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Przedmowa 


Encyklopedia  fizyki  współczesnej  jest  pierwszą  w Polsce  próbą  przeglądu  za- 
gadnień fizyki  współczesnej  na  poziomie,  który  umożliwi  korzystanie  z niej 
tym  wszystkim  czytelnikom,  którzy  fizykę  i matematykę  znają  w zakresie  szkoły 
średniej.  Nie  jest  to  encyklopedia  w tradycyjnym  znaczeniu  tego  słowa.  Nie  ma 
w niej  bowiem  haseł  definicyjnych  dotyczących  poszczególnych  pojęć,  zjawisk 
i praw,  są  natomiast  dłuższe  artykuły  przeglądowe,  obejmujące  pewną  całość 
tematyczną  (np.  Cząstki  elementarne.  Magnetooptyka,  Kwasy  nukleinowe). 
Artykuły  są  pogrupowane  tematycznie  w działy.  Czytelnik,  który  chciałby 
sobie  wyjaśnić  jakieś  pojęcie  czy  termin,  może  korzystać  ze  szczegółowego  sko- 
rowidza terminów,  pojęć  i wzorów,  ułatwiającego  znalezienie  odpowiedniego 
miejsca  w artykule  przeglądowym. 

Fizykę  współczesną  stanowi  zespół  zagadnień,  które  w obecnej  dobie  są  te- 
matem zainteresowań  i badań  fizyków.  W Encyklopedii  zostały  omówione  prze- 
de wszystkim  zagadnienia  najciekawsze,  bądź  ze  względu  na  ich  wartość  poz- 
nawczą, bądź  też  ze  względu  na  nowe  i ważne  zastosowania  w fizyce  szeroko 
pojętej,  w technice  i w życiu  codziennym. 

Spotykamy  się  często  z poglądem,  że  na  pograniczu  fizyki  i innych  nauk  przy- 
rodniczych powstało  szereg  specjalności,  jak  astrofizyka,  biofizyka,  geofizyka, 
chemia  kwantowa  itd.  Piszącemu  te  słowa  wydaje  się,  że  są  to  właściwie  nowe 
gałęzie  fizyki,  która  w postępującym  od  dawna,  procesie  integracji  wchłania 
dyscypliny  uważane  przez  jakiś  czas  za  niezależne  gałęzie  wiedzy.  I tak  np.,  gdy 
w latach  trzydziestych  naszego  stulecia  dzięki  rozwojowi  fizyki  jądrowej  udało 
się  wskazać  źródło  energii  gwiazd,  częścią  fizyki  stała  się  astrofizyka,  natomiast 
część  astronomii  zajmująca  się  badaniem  ruchu  ciał  niebieskich  stała  się  częścią 
fizyki  jeszcze  w czasach  Newtona.  Podobnie,  gdy  dzięki  mechanice  kwantowej 
udało  się  zrozumieć  budowę  atomów  i cząsteczek  oraz  istotę  wiązań  chemicz- 
nych przez  sprowadzenie  procesów  chemicznych  do  kwantowych  elektromagne- 
tycznych oddziaływań  elektronów,  gałęzią  fizyki  stała  się  w znacznej  mierze 
chemia. 

Wracamy  więc  pęwoli  do  pierwotnego  znaczenia  fizyki  jako  wszechogarnia- 
jącej nauki  o całej  przyrodzie  (gr.  physis  natura’).  W taki  właśnie  sposób 
pojmowano  fizykę  przez  stulecia.  Na  przykład  typowy  siedemnastowieczny 
podręcznik  fizyki  Traite  de  physigue  Jacąuesa  Rohaulta,  wydany  w Paryżu 
w 1671  r.,  zawiera  nie  tylko  fizykę  sensu  stricto,  lecz  także  kosmologię,  astro- 
nomię, meteorologię,  geografię,  fizjologię  i medycynę.  Z piśmiennictwa  pol- 
skiego przypominamy  piękną  definicję  fizyki  z gimnazjalnego  podręcznika  fizyki 
wydanego  w Wilnie  w 1825  r.,  napisanego  przez  Feliksa  Drzewińskiego,  pro- 
fesora Uniwersytetu  Wileńskiego: 
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„Fizyka  nazwisko  nauki  pochodzące  od  wyrazu  greckiego  Physis , natura,  przyrodzenie, 
oznacza  naukę  poznawania  natury.  Przyrodzeniem,  albo  naturą  zmysłową,  zowiemy  to  wszys- 
tko cokolwiek  działa  na  zmysły  nasze,  i sprawuje  w nas  czucie.  Wszystkie  więc  rzeczy  nas 
otaczające,  których  się  dotykamy,  na  które  patrzymy,  to  co  słyszymy,  co  działa  na  zmysły 
smaku,  i powonienia,  wszystko  to  stanowi  naturę  zmysłową,  i poznawanie  tego  wszystkiego 
do  Fizyki  należy.  Przeto  Fizyka  jest  nauką  poznawania  rzeczy  świat  składających,  badania 
i dochodzenia  ich  własności. 

Rzeczy  składające  świat  fizyczny,  to  jest  zmysłom  naszym  dostępny,  są  niezmiernie  liczne, 
i rozmaitemi  własnościami  obdarzone.  Cała  ziemia  i części  ją  składające,  istoty  na  niey  i we- 
wnątrz jey  umieszczone,  niebo  i to  co  na  niem  postrzegamy,  powietrze  w którem  żyjemy,  bu- 
dowa nas  samych  i innych  podobnych  nam  jestestw,  to  wszystko  stanowi  świat  zmysłowy. 
W epokach  zaczęcia  nauk,  badania  tych  wszystkich  rzeczy  stanowiły  jedną  naukę,  mającą 
ogólne  nazwisko  Fizyki:  taką  miały  fizykę  starożytne  narody  Egipcyan,  Greków  i Rzymian. 

Poznawaniem  coraz  bliżey  tylu  rozlicznych  przedmiotów,  i odkrywaniem  w nich  coraz 
więcej  nowych  własności,  gdy  nauka  z czasem  uzrosła,  i stała  się  bardzo  obszerną,  uczeni 
wieków  późnieyszych  podzielili  ją  na  wiele  odnog,  albo  części,  z których  głównieysze  są  na- 
stępujące: lód  Nauka  uważania  nieba,  albo  raczey  położeń,  ruchów,  i postaci  brył  światłych 
widzianych,  w przestrzeni  niebios;  tę  część  fizyki  Astronomiją  nazywamy.  2re  Oznaczanie 
kształtów  istot  znaydujących  się  na  ziemi  i w ziemi,  w wodzie  i powietrzu,  należy  do  oddziału 
Fizyki,  zwanego  Historyą  nataralną.  3cie  Uważanie  wewnętrzney  budowy  tych  istot,  stanowi 
naukę  zwaną  Anatomiją.  4te  Dochodzenie  pierwiastków,  czyli  nayprostszych  części,  z jakich 
się  składają  istoty  w naturze,  i na  jakie  ostatecznie  rozebrać  się,  rozdzielić,  albo  rozłożyć  mogą, 
jest  przedmiotem  Chemii 

Wzorem  naszych  przodków  sprzed  150  lat  przedstawiamy  zatem  Czytelni- 
kom encyklopedię  traktującą  o tak  szeroko  pojętej  fizyce,  a także  o jej  wielora- 
kich związkach  z techniką. 

Jak  powiedzieliśmy  wyżej,  zakładamy  u Czytelnika  w zasadzie  znajomość 
fizyki  i matematyki  na  poziomie  szkoły'  średniej.  Nie  ma  więc  w Encyklopedii 
wyjaśnienia  takich  pojęć  i zagadnień,  jak  np.  siła,  prędkość,  prawo  Ohma,  pra- 
wo Coulomba,  co  nie  oznacza,  że  elementarne  pojęcia  nie  są  czasem  przypomi- 
nane w kontekście  omawiania  innych  zagadnień.  Encyklopedia  fizyki  współ- 
czesnej stanowi  w pewnym  sensie  uzupełnienie  trzytomowej  Ekcyklopedii  fizyki 
w tradycyjnej  formie,  jaką  wydało  Państwowe  Wydawnictwo  Naukowe  przed 
kilku  laty. 

Encyklopedię  otwiera  kilka  artykułów  wprowadzających  w podstawowe 
pojęcia,  prawa  i strukturę  fizyki  oraz  charakteryzujących  fundamentalne 
wielkie  teorie  fizyki  współczesnej.  Następne  artykuły  są  uporządkowane  w dzia- 
ły traktujące  o obiektach  fizycznych  w porządku  wzrastających  rozmiarów  i zło- 
żoności, od  cząstek  elementarnych,  przez  jądro  atomowe,  atom,  cząsteczkę  do 
złożonych  struktur  biologicznych,  za  którymi  następują  działy  obejmujące 
artykuły  o Ziemi  jako  planecie  oraz  o Wszechświecie. 

Pomysł  opracowania  Encyklopedii  fizyki  współczesnej  narodził  się  w końcu 
1973  r.  We  wstępnym  stadium  opracowania  założeń  programowych  Państwo- 
we Wydawnictwo  Naukowe  uzyskało  obszerne  wypowiedzi  ankietowe  od  kilku- 
dziesięciu wybitnych  specjalistów  z różnych  dziedzin  fizyki.  Zebrane  cenne 
uwagi  pozwoliły  na  opracowanie  wstępnego  zestawu  artykułów  hasłowych, 
który  w trakcie  pracy  nad  Encyklopedią  nabrał  ostatecznego  kształtu.  Dodajmy, 
że  w ciągu  kilku  lat  przygotowywania  artykułów  następował  postęp  w wielu 
działach  fizyki  tu  omawianych,  co  nakładało  na  autorów  poważny  obowiązek 
uaktualniania  tekstów.  Encyklopedia  fizyki  współczesnej , pierwsza  publikacja 
tego  typu  na  naszym  rynku  księgarskim,  mogła  powstać  tylko  dzięki  życzli- 
wemu stosunkowi  i pomocy  wielu  osób,  których  nie  sposób  wymienić,  a którym 
składamy  w tym  miejscu  gorące  podziękowanie.  Ostateczny  osąd  wartości  dzie- 
ła należy  do  Czytelników,  którym  życzymy  przyjemnej  i pożytecznej  lektury. 

Andrzej  Kajetan  Wróblewski 
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fii— Zygmunt  Trzaska  Durski  499 

FIZYKA  CIAŁA  STAŁEGO  505 

Metale  — Jacek  Furdyna  505 

Mechaniczne  właściwości  metali  506 

Ruch  elektronów  w metalu  — obraz  klasyczny  508 

Ruch  elektronów  w metalu  — obraz  kwantowy  509 

Kwantowy  gaz  elektronowy  509 

Przewodnictwo  elektryczne  511 

Rozpraszanie  elektronów  511 

Ruch  elektronów  w kryształach  rzeczywistych  511 

Poziomy  Landaua  i oscylacje  kwantowe  513 

Metale  jedno-  i wielowartościowe  514 

Optyczne  właściwości  metali  515 

Dielektryki  — Bożena  Hilczer  516 
Przewodnictwo  elektryczne  517 
Polaryzacja  dielektryczna  517 
Ferroelektryki  520 
Elektrety  523 

Półprzewodniki  — Tadeusz  Figielski  525 
O przewodzeniu  prądu  elektrycznego  525 
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Kwantowy  opis  półprzewodnika  526 
Elektrony  i dziury  528 
Domieszki  w półprzewodnikach  529 
Światłoczułość  półprzewodników  53 i 
Od  tranzystora  do  generatora  Gunna  532 

Półprzewodniki  magnetyczne  — Robert 
R.  Gałązka  533 

Struktura  energetyczna  — gęstość  stanów  534 
Gigantyczny  magnetoopór  535 
Własności  optyczne  półprzewodników  magnetycz- 
nych 536 

Półprzewodniki  półmagnetyczne  537 

Struktura  elektronowa  ciał  stałych 

— Waldemar  Gorzkowski  537 

Dynamika  elektronu  w ciałach  stałych  (krysz- 
tałach) — Waldemar  Gorzkowski  542 

Dynamika  sieci  krystalicznej  — Wacław 
Nazarewicz  544 
Podstawowe  przybliżenia  545 
Równania  ruchu  545 
Relacje  dyspersji  546 
Widmo  wartości  wektora  falowego  548 
Kwantowanie  drgań  sieci  549 
Widmo  częstości  drgań  550 
Oddziaływania  anharmoniczne  552 
Wpływ  defektów  na  drgania  sieci  552 
Doświadczalne  metody  badania  drgań  sieci  553 
Niesprężyste  rozproszenie  neutronów  powolnych  553 
Absorpcja  w podczerwieni  554 
Rozproszenie  ramanowskie  556 
Aktualne  kierunki  badań  557 

Wzbudzenia  elementarne  w ciałach  stałych 

— Jerzy  Czerwonko  557 
Ogólne  pojęcie  wzbudzenia  557 

Układy  wielu  cząstek ; cząstki  Fermiego  558 
Oddziałujące  cząstki  Fermiego;  wzbudzenia  elemen- 
tarne; kwazicząstki  558 

Trochę  o fononach;  wzbudzenia  w kryształach 
kwantowych  560 
Plazmony  561 
Ekscytony  i polarony  562 

Czy  da  się  zamknąć  listę  kwazicząstek  ? Polarytony  563 

Stany  powierzchniowe  w ciałach  stałych 

— Jacek  Łagowski  i Andrzej  Morawski  564 
Powierzchnie  czyste  i powierzchnie  rzeczywiste  565 
Stany  powierzchniowe  na  powierzchni  czystej  565 
Stany  powierzchniowe  na  powierzchni  rzeczywistej  567 
Udział  stanów  powierzchniowych  w zjawiskach 

fizycznych  567 


ELEKTRONIKA  WSPÓŁCZESNA 


Co  to  jest  współczesna  elektronika 

— Jarosław  Świderski  607 

Elektronika  półprzewodnikowa  w zbliżeniu  607 

Fizyka  przyrządów  półprzewodnikowych 

— Stanisław  Sikorski  608 
Nośniki  nadmiarowe  608 

Dyfuzja  i droga  dyfuzji  nośników  nadmiarowych  610 
Złącze  p-n  610 

Oddziaływanie  nośników  nadmiarowych  na  złącze 
p-n.  Zjawisko  tranzystorowe  613 

Przyrządy  półprzewodnikowe  dyskretne 

— Jarosław  Świderski  613 

Od  „kryształka”  do  kryształka  613 
Diody  i tranzystory  614 

Miniaturyzacja,  mikrominiaturyzacja  i co  dalej?  615 

Optoelektronika  półprzewodnikowa 

— Marian  A.  Herman  617 


Przypowierzchniowy  obszar  ładunku  przestrzenne- 
go 567 

Przewodnictwo  powierzchniowe  568 
Efekt  połowy  568 

Zjawiska  fotoelektryczne  wewnętrzne  569 
Fotoemisja  (zjawisko  fotoelektryczne  zewnętrzne)  570 
Fononowe  stany  powierzchniowe  571 

Wysokie  ciśnienia  — Tadeusz  Suski  571 
Metody  otrzymywania  wysokich  ciśnień  571 
Procesy  zachodzące  przy  wysokim  ciśnieniu  572 
Elektrony  i ciśnienie  573 
Sieć  krystaliczna  i ciśnienie  574 
Nadprzewodnictwo  575 

Zastosowanie  wysokich  ciśnień  w inżynierii  materia- 
łowej 576 

Metaliczny  wpodór?  577 

MAGNETYZM  577 

Teoria  megnetyzmu  — Jerzy  Mielnicki 
i Bogusław  Mrygoń  577 
Magnetyzm  atomowy  578 
Diamagnetyzm  578 
Paramagnetyzm  579 

Spontaniczne  uporządkowanie  magnetyczne  580 
Teoria  pola  molekularnego  581 
Metoda  fal  spinowych  582 

Kwantowanie  fal  spinowych.  Własności  kryształów 
magnetycznych  w niskich  temperaturach  584 

Struktura  domenowa  i procesy  magnesowa- 
nia — Henryk  Szymczak  i Rita  Szymczak  585 
Energia  wymiana  586 

Energia  anizotropii  magnetokrystalicznej  586 
Energia  magnetostatyczna  pola  rozmagnesowujące- 
go  587 

Metody  obserwacji  struktury  domenowej  588 
Procesy  magnesowania  589 

Magnetooptyka  — Wiesław  Wardzyński  540 
Zjawisko  Faradaya  592 
Zjawisko  Voigta  (Cottona-Moutona)  593 
Zjawisko  Zeemana  593 

Zastosowanie  zjawisk  magnetooptycznych  w materia- 
łach magnetycznych  595 

Pamięć  magnetyczna  — Henryk  Lachowicz  596 
Pamięć  dźwięku  i obrazu  596 
Pamięci  cyfrowe ; ferrytowe  i elektromechaniczne  597 
Najnowsze  konstrukcje  pamięci  cyfrowych  599 

Najsilniejsze  pola  magnetyczne  — Czesław 
Bazan  601 

Do  czego  mogą  służyć  silne  pola  magnetyczne  602 
Wytwarzanie  silnych  pól  magnetycznych  604 


Półprzewodnikowe  źródła  światła  617 
Półprzewodnikowe  detektory  promieniowania  elektro- 
magnetycznego 620 

Zastosowania  półprzewodnikowych  źródeł  i detek- 
torów promieniowania  elektromagnetycznego  621 
Kierunki  rozwoju  optoelektroniki  półprzewod- 
nikowej 624 

Mikroelektronika  — Andrzej  Zawadzki  624 
Projektowanie  układów  scalonych  624 
Wytwarzanie  układów  scalonych  626 
Układy  scalone  bipolarne  626 
Układy  unipolarne  628 
Montaż  i pomiary  układów  scalonych  628 
Zastosowania  układów  scalonych  629 
Przyszłość  układów  scalonych  629 

Generacja  mikrofal — Janusz  Konopka  630 
Klistron  refleksowy  630 
Generator  Gunna  632 
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Kom  puter  jako  narzędzie  pracy  fizyka 

— Wojciech  Wójcik  635 

Rozwój  techniki  pbliczeniowej  — od  liczydła  do 
komputera  635 

Elementy  składowe  współczesnego  komputera  636 

AKUSTYKA 

Przedmiot  i zakres  akustyki  639 

Teoria  ośrodków  ciągłych  i fale  sprężyste 

— Antoni  Śliwiński  639 

Akustyczne  zjawiska  liniowe — Antoni  Śliwiński  644 
Akustyczne  zjawiska  nieliniowe  — Antoni  Śliwiń- 
ski 646  , r 

Akustyczne  procesy  molekularne  — Antoni  Śliwiń- 
ski 648  , 

Ultradźwięki  i hiperdźwięki  — Antoni  Śliwiński  652 
Infradźwięki  — Ignacy  Małecki  657 

Badanie  ośrodków  za  pomocą  ultradźwię- 
ków 658 

Spektroskopia  ultradźwiękowa  — Jerzy  Wehr  658 
Defektoskopia  i mikrodefektoskopia  ultradźwiękowa 
— Bogumił  Linde  660 

Ultradźwiękowe  metody  diagnostyczne  — Leszek 
Filipczyński  661 

Badanie  ośrodków  biologicznych  za  pomocą  meto- 
dy echa  662 

Dopplerowskie  metody  badania  biologicznych  stru- 
ktur ruchomych  662 

Akustyczne  fale  powierzchniowe  i ich  zasto- 
sowanie — Antoni  Śliwiński  663 


Programowanie,  czyli  wykorzystanie  możliwości  kom- 
putera 636 

Zastosowanie  komputerów  w fizyce  636 
Automatyzacja  pomiarów  i praca  w czasie  rzeczywis- 
tym 638 

Sieci  abonenckie  638 


Holografia  akustyczna  — Iwona 
Wojciechowska  666 

Akustyczne  zjawiska  kwantowe  668 

Oddziaływania fonon-elektron  — Antoni  Śliwiński  669 
Oddziaływania  fonon-fonon  — Antoni  Śliwiński  671 
Oddziaływania  foton-fonon  — Marek  Kosmal  673 
Optosonika  — Iwona  Wojciechowska  674 
Zjawiska  akustomagnetyczne — Czesław  Lewa  676 
Akustyczny  rezonans  magnetyczny  — Czesław  Lewa  676 
Fasery  — Mieczysław  Szustakowski  678 
Fasery  akustoelektryczne  678 
Fasery  kwantowe  680 

Modelowanie  obiektów  akustycznych 

— Stefan  Czarnecki  681 

Fale  uderzeniowe  — Wiktor  Jungowski  682 

Fale  biegnące  684 

Fale  stacjonarne  (nieruchome)  686 

Fale  oscylujące  688 

Hałas  __  Stefan  Czarnecki  689 

Ocena  i pomiar  hałasu  689 

Źródła  hałasu  692 

Środowisko  akustyczne  693 

Tłumienie  hałasu  693 


BIOFIZYKA  I FIZYKA  MEDYCZNA 


Przedmiot  i problemy  biofizyki  molekular- 
nej — Kazimierz  Wierzchowski  659 
Stan  nieuporządkowany  makrocząsteczek  w roztwo- 
rach 696 

Badanie  kształtu  makrocząsteczek  696 
Giętkość  łańcuchów  polimerów  liniowych  696 
Statystyczny  opis  kształtu  makrocząsteczek  697 
Stan  uporządkowany  makrocząsteczek  698 
Badanie  struktury  metodami  dyfrakcji  promienio- 
wania rentgenowskiego  698 
Formy  przestrzennego  uporządkowania  biopolime- 
rów 699 

Teoretyczne  badania  konformacji  700 

Badania  konformacji  makrocząsteczek  w roztworach 

701  . . . , « r 

Siły  odpowiedzialne  za  organizację  łańcuchów- 
makrocząsteczek  701 

Dynamika  uporządkowanych  konformacji  biopoli- 
merów 703 

Zmiany  stanu  uporządkowania  makrocząsteczek  703 
Statystyczno-termodynamiczna  teoria  przejść  kon- 
formacyjnych  704  . . , . 

Kooperatywne  właściwości  biopolimerów  a regulacja 
ich  funkcji  705 

Regulacje  układów  enzymatycznych  706 
Regulacja  funkcji  błon  komórkowych  706 
Regulacja  skurczu  mięśnia  706 

Organizacja  procesów  życiowych  komórki 

— Tadeusz  Kłopotowski  707 
Strukturalne  elementy  komórek  708 
Podstawowe  procesy  metaboliczne  709 
Mechanizmy  zachowania  gatunków  i ich  ewolucji  713 

Błony  komórkowe  — Stanisław  Przestał  ski  714 
Występowanie  błon  i ich  znaczenie  714 
Lipidy  i białka  membranowe  715 


Modele  błon  komórkowych  718 
Termodynamiczny  opis  zjawisk  transportu  780 
Przenikanie  substancji  przez  błony  biologiczne  721 
Od  czego  zależy  dalszy  rozwój  biofizyki  błon  723 

Siatka  — Kazimierz  Zakrzewski  723 

Budowa  białek  724 
Rodzaje  białek  729 

Białka  — elastyczny  szkielet  organizmów  729 
Białka  — narzędzia  transportu  733 
Białka  — narzędzia  regulowanej  katalizy  736 
Białka  — sygnały  i receptory  sygnałów  743 

Kwasy  nukleinowe  — Edward  Czuryło 
i Magdalena  Fikus  746 

Budowa  kwasów  nukleinowych  746 
Struktura  kwasów  nukleinowych  746 
Struktura  DNA  747 
Struktura  RNA  749 

Przejścia  konformacyjne  w cząsteczkach  kwasów  nu 
kleinowych  751 

Aktywność  biologiczna  kwasów  nukleinowych  752 
Replikacja  DNA  752 
Transkrypcja  informacji  genety  cznej  755 
Translacja  informacji  genetycznej  756 
Inżynieria  genetyczna  757 

Molekularne  podstawy  skurczu  mięśnia 

— Hanna  Strzelecka- Gołaszewska  758 

Źródła  energii  dla  skurczu  759 
Budowa  komórek  mięśniowych  760 
Charakterystyka  strukturalnych  białek  mięśniowych 
i ich  molekularnej  organizacji  w mięśniu  761 
Molekularny  mechanizm  skurczu  761 
Regulacja  cyklu  skurczowo-rozkurczowego  764 
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Biomechanśka  mięśni  — Kazimierz  Fidelus, 
Krzysztof  Kędzior  i Adam  Morecki  767 

Układ  ruchu  768 
Aparat  kostno-stawowy  768 
Aparat  mięśniowy  769 
Rodzaje  mięśni  i ich  możliwości  769 
Ewolucja  mięśni  769 
Mięśnie  szkieletowe  770 
Mięśnie  gładkie  772 
Mięsień  sercowy  772 

Badanie  właściwości  biomcchanicznych  mięśni  szkiele- 
towych 772 

Badanie  mięśni  izolowanych  772 
Badanie  mięśni  częściowo  izolowanych  i mięśni  bez- 
pośrednio w organizmie  775 
Modelowanie  mięśni  izolowanych  775 
Sformułowanie  uogólnionego  modelu  776 
Możliwości  rozwoju  siły  mięśniowej  przez  trening  777 
Problemy  wymagające  dalszych  badań  778 

Biocybernetyka  — Ryszard  Gawroński  779 

Biocybernetyka  jako  metoda  badań  procesów  w zło- 
żonych układach  biologicznych  779 
Rola  sprzężenia  zwrotnego  780 
Stabilność  układu  781 
Zastosowanie  teorii  informacji  781 
Modelowanie  782 

Biocybernetyka  a układy  regulacji  782 
Neurocybemetyka  786 


FIZYKA  ZIEMI 

Fizyka  skorupy  i wnętrza  Ziemi  — Renata 
Dmowska  815 
Budowa  Ziemi  815 

Własności  fizyczne  wnętrza  Ziemi  816 

Trzęsienia  ziemi  818 

Procesy  fizyczne  w ognisku  818 

Fale  sejsmiczne  819 

Zapis  trzęsienia  ziemi  820 

Badanie  wewnętrznej  budowy  Ziemi  820 

Sejsmiczność  Ziemi  822 

Prognozowanie  trzęsień  ziemi,  sztuczne  trzęsienia  822 
Globalne  teorie  geodynamiczne  825 

Fizyka  atmosfery  — Krzysztof  Haman  826 
Zasady  fizycznego  opisu  atmosfery  827 
Budowa  i skład  atmosfery  872 

Promieniowanie  słoneczne  źródłem  energii  w atmosfe- 
rze 829 

Dynamika  atmosfery  831 
Ogólna  cyrkulacja  atmosfery  832 
Chmury  i opady  atmosferyczne  834 
Główne  problemy  i kierunki  rozwoju  współczesnej 
fizyki  atmosfery  836 
Prognozy  pogody  836 
Ewolucja  klimatu  i modyfikacja  pogody  837 
Obserwacje  i pomiary  w atmosferze  838 

Fizyka  przestrzeni  akołoziemskiej  — Andrzej 
Wernik  840 

Atmosfera  na  wysokości  powyżej  300  km  840 
Magnetosfera  842 

Burze  magnetyczne  i zorze  polarne  844 

Magnetyzm  ziemski  — Magdalena 
Kądziołko- Hofmokl  845 
Stale  pole  geomagnetyczne  845 
Paleomagnetyzm  850 
Pozostałość  magnetyczna  skał  850 
Inwersja  pola  geomagnetycznego  851 
Dryf  kontynentów  852 
Archeomagnetyzm  855 

Teoria  pochodzenia  stałego  poła  geomagnetycznego 
i zmian  wiekowych  856 
Zmienne  pole  geomagnetyczne  857 
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Fizyka  medyczna  — Oskar  Chomicki  790 
Promieniowanie  jonizujące  w medycynie  762 

Radiodiagnostyka  i radioterapia  793 
Medycyna  nuklearna  797 
Promieniowanie  niejonizujące  w medycynie  800 
Promieniowanie  laserowe  800 
Promieniowanie  podczerwone  801 
Fizyka  medyczna  nieradiacyjna  802 

Modelowanie  matematyczne  procesów  biolo- 
gicznych 

— Dymitr  Czernawski  i Ewa  Skrzypczak  803 
Klasyfikacja  modeli  803 
Modele  fizyczne  803 
Modele  matematyczne  804 
Modele  statystyczne  805 
Modele  matematy  czne  (dynamiczne)  806 
Modele  punktowe  806 
Modele  uwzględniające  wiek  obiektów  809 
Modele  niepunktowe,  opisujące  układy  przestrzennie 
niejednorodne  809 

Wybrane  przykłady  modeli  matematycznych  w zagad- 
nieniach biologicznych  809 
Model  hodowli  ciągłej  809 
Modele  oscylacyjne  810 
Modele  przełączania  (tryggerowe)  812 
Inne  rodzaje  zastosowania  modelowania  matematycz- 
nego 813 

Układy  otwarte  813 

Dziedziny  mniej  związane  z biofizyką  813 


Indukcja  elektromagnety  czna  we  wnętrzu  Ziemi  859 
Fizyka  morza  860 

Dynamika  morza  — Czesław  Druet  860 
Przyczyny  ruchu  mas  wodnych  860 
Prawa  rządzące  ruchem  mas  wodnych  861 
Rodzaje  zjawisk  hydrodynamicznych  w morzach 
i oceanach  862 

A)  Ruch  falowy  862 

B)  Prądy  morskie  866 

Metody  badania  morskich  procesów 
dynamicznych  869 

Praktyczne  problemy  dynamiki  morza  869 
Optyka  morza  — Jerzy  Dera  870 
Badanie  rozchodzenia  się  światła  w morzu  870 
Właściwości  optyczne  morza,  rzeczywiste 
i pozorne  873 

Zastosowanie  optyki  morza  w innych  dziedzinach 
oceanologii  878 

Akustyka  morza  — Antoni  Śliwiński  880 
Charakter  rozprzestrzeniania  się  dźwięku  880 
Prędkość  rozchodzenia  się  dźwięku  882 
Rozpraszanie  dźwięku  883 
Tłumienie  dźwięku  883 
Szumy  własne  morza  884 
Zastosowanie  885 

Fizyka  wód  śródlądowych  — Bohdan 
Utrysko  886 

Mechanika  przepływów  wód  powierzchniowych  886 
Dynamika  koryt  889 

Mechanika  przepływów  wód  podziemnych  889 
Termika  wód  890 

Geofizyka  poszukiwawcza  — Zbigniew 
Fajklewicz  891 

Grawimetria  poszukiwawcza  891 
Magnetometria  poszukiwawcza  893 
Geoełektryka  poszukiwawcza  894 
Metoda  elektrooporowa  894 
Inne  metody  elektryczne  895 
Sejsmika  poszukiwawcza  895 
Radiometria  poszukiwawcza  896 
Geofizyka  wiertnicza  897 


ASTROFIZYKA  I KOSMOCHEJVSiA 


Kosmologia  — Michał  Heller  899 

Obserwowalny  Wszechświat  899 

Obserwacyjne  podstawy  kosmologii  900 

Konstrukcja  modeli  kosmologicznych  901 

Modele  Friedmana  902 

Modele  Friedmana-Lemaitreła  903 

Światy  promieniste  904 

Inne  modele  kosmologiczne  904 

Historia  Wszechświata  904 

Fizyka  w pobliżu  osobliwości  906 

Testowanie  modeli  kosmologicznych  907 

Antymateria  we  Wszechś wiecie  — Marcin 
Kubiak  908 

Radioastronomia  — Stanisław  Zięba  912 

Radioteleskopy  912 
Mechanizmy  promieniowania  913 
Źródła  promieniowania  radiowego  914 
Promieniowanie  radiowe  Słońca  i gwiazd  915 
Promieniowanie  radiowe  Księżyca  i planet  916 
Promieniowanie  radiowe  Galaktyki  916 
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Fundamentalne  zasady 
p rzy  rodoznawstwa 

Fizyka  jest  najbardziej  podstawową  nauką  przyrod- 
niczą, zajmującą  się  badaniem  strukturalnych  i dy- 
namicznych praw  przyrody.  Jednym  z najważniej- 
szych zadań  fizyki  jest  poznanie  fundamentalnych 
i uniwersalnych  własności  materii  wspólnych  wszyst- 
kim lub  przynajmniej  wielu  różnym  jej  formom. 
Z zadania  tego  wynika  podstawowa,  integrująca  całe 
przyrodoznawstwo  rola  fizyki. 

Możliwość  wykonania  tego  zadania  przez  fizykę 
opiera  się  na  dwóch  niezwykle  ważnych  i płodnych 
ogólnych  zasadach:  jednolitości  materii  i powszech- 
ności praw  fizyki.  W rozumieniu  większości  fizyków 
pierwsza  zasada  odnosi  się  do  strukturalnych,  druga 
— do  bardziej  dynamicznych  własności  materii.  Zgod- 
nie ze  współczesną  fizyką  można  by  im  nadać  nastę- 
pujące brzmienie : 

jednolitość  I.  Wszystkie  ciała  materialne,  nieożywione  i oży- 
materii  wionę,  na  Ziemi  i gdziekolwiek  indziej  we  Wszech- 
świecie  są  zbudowane  z takich  samych  elementar- 
nych składników  (np.  odpowiednich  cząstek  i pól), 
powszech-  II.  Oddziaływania  między  elementarnymi  skład- 
ność  praw  nikami  materii  i wynikające  z nich  własności  materii 
fizyki  oraz  prawa  fizyki  są  wszędzie  takie  same. 

Obie  te  zasady  są  dziś  wszechstronnie  potwierdzo- 
ne przez  doświadczenie.  Oczywiście  nie  oznaczają 
one  bynajmniej,  że  świat  jest  pod  każdym  względem 
jednorodny  (co  byłoby  jawnie  sprzeczne  z naszym 
doświadczeniem),  zasady  te  nie  wykluczają  bowiem 
występowania  materii  w różnych  formach  i stanach. 

Zilustrujemy  to  na  przykładzie  Ziemi  i Słońca.  Ma- 
teria we  wnętrzu  Słońca  i na  Ziemi  występuje  nie- 
wątpliwie w bardzo  różnych  stanach.  Różnice  włas- 
ności materii  ziemskiej  i słonecznej  wynikają  z ogrom- 
nych różnic  wartości  takich  parametrów  stanu  jak 
temperatura,  ciśnienie,  natężenie  pola  grawitacyjnego, 
pola  promieniowania  itd.  Niemniej  jest  to  taka  sama 
materia,  podlegająca  tym  samym  prawom.  Należy  to 
rozumieć  tak,  że  np.  materia  ziemska  o odpowiednim 
składzie  chemicznym,  poddana  takiemu  samemu  jak 
we  wnętrzu  Słońca  ciśnieniu,  temperaturze,  promie- 
niowaniu itp.,  będzie  się  zachowywała  identycznie  jak 
materia  słoneczna.  Weźmy  inny  przykład:  Organizmy 
żywe  zbudowane  są  z takich  samych  atomów,  między 
którymi  występują  takie  same  oddziaływania  i reak- 
cje jak  te,  które  badają  fizycy  i chemicy  w laborato- 
riach w warunkach  wprawdzie  sztucznych,  ale  za  to 
dobrze  kontrolowanych.  Oczywiście  występujące  w 
żywych  komórkach  bardzo  duże  drobiny  przysparzają 
kłopoty  wskutek  skomplikowanej  budowy  i wynikają- 
cych stąd  specyficznych  własności,  ale  jest  to  kompli- 
kacja w pełni  zrozumiała  na  gruncie  fizyki. 


Całe  współczesne  przyrodoznawstwo  opiera  się 
więc  na  założeniu,  że  wszelkie,  nieraz  bardzo  skom- 
plikowane struktury  i procesy  chemiczne,  biologicz- 
ne, geologiczne  i astronomiczne  są  wynikiem  działa- 
nia uniwersalnych  praw  fizyki.  Fundamentalne  prawa 
fizyki  są  względnie  proste  i ogólne,  ale  zastosowane 
do  różnych  złożonych  układów  i sytuacji  mogą  impli- 
kować bardzo  różnorodne  i skomplikowane  własności 
szczególne. 

Weryfikacja  tego  podstawowego  założenia  współ- 
czesnego przyrodoznawstwa  może  być  w pewnych 
wypadkach  dość  prosta,  ale  na  ogół  jest  bardzo  trud- 
na, gdyż  wymaga  długiego  łańcucha  obserwacji, 
wnioskowań  i rachunków.  Bezpośrednie  sprawdzenie 
pewnych  konsekwencji  jest  czasem  praktycznie  nie- 
możliwe. Nie  potrafimy  np.  przenieść  badanego  ka- 
wałka materii  ziemskiej  do  wnętrza  Słońca  w celu 
sprawdzenia,  czy  będzie  się  ona  tam  rzeczywiście  za- 
chowywała tak  jak  materia  słoneczna.  Jednakże  iden- 
tyczność materii  na  Ziemi  i na  Słońcu  można  po- 
twierdzić w inny  sposób,  który  wprawdzie  nie  jest 
bezpośredni,  ale  mimo  to  jest  przekonywający.  A mia- 
nowicie — w widmie  promieniowania  Słońca  wy- 
stępują linie  absorpcyjne  charakterystyczne  dla  zna- 
nych również  na  Ziemi  pierwiastków.  Ba,  jeden 
z nich,  hel,  został  właśnie  w ten  sposób  odkryty  naj- 
pierw na  Słońcu,  a dopiero  potem  został  znaleziony 
na  Ziemi.  Dalej  — Słońce  promieniuje  nie  tylko  fale 
elektromagnetyczne,  lecz  także  różne  cząstki,  które 
można  dziś  dobrze  zidentyfikować  (np.  przy  użyciu 
odpowiednich  detektorów  umieszczonych  na  sput- 
nikach). Okazuje  się,  że  są  one  identyczne  z cząstkami 
poznanymi  przez  fizyków  w ich  laboratoriach  na 
Ziemi. 

Można  podać  tysiące  faktów,  zarówno  z zakresu 
właściwej  fizyki,  jak  i chemii,  biologii,  geologii  i astro- 
nomii, potwierdzających  zasady  jednolitości  materii 
i powszechności  praw  fizyki,  natomiast  nie  znamy 
naukowo  potwierdzonych  faktów  sprzecznych  z nimi. 

Zasady  te  okazały  się  niezmiernie  ważne,  płodne 
i stymulujące  dla  wszystkich  nauk  przyrodniczych. 

Bez  nich  wiele  tych  nauk  nie  mogłoby  po  prostu  ist- 
nieć albo  ograniczyłoby  się  do  bardzo  powierzchow- 
nych obserwacji  i czysto  opisowego  podejścia.  Na 
przykład  dopiero  przyjęcie  zasady  jednolitości  ma- 
terii i powszechności  praw  przyrody  pozwala  na 
wykorzystanie  licznych  wiadomości  z zakresu  fizyki 
jądrowej  i cząstek  elementarnych,  teorii  promienio- 
wania, termodynamiki,  teorii  grawitacji,  mechaniki  P 

itd.  w celu  wyjaśnienia  obserwowanych  zjawisk  astro-  e 

nomicznych.  I 

Warto  zwrócić  uwagę  na  zmiany,  jakie  w pojmo- 
waniu obu  zasad  zachodziły  w toku  rozwoju  nauki.  © 

Rodowód  tych  zasad  jest  niewątpliwie  bardzo  stary  Gtówne  sk)adniki 
i sięga  z pewnością  starożytnych  greckich  filozofów  Wjatru  słonecznego 
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Relacje  między 
chemią,  biologią 
i fizyką  dawniej 
i dziś 


przyrody,  a może  czasów  jeszcze  dawniejszych.  Nie 
wdając  się  tu  w szczegółowe  historyczne  rozważania, 
należy  zwrócić  uwagę  na  bardzo  istotny  przełom, 
który  się  dokonał  w ostatnich  100  latach.  Otóż 
ugruntowany  już  bardzo  dawno  i właściwie  nie  zmie- 
niany przez  długie  wieki  sens  obu  zasad  był  pier- 
wotnie znacznie  skromniejszy.  Polegały  one  właści- 
wie tylko  na  stwierdzeniu,  że  wszystkie  ciała  material- 
ne mają  pewne  wspólne  cechy,  zwane  fizycznymi,  np. 
rozciągłość,  położenie,  prędkość,  masę,  pęd,  tempe- 
raturę, barwę.  Było  oczywiste,  że  ze  względu  na  wy- 
stępowanie tych  cech  wszystkie  ciała  materialne  mu- 
szą oczywiście  podlegać  odpowiednim  prawom  fi- 
zycznym. Uważano  jednak,  że  oprócz  cech  fizycz- 
nych ciała  materialne  mogą  posiadać  zupełnie  nieza- 
leżne od  praw  fizyki  własności  chemiczne,  biologicz- 
ne (witalne),  astralne  czy  spirytualne.  Przez  długie 
wieki  uważano,  że  zjawiska  fizyczne,  chemiczne,  bio- 
logiczne, geologiczne  i astronomiczne  są  wywoływane 
przez  specyficzne,  odrębne  i niezależne  siły  fizyczne, 
chemiczne,  witalne,  geologiczne,  astralne  itd.,  podle- 
gające niezależnym  prawom.  Dziś  jesteśmy  głęboko 
przekonani,  że  nie  ma  potrzeby  przyjmowania  istnie- 
nia takich  odrębnych  sił  i praw.  Wszystkie  te  zja- 
wiska staramy  się  dziś  sprowadzić  — na  ogół  z do- 
brym skutkiem  — do  odpowiednich  zjawisk  i praw 
czysto  fizycznych,  zachodzących  w specyficznych  dla 
danej  gałęzi  nauki  układach  (obiektach,  procesach, 
sytuacjach,  stanach).  Współczesne  przyrodoznaw- 
stwo bardzo  pogłębiło  więc  znaczenie  obu  zasad,  roz- 
ciągając je  na  wszystkie  niemal  obiekty  i zjawiska 
przyrody. 

Współczesna  fizyka  łączy  i zespala  w jedną  całość 
wszystkie  nauki  przyrodnicze.  Chemia,  geologia 
i astronomia  oraz  pokrewne,  bardziej  szczegółowe 
nauki  przyrodnicze,  jak  np.  krystalografia,  minera- 
logia, meteorologia,  są  dziś  uważane  po  prostu  za 
działy  fizyki  zajmujące  się  badaniem  pewnych  szcze- 
gólnych klas  obiektów  za  pomocą  uniwersalnych 
metod,  pojęć  i praw  fizyki.  W naszych  oczach  również 
biologia  staje  się  coraz  bardziej  „fizyką  materii  oży- 
wionej”, czy  krócej  — „fizyką  życia”.  Postępująca 
coraz  głębiej  i szerzej  integracja  wszystkich  nauk 
przyrodniczych  na  bazie  fizyki  jest  jedną  z najbar- 
dziej charakterystycznych  cech  nowożytnej  nauki. 


Metoda  naukowa  fizyki 


Zasady  jednolitości  materii  i powszechności  praw 
fizyki  otwierają  wprawdzie  bardzo  szerokie  horyzon- 
ty, ale  są  same  w sobie  zbyt  ogólnikowe.  Konkretne 
zastosowanie  tych  zasad  w pracy  badawczej  wyma- 
ga — z jednej  strony  — znajomości  odpowiednich 
zjawisk,  praw  i teorii  fizycznych,  z drugiej  — stoso- 
wania w całym  przyrodoznawstwie  tego  samego  ję- 
zyka i tej  samej  metody  badawczej.  Ta  ostatnia 
sprawa  jest  szczególnie  ważna,  warto  się  więc  zasto- 
nowić  nieco  dokładniej  nad  metodą  naukową  fizyki, 
ponieważ  stała  się  ona  dziś  metodą  wszystkich  nauk 
przyrodniczych. 

Otóż  najważniejsze  i najbardziej  charakterystyczne 
cechy  metody  naukowrej  fizyki  są  następujące: 

— możliwie  szerokie  stosowanie  eksperymentu, 

— ścisłe,  ilościowe  formułowanie  wyników  ekspe- 
rymentu i wniosków  ogólnych, 

— poszukiwanie  praw  przyczynowych, 

— silne  obustronne  sprzężenie  doświadczenia  (eks- 
perymentu) z teorią. 


Obserwacja  i eksperyment 

Fizyka  jest  nauką  o realnych  faktach  przyrodniczych, 
które  możemy  poznać  jedynie  (bezpośrednio  lub  po- 
średnio) za  pomocą  naszych  zmysłów.  Fakty  takie 


nazywamy  w fizyce  zjawiskami.  Badanie  zjawisk 
przyrody  może  polegać  na  ich  biernym  oglądaniu 
w warunkach  naturalnych,  w których  nie  mamy  wpły- 
wu na  oglądane  zjawiska.  Ograniczenie  się  do  bier- 
nego oglądania,  zwanego  często  obserwacją,  jest  ko-  obserwacja 
nieczne,  jeśli  obiekty  obserwacji  są  bardzo  wielkie  lub 
bardzo  odległe  w przestrzeni  lub  czasie,  jak  to  ma 
miejsce  np.  w astronomii  lub  geologii. 

Wiele  zjawisk  zachodzących  w mniejszej  skali  moż- 
na jednak  wywołać  sztucznie,  umyślnie,  w warun- 
kach laboratoryjnych.  Takie  postępowanie  nazywamv 
eksperymentowaniem.  Czynny  eksperyment  ma  oczy- 
wiście wiele  zalet.  Przede  wszystkim  jest  znacznie  eksperymen- 
bardziej  elastyczny  niż  bierna  obserwacja,  da  się  towanie 
powtórzyć  na  życzenie  i łatwiej  go  kontrolować 
ilościowo.  Możliwość  powtórzenia  zjawiska  dowolną 
liczbę  razy,  w ilościowo  identycznych  warunkach, 
pozwala  na  usunięcie  przypadkowych  lub  nawet  sys- 
tematycznych błędów,  na  zwiększenie  dokładności 
i pewności  wyników  badań,  na  uściślenie,  sprawdze- 
nie i korygowanie  dotychczasowej  wiedzy.  Wyko- 
nanie eksperymentów  w różnych,  celowo  zmienio- 
nych warunkach  pozwala  na  bardziej  wszechstronne, 
pełniejsze  i głębsze  poznanie  badanych  zjawisk. 

Zastąpienie  biernej  obserwacji  przez  czynny  ekspe- 
ryment przynosi  więc  zawsze  istotny  postęp  w pracy 
badawczej. 

Zjawiska  powtarzające  się  często,  ale  tylko  w wa- 
runkach naturalnych,  trudniej  jest  kontrolować,  gdyż 
na  ogół  nie  możemy  być  pewni  identyczności  tych 
warunków,  nie  możemy  też  dobrze  określić  wartości 
parametrów,  zmieniających  się  za  każdym  razem. 

Jeszcze  gorzej  przedstawia  się  sprawa  ze  zjawis- 
kami niepowtarzalnymi  lub  bardzo  rzadkimi.  Można 
je  również  badać  za  pomocą  odpowiednich  metod 
fizycznych,  ale  wiedzy  o takich  zjawiskach  nie  mo- 
żemy pogłębiać,  sprawdzać  ani  korygować  przez  po- 
wtórzenie ich  i wykonanie  nowych  badań. 

Fizyka  właściwa  zajmuje  się  niemal  wyłącznie 
zjawiskami,  które  można  badać  eksperymentalnie 
w warunkach  laboratoryjnych.  Inne  nauki  przyrod- 
nicze, jak  np.  astronomia,  geologia  oraz  niektóre 
działy  biologii,  muszą  się  z natury  rzeczy  ograniczać 
do  biernych  obserwacji.  W astronomii  układu  pla- 
netarnego era  czynnego  eksperymentowania  zaczęła 
się  bardzo  niedawno,  dopiero  wówczas,  gdy  zasto- 
sowano rakiety  kosmiczne. 


Wielkości  fizyczne 

Metoda  naukowa  fizyki  jest  ścisła,  tj.  ilościowa. 

Oznacza  to  przede  wszystkim,  że  każde  zjawisko  sta- 
rają się  fizycy  opisać  za  pomocą  odpowiednich  mie- 
rzalnych cech,  zwanych  wielkościami  fizycznymi. 

Metoda  ta  okazała  się  niezwykle  skuteczna  i płodna. 

Stopniowo  przyjmowały  ją  i nadal  w większym  lub 
mniejszym  zakresie  przyjmują  inne  nauki  empiryczne. 

Wiele  ludzi,  w tym  spora  liczba  naukowców,  broni 
się  przed  wprowadzaniem  metod  ilościowych.  Uwa-  jakość  a ilość! 
żają  oni,  że  ilościowe  podejście  gubi  istotne  różnice  w fizyce 
jakościowe,  które  nie  dają  się  zmierzyć,  ponieważ 
możemy  porównywać  ilościowo  tylko  te  same  jakości, 
a więc  ilościowe  podejście  rzekomo  zuboża  ludzkie 
poznanie.  To  obronne  stanowisko  wynika  z niezro- 
zumienia znaczenia  metod  ilościowych  i możliwości 
pomiaru  oraz  matematycznego  zapisu. 

Otóż  trzeba  podkreślić  z naciskiem,  że  pomiar  nie 
gubi  żadnych  różnic  jakościowych.  Przeciwnie  — 
uściśla  je  i wzbogaca,  czyni  je  komunikatywnymi, 
obiektywnymi  i odtwarzalnymi.  Jest  faktem,  że  nie- 
które różnice,  które  naszym  zmysłom  wydają  się 
czysto  jakościowe,  udało  się  fizykom  sprowadzić  do 
różnic  czysto  ilościowych.  Tak  np.  barwa  żółta  jest 
dla  naszego  oka  jakościowo  odmienna  od  barwy  zie- 
lonej. Fizycy  odkryli  jednak,  że  światło  jest  falą 
elektromagnetyczną  i że  każdej  czystej  barwie  odpo- 
wiada określona  długość  fali.  Jakościowe  różnice 
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między  barwami  zostały  wyrażone  przez  ilościowe 
różnice  tej  samej  jakości,  którą  jest  długość  fali 
elektromagnetycznej.  Ludzkie  doznania  i wrażenia 
odbierane  przy  oglądaniu  barwnych  przedmiotów  nie 
zostały  przez  to  odkrycie  zubożone,  lecz  wręcz  prze- 
ciwnie, wzbogacone  przez  możliwość  dokładnej  fizycz- 
nej analizy  i reprodukcji  barwnych  obrazów. 

Najczęściej  jednak  różnice  jakościowe  nie  dają  się 
sprowadzić  do  różnic  często  ilościowych  w ramach 
tej  samej  jakości.  Dźwięki  np.  mają  też  naturę  falową. 
Wysokości  czystego  tonu  przyporządkowana  jest 
znowu  określona  długość  fali,  ale  tym  razem  jest  to 
fala  akustyczna,  która  ma  zupełnie  inne  własności 
niż  fala  elektromagnetyczna.  Chociaż  czysta  barwa 
i czysty  ton  określone  są  przez  długość  fali,  wiadomo 
jednak,  że  chodzi  o zupełnie  odmienne  rodzaje  fal 
(które  mierzymy  w zupełnie  inny  sposób),  więc 
stwierdzenie  takie  bynajmniej  nie  lekceważy  zasad- 
niczych różnic  jakościowych.  Zatem  ilościowe  podejś- 
cie nie  zuboża,  lecz  wzbogaca,  uściśla  i upraszcza 
nasze  poznanie,  stwarza  możliwości  zupełnie  nowego, 
syntetycznego  spojrzenia  na  świat  zjawisk,  daje  nowe 
możliwości  rozlicznych  praktycznych  zastosowań. 

Analiza  badanego  zjawiska  przy  użyciu  adekwat- 
nych wielkości  fizycznych  bywa  nieraz  zadaniem  nader 
trudnym,  polega  ona  bowiem  na  konkretnej  odpo- 
wiedzi na  3 zasadnicze  pytania  eksperymentatora : co, 
co,  jak  i czym  jak  1 czym  należy  mierzyć?  Trzeba  więc  wybrać  takie 
mierzyć?  ilościowe  cechy  badanego  zjawiska,  które  są  istotne 
i nieodzowne,  a jednocześnie  możliwie  wygodne  do 
jego  zrozumienia  i opisu.  Następnie  trzeba  się  zasta- 
nowić, jak  mierzyć  wybrane  cechy.  Wreszcie  trzeba 
skonstruować  odpowiednie  przyrządy  pomiarowe, 
wybrać  jednostki,  wycechować  przyrządy,  no  i wresz- 
cie wykonać  pomiary  z pożądaną  dokładnością.  Nie 
są  to  bynajmniej  proste  zadania,  o czym  świadczą 
liczne  przykłady  z historii  fizyki. 

Od  niepamiętnych  np.  czasów  ludzie  obserwowali 
rozmaite  ruchy  mechaniczne  polegające  na  zmianie 
położenia  i prędkości  ciał  materialnych.  Mieli  też 
pewne  — choć  raczej  niejasne  — pojęcie  o sile  jako 
przyczynie  sprawczej.  A jednak  bardzo  długo  nie 
potrafili  znaleźć  popiawnego  związku  między  siłą 
a ruchem,  ponieważ  nie  umieli  wybrać  odpowiednich 
wielkości  do  opisu  ruchu.  Największy  uczony  staro- 
żytności, Arystoteles,  nie  doceniał  znaczenia  pomiaru 
ani  ilościowego,  ścisłego  opisu  zjawisk.  Opierając  się 
na  powierzchownych  obserwacjach  ruchów,  w któ- 
rych występuje  tarcie,  doszedł  do  błędnego  prawa 
ruchu,  według  którego  stała  siła  wywołuje  zawsze 
ruch  ze  stałą  prędkością.  Choć  przez  dwa  tysiące  lat 
fizyka  Arystotelesa  miała  wielu  krytyków,  to  jednak 
aż  do  XVII  w.  nikt  nie  potrafił  podać  właściwego 
rozwiązania  tego  problemu. 

przykład : Dopiero  Galileusz  zwrócił  uwagę  na  przyspieszenie 

związek  ru-  jako  na  wielkość  bardzo  istotną  dla  zrozumienia 
chu  z siłą  związku  ruchu  z siłą.  Wreszcie  Newton  wprowadził 
pojęcie  masy  inercjalnej  i podał  poprawne  sformuło- 
wanie prawa  ruchu,  według  którego  siła  jest  równa 
_ zmianie  pędu  ciała  (punktu  materialnego)  w jednostce 
dp  czasu.  Przy  pełnym,  kinetycznym  opisie  ruchu  punktu 
dt  materialnego  istotnymi  wielkościami  są  składowe 

wektora  położenia  r(t)>  które  są  na  ogół  funkcjami 

czasu.  Pomiary  r{t)  ciał  na  Ziemi  są  wykonywane  za 
pomocą  stosunkowo  prostych  przyrządów,  a miano- 
wicie miarki  służącej  do  pomiaru  położeń  i zegara  — 
do  pomiaru  czasu.  Wyznaczenia  położeń  planet,  ko- 
met, Słońca  i gwiazd  praktycznie  nie  da  się  wykonać 
jedynie  za  pomocą  miarki  i zegara.  Wymaga  ono 
pomiarów  odpowiednich  kątów  i wykonania  specjal- 
nych rachunków.  W celu  zwiększenia  ostrości  widze- 
nia i dokładności  oraz  w celu  zobaczenia  wielu  nie- 
dostrzegalnych gołym  okiem  obiektów  astronomicz- 
nych stosuje  się  ponadto  lunety,  teleskopy,  refraktory, 
interferometry  itp.  Do  obserwacji  i pomiaru  bardzo 
małych  obiektów  stosuje  się  lupy,  mikroskopy  op- 
tyczne, elektronowe  itp.  Liczne  przyrządy  fizyczne 


służą  więc  do  zwiększenia  dokładności  pomiaru,  a na- 
wet rozszerzenia  zasięgu  naszych  zmysłów  poza  ob- 
szar ich  naturalnych  możliwości  postrzegania. 


Detektory  zjawisk 

Istnieje  wiele  zjawisk  (nawet  makroskopowych),  na 
które  nasze  zmysły  wcale  lub  prawie  wcale  nie  rea- 
gują. Nie  odczuwamy  np.  w ogóle  pola  elektrycznego 
i magnetycznego,  promieniowania  elektromagnetycz- 
nego (poza  wąskim  zakresem  widma  widzialnego)  ani 
promieniowań  korpuskularnych  (a,  /?,  neutronowego), 
chociaż  duże  dawki  promieniowania  mogą  nawet  wy- 
wołać groźne  schorzenia  lub  śmierć.  Bez  odpowied- 
nich przyrządów  fizycznych,  zwanych  detektorami, 
odkrycie  i poznanie  tego  typu  zjawisk  byłoby  w ogóle . 
niemożliwe.  Zostałyby  one  poza  granicami  naszego 
poznania,  jako  tajemne,  nieznane  moce  „z  innego 
świata”,  których  istnienia  człowiek  mógłby  się  tylko 
domyślać,  nie  mając  jednak  żadnych  możliwości  ich 
zbadania,  zrozumienia  i wykorzystania. 

Nasze  zmysły  są  więc  nie  tylko  bardzo  niedokładne 
i subiektywne,  a czasem  wręcz  zwodnicze  (przywi- 
dzenia, złudzenia,  halucynacje,  majaki,  stany  otępie- 
nia itp.),  ale  również  mają  pod  względem  jakościo- 
wym bardzo  wąski  zakres.  Detektory  fizyczne  po- 
zwalają nam  uwolnić  się  od  subiektywności,  niedo- 
kładności i zawodności  naszych  zmysłów,  a ponadto 
umożliwiają  nieograniczone  rozszerzenie  ludzkiego 
poznania  na  jakościowo  nowe  zjawiska,  niedostępne 
bezpośredniej  zmysłowej  obserwacji.  Potęga  współ- 
czesnych nauk  fizycznych  polega  na  konstrukcji  coraz 
bogatszego  zestawu  coraz  bardziej  wszechstronnych, 
coraz  czulszych  i wygodniejszych  detektorów. 

Ogólna  zasada  działania  wszelkich  detektorów  fi-  konwersja 
zycznych  sprowadza  się  do  zamiany  (konwersji)  zja-  zjawisk 
wisk  słabo  dostrzegalnych  lub  wręcz  bezpośrednio, 
zmysłowo  niedostrzegalnych  — na  inne,  łatwo  obser- 
wowalne  przez  nasze  zmysły.  Najdokładniejszym 
i najważniejszym  narzędziem  poznawczym  człowieka 
jest  z pewnością  zmysł  wzroku,  który  wsparty  odpo- 
wiednimi urządzeniami  w postaci  podziałek,  wskaźni- 
ków i różnych  wzmacniaczy  — potrafi  zauważyć 
nawet  bardzo  niewielkie  zmiany  wzajemnego  poło- 
żenia odpowiednio  skonstruowanych  części  detek- 
tora (np.  wskazówki  przesuwające  się  względem  nie- 
ruchomej skali,  cyfry  licznika  automatycznego  rosną- 
ce o jeden  po  każdym  zarejestrowanym  błysku  optycz- 
nym czy  innym  sygnale).  Bez  żadnych  istotnych  ogra- 
niczeń możemy  więc  określić  detektory  fizyczne  jako 
urządzenia  (przyrządy)  zamieniające  różne  zjawiska 
fizyczne  na  dające  się  łatwo  obserwować  zjawiska 
mechaniczno-wizualne : w końcu  obserwujemy  zawsze 
tylko  wzajemne  położenie  pewnych  części  detektora. 

Detektorami  są  zarówno  tak  proste  przyrządy,  jak  np. 
zegar  i waga,  jak  i bardziej  złożone,  w rodzaju  ter- 
moskopu,  busoli,  baroskopu,  elektroskopu,  galwano- 
skopu,  spektroskopu,  mikroskopu,  teleskopu. 


Przyrządy  pomiarowe 

Dobrze  skonstruowany  detektor  reaguje  na  występo- 
wanie lub  zmianę  w badanym  zjawisku  jakiejś  jednej 
wielkości  fizycznej.  Detektor  taki  można  więc  wy-  wzorcowanie 
wzorcować,  tj.  zaopatrzyć  w skalę  odpowiednią  do  detektora 
wybranego  układu  jednostek.  Z jakościowego  wykry- 
wacza danego  zjawiska  staje  się  on  wówczas  ilościo- 
wym przyrządem  pomiarowym,  a więc  termoskop 
staje  się  termometrem,  galwanoskop  — woltomie- 
rzem lub  amperomierzem,  spektroskop  — spektro- 
metrem, wykrywacz  promieniowania  staje  się  licz- 
nikiem określonego  rodzaju  mikrocząsteczek  itd. 

Zbudowanie  i wy  wzorcowanie  odpowiedniego  zestawu 
detektorów  stanowi  definitywną  i konkretną  odpo- 
wiedź na  trzy  sakramentalne  dla  każdego  kierunku 
badań  pytania:  co,  jak  i czym  mierzyć? 
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przykład : 
od  terir.osko- 
pu  do  termo- 
pary 


określenie 
a priori 
a pomiary 


Problem  wzorcowania  detektora  i przeistoczenia 
go  w pełnosprawny  przyrząd  pomiarowy  jest  często 
bardzo  trudny  — nawet  w pozornie  prostych  przy- 
padkach. Weźmy  za  przykład  termometr,  tj.  przyrząd 
do  pomiaru  temperatury.  Nasz  wrodzony  zmysł  tem- 
peratury jest  wysoce  niedokładny,  subiektywny  i ma 
ponadto  mały  zasięg,  uwarunkowany  chociażby  fak- 
tem, że  nasze  ciało  może  żyć  i funkcjonować  tylko 
w bardzo  wąskim  przedziale  temperatur.  Termoskop 
wykrywający  zmiany  temperatury  na  podstawie  zmia- 
ny objętości  ustalonej  ilości  gazu  skonstruował  w koń- 
cu XVI  w.  Galileusz.  Wybór  najwygodniejszej  sub- 
stancji termometry cznej,  wybór  jednostki  i punktu 
zerowego  skali  temperatur  itp.  trwał  właściwie  parę 
wieków.  W połowie  XVIII  w.  powstały  względnie  do- 
kładne i wygodne  termometry  rtęciowe  i wprowadzono 
do  dziś  stosowane  skale,  oparte  na  punktach  krzep- 
nięcia i wrzenia  wody  lub  innych  cieczy,  a dopiero 
w 2.  połowie  XIX  w.  usunięto  dowolność  tego  typu 
skal,  wprowadzając  pojęcie  absolutnego  zera  i termo- 
dynamiczną skalę  temperatur. 

Ponieważ  jednak  nawet  najlepiej  wzorcowany  ter- 
mometr rtęciowy  nie  działa  ani  w zbyt  niskich,  ani 
w zbyt  wysokich  temperaturach,  powstał  więc  problem 
konstrukcji  innych  typów  termometrów,  działających 
poza  zakresem  termometru  rtęciowego,  problem  roz- 
szerzenia zakresu  mierzonych  temperatur.  Skonstruo- 
wano termometry  oporowe,  radiacyjne,  termopary 
itp.,  które  pozwalają  na  ekstrapolację  pojęcia  tempe- 
ratury daleko  poza  wąski  obszar  bezpośrednio  uch- 
wytny zmysłowo.  Chociaż  dzięki  znajomości  zasad 
termodynamiki  nie  mamy  zasadniczych  kłopotów 
z ekstrapolacją  skali  temperatur,  to  jednak  trudności 
techniczne  związane  z konstrukcją  coraz  dokładniej- 
szych i czulszych  termometrów  o coraz  większym 
zakresie  są  bardzo  duże  i prace  nad  udoskonaleniem 
termometrów  prowadzi  się  nadal. 

Zagadnienie  przygotowania  dostosowanych  do 
badanego  zjawiska  przyrządów  pomiarowych  wyma- 
ga nie  tylko  pracy  techniczno-konstrukcyjnej,  lecz 
także  pracy  koncepcyjnej,  pojęciowej.  Przyrząd  po- 
miarowy jest  ściśle  związany  z pojęciem  wielkości 
fizycznej,  którą  mierzy.  Na  czym  polega  ten  związek? 

Wiele  ludzi  sądziło  dawmiej,  że  wprowadzenie 
adekwatnych  do  badanego  zjawiska  wielkości  fizycz- 
nych jest  przede  wszystkim  procesem  koncepcyjnym, 
dokonującym  się  w umyśle  badacza,  który  dopiero 
po  wypracowaniu  w drodze  abstrakcyjnego  rozumo- 
wania najstosowniejszych  według  niego  pojęć  po- 
winien przystąpić  do  konstrukcji  odpowiednich  przy- 
rządów pomiarowych.  Jaką  gwarancję  może  mieć 
tak  postępujący  badacz,  że  przyrząd  pomiarowy  mie- 
rzy rzeczywiście  tę  samą  wielkość  fizyczną,  która  zo- 
stała określona  czysto  abstrakcyjnie  i a priori  (np. 
przez  podanie  z góry  logicznej  definicji  pojęcia)? 
W historii  fizyki  wiele  pojęć  wprowadzono  a priori , 
a dopiero  później  przystąpiono  do  konstrukcji  od- 
powiednich przyrządów  pomiarowych.  Nierzadko 
okazywało  się  potem,  że  postulowany  obiekt,  proces 
czy  naw-et  pozornie  prosta  wielkość  fizyczna  wcale  nie 
ma  narzuconych  a priori  własności.  Na  przykład  ato- 
my wprow  adzono  do  fizyki  i chemii  jako  niezniszczal- 
ne, niepodzielne  i najmniejsze  cząstki  materii,  które 
mogą  się  łączyć  w drobiny  związków  chemicznych. 
Wszechstronne  badania  i pomiary  własności  atomów 
wykazały,  że  nie  są  one  ani  niezniszczalne,  ani  nie- 
podzielne, ani  nie  stanowią  najmniejszych  cegiełek 
składowych  materii,  że  zatem  pierwotne  koncepcje 
można  traktować  jedynie  jako  przybliżenie  przydatne 
w pewnym  wąskim  zakresie  zjawisk. 

Na  początku  XX  w.  Einstein  wykazał,  że  newto- 
nowskie definicje  nawet  tak  podstawowych  pojęć 
fizycznych  jak  odległość,  czas,  równowczesność,  ko- 
lejność czasowa  zdarzeń  itd.  nie  zgadzają  się  z po- 
miarami wykorzystującymi  własności  światła.  Im- 
plikują one  zupełnie  inne  własności  tych  wielkości 
niż  te,  które  postulował  Newton. 

Nauczeni  tymi  i wieloma  innymi  doświadczeniami 
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fizycy  przypisują  obecnie  znacznie  większą  rolę  przy- 
rządowi pomiarowemu.  Przyjmuje  się  mianowicie, 
że  wielkość  fizyczna  jest  z reguły  dobrze  określona 
dopiero  przez  podanie  pełnego  przepisu  jej  pomiaru. 
Dopiero  analiza  sposobu  i wyników  pomiaru  daje  nam 
możliwość  adekwatnej  do  rzeczywistości  konstrukcji 
pojęciowej  badanej  wielkości  czy  złożonego  zjawiska. 
Takie  określenie  wielkości  fizycznej  przez  podanie 
sposobu  jej  pomiaru  nazywa  się  określeniem  opera- 
cyjnym. Prócz  wielkości  określonych  operacyjnie, 
a więc  związanych  bezpośrednio  z pomiarami,  fizyka 
współczesna  używa  także  pojęć,  które  mają  charakter 
konstrukcji  matematycznych,  związanych  z pomia- 
rem tylko  pośrednio  (np.  funkcja  stanu  w mechanice 
kwantowej)  lub  wymagających  do  pełnego  określenia 
bardzo  wielu,  a nawet  nieskończenie  wielu  pomiarów. 

W każdym  razie  warto  jeszcze  raz  podkreślić,  że 
przyrząd  pomiarowy  odgrywa  we  współczesnej  fizyce 
ważną  rolę  koncepcjotwórczą. 

Szukanie  związków  (praw  fizycznych) 

Wynik  pomiaru  zawsze  można  zapisać  w postaci  licz- 
by lub  zbioru  liczb,  funkcji  itp.,  dających  się  przed- 
stawić w postaci  wykresu,  diagramu,  tabeli  itp.  Trzeba 
przy  tym  pamiętać,  że  są  to  liczby  obdarzone  jakością, 
która  jest  określona  przez  przepis  wykonywania  po- 
miaru. To  często  nie  uwidaczniane  w zapisie  „miano” 
wielkości  jest  bardzo  ważne  dla  fizyka,  choć  może 
mało  obchodzić  matematyka. 

Między  różnymi  wielkościami  występującymi  w da- 
nym zjawisku  mogą  występować  pewne  związki,  zwa- 
ne prawami  fizycznymi.  Ponieważ  wielkości  fizyczne 
wyrażają  się  przez  liczby  lub  bardziej  złożone  twory 
matematyczne,  związki  między  nimi  dają  się  zapisać 
w postaci  relacji  matematycznych  między  symbolami 
reprezentującymi  poszczególne  wielkości.  Najcen- 
niejsze dla  fizyka  są  związki  mające  postać  matema- 
tycznych równań,  choć  nie  do  pogardzenia  są  również 
nierówności  i inne  relacje  matematyczne.  Znajdowa- 
nie praw  fizyki  i badanie  na  drodze  matematycznej  ich 
różnych  konsekwencji  jest  głównym  celem  teorii 
fizycznych. 

Przystępując  do  badania  jakiegoś  nowego,  złożo- 
nego zjawiska,  staramy  się  przede  wszystkim  dokład- 
nie i wszechstronnie  zmierzyć  różne  występujące  w 
nim  wielkości  fizyczne.  Lepiej  jest  zmierzyć  raczej 
za  dużo  niż  za  mało  różnych  wielkości  fizycznych. 
Posiadając  bowiem  za  mało  informacji,  na  pewno  nie 
możemy  w pełni  opisać  badanego  zjawiska.  Jeśli  na- 
tomiast wprowadzimy  za  dużo  wielkości,  to  dosta- 
tecznie dokładne  pomiary  wykażą,  że  nie  są  one  nie- 
zależne i że  można  wszystkie  wielkości  wyrazić  alge- 
braicznie przez  pewne  wielkości  podstawowe.  Żadna 
z wielkości  podstawowych  nie  da  się  — ogólnie  bio- 
rąc— wyrazić  jako  funkcja  pozostałych,  ale  mogą 
między  nimi  występować  bardziej  złożone  związki, 
np.  w postaci  równań  różniczkowych  lub  całkowych. 
Taką  postać  mają  równania  ruchu  Newtona,  rów- 
nania Maxwelia  czy  równania  wielu  innych  teorii. 

Rozpatrzmy  względnie  prosty  przykład  klasycznej 
mechaniki  punktu  materialnego  (cząstki).  Podstawo- 
wymi wielkościami  fizycznymi  w tym  problemie  są 

masa  cząstki  m oraz  wektory  położenia  r(t)  i siły 

F(t).  Jeśli  znamy  te  wielkości  w interesującym  nas 
przedziale  czasu,  to  znamy  właściwie  wszystko:  wie- 
my, jak  się  cząstka  porusza,  wiemy,  jaka  jest  jej  masa 
i jaka  siła  na  nią  działa.  Algebraicznie  wielkości  te  są 
niezależne,  tzn.  nie  ma  ogólnego  słusznego  dla  do- 
wolnego ruchu  związku  funkcyjnego,  który  by  wy- 
rażał /*(/)  jako  funkcję  m i F(t)  (lub  F(t)  jako  funkcję 

m i 7(/)).  Łatwo  jednak  zauważyć,  że  siła  F(t)  w jakiś 
sposób  wpływa  na  ruch,  choć  nie  określa  go  jedno- 
znacznie. Na  przykład  stała  siła  grawitacyjna  powo- 
duje, że  wszelkie  możliwe  tory  cząstek  są  parabolami 
o osiach  skierowanych  zgodnie  z kierunkiem  siły. 
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Znając  funcję  wektorową  r(t)  w w pewnym  prze- 
dziale czasu,  możemy  obliczyć  jej  kolejne  pochodne : 


— dr 

v = — — . 

dt 


— d-r  — dzr 

v~~dir 


Pierwsze  dwie  pochodne  nazywamy  odpowiednio 
prędkością  i przyspieszeniem  cząstki  w chwili  t. 
Z pierwotnych  wielkości  oraz  powyższych  pochodnych 
możemy  utworzyć  teraz  dalsze  bardziej  złożone  wiel- 
kości, jak  np.  pęd,  moment  pędu,  moment  siły: 


P = 


j/l  -v*lc2 


rxp , D = rxF, 


Szukany  związek  między  ruchem,  czyli  funkcją  r(/), 
a siłą  znalazł  Newton  w postaci  równości  siły  i po- 
chodnej pędu: 


Czysto  matematyczną  konsekwencją  tego  prawa  jest 
analogiczny  związek  między  momentami: 


dj 

dt 


= D. 


Prawo  ruchu  Newtona  ma  postać  niezależną  ani  od 
konkretnej  wartości  siły,  ani  od  konkretnego  toru 

r(/),  ani  od  wartości  masy.  Dotyczy  więc  dowolnych 
sił,  dowolnych  wartości  masy  i całej  klasy  torów  do- 
puszczalnych przez  to  prawo.  Z matematycznego 
punktu  widzenia  prawo  dynamiki  Newtona  jest  ukła- 
dem 3 równań  różniczkowych  drugiego  rzędu  na  nie- 
znane funkcje  czasu  x(t),  y(t)y  z(t).  Nawet  przy  okre- 
ślonej wartości  F(t)  i m równania  te  dopuszczają  jesz- 
cze nieskończenie  wiele  rozwiązań.  Rozwiązanie,  tj. 

funkcja  r(t),  będzie  jednoznacznie  określone  dopiero 
po  sprecyzowaniu  warunków  początkowych,  tj.  po 

podaniu  wektorów  położenia  r(/0)  i prędkości  v0=p(/0) 
w chwili  początkowej  t0. 

Prawa  fizyki  mają  bardzo  często  różniczkowy  lub 
całkową  postać,  która  jak  widzieliśmy  na  powyższym, 
stosunkowo  prostym  przykładzie  — nie  dotyczy  jed- 
nego szczególnego  ruchu,  ale  podaje  związki  praw- 
dziwe w odniesieniu  do  całej  klasy  fizycznie  dopusz- 
czalnych ruchów.  Innymi  słowy  — różniczkowe  pra- 
wa fizyki  dopuszczają  nieskończenie  wiele  rozwiązań. 
Wybór  konkretnego  rozwiązania  jest  zależny  od  in- 
teresującej nas  konkretnej  sytuacji  fizycznej.  Prawa 
fizyki  opisują  więc  tylko  ogólne  związki,  które  odno- 
szą się  do  nieskończonej  liczby  fizycznie  dopuszczal- 
nych sytuacji,  mają  zatem  bardzo  syntetyczny,  ogól- 
ny i powszechny  charakter.  Językiem  adekwatnym 
do  zapisu  tych  ogólnych  związków  oraz  do  ich  anali- 
zy i wyciągania  różnorodnych  wniosków  jest  ścisły 
i ogólny  język  matematyki. 


Teorie  fizyczne 

Fizyka  interesują  takie  obiekty  jak  cząstki  elementar- 
ne, jądra,  atomy,  jony,  molekuły  oraz  makroskopowe 
układy  takich  cząstek  jak  np.  gazy,  ciecze,  ciała  stałe, 
planety  i gwiazdy  tudzież  pola.  Teorią  fizyczną  na- 
zywamy zbiór  zapisanych  w postaci  matematycznej 
praw  fizycznych  odnoszących  się  do  obiektów  okre- 
ślonego typu,  uzupełniony  warunkami  stosowalności, 
warunkami  wyboru  fizycznie  dopuszczalnych  roz- 
wiązań oraz  omówieniem  precyzującym  znaczenie 
fizyczne  występujących  symboli  matematycznych. 
Teoria  powinna  podawać  związki  przyczynowe  i opi- 
sywać występujące  w rozważanym  obiekcie  (układzie) 
zjawiska  i prawa  możliwie  kompletnie,  ogólnie  i z wy- 
starczającą dokładnością.  Kryterium  przydatności 
teorii  fizycznej  jest  zawsze  ilościowa  zgodność  jej 
przewidywań  z faktami  doświadczalnymi.  Każda 


teoria  fizyczna  ma  ograniczony  zasięg  stosowalności 
i ograniczoną  dokładność.  Jednym  z głównych  celów 
badań  fizycznych  jest  więc  konstrukcja  coraz  dosko- 
nalszych teorii,  tzn.  teorii,  które  są  coraz  głębsze 
i ogólniejsze,  mają  coraz  większy  zasięg  stosowalności 
i coraz  lepszą  zgodność  z doświadczeniem. 

Rozpatrzymy  dla  przykładu  sukcesywne  teorie  ru-  przykład : 
chów  planet.  Teoria  geocentryczna  Ptolemeusza  była  teoria  ruchu 
czysto  opisowym,  kinematycznym,  niedynamicznym  planet 
i nieprzy  czy  nowym  schematem  rachunkowym.  Znacz- 
nie uprościł  i ufizycznił  opis  ruchów  planet  Kopernik, 
wprowadzając  konsekwentnie  układ  heliocentryczny. 

Stosując  ten  układ,  Kepler  odkrył  3 ważne  kinema- 
tyczne prawa  ruchu.  Pierwszą  ogólną,  przyczynową 
i dynamiczną  teorię  podał  Newton.  Składają  się  na 
nią  uniwersalne  prawa  dynamiki  Newtona  oraz  pra- 
wo powszechnego  ciążenia.  Następnym  udoskona- 
leniem było  uwzględnienie  na  początku  XX  w.  re- 
latywistycznej zależności  masy  od  prędkości.  Najdo- 
kładniejszą w tej  chwili  teorią  ruchów  planet  jest 
teoria  grawitacji  Einsteina  (tzw.  ogólna  teoria  względ- 
ności), która  przewiduje  drobne  odstępstwa  od  wyni- 
ków teorii  Newtona  (np.  ruch  peri  helion  owy  Merku- 
rego). Teoria  Einsteina  jest  ponadto  najgłębszą  — 
w sensie  przyczynowego  tłumaczenia  zjawisk  — te- 
orią grawitacji  i ruchów  planetarnych.  Paradoksalnie 
wręcz  brzmi  stwierdzenie,  że  dokładność  teorii  Einstei- 
na przekracza  ciągle  doświadczalne  możliwości.  Wie- 
le przewidywanych  przez  tę  teorię  efektów,  np.  pewne 
poprawki  do  ruchów  planet,  promieniowanie  grawi- 
tacyjne itd.,  są  tak  małe,  że  nie  dadzą  się  wykryć  przy 
zastosowaniu  znanych  dotychczas  detektorów.  Inne 
przewidywane  przez  tę  teorię  efekty,  jak  np.  czarne 
dziury,  mogą  występować  jedynie  w dużych,  kosmicz- 
nych obiektach  i też  nie  zostały  jeszcze  definitywnie 
wykryte. 

Historia  różnych  dziedzin  fizyki  toczyła  się  różnie. 

Przeważnie  rozpoczynała  się  od  doświadczalnego  od- 
krycia jakiegoś  nowego  zjawiska  (obiektu,  procesu, 
własności).  W takiej  sytuacji  w pierwszym  okresie 
badawczym  dominował  eksperyment,  a więc  kon- 
strukcja odpowiednich  detektorów,  pomiary  różnych 
charakterystycznych  wielkości,  szukanie  fenomeno- 
logicznych reguł,  korelacji,  struktur  i związków. 

Oczywiście  i na  tym  etapie  — jak  już  wspominaliśmy 

— dużą  rolę  odgrywa  tworzenie  nowych  pojęć  i kon- 
strukcji myślowych,  bez  których  eksperyment  byłby 
ślepy  i przypadkowy.  Koncepcje  teoretyczne  wpro- 
wadzane wówczas  są  więc  nieodzowne  dla  właściwego 
ukierunkowania  doświadczeń.  Nie  stanowią  one  jesz- 
cze teorii,  ale  są  przygotowaniem  teorii,  której  celem 
jest  wykrycie  istotnych  dla  danego  typu  obiektów 
czy  zjawisk,  strukturalnych  i dynamicznych  związków 
przyczynowych  oraz  zapisanie  ich  w odpowiedniej 
matematycznej  formie. 

Z chwilą  skonstruowania  takiej  teorii  zaczyna  się 
badanie  i sprawdzanie  jej  konsekwencji.  Od  metody 
indukcyjnej,  stosowanej  na  poprzednim  konstruk- 
cyjnym etapie,  przechodzi  się  do  metody  dedukcyjnej, 
polegającej  na  wyciąganiu  logicznych  wniosków  z za-  od  teorii  do 
łożeń  i równań  teorii.  Dobra  teoria  nie  powinna  za-  doświadczę- 
wierać  logicznych  i matematycznych  sprzeczności,  nia 
powinna  tłumaczyć  przyczynowo  znane  już  fakty 
i przewidywać  nowe.  Za  szczególnie  cenne  osiągnięcie 
teorii  uważa  się  potwierdzenie  przez  doświadczenie 
wszystkich  przewidywań  nieznanych  uprzednio  fak- 
tów. Oczywiście  zgodność  z faktami  doświadczalnymi 
musi  być  ilościowa,  a nie  tylko  jakościowa.  Ważną 
zaletą  każdej  teorii  fizycznej  jest  więc  możliwie  do- 
kładna zgodność  z doświadczeniem. 

Zdarzyło  się  niejednokrotnie  w historii  fizyki,  że 
pewne  nieoczekiwane  przewidywania  teorii  dawały 
asumpt  do  wykrycia  zupełnie  nowych  zjawisk  i do 
powstania  nowych  działów  fizyki.  Czasem  więc  i do- 
świadczenie wyprzedza  teorię,  czasem  — na  odwrót 

— teoria  wyprzedza  doświadczenie.  Maxwell  np. 
przewidział  na  podstawie  skonstruowanej  przez  sie- 
bie teorii  elektryczności  i magnetyzmu  istnienie  fal 
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elektromagnetycznych  i zbadał  teoretycznie  ich  wła- 
sności. Fale  te  wykrył  doświadczalnie  H.  Hertz  wiele 
lat  później.  Szczególna  teoria  względności  Einsteina 
przewidywała  szereg  zaskakujących  efektów,  jak  np. 
wzrost  masy  lub  wydłużanie  się  czasu  życia  nietrwa- 
łych cząstek  będących  w ruchu  względem  obserwa- 
tora, co  zostało  później  potwierdzone  doświadczalnie. 

Można  podać  bardzo  wiele  takich  przykładów  swo- 
istego wyprzedzania  doświadczenia  przez  teorię. 
Z drugiej  jednak  strony  — wszystkie  teorie  fizyczne 
powstały  w wyniku  analizy  odpowiednich  danych 
doświadczalnych.  Nie  ma  w fizyce  sprawdzonych  te- 
orii, które  byłyby  „wymyślone'’  na  drodze  czysto 
racjonalnych  rozważań,  nie  opierających  się  na  żad- 
nych faktach  doświadczalnych.  Jest  to  możliwe  w ma- 
tematyce, która  jako  nauka  czysto  racjonalna  nie 
musi  się  opierać  na  żadnych  realnych  faktach.  Ale 
fizyka  jest  nauką  empiryczną,  nie  może  być  zatem 
czysto  racjonalna,  lecz  musi  być  racjonaln ©-empi- 
ryczna. 


Sprzężenie  teorii  z doświadczeniem 

Czasami  po  pewnym  okresie  badań  eksperymental- 
nych i przygotowawczej  działalności  koncepcyjnej 
dobra  teoria  powstawała  stosunkowo  szybko,  tj.  bez 
wielu  nieudanych  prób.  Niejednokrotnie  powstanie 
dobrej  teorii  poprzedzał  szereg  próbnych  hipotez, 
które  po  konfrontacji  z doświadczeniem  trzeba  było 
odrzucać  lub  modyfikować,  usuwając  stopniowo  zau- 
ważone braki  i luki. 

Racjonalno-empiryczna  metoda  naukowa,  stoso- 
wana w fizyce  i innych  naukach  empirycznych,  opiera 
się  na  bardzo  charakterystycznych  cyklach  badaw- 
cyk!  czych.  Typowy  cykl  badawczy  składa  się  z następu- 
badawczy  jących  etapów  (rys.  1):  stan  początkowy  (wyjściowy) 
wiedzy,  postawienie  problemu,  wysunięcie  hipotezy 
rozwiązującej  ten  problem  (przynajmniej  częściowo). 


Rys.  1 . Struktura  typowego  cyklu  badawczego.  Strzałki  niebieskie 
przedstawiają  sprzężenia  zwrotne 


testowanie  hipotezy  (logiczne,  matematyczne  i em- 
piryczne), analiza  hipotezy  i problemu  w świetle  wy- 
ników testów  (odrzucenie,  korekta  lub  przyjęcie  hipo- 
tezy), nowy  stan  wiedzy. 

Jeśli  testy  nie  potwierdzają  w pełni  hipotezy,  należy 
ją  poprawić  lub  zastąpić  nową  hipotezą,  albo  też 
skorygować  sam  problem,  rozpoczynając  w ten  sposób 
nowy  cykl  badawczy.  Jeśli  po  pewnej  liczbie  takich 
cykli  dojdziemy  do  zgodnej  z wszystkimi  faktami 
hipotezy  rozwiązującej  nasz  problem,  możemy  ją 
uznać  za  dobrą  teorię  i włączyć  do  zasobu  sprawdzo- 
nej wiedzy  naukowej.  Wynikiem  takiego  postępowa- 
nia jest  więc  osiągnięcie  nowego,  wyższego  poziomu 
wiedzy. 

Punktem  wyjściowym  każdego  cyklu  badawczego 
jest  zastany  przez  badacza  stan  wiedzy,  z którego 
wyłania  się  problem  (pytanie).  Czasem  rozwiązanie 
problemu  wynika  z już  znanych  faktów  oraz  już 
istniejących  teorii  i nie  wymaga  nowych  hipotez  ani 
stosowania  podanego  cyklu  badawczego.  Innymi  sło- 
wy, odpowiedź  na  tego  typu  pytanie  tkwi  implicite 
w zastanej  wiedzy,  ale  wymaga  zebrania  i przetwo- 
rzenia pewnych  informacji.  Jeśli  np.  zapytamy  astro- 


noma, jakie  będzie  położenie  planety  Wenus  jutro 

0 godzinie  23,  to  z pewnością  nie  odpowie  nam  z miej- 
sca, lecz  najpierw  zajrzy  do  odpowiednich  tablic  astro- 
nomicznych, następnie  wykona  konieczne  obliczenia 

1 dopiero  potem  będzie  mógł  podać  współrzędne  pla- 
nety w żądanej  chwili.  Tego  rodzaju  problemy  wy- 
stępują z reguły  w nauczaniu  oraz  w zastosowaniach 
wiedzy  naukowej,  gdzie  odgrywają  bardzo  istotną 
rolę.  Do  poznania  nie  wmoszą  jednak  nic  istotnie 
nowego,  ponieważ  właściwie  nie  doskonalą  i nie  roz- 
szerzają zasobu  naszej  wiedzy,  wydobywają  tylko 
z ogromu  tej  wiedzy  aktualnie  interesującą  nas  in- 
formację. 

Z poznawczego  punktu  widzenia  znacznie  waż- 
niejszy jest  inny  typ  problemów,  które  są  impliko- 
wane przez  aktualną  wiedzę  naukową,  ale  których 
rozwiązanie  nie  wynika  z tej  wiedzy,  lecz  wymaga  jej 
rozszerzenia.  Na  przykład  — po  odkryciu  możli- 
wości wzbudzania  atomów  oraz  jonizacji,  tj.  wyry- 
wania elektronów  z atomów  lub  molekuł,  powstały 
następujące  problemy:  Jakie  siły  trzymają  elektrony 
w atomie?  Jakie  ruchy  może  wykonywać  elektron 
w atomie?  Jakie  jest  pochodzenie  dodatniego  ładun- 
ku, który  neutralizuje  ujemny  ładunek  elektronów? 
Jak  rozłożone  są  ładunki  dodatnie  i ujemne  w atomie? 

Pierwsze  hipotezy  opierały  się  na  założeniu,  że 
elektrony  trzymane  są  w atomie  siłami  elastycznymi 
(niewiadomego  pochodzenia)  i mogą  wykonywać 
drgania  o stałej  częstości  dokoła  położenia  równowagi. 
Dodatni  ładunek  i masa  atomu  miały  być  rozmazane 
po  całym  jego  wnętrzu.  Taki  prosty  model  teoretyczny 
tłumaczył  sporo  zjawisk,  ale  nie  potrafił  dać  odpo- 
wiedzi na  dwa  ostatnie  z podanych  wyżej  pytań.  Poza 
tym  nie  potrafił  wyjaśnić  wielkiej  liczby  częstości 
drgań  występujących  nawet  w najprostszym  jednoelek- 
tronowym  atomie  wodoru.  Dopiero  z przeprowadzo- 
nej przez  Rutherforda  analizy  rozproszeń  cząstek  a 
przez  atomy  wynikło,  że  cały  dodatni  ładunek  ato- 
mu i prawie  cała  jego  masa  skupione  są  w jądrze 

0 rozmiarach  ok.  105  razy  mniejszych  od  rozmiarów 
atomu  i że  elektrony  krążą  dokoła  jądra  trzymane  na 
uwięzi  przez  siły  kulombowskiego  przyciągania  po- 
chodzące od  dodatniego  ładunku  jądra.  Dwa  lata 
później  (1913  r.)  Bohr  zaproponował  swój  model  ato- 
mu wodoru,  w którym  uwzględnił  wyniki  Rutherfor- 
da, dodał  przy  tym  do  mechaniki  Newtona  trzy  nowe 
kwantowe  postulaty.  Również  model  Bohra  nie  był 
w pełni  zadowalający,  gdyż  nie  dawał  możliwości 
obliczenia  natężeń  linii  widmowych,  nie  nadawał  się 
do  obliczeń  poziomów  cięższych  atomów  itd.  Wresz- 
cie w 1925  r.  powstała  mechanika  kwantowa  (falowa) 
atomu,  którą  po  pewnych  udoskonaleniach,  związa- 
nych z wprowadzeniem  spinu  i statystyki,  uwzględ- 
nieniem efektów  relatywistycznych  itp.,  można  było 
uznać  za  dobrą  teorię  atomów,  molekuł  i wszelkich 
ciał  z nich  złożonych. 

Widać  na  tym  przykładzie,  że  w celu  rozwiązania 
drugiego  rodzaju  problemów  należy  wysunąć  od- 
powiednią hipotezę  teoretyczną,  której  zasadność 

1 poprawność  trzeba  wszechstronnie  sprawdzić.  Zgo- 
dne z hipotezą  wyniki  testów  uzasadniają  ją,  tzn. 
umacniają  przekonanie  o jej  słuszności,  ale  z logicz- 
nego punktu  widzenia  jedynie  jej  nie  wykluczają  i nie 
stanowią  nigdy  niezbitego  dowodu  jej  prawdziwości. 
Dotyczy  to  nawet  bardzo  dobrze  ugruntowanych, 
wszechstronnie  sprawdzonych  i empirycznie  po- 
twierdzonych teorii.  Ani  więc  próbne,  robocze  hipo- 
tezy, ani  też  dobrze  sprawdzone  teorie  fizyczne  nie 
są  niepodważalne  i absolutnie  prawdziwe.  Nawet 
najlepsze  teorie  mają  ograniczony  zasięg  stosowal- 
ności, tzn.  tłumaczą  i opisują  w zgodzie  z doświad- 
czeniem tylko  pewien  ograniczony  zakres  realnych 
faktów;  ponadto  opis  ten  ma  zawsze  ograniczoną 
dokładność.  Nawet  najlepiej  sprawdzone  teorie  nie 
mają  więc  charakteru  ostatecznej,  dokładnej  i abso- 
lutnej prawdy,  przedstawiają  jedynie  prawdy  cząstko- 
we, oparte  na  pewnych  przybliżeniach.  I tak  np. 
wspomniana  mechanika  kwantowa  atomu  też  nie  jest 
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uniwersalną  i bezwzględnie  dokładną  teorią,  choć  jej 
zasięg  stosowalności  jest  naprawdę  ogromny.  Zasięg 
ten  nie  obejmuje  jednak  ani  cząstek  elementarnych, 
ani  wnętrza  jądra,  ani  licznych  procesów  promienio- 
wania, kreacji  i anihilacji  cząstek  itd. 

Scharakteryzowana  wyżej  metoda  badawcza,  opar- 
ta na  powtarzaniu  stopniowo  doskonalonych  cykli 
badawczych,  ma  tę  zaletę,  że  świetnie  pasuje  do  przy- 
bliżonego i stopniowego  charakteru  naszego  pozna- 
nia. Pozwala  ona  bowiem  na  systematyczne  doskona- 
lenie naszej  wiedzy,  która  polega  nie  tylko  na  odkry- 
waniu nowych  faktów,  lecz  także  na  tworzeniu  no- 
wych coraz  lepszych  teorii,  opisujących  przyczynowo 
coraz  większy  zakres  faktów  z coraz  większą  dokład- 
nością. Metoda  naukowa  fizyki  nie  jest  więc  metodą 
zdobywania  prawd  absolutnych,  lecz  metodą  dosko- 
nalenia prawd  cząstkowych,  metodą  kolejnych  przy- 
bliżeń. 


Rola  teorii  w poznaniu  przyrody 

Doskonalenie  wiedzy  naukowej  jest  możliwe  dzięki 
zawartym  w cyklu  badawczym  sprzężeniom  zwrot- 
nym między  hipotezą  i realnymi  faktami,  czyli  między 
teorią  i doświadczeniem.  Struktura  tego  cyklu  uwzglę- 
dnia również  ogromną  rolę  teorii  w poznaniu  świata. 
Może  się  wydawać,  że  teoria  jest  niepotrzebnym,  bo 
jak  stwierdziliśmy  wyżej  — nie  całkiem  pewnym  ele- 
mentem poznania.  Realne  fakty  są  niewątpliwie  pew- 
niejsze i ich  znajomość  stanowi  oczywiście  niezwykle 
cenną  część  wiedzy  naukowej.  Wiedza  uznająca  tylko 
realne  fakty,  a odrzucająca  wszelkie  teorie  wykracza- 
jące poza  porządkowanie  faktów,  byłaby  jednak 
wiedzą  często  opisową,  me  wchodzącą  w przyczyny 
zjawisk,  pozbawioną  możliwości  tłumaczenia  i prze- 
widywania. Byłaby  to  zatem  wiedza  zdecydowanie 
uboższa  — zarówno  w sensie  poznawczym,  jak  i prak- 
tycznym — od  wiedzy  naukowej,  która  również  opie- 
ra się  na  realnych  faktach,  ale  w celu  ich  zrozumienia, 
wyjaśnienia,  przewidywania  i praktycznego  wykorzy- 
stania posługuje  się  teoriami. 

Okazuje  się  zresztą,  że  nawet  samo  uporządkowa- 
nie i klasyfikacja  faktów  oparta  na  odpowiednich 


teoriach  jest  z reguły  znacznie  lepsza,  prostsza,  lepiej 
uzasadniona  i głębsza.  Koncepcje,  prawa  i zasady 
teoretyczne  tworzą  poza  tym  konieczny  dla  głębszego 
poznania  język  pojęć  i wytyczają  sposób  myślenia 
oraz  sposób  patrzenia  na  badane  zjawiska.  Koncepcje 
teoretyczne  sugerują  często,  co  należy  badać,  czym 
i jak.  Innymi  słowy,  teorie  bardzo  często  zarówno 
sugerują  kierunki  i obiekty  dalszych  badań  empirycz- 
nych, jak  też  wskazują  możliwe  narzędzia  i metody 
badawcze.  Warto  sobie  np.  uświadomić  ogromną 
stymulującą  rolę  hipotezy  atomowej  w XIX  w.,  kiedy  stymulująca 
to  przez  długi  czas  opierała  się  ona  jedynie  na  prostej  rola  hipotezy 
interpretacji  kilku  makroskopowych  praw  zaobser-  atomowej 
wowanych  głównie  w procesach  chemicznych.  Hipo- 
teza atomowa  dała  jednak  liczne  konkretne  wskazów- 
ki dotyczące  badań  doświadczalnych,  sugerując,  jak 
szukać  innych,  coraz  wszechstronniejszych  i coraz 
bardziej  bezpośrednich  eksperymentalnych  metod 
badania  atomów,  molekuł  i jonów. 

Teorie  naukowe  są  więc  podstawową  formą,  spo- 
sobem i narzędziem  poznania.  Niemożliwe  byłoby 
głębsze,  przyczynowe  poznanie  i szersze  praktyczne 
zastosowanie  zjawisk  przyrody,  gdybyśmy  się  ogra- 
niczyli wyłącznie  do  spisów  i opisów  obserwowanych 
faktów.  Naukowe  poznanie  i wykorzystanie  praw 
przyrody 'odbywa  się  za  pomocą  ustawicznie  dosko- 
nalonych i sprawdzanych  przyczynowych  teorii,  a me 
za  pomocą  najbardziej  nawet  skrupulatnych  katalo- 
gów faktów.  Niech  ktoś  spróbuje  skonstruować  dzia- 
łający samochód  bez  żadnej  teorii,  me  znając  w ogóle 
praw  fizyki,  mając  tylko  do  dyspozycji  dokładny  ka- 
talog wszystkich  części  samochodu! 

Zbudowanie  możliwie  dokładnej,  przyczynowej,  po- 
twierdzonej przez  realne  fakty  teorii  naukowej  jest 
więc  w pewnym  sensie  głównym  celem  i uwieńczeniem 
określonego  etapu  badań.  Z reguły  etap  taki  zawiera 
nie  tylko  jeden  cykl  badawczy,  lecz  całą  spiralę, 
a nawet  wiele  spiral  składających  się  z szeregu  cykli 
badawczych,  zbliżających  się  poprzez  różne  nieudane 
i częściowo  udane,  bezpłodne  i płodne  hipotezy  ro- 
bocze do  zadowalającej  teorii  badanego  zakresu 
zjawisk. 

Oczywiście  określenie  „zadowalająca  teoria'’  jest  teoria 
względne.  Teoria  oddająca  w zadowalający  sposób  zadowalająca 
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Rys.  2.  Hierarchiczna  struktura  współczesnych  teorii  fizycznych.  Zaznaczono  tylko  najważniejsze  teorie  fizyczne.  Na  szarym  tle  podano 
teorie  w zasadzie  zadowalające,  dobrze  sprawdzone,  na  niebieskim  — teorie  w budowie,  czyli  jeszcze  niezadowalające.  Relacje  impli- 
kacji przedstawione  są  strzałkami;  strzałki  czarne  oznaczają  implikacje  dobrze  sprawdzone,  niebieskie  — implikacje  spodziewane. 
Linie  poziome  oznaczają  związki  (często  obustronne)  między  teoriami  tego  samego  poziomu 
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pewien  zakres  zjawisk  może  się  stać  niezadowalająca, 
gdy  zwiększymy  wymagania  dokładności  lub  po- 
większymy zakres  faktów,  np.  przez  odkrycie  nowych 
zjawisk  nie  objętych  przez  dotychczasową  teorię. 
Trzeba  wtedy  szukać  nowej,  ogólniejszej  i dokład- 
niejszej teorii.  W fizyce  zdarzało  się  już  wielokrotnie, 
że  ta  nowa,  doskonalsza  teoria  nie  była  sprzeczna 
z poprzednimi  (starymi)  teoriami  i wcale  nie  obalała 
ich,  lecz  tworzyła  nowy,  ogólniejszy,  szerszy  i głęb- 
szy punkt  widzenia.  Stare  teorie  okazywały  się  przy- 
padkami szczególnymi  lub  granicznymi,  tj.  pewmymi 
przybliżeniami  nowej.  Teorie  fizyczne  są  dziś  ściśle 
powiązane  w bardzo  ciekawą  hierarchiczną  strukturę, 
która  przypomina  trochę  drzewo  genealogiczne. 
Wiele  gałązek  i konarów  tego  drzewa  już  znamy,  ale 
do  centralnego  pnia,  z którego  wszystko  wyrasta, 
jeszcześmy  się  nie  dostali  (rys.  2). 

Rys.  2 przedstawia  schemat  powiązań  między  dob- 
rze sprawdzonymi  teoriami  fizycznymi  i teoriami 
obecnie  tworzonymi. 


Przyczynowość  i determinizm 

Fizyka  interesuje  się  szczególnie  prawami,  które  mają 
charakter  związków  przyczynowych,  tzn.  określają 
pewną  sytuację  zwaną  skutkiem,  jeśli  tylko  spełnione 
są  warunki  zwane  przyczyną.  Rozumienie  charakteru 
związku  przyczynowego  nie  jest  w nauce  ani  w filo- 
zofii zupełnie  jasne  i jednoznaczne.  Niektórzy  uwa- 
związki  żają,  że  związek  przyczynowy  dotyczy  tylko  zmian 
orzyczynowe  w czasie,  a więc  zdarzeń  i procesów.  W tym  ujęciu 
przyczyna  p jest  zdarzeniem  (lub  procesem)  poprze- 
dzającym w czasie  inne  zdarzenie  s , zw.  skutkiem.  Przy 
tym  zawsze,  jeśli  w chwili  t zajdzie  p,  to  w późniejszej 
chwili  t'>t  zajdzie  również  s.  Liczne  równania  ruchu 
(np.  równania  Newtona,  Maxwella,  Schródingera, 
równania  przewodnictwa  cieplnego,  dyfuzji)  opisują 
takie  czasowe  związki  przyczynowe.  Podanie  stanu 
początkowego  układu  w chwili  t i wartości  wszystkich 
oddziaływań  (sił)  w przedziale  czasu  od  t do  t'>t 
określa  jednoznacznie  stan  układu  w dowolnej  chwili 
późniejszej  Skutek  można  uznać  w tym  przypadku 
za  zdarzenie  polegające  na  tym,  że  układ  znajduje  się 
w określonym  stanie  w chwili  Natomiast  za  przy- 
czynę trzeba  uznać  cały  zespół  warunków,  a mianowi- 
cie zdarzenie  polegające  na  wystąpieniu  określonego 
stanu  początkowego  w chwili  t oraz  zadziałanie  okreś- 
lonych sił  i praw  ruchu  w przedziale  od  / do  Stan 
końcowy  układu  jest  zdeterminowany  przez  stan  po- 
determinizm  czątkowy  i równania  ruchu  w przedziale  od  i do  t'. 

Tak  rozumiana  przyczyn owość  wiąże  się  więc  ściśle 
z determinizmem. 

Zamiast  pojęciami  przyczyny  i skutku  determi- 
nizm  operuje  pojęciami  stanu  początkowego  i końco- 
wego oraz  pojęciem  równań  ruchu.  Przy  tych  samych 
oddziaływaniach  stan  początkowy  wyznacza  jedno- 
znacznie stan  końcowy.  Natomiast  przy  różnych 
oddziaływaniach  różne  stany  początkowe  mogą 
prowadzić  do  tego  samego  stanu  końcowego  i na 
odwrót  — z tego  samego  stanu  początkowego  może- 
my otrzymać  różne  stany  końcowe, 
zdarzenia  Głębsze  podejście  do  zagadnienia  przyczynowości 
elementarne  oparte  jest  na  dokładniejszej  analizie  oddziaływań 
między  parami  zdarzeń  elementarnych  <p(A)  i <p(A') 
zachodzących  w punktach  A = (/,  xy  y,  z)  i A'  — 
= (t\  x',  y , z')  czasoprzestrzeni.  (Zdarzeniem  ele- 
mentarnym może  być  np.  określona  wartość  jakie- 
goś pola  (ĄA)  w punkcie  A.  Mając  teorię  opisującą 
rozchodzenie  się  pola  9?,  możemy  powiedzieć,  czy 
i jak  wartość  pola  <p(A)  w punkcie  A wpływa  na  war- 
tość pola  <p(A')  w punkcie  A'.)  Stawiamy  pytanie  jaki 
jest  zbiór  zdarzeń  elementarnych  (p(A)>  które  stanowią 
łącznie  przyczynę  zdarzenia  <p(A'). 

Dokładna  odpowiedź  zależy  od  rodzaju  interesu- 
jących nas  zdarzeń  elementarnych  <p(A).  Najistotniej- 
sze ogólne  ograniczenia  daje  teoria  względności,  która 
podaje  następujące  warunki  konieczne  istnienia  przy- 
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czynowego  związku  między  zdarzeniami  zachodzą- 
cymi w A i zdarzeniem  zachodzącym  w A': 

c8(t'-/)*>(r'-r)2. 

Jeśli  któryś  z tych  warunków  nie  jest  spełniony,  zda- 
rzenia zachodzące  w A nie  mogą  mieć  wpływu  na 
zdarzenia  zachodzące  w A'.  Mówimy  wtedy,  że  punk- 
ty A i A'  są  przyczynowo  nie  powiązane.  Znaczenie  zdarzenia 
pierwszej  nierówności  jest  oczywiste.  Natomiast  dru-  przyczynowo 
ga  nierówność  oznacza,  że  prędkość  rozchodzenia  się  nie  powiąza- 
wszelkich  realnych  oddziaływań  fizycznych  nie  może  ne 
być  większa  od  prędkości  światła  c w próżni.  W wy- 
padku oddziaływań  elektromagnetycznych  prędkość 
ta  wynosi  dokładnie  c,  dla  innych  oddziaływań  — 
może  być  mniejsza  lub  równa  c. 

W nieco  luźniejszym  sformułowaniu  związek  przy- 
czynowy łączy  się  zawsze  z jakimś  pytaniem  typu: 
dlaczego?  W zależności  od  rodzaju  dopuszczalnych  dlaczego...? 
pytań  otrzymamy  różne  „rodzaje”  przyczyn.  W od- 
niesieniu do  ruchu  punktu  materialnego  możemy  np. 
zadać  pytanie:  Dlaczego  pęd  cząstki  zmienia  się 
w taki,  a nie  inny  sposób?  Gdy  znamy  równania  dy- 
namiki Newtona,  odpowiedź  na  takie  pytanie  jest 
łatwa:  Pęd  zmienia  się  w określony  sposób,  ponie- 
waż na  cząstkę  działa  odpowiednia  siła.  Gdyby  na 
cząstkę  nie  działały  żadne  siły,  pęd  jej  nie  zmieniałby 
się  w ogóle.  Bezpośrednią  przyczyną  sprawczą  zmia- 
ny pędu  jest  więc  siła.  Jeśli  jednak  nieco  inaczej  za- 
pytamy: Dlaczego  przyspieszenie  wynosi  w chwili  t 
tyle  a tyle?  — to  odpowiedź  będzie  inna.  A miano- 
wicie o wartości  przyspieszenia  w danej  chwili  de- 
cyduje nie  tylko  siła,  lecz  także  masa  cząstki  i chwi- 
lowa wartość  jej  prędkości.  Za  przyczynę  określonej 
zmiany  prędkości  (czyli  określonej  wartości  przyspie- 
szenia) wypada  więc  uznać  nie  tylko  siłę,  lecz  także 
masę  i prędkość  w interesującej  nas  chwili. 

Widać  z tego  przykładu,  że  określenie  przyczyny 
i skutku  zależy  od  sposobu  stawiania  pytań.  Pytania 
typu  „dlaczego”  mogą  w ogóle  nie  dotyczyć  zmian 
zachodzących  w czasie  ani  żadnych  zmian.  Możemy 
np.  zadać  pytanie : Dlaczego  jądro  helu  ma  podwójny 
ładunek  dodatni  i spin  równy  zeru?  Odpowiedź  bę- 
dzie brzmiała:  Ponieważ  składa  się  ono  z dwóch  do- 
datnio naładowanych  protonów  i dwóch  neutronów, 
przy  tym  wszystkie  one  są  w stanie  podstawowym 
z momentem  orbitalnym  równym  zeru,  a spiny  obu 
protonów  i obu  neutronów  muszą  być  wtedy  — 
zgodnie  z zakazem  Pauliego — skierowane  przeciw- 
nie. Podane  przyczyny  mają  teraz  charakter  nie  dy- 
namiczny, lecz  czysto  strukturalny.  Pytanie  nie  do-  Modei  jądra 
tyczy  zmian  w czasie,  więc  nie  było  potrzeby  odwo-  helu 
ływania  się  do  sił  jądrowych  i równań  ruchu.  Wy- 
starczyło podanie  prostych  informacji  o strukturze 
jądra  i prostego  prawa  w postaci  zakazu  Pauliego. 

Fizycy  są  skłonni  traktować  determinizm  i przy- 
czynowość  raczej  szeroko,  stosując  te  pojęcia  do  sy- 
tuacji, w których  własności  obiektów  wynikają  te- 
oretycznie z ich  struktury  lub  odpowiednich  dyna-  przyczyno- 
micznych  praw.  Związek  przyczynowy  w tym  szer-  wość  jako 
szym  ujęciu  przypomina  więc  logiczną  relację  wyni-  relacja 
kania  p-+sy  a więc:  jeśli  zachodzi  p , to  musi  także  wynikania 
zachodzić  5.  Szczególnie  poglądowe  i ciekawe  jest 
wynikanie  z odpowiednich  teorii  własności  obiektów 
złożonych  z własności  ich  części  składowych. 

Bardzo  wygodny  i poglądowy  jest  podział  obiektów 
fizycznych  według  stopnia  złożoności,  co  odpowiada 
z grubsza  ich  wzrastającym  rozmiarom.  Mamy  więc 
poziom : cząstek  elementarnych,  jąder,  atomów,  mo- 
lekuł i jonów,  zwykłych  ciał  makroskopowych.  Ziemi 
i planet,  gwiazd,  galaktyk  i Wszechświata.  Do  chemii 
należy  poziom  atomów  i drobin;  fizyka  klasyczna 
zajmuje  się  głównie  ciałami  makroskopowymi  o nie- 
zbyt wielkich  rozmiarach;  geologia  i geofizyka  zaj- 
mują się  Ziemią,  jej  składem  i budową;  astronomia 
zajmuje  się  ostatnimi  czterema  poziomami;  biologia 
sięga  od  poziomu  cząsteczek  do  poziomu  ciał  makro- 
skopowych. 

Zasada,  że  prawa  i własności  obiektów  należących 


do  wyższego  poziomu  wynikają  z odpowiednich  praw 
i własności  ich  części  składowych  należących  do 
niższego  poziomu,  jest  w fizyce  w wielu  wypadkach 
bardzo  dobrze  i dokładnie  potwierdzona;  niekiedy 
dokładność  pozostawia  jeszcze  wiele  do  życzenia. 
Na  przykład  wynikanie  własności  jąder  z własności 
nukleonów'  i innych  cząstek  elementarnych  nie  budzi 
wątpliwości,  ale  wobec  braku  zadowalającej  ogólnej 
teorii  cząstek  elementarnych  przewidywania  są  jesz- 
cze mało  dokładne.  Natomiast  bardzo  dokładnie  po- 
trafimy wytłumaczyć  i obliczyć  wszystkie  fizyczne 
i chemiczne  własności  atomów,  ponieważ  mechanika 
kwantowa  jest  bardzo  dobrą  teorią  atomu.  Okazuje 
się,  że  skomplikowane  własności  atomów  są  ściśle 
określone  przez  stosunkowo  proste,  czysto  elektro- 
magnetyczne i mechaniczne  własności  jąder  i otacza- 
jących je  elektronów  (jak  masy  i ładunki  elektryczne 
oraz  momenty  magnetyczne  jądra  i elektronu).  Oczy- 
wiście wynikanie  to  możemy  wykazać  jedynie  za  po- 
mocą teorii  fizycznych  — w tym  wypadku  za  pomocą 
mechaniki  kwantowej. 

Z kolei  struktura  geometryczna  i inne  fizyczne 
i chemiczne  własności  molekuł  wynikają  z budowy  ze- 
wnętrznych powłok  elektronowych  atomów  wcho- 
dzących w skład  tych  molekuł.  Dalej  — fizyka  sta- 
tystyczna, teoria  ciała  stałego  i inne  teorie  ukazują, 
jak  własności  ciał  makroskopowych  (gazów,  cieczy, 
ciał  stałych)  wynikają  z ich  struktury  atomowej,  mo- 
lekularnej lub  jonowej.  Od  czasów  Newtona  wiemy, 
że  ruchy  planet,  komet  i gwiazd  wynikają  z tych  sa- 
mych praw  mechaniki,  które  obowiązują  makrosko- 
powe ciała  na  Ziemi.  Wiele  własności  Słońca  i innych 
gwiazd  jest  wynikiem  występujących  w nich  reakcji 
między  jądrami  i cząstkami  elementarnymi.  Wyjaśnio- 
no m.in.,  że  źródłem  ogromnej  energii  promieniowa- 
nia wysyłanego  przez  Słońce  i inne  gwiazdy  są  reakcje 
jądrowe. 

Liczne  i różnorodne  relacje  wynikania,  które  już 
znamy,  dają  bardzo  głębokie  i ciekawe  powiązania 
między  różnymi  gałęziami  właściwej  fizyki  a innymi 
naukami  przyrodniczymi.  Związki  te  sprawiają,  że 
mimo  powstawania  nowych  specjalności  naukowych, 
jedność  mimo  odkrywania  nowych  zjawisk,  z teoretycznego 
nauk  punktu  widzenia  nauki  przyrodnicze  tworzą  coraz 
przyrodni-  bardziej  jednolitą  całość.  Ten  niezwykle  ważny  i fra- 
czych  pujący  proces  jednoczenia  wszystkich  nauk  przyrod- 
niczych na  bazie  fizyki  nie  został  zakończony.  Spo- 
dziewamy się  odkrycia  jeszcze  wielu  zupełnie  nowych, 
fundamentalnych  związków  po  powstaniu  zadowa- 
lającej teorii  cząstek  elementarnych.  Również  orga- 
nizmy żywe  nadal  kryją  wiele  tajemnic.  Nie  ma  jednak 
powodów  do  niecierpliwości.  Trzeba  bowiem  pamię- 
tać, że  fizyka  cząstek  elementarnych  powstała  dopiero 
ok.  30  lat  temu  i że  ciągle  odkrywamy  w tej  dziedzinie 
nowe  zjawiska  i nowe  prawa.  Niemal  równie  młoda 
jest  biologia  molekularna,  badająca  fizykochemiczne 
podstawy  życia. 


Matematyka  jako  język  fizyki 

Matematyka  jest  nauką  czysto  racjonalną,  która  nie 
zajmuje  się  odkrywaniem  i badaniem  empirycznych 
faktów,  lecz  tworzeniem  i doskonaleniem  specjalnych 
języków  formalnych.  Języki  te  są  potrzebne  do  ścisłe- 
go, jasnego  i komunikatywnego  przedstawienia  ab- 
strakcyjnych pojęć  i relacji,  których  opisanie  i zba- 
danie za  pomocą  języka  potocznego  byłoby  zbyt 
kłopotliwe,  niedokładne,  niejasne,  czy  wręcz  nie- 
możliwe. 

Dla  uniknięcia  ewentualnych  nieporozumień  na- 
leży podkreślić,  że  twórcza  praca  matematyków  nie 
ma  nic  wspólnego  z propozycjami  sztucznych  języ- 
ków w rodzaju  esperanto.  W tym  ostatnim  wypadku 
chodzi  tylko  o wierne  tłumaczenie  zdań  występują- 
cych w językach  naturalnych  (narodowych)  na  nowy 
język,  który  dzięki  swej  prostocie  miałby  szanse  sta- 
nia się  językiem  światowym.  W twórczych  badaniach 


matematyków  nie  chodzi  o tłumaczenie  znanych  już 
zdań  i relacji  na  nowy  ystem  słów  czy  innych  zna- 
ków, lecz  o poszukiwanie  i badanie  nowych,  niezna- 
nych uprzednio  relacji,  do  których  opisu  trzeba  two- 
rzyć specjalne  języki  symboli  (znaków)  i reguł  po- 
stępowania. 

Teorie  matematyczne  nie  muszą  się  odnosić  do  re- 
alnej rzeczywistości  ani  wynikać  z badania  realnych 
faktów;  nie  podlegają  więc  empirycznej  weryfikacji, 
lecz  jedynie  sprawdzeniu  logicznej  poprawności. 

W tej  sytuacji  jest  oczywiste,  że  nie  wszystkie  możli- 
we, logicznie  dopuszczalne  teorie  matematyczne  i re- 
lacje nadają  się  do  opisu  rzeczywistości.  W fizyce  np. 
zwykle  spośród  wielu  matematycznie  dopuszczalnych 
rozwiązań  równań  opisujących  dane  zjawisko  trzeba 
wybrać  te,  które  spełniają  jeszcze  pewne  dodatkowe 
warunki  czysto  fizyczne.  Rozwiązania  równań  nie 
spełniające  tych  warunków  odrzuca  się  jako  nieprzy- 
datne dla  fizyka.  Tak  więc  dopiero  nauki  empiryczne 
oraz  praktyka  (technika)  stwierdzają,  które  z utwo- 
rzonych przez  matematykę  języków,  relacji,  twierdzeń, 
zdań  i pojęć  znajdują  zastosowanie  do  opisu  rzeczy- 
wistości. 

Ze  względu  na  abstrahowanie  od  realnych  faktów 
symboliczny  język  matematyki  jest  prawdziwie  uni- 
wersalny, tzn.  nadaje  się  do  opisu  bardzo  wielu 
formalnie  identycznych  relacji  między  jakościowo  1 frf 

zupełnie  odmiennymi  zjawiskami.  Identyczne  pod 
względem  formalnym  (tj.  czysto  matematycznym)  Równanie 
równania  falowe  mogą  opisywać  tak  różne  zjawiska  falowe 
jak  rozchodzenie  się  głosu,  światła  lub  fal  radiowych. 

Odmienna  treść  fizyczna  wynika  dopiero  z wyboru 
rozwiązań  oraz  interpretacji  wielkości  spełniających 
te  równania  i odpowiednie  dodatkowe  warunki 
fizyczne. 

Jako  uniwersalny,  a przy  tym  bardzo  bopty  i ścisły 
język,  matematyka  ma  ogromne  znaczenie  dla  całej 
nauki.  Proces  matematyzacji  nauki  zaczął  się  histo- 
rycznie od  astronomii  i fizyki,  gdzie  ilościowy  opis 
zjawisk  przyrody  i związane  z tym  szerokie  stosowa- 
nie matematyki  są  najbardziej  naturalne.  Sformuło- 
wanie większości  praw  i wszystkich  teorii  fizycznych 
byłoby  wręcz  niemożliwe  bez  wszechstronnej  pomocy 
matematyki.  Potrzeby  fizyki  wielokrotnie  inspirowały 
powstanie  nowych  działów  matematyki.  Tak  było 
w czasach  nowożytnych  z geometrią  analityczną, 
teorią  równań  różniczkowych  i całkowych,  rachun- 
kiem wariacyjnym  czy  teorią  dystrybucji,  które 
powstały  niejako  na  zamówienie  fizyki  i przy  współ- 
udziale fizyków. 


Modele  mechaniczne  i matematyczne 

Hipotezy  robocze,  a także  dobrze  sprawdzone  teorie 
fizyczne  opierały  się  dawniej  na  poglądowych  mo- 
delach geometryczno-mechamcznych.  Modelem  mo- 
lekuły np.  był  układ  odpowiednio  przestrzennie  roz- 
mieszczonych punktów  masowych  odpowiadających 
atomom.  Odległości  między  atomami  miały  być  stałe, 
tak  że  pod  wieloma  względami  molekuła  zachowy- 
wała się  jak  bryła  sztywna,  mogąca  wykonywać 
tylko  ruchy  postępowe  i obrotowe  dokoła  środka 
masy.  Modelem  gazu  był  w teorii  kinetycznej  układ 
bardzo  wielu  sztywnych  kulek  o określonych  promie- 
niach i masach,  poruszających  się  bezładnie  (ruchem 
termicznym),  mogących  się  zderzać  oraz  oddziaływać 
na  odległość  siłami  van  der  Waalsa. 

Stosowanie  takich  mechanicznych  modeli  było  wy- 
nikiem podstawowej  dla  całej  fizyki  roli  pojęć  i praw 
mechaniki,  co  jest  z pewnością  także  związane  z fak- 
tem, że  używane  w fizyce  detektory  i przyrządy  po- 
miarowe dokonują  z reguły  konwersji  badanych  zja- 
wisk na  zjawiska  mechaniczno-wizualne,  które  potra- 
fimy bezpośrednio  obserwować  i mierzyć.  Można 
wyróżnić  kilka  podstawowych  elementów,  z których 
złożone  są  modele  mechaniczne.  Są  to:  punkty  ma- 
sowe (korpuskuła,  cząstka),  bryły  sztywne,  ciągłe 


Model  gazu 
wg  teorii 
kinetycznej' 


modele 

mechaniczne 
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ośrodki  materialne  i pola  (np.  pola  sił  działających  na 
cząstkę  lub  pola  różnych  innych  wielkości  fizycznych, 
fale).  Z elementów  tych  można  złożyć  bardzo  wiele 
klasycznych,  mechanicznych  modeli.  Teoria  oparta 
na  takim  mechanicznym  modelu  jest  zwykle  dość 
poglądowa,  a wiele  własności  można  wydedukować, 
zrozumieć  i opisać  prawie  bez  użycia  matematyki. 
Dopiero  gdy  pytamy  o konkretne  wartości  wielkości 
fizycznych  lub  bardziej  złożone  prawa,  musimy  sko- 
rzystać z pomocy  matematyki.  Koncepcji  podstawo- 
wych dostarcza  więc  w takich  modelach  mechanika, 
a matematyka  odgrywa  tylko  rolę  pomocniczą; 
służy  mianowicie  do  ścisłego  sformułowania  modelu 
mechanicznego  i dokonywania  obliczeń. 

W XX  w.  odkryto  zjawiska  kwantowe,  powstały 
teorie  kwantowe,  w których  związek  stosowanych 
symboli  matematycznych  (np.  operatorów,  wekto- 
rów stanu,  pół  kwantowych)  z pomiarem  jest  po- 
średni i bardzo  złożony.  Okazało  się  m.in.,  że  elek- 
tron nie  jest  ani  czystą  korpuskułą,  ani  falą,  lecz 
w-  pewnych  sytuacjach  przejawia  własności  korpu- 
skularne,  w innych  — pozornie  sprzeczne  z tamtymi  — 
własności  falowe.  Korpuskularno-falowy,  dualny  cha- 
charakter  elektronu,  protonu  i innych  „cząstek” 
nie  da  się  wytłumaczyć  za  pomocą  żadnego  klasycz- 
nego modelu  mechanicznego.  Jeszcze  gorzej  przed- 
stawia się  sytuacja  w zjawiskach,  w których  obser- 
wujemy kreację  i anihilację  elektronów  i innych  czą- 
stek kwantowych. 

Modele  mechaniczne  okazały  się  więc  w XX  w. 
nieprzydatne  do  opisu  przynajmniej  niektórych  zja- 
modele  wisk.  Zmusiło  to  fizyków  do  coraz  częstszego  stoso- 
matematycz-  wania  tzw\  modeli  matematycznych.  Model  matema- 
ne  tyczny  to  układ  równań  wraz  z określeniem  fizycznego 
charakteru  występujących  w nim  symboli  i ich  związ- 
ku z pomiarami.  Sprawa  interpretacji  tych  równań 
za  pomocą  odpowiednich  mechanicznych  wyobrażeń 
staje  się  sprawą  drugorzędną.  Najważniejszą  sprawą 
jest,  by  założone  równania  modelu  matematycznego 
dawały  wyniki  ilościowo  zgodne  z doświadczeniem. 
Model  jest  tym  lepszy,  im  większy  jest  zakres  jego 
stosowalności  i dokładności  oraz  im  więcej  jego  prze- 
widywań potwierdziło  doświadczenie.  We  współcze- 
snej fizyce  stosuje  się  — z jednej  strony  (w  charakte- 
rze hipotez  roboczych)  — modele  matematyczne 
o bardzo  wąskim  zakresie  i małej  dokładności, 
z drugiej  — modele  bardzo  dokładnie  oddające 
rzeczywistość  w szerokim  zakresie  zjawisk.  W tym 
ostatnim  przypadku  mówimy  raczej  o teorii,  a nie  o 
modelu,  gdyż  tę  nazwę  rezerwuje  się  zwykle  dla  moc- 
no przybliżonych,  fragmentarycznych,  próbnych  sche- 
matów’ teoretycznych,  głównie  takich,  które  dotyczą 
jakiegoś  szczególnego,  konkretnego  obiektu  lub 
zjawiska. 

Modele  matematyczne  są  zazwyczaj  znacznie  mniej 
poglądowe  od  mechanicznych.  Poglądowość  nie  jest 
jednak  najważniejszą  zaletą  teorii.  Nie  możemy  żądać 
od  wszystkich  praw  natury,  by  były  poglądowe  w sen- 
sie mechanicznym.  Zresztą  uznanie  teorii  za  poglą- 
dową zależy  trochę  od  przyzwyczajenia,  rozwoju 
nauki,  przyswojenia  odpowiednich  pojęć  itp.  W każ- 
dym razie  rozwój  fizyki  zmusił  badaczy  do  zarzuce- 
nia w pewnych  sytuacjach  klasycznych  modeli 
mechanicznych,  ponieważ  okazały  się  one  sprzeczne 
z rzeczywistością. 


Zarys  rozwoju  fizyki 


Od  niepamiętnych,  prehistorycznych  czasów  człowiek 
obserwował  zjawiska  przyrody,  powodowany  zarówno 
naturalną  ciekawością,  jak  i chęcią  praktycznego 
wykorzystania  zauważonych  regularności.  Od  bier- 
nej, przypadkowej  obserwacji  do  celowego,  czynnego, 
racjonalno-empirycznego  działania  naukowego  droga 
jest  jednak  bardzo  daleka.  Nie  da  się  ustalić  okre- 


ślonej daty,  czy  nawet  stulecia,  które  można  by  uznać 
za  początek  fizyki,  ponieważ  działalność  badawcza 
człowieka  nabierała  bardzo  powoli  cech  zwanych 
dziś  naukowymi.  Niewątpliwie  można  jednak  wy- 
różnić w historii  pewne  przełomowe  okresy,  w których 
zaszły  istotne  i raczej  trwałe  zmiany  warunkujące 
postęp  nauki. 

Przełomowym  dla  fizyki  i wielu  innych  nauk  był 
z pewnością  okres  między  VI  a III  w.  p.n.e.,  kiedy  to 
w starożytnej  Grecji  powstała  filozofia  rozumiana 
jako  niezależne  od  religii  i magii,  racjonalne  poszu- 
kiwanie prawdy  o przyrodzie  i o człowieku.  Nie- 
zmiernie ciekawa  jest  historia  myśli  greckiej  tego  okre- 
su, która  od  stosunkowo  prymitywnych  rozważań 
Talesa  nad  prapoczątkiem  świata  przechodziła  do 
coraz  bardziej  dociekliwych  pytań  i coraz  wnikliw- 
szych i wszechstronniejszych  odpowiedzi.  W okresie 
tym  powstały  liczne  racjonalne  modele,  mające 
wyjaśnić  różne  zjawiska  przyrody.  Choć  często  pro- 
pozycje greckich  filozofów  wydają  się  dziś  bardzo 
naiwne,  to  jednak  są  i takie,  które  zadziwiają  swoją 
trafnością.  Zdecydowanie  wyróżnia  się  wśród  nich 
atomowy  model  materii,  zapoczątkowany  przez 
Leukippa,  a rozwinięty  przez  Demokryta  w IV  w. 
p.n.e.  Model  ten  jest  stosunkowo  bliski  atomistycz- 
nym  ideom  współczesnej  fizyki. 

Wszystkie  modele  przyrody  filozofów  greckich 
opierały  się  jednak  na  powierzchownych,  jakościo- 
wych obserwacjach  i spekulatywnych,  nie  sprawdzo- 
nych przesłankach.  Były  to  więc  modele  czysto  racjo- 
nalne i jakościowe,  nastawione  na  wyjaśnienie,  a nie 
na  ilościowe  przewidywanie.  Brak  odpowiednich 
kryteriów  doświadczalnych  nie  pozwalał  odróżnić 
propozycji  trafnych  od  nietrafnych,  płodnych  od 
bezpłodnych.  Wprawdzie  występowali  w bogatej 
kulturze  greckiej  również  zwolennicy  empiryzmu, 
był  to  jednak  empiryzm  raczej  czysto  obserwacyjny, 
bierny  i jakościowy,  który  też  nie  zdołał  się  prze- 
kształcić w ścisłą  racjonalno-empiryczną  naukę. 

Wydaje  się,  że  filozofowie  greccy  byli  zbyt  nie- 
cierpliwi i ambitni,  że  chcieli  od  razu  znaleźć  uniwer- 
salne i fundamentalne  prawa  przyrody,  struktury 
i przyczyny;  nie  zdawali  sobie  sprawy,  że  trzeba 
przedtem  lepiej  i dokładniej  poznać  zjawiska  przy- 
rody. Najpierw  trzeba  wiedzieć,  „co  i jak”,  a potem 
można  próbować  głębszych  odpowiedzi  na  pytanie 
typu  „dlaczego”. 

Wielką  zasługą  i trwałą  zdobyczą  filozofii  greckiej 
było  jednak  samo  postawienie  problemu  racjonalnej 
teorii  przyrody,  która  by  tłumaczyła  nawet  bardzo 
złożone  zjawiska  za  pomocą  niewielkiej  liczby  sto- 
sunkowo prostych  elementów  składowych  i praw. 
W filozofii  i nauce  greckiej  można  znaleźć  także  pod- 
stawowe idee  dotyczące  jedności  materii  oraz  istnie- 
nia uniwersalnych  praw  przyrody.  Znajdziemy  tam 
także  niemal  wszystkie  elementy  dzisiejszej  metody 
naukowej,  jak  indukcja  i dedukcja,  analiza  i kon- 
strukcja pojęć,  hipoteza,  przyczyn  o wość,  racjonalizm, 
empiryzm,  pomiar,  eksperyment,  obserwacja,  ma- 
tematyczny zapis.  Jednak  znajdziemy  tam  również 
wiele  koncepcji  i tendencji  niepotrzebnych  lub  wręcz 
błędnych. 

Dysponując  w zasadzie  wszystkimi  potrzebnymi 
elementami  składowymi  procesu  badawczego,  filo- 
zofowie i uczeni  greccy  nie  doszli  do  odpowiedniej  ich 
syntezy,  która  jest  potrzebna  do  skutecznego  funkcjo- 
nowania metody  naukowej.  Nie  opracowali  w do- 
statecznym stopniu  koniecznych  dla  rozwoju  fizyki 
technik  eksperymentalnych,  nie  zwrócili  należytej 
uwagi  na  rolę  pomiaru  i eksperymentu,  na  ścisły, 
matematyczny  opis  zjawisk  ani  ilościową  zgodność 
teorii  z doświadczeniem.  Toteż  nie  udało  im  się 
uruchomić  tak  istotnego  sprzężenia  zwrotnego  między 
teoretyczną  hipotezą  a faktami  doświadczalnymi, 
które  jest  podstawą  samodoskonalącego  mechanizmu 
empirycznej  kontroli,  sprawdzania  i korygowania 
wysuwanych  hipotez. 

I tak  np.  idealista  Platon  wysoko  cenił  matematykę. 
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ale  lekceważył  zmysłowe  poznanie,  a empiryk  Ary- 
stoteles doceniał  wprawdzie  wagę  zmysłowego  poz- 
nania i logicznego  rozumowania,  ale  posługiwał  się 
głównie  metodami  jakościowymi  i nie  doceniał  ści- 
słego matematycznego  opisu  zjawisk.  Żaden  z nich 
nie  zdawał  sobie  sprawy  z roli  pomiaru  i eksperymen- 
tu. 

W nauce  i filozofii  starożytności,  a także  później, 
aż  do  końca  średniowiecza,  brakowało  więc  pod- 
stawowych uzgodnień,  co  się  objawiło  w skrajnie 
przeciwnych  postawach  filozofów  (uczonych)  w spra- 
wach zasadniczych  dla  rozwoju  metody  naukowej 
i samych  badań.  Jeszcze  dziwniejsze  jest  dziś  dla  nas 
pomieszanie  w działalności  tych  samych  ludzi  ele- 
mentów racjonalnych  z irracjonalnymi,  materializmu 
z idealizmem,  wyrafinowania  logicznego  z naiwnością 
i prymitywizmem  przesłanek,  grubego  zmysłowego 
empiryzmu  z metafizyczną,  oderwaną  od  rzeczywi- 
stości spekulacją. 

Z fizyków  starożytności  niewątpliwie  największym 
i najbliższym  nam  ideowo  był  Archimedes.  Jego 
wielkość  polegała  nie  tylko  na  odkryciu  kilku  pod- 
stawowych praw  mechaniki,  lecz  także  na  umiejęt- 
ności łączenia  teorii  z praktyką  i matematyki  z ekspe- 
rymentem. Wydaje  się,  że  Archimedes  trafił  już  na 
trop  właściwej,  skutecznej  metody  naukowej,  ale  nie 
zdążył  jej  należycie  opracować  i rozpowszechnić. 
Nie  znalazł  też  godnych  następców  i po  jego  śmierci 
rozwój  fizyki  właściwie  zatrzymał  się  na  kilkanaście 
stuleci. 

Jedynym  działem  fizyki,  w którym  starożytność 
przekazała  wiekom  późniejszym  wiele  cennych,  kon- 
kretnych wiadomości,  była  statyka.  Natomiast  w za- 
gadnieniach ruchu  i dynamiki  panowały  przez  nie- 
mal 2000  lat  zupełnie  błędne  koncepcje  Arystotelesa. 
To  samo  można  powiedzieć  o błędnym  fizycznym 
modelu  świata  Eudoksosa-Arystotelesa,  który  był 
sprzeczny  z zasadami  jedności  materii,  powszech- 
ności praw  fizyki  i przyczy nowości,  a ponadto  miał 
raczej  jakościowy  i zamknięty  charakter.  Ogromny 
autorytet  Arystotelesa  jako  filozofa  i twórcy  wielu 
nauk  sprawił  niestety,  iż  fizyczna  astronomia  zatrzy- 
mała się  w rozwoju. 

Dopiero  w okresie  późnego  średniowiecza  i potem 
w okresie  odrodzenia  coraz  więcej  ludzi  zaczęło 
sobie  zdawać  sprawę  ze  słabości  ówczesnej,  czysto 
racjonalnej,  spekulatywnej  nauki.  Niektórzy,  np. 
Roger  Bacon  oraz  — dużo  później  — Francis  Bacon, 
napisali  nawet  specjalne  filozoficzne  traktaty,  za- 
wierające propozycje  nowej  empirycznej  metody 
naukowej  i wizje  nowego  społeczeństwa  zorganizo- 
wanego na  naukowych  podstawach.  Sami  jednak  nie 
zastosowali  proponowanych  metod  do  systematycz- 
nych badań  naukowych,  nie  zdołali  więc  porwać 
współczesnych  wielkimi  odkryciami  lub  teoriami  nau- 
kowymi. Inni,  jak  np.  Leonardo  da  Vinci,  dokonali 
wielu  szczegółowych,  ale  niesystematycznych  odkryć 
i wynalazków,  które  również  nie  zostały  podjęte, 
kontynuowane  i rozpowszechnione.  Ani  jedni,  ani 
drudzy  nie  odegrali  więc  większej  roli  w powstaniu 
nowożytnego  przyrodoznawstwa.  Decydujące  dla 
jego  powstania  i rozwoju  okazały  się  dopiero  fascy- 
nujące przykłady  skuteczności  nowego  stylu  myślenia 
w postaci  wielkiej  i stymulującej  teorii  lub  w postaci 
dłuższej  i systematycznej  serii  ważnych  i ciekawych 
odkryć  doświadczalnych.  Tak  więc  nie  R.  Bacon  ani 
F.  Bacon  i nie  Leonardo  da  Vinci,  lecz  Kopernik, 
Galileusz  i Newton  są  ojcami  nowożytnej  fizyki 
i całego  przyrodoznawstwa. 

Największy  przełom  w historii  nauk  fizycznych 
dokonywał  się  w XVI  i XVII  w.  dzięki  rozwinięciu 
w tym  okresie  skutecznej  i niemal  całkowicie  dojrzałej 
metody  naukowej.  Proces  rozwijania  nowej,  racjo- 
nalno-empirycznej  metody  badawczej  rozpoczął  Mi- 
kołaj Kopernik.  Jego  dzieło  okazało  się  wielką,  nie- 
zwykle ważną  i płodną  syntezą  renesansowego  empi- 
ryzmu ze  średniowieczną  metafizyką.  Od  humanistów 
odrodzenia  przejął  Kopernik  antydogmatyczną  i em- 


piryczną, dociekliwą  i poszukującą,  krytyczną  posta- 
wę, która  była  wolna  od  wszelkiego  mistycyzmu 
i walczyła  otwarcie  z więzami  tradycji,  wątpliwymi 
dogmatami  i autorytetami.  Od  swoich  filozofujących 
poprzedników  przejął  racjonalny  i ścisły,  a przy  tym 
śmiały  teoretyczny  sposób  myślenia,  umożliwiający 
głębsze  poznanie  i zrozumienie  świata  zamiast 
poprzestawania  na  jakościowym,  czysto  zmysłowym 
poznaniu  i powierzchownym  opisie  obserwowanych 
zjawisk.  Kopemikańska  płodna  synteza  tych  uprzed- 
nio rozdzielonych  i przeciwstawnych  lub  źle  wymie- 
szanych nurtów,  postaw  i sposobów  myślenia  sta- 
nowiła narodziny  nowożytnego  przyrodoznawstwa. 

Znajdujemy  więc  w dziele  Kopernika  niemal  wszy- 
stkie podstawowe  zasady  dzisiejszej  metody  naukowej, 
bez  tak  częstych  u jego  poprźedników  domieszek 
religijnych,  magicznych,  mistycznych  itp.  Kopernik 
wierzył  w sposób  oczywisty  w realność  świata  i jego 
poznawalność  za  pomocą  zmysłowych  obserwacji 
i rozumowania.  Jego  metoda  jest  ścisła,  oparta  na 
pomiarach  i matematyce.  W przytaczanych  argumen- 
tach fizycznych  na  rzecz  układu  heliocentrycznego 
korzystał  w sposób  widoczny  z założenia  jednolitości 
materii  i powszechności  praw  fizyki.  Unikał  wszel- 
kich irracjonalnych  i idealistycznych  interpretacji 
obserwowanych  zjawisk. 

Kopernik  był  przekonany  o wyższości  swojej 
metody  naukowej  i krytykował  dowolność  i aprio- 
ryczność,  jakościowy  charakter  i brak  uzasadnienia 
założeń  u wielu  swych  poprzedników.  Był  przekona- 
ny, że  dobra  teoria  powinna  być  nie  tylko  ilościowo 
zgodna  z doświadczeniem,  ale  powinna  być  również 
zgodna  z „naturą  rzeczy”.  Choć  nie  jest  całkowicie 
jasne,  jak  rozumiał  to  wymaganie,  to  z jego  własnych 
rozważań  można  sądzić,  że  dobra  teoria  powinna 
uwypuklać  proste  symetrie  i prawa  oraz  powinna  mieć 
jakieś  głębsze,  np.  dynamiczne  znaczenie.  W sposób 
widoczny  Kopernik  szukał  fizycznego  uzasadnienia 
swojej  heliocentrycznej  teorii  i zaproponował  sam 
ciekawą  wielograwitacyjną  hipotezę,  która  była 
pierwszym  krokiem  w kierunku  prawa  powszechnego 
ciążenia. 

Zasługi  Kopernika  dla  rozwoju  fizyki  polegają 
jednak  nie  tyle  na  wadze  jego  własnych  odkryć  i hi- 
potez, co  na  wadze  problemów  fizycznych,  jakie 
dzieło  jego  otworzyło  dla  następnych  pokoleń  astro- 
nomów i fizyków.  W przeciwieństwie  do  zamkniętych 
od  strony  fizycznej  systemów  Eudoksosa-Arystote- 
lesa oraz  Ptolemeusza  teoria  Kopernika  stanowiła 
system  otwarty.  Stała  się  więc  przebogatym  źródłem 
fundamentalnych  i płodnych  dla  rozwoju  fizyki 
pytań  dotyczących:  kinematycznych  i dynamicznych 
praw  i zasad  mechaniki,  fizycznej  struktury  układu 
planetarnego  i Wszechświata  oraz  podstawowych 
zasad  metody  naukowej  przyrodoznawstwa. 

Tak  więc  na  samym  progu  ery  nowożytnej  astrono- 
mia, jako  najbardziej  ilościowa  z ówczesnych  nauk 
fizycznych,  stała  się  dzięki  Kopernikowi  inspiratorką 
rozwoju  całej  fizyki.  Dzieło  Kopernika  kontynuował 
świadomie  Galileusz.  Uznając  i popierając  system 
heliocentryczny  Kopernika  — ugruntowany  na  po- 
czątku XVII  w.  przez  odkrycia  Keplera  — Galileusz 
skoncentrował  swe  wysiłki  głównie  na  ziemskiej 
fizyce.  Przeprowadził  systematyczne  i wnikliwe  po- 
miary i obserwacje  różnych  zjawisk.  On  pierwszy 
zrozumiał,  że  wbrew  pozorom  siła  wiąże  się  z przy- 
spieszeniem, a nie  z prędkością.  Skonstruował  szereg 
nowych  detektorów  (termoskop,  luneta,  waga  hy- 
drostatyczna). Odkrył  prawo  ruchu  wahadła,  księ- 
życe Jowisza,  fazy  Wenus  itp.  Przede  wszystkim  jed- 
nak pogłębił  metodę  naukową  w zakresie  detekcji 
i pomiarów  zjawisk  oraz  wprowadził  szereg  ważnych 
dla  dalszego  rozwoju  dynamiki  pojęć. 

W XVII  w.  zostały  położone  doświadczalne  i teore- 
tyczne podwaliny  wielu  działów  fizyki.  Zaczęto  sy- 
stematyczne badania  gazów  i cieczy  oraz  ciał  sprę- 
żystych, zjawisk  optycznych  i falowych  (W.  Snęli, 
R.  Boyle,  B.  Pascal,  Ch.  Huygens,  O.  Romer,  P.  de 
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Fermat,  Torricelli,  Otto  von  Guericke  i in.).  Następcy 
Galileusza  skonstruowali  w XVII  w.  wiele  nowych 
detektorów,  np.  baroskop  do  badania  zmian  ciśnie- 
nia, spektroskop  pryzmatyczny  do  badania  składu 
światła,  zegary  astronomiczne. 

Nowe,  ilościowe  metody  fizyki,  rozwijane  przez 
Galileusza  i jego  następców,  wymagały  adekwatnych 
metod  matematycznych.  Niejako  na  zamówienie 
fizyki  stworzył  R.  Descartes  geometrię  analityczną, 
a 1.  Newton  i G.W.  Leibniz  — rachunek  różniczkowy 
i całkowy. 

Słynne  dzieło  I.  Newtona  Philosophiac  naturalis 
principia  mathematica  (1687)  zawiera  już  kompletną 
koncepcję  nowożytnej  fizyki  jako  nauki  ścisłej, 
zarazem  eksperymentalnej  i teoretycznej,  opartej 
na  pomiarach  i szerokim  stosowaniu  matematyki. 
W pracy  tej  Newton  sprecyzował  pojęcia  przestrzeni, 
czasu,  układu  odniesienia,  masy,  siły,  pędu  itd. 
Podał  też  trzy  podstawowe  prawa  dynamiki,  zwane 
często  ze  względu  na  ich  wagę  zasadami  mechaniki. 
Pierwsza  zasada  postuluje  istnienie  inercjalnych  ukła- 
dów odniesienia;  druga  podaje  równanie  wiążące  siłę 
z pochodną  pędu;  trzecia  dotyczy  pewnych  ogólnych 
własności  symetrii  sił  wzajemnego  oddziaływania 
między  ciałami  fizycznymi.  Newton  odkrył  również 
prawo  powszechnego  ciążenia  jako  uniwersalne 
prawo  natury,  dotyczące  wszelkich  ciał  fizycznych. 
Korzystając  z podanych  przez  siebie  praw  ruchu,  wy- 
rażonych w ścisłej  matematycznej  postaci,  rozwiązał 
w-iele  konkretnych  problemów  właściwej  fizyki  oraz 
astronomii.  Szczególnie  ciekawe  rezultaty  dały  prawa 
Newtona  zastosowane  do  ruchu  planet.  Okazało  się, 
że  ruch  punktu  masowego  w centralnym  polu  sil 
grawitacyjnych  odwrotnie  proporcjonalnych  do  kwa- 
dratu odległości  odbywa  się  po  krzywych  stożkowych 
(koło,  elipsa,  parabola,  hiperbola)  w zależności  od 
warunków  początkowych.  Newton  nie  tylko  fizycznie 
uzasadnił  system  Kopernika  i trzy  prawa  Keplera, 
ale  podał  jednolitą  teorię  ruchów  ciał  na  Ziemi  oraz 
planet,  komet  i innych  ciał  niebieskich.  W ten  sposób 
astronomia  stała  się  po  prostu  częścią  fizyki,  a jedno- 
cześnie prawa  ziemskiej  mechaniki  objęły  co  najmniej 
cały  układ  planetarny.  Zasady  jedności  materii 
i powszechności  praw  fizyki  znalazły  w mechanice 
układu  planetarnego  swoje  pierwsze  ścisłe  potwier- 
dzenie. 

Newton  przyczynił  się  również  niezwykle  do  rozwo- 
ju optyki,  nauki  o cieple,  mechaniki  ośrodków  ciąg- 
łych itd.  Choć  jego  zasługi  dotyczą  głównie  teorii, 
to  jednak  dokonał  on  także  wielu  odkryć  ekspery- 
mentalnych (np.  odkrycie  dyspersji  światła,  rozszcze- 
pienia światła  białego,  dyfrakcji  i interferencji  w cien- 
kich płytkach,  odkrycie  prawa  stygnięcia  ciał,  praw 
lepkości). 

Newton  podał  w jasnej  i ścisłej  postaci  zasady 
nowoczesnej,  empiryczno-racjonalnej  metody  nauko- 
wej, która  jest  stosowana  bez  zasadniczych  zmian 
do  dziś.  Dopiero  wiek  XX  przyniósł  pewne  pogłę- 
bienie jego  metody  naukowej.  W ciągu  minionych 
prawie  300  lat  metodę  tę  przejęły  bez  większych  zmian 
inne  nauki  przyrodnicze  i technika,  a ostatnio  adap- 
tują ją  również  nauki  społeczne  i humanistyczne. 

Mechanika  Newtona  stanowiła  przez  niemal  200 
lat  wzór  teorii  fizycznej,  źródło  inspiracji  dla  filozo- 
fów i przedmiot  powszechnego  zainteresowania  ludzi 
wykształconych.  Następcy  Newtona  rozw-ijali  przez 
cały  XVIII  w.  mechanikę  teoretyczną,  stosując 
prawa  Newtona  do  różnych  typów  sił  i różnych  ukła- 
dów, np.  układów  wielu  punktów  i ośrodków  ciąg- 
łych (gazów',  cieczy,  ciał  sprężystych).  W związku 
z potrzebami  doskonalonej  mechaniki  teoretycznej 
powstały  w tym  okresie  nowe  działy  matematyki,  np. 
teoria  równań  różniczkowych  zwyczajnych  i cząstko- 
wych, teoria  równań  całkowych,  rachunek  waria- 
cyjny itp.  Wielu  spośród  następców  Newtona  (np. 

L.  Euler,  J.L.  Lagrange,  J.  d’Alembert,  J.D.  Bemoulli, 
P.S.  Laplace,  C.G.J.  Jacobi,  W.R.  Hamilton)  przy- 
czyniło się  tak  jak  on  do  rozwoju  zarówno  fizyki. 
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jak  i matematyki.  Jeśli  chodzi  o ścisłą  i niezwykle 
owocną  współpracę  fizyki  z matematyką,  był  to 
z pewnością  złoty  wiek  nauki,  który  trwał  do  połowy 
XIX  stulecia. 

Wiek  XVIII  cechuje  nie  tylko  wspaniały  rozwój 
mechaniki  teoretycznej,  znamionują  go  także  ważne 
osiągnięcia  eksperymentalne  w innych  działach  fizyki. 
Skonstruowano  lub  w istotny  sposób  udoskonalono 
wiele  nowych  detektorów  i przyrządów  pomiarowych 
(np.  termometr,  barometr,  kalorymetr,  teleskopy 
różnych  typów,  w;aga  analityczna,  waga  skręceń). 
Poznano  podstawowe  prawo  elektrostatyki  (Ch.A. 
Coulomb),  odkryto  prawo  zachowania  masy  w reak- 
cjach chemicznych  (A.L.  Lavoisier,  M.W.  Łomono- 
sow), rozwinęła  się  szybko  kalorymetria.  Rewolucja 
przemysłowa  w Anglii  przyspieszyła  rozwój  badań 
eksperymentalnych. 

Pierwszą  połowę  XIX  w.  charakteryzuje  znaczna 
liczba  przełomowych  odkryć  doświadczalnych  z za- 
kresu nauk  o cieple,  elektryczności,  magnetyzmie 
oraz  optyki  i chemii  — przy  jednoczesnym  braku 
dobrych  teorii  badanych  zjawisk.  W dziedzinie  zja- 
wisk cieplnych  odkryto  równoważność  pracy  i ciepła 
(B.  Rumford,  H.  Davy,  J.P.  Joule).  Stwierdzono  też, 
że  praca  może  się  przemieniać  w ciepło  bez  .żadnych 
ograniczeń,  natomiast  ciepło  można  przemienić 
w pracę  tylko  z pewnymi  ograniczeniami  (S.  Carnot). 
Odkrycia  te  zadały  pierwszy  poważny  cios  błędnej 
hipotezie  cieplika,  przypisującej  ciepłu  substancjalny, 
niezniszczalny  charakter.  W chemii  odkryto  prawa 
stosunków  wielokrotnych,  stosunków  równoważni- 
kowych i stosunków  stałych  (J.L.  Proust,  J.B.  Rich- 
ter, L.J.  Gay-Lussac,  J.  Dalton,  A.  Avogadro). 
W celu  wytłumaczenia  tych  praw  Dalton  przypomniał 
starą  hipotezę  atomową.  W optyce  dokładne  zbadanie 
zjawisk  interferencji  i dyfrakcji  światła  (T.  Young, 
A.J.  Fresnel)  obaliło  korpuskularny  model  światła, 
którego  zwolennikiem  był  sam  Newton.  Konstrukcja 
siatki  dyfrakcyjnej  (J.  Fraunhofer)  i różnych  typów 
spektrometrów  oraz  odkrycie  linii  absorpcyjnych 
w widmie  słonecznym  stało  się  początkiem  spektro- 
metrii optycznej.  Astronomia  otrzymała  nowe, 
potężne  narzędzia  do  badania  chemicznego  składu 
zewnętrznych  warstw  Słońca,  gwiazd  i planet 
oraz  procesów  pchodzących  w tych  warstwach,  jak 
również  procesów  zachodzących  w przestrzeni  mię- 
dzygwiazdowej.  Spektrometria  znalazła  też  rychło 
liczne  zastosowania  do  badania  składu  chemicznego 
i zanieczyszczeń  różnych  substancji,  dzięki  możli- 
wości bardzo  dokładnego  wykrywania  charaktery- 
stycznych dla  poszczególnych  pierwiastków  linii 
widmowych.  Innym  ważnym  dla  optyki  osiągnięciem 
było  odkrycie  polaryzacji  światła  odbitego  (E.L.  Ma- 
lus).  Po  skonstruowaniu  efektywnych  polaryzatorów 
(W.  Nicol)  rozpoczął  się  okres  intensywnych  badań 
zjawiska  polaryzacji  światła  (A.J.  Fresnel,  T.  Young, 

E.  Malus,  D.F.J.  Arago,  D.  Brewster).  J.B.L.  Foucault 
zmierzył  prędkość  światła  w wodzie  i wykazał,  że 
jest  ona  zgodna  z modelem  falowym,  natomiast 
zdecydowanie  sprzeczna  z modelem  korpuskularnym 
światła.  Zjawisko  polaryzacji  świadczyło,  że  światło 
jest  falą  poprzeczną. 

W dziedzinie  elektryczności  skonstruowano  wiele 
nowych  urządzeń  służących  do  wytwarzania  pól 
i prądów  elektrycznych  oraz  pól  magnetycznych 
(np.  stosy,  ogniwa,  akumulatory,  maszyny  elektro- 
statyczne, kondensatory,  cewki)  oraz  do  pomiaru 
wielkości  elektrycznych  i magnetycznych  (galwano- 
metr,  woltomierz,  amperomierz,  busola  stycznych).  Za 
pomocą  ogniw  odkryto  i zbadano  zjawisko  elektrolizy 
(H.  Davy,  M.  Faraday),  a następnie  za  pomocą  elek- 
trolizy wykryto  ważne  pierwiastki  nie  występujące  na 
Ziemi  w stanie  wolnym  (np.  potas  i sód)  oraz  stwier- 
dzono złożony  charakter  niektórych  substancji  (np. 
wody).  W 1820  r.  H.Ch.  Oersted,  badając  własności 
prądów  stałych,  odkrył,  że  prąd  elektryczny  ma  coś 
wspólnego  z magnetyzmem,  ponieważ  odchyla  igłę 
busoli.  Wkrótce  A.M.  Ampere  odkrył  wzajemne  mag- 
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netyczne  oddziaływanie  dwóch  prądów.  G.S.  Ohm 
wykrył  prawo  przewodnictwa  metali,  zwane  dziś  jego 
imieniem. 

Największe  zasługi  dla  rozwoju  nauki  o elektrycz- 
ności i magnetyzmie  położył  jednak  w 1 połowie 
XIX  w.  M.  Faraday.  Odkrył  on  w 1831  r.  bardzo 
ważne  prawo  indukcji,  wg  którego  zmienne  w czasie 
pole  magnetyczne  powoduje  wystąpienie  zamkniętych 
linii  sił  pola  elektrycznego.  W tym  samym  czasie  Fa- 
raday odkrył  zjawisko  indukcji  prądów  przez  zmienne 
prądy,  co  było  zresztą  naturalną  konsekwencją  zja- 
wiska Oersteda  i pierwotnego  prawa  indukcji.  Odkry- 
cia te  wykazywały  istnienie  głębokich  związków 
między  elektrycznością  i magnetyzmem,  wprowadzały 
nowe  obiekty  badań:  zmienne  w czasie  prądy  i pola 
elektryczne  oraz  magnetyczne,  inspirowały  konstruk- 
cje nowych  ważnych  urządzeń  w postaci  cewki, 
elektromagnesu,  galwanoskopu,  transformatora,  któ- 
re wkrótce  zrewolucjonizowały  technikę,  a z nią  całą 
naszą  cywilizację.  Faraday  dokonał  jeszcze  wielu 
innych  wiekopomnych  odkryć,  zdobywając  sławę 
najlepszego  eksperymentatora,  jeśli  nie  w całej  historii 
fizyki,  to  przynajmniej  XIX  w.  Wystarczy  wymienić 
jeszcze  prawa  elektrolizy  (stała  Faradaya),  skroplenie 
gazów,  odkrycie  diamagnetyków  i paramagnetyków, 
zbadanie  dielektryków,  odkrycie  skręcenia  polaryza- 
cji światła  przy  przechodzeniu  przez  namagnesowane 
ośrodki. 

Faraday  był  nie  tylko  genialnym  eksperymentato- 
rem, był  równie  genialnym  teoretykiem.  Wprawdzie 
nie  sformułował  matematycznie  teorii  zjawisk  elektro- 
magnetycznych, ale  wprowadził  podstawowe  kon- 
cepcje teoretyczne.  Wyniki  jego  doświadczeń  skło- 
niły go  do  odrzucenia  panującego  wówczas  mecha- 
nistycznego  obrazu  zjawisk  elektromagnetycznych, 
w którym  podstawową  rolę  odgrywały  ładunki  elek- 
tryczne i magnetyczne  działające  na  odległość  siłami 
centralnymi  odwrotnie  proporcjonalnymi  do  kwadra- 
tu odległości.  Faraday  wprowadził  inny  opis,  oparty 
na  pojęciu  lokalnego  działania  pola  elektrycznego 
i magnetycznego  na  znajdujący  się  w nim  ładunek 
elektryczny  lub  prąd.  Taki  model  stał  się  bardzo  płod- 
ny w przyszłości,  kiedy  się  okazało,  że  szybko  zmienne 
pola  elektromagnetyczne  mogą  się  oderwać  od  wy- 
twarzających je  ładunków  i rozchodzić  niezależnie  od 
chwilowych  położeń  tych  ładunków. 

Mimo  tak  wielu,  tak  fundamentalnych  odkryć 
eksperymentalnych,  konstrukcji  wielu  nowych  de- 
tektorów, urządzeń  i aparatów  pomiarowych,we  wszy- 
stkich działach  fizyki,  oprócz  właściwej  mechaniki, 
brak  było  zadowalających  teorii  i panował  w nich 
dość  duży  nieład.  Dopiero  w połowie  XIX  w.  na- 
stąpił przełom  pod  tym  względem.  Zaczęło  się  od 
sformułowania  w latach  czterdziestych  I zasady 
termodynamiki,  a wkrótce,  w latach  1850-51  — 
II  zasady  (S.  Carnot,  R.  Mayer,  J.P.  Joule,  H.  Helm- 
holtz,  R.  Clausius,  W.  Thomson-Kelvin).  I zasada 
jest  uogólnieniem  prawa  zmiany  energii,  znanego 
z mechaniki,  na  procesy,  w których  oprócz  pracy 
występuje  wymiana  ciepła.  II  zasada  określa  kierunek 
zachodzących  w przyrodzie  procesów  termodyna- 
micznych. Z zasad  tych  wynika  istnienie  temperatury 
bezwzględnej  i entropii.  Obie  zasady  termodynamiki 
implikują  ścisły  związek  między  zjawiskami  mecha- 
nicznymi i cieplnymi,  które  przez  długie  wieki  były 
uważane  za  niezależne  od  siebie.  Choć  zasady  termo- 
dynamiki są  sformułowane  zupełnie  ogólnie  (abstra- 
hują od  szczególnych  własności  układów)  oraz  czy- 
sto fenomenologicznie,  to  jednak  zastosowanie  ich 
do  konkretnych  ciał  implikuje  wiele  ciekawych  związ- 
ków między  bardzo  różnorodnymi  zjawiskami  i pro- 
cesami. 

W połowie  XIX  w.  została  ostatecznie  przyjęta 
przez  chemików  hipoteza  atomowo-molekulama 
(St.  Cannizzaro),  a — w związku  z powstaniem  ter- 
modynamiki i ze  wzrastającym  zainteresowaniem  zja- 
wiskami cieplnymi  — stała  się  ona  domeną  teore- 
tycznych badań  fizyków.  Zarówno  bowiem  termo- 


dynamika, jak  i powstała  kilkanaście  lat  później 
elektrodynymika  były  teoriami  czysto  fenomenolo- 
gicznymi i makroskopowymi.  Występowały  w nich 
liczne  empiryczne  parametry  i funkcje  stanu  (np. 
temperatura,  ciśnienie,  równanie  stanu,  entropia, 
energia  wewnętrzna,  stała  dielektryczna,  przewod- 
nictwo elektryczne),  których  teorie  te  nie  potrafiły 
ani  zinterpretować,  ani  obliczyć. 

Problem  wyjaśnienia  zjawisk  makroświata  jako 
wypadkowych  odpowiednich  własności  atomów  i mo- 
lekuł (czyli  mikroświata)  podjął  w 1845  r.  J.J.  Water- 
ston.  Szybki  rozwój  tego  kierunku  badań  datuje 
się  jednak  dopiero  od  prac  A.K.  Króniga  i R.E.  Clau- 
siusa  rozpoczętych  w 1856  r.  Badacze  ci  zbudowali 
bardzo  poglądowy  model  atomowo-molekularny 
gazów,  zwany  teorią  kinetyczną  gazów.  Począwszy 
od  1860  r.  do  szybkiego  rozwoju  tej  teorii  przyczy- 
nił się  J.C.  Maxwell.  Na  gruncie  tej  pieiwszej  ilościo- 
wej teorii  mikroświata  zinterpretowano  temperaturę, 
ciśnienie,  entropię  i inne  makroskopowe  funkcje 
stanu,  wyrażając  je  przez  wartości  średnie  odpowied- 
nich wielkości  mikroskopowych.  W ten  sposób 
zjawiska  cieplne  zostały  sprowadzone  do  odpowied- 
nich zjawisk  mechanicznych  zachodzących  w mikro- 
świecie.  Wychodząc  z założenia,  że  między  molekuła- 
mi gazu  występuje  proste  oddziaływanie,  udało  się 
też  wytłumaczyć  postać  równania  stanu  gazów  (van 
der  Waals).  Zastosowanie  znalezionego  przez  Maxwel- 
la  rozkładu  prędkości  w jednorodnym  gazie  o stałej 
temperaturze  pozwoliło  na  uściślenie  obliczeń  wielu 
parametrów  i uczyniło  teorię  kinetyczną  znacznie 
bardziej  realistyczną.  Maxwell  podał  też  prostą 
mikroskopową  teorię  takich  zjawisk  jak  przewodni- 
ctwo cieplne,  lepkość  i dyfuzja  gazów. 

Stworzenie  zadowalającej  matematycznej  teorii 
zjawisk  elektromagnetycznych  i magnetycznych  jest 
również  zasługą  Maxwella.  Dokonał  on  tego  w serii 
prac  rozpoczętych  w 1861  r.,  a uwieńczonych  ogło- 
szeniem w 1873  r.  wielkiego  dzieła  Treatise  on  Electri- 
city  and  Magneiism.  W pracach  tych  Maxwell  prze- 
łożył najpierw  prawa  Gaussa,  Ampere'a-Qersteda 
i Faradaya  na  ścisły  język  matematycznych  równań 
różniczkowych,  posługując  się  przy  tym  polowymi 
koncepcjami  Faradaya.  Równanie  odpowiadające 
pierwotnemu  prawu  Oersteda  okazało  się  w przy- 
padku gęstości  ładunku  zależnej  od  czasu  sprzeczne 
z prawem  zachowania  ładunku.  Maxwell  zmienił  to 
równanie  i doszedł  do  niesprzecznego  układu,  zwa- 
nego dziś  równaniami  elektrodynamiki  klasycznej 
albo  po  prostu  równaniami  Maxwella.  Z równań 
elektrodynamiki  wynikało  istnienie  nowego,  nie 
znanego  wówczas  zjawiska  fal  elektromagnetycznych. 
Maxwell  wykazał,  że  powinny  to  być  fale  poprzeczne 
o ściśle  określonych  właściwościach.  Zwrócił  też 
uwagę  na  to,  że  fale  elektromagnetyczne  mają  wszy- 
stkie znane  wówczas  własności  światła.  Założył  więc 
w zgodzie  ze  wspomnianymi  doświadczeniami  Fa- 
radaya, że  światło  jest  po  prostu  falą  elektromagne- 
tyczną o stosunkowo  małej  długości  fali.  Istnienie 
fal  elektromagnetycznych  o dużych  długościach 
zostało  potwierdzone  przez  H.R.  Hertza  wiele  lat 
później,  dopiero  w 1888  r. 

Po  licznych  i bardzo  różnorodnych  weryfikacjach 
teorii  Maxwełla,  w końcu  XIX  w.  nikt  już  nie  wątpił 
w jej  poprawność.  Podobnie  jak  w końcu  XVII  w.  me- 
chanika Newtona,  tak  w 2 połowie  XIX  w.  elektro- 
dynamika Maxwella  oznaczała  niezwykle  ważny 
przewrót  w strukturze  fizyki.  W ramach  jednej 
wspólnej  teorii  zostały  połączone  trzy  wielkie  klasy 
zjawisk  (elektryczne,  magnetyczne  i optyczne),  które 
przez  długi  okres  były  uważane  za  niezależne.  Pomi- 
nąwszy elektrostatykę  i magnetostatykę,  pola  elek- 
tryczne i magnetyczne  są  zawsze  nierozłączne,  a związ- 
ki między  nimi  są  opisane  przez  równanie  Maxwella. 
Dlatego  mówi  się  obecnie  poprawniej  o zjawiskach 
elektromagnetycznych.  Optyka  przestała  istnieć  jako 
niezależny  dział  fizyki,  a stała  się  działem  ełektro- 
dynamiki(  -►  Elektrodynamika). 
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ziarnistość  W ostatniej  ćwierci  XIX  w.  zaczęły  się  mnożyć 
elektrycz-  doświadczenia  wykazujące  coraz  bardziej  przekony- 
ności  wająco,  że  elektryczność  występuje  w postaci  ziar- 
nistej, a nie  jest  ciągłym  fluidem  jak  sądzono  dawniej. 
Wskazywały  na  to  już  prawa  elektrolizy.  Znacznie 
większą  rolę  odegrały  tu  jednak  badania  wyładowań 
elektrycznych  w rozrzedzonych  gazach  (J.  Pliicker, 
H.  Geissler,  J.  Hittorf,  W.  Crookes,  E.  Goldstein). 
Wykazano  m.in.,  że  promienie  katodowe  składają 
się  z ujemnie  naładowanych  cząstek.  Dokonane  po 
1897  r.  pomiary  stosunku  masy  do  ładunku  (J.J. 
Thomson,  W.  Kaufmann,  E.  Wiechert)  doprowadziły 
do  wniosku,  że  cząstki  te,  nazwane  elektronami,  są 
przeszło  1800  razy  lżejsze  od  najlżejszego  atomu  wo- 
doru. Przeprowadzone  niezależnie  pomiary  ładunków 
elektrycznych  (R.A.  Millikan)  wykazały,  że  są  one 
zawsze  całkowitymi  wielokrotnościami  ładunku  elek- 
tronu. 

Wyładowania  w rozrzedzonych  gazach  stały  się 
pierwszą  bardziej  bezpośrednią  metodą  eksperymen- 
talnego badania  mikroświata.  Zastosowanie  niskich 
pierwsze  ciśnień,  a tym  samym  małych  gęstości,  oznaczało  po- 
badania  ważne  zmniejszenie  wzajemnych  oddziaływań,  czyli 
mikroświata  stworzenie  warunków  coraz  lepszej  wzajemnej  izo- 
lacji mikrocząstek.  Poza  tym  w eksperymentach 
tych  udało  się  po  raz  pierwszy  wytworzyć  wiązki 
jednakowych  naładowanych  mikrocząstek  (proto- 
nów, elektronów,  jonów)  o bardzo  zbliżonych  pędach. 
Wprawdzie  historia  fizyki  niskich  ciśnień  zaczęła  się 
już  w XVII  w.,  od  Torricellego  i Guerickego,  ale  do- 
piero w 2 połowie  XIX  w . nastąpił  jej  gwałtowny 
rozw-ój  — głównie  dzięki  temu,  że  stała  się  ona  pod- 
waliną niemal  wszystkich  metod  badania  mikroświata. 

Jeszcze  przed  definitywnym  doświadczalnym  od- 
kryciem elektronu  H.A.  Lorentz  stworzył  podwaliny 
pierwszej  mikroskopowej,  statystycznej  teorii  zjawisk 
elektronowa  elektromagnetycznych,  nazwanej  później  elektronową 
teoria  teorią  Lorentza.  Lorentz  przyjął,  zgodnie  z później- 
Lorentza  szymi  odkryciami  doświadczalnymi,  że  atomy  i mo- 
lekuły zbudowane  są  z elektrycznie  naładowanych 
cząstek.  Założył  dalej,  że  w mikroświecie  słuszne 
są  równania  Maxwella  w postaci  znanej  dla  próżni  — 
z tym  zastrzeżeniem,  że  jedynym  prądem  elektrycz- 
nym jest  prąd  konwekcyjny,  wywołany  ruchem  ła- 
dunków. Wprowadzając  jeszcze  kilka  innych  po- 
glądowych założeń  i utożsamiając  makroskopowe 
wielkości  z wartościami  średnimi  odpowiednich  wiel- 
kości mikroskopowych,  z modelu  Lorentza  można 
było  otrzymać  wiele  wniosków  dotyczących  elektro- 
magnetycznych własności  ciał. 

W tym  samym  okresie  do  rozwoju  kinetycznej 
teorii  gazów  w kierunku  coraz  głębszej  i coraz  wszech- 
stronniejszej statystycznej  teorii  materii  ogromnie  się 
przyczynili  przede  wszystkim  L.  Boltzmann,  a potem 
J.W.  Gibbs.  Po  odkryciu  elektrycznej  struktury  ma- 
terii oraz  powstaniu  teorii  Lorentza  i statystycznej 
fizyki  zaczął  się  na  przełomie  XIX  i XX  w.  nowy  etap 
atomistyka  unifikacji  całej  makroskopowej  fizyki  na  bazie  ato- 
podstawą  mistyki,  zakładającej,  że  wszystkie  ciała  makrosko- 
unifikacji  powe  składają  się  z określonych  mikrocząstek  (ato- 
fizyki  mów,  molekuł,  jonów,  elektronów).  Własności  tych 
mikrocząstek  i prawa  nimi  rządzące  miały  determi- 
nować wszystkie  własności  ciał  makroskopowych 
i prawa  makroświata. 

Program  ten  był  w owym  czasie  bardzo  trudny  do 
zrealizowania.  Nie  znano  jeszcze  struktury  atomów, 
molekuł  i jonów,  nie  znano  najważniejszych  praw 
mikroświata.  Wnioskowanie  o własnościach  mikro- 
świata na  podstawie  ich  hipotetycznego  wpływu  na 
zjawiska  makroświata  było  bardzo  trudne,  ponieważ 
średniowanie  nie  jest  procedurą  jednoznacznie 
określoną  ani  odwracalną.  W tej  sytuacji  na  przeło- 
mie XIX  i XX  stulecia  powstała  silna  opozycja  prze- 
ciwko całej  atomistyce,  wskazująca  na  brak  bezpo- 
średnich metod  doświadczalnych,  które  by  potwier- 
dziły realne  istnienie  i pozwoliły  na  zbadanie  struktury 
atomów  i innych  mikrocząsteczek.  Wielkim,  ale 
krótkotrwałym  triumfem  przeciwników  atomistyki 


było  wykrycie  w tym  okresie  wielu  fundamentalnych 
sprzeczności  między  przewidywaniami  teorii  staty- 
stycznych a faktami  doświadczalnymi.  W rezultacie 
sprzeczności  te  doprowadziły  do  powstania  ok.  1925  r. 
nowej,  poprawnej  teorii  atomu  i molekuły  — mecha- 
niki kwantowej. 

Również  żądanie  bardziej  bezpośrednich,  doświad- 
czalnych dowodów  istnienia  mikrocząstek  zostało 
wkrótce  spełnione  dzięki  konstrukcji  nowych  detek- 
torów i innych  narzędzi  badawczych,  jak  np.  komory 
Wilsona,  pęchrzykowe,  iskrowe,  liczniki  różnego 
rodzaju  naładowanych  i neutralnych  cząstek,  czułe 
emulsje  fotograficzne,  mikroskopy  elektronowe,  da- 
lej — liczne  akceleratory  przygotowujące  strumie- 
nie pożądanych  mikrocząstek  o określonym  pędzie 
itp.  (-►  Detekcja  cząstek  wielkiej  energii.  Akcelera- 
tory). Urządzenia  te  pozwoliły  nie  tylko  na  mierzenie 
nowych,  statystycznych  wielkości  odnoszących  się  bez- 
pośrednio do  określonych  mikrocząstek  (jak  przekroje 
czynne,  rozkłady  kątowe  i energetyczne  oraz  inne 
rozkłady  prawdopodobieństwa),  lecz  także  na  wizual- 
ne oglądanie  torów  pojedynczych  naładowanych 
mikrocząstek  oraz  ich  zderzeń,  procesów  tworzenia 
się  i rozpadów,  a nawet  obserwację  większych  drobin 
(w  mikroskopie  elektronowym). 

W ten  sposób  odpowiedź  na  trzy  fundamentalne 
pytania  eksperymentatora:  Co,  jak  i czym  mierzyć 
v/  fizyce  mikroświata  — stawała  się  stopniowo  coraz 
bogatsza  i głębsza. 

Inny  ważny  kierunek  badań  z końca  XIX  i początku 
XX  w.  wiązał  się  z narastającą  sprzecznością  między 
dwoma  największymi  teoriami  makroświata:  mecha- 
niką Newtona  a elektrodynamiką  Maxwe!la.  Według 
elektrodynamiki  prędkość  rozchodzenia  się  fal 
elektromagnetycznych  w próżni  c jest  stała  i izotro- 
powa. Newtonowska  koncepcja  przestrzeni  i czasu 
prowadzi  do  wniosku,  że  jest  to  możliwe  tylko  w jed- 
nym wyróżnionym  układzie  inercjalnym.  W innych 
poruszających  się  względem  niego  układach  prędkość 
c powinna  zależeć  od  kierunku  rozchodzenia  się  fali. 

W końcu  XIX  w.  A. A.  Michelson  i E.W.  Morley 
wykonali  serię  doświadczeń,  które  miały  wykazać,  jak 
prędkość  Ziemi  dodaje  się  do  prędkości  światła. 
Okazało  się  — wbrew  fizyce  Newtona  — że  prędkość 
światła  w dwóch  poruszających  się  wzajemnie  ukła- 
dach jest  taka  sama  i że  jest  izotropowa  w obu  ukła- 
dach. Usiłowania  pogodzenia  obu  teorii  bez  zmienia- 
nia żadnej  z nich  nie  udały  się.  W 1905  r.  A.  Einstein 
zrobił  zgodne  z wynikiem  doświadczeń  Michelsona- 
Morleya  założenie,  że  prędkość  światła  jest  stała 
i jednakowa  we  wszystkich  układach  inercjalnych, 
oraz,  że  wszystkie  układy  inercjalne  są  fizycznie 
równoprawne  i nie  ma  układu  wyróżnionego  (eteru). 
Einstein  wykazał,  że  współrzędne  przestrzenne  i cza- 
sowe tego  samego  zdarzenia,  mierzone  za  pomocą 
sygnałów  świetlnych  w dwóch  poruszających  się  wza- 
jemnie ruchem  jednostajnym  układach  inercjalnych, 
są  związane  tzw.  transformacją  Lorentza,  odmienną 
od  dotychczas  stosowanej  transformacji  Galileusza. 
Z transformacji  Lorentza  wynikały  zaskakujące  kon- 
sekwencje, np.  względność  takich  pojęć  jak  przedział 
czasowy,  kolejność  czasowa,  odległość,  masa,  które 
w fizyce  Newtona  były  uważane  za  bezwzględne,  tj. 
niezależne  od  wyboru  układu  inercjalnego.  Einstein 
pogodził  elektrodynamikę  Maxwella  z mechaniką 
Newtona  zmieniając  tę  ostatnią,  gdyż  jej  równania 
nie  były  niezmiennicze  względem  transformacji 
Lorentza.  Najważniejszą  zmianą  było  zastąpienie 
w prawie  dynamiki  Newtona  stałej  masy  masą  za- 
leżną od  prędkości.  Ze  zmienionej  w ten  sposób 
mechaniki  wyniknął  słynny  wzór  wyrażający  równo- 
ważność masy  i energii.  Einstein  założył,  że  wzór  ten 
jest  słuszny  w przypadku  układów  zawierających  nie 
tylko  cząstki,  lecz  również  pola  (— ► O niektórych  pod- 
stawowych pojęciach  fizycznych). 

Transformacja  Lorentza  implikuje  skomplikowane 
prawo  dodawania  prędkości,  które  jednakże  dla 
prędkości  małych  w porównaniu  z nieprzekraczalną 
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szczególna  według  Einsteina  prędkością  światła  c przechodzi 
teoria  w dawne  proste  prawo  dodawania  wektorów.  To 
względności  samo  dotyczy  innych  równań,  tak  że  można  powie- 
dzieć, że  teoria  Einsteina,  zwana  też  szczególną  teorią 
względności,  nie  jest  sprzeczna  z dawną  mechaniką, 
tylko  obejmuje  szerszy  zakres  zjawisk.  Dawna  me- 
chanika pozostaje  słuszna  w zakresie  prędkości  dużo 
mniejszych  od  c. 

Zaskakujące  konsekwencje  szczególnej  teorii 
względności  zostały  potwierdzone  w tysiącach  ekspe- 
rymentów i w praktycznym  zastosowaniu  (np.  w akce- 
leratorach szybkich  cząstek,  w reakcjach  między  czą- 
stkami elementarnymi  i jądrami,  w reaktorach  i bom- 
bach atomowych).  Do  tych  sukcesów  doprowadziła 
Einsteina  systematyczna  rewizja  podstawowych  pojęć 
dawnej  fizyki  i wprowadzenie  — zamiast  starych, 
apriorycznych  definicji  — określeń  operacyjnych, 
opartych  na  użyciu  fal  elektromagnetycznych  jako 
optymalnego  środka  przesyłania  sygnałów  i wszelkiej 
informacji.  Z przykładu  tego  wynika,  że  po  pierwsze — 
trzeba  być  bardzo  ostrożnym  z pojęciami,  które  nie  są 
wprowadzone  operacyjnie,  lecz  apriorycznie,  po 
drugie  — nie  należy  zakładać  pochopnie  stosowalno- 
ści teorii  w zakresie  jeszcze  nie  sprawdzonym. 

Kilkanaście  lat  później  Einstein  zaproponował 
nową,  wysoce  zgeometryzowaną  teorię  grawitacji, 
która  nosi  też  nazwę  ogólnej  teorii  względności 
ogolna  teoria  (0pjera  się  ona  na  lokalnej  równoważności  zjawisk 
względności  występujących  w przywieszonym  układzie  i w polu 
grawitacyjnym).  W teorii  tej  postuluje  się,  że  obecność 
mas  grawitacyjnych  zakrzywia  przestrzeń,  która  już 
nie  jest  prostą  przestrzenią  Euklidesa,  lecz  przestrze- 
nią typu  Riemanna.  Teoria  ta  daje  w pierwszym 
przybliżeniu  te  same  wyniki  co  mechanika  Newtona. 
Otrzymane  w następnym  przybliżeniu  odstępstwa 
od  teorii  Newtona  są  bardzo  małe,  tak  że  do  dziś 
zostały  potwierdzone  jedynie  w paru  przypadkach. 
Teoria  grawitacji  Einsteina  stała  się  jednak  podstawą 
nowoczesnej  kosmologii  i prowadzi  do  wielu  cieka- 
wych wyników  (— ► Kosmologia). 

Jak  już  wspomniano  wyżej,  po  długim  stosunkowo 
okresie  rozwoju  i coraz  większych  sukcesów,  na 
przełomie  XIX  i XX  stulecia  atomistyka  znalazła  się 
kryzys  nagle  w stanie  głębokiego  kryzysu.  Przede  wszystkim 
atomistyki  okazało  się,  że  wbrew  pierwotnej  koncepcji  atomu  — 
na  początku  odkryte  przez  chemików  i fizyków  realne  atomy  nie 
XX  w.  Są  anj  niepodzielne,  ani  niezniszczalne,  ani  nie  są 
najmniejszymi  cząstkami  materii.  Wskazywało  na 
to  odkrycie  elektronu  jako  składnika  atomu  oraz  od- 
krycie naturalnej  promieniotwórczości  szeregu  pier- 
wiastków (H.  Becquerel,  M.  Skłodowska-Curie  i P. 
Curie).  Rychło  wykazano,  że  promienie  alfa  i beta 
występujące  w tych  zjawiskach  są  korpuskularne 
i że  emitujący  je  pierwiastek  przekształca  się  w inny 
pierwiastek  (E.  Rutherford,  W.  Crookes,  W.  Ramsay, 
K.  Fajans,  F.  Soddy). 

Z drugiej  strony  zwrócono  uwagę  na  szereg  faktów 
doświadczalnych  (np.  kształt  widma  promieniowania 
ciała  doskonale  czarnego,  ciepło  właściwe  wieloato- 
mowych  gazów  i ciał  stałych,  mnogość  linii  widmo- 
wych nawet  najprostszych  atomów,  zjawisko  foto- 
elektryczne),  które  się  nie  dały  pogodzić  z ówczesnymi 
prawami  fizyki  makroskopowej  postulowanymi  w fizy- 
ce statystycznej  również  w odniesieniu  do  obiektów 
mikroświata.  Zaczęto  więc  szukać  dodatkowych 
ograniczeń,  które  by  z jednej  strony  — usunęły 
powstałe  rozbieżności,  a z drugiej  — nie  były  rażąco 
sprzeczne  ze  znanymi  prawami,  choć  może  obce 
i niepotrzebne  w fizyce  makroświata. 

Ten  nowy  etap  rozwoju  atomistyki  zapoczątkował 
w 1900  r.  M.  Planck,  proponując  rozwiązanie  pro- 
blemu promieniowania  ciała  doskonale  czarnego  za 
kwant  p0m0Cą  dodatkowego  założenia  kwantów  energii 
energii  (tj  określonych  porcji),  które  może  wypromieniować 
lub  zaabsorbować  oscylator  harmoniczny.  Następny 
krok  zrobił  w 1905  r.  Einstein  wprowadzając  pojęcie 
fotonu  (cząstki  lub  kwantu  światła)  dla  wytłumaczenia 
foton  efektu  fotoelektrycznego. 


Tymczasem  badano  pilnie  widma  promieniowania 
i inne  własności  atomu,  odkrywając  szereg  empirycz- 
nych reguł  (np.  reguła  kombinacyjna  Ritza).  Przeło- 
mowe znaczenie  miało  jednak  dopiero  odkrycie 
w 1911  r.  dodatnio  naładowanego  jądra  atomowego 
przez  Rutherforda.  Opierając  się  na  tym  odkryciu, 
N.  Bohr  już  w 1913  r.  zaproponował  nowy  model 
atomu.  Model  Bohra  był  półklasyczny,  tzn.  opierał 
się  na  równaniach  mechaniki  Newtona  uzupełnio- 
nych trzema  dodatkowymi  kwantowymi  postulatami. 
Model  Bohra  wyjaśniał  częściowo  podstawowe  wła- 
sności atomów  z jednym  elektronem,  ale  nie  odpo- 
wiadał na  wiele  istotnych  pytań,  nie  pozwalał  na 
obliczenie  wielu  ważnych  własności  atomów,  nie 
nadawał  się  do  obliczeń  bardziej  złożonych  ukła- 
dów. 

W 1924  r.  L.  de  Broglie  wysunął  śmiałą  hipotezę, 
że  podobnie  jak  światłu  (fotonom)  przypisano  włas- 
ności korpuskularne  w oddziaływaniu  z materią,  tak 
i typowym  cząstkom  (np.  elektronom)  należy  przy- 
pisać własności  falowe.  De  Broglie  podał  wzór  wią- 
żący długość  fali  z pędem  elektronu,  ale  nie  podał 
równania  falowego.  Zrobił  to  wkrótce  E.  Schródin- 
ger,  proponując  swoje  słynne  równanie,  które  się 
stało  filarem  nowej  mechaniki  mikroświata,  zwanej 
mechaniką  kwantową  (lub  falową).  Inne,  nieco  ogól- 
niejsze, bardziej  abstrakcyjne  (operatorowe),  ale 
w zasadzie  równoważne  sformułowanie  mechaniki 
kwantowej  podał  W.  Heisenberg.  W następnych 
paru  latach  ewolucja  mechaniki  kwantowej  polegała 
na  wprowadzeniu  probabilistycznej  interpretacji 
funkcji  falowej,  na  uwzględnieniu  świeżo  odkrytego 
spinu  elektronu,  zakazu  Pauliego  lub  statystyki 
Bosego-Einsteina  w przypadku  układów  wieloczą- 
stkowych  oraz  efektów  relatywistycznych  (P.  A.M.  Di- 
rac) i na  wprowadzeniu  innych  formalnych  i fizycz- 
nych uogólnień  i udoskonaleń. 

Nowa  teoria  świata  atomów,  molekuł,  jonów  i elek- 
tronów dawała  znakomite  rezultaty.  Pozwoliła  na  do- 
kładne obliczenie  energii  wiązania,  poziomów  wzbu- 
dzonych, prawdopodobieństw  przejścia,  czasów  życia 
i wielu  innych  efektów,  wobec  których  dawne  teorie 
i modele  były  bezradne.  Gdy  mamy  do  czynienia 
z prostszymi  układami,  rachunki  nie  są  nawet  spe- 
cjalnie trudne,  a ich  zgodność  z danymi  doświadczal- 
nymi znakomita.  W przypadku  wielocząstkowych 
układów  równania  mechaniki  kwantowej  są  wpraw- 
dzie bardzo  skomplikowane,  ale  numeryczne  ra- 
chunki wszędzie  dają  dobrą  zgodność  teorii  z doświad- 
czeniem. 

Mechanika  kwantowa  dokonała  poważnych  zmian 
w podstawowych  pojęciach  fizyki.  W fizyce  przed- 
kwantowej,  zwanej  dziś  klasyczną,  przez  symbole 
oznaczające  w równaniach  teorii  pęd,  położenie, 
moment  pędu  itp.  należało  rozumieć  dostatecznie 
dokładne  wyniki  pomiarów  tych  wielkości,  czyli 
liczby.  W mechanice  kwantowej  wielkości  fizyczne  są 
reprezentowane  w równaniach  przez  operatory, 
których  związek  z pomiarem  jest  dość  złożony,  a mia- 
nowicie dopiero  wartości  własne  operatora  reprezentu- 
jącego daną  wielkość  są  liczbami,  które  się  po- 
krywają z możliwymi  wynikami  pomiaru.  Niepraw- 
dziwe okazują  się  w związku  z tym  dwa  milczące 
założenia  teorii  pomiaru  robione  w fizyce  klasycznej: 
a)  zakłócenie  stanu  dowolnego  obserwowanego  ciała 
spowodowane  przez  przyrząd  pomiarowy  można 
uczynić  dowolnie  małym;  b)  można  przeprowadzić 
jednoczesne  pomiary  dwóch  dowolnych,  algebraicznie 
niezależnych  wielkości  fizycznych  z dowolną  dokła- 
nością  i tak,  by  pomiar  jednej  nie  zakłócał  pomiaru 
drugiej.  O nieprawdziwości  tych  założeń  świadczą 
m.in.  znane  relacje  nieokreśloności  Heisenberga. 
Metodologiczne  i filozoficzne  konsekwencje  mecha- 
niki kwantowej  są  nawet  ciekawsze  i dalej  idące 
niż  teorii  względności. 

Z biegiem  czasu  okazało  się,  że  mechanika  kwan- 
towa nie  opisuje  całkiem  poprawnie  oddziaływania 
elektronów,  atomów  itp.  z polem  promieniowania 
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elektromagnetycznego  (np.  nie  daje  możliwości 
obliczenia  efektu  Comptona  czy  anihilacji  pary  ne- 
gaton-pozyton).  W celu  opisania  takich  i wielu  innych 
efektów  trzeba  było  wprowadzić  tzw.  drugie  kwanto- 
wanie, w wyniku  którego  powstała  w połowie  XX  w. 
kwantowa  elektrodynamika  (S.  Tomonaga,  F.J.  Dy- 
son,  R.P.  Feynman,  J.  Schwinger).  Teoria  ta  opisuje 
wszelkie  układy  złożone  z elektronów  i pola  elek- 
tromagnetycznego w doskonałej  zgodzie  z doświad- 
czeniem. 

Jest  rzeczą  niezwykle  interesującą,  że  równania 
mechaniki  kwantowej  Schrodingera  można  wypro- 
wadzić z równań  elektrodynamiki  kwantowej  jako 
pewne  przybliżenie.  Inne  przybliżenie,  zwane  kla- 
sycznym, prowadzi  od  elektrodynamiki  kwantowej 
do  klasycznych  równań  Maxwella  i równań  Newto- 
na. Elektrodynamikę  kwantową  można  więc  uznać 
za  najbardziej  fundamentalną  z istniejących  spraw- 
dzonych teorii  fizycznych.  Jest  ona  teorią,  która  opi- 
suje w sposób  jednolity  ogromny  zakres  zjawisk. 
Dla  większości  zjawisk  zachodzących  w świecie 
atomów,  molekuł,  jonów  oraz  złożonych  z nich  ciał 
makroskopowych  wystarczająco  dokładną  teorią 
jest  zresztą  już  mechanika  kwantowa.  Opisuje  ona 
nie  tylko  wszystkie  fizyczne  i chemiczne  własności 
wymienionych  mikrocząstek,  ale  za  pośrednictwem 
fizyki  statystycznej  opisuje  doskonale  również  wła- 
sności ciał  makroskopowych.  Tak  to  już  w XX  w. 
dokonał  się  następny  bardzo  ważny  krok  w kierunku 
zjednoczenia  coraz  większej  liczby  działów  fizyki 
i innych  nauk  przyrodniczych  w ramach  wspólnej, 
jednolitej  teorii.  Objęcie  niemal  całej  makroskopowej 
fizyki  oraz  chemii,  a przypuszczalnie  także  biologii, 
przez  jedną  fizyczną  teorię,  którą  jest  elektrodynamika 
kwantowa  lub  w nieco  skromniejszym  wymiarze 
mechanika  kwantowa,  ma  bardzo  proste  i poglądowe 
uzasadnienie.  Jest  nim  atomowa  struktura  wszystkich 
normalnych  ciał  oraz  czysto  elektromagnetyczny 
charakter  wszystkich  istotnych  w tym  zakresie  od- 
działywań elementarnych. 

Poza  zasięgiem  elektrodynamiki  kwantowej  znaj- 
dują się  tylko  fizyka  jądrowa  i fizyka  cząstek  elemen- 
tarnych oraz  niektóre  zjawiska  zachodzące  w skali 
kosmicznej,  np.  we  wnętrzu  gwiazd,  gdzie  zresztą 
oprócz  grawitacji  istotną  rolę  odgrywają  własności 
jąder  i cząstek  elementarnych. 

Jądro  atomowe  zostało  odkryte  już  w 1911  r. 
przez  Rutherforda  przy  okazji  jego  badań  wnętrza 
atomu.  Jednakże  rozwój  fizyki  jądrowej  jako  odręb- 
nej dyscypliny  rozpoczął  się  właściwie  dopiero  w la- 
tach trzydziestych.  Jak  zwykle  w fizyce,  nowe  obiekty 
badań  wymagają  najpierw  stworzenia  nowych  na- 
rzędzi i metod  pomiarowych.  Podstawową  metodą 
badania  jąder  stało  się  ich  bombardowanie  różnymi 
cząstkami  i śledzenie  zachodzących  przy  tym  roz- 
proszeń oraz  reakcji.  Rozwój  fizyki  jądrowej,  a na- 
stępnie fizyki  cząstek  elementarnych,  wymagał  kon- 
strukcji coraz  potężniejszych  akceleratorów  oraz  coraz 
czulszych  liczników  i detektorów  cząstek.  Pierwsze 
systematyczne  badania  sztucznie  wywołanych  reakcji 
jądrowych  rozpoczęto  ok.  1930  r.  (I.  i F.  Joliot-Curie, 
J.  Chadwick  i in.).  W r.  1932  odkryto  drugi  obok 
protonu  składnik  jądra  — neutron.  Od  tego  czasu 
nasza  wiedza  empiryczna  o stanach  podstawowych 
i wzbudzonych  jąder  oraz  o reakcjach  jądrowych 
wzrosła  ogromnie,  a jednak  nie  ma  jeszcze  zadowa- 
lającej ogólnej  teorii  jądra.  Zgodnie  z hipotezą 
H.  Yukawy  przyjmuje  się,  że  oddziaływania  między 
nukleonami  przenoszone  są  głównie  przez  tzw.  pole 
mezonowe  (mezony  n).  Jednakże  oddziaływań  tych 
nie  udało  się  dotychczas  opisać  teoretycznie  w za- 
dowalający sposób  ( ■*  Oddziaływania  silne.  Siły 
jądrowe).  Zamiast  tego  stosuje  się  w fizyce  jądrowej 
liczne  fragmentaryczne  modele,  które  oddają  dość 
dobre  usługi,  pozwalając  zrozumieć  podstawowe 
własności  jąder  (->»  Modele  jądrowe).  Ponieważ 
nukleony  oddziałują  silnie  nie  tylko  między  sobą 
i z mezonami  n>  lecz  także  z innymi  cząstkami  ele- 


mentarnymi, trudno  uwierzyć,  by  zadowalająca  fizyka 
teoria  jądra  mogła  powstać  przed  powstaniem  teorii  cząstek 
cząstek  elementarnych.  elementar- 

Fizyka  cząstek  elementarnych  jest  właściwie  naj-  nych 
młodszym  z wielkich  działów  fizyki ; w odrębną  dyscy- 
plinę wydzieliła  się  z fizyki  jądrowej  dopiero  w latach 
pięćdziesiątych,  po  odkryciu,  oprócz  cząstek  n i me- 
zonów 7 r,  szybko  rosnącej  liczby  nowych,  z reguły 
nietrwałych  cząstek  (hiperony:  A,  £,  S,  mezony: 
k , j?,  coy  q i cała  plejada  tzw.  rezonansów).  Obiekty  te  obserwowany 
traktuje  się  na  równi  z elektronami,  protonami  i neu-  Wszechświat  1 0K 
tronami,  ponieważ  mają  one  wiele  własności  cząstek 
elementarnych  (podobne  elementarne  oddziaływania 
i symetrie  oraz  niepodzielność,  małe  rozmiary  itp.). 

Znamy  już  bardzo  wiele  takich  obiektów  i ciągle 
odkrywamy  nowe.  Znamy  też  sporo  ciekawych  empi-  Galaktyka  i ete- 
rycznych praw  i reguł  oraz  ogromną  liczbę  reakcji 
między  cząstkami  elementarnymi.  Nie  ma  jednak 
jeszcze  zadowalającej  teorii  cząstek  elementarnych 
(-►  Cząstki  elementarne  i ich  oddziaływania). 

Ponieważ  cząstki  elementarne  są  najmniejszymi 
(ok.  10" 13  cm)  znanymi  cegiełkami,  z których  zbudo-  9 

wane  są  wszystkie  znane  nam  formy  materii,  fizycy  Słonce  1 • 
przypuszczają,  że  ich  własności  powinny  wyznaczać  Ziemia  10'- 
własności  wszystkich  obiektów  zarówno  mikroświata, 
jak  i makroświata,  a więc  zarówno  jąder,  jak  i materii 
gwiezdnej.  O własnościach  atomów  istotnych  dla 
chemii  i fizyki  normalnych  ciał  makroskopowych  człowiek  10  ■ 
decydują  — na  szczęście  — tylko  bardzo  nieliczne 
globalne  własności  jąder,  jak  ładunek,  masa  i spin. 

Struktura  samego  jądra,  osłoniętego  bardzo  grubą  bakteria  10-e. 
otoczką  elektronową,  jest  nieistotna  dla  wspomnia- 
nego  zakresu  zjawisk;  ważna  jest  tu  tylko  struktura  ' 

zewnętrznych  powłok  elektronowych  atomów  i ich  wodoru  10 
masy.  Natomiast,  aby  obliczyć  własności  samych 
jąder  (którymi  możemy  się  interesować  niezależnie)  , 

oraz  badać  konsekwencje  pewnych  ekstremalnych  Proton 
stanów  w makroświecie,  konieczna  jest  dobru  teoria  porównanje 
cząstek  elementarnych.  rozmiarów 

Przyszła  teoria  cząstek  elementarnych  ma  więc 
wszelkie  szanse  stania  się  najbardziej  ogólną  i fun- 
damentalną teorią  fizyczną,  zawierającą  kwantową 
elektrodynamikę  i teorię  jądra  jako  przypadki  szcze-  przyszła 
gólne  lub  graniczne.  Według  obecnego  stanu  fizyki  teoria  cząs- 
możemy  powiedzieć,  że  cała  materia  w jej  wszystkich  tek  elemen- 
znanych  nam  stanach  jest  zbudowana  z tych  samych  tarnych 
cząstek  elementarnych,  których  oddziaływania  podle- 
gają tym  samym  prawom.  Jest  to  niezwykle  poglądo- 
we i przekonywające  fizyczne  uzasadnienie  zasad 
jedności  materii  i powszechności  praw  przyrody. 

Powstaje  frapujące  pytanie,  czy  teoria  cząstek 
elementarnych  obejmuje  swoim  zasięgiem  całą  ma- 
terię, czy  też  będzie  ona  tylko  następnym  krokiem 
po  nieskończonej  drabinie  poznania. 

W niniejszym,  z natury  rzeczy  bardzo  pobieżnym, 
szkicu  uwzględnione  zostały  tylko  te  działy  fizyki, 
które  się  znalazły  w głównym  nurcie  poznawczym 
fizyki,  wyznaczonym  przez  powstawanie  coraz 
ogólniejszych  i coraz  głębszych  przyczynowych  teorii. 

Jest  wiele  działów  fizyki,  które  mają  ogromne  zna- 
czenie praktyczne  i są  również  ciekawe  pod  względem 
poznawczym,  ale  nikt  nie  spodziewa  się  po  nich  od- 
kryć o fundamentalnym  dla  rozwoju  całej  fizyki 
znaczeniu  poznawczym  czy  też  konstrukcji  zupełnie 
nowej  ogólnej  teorii.  Takimi  działami  są:  fizyka  ciała 
stałego,  fizyka  cieczy,  fizyka  plazmy,  optyka,  termo- 
dynamika procesów  nieodwracalnych  itd.  Nikt  nie  ma 
wątpliwości,  że  istniejące  teorie  — mechanika  kwan- 
towa i elektrodynamika  kwantowa  oraz  fizyka  sta- 
tystyczna — opisują  dobrze  wymienione  działy  fizyki, 
ale  wobec  skomplikowanego  charakteru  występują- 
cych w nich  układów  ścisła  teoria  jest  przydatna 
tylko  jako  punkt  wyjścia  do  licznych  uproszczonych 
modeli.  Ze  względu  na  bogactwo  występujących 
w takich  układach  różnorodnych  zjawisk  praca  ba- 
dawcza jest  tu  nie  tylko  bardzo  ciekawa,  ale  ma 
przede  wszystkim  kapitalne  znaczenie  praktyczne. 

Zarys  niniejszy  ogranicza  się  do  właściwej  fizyki. 
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O chemii  czy  astronomii  wspomniano  tylko  wówczas, 
gdy  nauki  te  przyczyniły  się  w sposób  istotny  do 
rozwoju  głównego  nurtu  fizyki.  Trzeba  jednak  pod- 
kreślić, że  w astrofizyce  odkryto  w XX  w.  wiele  no- 
wych, fascynujących  zjawisk,  które  mogą  mieć 
ogromne  znaczenie  dla  poznania  struktury  i ewolucji 
Wszechświata.  Ogromne  znaczenie  zarówno  poznaw- 
cze, jak  i praktyczne  ma  też  fizyka  życia,  a w szcze- 
gólności biologia  molekularna. 


Praktyczne  i kulturotwórcze 
znaczenie  fizyki 


Technika  jest  z pewnością  dużo  starsza  od  nauki; 
stniała  i rozwijała  się,  gdy  nauki  jeszcze  nie  było. 
Wobec  braku  naukowej,  teoretycznej  i empirycznej 
podbudowy  techniki,  jej  rozwój  był  w dawnych  cza- 
sach niezmiernie  powolny,  zależał  najczęściej  od 
szczęśliwego  przypadkowego  odkrycia,  niekiedy  — 
technika  od  genialnego  pomysłu.  Również  utrwalanie  i prze- 
a nauka  kazy wanie  nabytych  praktycznych  umiejętności  było 
w tych  warunkach  bardzo  utrudnione.  Zresztą  nawet 
przez  pierwsze  paręset  lat  historii  nowożytnej  fizyki 
jej  szybki  rozwój  w niewielkim  zaledwie  stopniu 
oddziaływał  na  technikę.  Z wyjątkiem  wynalazku 
maszyny  parowej  technika  tego  okresu  opierała  się 
niemal  wyłącznie  na  osiągnięciach  mechaniki  sta- 
rożytnej, a więc  głównie  na  statyce  i teorii  mecha- 
nizmów. 

Przełom  nastąpił  dopiero  w 2 połowie  XIX  w., 
po  powstaniu  elektrodynamiki,  a także  termodyna- 
miki. Praktyczne  wykorzystanie  termodynamiki  do 
budowy  silników  cieplnych  i wielu  zagadnień  prze- 
mysłowej chemii,  ciepłownictwa  itp.  postępowało 
stosunkowo  wolno.  Natomiast  zastosowanie  elektro- 
dynamiki potoczyło  się  od  razu  lawinowo.  Rozpoczął 
się  „wiek  elektryczności”,  który  trwa  nadal.  Szerokie 
wiek  elek-  wykorzystanie  zjawisk  elektromagnetycznych  spo- 
tryczności  wodowało  przede  wszystkim  zupełną  rewolucję  sił 
wytwórczych  i podniesienie  poziomu  materialnego 
i kulturalnego  społeczeństw.  Rewolucja  ta  opierała 
się  głównie  na  wprowadzeniu  wydajnych,  niezawod- 
nych i ogólnie  dostępnych  elektromagnetycznych 
metod  przetwarzania,  przesyłania,  akumulowania 
i coraz  bardziej  zróżnicowanego  wykorzystania  taniej 
energii.  Z drugiej  strony  — nie  mniejszą  rewolucję 
społeczno-kulturalną  spowodowały  elektromagne- 
tyczne metody  zbierania,  zapisu,  przesyłania,  prze- 
twarzania, odtwarzania  i powielania  wszelkiej  infor- 
macji, w tym  także  informacji  czysto  kulturalnej 
Trzeci  zakres  zastosowania  elektrodynamiki  dotyczy 
automatyzacji  procesów  produkcyjnych  i nieproduk- 
cyjnych, zdalnego  kierowania  itp. 

Aż  do  drugiej  wojny  światowej  technika  wykorzy- 
stywała tylko  makroskopowe  zjawiska  i prawa  kla- 
sycznej fizyki.  W ostatnich  30  latach  coraz  częściej 
wykorzystuje  się  zjawiska  kwantowe  z zakresu  fizyki 
atomu,  molekuły  i ciała  stałego,  kwantowej  optyki 
oraz  fizyki  plazmy,  które  się  zajmują  zjawiskami 
elektromagnetycznymi  na  poziomie  fizyki  mikro- 
świata. 

W tym  samym  wprawdzie  czasie  wzrosła  liczba 
nowych  zastosowań  mechaniki  i termodynamiki,  ale 
ich  wagi  nie  da  się  porównać  z wagą  zastosowań 
zjawisk  elektromagnetycznych.  Prymatu  pod  tym 
zastosowa-  względem  nie  zdołała  też  odebrać  elektrodynamice 
nie  fizyki  fizyka  jądrowa  — mimo  swego  wielkiego  wpływu 
jądrowe]  na  politykę  (bomby  jądrowe).  Zastosowanie  izotopów, 
reaktorów  jądrowych,  różnego  typu  promieniowania, 
choć  bardzo  ważne,  nie  jest  jeszcze  tak  powszechne 
i tak  istotne  ani  dla  przemysłu,  ani  dla  praktyki 
pozaprzemysłowej  jak  zastosowanie  elektrodynamiki. 
Warto  zresztą  podkreślić,  że  fizyka  jądrowa  nie  wy- 
stępuje bynajmniej  w roli  konkurenta  elektrodyna- 
miki, tzn.  nie  ma  mowy  o wypieraniu  metod  elektro- 


magnetycznych przez  jądrowe.  Chodzi  z reguły  o do- 
danie do  możliwości  elektrodynamiki  nowych  możli- 
wości, wynikających  z wykorzystania  fizyki  jądrowej. 

Warto  wspomnieć  tu  także  o drugiej,  równoczesnej 
rewolucji,  którą  spowodowało  w ostatnim  stuleciu 
zastosowanie  chemii.  Chemia  nie  tylko  udoskonaliła 
technologię  wytwarzania  wielu  „starych”  materiałów, 
ale  wprowadziła  do  produkcji  ogromną  liczbę  nowych 
tworzyw  sztucznych,  paliw,  leków,  nawozów,  deter- 
gentów, środków  spożywczych  itp. 

Dzięki  coraz  szerszemu  wykorzystaniu  zdobyczy 
fizyki  i chemii  oraz  w pewnym  stopniu  biologii  na- 
stąpił w ostatnich  100  latach  niebywale  szybki  roz- 
wój przemysłu.  Zrodzona  przez  te  nauki  nowa  tech- 
nika zmienia  w zawrotnym  tempie  oblicze  świata, 
decyduje  o bogactwie  materialnym  i o poziomie  kul- 
turalnym narodów,  zmienia  siły  wytwórcze,  rodzaj 
i skalę  wytwarzanych  dóbr,  zmienia  stosunki  społecz- 
ne i polityczne  we  wszystkich  częściach  naszego  globu. 

W pierwszym  okresie  unaukowienia  techniki,  któ- 
ry trwał  z grubsza  do  połowy  XX  w.,  technika  korzy- 
stała niemal  wyłącznie  z końcowych  rezultatów  badań 
naukowych,  czyli  z gotowej  wiedzy  naukowej  w po- 
staci odkrytych  zjawisk,  skonstruowanych  aparatów 
i teorii.  Był  to  okres  dominacji  indywidualnych  wyna- 
lazców, którzy  eksploatowali  fizykę  w sposób  „cha- 
łupniczy”, polegający  na  wielokrotnych  próbach 
albo  opartych  na  zasadzie  „chybił  trafił”,  albo  na 
tzw.  genialnych  pomysłach  wynalazczych,  albo  też  na 
dość  nieuchwytnej  i niepowtarzalnej  „technicznej 
smykałce”. 

Rozpoczętą  w połowie  XX  w.  rewolucję  naukowo- 
techniczną  charakteryzuje  zerwanie  z poprzednimi, 
„chałupniczymi”  i nienaukowymi  metodami  wyko- 
rzystania fizyki  do  celów  praktycznych.  Współczesna 
fuzja  techniki  z fizyką  polega  więc  na  powszechnym 
stosowaniu  metod  naukowych  w intensywnie  i sys- 
tematycznie prowadzonych  pracach  zespołowych, 
zmierzających  do  optymalnego  wykorzystania  pozna- 
nych przez  nauki  fizyczne  zjawisk  i praw  natury. 

Dopiero  bardzo  niedawno  zdano  sobie  sprawę,  że 
do  praktycznego  wykorzystania  nadaje  się  nie  tylko 
produkt  końcowy  pracy  fizyków,  którym  jest  gotowa 
wiedza  naukowa,  lecz  także  stosowana  przez  fizyków 
metoda  naukowa,  styl  myślenia  i działania.  Fizyka 
bowiem  nie  tylko  zaspokaja  nasz  głód  poznania  i na- 
turalną ciekawość  świata,  jest  nie  tylko  przebogatą 
skarbnicą  aparatów,  materiałów,  zjawisk,  praw 
i teorii  tworzących  szeroką  bazę  techniki,  fizyka 
stworzyła  również  nowy  styl  myślenia  i wszelkiego 
działania  opartego  na  racjonalno-empirycznej,  ścisłej 
metodzie  naukowej.  Okazuje  się,  że  metody  opraco- 
wane pierwotnie  w badaniach  naukowych  do  celów 
czysto  poznawczych  można  zaadaptować  w coraz 
szerszym  zakresie  do  praktycznego  działania.  Adapta- 
cja ta  zasadza  się  m.in.  na  podobieństwie  struktury 
omówionego  wyżej  cyklu  badawczego  i typowego 
cyklu  planowego  działania  praktycznego,  który  się 
składa  z następujących  elementów:  stan  początkowy, 
zadanie,  plan,  realizacja  planu,  analiza  planu  i jego 
realizacji  (ewentualność  zmian  i korekt),  stan  końco- 
wy. Uruchomienie  skutecznie  działających  sprzężeń 
zwrotnych  między  zadaniem  a planem  i jego  realizacją, 
na  wzór  sprzężenia  między  problemem,  hipotezą 
i testami  empirycznymi,  jest  dziś  jednym  z podsta- 
wowych problemów  rewolucji  naukowo-technicznej. 

Podstawą  i warunkiem  skuteczności  wszelkiej 
działalności  praktycznej  jest  umiejętność  trafnego 
przewidywania  przebiegu  ważnych  dla  praktyki 
procesów  oraz  rezultatów  ludzkiego  działania.  Dobrze 
uzasadnione  podstawy  maksymalnie  trafnego  prze- 
widywania daje  dziś  tylko  nauka.  W skomplikowanym 
i szybko  zmieniającym  się  świecie  dawne  źródła 
umiejętności  przewidywania,  a mianowicie  doświad- 
czenie życiowe,  praktyka,  tradycja  i historia,  są  dziś 
wysoce  niewystarczające. 

Ogromna  rola  fizyki  w tworzeniu  kultury  material- 
nej jest  — mimo  wszelkie  nieporozumienia  i wypacze- 
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wkład  fizyki  nia  — znacznie  lepiej  znana  i utrwalona  w świado- 
do  kultury  mości  społecznej  niż  znaczenie  fizyki  dla  kultury 
umysłowej  duchowej  (zwanej  też  często  kulturą  właściwą), 
a ściślej  — kultury  umysłowej. 

Fizyka  odgrywa  ogromną  rolę  kulturotwórczą; 
niestety,  na  ogół  nie  docenianą.  Fizyka  stworzyła 
przede  wszystkim  nowy,  niezależny  od  religii  i magii, 
naukowy  obraz  całej  przyrody  nieożywionej.  Wpraw- 
dzie fizyczny,  materialistyczny  obraz  świata  nie  jest 
ani  absolutnie  dokładny,  ani  ostateczny,  ale  jest 
z pewnością  dokładniejszy  i bliższy  rzeczywistości 
od  wszelkich  obrazów  nienaukowych.  Obraz  ten  jest 
nie  tylko  sprawdzalny,  ale  także  ustawicznie  roz- 
szerzany, pogłębiany  i korygowany.  Ten  niepełny, 
ale  ciągle  doskonalony  obraz  świata  urzeka  już  dziś 
swoją  prostotą  Jednolitością  oraz  jasnością  i komuni- 
katywnością. 

Wiele  elementów  fizycznego  obrazu  świata  weszło 
już  do  kultury  ogólnej  szerokich  rzesz  społeczeństwa. 
Pojęcia  cząstki  elementarnej,  atomu,  molekuły,  jądra, 
masy,  prędkości,  przyspieszenia,  siły,  prądu  elektrycz- 
nego, pól  elektrycznych  i magnetycznych,  fal,  praw 
ruchu,  prawa  powszechnego  ciążenia,  układu  helio- 
centrycznego  itp.  są  powszechnie  używane  i rozumiane 
(choć  nie  zawsze  całkiem  poprawnie)  przez  większość 
ludzi  nie  tylko  ze  średnim  lub  wyższym  wykształce- 
niem, lecz  nawet  przez  ludzi  o wykształceniu  podsta- 
wowym. Język  pojęć  fizyki  i ilościowy,  racjonalno- 
empiryczny  styl  myślenia  fizyków  stał  się  w znacznym 
stopniu  dobrem  powszechnym,  wszedł  do  języka 
ogólnego,  jest  używany  potocznie,  w prasie,  w ra- 
dio i telewizji,  a nawet  w ...  poetyckich  porówna- 
niach. 

Dobrze  sprawdzony  i sprawdzalny,  obiektywny 
obraz  całego  świata,  materialnego  oraz  naukowy  styl 
myślenia  są  niezwykle  cennymi  dobrami  kulturalnymi, 
które  fizyka  oferuje  społeczeństwu.  Już  w XVIII  w. 
powstanie  mechaniki  Newtona,  tłumaczącej  w jedno- 
lity sposób  ruchy  planet  i ciał  na  Ziemi,  stało  się 
przedmiotem  powszechnego  zainteresowania  ludzi 
wykształconych  w kulturalnie  zaawansowanych  kra- 
jach. Fizyka  Newtona  stała  się  źródłem  inspiracji  dla 
filozofów  i działaczy,  przyczyniła  się  walnie  do  po- 
wstania ważnego  prądu  umysłowego,  zwanego  oświe- 
ceniem. Dzisiaj  bezpośrednie  oddziaływanie  fizyki 
na  kulturę  umysłową  jest  jeszcze  większe,  choć  brak 
perspektywy  czasu  utrudnia  nam  często  wykrycie 
głównych  nurtów  i kierunków. 

Podobnie  jak  oddziaływanie  fizyki  na  produkcję 
i konsumpcję  dóbr  materialnych  odbywa  się  za  po- 
średnictwem techniki,  tak  też  część  oddziaływania 
fizyki  na  kulturę  właściwą  odbywa  się  za  pośrednic- 
twem literatury  i sztuki.  Do  literatury  zaczęła  wcho- 
dzić fizyka  i inne  nauki  przyrodnicze  już  w 2 połowie 
XIX  w.  Odkrycia  naukowe  i oparte  na  nich  wyna- 
lazki i pomysły  techniczne  pobudzały  fantazję  pisarzy, 
fizyka  Rozpoczął  się  trwający  do  dziś  bujny  rozwój  litera- 
a literatura  tury  fantastyczno-naukowej  oraz  powieści  przy- 
godowej i detektywistycznej,  zawierającej  dużo 
informacji  i pomysłów  z zakresu  fizyki  tudzież  innych 
nauk  przyrodniczych  oraz  techniki.  Wiek  XX  przy- 
niósł znaczne  pogłębienie  tego  kierunku,  który  znajdu- 
je wyraz  także  w rozkwicie  tzw.  literatury  faktu. 
W społeczeństwach  XX  w.  wystąpił  bowiem  stymu- 
lowany przez  naukę  głód  szeroko  pojętej  wiedzy, 
opartej  nie  na  dyletanckich  obserwacjach  oraz  oso- 
bistych, subiektywnych  przeżyciach  pisarzy  z bożej 
łaski,  lecz  na  rzetelnych,  naukowo  stwierdzonych 
faktach.  Coraz  częściej  bestsellerem  staje  się  w na- 


szym wieku  nie  powieść,  lecz  pamiętnik  interesującej 
osoby,  zbiór  reportaży,  esejów,  rozpraw  czy  książka 
popularnonaukowa  z zakresu  archeologii,  historii, 
psychologii,  biologii,  socjologii,  medycyny,  chemii, 
fizyki,  astronomii,  a nawet  matematyki.  Ba,  niejedno- 
krotnie bestsellerami  stają  się  ładnie  napisane  książki 

0 wyraźnie  naukowym  charakterze. 

Tworzenie  dobrych  dzieł  literatury  faktu  jest  trud- 
niejsze niż  tworzenie  dobrych  fikcji  powieściowych. 
Oprócz  piękna  języka,  polotu  i fantazji  wymaga 
się  dobrego  przygotowania  fachowego,  znajomości 

1 dobrego  zrozumienia  przedstawionych  zjawisk,  kon- 
cepcji i teorii,  zdolności  syntetycznego  widzenia  oraz 
daru  prostego  wyjaśniania  spraw  nader  skompli- 
kowanych. Połączenie  piękna  słowa  i formy  pisar- 
skiej z głęboką,  konkretną,  a przecież  fascynującą 
treścią,  opartą  na  faktach  dostarczanych  przez  naukę 
i praktykę,  wydaje  się  realistycznym  i pociągającym 
programem  rozwoju  literatury. 

Jeszcze  większy  i łatwiejszy  do  prześledzenia  jest 
wpływ  fizyki  na  kulturę  artystyczną.  Na  bazie  fizyki 
i chemii  powstały  i nadal  powstają  nowe  dziedziny 
twórczości  artystycznej,  których  w ogóle  nie  było 
200,  100  czy  nawet  50  lat  temu.  Jako  najważniejsze 
przykłady  można  tu  podać  fotografię,  kino,  radio, 
telewizję  i rodzącą  się  dopiero  sztukę  holografii. 
Są  to  uznane  dziś,  nowe  dziedziny  twórczości,  które 
pozornie  wypierają  stare  — w rodzaju  malarstwa, 
muzyki,  śpiewu,  tańca  i teatru  — ale  w gruncie  rzeczy 
przyczyniają  się  do  niebywałego  ich  upowszechniania. 

Również  muzyka  i sztuki  plastyczne  zmieniają  się 
bardzo  dzięki  zastosowaniu  opartych  na  fizyce  i chemii 
nowych  technik  i nowych  materiałów.  Wystarczy 
przypomnieć  zastosowanie  elektroniki  i akustyki 
w muzyce  albo  rolę  nowych  materiałów  w architek- 
turze. . . 

Należy  też  podkreślić,  że  fizyka  i chemia  stworzyły 
iczne  możliwości  wiernego  zapisu,  utrwalenia,  prze- 
syłania i dowolnie  częstej,  wiernej  reprodukcji  nie- 
trwałych dóbr  kultury.  To,  co  dawniej  ginęło  bez- 
powrotnie, możemy  teraz  utrwalić  i powtórzyć 
w dowolnym  czasie.  Na  fotografii,  filmie,  płycie  gra- 
mofonowej lub  taśmie  magnetycznej  możemy  utrwa- 
lić dowolny  występ  muzyczny,  taneczny,  teatralny 
lub  wokalny  i odtworzyć  kiedy  mamy  tylko  czas 
i ochotę.  Możemy  w krótkim  czasie  porównać  wyko- 
nanie tego  samego  utworu  przez  różne,  może  nie 
istniejące  już  zespoły,  możemy  oglądać  i słuchać 
zmarłych  już  wykonawców,  brać  niemal  bezpośredni 
udział  w minionych  lub  geograficznie  odległych, 
a ważnych  i ciekawych  zdarzeniach  kulturalnych 
i politycznych.  Czy  nie  jest  to  wspaniale  rozszerzenie 
i wzbogacenie  możliwości  kulturalnych  każdego 
człowieka?  Czy  nasi  dziadowie  mieli  takie  możliwo- 


Nauka  jest  dziś  nie  tylko  ważną  częścią  kultury 
ogólnej,  nie  tylko  oddziałuje  coraz  silniej  na  wszy- 
stkie niemal  formy  kultury  materialnej  i duchowej, 
ale  staje  się  w naszych  oczach  główTią,  dominującą 
siłą  kulturotwórczą,  wyznaczającą  kierunki  rozwoju 
kulturalnego  oraz  inspirującą  powstawanie  nowych 
prądów  umysłowych  i nowych  form  działalności 
kulturalnej.  Przodującą  rolę  odgrywa  w tym  procesie 
fizyka,  jako  najbardziej  podstawowa  nauka  przyrod- 
nicza i baza  nowoczesnej  techniki. 

M Bunge  Foundalions  of  Physics,  Berlin  1967;  L.N.  Cooper 
Istota  i struktura  fizyki , Warszawa  1975;  A.  Einstein  i L.  Infeld 
Ewolucja  fizyki.  Warszawa  1959;  R.P.  Feynman  i >n.  Feynmana 
wykłady  z fizyki  t.  1-3,  Warszawa  1972-74;  J.  Werle  Rozwoj 
i perspektywy  fizyki , Warszawa  1969. 
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O niektórych  podstawowych  pojęciach 

fizycznych 


Andrzej  Staruszkiewicz 

Fizyka  klasyczna 

Terminem  „fizyka  klasyczna”  określa  się  zespół  pojęć 
i praw  ruchu  uważanych  za  prawdziwe  od  połowy 
XVII  do  końca  XIX  w.  Za  początek  fizyki  klasycznej 
należy  uważać  rozpoznanie  przez  fizyków  XVII  w., 
I prawo  zwłaszcza  I.  Newtona,  prawdziwości  prawa  ruchu 
Newtona  nazwanego  później  pierwszym  prawem  Newtona: 
ciało,  na  które  nie  działa  żadna  siła,  pozostaje  w spo- 
czynku lub  porusza  się  ruchem  jednostajnym  i pro- 
stoliniowym. Twierdzenie  to  nie  jest  ani  oczywiste, 
ani  nawet  zrozumiałe  bez  dalszych  wyjaśnień. 

Człowiek  płynący  statkiem  porusza  się  względem 
przedmiotów  na  brzegu,  lecz  pozostaje  w spoczynku 
względem  statku.  O jakim  więc  ruchu  i jakim  spo- 
czynku mówi  pierwsze  prawo?  Jak  można  stwierdzić, 
że  na  ciało  nie  działa  żadna  siła?  Jeszcze  w drugiej 
połowie  XIX  w.  Ernst  Mach  uznał,  że  pytania  te  pod- 
ważają cały  gmach  mechaniki  klasycznej;  krytyka 
Macha  wywarła  pewien  wpływ  na  Alberta  Einsteina  — 
twórcę  szczególnej  i ogólnej  teorii  względności. 

Newton  rozumiał  pierwsze  prawo  w sposób,  który 
być  może — jak  utrzymywali  krytycy  od  G.W.  Leib- 
niza do  Macha — jest  filozoficznie  niedorzeczny,  lecz 
za  to  trafnie  ujmuje  fizyczną  istotę  zagadnienia: 
gdyby  usunąć  wszystkie  rzeczy  wypełniające  prze- 
strzeń, tak  jak  usuwa  się  płyn  z naczynia,  to  po- 
zostałby pusty  pojemnik  przedmiotów  materialnych  — 
przestrzeń  Euklidesowa;  gdyby  następnie  do  prze- 
strzeni tej  wprowadzić  małą  cząstkę  i nadać  jej  pręd- 
kość, to  kolejne  położenia  cząstki  ułożyłyby  się  wzdłuż 
linii  prostej;  gdyby  wreszcie  na  prostej  tej  zaznaczyć 
ciąg  punktów  tak,  by  między  dwoma  sąsiednimi  była 
zawsze  ta  sama  odległość,  to  chwile  przebywania 
cząstki  w tych  punktach  byłyby  oddzielone  jednako- 
wymi odstępami  czasu. 

Krytyka  newtonowskiego  rozumienia  pierwszego 
prawa  jest  łatwa,  lecz  jałowa;  chwalebne  skądinąd 
dążenie  do  ścisłości  logicznej  musi  być  poprzedzone 
wiedzą  o faktach;  w mechanice  klasycznej  podsta- 
wowym faktem  jest  bezwładność  ciał,  z której  zdaje 
sprawę  pierwsze  prawo  ruchu. 

Współcześnie  w celu  jasnego  ujęcia  zasad  mecha- 
niki wprowadzamy  pojęcie  czterowym  i arowej  czaso- 
Czasoprze-  przestrzeni  Galileusza.  Jest  to  zbiór  wszystkich 
strzeń  zdarzeń,  tj.  procesów  fizycznych  zachodzących  w ściś- 
Galileusza  !e  określonym  miejscu  i ściśle  określonym  czasie, 


jak  np.  zderzenie  dwu  nieskończenie  małych  cząstek. 

Za  zdarzenie  uważamy  przy  tym  nie  sam  proces 
fizyczny,  lecz  wyłącznie  jego  miejsce  w czasie  i prze- 
strzeni. G.W.  Leibniz  uważał  taką  abstrakcję  za  nie- 
dopuszczalną i na  tej  zasadzie  odrzucał  mechanikę 
Newtona.  Czasoprzestrzeń  Galileusza  ma  określoną 
strukturę  afiniczną  i metryczną.  Struktura  afiniczna 
polega  na  tym,  że  można  wyróżnić  pewne  linie  jako 
linie  proste  i pewne  pary  prostych  jako  proste  równo- 
ległe. Struktura  metryczna  polega  na  tym,  że  istnieje  hiperpłasz- 
wyróżniona  rodzina  równoległych  hiperpłaszczyzn,  czyzny  rów- 
zwanych  hiperpłaszczyznami  równoczesności.  Każda  noczesności 
z nich  jest  trójwymiarową  przestrzenią  Euklidesową. 

Nadto  z każdą  parą  hiperpłaszczyzn  równoczesności, 
np.  z hiperpłaszczyznami  1 i 2,  związana  jest  liczba 
Aa — upływ  czasu  newtonowskiego  między  l i 2; 
dla  trzech  hiperpłaszczyzn  7,  2,  3,  /13  = *i2+/23- 
Mówimy,  że  współrzędne  czasoprzestrzenne  t , 

■xu  x2,  *3  są  dostosowane  do  struktury  czasoprze- 
strzeni Galileusza,  jeżeli  hiperpłaszczyzny  równocze- 
sności dane  są  równaniem  t = const,  jeżeli  upływ 
czasu  newtonowskiego  między  dwiema  takimi  hi- 
perpłaszczyznami jest  równy  różnicy  współrzędnej  t 
i jeżeli  kwadrat  odległości  dwu  równoczesnych  i nie- 
skończenie bliskich  zdarzeń  wynosi  (dxj)Zjr{dxj)2jr 
+(dxzy.  O współrzędnych  czasoprzestrzennych  do- 
stosowanych  mówimy,  że  tworzą  układ  inercjalny.  inercjalny 
Terminu  „układ  inercjalny”  używa  się  w dwu  róż- 
nych znaczeniach.  Oznacza  on  albo  współrzędne  cza- 
soprzestrzenne dostosowane  do  struktury  metrycznej 
czasoprzestrzeni  — rozumie  się  wtedy,  że  współrzędne 
te  pokrywają  całą  czasoprzestrzeń  — albo  niewielkie 
ciało,  np.  laboratorium,  wolne  w dostatecznym  stop- 
niu cd  wpływu  innych  ciał  i nie  wykonujące  ruchu 
obrotowego.  Gdy  mówimy:  równania  Newtona 
przyjmują  najprostszą  postać  w układzie  inercjalnym, 
to  mamy  na  myśli  pierwsze  znaczenie;  gdy  mówimy: 
dla  czasów  rzędu  kilku  sekund  laboratorium  spoczy- 
wające na  Ziemi  może  być  uważane  za  układ  iner- 
cjalny, to  mamy  na  myśli  drugie  znaczenie.  W dal- 
szym ciągu  artykułu  używamy  terminu  „układ  iner- 
cjalny” w obu  znaczeniach. 

Pierwsze  prawo  ruchu  mówi,  że  w układzie  iner- 
cjalnym ruch  cząstki,  na  którą  nie  działają  żadne  siły, 
spełnia  równanie: 

^ = 0,  / = 1, 2,  3. 

<A2 
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Jeżeli  współrzędne  /,  xly  x2y  x3  tworzą  układ  iner- 
cjalny, to  współrzędne: 

/'  = /,  x't  = Xt+Vit 

(gdzie  Vi  są  stałymi)  też  tworzą  układ  inercjalny ; jest  to 
matematyczny  wyraz  zasady  względności  Galileusza, 
która  mówi,  że  przy  pomocy  żadnego  doświadczenia 
mechanicznego  nie  można  odróżnić  spoczynku  od 
ruchu  po  prostej  ze  stałą  prędkością. 

Jak  można  wyznaczyć  hiperpłaszczyzny  równocze- 
sności?  Newton  nie  powiedział  tego  jasno.  Wyzna- 
czenie hiperpłaszczyzn  równoczesności  nabrało  jednak 
wielkiej  wagi  w XVIII  w.  w związku  z rozwojem  żeglu- 
gi; znając  bowiem  hiperpłaszczyzny  równoczesności 
można  z położenia  gwiazd  oznaczyć  długość  geogra- 
ficzną. Parlament  angielski  wyznaczył  nagrodę  za 
opracowanie  metody  oznaczania  długości ; połowę  na- 
grody dostał  zegarmistrz  londyński  Harrison,  którego 
zegar  przewieziony  z Londynu  do  Singapuru  i z po- 
wrotem wskazywał  czas  różniący  się  tylko  o kilka  se- 
kund od  czasu  wskazywanego  przez  podobny  zegar 
pozostawiony  w Londynie.  Przyznając  nagrodę  Harri- 
sonowi  parlament  zgodził  się  milcząco  na  następujące 
określenie  równoczesności:  niech  w układzie  iner- 
cjalnym spoczywają  dwa  jednakowe  zegary  spręży- 
nowe wskazujące  ten  sam  czas ; jeżeli  jeden  z nich  prze- 
nieść w inne  miejsce,  to  wskazanie  czasu /przez  zegar 
przeniesiony  pozostanie  zdarzeniem  równoczesnym 
ze  wskazaniem  czasu  / przez  zegar  pozostawiony 
w spoczynku. 

Określenie  to  nie  ogranicza  ani  drogi  przeniesienia, 
ani  prędkości,  a więc  zakłada,  że  upływ  czasu  newto- 
nowskiego dt  wskazywany  przez  zegar  sprężynowy 
jest  różniczką  zupełną;  rzecz  jasna,  zmiany  prędkości 
przy  przenoszeniu  powinny  być  tak  łagodne,  by  nie 
powstały  uszkodzenia  mechaniczne  zegara.  Powyż- 
szym określeniem  równoczesności  posługujemy  się 
do  dziś  w życiu  codziennym. 

Drugie  prawo  ruchu  Newtona  rozwija  myśl  za- 
wartą w pierwszym : skoro  ciało  oddzielone  zupełnie 
od  innych  porusza  się  ze  stałą  prędkością,  to  każda 
zmiana  prędkości  wywołana  jest  obecnością  innych 
ciał.  Każde  ciało  ma  wg  Newtona  masę  bezwładną, 
która  jest  tym  większa,  im  trudniej  jest  zmienić  jedno- 
stajny i prostoliniowy  ruch  ciała.  Drugie  prawo  we 
współczesnym  ujęciu  mówi,  że  iloczyn  masy  bez- 
władnej i przyspieszenia  równy  jest  w każdej  chwili 
sile  przyłożonej  do  ciała : 

dzxi  . 

* — 1.2,3. 

Sądzi  się  czasem,  że  drugie  prawo  jest  tylko  okre- 
śleniem pojęcia  siły  za  pomocą  czysto  kinematycz- 
nego pojęcia  przyspieszenia.  Newton  i tu  rozumiał 
rzecz  głębiej;  w dziele  Optyka  napisał:  „całe  zadanie 
filozofii  przyrody  polega  na  tym,  by  z obserwowanych 
zjawisk  odczytać  siły,  a następnie  z sił  wyprowadzić 
dalsze  zjawiska”. 

Pięknym  rozwiązaniem  tak  rozumianego  podsta- 
wowego zadania  fizyki  jest  newtonowska  teoria 
grawitacji.  Newton  znał  prawa  ruchu  planet  Keplera. 
Udowodnił,  że  prawa  te  wynikają  z założenia,  że 
między  Słońcem  a planetą  działa  siła  przyciągająca 
odwrotnie  proporcjonalna  do  kwadratu  odległości 
planety  od  Słońca  i skierowana  wzdłuż  prostej  łączą- 
cej oba  ciała.  Na  tej  zasadzie  przyjął,  że  między  każ- 
dymi dwoma  ciałami  we  Wszechświecie  działa  siła 
przyciągająca  proporcjonalna  do  iloczynu  mas, 
odwrotnie  proporcjonalna  do  kwadratu  odległości 
i skierowana  wzdłuż  prostej  łączącej  oba  ciała. 

Masa,  o której  mówi  prawo  grawitacji,  jest  po- 
jęciem różnym  od  pojęcia  masy  bezwładnej,  o której 
mówi  drugie  prawo  ruchu.  Jest  jednak  faktem  do- 
świadczalnym, że  obie  te  masy  są  zawsze  równe. 
Najprostszym  dowodem  tego  jest  ruch  wahadła 
matematycznego,  którego  okres  nie  zależy  od  ma- 
teriału, z którego  wykonano  wahadło.  Równość 
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masy  ciężkiej  i masy  bezwładnej,  będąca  jedynie 
faktem  w teorii  grawitacji  Newtona,  stała  się  dla  Ein- 
steina punktem  wyjścia  do  sformułowania  ogólnej 
teorii  względności.  Odległość  występująca  w prawie 
grawitacji  jest  odległością  wzdłuż  hiperpłaszczyzn 
równoczesności;  stąd  widać,  że  sformułowanie  prawa 
grawitacji  zakłada  opisaną  wcześniej  strukturę 
metryczną  czasoprzestrzeni  Galileusza. 

Prawo  grawitacji  pozwala  przewidzieć  na  drodze 
czysto  dedukcyjnej  zjawiska  nie  objęte  prawami 
Keplera,  np.  perturbacje,  które  do  ruchu  planety 
wprowadza  sąsiedztwo  innej  planety. 

Trzecie  prawo  ruchu  mówi,  że  jeżeli  ciało  A działa 

na  ciało  B siłą  f ab , to  ciało  B działa  na  ciało  A siłą 

— > — ► 

/ba  = — / ab . Status  trzeciego  prawa  jest  wyraźnie 
niższy  niż  status  pierwszego  i drugiego  prawa.  Po 
pierwsze,  np.  dla  układu  ciał  oddziaływających  gra- 
witacyjnie, trzecie  prawo  jest  zawarte  w prawie  gra- 
witacji. Po  drugie,  w szczególnej  teorii  względności, 
która  jest  uogólnieniem  fizyki  klasycznej,  pierwsze 
prawo  pozostaje  bez  zmian,  drugie  wymaga  tylko 
niewielkiej  zmiany,  podczas  gdy  trzecie  może  się 
ostać  tylko  po  znacznych  zmianach  w sposobie  ro- 
zumienia oddziaływań  między  ciałami. 


Szczególna  teoria  względności 

„Szczególna  teoria  względności”  jest  to  wyjątkowo 
niefortunny  termin,  którym  obejmujemy  zespół  pojęć 
i praw  ruchu  uważanych  od  początku  XX  w.  za  do- 
kładniejsze od  praw  fizyki  klasycznej.  Zasady  szcze- 
gólnej teorii  względności  zostały  podane  przez 
Einsteina  w 1905  r.  Einstein  stwierdził,  że  o ile  równo- 
czesność  zdarzeń  nieskończenie  bliskich  jest  koincy- 
dencją przestrzennc-czasową  i może  być  stwierdzona 
przez  prostą  obserwację,  o tyle  równoczesność 
zdarzeń  odległych  nie  jest  czymś  oczywistym.  Einstein 
określił  równoczesność  zdarzeń  odległych  (rys.  1) 
następująco:  jeśli  w układzie  inercjalnym  spoczywa 
zegar  i jeśli  sygnał  świetlny  wysłany  w chwili  tx 
7 miejsca  spoczynku  zegara  i odbity  od  jakiejś  przesz- 
kody powraca  w chwili  /2,  to  odbicie  sygnału  jest 
zdarzeniem  równoczesnym  ze  wskazaniem  przez 
zegar  czasu  1/2(^i  + ^)-  Z określenia  tego  wynika,  że 
zdarzenia  równoczesne  w jednym  układzie  inercjal- 
nym nie  są  na  ogół  równoczesne  w innym  układzie 
inercjalnym.  Istotnie,  niech  prosta  x = 0 na  rys.  2 
przedstawia  zegar  spoczywający,  a prosta  x — vt  — 
zegar  poruszający  się  z prędkością  v ; jeśli  nadto 
łamana  ABC  przedstawia  bieg  światła,  to  w punkcie 
B następuje  odbicie.  W układzie  zegara  spoczywają- 
cego zdarzenie  B jest  równoczesne  ze  zdarzeniem  D 
określonym  równością  AD  — DC,  natomiast  w ukła- 
dzie zegara  poruszającego  się  zdarzenie  B jest  równo- 
czesne ze  zdarzeniem  D ' określonym  równością: 
AD'  = D'C\  gdzie  zdarzenie  C'  jest  odebraniem  przez 
zegar  poruszający  się  sygnału  odbitego. 

Względność  równoczesności  wynikająca  z określe- 
nia Einsteina,  tj.  zależność  równoczesności  od  układu 
inercjalnego,  została  odebrana  przez  współczesnych 
Einsteina  jako  coś  całkowicie  zmieniającego  pojęcie 
czasu;  wrażenie  to  zostało  utrwalone  w niefortunnej 
nazwie  „teoria  względności”.  Obecnie,  z perspektywy 
przeszło  siedemdziesięciu  lat,  uderza  nas  ciągłość 
przejścia  od  fizyki  klasycznej  do  szczególnej  teorii 
względności.  W porównaniu  z teoriami  rzeczywiście 
i głęboko  zmieniającymi  fizyczny  obraz  świata - 
ogólną  teorią  względności  i mechaniką  kwantową  — 
zmiany,  które  wprowadza  do  fizyki  klasycznej  szcze- 
gólna teoria  względności,  są  nieznacznymi  uzupełnie- 
niami tego  samego  w zasadzie  obrazu  rzeczywistości. 

W trzy  lata  po  ukazaniu  się  pracy  Einsteina  H.  Min- 


Rys.  1 . Odbicie  sygnału  jest  zdarzeniem  równoczesnym  ze  wska- 
zaniem czasu  */j  (*x  + f2)  Przez  zegar  spoczywający  w układzie 
inercjalnym 
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kowski  podał  prostą  interpretację  geometryczną 
zasad  szczególnej  teorii  względności.  Interpretacja 
Minkowskiego  jest  tak  przekonywająco  trafna,  że 
współcześnie  za  szczególną  teorię  względności  nie- 
którzy uważają  właśnie  interpretację  Minkowskiego. 

Wróćmy  do  rys.  2;  zdarzenia  leżące  na  prostej 
D'B  są  równoczesne  w układzie  zegara  poruszającego 


się,  podobnie  jak  zdarzenia  na  każdej  prostej  równo- 
ległej do  D'B.  Prosta  równoległa  do  D'B  i przechodzą- 
ca przez  punkt  A jest  więc  w układzie  zegara  poru- 
szającego się  odpowiednikiem  osi  x ; nazwijmy  ją 
osią  x'.  Podobnie  prosta  * = vt  jest  odpowiednikiem 
osi  t\  nazwijmy  ją  osią  t'.  Łatwo  stwierdzić,  że  zda- 
przekształce-  rżenie  o współrzędnych  /,  x ma  w układzie  porusza- 
nie Lorentza  jącym  się  współrzędne: 

t,  _ t — (v/c2)x  ^ _ — vt+x 

~ l/l-^/c2  ’ A ~ yj  1 — t,2/c2  ’ 

gdzie  c jest  prędkością  światła ; związki  te  nazywamy 
przekształceniem  Lorentza.  Otóż: 

(c/T-OO2  = (cty-(x)\ 

czasoprze-  Minkowski  interpretuje  formę  kwadratową  {ety— (*)2 
strzeń  Min-  jako  kwadrat  odległości  zdarzenia  o współrzędnych 
kowskiego  t,  x od  początku  układu,  przekształcenie  Lorentza 
zaś  jako  odpowiednik  obrotu.  Interpretacja  Minkow- 
skiego polega  więc  na  przypisaniu  czasoprzestrzeni 
struktury  metrycznej  różnej  od  struktury  metrycznej 
czasoprzestrzeni  Galileusza.  Strukturę  tę  można 
opisać  następująco:  z każdymi  dwoma  zdarzeniami 
związana  jest  liczba  będąca  czasoprzestrzennym  od- 
powiednikiem kwadratu  odległości  między  dwoma 
punktami  w geometrii  Euklidesowej.  Dla  dwu  nie- 
skończenie bliskich  zdarzeń  liczba  ta  ma  postać: 

ds2  = <?dt2-dx2-dyŁ-dz2y 

gdzie  / jest  czasem  mierzonym  przez  zegar  spoczy- 
wający w wybranym  układzie  inercjalnym,  c — pręd- 
kością światła,  zaś  współrzędne  *,  yy  z mają  to  samo 
znaczenie,  co  w fizyce  klasycznej  (są  to  współrzędne 
kartezjańskie  prostokątne  na  każdej  płaszczyźnie 
równoczesności,  ct  = const);  płaszczyzny  równocze- 
sności  są  zbiorami  zdarzeń  równoczesnych  w wybra- 
nym układzie  inercjalnym.  O ile  jednak  płaszczyzny 
równoczesności  zmieniają  się  wraz  ze  zmianą  układu 
inercjalnego,  o tyle  liczba  (ds)2  dla  dwu  ustalonych 
zdarzeń  ma  tę  samą  wartość  we  wszystkich  układach 
inercjalnych. 

Treść  fizyczną  szczególnej  teorii  względności 
można  ująć  w następującą  zasadę:  wszystkie  prawa 
fizyki  dotyczące  czasu  i przestrzeni  powinny  być 
twierdzeniami  geometrii  metrycznej  Minkowskiego. 

Zbadamy  dokładniej  strukturę  metryczną  czaso- 
przestrzeni Minkowskego.  O współrzędnych  t,  x , y , z 
takich,  że  kwadrat  odległości  dwu  bliskich  zdarzeń 
ma  postać: 

c2dt 2 — dx2 — dy2  — dz2 

mówimy,  że  są  dostosowane  do  struktury  metrycznej 


czasoprzestrzeni;  mówimy  też,  że  tworzą  układ  iner- 
cjalny. Omawiając  czasoprzestrzeń  Galileusza  zwró- 
ciliśmy uwagę  na  owa  różne  znaczenia  terminu  „układ 
inercjalny”.  Pojęcie  układu  inercjalnego  jako  nie- 
wielkiego ciała,  wolnego  w dostatecznym  stopniu 
od  wpływu  innych  ciał  i nie  wykonującego  ruchu 
obrotowego,  przenosi  się  bez  zmiany  do  szczególnej 
teorii  względności;  ulega  natomiast  zmianie  pojęcie 
układu  inercjalnego  jako  układu  współrzędnych 
dostosowanych  do  struktury  metrycznej  czasoprze- 
strzeni, bo  zmienia  się  właśnie  sama  struktura  me- 
tryczna. 

Obierzmy  dowolne  zdarzenie  O jako  początek  ukła- 
du współrzędnych  czasoprzestrzennych.  Kwadrat 
odległości  zdarzenia  X o współrzędnych  /,  x , y,  z 
od  początku  układu: 

s2  = c*t*-x2-y2-z2 

może  być  dodatni,  ujemny  lub  równy  zeru.  Mówimy, 
że  zdarzenia  O,  X tworzą  wektor  czasowy  — gdy  stożek 
s2  > 0,  przestrzenny  — gdy  j2  <0  i zerowy  — gdy  świetlny 
s2  — 0.  Zbiór  wektorów  zerowych  o początku  O two- 
rzy stożek  świetlny  zdarzenia  O.  Stożek  ten  dzieli 
czasoprzestrzeń  na  trzy  rozłączne  podzbiory  (rys.  3): 


Rys.  3.  Stożek  świetlny  zdarzenia  O 

wnętrze  górnej  części  stożka  zwane  przyszłością 
zdarzenia  O,  wnętrze  dolnej  części  stożka  zwane 
przeszłością  zdarzenia  O i zewnętrze  stożka.  Stożki 
światła  każdego  zdarzenia  stanowią  absolutny  ele- 
ment czasoprzestrzeni  Minkowskiego,  podobnie  jak 
hi  per  płaszczyzny  równoczesności  stanowią  absołutny 
element  czasoprzestrzeni  Galileusza. 

Stożek  świetlny  określa  przeszłość  i przyszłość 
jednego  zdarzenia,  a nie  przeszłość  i przyszłość 
w ogóle;  tych  ostatnich  pojęć  nie  da  się  określić 
w czasoprzestrzeni  Minkowskiego.  K.  Godeł,  sławny 
matematyk,  zwraca  uwagę,  że  kryje  się  tu  ciekawa 
filozoficznie  różnica  między  fizyką  klasyczną  a szcze- 
gólną teorią  względności.  Intuicja  nasza  zdaje  się 
dostrzegać  różnicę  w sposobie  istnienia  rzeczy  prze- 
szłych i przyszłych.  Ma  to  dobre  oparcie  w strukturze 
metrycznej  czasoprzestrzeni  Galileusza,  która  jest 
pocięta  płaszczyznami  równoczesności  na  rozłączne 
zbiory  zdarzeń;  o zdarzeniach  leżących  na  jednej  przeszłość 
płaszczyźnie  równoczesności  możemy  powiedzieć,  że  • przyszłość 
współistnieją,  o innych  — że  były  lub  będą.  W cza- 
soprzestrzeni Minkowskiego  nie  da  się  wykonać 
żadnej  takiej  geometrycznie  uzasadnionej  konstrukcji. 

Godeł  wyciąga  stąd  wniosek,  że  wszystkie  zdarzenia 
istnieją  tak  samo,  jedynie  nasza  intuicja,  przestając 
spostrzegać  pewne  z nich,  uznaje  je  za  minione. 

Ciekawe,  czy  przekonanie,  że  świat  „staje  się”,  a nie 
„istnieje  w czasie  i przestrzeni”,  jest  wrodzone 
umysłowi  ludzkiemu,  czy  też  ukształtowało  się  wy- 
raźnie pod  wpływem  fizyki  Newtona. 

Rozważymy  trzy  stereotypowe  poglądy  łączone 
niekiedy  ze  szczególną  teorią  względności. 

„Żaden  sygnał  w przyrodzie  nie  może  mieć  pręd- 
kości większej  niż  prędkość  światła”.  Nie  wykluczone, 
że  zdanie  to  jest  prawdziwe;  nie  jest  ono  jednak  ani 
potrzebne  dla  uzasadnienia  szczególnej  teorii  względ- 
ności ani  z niej  nie  wynika.  Przeciwnie,  w ramach 
szczególnej  teorii  względności  można  łatwo  zbudować 
modele  teoretyczne,  w których  występują  sygnały 
o prędkości  większej  niż  prędkość  światła. 

„Dwa  zdarzenia  tworzące  wektor  przestrzenny  nie 
mogą  być  powiązane  przyczynowo”.  Pojęcie  więzi 
przyczynowej  jest  antropomorfizmem,  któremu  bar- 
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dzo  trudno  nadać  znaczenie  fizyczne.  Jeżeli  za  więź 
przyczynową  uznać  istnienie  zależności  funkcyjnej, 
to  pogląd  ten  nie  jest  na  ogół  prawdziwy.  Twierdzenie 
Gaussa-Ostrogradskiego  mówi  np.,  że  strumień  pola 
elektrycznego  przez  zamkniętą  powierzchnię  jest 
proporcjonalny  do  ładunku  elektrycznego  wewnątrz 
powierzchni,  a więc  ustala  zależność  funkcyjną  między 
zjawiskami  oddzielonymi  przestrzennie  dowolnie 
dużą  odległością. 

„Ciała  nie  mogą  oddziaływać  na  odległość,  lecz 
za  pośrednictwem  pola,  tj.  materii  istniejącej  w prze- 
strzeni między  ciałami  i mogącej  istnieć  także  pod 
nieobecność  samych  ciał”.  Nie  wykluczone,  że  twier- 
dzenie to  jest  prawdziwe,  niemniej  nie  wynika  ono 
ze  szczególnej  teorii  względności.  W ramach  tej  osta- 
tniej można  z powodzeniem  budować  teorie  działa- 
nia na  odległość  na  wzór  newtonowskiej  teorii  gra- 
witacji. 

działanie  z Różnicę  między  działaniem  z bliska,  tj.  przez  okre- 

bliska  i na  ślone  środowisko,  a działaniem  na  odległość,  tj.  przez 
odległość  „próżnię”,  rozumiano  dobrze  już  w XVII  wieku. 

Ch.  Huygens  i G.W.  Leibniz  odrzucali  newtonowską 
teorię  grawitacji  jako  opartą  na  wykluczonym  a priori 
działaniu  na  odległość.  Newton,  zgadzając  się  w za- 
sadzie z krytyką,  rozumiał  jednak,  że  dokładny  opis 
zjawisk  jest  równie  ważny  jak  znajomość  ich  mecha- 
nizmu. Przykład  ten  powinien  być  ostrzeżeniem  przed 
pochopnym  odrzucaniem  działania  na  odległość  jako 
sposobu  opisu. 


Ogólna  teoria  względności 

„Ogólna  teoria  względności”  jest  nazwą  równie  nie- 
fortunną jak  „szczególna  teoria  względności”.  Nazy- 
wamy w ten  sposób  współczesną  teorię  grawitacji  od- 
krytą przez  Einsteina  w latach  1911-16.  Newtonow- 
skie prawo  grawitacji  zakłada  strukturę  metryczną 
czasoprzestrzeni  Galileusza,  a więc  jest  niezgodne  ze 
strukturą  metryczną  czasoprzestrzeni  Minkowskiego. 
Jeżeli  tę  ostatnią  uważamy  za  bliższą  rzeczywistości, 
to  musimy  zmienić  prawo  grawitacji.  Klucz  do  nowej 
teorii  grawitacji  Einstein  widział  w równości  masy 
bezwładnej  i ciężkiej  — fakcie  przypadkowym  w te- 
orii Newtona.  Z faktu  tego  wynika  m.in.,  że  masa  nie- 
wielkiego ciała  poruszającego  się  w polu  grawitacyj- 
nym nie  występuje  w równaniach  Newtona,  tj.  że 
ruch  wszystkich  ciał  w polu  grawitacyjnym  ma  to 
samo  przyspieszenie.  Daleko  idący  wniosek  Einsteina 
polega  na  przyjęciu,  że  skoro  ruch  wszystkich  ciał 
jest  taki  sam,  to  ruch  ten  jest  własnością  czasoprze- 
strzeni, a nie  samych  ciał.  Jest  to  hipoteza  o strukturze 
metrycznej  czasoprzestrzeni,  którą  można  opisać  na- 
stępująco. 

rzeczywista  Rzeczywista  czasoprzestrzeń  ma  się  tak  do  czaso- 
czaso-  przestrzeni  Minkowskiego,  jak  zakrzywiona  powierz- 
przestrzeń  chnia  w trójwymiarowej  przestrzeni  Euklidesa  do 
płaszczyzny:  małe  kawałki  każdej  gładkiej  powierz- 
chni można  uważać  za  kawałki  płaszczyzny ; podobnie 
kawałki  czasoprzestrzeni  dostępne  w doświadczeniu 
są  małe  w skali  kosmosu  i mogą  być  uważane  za  część 
czasoprzestrzeni  Minkowskiego;  większe  części  czaso- 
przestrzeni wykazują  jednak  własności  metryczne 
różne  od  odpowiednio  dużych  części  czasoprzestrzeni 
Minkowskiego. 

Jak  można  znaleźć  rzeczywisty  kształt  czasoprze- 
strzeni? Jest  to  zadanie  technicznie  trudne,  lecz  bardzo 
proste  pojęciowo,  niczym  nie  różniące  się  od  zadania 
znalezienia  np.  kształtu  powierzchni  Ziemi.  Należy 
jedynie  wprowadzić  określenia  i hipotezy  wiążące 
nieznaną  geometrię  ze  zjawiskami  dostępnymi  ob- 
serwacji. 

Kształt  Ziemi  można  znaleźć  umawiając  się,  że 
łańcuch  napięty  między  dwoma  bliskimi  punktami 
powierzchni  Ziemi  tworzy  odcinek  prostej  o długości 
równej  liczbie  ogniw.  Mówimy  tu,  rzecz  jasna,  o po- 
jęciowej zasadzie  mierzenia,  a nie  o rzeczywistych  po- 
miarach, które  znacznie  wygodniej  robić  przy  po- 


mocy teodolitu.  Wykonując  triangulację,  tj.  mierząc 
szereg  stykających  się  bokami  trójkątów,  znajdziemy 
łatwo  odstępstwa  od  hipotezy,  że  badana  powierzch- 
nia jest  płaszczyzną. 

Kształt  czasoprzestrzeni  można  znaleźć  umawiając 
się,  że  zegar  spadający  swobodnie  w polu  grawitacyj- 
nym wskazuje  upływ  czasu  równy  długości  linii  czaso- 
przestrzennej, którą  tworzy  jego  ruch.  Niech  linie  ABy 
AC  i BC  na  rys.  4 przedstawiają  swobodne  spadanie 
trzech  jednakowych  zegarów.  W czasoprzestrzeni 
Minkowskiego,  znając  czas  AB , czas  AC  i prędkość, 
z jaką  zegary  mijają  się  w punkcie  Ay  można  obliczyć 
czas  BCy  podobnie  jak  w geometrii  Euklidesa  oblicza 
się  bok  z dwu  pozostałych  boków  i kąta  między  nimi. 
Jeżeli  czas  BC  okaże  się  różny  od  obliczonego  w ra- 
mach geometrii  Minkowskiego,  to  będzie  to  znaczyć, 
że  obszar  czasoprzestrzeni  zawierający  trójkąt  ABC 
nie  może  być  uważany  za  część  czasoprzestrzeni  Min- 
kowskiego. Przy  pomocy  takiej  triangulacji  czasoprze- 
strzennej można  wyznaczyć  dokładny  kształt  każdej 
części  czasoprzestrzeni. 

Czy  jest  uzasadnione  przyjąć,  że  swobodnie  spada- 
jący zegar  odmierza  czas  równy  długości  linii,  którą 
tworzy  jego  ruch?  Można  by  odpowiedzieć,  że  jest  to 
definicja  długości  krzywej  czasoprzestrzennej,  którą 
przyjmujemy  nie  tłumacząc  jej  racjonalności ; jest  to 
jednak  odpowiedź  niesłuszna.  Prawidłowa  odpowiedź 
brzmi:  intuicja  oparta  na  wiedzy  fizycznej  i matema- 
tycznej każe  nam  przypuszczać,  że  czas  mierzony 
przez  swobodnie  spadający  zegar  jest  istotnie  bardzo 
dobrą  miarą  długości  krzywej  czasoprzestrzennej. 
Samo  pojęcie  długości  jest  w ramach  ogólnej  teorii 
względności  pojęciem  podstawowym;  jest  nam  ono 
znane  przed  każdym  rzeczywistym  pomiarem.  Wyko- 
nując rzeczywiste  pomiary  nie  tylko  nie  uzależniamy 
mierzonych  długości  od  ich  roboczych  definicji,  lecz 
przeciwnie  — przeprowadzamy  analizę  i krytykę 
wyników  opierając  się  na  znajomości  ogólnej  teorii 
względności  i innych  działów  fizyki  jako  hipotez  pod- 
stawowych. 

Krzywizna  czasoprzestrzeni  nie  jest  dowolna,  lecz 
ograniczona  równaniami  Einsteina.  Równania  te 
dopuszczają  szeroki  zbiór  rozwiązań,  a każde  roz- 
wiązanie jest  a priori  dopuszczalną  formą  czasoprze- 
strzeni. Problemy,  które  nastręcza  interpretacja  roz- 
wiązań równań  Einsteina  zobrazujemy  na  dwu  przy- 
kładach. 

Niech  współrzędne  ty  x,  y , z tworzą  układ  inercjalny 
w czasoprzestrzeni  Minkowskiego.  Utożsamiając 
punkty  hiperpłaszczyzny  z = Oz  odpowiednimi  punk- 
tami hiperpłaszczyzny  z = a> 0 otrzymamy  czaso- 
przestrzeń różną  od  czasoprzestrzeni  Minkowskiego, 
lecz  spełniającą  równania  Einsteina  tak  jak  sama  cza- 
soprzestrzeń Minkowskiego.  Można  też  utożsamić 
punkty  hiperpłaszczyzny  / = Oz  odpowiednimi  punk- 
tami hiperpłaszczyzny  / = b> 0;  otrzymamy  czaso- 
przestrzeń o cyklicznym  czasie,  tj.  czasoprzestrzeń, 
w której  wszystkie  zdarzenia  okresowo  się  powtarzają. 
Istnienie  zamkniętych  linii  czasowych  tak  dalece 
komplikuje  i tak  niełatwą  analizę  rozwiązań  równań 
Einsteina,  że  wielu  fizyków  zajmujących  się  tymi  za- 
gadnieniami jest  skłonnych  uznać,  iż  rozwiązania 
z zamkniętymi  liniami  czasowymi  są  a priori  niedo- 
puszczalne. 


Mechanika  kwantowa 

Mechanika  kwantowa  powstała  w latach  1925-2 
w wyniku  długotrwałych  prób  znalezienia  opisu  zja- 
wisk atomowych,  np.  liniowego  widma  emisyjnego 
gazów.  Próby  te  utrwaliły  pogląd,  że  opis  taki  jest 
niemożliwy  w ramach  tradycyjnych  pojęć.  Na  przy- 
kład teoria  Bohra  atomu  wodoru  pozwala  w zasadzie 
prawidłowo  opisać  widmo  atomu  wodoru  zakładając, 
że  w atomie  tym  elektron  krąży  wokół  protonu  tak  jak 
planeta  wokół  Słońca,  lecz  po  niektórych  tylko  orbi- 
tach Keplera,  co  jest  niezrozumiałą  innowacją. 
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Rys.  4.  Linie  AS, 
AC  i BC  przedsta- 
wiają swobodct 
spadanie  trzech  jed- 
nakowych zegaróa 
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Tytuł  pierwszej  z prac  E.  Schródingera:  Kwanto- 
wanie jako  problem  wartości  własnych , dobrze  oddaje 
kierunek  myśli  autora.  Od  dawna,  wiedziano,  że  rów- 
nania różniczkowe  opisujące  ruch  drgający,  np.  rów- 
nanie struny,  mają  przy  pewnych  warunkach  brzego- 
wych rozwiązania  tylko  dla  niektórych  częstości, 
zw.  częstościami  własnymi.  Skoro  atom  wodoru  wy- 
syła promieniowanie  o ściśle  określonych  często- 
ściach, to  widocznie  atom  ten  wykonuje  ruch  drgający, 
a celem  fizyki  jest  znalezienie  równania  opisującego 
ten  ruch. 

Schródinger  podał  równanie,  zwane  od  tego  czasu 
równaniem  Schródingera,  które  pozwala  odtworzyć 
teorię  Bohra  atomu  wodoru  w sposób  matematycznie 
zrozumiały,  tj.  znaleźć  charakterystyczne  dla  tego 
atomu  częstości  mniej  więcej  tak,  jak  znajduje  się 
częstości  drgającej  struny.  Równanie  Schródingera 
dla  atomu  wodoru  jest  równaniem  różniczkowym 
funkcji  falowej  elektronu  \p  (t,  x , y,  z),  gdzie  współ- 
rzędne t,  xy  y , z tworzą  układ  inercjalny  w czasoprze- 
strzenLGalileusza.  Równanie  Schródingera  dla  ato- 
mu helu,  który  zawiera  dwa  elektrony,  jest  równa- 
niem określającym  funkcję  falową  dwu  elektronów 
v(fy  xu  yu  Zj,  a'2,  y2 , z2)  itd.  Jądra  atomowe,  które  są 
znacznie  cięższe  od  elektronów,  uważamy  za  nie- 
ruchome centra  sił,  można  jednak  zbudować  równa- 
nie Shródingera  uważając  jądro  za  ruchomą  część 
atomu.  Jakie  jest  znaczenie  fizyczne  funkcji  falowej? 
Odpowiedź  na  to  pytanie  dał  M.  Born;  ażeby  jednak 
właściwie  ocenić  charakter  tej  odpowiedzi,  rozpatrzy- 
my proste  doświadczenie,  które  w różnych  wersjach 
było  wielokrotnie  wykonywane. 

Elektron  pada  na  płytkę  z dwoma  małymi  otworka- 
mi, przez  które  może  on  przejść  na  drugą  stronę 
(rys.  5);  za  otworkami  jest  klisza  fotograficzna,  która 
rejestruje  każdy  przechodzący  elektron.  Doświadcze- 
nie daje  następujące  wyniki:  miejsca  zaczernione 
przez  elektron  w kolejnych  doświadczeniach  są  różne, 
a różnicy  nie  da  się  powiązać  z jakąkolwiek  niejedno- 
litością stanów  elektronu  poprzedzających  przejście 
przez  otworki;  przy  wielokrotnym  powtarzaniu  do- 
świadczenia liczba  śladów  na  kliszy  układa  się  w ob- 
raz o kilku  maksimach  i minimach,  jak  przy  inter- 
ferencji światła  na  dwu  otworkach. 


kierunek 

padania 

elektronu 


płytka 
z dwoma 
otworkami 


kfisza  z miejscem 
zaczernionym  przez 
jeden  elektron 


Rys.  5.  Przejście  pojedynczego  elektronu  przez  płytkę  z dwoma 
otworami 


Wydaje  się,  że  przed  teorią  można  by  postawić  dwa 
zadania:  przewidzieć,  w którym  miejscu  na  kliszy 
powstanie  zaczernienie  w pojedynczym  doświadcze- 
niu ; wyjaśnić,  skąd  biorą  się  maksima  i minima  przy 
wielokrotnym  powtarzaniu  doświadczenia. 

Interpretacja  Borna  funkcji  falowej  elektronu  daje 
wyczerpującą  odpowiedź  na  drugie  pytanie,  lecz  jed- 
nocześnie wyklucza  danie  odpowiedzi  na  pierwsze 


pytanie.  Mianowicie  liczba  |y  (/,  x , y , z) j2  dxdydz  jest 
wg  Borna  proporcjonalna  do  prawdopodobieństwa 
znalezienia  elektronu  w objętości  dxdydz  w chwili 
/,  jeżeli  poszukiwanie  takie  zostanie  przedsięwzięte. 
Postępowanie  teoretyczne,  które  wraz  z interpretacją 
Borna  doprowadziło  do  odkrycia  ogromnej  liczby 
nowych  faktów,  zobrazujemy  na  przykładzie  opisa- 
nego wyżej  doświadczenia.  Zakładamy,  że  ruch  elek- 
tronu jest  opisany  — cokolwiek  by  to  znaczyło  — 
funkcją  falową  y ( t , x , y , z).  Równanie  Schródingera 
dla  tej  funkcji  rozwiązujemy  przy  warunkach  brzego- 
wych odpowiadających  założonej  nieprzepuszczalności 
płytki,  np.  przyjmując,  że  funkcja  falowa  znika  na 
brzegu  płytki.  Jest  to  postępowanie  od  dawna  znane 
w fizyce  teoretycznej,  identyczne  w istocie  z postępo- 
waniem zastosowanym  przez  A.  J.  Fresnela  w po- 
czątkach XIX  w.  w celu  objaśnienia  ugięcia  światła. 
Wreszcie  przyjmujemy,  że  proces  oddziaływania 
elektronu  z kliszą  można  traktować  jako  lokalizację 
elektronu  w niewielkiej  objętości  i stosujemy  inter- 
pretację Borna,  by  przewidzieć  natężenie  lokalizacji 
przy  wielokrotnym  powtarzaniu  doświadczenia. 


Mechanika  kwantowa  a szczególna  teoria 
względności 

Bohr  i Heisenberg  rozwinęli  i zaostrzyli  interpretację 
probabilistyczną  Borna  do  postaci  zwanej  kopenhaską 
interpretacją  mechaniki  kwantowej.  Wolimy  nie 
wchodzić  w szczegóły  tej  interpretacji,  wydaje  się  nam  interpretacja 
bowiem,  że  interpretacja  kopenhaska  jest  przykładem  mechaniki 
i wynikiem  filozoficznej  emfazy,  której  w fizyce  lepiej  kwantowej 
unikać,  o ile  tylko  jest  to  możliwe.  Nie  zaostrzona 
filozoficznie  interpretacja  Borna  wystarcza  w zupeł- 
ności do  praktycznego  stosowania  mechaniki  kwan- 
towej. 

Einstein  — będący  jednym  z twórców  mechaniki 
kwantowej  — nigdy  nie  przyjął  interpretacji  kopen- 
haskiej, ponieważ  przypuszczał,  że  interpretacja  ko- 
penhaska może  prowadzić  do  istnienia  sygnałów 
o prędkości  większej  niż  prędkość  światła.  Jak  wyja- 
śniliśmy wcześniej,  istnienie  takich  sygnałów  nie  uwa- 
żamy dziś  za  coś  a priori  niemożliwego  lub  sprzecz- 
nego z teorią  względności ; ta  ostatnia  jest  tylko  hipo- 
tezą o strukturze  'metrycznej  czasoprzestrzeni  i nie- 
wiele mówi  o własnościach  materii  wypełniającej  cza- 
soprzestrzeń. 

Nie  wypowiadając  się  w sprawach  niejasnych,  chcie- 
libyśmy podkreślić  jednak  to,  co  jest  jasne  (przynaj- 
mniej dla  nas). 

Spekulacje  filozoficzne  związane  z mechaniką 
kwantową  są  wątpliwej  wartości  przede  wszystkim 
ze  względu  na  prowizoryczny  charakter  samej  me- 
chaniki kwantowej.  Mechanikę  kwantową  należy 
bowiem  uzgodnić  ze  szczególną  teorią  względności. 

Jedyną  współczesną  teorią,  która  jest  syntezą  mecha- 
niki kwantowej  i szczególnej  teorii  względności  jest 
tzw.  elektrodynamika  kwantowa.  Są  trzy  (co  naj-  braki  e*ek- 
mniej)  powody,  by  uważać  elektrodynamikę  kwan-  trodynamiki 
tową  za  teorię  wymagającą  dopracowania.  Po  pierw-  kwantowej 
sze,  w rachunkach  związanych  z tą  teorią  pojawiają 
się  wyrażenia  matematycznie  nieokreślone  (całki 
rozbieżne);  istnieje  wprawdzie  sposób  jednoznaczne- 
go obliczania  tych  wyrażeń,  lecz  sam  fakt  jest  sygna- 
łem trudności  pojęciowych  teorii.  Po  drugie,  zasady 
mechaniki  kwantowej  w zastosowaniu  do  pola  elek- 
tromagnetycznego prowadzą  do  sprzeczności  z rów- 
naniami Maxwella,  które  są  równaniami  ruchu  tego 
pola.  Większość  badaczy  nie  przywiązuje  wagi  do 
tego,  lecz  np.  G.  Kallen,  jeden  z najlepszych  znawców 
elektrodynamiki  kwantowej,  napisał  wyraźnie:  „jest 
to  w najlepszym  wypadku  brak  elegancji  w teorii”. 

Po  trzecie,  w elektrodynamice  kwantowej  występuje 
stała  bezwymiarowa  ftc/e*  = 137,036...,  gdzie  h jest 
stałą  Plancka,  c — prędkością  światła,  a e — ła- 
dunkiem elektronu.  Stała  ta  wg  jednomyślnej  opinii 
wielu  fizyków  powinna  być  obliczona  teoretycznie. 
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lecz  zdaje  się  to  być  niemożliwe  w ramach  elektrody- 
namiki kwantowej. 

Jasne  jest  także,  że  w ostatnich  kilkunastu  latach 
zmieniła  się  wyraźnie  atmosfera  intelektualna  wokół 
zagadnienia  podstaw  mechaniki  kwantowej.  Atmo- 
sferę z końca  lat  trzydziestych  opisuje  L.  Infeld,  któ- 
remu Einstein  powiedział  „tu  w Princeton  uważają 


mnie  za  starego  durnia”;  chodziło  oczywiście  o opo- 
zycję Einsteina  wobec  interpretacji  kopenhaskiej. 
Dziś  nikt  zapewne  nie  pomyślałby  czegoś  takiego. 

E.J.  DiJKSTERHUlS  The  Mechanization  of  the  World  Picture , 
Oxford  1969;  L.  Infeld  Szkice  z przeszłości , Warszawa  1966; 
A.  Trautman  Teoria  względności , Wrocław  1971;  E.T.  Whitta- 
ker  A History  of  the  Theories  of  Acther  and  Electricity , New  York 
1960. 


Zasady  zachowania 

Wojciech  Kopczyński 


Zasady  zachowania  dotyczą  tych  wielkości  * fizycz- 
nych, o których  można  powiedzieć,  że  nie  dają  się 
zniszczyć,  tzn.,  które  podczas  procesów  jakim  pod- 
legają układy  fizyczne  izolowane  od  otoczenia  (zwane 
też  układami  odosobnionymi)  pozostają  niezmienio- 
ne. Zachowanie  wielkości  fizycznych  może  przy  tym 
być  słuszne  bezwzględnie,  lub  też  obowiązywać  jedy- 
nie dla  niektórych  procesów.  Zasady  zachowania 
określają  warunki,  których  spełnienie  zapewnia  sta- 
łość tych  wielkości  fizycznych.  Ich  przegląd  rozpocz- 
nijmy od  zasad  poznanych  najwcześniej. 


Zasady  zachowania  w mechanice 
Newtona 

Pęd  pojedynczej  cząstki  określamy  jako  iloczyn  jej 
masy  przez  prędkość 


p = mv. 

Gdy  na  cząstkę  nie  działa  żadna  siła,  to  z I zasady 
dynamiki  Newtona  wynika,  że  jej  pęd  jest  zachowany, 
zasada  Pęd  układu  fizycznego  złożonego  z n cząstek  jest 
zachowania  sumą  pędów  poszczególnych  cząstek.  Z II  zasady 
pędu  Newtona  wynika,  że  jest  on  stały,  gdy  suma  sił  dzia- 
łających na  cząstki  jest  równa  zeru : 

P1+P2+  •••  ~rPn  — const,  gdy  ...  -\rFn  = 0. 


Załóżmy,  że  wszystkie  siły  działające  w tym  układzie 
są  siłami  wewnętrznymi,  tzn.  Fx  — Fn+Fxz ...  + 

+FlntFz  = F^Ą-F^Ą- ...  +Fzn  itd.,  przy  czym  Fi} 
oznacza  siłę  działającą  na  /-tą  cząstkę  a pochodzącą 
od  cząstki  /-tej.  Przyjmijmy  też,  że  siły  te  spełniają 

III  zasadę  Newtona,  Fy  — —F#.  Wtedy  suma  wszy- 
stkich sił  działających  na  cząstki  będzie  równa  zeru, 

gdyż  siła  F12  odejmie  się  od  siły  F21,  F13  od  F31  itd. 
Zatem,  całkowity  pęd  układu  cząstek  będzie  zacho- 
wany. 

Z zasady  zachowania  pędu  oraz  z zasady  zachowa- 
nia masy  wynika,  że  środek  masy  układu  porusza  się 
ruchem  jednostajnym  i prostoliniowym. 

Moment  pędu  L cząstki  względem  pewnego  punktu 
O określa  się  jako  iloczyn  wektorowy  promienia  wo- 
dzącego cząstki  r,  poprowadzonego  z O,  przez  pęd  tej 
cząstki  p,  L = rXp.  Moment  pędu  spełnia  równanie 


gdzie  Af  = r x F nazywa  się  momentem  siły  F wzglę- 
dem punktu  O.  Siła  F jest  siłą  centralną,  gdy  istnieje 
punkt  O taki,  że  siła  ta  jest  w każdym  punkcie  rów- 
noległa do  promienia  wodzącego  r poprowadzonego 
z tego  punktu  O.  Nazywa  się  on  centrum  siły  F.  Mo- 
ment siły  centralnej  F względem  centrum  znika,  a za- 
tem moment  pędu  względem  tego  punktu  jest  stały: 

L = const,  gdy  F||  r. 


Przedstawiona  powyżej  zasada  zachowania  mo- 
mentu pędu  dla  pojedynczego  punktu  materialnego 
niesie  dwie  informacje.  Po  pierwsze,  wektory  r i v, 
spełniające  związek  r x v — Ljm , muszą  stale  pozosta- 
wać w płaszczyźnie  przechodzącej  przez  centrum 
i prostopadłej  do  wektora  jL,  a zatem  ruch  cząstki 
powinien  się  odbywać  w tej  płaszczyźnie.  Po  drugie, 
prędkość  połowa  cząstki,  wynosząca  L/2/w,  pozostaje 


Rys.  1.  Gdy  moment  pędu  L jest 
stały,  ruch  jest  płaski  i wartość 
prędkości  polowej  dSJdt  jest  stała 
(S  — pole  zakreślone  przez  wek- 
tor wodzący  cząstki) 


stała  (rys.  1).  II  prawo  Keplera  oraz  informacja,  że  tor 
planety  jest  krzywą  płaską  oznaczają  właśnie,  że  mo- 
ment pędu  planety  w ruchu  wokół  Słońca  spełnia  zasa- 
dę zachowania.  Zasada  ta  jest  słuszna  w przybliżeniu, 
gdy  pomijamy  wpływ  innych  ciał  niebieskich  na  ruch 
planety.  W lepszym  przybliżeniu  zachowany  jest  mo- 
ment pędu  całego  Układu  Słonecznego. 

Gdy  mamy  układ  złożony  z dwóch  cząstek,  oddzia- 
ływających między  sobą  siłami  spełniającymi  III  za- 
sadę Newtona,  suma  momentów  sił  działających  na 
te  cząstki  wynosi 


Af  = rx  X Fx+r2  X F2  = (rx—r2)  X Fx. 


Uogólniając  definicję  podaną  dla  pojedynczej  cząstki, 
siłę  Fx  nazwiemy  centralną,  jeśli  jest  ona  równoległa 
do  prostej  łączącej  cząstki.  Jeśli  Fx  jest  centralna,  to 
M = 0,  a więc  całkowity  moment  pędu  układu,  okre- 
ślony jako  suma  momentów  pędu  cząstek,  jest  za- 
chowany, L = Lx+Lz  = const.  Nietrudno  uogólnić 
zasadę  zachowania  momentu  pędu  na  sytuację,  gdy 
układ  składa  się  z rt  cząstek: 


L — JLX -f- L2 -j-  ...  -fLn  = const, 
gdy  Afi  + Afi-h  ...  = 0. 

Podkreślamy,  że  ostatnia  równość  zachodzi  wtedy, 
gdy  siły  pomiędzy  każdą  parą  cząstek  spełniają  za- 
sadę równej  akcji  i reakcji  oraz  skierowane  są  wzdłuż 
prostej  łączącej  cząstki  danej  pary. 

Rozważmy  pojedynczą  cząstkę  poruszającą  się  w 

niezależnym  od  czasu  polu  sił  F(r).  Jednym  z wnio- 
sków z II  zasady  Newtona  jest  stwierdzenie,  że  przy- 
rost energii  kinetycznej  cząstki  jest  równy  wykonanej 
nad  nią  pracy,  tzn. 

j j B 

-2mvB~YmV'A  = / Fdr' 


zasada 

zachowania 

momentu 

pędu 
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Rys.  2.  Gdy  pole 
sil  jest  potencjalne, 
to  praca  wzdłuż 
drogi  1 równa  jest 
pracy  wzdłuż  drogi 
2 


Pole  sił  nazywamy  potencjalnym,  jeżeli  praca  wyko- 
nana nad  cząstką  przy  jej  przesunięciu  z punktu  A 
do  punktu  B nie  zależy  od  wyboru  toru  łączącego  te 
punkty  (rys.  2): 

/ Fd7  = / Fd7 

wzdłuż  1 wzdłuż  2 

Wtedy  możemy  wprowadzić  pojęcie  potencjału  V. 

Potencjał  V{ta)  pola  sił  F(r)  w punkcie  ta  jest  to  pra- 
ca wykonana  przy  przesunięciu  cząstki  od  tego  punk- 
tu do  pewnego  dowolnie  wybranego  punktu  r0,  czyli 

o 

v(7a)  = / Fd7. 

A 


Definicja  ta  ma  sens,  dzięki  założeniu  o potencjal- 
ności  pola  F(r).  Potencjał  V jest  wyznaczony  nieje- 
dnoznacznie; wybierając  inny  punkt  r0,  dodajemy  do 
potencjału  stałą.  Stwierdziwszy  następnie,  że  praca 
wykonana  przy  przesunięciu  cząstki  z punktu  A do  B 
równa  się  różnicy  potencjałów  między  tymi  punktami, 

R 

f Fd7=  v(7a)-v(7b), 

A 

zasada  dochodzimy  do  wniosku,  że  suma  energii  kinetycznej 
zachowania  \ potencjalnej  cząstki  nie  zależy  od  punktu,  w którym 
energii  znajduje  się  cząstka, 

= 2 mv\+V(r*)  = y ™vb  + V(rs), 


a więc  pozostaje  stała  w czasie. 

Ze  sformułowanej  powyżej  zasady  zachowania 
energii  dla  jednego  punktu  materialnego  wynika,  że 
prędkość  punktu  materialnego  o ustalonej  energii 
jest  funkcją  jego  położenia. 

Pojęcie  potencjału  uogólnia  się  na  dwie  lub  więcej 
cząstek.  Jest  on  wówczas  funkcją  położeń  tych  czą- 
stek: rl9  r2 , itd.  Na  przykład,  potencjał  dwóch  ładun- 
ków Qu  Q2  oddziaływających  elektrostatycznie  zależy 

od  ich  wzajemnej  odległości  r = Ir*  — r2\  w następujący 
sposób:  V = —Qi Q2{4k eQr,  gdzie  c0  jest  przenikal- 
nością  elektryczną  próżni.  Prawo  zachowania  energii 
dla  n cząstek  wyraża  się  formułą 

« ^ 

ć = JT*  y nu  v\+  V(ru  r2t ...  ,r„)  = const. 

2 — 1 

Istnieje  wiele  sił  nie  mających  potencjału.  Zalicza 
się  do  nich  wszystkie  siły  zależne  od  prędkości  czą- 
stek. Jednakże  nie  wszystkie  siły  tego  typu  powodu- 
ją niezachowanie  energii.  Przykład:  siła  Lorentza  F — 
— QvxB  działająca  na  ładunek  Q poruszający  się 

w polu  indukcji  magnetycznej  B , jest  prostopadła  do 
kierunku  ruchu  cząstki,  nie  wykonuje  więc  żadnej 
pracy,  a co  za  tym  idzie,  nie  wpływa  na  zmianę  energii 
cząstek. 

Występują  jednak  siły  niepotencjalne  prowadzące 
do  rozpraszania  energii  mechanicznej.  Są  to  przede 
wszystkim  siły  tarcia  i oporu  ośrodka.  Siły  te  są  po- 
chodzenia międzycząsteczkowego,  a więc  mają  na- 
turę. elektromagnetyczną.  A zatem,  w zjawiskach, 
w których  występują  te  siły,  zasada  zachowania  ener- 
gii obowiązuje  na  poziomie  mikroskopowym.  Opór 
ośrodka  powoduje  zamianę  energii  kinetycznej  ciała 
jako  całości  na  energię  kinetyczną  cząsteczek  lub 
na  inne  postacie  energii  wewnętrznej.  Przekonanie 
o niezniszczalności  energii  prowadzi  do  sformuło- 
wania I zasady  termodynamiki.  Zawiera  ona  naj- 
I zasada  ogólniej  wyrażoną  zasadę  zachowania  energii:  ener- 
termo-  gia  układu  odosobnionego  jest  zachowana.  Termody- 
dynamiki  namika  pozwala  przy  tym  teoriom  szczegółowym  na 


dokładne  określenie  tego  czym  jest  energia  różnora- 
kich typów  układów  fizycznych. 

Zasady  zachowania  są  często  pomocne  w rozwią- 
zywaniu równań  ruchu.  Pozwalają  one  zmniejszyć 
liczbę  równań,  a także  zastąpić  niektóre  równania 
różniczkowe  drugiego  rzędu  równaniami  pierwszego 
rzędu.  Oto  dwa  przykłady,  w których  ta  rola  zasad 
zachowania  jest  szczególnie  wyraźna.  Zasada  zacho- 
wania pędu  pozwala  zmniejszyć  liczbę  równań  ruchu 

0 trzy  — dzięki  temu  rozwiązywanie  równań  ruchu 
2 ciał  sprowadza  się  do  badania  ich  ruchu  względne- 
go, a więc  do  rozwiązywania  równań  analogicznych 
do  równań  Newtona  dla  1 ciała.  Rozwiązując  zagad- 
nienie ruchu  cząstki  po  zadanej  krzywej,  możemy 
zastąpić  równanie  Newtona,  będące  równaniem  róż- 
niczkowym drugiego  rzędu,  równaniem  pierwszego 
rzędu,  wyrażającym  zasadę  zachowania  energii. 

Zasady  zachowania  mają  szczególne  znaczenie, 
gdy  nie  znamy  sił  działających  między  cząstkami, 
a także  wtedy,  gdy  siły  działają  przez  krótki  okres, 
a zainteresowani  jesteśmy  zachowaniem  się  układu 
przed  i po  tym  okresie;  tak  jest  np.  podczas  zderzeń 

1 rozpadów  cząstek.  Teoria  tych  zjawisk  opiera  się  nie 
na  równaniach  ruchu,  lecz  wyłącznie  na  prawach  za- 
chowania. Dobitnym  przykładem  takiego  zastosowa- 
nia zasad  zachowania  jest  zasada  działania  silnika 
odrzutowego,  gdy  nie  wnikając  w charakter  oddziały- 
wania pomiędzy  rozpalonymi  gazami  a ściankami  ko- 
mory spalania,  a posługując  się  jedynie  zasadą  zacho- 
wania pędu,  potrafimy  zrozumieć  zjawisko  odrzutu. 


Energia,  pęd  i masa  w fizyce  newtonowskiej 
i w szczególnej  teorii  względności 

W fizyce  nierelatywistycznej,  zasada  zachowania  ma- 
sy jest  konsekwencją  zasady  zachowania  pędu.  Aby 
uzasadnić  to  stwierdzenie,  rozpatrzmy  rozpad  spo- 


m 


Rys.  3.  Rozpad  cząstki  o masie  m wg  mechaniki  Newtona: 
a)  w układzie,  w którym  cząstka  ta  spoczywa,  b)  w układzie  poru- 
szającym się  względem  poprzedniego  z prędkością  V 

czywającej  cząstki  o masie  m na  dwie  cząstki  o masach 
m1  i m2  (rys.  3).  Zgodnie  z zasadą  zachowania  pędu 

0 = m2v2. 

Rozważmy  następnie  ten  sam  proces  w układzie  od- 
niesienia poruszającym  się  ze  stałą  prędkością  — V 
względem  układu  pierwotnego.  Zasada  zachowania 
pędu  w tym  układzie  ma  postać 

mV  = /Wifa-f  V)+m2(v2+  V). 

Z powyższych  równań  wynika  zasada  zachowania 
masy 

m = 

W fizyce  nierelatywistycznej  zasady  zachowania 
masy  i pędu  są  nierozłącznie  związane.  W fizyce  rela- 
tywistycznej podobny  związek,  oparty  na  einsteino- 
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wskim  prawie  dodawania  prędkości,  obowiązuje  dla 
energii  i pędu.  Energię  liczoną  w jednostkach  masy 
nazywamy  masą  relatywistyczną, 

ć 


Wielkość  ta  spełnia  tę  samą  funkcję,  co  masa  niere- 
latywistyczna  w równaniu  wiążącym  pęd  cząstki 
z jej  masą 


Masa  relatywistyczna,  w odróżnieniu  od  masy  nierela- 
tywistycznej,  zależy  od  wyboru  układu  odniesienia. 
Z tego  powodu  bliższa  masie  nierelatywistycznej  jest 
masa  spoczynkowa 

-Vm f 

Z zasad  zachowania  energii  i pędu  wynika,  że  masa 
spoczynkowa  rozpadającej  się  cząstki  jest  większa 
niż  suma  mas  spoczynkowych  cząstek,  na  które  się 
ona  rozpada,  m > mx+m2. 

W fizyce  relatywistycznej  mamy  o jedną  zasadę 
zachowania  (masy)  mniej  niż  w fizyce  newtonowskiej. 
Zasady  zachowania  energii  i pędu  są  w niej  nieroz- 
łączne, toteż  często  nazywa  się  je  zasadami  zachowa- 
nia energii-pędu. 


Zasady  zachowania  w klasycznej 
teorii  pola 


III  zasada  Newtona,  Fu  = — Fjiy  jest  ściśle  związana 
z zasadami  zachowania  pędu  i momentu  pędu  w nie- 
relatywistycznej mechanice.  Zasada  ta  wymaga,  aby 

zmiany,  którym  podlegają  siły  Fij  i Fp , działające 
na  oddalone  od  siebie  cząstki,  zachodziły  równocze- 
śnie. Odrzucenie  przez  teorię  względności  koncepcji 
równoczesności  niezależnej  od  układu  odniesienia, 
pociąga  za  sobą  rezygnację  z III  zasady  Newtona. 
W związku  z tym,  suma  np.  pędów  cząstek  nie  jest 
na  ogół  wielkością  zachowaną. 

W polowym  obrazie  świata  cząstki  nie  oddziałują 
na  siebie  bezpośrednio  — na  odległość.  Oddziaływa- 
nie między  cząstkami  następuje  za  pośrednictwem 
pól  fizycznych.  Typowym  polem  fizycznym  jest  pole 
elektromagnetyczne  opisane  wektorami  natężenia 

pola  elektrycznego  £ i indukcji  magnetycznej  By  bę- 
dącymi funkcjami  czasu  i położenia. 

Podobnie  jak  cząstkom,  polom  fizycznym  można 
przypisać  energię,  pęd  i moment  pędu.  Na  przykład, 
energia  pola  elektromagnetycznego  w próżni  przy- 
padająca na  jednostkę  objętości  wynosi: 


2 ®oJ?2+  2ft„  ***’ 


gdzie  fi0  oznacza  przenikalność  magnetyczną  próżni, 
natomiast  jego  pęd  na  jednostkę  objętości  jest  opi- 
sany wzorem 


p — — 

-y  = e0ExB. 

Moment  pędu  przypadający  na  jednostkę  objętości 
określamy  tak  jak  dla  cząstki.  Dla  układu  izolowa- 
nego, złożonego  z pola  i cząstek,  energia  całkowita, 
będąca  sumą  energii  cząstek  i energii  pola  jest  wiel- 
kością zachowaną.  Podobnie  się  dzieje  dla  pędu  i mo- 
mentu pędu. 

W elektrodynamice  prawa  zachowania  przybierają 
formę  lokalnych  zasad  zachowania.  Lokalna  zasada 
zachowania  np.  energii  podaje,  że  jeśli  pewna  porcja 
energii  pola  znika  z danego  obszaru,  to  dzieje  się  tak 
dlatego,  że  wypływa  ona  przez  granice  tego  obszaru. 
Z lokalnych  zasad  zachowania  wynikają  zasady  za- 


chowania dla  układów  izolowanych  — globalne  za 
sady  zachowania.  Wydaje  się,  że  lokalne  sformułowa- 
nie zasad  zachowania  jest  wręcz  koniecznością  w te- 
orii relatywistycznej.  Energia  nie  może  znikać  w pew- 
nym obszarze  i,  zamiast  wypływać  przez  jego  granice, 
pojawiać  się  jednocześnie  w innym  miejscu,  gdyż  po- 
jęcie jednoczesności  zależy  w teorii  względności  od 
układu  odniesienia.  Gdyby  owa  jednoczesność  za- 
chodziła w pewnym  układzie  odniesienia,  to  w ukła- 
dzie odniesienia  poruszającym  się  względem  niego 
energia  pojawiałaby  się  w innej  chwili,  wcześniej  lub 
później.  A więc  w tym  innym  układzie  energia  cał- 
kowita byłaby  przez  pewien  czas  inna  niż  na  począt- 
ku i na  końcu  tego  energetycznego  hokus-pokus,  co 
jest  nonsensem. 

Dość  niespodziewanie,  teorią,  w której  nie  można 
sformułować  lokalnych  zasad  zachowania  jest  ein- 
steinowska  teoria  grawitacji,  jakkolwiek  globalne 
zasady  zachowania  w tej  teorii  obowiązują.  Nie  znamy 
zadowalających  wyrażeń  na  gęstość  energii  i pędu  pola 
grawitacyjnego,  jakie  istnieją  np.  dla  pola  elektro- 
magnetycznego. 


Zasady  zachowania  a symetria 
praw  fizyki 

Zasady  zachowania  wiążą  się  z symetriami  teorii 
fizycznych.  Związek  ten  dla  teorii  niekwantowych 
jest  opisany  w twierdzeniu  E.  Noether. 

Symetrią  teorii  fizycznej  nazywamy  to  przekształ- 
cenie podstawowych  dla  niej  wielkości  fizycznych 
(jak  położenia  cząstek,  pola  fizyczne  itp.),  które  prze- 
prowadzą rozwiązania  równań  tej  teorii  w inne  ich 
rozwiązania.  Uznaje  się  także,  że  teoria  jest  niezmien- 
nicza względem  przekształceń  będących  symetriami. 
Rozważmy  jednoparametrową  rodzinę  symetrii  (5a). 
Rodzinę  tę  nazywamy  jednoparametrową  grupą  sy- 
metrii, gdy  złożenie  dwóch  symetrii  z tej  rodziny  Sa 
i Sp  jest  symetrią  należącą  do  tej  rodziny  odpowiada- 
jącą parametrowi  a-f/?: 

Sa‘£fi  ==  £<x+P» 

Na  przykład,  złożenie  obrotów  wokół  ustalonej  osi 
o kąty  a i /?  jest  obrotem  o kąt  a-f/?. 

Twierdzenie  Noether  głosi,  że  każdej  jednopara- 
metrowej  grupie  symetrii  teorii  fizycznej  odpowiada 
zasada  zachowania.  Dotyczy  to  m.in.  zasad  zachowa- 
nia energii,  pędu  i momentu  pędu.  Jeśli  przesunięcia 
w czasie  są  symetriami  danej  teorii,  to  w jej  ramach 
obowiązuje  zasada  zachowania  energii.  Jeśli  teoria 
jest  niezmiennicza  względem  przesunięć  w przestrzeni 
w pewnym  kierunku,  to  składowa  pędu  w tym  kie- 
runku jest  zachowana;  zasada  zachowania  wektora 
pędu  obowiązuje  w danej  teorii,  jeśli  przesunięcia 
w przestrzeni  we  wszystkich  kierunkach  są  jej  sy- 
metriami. Obroty  wokół  pewnej  osi  są  związane  przez 
twierdzenie  Noether  ze  składową  momentu  pędu 
skierowaną  wzdłuż  tej  osi;  jeśli  obroty  wokół 
pewnego  punktu  są  symetriami  teorii,  to  wektor 
momentu  pędu  względem  tego  punktu  jest  w niej 
zachowany. 

Spróbujmy  zbadać  sens  niezmienniczości  teorii 
względem  przesunięć  w czasie,  rozważając  ruch  gwiazd 
o masach  mx  i m2  (znajdujących  się  w odległości  r) 
oddziałujących  na  siebie  siłą  grawitacyjną 
m1m2 

F=  c— 4A 

r2 

Wyniki  rozważań  dotyczących  ruchu  tych  gwiazd 
nie  będą  zależeć  od  tego,  czy  ruch  odbywał  się  10  min 
lat  temu,  odbywa  się  obecnie,  czy  też  będzie  się  od- 
bywał za  milion  lat.  Wynika  to  z uniwersalnego  cha- 
rakteru newtonowskiego  prawa  grawitacji.  Przesu- 
nięcia w czasie  są  więc  symetriami  newtonowskiej 
teorii  dwóch  ciał  niebieskich. 

To,  że  niemal  wszystkie  poważniejsze  teorie  fizycz- 
ne są  niezmiennicze  względem  przesunięć  w czasie 
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i przestrzeni  oraz  obrotów,  jest  spowodowane  z jed- 
nej strony  wiarą,  iż  przekształcenia  te  są  symetriami 
realnego  świata,  z drugiej  zaś  tym,  że  nie  znamy 
odstępstw  od  praw  zachowania  energii,  pędu  i mo- 
mentu pędu.  Nie  jest  natomiast  prawdą,  że  byłoby 
niemożliwe  zbudowanie  teorii,  która  nie  byłaby  nie- 
zmiennicza względem  wymienionych  przekształceń. 
Przypuśćmy,  że  astronomowie  śledzący  ruch  planet 
doszli  do  wniosku,  iż  stała  grawitacyjna  G wolno 
zmienia  się  w czasie.  Wówczas  przesunięcia  w czasie 
nie  byłyby  symetriami  mechaniki  ciał  niebieskich, 
a więc  energia  mechaniczna  układu  gwiazd  nie 
zostałaby  zachowana..  Nikt  jednak  nie  mówiłby 
wtedy  o odkryciu  astronomicznego  perpetuum  mo- 
bile. Fizycy  staraliby  się  zbudować  teorię,  w której  G 
byłaby  traktowana  nie  jako  stała,  lecz  jako  pewne 
pole.  Niezmienniczość  tej  teorii  względem  przesunięć 
w czasie  zapewniałaby  zachowanie  całkowitej  energii 
układu,  będącej  sumą  energii  cząstek  i pola  grawita- 
cyjnego, w tym  pola  G.  Warto  nadmienić,  że  istnieje 
teoria  pola  grawitacyjnego  tego  typu,  nie  mająca 
wszakże  potwierdzenia  w obserwacjach  astronomicz- 
nych. 

Przesunięcia  w czasie  i przestrzeni  oraz  obroty 
wchodzą  w skład  zbioru  wszystkich  symetrii  czaso- 
przestrzeni, który  w fizyce  nierelątywistycznej  nazywa 
się  grupą  Galileusza,  a w fizyce  relatywistycznej  grupą 
Poincarego.  Do  grup  tych  zalicza  się  też  transforma- 
cje mieszające  współrzędne  czasowe  i przestrzenne, 
noszące  odpowiednio  nazwy  specjalnych  transforma- 
cji Galileusza,  albo  specjalnych  transformacji  Lo- 
rentza. Niezmienniczość  względem  tych  przekształ- 
ceń oznacza,  że  prawa  fizyki  są  takie  same  dla  dwóch 
obserwatorów,  z których  jeden  porusza  się  względem 
drugiego  ruchem  jednostajnym  i prostoliniowym. 
Symetriom  tym  też  odpowiadają  pewne  zasady  za- 
chowania, są  one  jednak  konsekwencją  zasad  roz- 
ważanych już  poprzednio.  Na  przykład,  w fizyce 
nierelatywistycznej  wynikająca  stąd  zasada  głosi,  że 
prędkość  środka  masy  układu  jest  zachowana,  co  jak 
wiemy,  jest  wnioskiem  wynikającym  z zasady  zacho- 
wania pędu. 

Symetriami  czasoprzestrzeni  są  też  odbicia  w cza- 
sie i inwersje  — inaczej  odbicia  względem  wyróżnio- 
nego punktu.  Niezmienniczość  teorii  względem  in- 
wersji i obrotów  łącznie  jest  równoważna  niezmien- 
niczości  względem  odbić  zwierciadlanych.  Wynika 
to  z tego,  że  inwersję  i obrót  można  otrzymać  jako 
złożenie  odpowiednio  trzech  lub  dwóch  odbić  zwier- 
ciadlanych, natomiast  odbicie  zwierciadlane  można 
otrzymać  jako  złożenia  obrotu  i inwersji.  Dlatego 
niezmienniczość  względem  inwersji  nazywamy  sy- 
metrią zwierciadlaną. 

Symetria  ta  oznacza,  że  wraz  z każdym  procesem 
dozwolonym  w ramach  teorii  jest  też  możliwy  proces 
będący  jego  zwierciadlanym  odbiciem  względem  do- 
wolnej płaszczyzny.  Zjawiskiem,  w którym  symetria 
zwierciadlana  wydaje  się  być  łamana,  jest  odchylenie 
igły  magnetycznej  umieszczonej  równolegle  do  prze- 
wodnika prostoliniowego,  w którym  płynie  prąd. 
Płaszczyzna,  w której  znajdują  się  igła  i przewodnik 
przed  włączeniem  prądu  jest  z makroskopowego 
punktu  widzenia  płaszczyzną  symetrii.  Zatem  fakt, 
że  po  włączeniu  prądu  płaszczyzna  ta  przestaje  być 
płaszczyzną  symetrii  układu,  zdaje  się  świadczyć 
o tym,  że  oddziaływanie  elektromagnetyczne  pomiędzy 
prądem  w przewodniku  a igłą  magnetyczną  nie  jest 
niezmiennicze  względem  odbić  zwierciadlanych.  Aby 
się  przekonać,  że  tak  nie  jest,  należy  wziąć  pod  uwagę 
mikroskopową  budowę  igły  magnetycznej.  Jej  na- 
magnesowanie polega  na  tym,  że  wypadkowa  momen- 
tów pędu  elektronów  jest  skierowana  równolegle  do 
osi  igły  ze  zwrotem  od  bieguna  południowego  do  bie- 
guna północnego.  Mikroskopowy,  wirowy  ruch  elek- 
tronów i jonów  powoduje,  iż  płaszczyzna  przecho- 
dząca przez  oś  igły  nie  jest  jej  płaszczyzną  symetrii. 
Odbicie  zwierciadlane  względem  takiej  płaszczyzny 
polega  na  zamianie  miejscami  biegunów  igły  magne- 


tycznej. Igła  z biegunami  zamienionymi  miejscami 
odchyli  się  po  włączeniu  prądu  w przewodniku  w kie- 
runku przeciwnym  w stosunku  do  igły  w pierwotnym 
położeniu  (rys.  4).  Świadczy  to  o tym,  że  oddziaływa- 
nia elektromagnetyczne  nie  łamią  symetrii  zwiercia- 
dlanej. 


Rys.  4.  Zjawiska  przedstaw  ionc  na  rysunku  są  przed  włączeniem 
prądu  nawzajem  swymi  zwierciadlanymi  odbiciami  względem 
płaszczyzny  przechodzącej  przez  oś  igły  magnetycznej  i przewodnik 

Odbicia  w czasie  są  symetriami  teorii,  jeśli  wraz 
z każdym  procesem  jest  możliwy  w jej  ramach  proces 
zachodzący  w odwrotnej  kolejności.  Na  przykład 
teoria  rzutów  w ziemskim  polu  grawitacyjnym  bez 
uwzględnienia  oporu  powietrza  jest  niezmiennicza 
względem  odbić  w czasie  (rys.  5).  Powszechnie  ob- 


Rys.  5.  Odbicia  w czasie  są  symetriami  teorii  rzutów  w’  polu  siły 
ciężkości  (z  pominięciem  oporu  powietrza).  Ruchy  przedstawione 

na  rysunku  związane  są  zależnością  r2(/)  = ra(— f) 

serwuje  się  istnienie  zjawisk  nieodwracalnych,  jakimi 
są  np.  rzuty  z uwzględnieniem  oporu  powietrza.  Nie- 
odwracalność procesów  makroskopowych  wiążemy 
z dużą  liczbą  obiektów  mikroświata  biorących  w nich 
udział.  Procesy  w mikroświecie  są  natomiast  prawie 
zawsze  odwracalne. 

Odbicia  różnią  się  od  takich  symetrii  czasoprze- 
strzeni jak  przesunięcia  bądź  obroty  tym,  że  nie  są 
sparametryzowane  wielkościami  tego  rodzaju  co  kąt 
obrotu  lub  wektor  przesunięcia,  które  mogą  przy- 
bierać wartości  dowolnie  małe.  Ponieważ  nie  ma  ma- 
łych odbić,  a więc  nie  wchodzą  one  w skład  jednopa- 
rametrowach  grup  symetrii,  nie  można  tu  zatem  za- 
stosować twierdzenia  Noether.  W fizyce  klasycznej 
z odbiciami  nie  wiążą  się  żadne  zasady  zachowania. 


odbicia 
w czasie 
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Zasady  zachowania  w fizyce  kwantowej 


związek  Związek  symetrii  z zasadami  zachowania  tkwi  w sa- 
zasad  mych  podstawach  teorii  kwantowych.  W fizyce  kwan- 
zachowania  towej  stanom  układu  odpowiadają  wektory  w pew- 
z symetriami  nej  abstrakcyjnej  przestrzeni  (przestrzeni  Hilberta), 
natomiast  mierzalnym  wielkościom  fizycznym  takim 
jak  położenie,  pęd  itp.  — operatory,  działające  na  te 
wektory.  Przekształcenia  układu  takie  jak  przesu- 
nięcia, obroty  itp.  są  tu  także  reprezentowane  przez 
operatory.  Wśród  nich  ważną  rolę  odgrywają  opera- 
tory przesunięcia  w czasie  Ht. 

Niech  9?  oznacza  pewien  stan  układu  odosobnio- 
nego, natomiast  S*q>  — stan  układu  po  wykonaniu 
przekształcenia  S*.  Przekształceniem  S * może  być 
np.  obrót  układu  o kąt  a wokół  osi  z (rys.  6).  Po  upły- 
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Rys.  6.  Przemienność  operatorów  obrotu  S * wokół  osi  z z ope- 
ratorami ewolucji  <5«  Ht  =>  Hi  Set)  oznacza,  że  z-owa  składowa 
momentu  pędu  Jz  jest  zachowana 


wie  czasu  t stany  te  przejdą  odpowiednio  w stany 
Ht<p  i HtSa<p.  Jeśli  Sx  jest  symetrią,  to  ten  ostatni  stan 
można  także  otrzymać  w wyniku  działania  S«na  Hty* 
a zatem  HtS*<p  = SxHt<p.  Równość  ta  powinna  za- 
chodzić dla  wszystkich  wektorów  <p,  a więc  warunek 
na  to,  aby  przekształcenie  S * było  symetrią,  możemy 
zapisać  następująco: 

HtSa  = SaHt. 

Operatory  reprezentujące  przekształcenia  układów 
kwantowych  nie  odpowiadają  na  ogół  żadnym  mie- 
rzalnym wielkościom  fizycznym  (wyjątkiem  jest  tu 
operator  inwersji).  Natomiast  z każdą  jednopara- 
metrową  grupą  przekształceń  (Sa)  jest  ściśle  związany 
operator  5 reprezentujący  mierzalną  wielkość  fizycz- 
ną. Operator  ten  jest  proporcjonalny  do  granicy  wy- 
rażenia (Sa  — l)/a  przy  a dążącym  do  0.  Na  przykład, 
z obrotami  wokół  osi  z jest  zw  iązany  operator  z-owej 
składowej  momentu  pędu  /*,  a z przesunięciami  w 
czasie  Ht  — operator  energii  H,  zwany  też  operato- 
rem Hamiltona  itd.  Warunek  przemienności 

HS  = SHt 


oznacza,  że  wielkość  fizyczna  odpowiadająca  ope- 
ratorowi S jest  zachowana. 

W fizyce  kwantowej  wiele  wielkości  fizycznych  może 
przybierać  ściśle  określone,  skwantowane  wartości. 
Do  wielkości  tych  należy  przede  wszystkim  energia 
i moment  pędu,  przy  czym  kwantyzacja  energii  doty- 
czy tylko  układów  związanych,  takich  jak  atomy  i czą- 
steczki, natomiast  kwantyzacja  momentu  pędu  ma 
znaczenie  uniwersalne. 

Moment  pędu  J pojedynczej  cząstki  jest  w mecha- 
nice kwantowej  sumą  orbitalnego  momentu  pędu 

L = r x p i spinu  S : 

7=  l+s. 

Długość  wektora  spinu  |Sj  nie  zależy  przy  tym  ani  od 
stanu  ruchu  cząstki,  ani  od  wyboru  układu  odnie- 
sienia. Wielkość  ta,  podobnie  jak  masa,  charaktery- 
zuje samą  cząstkę. 

Dopuszczalnymi  wartościami  długości  momentu 
pędu  dowolnego  układu  są 

\7\  = , gdzie  / = O,1/*,  1, 3/„  2, ... 

Podobna  reguła  kwantyzacji  dotyczy  spinu  i orbital- 
nego momentu  pędu,  z tą  różnicą,  że  liczba  kwantowa 
orbitalnego  momentu  pędu  może  przybierać  tylko 
wartości  całkowite.  Jeśli  długość  wektora  momentu 

pędu  | J\  jest  zadana,  to  rzut  wektora  J na  wybraną  oś 
— np.  oś  z — może  przybierać  wartości 

Jz  = firn,  gdzie  m = — /,  — y+1, ...,/— l,y. 

Liczba  kwantowa  j całkowitego  momentu  pędu  i licz- 
ba kwantowa  m jego  rzutu  na  oś  z w pełni  charakte- 
ryzują moment  pędu  układu  — układ  kwantowy  nie 
może  mieć  jednocześnie  określonych  wartości  rzutów 
wektora  momentu  pędu  na  dwie  różne  osie,  np.  Jx 
i Jz. 

Duże  znaczenie  w interpretacji  kwantowej  zasady 
zachowania  momentu  pędu  ma  kwantowe  prawo 
dodawania  momentów  pędu.  W fizyce  klasycznej 

moment  pędu  układu  złożonego  J jest  sumą  momen- 
tów pędu  jego  podukładów  / = 7I-fJr2-  W fizyce 
kwantowej  prawo  to  dotyczy  operatorów  momentu 
pędu.  Liczba  kwantowa  m jest  addytywna,  m = 
= m1+m2>  natomiast  liczba  kwantowa  j może  przy- 
bierać następujące  wartości : 

j = l/i— AU  l/i — ...Ji+A. 

Reguła  ta  dotyczy  także  dodawania  orbitalnego  mo- 
mentu pędu  i spinu. 

Klasyczna  zasada  zachowania  orbitalnego  momen- 
tu pędu  L została  w fizyce  kwantowej  uogólniona  na 
zasadę  zachowania  całkowitego  momentu  pędu  J. 

Właśnie  dzięki  uwzględnieniu  spinu  S , zasada  za- 
chowania momentu  pędu  pozostaje  słuszna.  Rozpa- 
trzmy jeden  z wniosków  płynący  z kwantowej  wersji 
tej  zasady.  Ponieważ  liczba  kwantowa  orbitalnego 
momentu  pędu  jest  całkowita,  z reguły  dodawania 
momentów  pędu  wynika,  że  j jest  liczbą  połówkową 
wtedy  i tylko  wtedy,  gdy  układ  zawiera  nieparzystą 
liczbę  cząstek  o spinie  połówkowym,  zwanych  fer- 
mionami. Zatem,  gdy  mamy  układ  izolowany  zło- 
żony z samych  bozonów,  tj.  cząstek  o spinie  całkowi- 
tym, fermiony  mogą  się  w nim  pojawiać  wyłącznie 
parami.  Z tego  samego  powodu  mogą  one  ginąć 
(przekształcać  się  w bozony)  tylko  parami. 


Parzystość 

W fizyce  kwantowej  operatorowi  inwersji  Podpowia- 
da wielkość  fizyczna  — parzystość.  Dwukrotne  pod- 
danie układu  fizycznego  inwersji  daje  układ  wyjścio- 
wy, a zatem  Pz  = 1.  Wynika  z tego,  że  parzystość 
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układów  fizycznych  może  przybierać  tylko  dwie  war- 
tości: + 1 lub  — 1.  Parzystość  jest  wielkością  multi- 
plikatywną,  gdyż  parzystość  układu  złożonego  z nie 
oddziałujących  między  sobą  podukładów  jest  iloczy- 
nem parzystości  podukładów.  Właściwość  ta  w istotny 
sposób  odróżnia  parzystość  od  addytywnych  wielkości 
zachowanych,  takich  jak  energia  lub  ładunek  elek- 
tryczny. Określoną  parzystość  mogą  mieć  tylko  te 
układy,  które  zawierają  parzystą  liczbę  fermionów  — 
pojedynczy  fermion  nie  ma  określonej  parzystości. 


Rys.  7.  Próbka  kobaltu  umieszczona  w silnym  jednorodnym  polu 
magnetycznym  w temperaturze  bliskiej  OK  emituje  prawie  wszy- 
stkie elektrony  na  jedną  stronę  płaszczyzny  P 

W przyrodzie,  jak  się  okazuje,  występują  takie  pro- 
cesy, w których  symetria  zwierciadlana  jest  łamana, 
a w konsekwencji  parzystość  nie  jest  zachowana. 
Należy  do  nich  rozpad  fi.  Łamanie  symetrii  zwiercia- 
dlanej w rozpadzie  fi  jest  widoczne  w doświadczeniu 
pani  C.S.Wu,  którego  koncepcja  jest  przedstawiona 
na  rys.  7.  W środku  przewodnika  kołowego  umiesz- 
czono próbkę  radioaktywnego  kobaltu.  Jądra  kobaltu 
nie  są  początkowo  w żaden  sposób  uporządkowane, 
toteż  elektrony  fi  są  emitowane  równomiernie  we 
wszystkich  kierunkach.  Dopiero  pole  magnetyczne 
wytworzone  przez  prąd  elektryczny  płynący  w koło- 
wym przewodniku  ustawia  momenty  pędów  jąder 
kobaltu,  tak  jak  małe  igły  magnetyczne  — prosto- 
padle do  płaszczyzny  9,  w której  znajduje  się  prze- 
wodnik. Na  podstawie  rys.  4 nietrudno  zauważyć, 
że  odbicie  zwierciadlane  igły  magnetycznej  względem 
płaszczyzny  prostopadłej  do  osi  igły  i przechodzącej 
przez  jej  środek  pozostawia  bieguny  na  swoich  miej- 
scach — jest  więc  ono  symetrią  igły  magnetycznej. 
Zatem  po  uporządkowaniu  jąder  kobaltu  przez  pole 
magnetyczne,  9 pozostaje  płaszczyzną  symetrii  ca- 
łego układu.  To,  że  elektrony  powstałe  w wyniku 
rozpadu  fi  są  emitowane  nierównomiernie  na  obie 
strony  płaszczyzny  9,  łamiąc  w ten  sposób  zwiercia- 
dlaną symetrię  układu  względem  9,  dowodzi,  iż  od- 
działywania słabe  wywołujące  rozpad  fi  nie  są  nie- 
zmiennicze względem  inwersji. 

Próbą  obrony  uniwersalności  symetrii  zwierciadla- 
nej jest  hipoteza,  że  geometryczną  operację  inwersji 
P należy  składać  z operacją  sprzężenia  cząstka-anty- 
cząstka  C,  aby  otrzymać  „fizyczną”  inwersję  CP , 
która  byłaby  symetrią  wszystkich  oddziaływań,  w tym 
oddziaływań  słabych.  „Fizycznym”  zwierciadlanym 
odbiciem  układu  przedstawionego  na  rys.  7 byłby 
wtedy  układ,  w którym  kobalt  byłby  zastąpiony  an- 
tykobaltem,  natomiast  elektrony  płynące  w prze- 
wodniku — pozytonami.  Emisja  pozytonów,  po- 
wstałych w wyniku  rozpadu  antykobaltu  w kierunku 
przeciwnym  niż  zaznaczony  na  rysunku  kierunek  emi- 
sji elektronów  świadczyłaby  o tym,  że  CP  jest  sy- 
metrią oddziaływań  słabych. 


Przekształcenia  C i CP  mają  właściwości  analo- 
giczne do  właściwości  inwersji  i\  toteż  odpowiada- 
jące im  wielkości  fizyczne,  noszące  odpowiednio  na- 
zwy parzystości  ładunkowej  i parzystości  kombino- 
wanej, mają  właściwości  analogiczne  do  właściwości 
parzystości  zwykłej.  Liczne  doświadczenia  przez  długi 
czas  potwierdzały,  iż  CP  jest  uniwersalną  symetrią 
przyrody,  a więc,  że  parzystość  kombinowana  jest 
bezwzględnie  zachowana.  Ponieważ  parzystość  nie 
jest  zachowana  w oddziaływaniach  słabych,  oznacza 
to,  że  w oddziaływaniach  tych  nie  jest  też  zachowana 
parzystość  ładunkowa.  Analiza  rozpadu  mezonów  K 
doprowadziła  jednak  do  stwierdzenia,  że  również 
parzystość  kombinowana  nie  jest,  co  prawda  nie- 
znacznie, zachowana  w oddziaływaniach  słabych. 


Wielkości  zaohowane  typu  ładunku 
elektrycznego 

Zasada  zachowania  ładunku  elektrycznego  jest  naj- 
wcześniej poznaną  zasadą  zachowania  nie  związaną 
z symetriami  czasoprzestrzeni.  Zasada  ta,  inaczej  niż 
zasady  omawiane  poprzednio,  powstała  nie  dzięki 
rozważaniom  teoretycznym,  lecz  została  stwierdzona 
doświadczalnie.  Ładunek  elektryczny  jest  wielkością 
addytywną;  jego  cechą  charakterystyczną  jest  ziarni- 
stość — występuje  on  zawsze  w ilościach  będących 
całkowitą  wielokrotnością  ładunku  elementarnego. 

Zasada  zachowania  ładunku  jest  związana,  za  po- 
mocą twierdzenia  Noether,  z transformacjami  cecho- 
wania. W klasycznej  teorii  pola  cząstki  określonego 
rodzaju  (np.  elektrony)  opisujemy  za  pomocą  pola 

V>i  = 0*  Ich  antycząstki  zaś  (np.  pozytony)  za 

pomocą  pola  y>2  = y>2(x , /).  Pole  y?  = (y>lt  y2)  opi- 
sujące układ  złożony  z cząstek  i ich  antycząstek  mo- 
żemy sobie  wyobrazić  jako  punkt  na  płaszczyźnie 
(rys.  8);  pola  y>x,  *p2  są  przy  tym  odłożone  na  osiach 


Rys.  8.  Transformacja  cechowania 


prostopadłych.  Transformacją  cechowania  (pierw- 
szego rodzaju)  nazywa  się  obrót  o pewien  kąt  a wo- 
kół punktu  przecięcia  tych  osi.  Niezmienniczość  teorii 
względem  wszystkich  transformacji  cechowania  za- 
pewnia zachowanie  ładunku  elektrycznego.  W teorii 
kwantowej,  operator  ładunku  elektrycznego  jest  zwią- 
zany z operatorami  cechowania  — obrotu  w płasz- 
czyźnie par  cząstka-antycząstka  — w podobny  spo- 
sób jak  operator  Jz  z obrotami  w płaszczyźnie  pro- 
stopadłej do  osi  z.  Wynika  z tego,  że  skwantowanie 
ładunku  elektrycznego  jest  analogiczne  do  skwanto- 
wania  z-owej  składowej  momentu  pędu.  Zatem,  po- 
wiązanie zachowania  ładunku  elektrycznego  z trans- 
formacjami cechowania,  tłumaczy  jego  ziarnistość. 

Niezmienniczość  względem  transformacji  cecho- 
wania zależnych  od  punktu  czasoprzestrzeni,  a = 

= a(x,  /),  zwanych  transformacjami  cechowania  dru- 
giego rodzaju,  jest  możliwa  tylko  wtedy,  gdy  uwzględni 
się  oddziaływanie  pola  w z polem  elektromagnetycz- 
nym. Przy  tym  charakter  tego  oddziaływania,  jak 
i niektóre  właściwości  pola  elektromagnetycznego  — 
np.  prawo  indukcji  Faradaya  — są  jej  konsekwencją. 
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Liczbę  barionową  B różną  od  zera  przypisujemy 
tym  cząstkom  elementarnym,  które  są  fermionami 
i oddziaływają  silnie.  Przy  czym  cząstki  o liczbie  ba- 
rionowej  +1,  zwane  barionami,  są  związane  proce- 
sami rozpadu  ze  swym  najlżejszym  reprezentantem  — 
protonem.  Antybariony  mają  liczbę  barionową  — 1. 
Liczba  barionowa  jest  wielkością  addytywną.  Liczba 
barionowa  atomów,  będąca  sumą  liczby  protonów 
i neutronów  zawartych  w ich  jądrach,  pokrywa  się 
zachowanie  z ich  liczbą  masową.  Zasada  zachowania  liczby  ba- 
liczby  rionowej  jest  zatem  uogólnieniem  zasady  zachowania 
barionowej  liczby  masowej,  obowiązującej  w reakcjach  chemicz- 
nych. Liczne  obserwacje  i doświadczenia  doprowa- 
dziły do  przekonania,  że  liczba  barionowa  jest  wiel- 
kością zachowaną  bezwzględnie.  Przemawiają  za  tym 
przede  wszystkim  dwa  następujące  fakty:  po  pierw- 
sze, nie  zaobserwowano  nigdy  żadnego  z ciężkich 
barionów  — neutronu,  hiperonów  A°,  27°,  2T+,  Z1-, 
£°,  £~ y lub  rezonansów  barionowych  — który  nie 
rozpadłby  się  w końcu  na  proton  (albo  związany 
w jądrze  neutron)  i cząstki  lżejsze  mające  liczbę  ba- 
rionową 0.  Po  drugie,  ze  względu  na  obfitość  pro- 
tonów, rozpad  protonu  byłby  zjawiskiem  nietrudnym 
do  zauważenia,  tymczasem  zjawiska  takiego  nigdy 
nie  zaobserwowano. 

Fermiony,  które  nie  biorą  udziału  w oddziaływa- 
niach silnych,  nazywa  się  leptonami  lub  antylepto- 
nami.  Liczbę  leptonową  Z,  = -f 1 mają  leptony: 
elektron  e~ , neutrino  elektronowe  ve,  mion  ju~ 
i neutrino  mionowe  vM.  Ich  antycząstki  mają  liczbę 
zachowanie  leptonową  L = — 1.  Liczba  leptonową  jest  wielko- 
liczby  ścią  addytywną.  Zasada  zachowania  liczby  leptono- 
leptonowej  wej  jest  wynikiem  analizy  reakcji  z udziałem  lepto- 
nów i antyleptonów.  Jak  wiadomo,  fermiony  mogą 
powstawać  i znikać  wyłącznie  parami.  Z zasad  za- 
chowania liczby  barionowej  i liczby  leptonowej  wy- 
nika, że  pary  te  muszą  składać  się  z barionu  i anty- 
barionu,  albo  z leptonu  i anty  leptonu. 

Wspólnymi  cechami  liczby  barionowej,  liczby  lep- 
tonowej i ładunku  elektrycznego  są:  addytywność, 
ziarnistość  oraz  zmiana  znaku  przy  zastąpieniu  czą- 
stki antycząstką.  Dlatego  zasady  zachowania  liczby 
barionowej  i leptonowej  są,  podobnie  jak  zasada  za- 
chowania ładunku,  związane  z transformacjami  ce- 
chowania. Nie  można  ich  jednak  wiązać  z transfor- 
macjami cechowania  drugiego  rodzaju,  gdyż  liczby 
barionowa  i leptonową,  w odróżnieniu  od  ładunku 
elektrycznego,  nie  są  bezpośrednimi  źródłami  pól 
o właściwościach  analogicznych  do  właściwości  pola 
elektromagnetycznego. 


Zachowanie  izospinu 

Przeglądając  tabelę  cząstek  elementarnych  (str.  84), 
widzimy  że  mezony  i bariony,  a więc  cząstki  od- 
działywające silnie,  tworzą  grupy  o bliskich  sobie 
masach  i jednakowych  spinach.  Grupy  te  noszą  naz- 
wę multipletów  izospinowych.  Multiplet  izospinowy 
tworzy  np.  grupa  pionów:  tt“,  n°  i 7i+ ; inny  przykład 
to  multiplet  nukleonów,  złożony  z protonu  p i neu- 
tronu n.  Liczne  dane  doświadczalne  świadczą  o tym, 
że  oddziaływania  silne  cząstek  należących  do  jednego 
multipletu  są  jednakowe.  Uzasadnia  to  formalne 
traktowanie  tych  cząstek  jako  jednej  cząstki  mogącej 
znajdować  się  w różnych  stanach.  Stany  te  numeruje- 
my liczbą  73,  przybierającą  27+1  wartości  (27+1 
jest  więc  liczbą  cząstek  w multiplecie),  7S  = —7, 
— /+1, 7,  dbając  przy  tym  o to,  aby  najmniejsza 
wartość  /3  odpowiadała  cząstce  o najmniejszym  ła- 
dunku. Tak  określone  liczby  kwantowe  1 i /3  mają 
właściwości  analogiczne  do  liczb  kwantowych  całko- 
witego spinu  i jego  trzeciej  składowej.  Z tego  powodu 
nazywa  się  je  odpowiednio  izospinem  i trzecią  skła- 
dową izospinu. 

Okazuje  się,  że  analogia  pomiędzy  izospinem  a spi- 
izospin  a spin  nem  jest  bliższa.  Jeśli  bowiem  umówimy  się,  aby 
obliczać  7 i /3  dla  układów  cząstek  zgodnie  z kwanto- 
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wym  prawem  dodawania  momentów  pędu,  to  izo- 
spin i jego  trzecia  składowa  będą  zachowane  w reak- 
cjach wywoływanych  przez  oddziaływania  silne.  Izo- 
spin jest  zachowany  wyłącznie  w tych  reakcjach,  to- 
też cząstkom  nie  oddziaływającym  silnie  nie  przypi- 
suje się  żadnej  wartości  izospinu.  Zasadę  zachowania 
izospinu  tłumaczymy  niezmienniczością  teorii  silnych 
oddziaływań  względem  obrotów  w abstrakcyjnej, 
trójwymiarowej  przestrzeni,  zwanej  przestrzenią  izo- 
spinową. 


Znaczenie  zasad  zachowania  w fizyce 
cząstek  elementarnych 

Zasady  zachowania  liczby  barionowej,  liczby  lepto-  wykorzysta- 
nowej  i izospinu  powstały  w wyniku  analizy  reakcji  nie  zasad 
pomiędzy  cząstkami  elementarnymi , jako  usankcjono-  zachowania 
wanie  występowania  jednych  a niewystępowania 
innych  reakcji.  Zasady  te  wraz  z zasadami  poznany- 
mi wcześniej  wprowadziły  pewien  porządek  w licz- 
nej rodzinie  cząstek  elementarnych.  Pozwoliły  one 
m.in.  sklasyfikować  cząstki  wg  posiadanych  przez 
nie  liczb  kwantowych.  Zasady  zachowania  zawierają 
też  przepis  na  określanie  liczb  kwantowych  cząstek 
nowo  odkrywanych.  Przypuśćmy  np.,  że  chcemy  okre- 
ślić liczby  kwantowe  rezonansu  /l(1815),  który  ulega 
tzw.  rozpadowi  szybkiemu 

A(m5)-*p+K-. 

Znając  liczbę  barionową,  ładunek  i izospin  protonu: 

B = 1,  Q = e,  I = 1/2,  /3  = — lJ 2 oraz  mezonu  K~  : 

B = 0,  Q = —e,  I = V2,  h = — 7a»  bez  trudu  do- 
chodzimy do  wniosku,  że  /1(1815)  ma  B = 1,  Q = 0, 

7S  = 0.  Izospin  tego  rezonansu,  który  powinien  być 
zachowany  w tym  procesie  wywołanym  przez  od- 
działy wania  silne,  mógłby  przybierać  wartości  7=0 
lub  7=1.  Gdyby  7=1,  rezonans  ten  musiałby  mieć 
dwóch  towarzyszy  o bliskich  masach,  czego  jednak 
nie  zaobserwowano;  a zatem  7=0.  Masę  tego  re- 
zonansu mzz  1815  MeV  można  wyznaczyć,  mierząc 
energię  i pędy  protonu  i mezonu  K~,  a następnie  sto- 
sując zasadę  zachowania  energii-pędu.  Wyznaczenie 
spinu  wymaga  subtelniejszych  metod. 

Związane  z zasadami  zachowania  symetrie  praw  symetria  a 
fizyki  prowadzą  często  do  wniosków  wykraczających  zasady  zacho*  I 
poza  same  zasady  zachowania.  Nie  wszystkie  zresztą  wania 


Zasada  zachowania  i symetrie  w zależności  od  typu 
oddziaływania 
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symetrie  są  związane  z zasadami  zachowania.  Na 
przykład  niezmienniczości  względem  odbicia  w cza- 
sie r,  zapewniającej  odwracalność  zjawisk  na  po- 
ziomie mikroskopowym,  nie  odpowiada  żadna  za- 
sada zachowania.  To  samo  dotyczy  złożenia  inwersji 
kombinowanej  i odbicia  w czasie  CPT.  Wykazano 
teoretycznie,  że  symetria  CPT  powinna  obowiązy- 
wać w każdej  teorii  relatywistycznej.  Symetria  ta 
prowadzi  do  wielu  sprawdzanych  doświadczalnie 
wniosków,  m.in.  zapewnia  ona  równość  mas  cząstki 
i antycząstki. 

Jest  wiele  zasad  zachowania,  które  obowiązują  nie 
przy  wszystkich,  a tylko  przy  niektórych  oddziały- 
waniach. Najwięcej  wielkości  jest  zachowanych  w od- 
działywaniach silnych,  nieco  mniej  w elektromagne- 
tycznych, najmniej  w słabych  (tabela).  A więc,  im 


oddziaływanie  jest  słabsze,  tym  mniej  zasad  zacho- 
wania obowiązuje  w wywoływanych  przez  nie  zjawi- 
skach. Nie  jest  jeszcze  znane  zadowalające  wytłuma- 
czenie tej  prawidłowości.  Nie  wiadomo  także,  czy 
dotyczy  ona  najsłabszego  z oddziaływań,  mianowicie 
grawitacyjnego,  gdyż  nie  zaobserwowano  żadnych 
reakcji  między  cząstkami  elementarnymi,  których  by 
ono  było  przyczyną. 

Badania  teoretyczne  wskazują  jednak  na  to,  że 
w bardzo  silnych  polach  grawitacyjnych,  w pobliżu 
czarnych  dziur,  są  możliwe  procesy  kreacji  cząstek 
łamiące  zasady  zachowania  liczby  barionowej  i liczby 
leptonowej. 

G.  Białkowski,  R.  Sosnov/sxi  Cząstki  elementarne , War- 
szawa 1971;  W.  Rubinowicz,  W.  Królikowski  Mechanika  teo- 
retyczna, Warszawa  1980. 


Termodynamika  fenomenologiczna 

Stanisław  Piasecki 


Przedmiotem  badań  termodynamiki  są  właściwości 
układów  makroskopowych  rozpatrywane  z punktu 
widzenia  ich  zależności  od  temperatury.  Ten  olbrzymi 
dział  fizyki  rozwinął  się  początkowo  jako  teoria  fe- 
nomenologiczna, nie  uwzględniająca  atomowej  (mi- 
kroskopowej) struktury  materii.  Zasady  termodyna- 
miki fenomenologicznej,  sformułowane  w XIX  w., 
przetrwały  po  dzień  dzisiejszy.  Stanowią  one  uogól- 
nienie wyników  niezliczonych  obserwacji  zachowania 
się  makroskopowych  ilości  materii.  Za  typowy  układ 
makroskopowy  można  przyjąć  1 mol  określonej  sub- 
stancji. Zawiera  on  niewyobrażalnie  wielką  liczbę  od- 
powiednich składników  mikroskopowych  (np.  dla 
wody  — cząsteczek  H20,  dla  gazu  elektronowego  — 
elektronów),  równą  liczbie  atomów  tworzących 
0,012  kg  węgla  12C.  Liczba  ta,  zwana  liczbą  Avo- 
gadra,  wynosi  Na  = (6,022 169  ± 0,000040)  • 1 023 
mol-1.  W zależności  od  struktury  układu  rolę  skład- 
ników mikroskopowych  mogą  odgrywać  cząstki  ele- 
mentarne, atomy,  cząsteczki,  jony  itp.  W opisie  ter- 
modynamicznym tak  ogromnych  zbiorowisk  oddzia- 
łujących mikrocząstek  uwzględnia  się  jedynie  te  wła- 
ściwości, które  dają  się  zaobserwować  na  poziomie 
makroskopowym.  Charakteryzują  je  parametry  ma- 
kroskopowe, takie  jak  objętość,  ciśnienie,  tempera- 
tura. Powiązaniem  tych  wielkości  ze  strukturą  mi- 
kroskopową materii  zajmuje  się  termodynamika 
statystyczna  (->  Termodynamika  statystyczna).  Należy 
podkreślić,  że  pojęcia  oraz  prawa  termodynamiki  fe- 
nomenologicznej tworzą  spójną  całość,  dostateczną 
do  rozwiązania  wielu  praktycznych  problemów.  Ten 
klasyczny  dział  fizyki  nadal  się  żywo  rozwija,  obej- 
mując swym  zakresem  coraz  więcej  zjawisk.  Na  przy- 
kład współcześnie  są  podejmowane  próby  zastoso- 
wania pojęć  termodynamicznych  do  opisu  właści- 
wości czarnych  dziur  (-*  Czarne  dziury  i grawitacyjne 
zapadanie).  Odkryto  bowiem  niezmiernie  interesujące 
właściwości  brzegu  czarnej  dziury,  zwanego  horyzon- 
tem zdarzeń.  Okazuje  się,  że  w procesach  pochłania- 
nia materii  lub  promieniowania  pole  powierzchni  ho- 
ryzontu zdarzeń  zawsze  rośnie.  Nasunęło  to  myśl 
o możliwości  interpretowania  go  jako  entropii  czarnej 
dziury  (analogia  z II  zasadą  termodynamiki).  Aby  tę 
tezę  rozwinąć,  należało  jednak  najpierw  zbadać,  czy 
jest  możliwe  występowanie  stanów  równowagi  ter- 
modynamicznej czarnej  dziury  z otoczeniem  (entropię 
definiuje  się  w termodynamice  dla  stanów  równo- 
wagi). Problem  ten  okazał  się  trudny,  gdyż  zgodnie 
z prawami  fizyki  klasycznej  czarna  dziura  może  je- 
dynie pochłaniać  promieniowanie,  jest  zaś  niezdolna 
do  wysyłania  go,  co  wyklucza  równowagę  z otocze- 
niem. Możliwość  emisji  cząstek  przez  czarne  dziury 
została  jednak  udowodniona  przez  S.W.  Hawkinga 
na  podstawie  praw  mechaniki  kwantowej.  W ten 


sposób  zostały  stworzone  podstawy  do  rozwoju  dal- 
szych badań  nad  możliwością  termodynamicznego 
opisu  tych  niezwykłych  układów. 

Innym  przykładem  dynamicznie  rozwijającego  się 
działu  termodynamiki  jest  teoria  przemian  fazowych. 
Dotyczy  ona  wielu  rozmaitych  zjawisk,  takich  jak 
nadciekłość,  nadprzewodnictwo,  zmiany  stanu  sku- 
pienia, zmiany  struktury  krystalicznej,  przejście  od 
stanu  paramagnetycznego  do  ferro-  lub  antyferro- 
magnetycznego i wielu  innych  (— ► Przejścia  fazowe 
i zjawiska  krytyczne).  Wszystkie  one  zależą  w sposób 
istotny  od  temperatury  i stanowią  naturalny  przed- 
miot badań  termodynamiki. 

Stwierdzono  doświadczalnie,  że  układy  makrosko- 
powe izolowane  od  wpływu  otoczenia  osiągają  po 
dostatecznie  długim  czasie  szczególnie  proste  stany, 
w pełni  scharakteryzowane  przez  wartości  niewielkie- 
go zespołu  parametrów  makroskopowych.  Stany  te, 
w razie  braku  jakichkolwiel  systematycznych  zmian, 
nazywa  się  stanami  równowagi  termodynamicznej. 
W opisie  ich  szczególną  rolę  odgrywa  odpowiadająca 
im  energia  układu.  Energię  zgromadzoną  w układzie 
będącym  w stanie  równowagi  nazywa  się  w termody- 
namice energią  wewnętrzną  i oznacza  przez  U . Po- 
nieważ sens  fizyczny  mają  jedynie  różnice  energii, 
określa  się  ją  przyjmując,  że  w wybranym  stanie 
U = 0.  Energia  wewnętrzna  jest  parametrem  eksten- 
sywnym. Oznacza  to,  że  np.  w układzie  złożonym 
z dwu  podukładów  makroskopowych  o energiach  Ui 
i U z całkowita  energia  wewnętrzna  wynosi  U ~ 
— Ux+U2.  Wzór  ten  jest  ścisły,  gdy  nie  ma  oddzia- 
ływania między  podukładami.  Stanowi  on  jednak 
również  bardzo  dobre  przybliżenie  przy  oddziaływa- 
niach krótkozasięgowych.  Energia  oddziaływania  jest 
wówczas  efektem  powierzchniowym,  który  dla  do- 
statecznie dużych  (makroskopowych)  podukładów 
jest  pomijalny.  Przykładami  parametrów  ekstensyw- 
nych są  również  objętość  układu  V i liczby  moli  Nu 
N2,...Nr  tworzących  go  składników.  Jakkolwiek  ter- 
modynamika stosuje  się  do  układów  o złożonych 
właściwościach  mechanicznych,  elektromagnetycznych 
i cieplnych,  jej  istotny  sens  można  wyjaśnić,  rozpa- 
trując tzw.  proste  układy  termodynamiczne.  Z de- 
finicji ich  stany  równowagi  są  całkowicie  określone 
przez  wartości  zespołu  parametrów  (t/,  V,  Nu  ...,  Nr). 
Przykładem  fizycznym  prostego  układu  jednoskład- 
nikowego może  być  wypełniona  N molami  gazu 
szlachetnego  objętość  V.  Stany  równowagi  takiego 
układu  można  przedstawiać  za  pomocą  punktów 
o współrzędnych  ( U , V,  N)  w trójwymiarowej  prze- 
strzeni parametrów  stanu. 

Stan  równowagi  termodynamicznej  ustala  się 
zawsze  w określonych  warunkach  zewnętrznych.  Od- 
działywanie układu  z otoczeniem  charakteryzuje  się 
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przez  wprowadzenie  pojęcia  odpowiednich  ścianek. 
Ściankę,  która  wyklucza  jakąkolwiek  formę  oddzia- 
ływania układu  z otoczeniem,  nazywamy  izolującą. 
Układ  izolowany  jest  oczywiście  daleko  posuniętą 
idealizacją.  Łatwiej  uzyskać  osłonięcie  nie  dopusz- 
czające do  wymiany  cząstek  z otoczeniem,  wówczas 
układ  nazywamy  zamkniętym.  Z kolei  układ  otwarty 
to  taki,  który  może  wymieniać  cząstki  z otoczeniem. 
Osłonięciu  ściankami  adiabatycznymi  towarzyszy 
ograniczenie  wpływu  otoczenia  na  układ  do  możli- 
wości wykonania  nad  nim  pracy  mechanicznej.  Ich 
bardzo  dobrą  przybliżoną  realizacją  są  ścianki  naczy- 
nia Dewara,  np.  w postaci  dwu  posrebrzanych  płytek 
szklanych  przedzielonych  obszarem  wysokiej  próżni 
(rys.  1 , 2).  Z doświadczeń  wiadomo,  że  poza  przepły- 
wem cząstek  i wykonaniem  pracy  mechanicznej  wy- 
stępują jeszcze  inne  formy  oddziaływania  powodu- 
jące wymianę  energii  między  układami  i zmianę  ich 
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Rys.  1 . Naczynie  Dewara  używane  do 
pracy  w niskich  temperaturach.  Na- 
czynia takie  (nazwa  pochodzi  od  naz- 
wiska J.  Dewara,który  pierwszy  skro- 
plił wodór  w 1898  r.)  są  podobne  do 
termosów,  izolują  termicznie  od  oto- 
czenia zawarty  w nich  płyn.  Mogą  być 
wykonane  ze  szkła,  albo  metalu,  np. 
stali  nierdzewnej.  Izolację  stanowi 
próżnia  panująca  wewnątrz  podwójnej 
ścianki.  W szklanych  naczyniach  De- 
wara zwykle  pokrywa  się  wewnętrzne 
powierzchnie  ścianek  odbijającą  war- 
stwą srebra,  aby  zmniejszyć  straty 
ciepła  na  promieniowanie 
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Rys.  2.  Podwójne  naczynie  Dewara  uży- 
wane do  pracy  w temperaturze  rzędu  1 K. 
Wewnętrzne  naczynie  Dewara,  wypełnio- 
ne ciekłym  helem,  jest  zanurzone  — w celu 
zmniejszenia  strat  ciepła  — w drugim  na- 
czyniu Dewara,  wypełnionym  ciekłym 
azotem 
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parametrów  stanu.  Określa  się  je  mianem  oddziały- 
wania termicznego.  Ścianki  dopuszczające  jedynie 
kontakt  termiczny  z otoczeniem  nazywają  się  ścian- 
kami diatermicznymi. 

I zasada  termodynamiki  jest  formułowana  zazwy- 
czaj jako  zasada  zachowania  energii  dla  układów 
osłoniętych  adiabatycznie.  Jej  treść  stanowi  stwier- 
dzenie, że  praca  nad  układem  osłoniętym  adiabatycz- 
nie wykonana  w procesie  przejścia  od  początkowego 
stanu  równowagi  A do  stanu  końcowego  B jest  cał- 
kowicie określona  przez  te  stany,  niezależnie  od 
przebiegu  procesu.  Oznaczając  tę  pracę  symbolem 


Wad  ( A , B)  możemy  napisać,  że 


W&d(AyB)  = U(B)—  U(A), 

przy  czym  z prawej  strony  występuje  różnica  między 
energią  stanu  końcowego  i początkowego.  Jeżeli  pro- 
ces nie  przebiega  adiabatycznie,  to  zasada  zachowa- 
nia energii  dla  układów  zamkniętych  przybiera  po- 
stać * 

U(B)-U(A)=  fV(A,B)+Q(A,B), 

gdzie  Q(A,B)  przedstawia  zmianę  energii  związaną 
z kontaktem  termicznym  układu  z otoczeniem.  Wiel- 
kość Q(A,B),  zwana  ciepłem  przekazanym  układowi 
w procesie  przejścia  ze  stanu  A do  B,  jest  więc  tego 
samego  typu  wielkością  co  praca  mechaniczna.  Mie- 
rzy się  ją  w dżulach.  Zarówno  praca  jak  i ciepło  za- 
leżą nie  tylko  od  stanów  A i B ale  również  od  kon- 
kretnej realizacji  procesu  powodującego  zmianę 
stanu  układu.  Różnią  się  tym  zasadniczo  od  energii 
wewnętrznej  będącej  funkcją  stanu. 

Fakt,  że  jedynie  część  procesów  zgodnych  z zasa- 


dą zachowania  energii  zachodzi  w rzeczywistości, 
ujmuje  precyzyjnie  II  zasada  termodynamiki.  Stwier- 
dza ona,  że  dla  każdego  układu  termodynamicznego 
istnieje  funkcja  stanu  S,  zwana  entropią,  o następu- 
jących właściwościach  : 

— S jest  wielkością  ekstensywną, 

— w procesach  zachodzących  w układach  izolowa- 
nych entropia  nigdy  nie  maleje. 

Jeśli  więc  układ  izolowany  przechodzi  ze  stanu  A do 
By  to  S(B)  ^ S(A).  W nierówności  tej,  wyrażającej 
prawo  wzrostu  entropii,  jest  zawarta  informacja  o nie- 
odwracalnym charakterze  procesów  przebiegających 
w warunkach  izolacji  od  otoczenia  (procesy  samo- 
rzutne). W szczególności  wynika  z niej,  że  spośród 
wszystkich  możliwych  wartości  entropii  w obecności 
ścianek  wewnętrznych  — stanowi  równowagi  bez 
ścianek  odpowiada  wartość  maksymalna  (usunięcie 
ścianki  powoduje  ewentualnie  samorzutny  proces  pro- 
wadzący do  wzrostu  entropii).  Znajomość  zależności 
entropii  od  parametrów  ekstensywnych  charaktery- 
zujących stany  równowagi  oznacza  pełną  informację 
o właściwościach  termodynamicznych  układu. 

Na  przykład  dla  prostego  jednoskładnikowego 
układu  termodynamicznego  (zwanego  płynem  pro- 
stym) entropia  jest  funkcją  trzech  parametrów  S = 
Związek  tego  typu  nazywa  się  równa- 
niem podstawowym.  Dla  rzeczywistych  układów  fi- 
zycznych entropia  jest  funkcją  rosnącą  energii  we- 
wnętrznej. Można  więc  rozpatrywać  równoważne  rów- 
nanie postaci  U — U(S,  Vt  N).  Przy  niewielkich  zmia- 
nach dS,  dVy  dN  parametrów  S,  V,  N zmiana  energii 
wewnętrznej  dU  jest  określona  przez  różniczkę  dU  = 
= (3U/3S)v,n  dS  + (8U/3  V)s,*<tV  + (3U/3N)s  vdN. 

7”  <-dUldS)v.»,  -p  = (3U/dV)s.tf,  n = 

= {dU/dN)stv  nazywane  są  parametrami  intensyw- 
nymi układu.  Charakteryzują  one  układ  lokalnie  i nie 
zależą  od  jego  rozmiarów,  przy  czym  T nazywamy 
temperaturą  termodynamiczną,  p — ciśnieniem,  p — 
potencjałem  chemicznym.  Z definicji  pochodnej  czą- 
stkowej potencjał  chemiczny  obliczamy  ze  wzoru 

ft  = lim*;\r- 


.0  [U(S,  V ; N+dN )-  U(S,  Vy  N)]  /dN. 

Określa  on  szybkość  wzrostu  energii  wewnętrznej 
przy  wzroście  liczby  cząstek  układu  (entropia  i obję- 
tość pozostają  ustalone).  Podobnie  ciśnienie  mierzy 
stosunek  zmian  energii  do  zmian  objętości  (przy  usta- 
lonej entropii  i liczbie  cząstek),  temperatura  zaś 
określa  szybkość  wzrostu  energii  przy  wzroście 
entropii,  gdy  stała  jest  liczba  cząstek  i objętość. 
Znaczenie  fizyczne  parametrów  Ty  p i p można  zrozu- 
mieć lepiej  na  podstawie  II  zasady  termodynamiki. 
Wiąże  się  ono  bezpośrednio  z warunkami  równowagi 
układu. 

Rozważmy  np.  płyn  prosty  z izolującą  ścianką, 
rozdzielającą  go  na  dwa  podukłady  o liczbach  moli 
Ni>  NZy  objętościach  Vly  V2  i energiach  UXy  U2.  Za- 
stąpienie ścianki  izolującej  ścianką  diatermiczną 
wprowadzi  podukłady  w kontakt  termiczny  (rys.  3). 
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Rys.  3.  W układzie  izolowanym  złożonym  z dwu  podukładów 
rozdzielonych  ścianką  izolującą  (stan  A)  po  zastąpieniu  tej  ścianki 
ścianką  diatermiczną  zachodzi  nieodwracalny  proces  przepływu 
energii  w postaci  ciepła  od  podukładu  cieplejszego  do  zimniej- 
szego. Końcowy  podział  energii  między  podukłady  odpowiada 
równości  ich  temperatur  termodynamicznych  (stan  B) 


warunki 

równowagi 

termodyna- 

micznej 


Zgodnie  z zasadą  wzrostu  entropii,  w wyniku  prze- 
pływu ciepła  ustali  się  taki  podział  energii  między 
podukłady,  któremu  odpowiada  wartość  maksymalna 
entropii  całkowitej  przy  ustalonych  parametrach  Nlt 
N2,  Vi,  V2  oraz  U = Ux+  U2.  Ze  wzoru  na  róż- 
niczkę energii  wewnętrznej  wynika,  że  przy  ustalonej 
objętości  i liczbie  cząstek  różniczki  entropii  podukła- 
dów  mają  postać: 

dSx\v\,  ni  = dUJTl9  dS2\v2,N*  = dU2(T2. 

Ponieważ  energia  całkowita  jest  również  stała,  więc 
zmiany  energii  podukładów  muszą  się  wzajemnie 
kompensować,  tzn. 

dU  = dUx+dU2  = 0. 

Dla  entropii  całkowitej,  będącej  sumą  entropii  pod- 
układów, znajdujemy  zatem 

i/(S'1+52)|ri,2Vi,F2,iV2lu-^i+U2  = dUJTx+(—dUi)ITt. 

Warunkiem  koniecznym  osiągania  przez  entropię 
wartości  maksymalnej  jest  znikanie  jej  różniczki. 
Równowaga  termiczna  pociąga  więc  za  sobą  równość 
{\!TX— \!T^)dUx  — 0,  oznaczającą  równość  tempe- 
ratur termodynamicznych  7\  = T2.  W procesie  sa- 
morzutnego wyrównywania  się  temperatur  energia 
w postaci  ciepła  przepływa  od  ciała  o wyższej  tem- 
peraturze (cieplejszego)  do  ciała  o niższej  tempera- 
turze (zimniejszego),  np.  przy  małych  różnicach  tem- 
peratur, zgodnie  z uzyskanym  wzorem,  zmiana 
entropii  wynosi  dS  — (l/Ti— 1 IT^dUx.  Ponieważ 
dS> 0,  więc  jeśli  TX>T2>  to  dUt< 0 (ciało  cieplejsze 
traci  energię).  Definicja  termodynamiczna  jest  zatem 
zgodna  z intuicyjnym  pojęciem  temperatury.  W po- 
dobny sposób  stwierdzamy,  że  dwa  układy,  między 
którymi  jest  możliwy  przepływ  cząstek,  mogą  pozo- 
stawać w równowadze  jedynie  wówczas,  gdy  ich  po- 
tencjały chemiczne  są  równe  fix  = y u2.  Jeżeli  7\  = T2 , 
zaś  materia  przepływa  z obszaru  o potencjale 

fxx  do  obszaru  o potencjale  p2.  W różniczce  dU  wy- 
stępuje też  znany  z mechaniki  parametr  intensywny  — 
ciśnienie  p.  Zasada  wzrostu  entropii  prowadzi  do 
wniosku,  że  warunkiem  równowagi  mechanicznej 
płynu  jest  stałość  ciśnienia  w całej  objętości  V. 
procesy  jj  zasada  termodynamiki  wprowadza  doniosłe  roz- 
odwracalne  różnienie  między  procesami  odwracalnymi  i nieod- 
nieodwra-  wracalnymi.  Procesy  odwracalne  w układach  izolo- 
calne  wanych  to  takie,  w których  układ  przechodzi  przez 


Rys.  4.  Proces  odwracalny  w układzie  izolowanym.  Kwazista- 
tyczna  zmiana  parametrów  ekstensywnych  (Xu  podukła- 

dów powoduje  przejście  złożonego  z nich  układu  izolowanego 
przez  kontinuum  stanów  równowagi  tworzących  krzywą  na 
powierzchni  stałej  entropii 

ciąg  stanów  równowagi  przy  stałej  entropii  całkowi- 
tej. Jest  to  ideał izacja,  którą  jedynie  w przybliżeniu 
można  realizować  doświadczalnie.  Proces  odwracalny 
musi  mieć  kwazistatyczny  przebieg,  tzn.  na  każdym 
jego  etapie  poszczególne  makroskopowe  części  układu 
pozostają  ze  sobą  w równowadze.  W opisie  takiego 
procesu  nie  trzeba  brać  pod  uwagę  czasu,  wystarcza 
podanie  kontinuum  stanów  równowagi,  reprezento- 
wanego przez  krzywą  w przestrzeni  parametrów 


stanu  (rys.  4).  Dzięki  stałości  entropii  proces  może 
przebiegać  w dowolnym  kierunku  (odwracalność). 

Rozważmy  przykładowo  prosty  układ  termodyna- 
miczny w kontakcie  termicznym  i mechanicznym 
z otoczeniem  o temperaturze  T0  i ciśnieniu  p0.  W pro- 
cesie odwracalnym  ciśnienie  p i temperatura  T tego 
układu  spełniają  warunki  równowagi  p = p0,  T — T0. 

Zgodnie  z prawami  mechaniki  praca  elementarna 
związana  ze  zmianą  objętości  wynosi  dW  = —p0dV  = 

= —pdV.  Symbol  d został  tu  użyty  w celu  podkreśle- 
nia, że  dW  nie  jest  różniczką  funkcji  stanu.  Praca 
związana  ze  zmianą  stanu  układu  jest  bowiem  zależna 
nie  tylko  od  stanów  początkowego  i końcowego,  ale 
i od  sposobu  realizacji  procesu.  Ponieważ  dN  = 0 
(liczba  cząstek  jest  stała),  więc  dU  = TdS—pdV , 
a uwzględniając  I zasadę  termodynamiki  otrzymuje- 
my dQ+d\V  = TdS—pdV.  Zatem  w procesach 
odwracalnych  ciepło  dQ  przekazane  przez  otoczenie 
do  układu  jest  dane  wzorem 

dQ  = TdS. 

Jest  to  podstawowy  związek  wiążący  zmiany  entropii 
z energią  wymienianą  z otoczeniem  przez  kontakt 
termiczny.  Kwazistatyczne  dostarczenie  ciepła  do 
układu  przy  stałej  objętości  powoduje  zmianę  tempe- 
ratury zgodnie  ze  wzorem  {dQ)v  — ( TdS)v  = 

= T(eS/dT)vdT . Współczynnik  CV  = T(dSjdT)v  na-  pojemność 
zywamy  pojemnością  cieplną,  cv  — CvjN  zaś  molo-  cieplna 
wym  ciepłem  właściwym  przy  stałej  objętości.  Po- 
dobnie określa  się  ciepło  właściwe  przy  stałym  ciś- 
nieniu cp  = T(dS/dT)p.  Jeżeli  proces  jest  cykliczny. 


to  stan  początkowy  pokrywa  się  ze  stanem  końco- 
wym — wówczas  całkowita  zmiana  entropii  AS  — 

= j dQ/T  = 0,  przy  czym  całka  jest  obliczana  wzdłuż 
krzywej  zamkniętej,  reprezentującej  proces  w prze- 
strzeni  parametrów  stanu.  Zastosujmy  ten  wzór  do  * . 

cyklu  Carnota  (rys.  5),  w którym  układ  podlega  ko- 
lejno  przemianie  izotermicznej  przy  temperaturze  Tx 
od  stanu  A do  R,  ochłodzeniu  adiabatycznemu  do 
stanu  C o temperaturze  T2  < Tu  przemianie  izoter- 
micznej do  stanu  D , po  czym  wraca  na  drodze  adia- 
batycznej do  wyjściowego  stanu  A.  Wykorzystując 
fakt,  że  odwracalny  proces  adiabatyczny  zachodzi 
bez  zmiany  entropii,  otrzymujemy  związek 

AS  = Q(A,  B)/T1+Q(C,D)/Ta  = 0, 

w którym  Q(A,B\  Q(C,D)  oznaczają  ciepło  przeka- 
zane układowi  w procesach  izotermicznych.  Wynika 
z niego,  że  ciepło  Q(AyB)  i ciepło  Q(C,D ) są  ^wsze 
przeciwnego  znaku.  Ponieważ  zmiana  energii  we- 
wnętrznej w cyklu  wynosi  zero,  więc  praca  wykonana 
przez  układ  jest  równa  [ Q(A,B)Ą-Q(CyD )].  Jej  sto- 
sunek do  ciepła  pobranego  określa  sprawność  cyklu  j?. 
Zakładając,  że  Q(A,B)  > 0,  otrzymujemy  y = (1- 
—TJTi).  Pomiar  sprawności  odwracalnego  cyklu 
Carnota  oznacza  więc  pomiar  stosunku  temperatur 
termodynamicznych,  odpowiadających  procesom  izo- 
termicznym.  Wynik  nie  zależy  od  układu,  który  pod- 
lega przemianie  cyklicznej. 
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bezwzględna  Przypisując  określonemu  stanowi  fizycznemu  pewną 
skala  tempe-  wartość  temperatury,  określamy  tym  samym  skalę 
ratur  Ke!vina  temperatur.  Powszechnie  stosowana  bezwzględna 
skala  Kelvina  przypisuje  punktowi  potrójnemu  wody 
(stan,  w którym  współistnieją  w równowadze  lód, 
woda  i para  wodna)  temperaturę  273,16  K.  Jednostka 
tej  skali  jest  zwana  kelwinem  (oznaczenie  K).  Iloczyn 
TS  ma  wymiar  energii.  Wprowadzając  stałą  Boltz- 
manna  k — (1 ,380622  ± 0,000059)  • 1 0-23  JK-1,  okre- 
ślającą stosunek  dżula  do  kelwina,  możemy  więc  entro- 
pię dowolnego  układu  zapisać  w postaci  S = Śky 
gdzie  S jest  wielkością  bezwymiarową. 

Iloczyn  k-NA=R  = (8,3 1 434  ±0, 00035)  JK-hnol"1 
jest  zwany  stałą  gazową.  Pojawia  się  on  np.  w rów- 
naniach stanu  jednoatomowego  gazu  doskonałego: 
U = 3NRT/2,  pV  = 247/3  = NRT.  Doświadczalnie 
stwierdzono,  że  związki  te  stanowią  bardzo  dobre 
przybliżenie  dla  realnych  gazów  jednoatomowych 
w obszarze  wysokich  temperatur  i małych  gęstości. 


termometr 

gazowy 


ramiona  manometru  rtęciowego 


Rys.  6.  Schemat  termometru 
gazowego  o stałej  objętości. 
Gaz  wypełnia  zbiornik  będą- 
cy w kontakcie  termicznym  ze 
środowiskiem  o mierzonej 
temperaturze  T.  Menisk  rtęci 
w ramieniu  A manometru  do- 
prowadza się  do  poziomu 
wskaźnika,  tak  aby  mierzyć 
ciśnienie  p zawsze  tej  samej 
objętości  gazu  termometrycz- 
ncgo  (hel,  azot  lub  wodór). 
Wartość  p znajduje  się  z po- 
miaru różnicy  poziomów 
rtęci  h przy  uwzględnieniu 
ciśnienia  atmosferycznego. 
Znając  ciśnienie  p0  odpowia- 
dające znanej  temperaturze 
T0=  273,16  K punktu  po- 
trójnego wody  możemy  ob- 
liczyć wartość  T ze  wzoru 
T = T0(p/p0).  Dokładne  po- 
miary wymagają  uwzględ- 
nienia odchyleń  własności 
gazu  tcrmometrycznego  od 
własności  gazu  doskonałego, 
zmian  objętości  zbiornika  itp. 


Wykorzystuje  się  je  do  pomiaru  temperatury  bez- 
względnej (termodynamicznej)  za  pomocą  termome- 
trów gazowych  (rys.  6).  Odpowiadający  im  wzór  na 
różnicę  entropii  między  stanami  B i A można  zna- 
leźć następująco:  przy  małych  zmianach  energii 
i objętości  (przy  ustalonej  liczbie  moli)  zmiana  entro- 
pii ma  postać  dS  = dUIT+pdV/Ty  jest  to  wynik 
przekształcenia  wzoru  na  różniczkę  energii  wewnętrz- 
nej; zatem  w rozważanym  przykładzie 

3 dU  dV 

dS  = -jNR-  -jj-  +NR  —y  = 

= iV/Jrf|yIn£/+lnFj  = NRd(\nVU*t*). 

Przy  przejściu  ze  stanu  A do  B przyrost  entropii  wy- 
nosi więc 

S (B)  — S (A)  = NR\n{[U(B)/U(A)r,2[V(B)/V(A)]}. 

zagadnienie  Z II  zasady  termodynamiki  wynika  wniosek  o du- 
pracy  żym  znaczeniu  praktycznym:  w procesie  przejścia  ze 
maksymalnej  stanu  A do  B układ  wykonuje  maksymalną  pracę 
(fVmz xA,B)  wówczas,  gdy  proces  jest  odwracalny. 
W tym  wypadku  zmianę  entropii  układu  AS  = S(B)— 
— S(A)  kompensuje  zmiana  entropii  otoczenia  (—AS). 
Natomiast  gdy  proces  jest  nieodwracalny,  przyrost 
entropii  układu  jest  taki  sam,  przyrost  entropii  oto- 
czenia zaś  jest  większy  (zasada  wzrostu  entropii). 
Ponieważ  zmiana  energii  układu  jest  w obu  wypad- 
kach taka  sama,  równa  [U(B)—U(A)]y  więc  większa 
entropia  końcowa  otoczenia  oznacza,  iż  więcej 


wpłynęło  do  niego  energii  z układu  w postaci  ciepła, 
czyli  że  układ  wykonał  mniejszą  pracę.  Praca  jest 
więc  maksymalna,  gdy  proces  jest  odwracalny. 

W szczególności  maksymalna  sprawność  cyklu  jest 
osiągana  przy  jego  odwracalnym  przebiegu,  toteż 
dla  cyklu  Carnota  nie  może  ona  przekroczyć  wartości 
(1  — 7yJi).  Wiążą  się  z tym  wprost  dawne  sformuło- 
wania II  zasady  termodynamiki  stwierdzające  niemoż- 
liwość zachodzenia  procesów,  których  jedynym  rezul- 
tatem byłoby  przekazanie  ciepła  od  ciała  zimniejszego 
do  cieplejszego  (sformułowanie  Clausiusa)  lub  całko- 
wite zamienienie  na  pracę  ciepła  pobranego  z układu 

0 stałej  temperaturze  (sformułowanie  Kelvina). 

Jeśli  otoczenie  zachowuje  w trakcie  procesu  stałą 
temperaturę  T0  (nazywa  się  je  wówczas  termostatem) 

1 stałe  ciśnienie  p0y  to  otrzymujemy  prosty  wzór  na 
pracę  maksymalną  fVmax(Ay  B)  = T0AS—AUy  obo- 
wiązuje on  dla  układów  zamkniętych  ( AN  — 0). 

Wielkość  (T0AS—AU—p0AV)  jest  to  maksymalna 
praca  użyteczna  (z  pominięciem  pracy  objętościowej 
p0AV).  Postać  tego  wyrażenia  pozwala  w ciekawy 
sposób  sformułować  warunki  stabilności  stanów 
równowagi.  Fizyczna  treść  tych  warunków  sprowadza 
się  do  stwierdzenia,  że  zaburzenie  stanu  równowagi 
wymaga  wykonania  pracy  nad  układem,  co  wyraża 
nierówność  (T0AS—  AU— p0AV)  < 0.  Wynikają  stąd  zasady 
podstawowe  zasady  ekstremalne  termodynamiki,  ekstremalne*  I 
Przy  stałych  Sy  V i N z odchyleniem  od  stanu  równo-  dla  potencja*  I 
wagi  układu  wiąże  się  wzrost  energii  AU  > 0.  Energia  łów  termody  I 
wewnętrzna  osiąga  więc  w tych  warunkach  minimum  mamicznych  i I 
w stanie  równowagi.  Zasada  minimum  energii  we- 
wnętrznej (przy  ustalonej  entropii)  jest  równoważna 

zasadzie  maksimum  entropii  (przy  ustalonej  energii). 

Z kolei,  porównując  stany  układu  o tej  samej  tempe- 
raturze T = T0  oraz  V i N stwierdzamy,  że  odchy- 
leniu od  stanu  równowagi  odpowiada  nierówność 
A(U—  TS)  > 0.  Zatem  w stanie  równowagi  minimum 
osiąga  potencjał  Helmholtza  (energia  swobodna) 

F = U—  TS.  Podobnie  przy  stałych  Ty  py  N obowią- 
zuje zasada  minimum  dla  potencjału  Gibbsa  (entalpia 
swobodna)  G = U—TS+pVy  zaś  przy  stałych py  V,  N 
dla  entalpii  H = U+pV.  Posługując  się  którąkolwiek 
z powyższych  zasad  minimum,  można  wyznaczyć 
wszystkie  własności  równowagowe  układu  termody- 
namicznego. Funkcje  U , Fy  Gy  H nazywa  się  w związku 
z tym  potencjałami  termodynamicznymi  (analogia 
z potencjałem  w mechanice).  Wszystkie  wymienione 
zasady  ekstremalne  są  zawarte  w podstawowej  nie- 
równości (AU—  T0AS+p0AV)  > 0.  Gdy  układ  jest 
w równowadze,  jego  temperatura  T i ciśnienie  p 
przyjmują  wartości  odpowiednich  parametrów  oto- 
czenia T = T0y  p = Pq.  Zatem  dla  małych  odchyleń 
entropii  i objętości  od  wartości  równowagowych 
jest  spełniony  wzór 

AU-  TAS  +pA  V — 4{(^r)  <^)’+ 

4wK*(iSH-  I 

Z prawej  strony  występuje  tu  różniczka  drugiego 
rzędu  energii  wewnętrznej  obliczona  dla  odchyleń 
AS  i A Vy  różniczka  pierwszego  rzędu  (TAS— pA  V) 
znosi  się  z wyrazem  (—  TAS+pA  V).  Przy  ustalonej 
objętości  warunek  (AU—  TAS-rpA  V)  > 0 prowadzi 
więc  do  nierówności  (d2UJdS2)v  n > 0.  Ponieważ 
(dUfdS)v,N  = r,  więc  (d*ujes*)v  n = (BTjdS)v  N = 

= T[T(dSldT)v9Nrx  = TICv.  ' 

Stan  równowagi  jest  zatem  stabilny,  gdy  ciepło  wła-  stabilność  ] 
ściwe  przy  stałej  objętości  jest  dodatnie  cv  > 0,  stanu 
(cv  = Cv/N).  W podobny  sposób  można  wykazać,  że  równowagi 
warunkiem  stabilności  mechanicznej  jest  dodatnia  war- 
tość ściśliwości  i zo termicznej  Kt  — — (d  V/dp)r  V~l  > 

> 0.  Reakcją  układu  na  izotermiczny  wzrost  ciśnienia 
jest  zmniejszenie  objętości.  W zakresie  wartości  para- 
metrów stanu,  w którym  warunki  stabilności  nie 
mogą  być  spełnione,  układ  nie  może  występować  w 
postaci  fazy  jednorodnej.  Wniosek  ten  potwierdza  do- 
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świadczenie.  Równania  stanu  postaci  T=  T(U>  V,  N), 
p = p(U,  Vy  N),  p = p(U9  Vy  N),  podobnie  jak  wy- 
nikające z nich  równanie  p = p(Ty  Vy  N ),  muszą  być 
zgodne  z warunkami  stabilności.  Rozważmy  przykła- 
dowo równanie  stanu  van  der  Waalsa 

(p+aWiy2)  (V-  bN ) = NRT. 

Wynika  z niego,  iż  małej  izotermicznej  zmianie  ciś- 
nienia dp\r  towarzyszy  zmiana  objętości  dV \t  zgod- 
nie ze  wzorem 

dplT  = d(NRT(V-  bN)-1-  aNzV-*)\T  = 

= (-  NRT(V-bN)-z+2aNzV-*) -dV\T. 


Rys.  7.  Izotermy  van  der  Waalsa.  Do  wyznaczenia  punktów  A 
i D izoterm  poniżej  temperatury  krytycznej  T k i do  otrzymania 
krzywej  współistnienia  stosuje  się  konstrukcję  równych  pól 
Maxwclla  (pole  ABE  — pole  ECD).  Wprowadza  się  przy  tym 
część  płaską  izoterm  (odcinek  AD),  której  punkty  reprezentują 
stabilne  stany  równowagi,  odpowiadające  współistnieniu  pary 
i cieczy.  Oryginalne  izotermy  van  der  Waalsa  zawierają  części 
o ujemnej  ściśliwości  izotermicznej  (odcinek  BC ),  co  narusza 
warunek  stabilności  mechanicznej 

Ściśliwość  izotermiczna  zatem  ma  postać 
Kt  = -l/V(dVJdp)T  = 

= [NVRT(V-  bN)~2-  2aN2V~T1  = 

= [nRT(}-  bn-^-lcm*]-1, 

gdzie  n — NjV  jest  gęstością  molową  gazu.  Nierów- 
ność Kt  > 0 jest  tu  równoważna  warunkowi  RT> 
> 2an(l—  bn)2.  Maksymalna  wartość  funkcji  f(n)  = 
= 2cm(\  — bn)2  w przedziale  1 fb  > n>  0 (zakres  zmien- 
ności gęstości  gazu)  wynosi  %aj21b.  Jest  ona  osiągana 
w punkcie  n = 1/3 by  toteż  dla  dostatecznie  niskich 
temperatur  (RT  < ^ajllb),  izotermy  zawierają  części 
o Kt  < 0 (naruszenie  warunku  stabilności  mechanicz- 
nej, rys.  7).  Interpretacja  tego  obszaru,  jako  odpo- 
wiadającego współistnieniu  cieczy  i pary  (układ  nie- 
jednorodny), stanowi  podstawę  teorii  Maxwella-van 
der  Waalsa  przejścia  fazowego  gaz-ciecz. 
równowaga  Jeżeli  układ  r-składnikowy  jest  niejednorodny 
układów  i rozpada  się  na  a faz,  równowaga  termodynamiczna, 
wislofazo-  poza  stałością  temperatury  i ciśnienia  w całym  ukła- 
wych  dzie  wymaga  dla  każdego  składnika  równości  jego 
potencjałów  chemicznych  we  wszystkich  fazach 

m)  = — = = Pj,  i - 1 r. 

Po  uwzględnieniu  tych  związków  okazuje  się,  że  liczba 
termodynamicznych  stopni  swobody  (liczba  para- 
metrów intensywnych  mogących  się  zmieniać  nie- 
zależnie) wynosi  / = r+2— a.  Ponieważ  />  0,  więc 
w stanie  równowagi  może  współistnieć  co  najwyżej 
(r+2)  faz  (reguła  faz  Gibbsa).  Dla  układu  jedno- 
składnikowego liczba  ta  wynosi  3 (rys.  8).  Fakt,  iż 
wówczas  / = 0,  oznacza,  że  stan  taki  występuje  przy 
ściśle  określonych  wartościach  parametrów  intensyw- 
nych. Znajdujemy  je  rozwiązując  równania  p\pyT)  — 
= p?(pyT)  — p3(p,T)y  gdzie  p2,  p3  oznaczają  po- 


tencjały chemiczne  trzech  współistniejących  faz.  Uzy-  punkty 
skujemy  w ten  sposób  tzw.  punkty  potrójne  danej  potrójne 
substancji.  Współistnieniu  jedynie  dwu  faz  odpowiada 
krzywa  p\pyT)  — p2(pyT).  Zbiór  krzywych  współ- 
istnienia na  płaszczyźnie  (p,T)  tworzy  wykres  fazowy, 
który,  w zależności  od  właściwości  danej  substancji, 
może  mieć  bardzo  różny  przebieg.  Niezwykła  jest  np. 
jego  postać  dla  helu,  mogącego  występować  w stanie 
ciekłym  w dowolnie  niskich  temperaturach.  Nie 
pojawia  się  tu  bowiem  w ogóle  punkt  potrójny  faz 
gazowej,  ciekłej  i stałej  (rys.  9),  natomiast  ciekły  hel 
4 He  dla  temperatur  T < 2,172  K podlega  przejściu 
fazowemu  do  stanu  nadciekłego  (-*  Nadpłynność). 


Rys.  8.  Schematyczny  wykres  fazowy  wody 


106  Pa 


Rys.  9.  Wykres  fazowy  helu  3He 


wykresy 

fazowe 


Rys.  10.  Przebieg  izoterm  i adiabat  w niskich  temperaturach. 
Izoterma  T = 0 pokrywa  się  z adiabatą  S = 0.  Zatem  żaden  proces 
adiabatyczny,  rozpoczęty  przy  temperaturze  T > 0,  nie  może 
doprowadzić  do  stanu  o T — 0 
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III  zasada  Podstawowe  właściwości  okładów  makroskopo- 
termodyna-  Wych  w niskich  temperaturach  ujmuje  III  zasada 
m»ki  termodynamiki.  W sformułowaniu  Plancka  stwier- 
dza ona,  że  w stanach  równowagi  o zerowej  tempera- 
turze termodynamicznej  wartość  entropii  wynosi  zero 
(rys.  10).  Wynika  stąd,  że  zmiana  entropii  w dowol- 
nym procesie  izotermicznym  dąży  do  zera,  jeżeli 
temperatura,  przy  której  proces  przebiega,  dąży  do 
zera  (twierdzenie  Nemsta).  III  zasada  pozwala  jedno- 
znacznie przypisać  stanom  równowagi  układu  okre- 
ślone wartości  entropii  (II  zasada  wyznacza  entropię 
z dokładnością  do  stałej  addytywnej).  Wynika  też 
z mej  dążenie  do  zera  w granicy  T -+  0 ciepła  wła- 
ściwego cv  i cP,  współczynnika  rozszerzalności 
termicznej  a = (dV/dT)p  V~1  oraz  współczynnika 
temperaturowego  ciśnienia  (dp/dDv.  Wyjaśnienie 
tych  faktów  i w ogóle  zjawisk  występujących  w niskich 
temperaturach,  wymaga  zastosowania  teorii  kwanto- 
wej. Interpretację  fizyczną  III  zasady  termodynamiki 
uzyskuje  się  na  gruncie  kwantowej  fizyki  statystycznej 
(-*  Termodynamika  statystyczna). 

termodyna-  Omówione  trzy  zasady  termodynamiki  są  uniwer- 
niaczny  opis  salnym  narzędziem  do  badania  właściwości  układów 
procesów  makroskopowych  w stanie  równowagi.  Wynika  też 
nieodwracal-  z nich  wiele  istotnych  wniosków  na  temat  procesów 
nych  termodynamicznych.  Tak  więc  II  zasada  orzeka,  iż 
są  możliwe  wyłącznie  te  procesy,  które  są  zgodne 
z zasadą  wzrostu  entropii.  W wypadku  wyidealizo- 
wanych, kwazistatycznie  przebiegających  procesów 
odwracalnych  stany  pośrednie  można  uznać  za  stany 
równowagi,  można  więc  je  przedstawić  w przestrzeni 
parametrów  stanu  (rys.  4).  Zasady  termodynamiki  nie 
wystarczają  jednak  do  opisu  przebiegu  rzeczywistych 
procesów  nieodwracalnych.  Dlatego  zbudowana  na 
ich  podstawie  teoria  jest  często  nazywana  termosta- 
tyką  (nie  występuje  w niej  w ogóle  czas).  Ażeby  móc 
badać  ewolucję  w czasie  stanu  układu,  rozważa  się 
procesy,  w czasie  trwania  których  o każdej  dosta- 
tecznie małej  (ale  makroskopowej)  części  układu 
można  założyć,  że  jest  w równowadze.  Wtedy  pa- 
rametry intensywne,  takie  jak  temperatura,  ciśnienie 
czy  potencjał  chemiczny,  mają  w różnych  częściach 
układu  na  ogół  różne  wartości,  podlegające  zmianom 
w czasie.  Lokalnie,  w określonej  chwili  czasu,  para- 
metry te  wiążą  się  ze  sobą  przez  równowagowe  rów- 


nania stanu.  Okazuje  się,  że  tego  rodzaju  założenie 
o lokalnej  równowadze  doskonale  stosuje  się  do 
różnorodnych  zjawisk  (jest  ono  np.  istotnym  elemen- 
tem hydrodynamiki).  Określenie  zmian  w czasie 
lokalnych  wartości  parametrów  makroskopowych 
wymaga  sformułowania  nowych  praw.  Jako  przykład 
rozważymy  tu  proces  przewodnictwa  cieplnego  przewód 
w układzie,  ktorego  różne  części  mają  w chwili  po-  mctwo 
czątkowej  różne  temperatury.  Z II  zasady  termodyna-  cieplne 
miki  wynika,  że  przepływ  energii  wewnętrznej  z ob- 
szarów o wyższej  temperaturze  do  obszarów  o niższej 
temperaturze  doprowadzi  układ  do  stanu  równowagi, 
który  charakteryzuje  się  stałą  temperaturą  w całej 
objętości  układu.  „Siłą  termodynamiczną”  powodu- 
jącą przepływ  energii  (przewodnictwo  cieplne)  jest 
więc  niejednorodność  rozkładu  temperatury.  W punk- 
cie r w chwili  / miarą  tej  niejednorodności  jest  wektor 
grad  T(7y  t)  = (dTjdxy  dT/dy,  dT/Bz).  Wektor  ten 
znika,  gdy  temperatura  nie  zależy  od  7 Przepływ 
energii  w układzie  można  scharakteryzować  za  po- 
mocą gęstości  strumienia  energii  Ju(ry  /).  Jest  to  wek- 
tor, którego  długość  określa  ilość  energii  przepły- 
wająca w jednostce  czasu  przez  jednostkową  powierz- 
chnię do  niego  prostopadłą.  Doświadczalnie  stwier- 
dzono, że  w procesach  przewodnictwa  cieplnego 
w ciałach  izotropowych  (przewodzących  tak  samo  we 
wszystkich  kierunkach)  gęstość  strumienia  energii 
jest^  proporcjonalna  do  gradientu  temperatury 

/a(r,  /)  = —X  grad  T(r,  t).  Współczynnik  X jest  zwany 
współczynnikiem  przewodnictwa  cieplnego,  a prawo 
powyższe  — prawem  Fouriera.  Jest  ono  przykładem 
liniowych  praw  fenomenologicznych,  ustalających 
liniowe  związki  między  gęstościami  strumieni  róż- 
nych wielkości  fizycznych  a odpowiednimi  siłami 
termodynamicznymi.  Powiązanie  tych  praw  z pra- 
wami zachowania  (energii,  pędu,  ładunku  elektrycz- 
nego itp.)  oraz  z założeniem  o lokalnej  równowadze 
pozwala  uzyskać  pełny  opis  ewolucji  w czasie 
stanu  układu  podlegającego  procesowi  nieodwracal- 
nemu. 

Sz.  Szczeniowski,  Fizyka  doświadczalna  cz.  II.  Ciepło  i fizyka 
cząsteczkowa , Warszawa  1976;  J.  Werle,  Termodynamika  feno- 
menologiczna, Warszawa  1957;  K.  Zalewski,  Wykłady  z termo- 
dynamiki fenomenologicznej  i statystycznej , Warszawa  1976. 


Termodynamika  statyczna 

Jerzy  Czerwonko 


Termodynamika  statystyczna  jest  działem  termody- 
namiki, który  uzupełnia  i uzasadnia  termodynamikę 
fenomenologiczną.  Na  czym  polega  to  uzupełnienie? 
Po  pierwsze,  na  możliwości  otrzymania,  na  podstawie 
założeń  o budowie  ciał,  ich  równania  stanu,  np.  rów- 
nania stanu  gazu  doskonałego,  które  do  termodyna- 
miki fenomenologicznej  wchodziło  jako  prawo  empi- 
ryczne. Po  drugie,  na  wprowadzeniu  fluktuacji,  tj. 
odchyleń  wielkości  fizycznych  od  ich  wartości  śred- 
nich, rozpatrywanych  w termodynamice  fenomenolo- 
gicznej. Skoncentrujemy  się  tu  raczej  na  omówieniu 
termodynamiki  statystycznej  stanów  równowagi, 
ze  względu  na  to,  że  jej  podstawy  teoretyczne  tworzą 
logiczną  całość  oraz  fakt,  że  stanowi  ona  punkt  wyjścia 
. dla  termodynamiki  procesów  nieodwracalnych.  Na- 
uzasadnienie  tomiast  uzasadnieniem  termodynamiki  statystycznej 
termodyna-  są  prawa  dynamiczne  opisujące  ruch  cząstek,  a więc 
miks  staty-  równania  Newtona  lub  równania  Schródingera  dla 
stycznej  układów  niekwantowych  bądź  kwantowych  przy 
rezygnacji  z dokładnego  opisu  układu  fizycznego. 

Aby  zrozumieć  o co  chodzi  w ostatnim  zdaniu, 
zwróćmy  uwagę,  że  termodynamika  zajmuje  się  z re- 
guły układami  makroskopowymi,  zawierającymi 
bardzo  wiele  atomów.  Interesujemy  się  przy  tym  nie- 
widoma parametrami  charakteryzującymi  układ,  tj. 
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takimi,  które  mają  sens  makroskopowy  jak : objętość, 
energia,  ciśnienie,  polaryzacja  dielektryczna,  nie  zaś 
położeniami  czy  prędkościami  poszczególnych  ato- 
mów. Dlatego  też  istnieje  bardzo  wiele  układów  fizycz- 
nych o tej  samej  strukturze,  istotnie  różnych  w opisie 
mikroskopowym,  tj.  o różnych  rozkładach  położeń 
i prędkości  cząstek,  ale  identycznych  makroskopowo 
(rys.  1 i 2). 


Rys.  I.  Dwa  różne  układy  50  cząstek  umieszczonych  na  tej  samej 
powierzchni 

Pozwala  to  na  wprowadzenie  wrażnego  pojęcia  ze-  zespól 
społu  statystycznego,  który  jest  zbiorem  wszystkich  statystyczny 
układów  o identycznej  budowie  i identycznej  wartości 
określonych  parametrów  makroskopowych.  Para- 
metry te  i ich  wartości  służą  jakby  za  szyld  zespołu 
statystycznego,  możemy  mówić  np.  o zespole  sta- 
tystycznym 1 mola  neonu  (liczba  atomów  równa 


liczbie  Avogadra)  znajdującym  się  w objętości  10  1. 
Ponieważ  określony  stan  makroskopowy  odpowiada 
wielu  stanom  mikroskopowym,  więc  sensowne  staje 
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Rys.  2.  Dwa  różne  uk- 
łady 11  cząstek  nie  od- 
działujących ze  sobą, 
o tej  samej  energii  całko- 
witej. Poziomy  energety- 
czne mają  energie  od  0 
do  9 jednostek,  energia 
całkowita  wynosi  41  jed- 
nostek. Liczba  kółek  na 
poziomach  odpowiada 
liczbie  cząstek  o danej 
energii 


pomiar 

wielkości 

makrosko- 

powych 


wartość 
średnia 
w zespole 
statystycz- 
nym układów 
kwantowych 


się  pytanie  o prawdopodobieństwo  występowania 
określonego  stanu  mikroskopowego  w danym  stanie 
makroskopowym.  Do  kwestii  tej  powrócimy  jeszcze 
przy  omawianiu  konkretnych  przykładów. 

Zobaczmy  teraz,  jak  wygląda  pomiar  wielkości 
makroskopowych  w warunkach  równowagi — jako 
przykładowy  parametr  weźmy  objętość  układu. 
Cząstki  układu  znajdują  się  w bezustannym  ruchu, 
tym  samym  zmienia  się  również  bezustannie  objętość 
układu,  nawet  układu  znajdującego  się  w równowa- 
dze, która  oznacza  jedynie  brak  systematycznych 
zmian  parametrów  makroskopowych.  Przyrządy  sto- 
sowane do  pomiaru  parametrów  makroskopowych 
mają  określoną  czułość  i określoną  bezwładność, 
tak  że  z reguły  nie  są  w stanie  śledzić  chaotycznych 
zmian,  którym  podlegają  parametry  makroskopowe. 
Stąd,  przyrządy  pomiarowe  podają  nam  nie  chwilowe, 
ale  uśrednione  w czasie  wartości  parametrów  makro- 
skopowych, przy  czym  wzór  na  wartość  średnią  ma 
postać 

— l r 

A = lim  — I A(j)dt , (1) 

T— *00  T - 
0 


gdzie  A(t)  oznacza  chwilową,  a A — średnią  wartość 
parametru  A ; czas  / = 0 oznacza  czas  początku 
pomiaru.  Granica  r -*■  oo  nie  musi  być  traktowana 
zbyt  dosłownie,  chodzi  tu  wyłącznie  o uśrednienie  po 
okresie  znacznie  dłuższym  od  okresu  charaktery- 
stycznego dla  chaotycznych  zmian  parametru  A. 

Jeśli  wprowadzić  prawdopodobieństwo  w zespole 
statystycznym,  to  można  również  mówić  o warto- 
ściach średnich  w tym  zespole.  Pojęcie  wartości  śred- 
niej szczególnie  łatwo  wprowadzić  dla  układów 
opisywanych  przez  mechanikę  kwantową.  Niech 
zespół  statystyczny  stanowi  zbiór  stanów  kwanto- 
wych M.  Każdemu  stanowi  kwantowemu  / należą- 
cemu do  M (/  € M)  przypisujemy  prawdopodobień- 
stwo Pit  przy  czym 


co  oznacza,  że  prawdopodobieństwo  znalezienia 
układu  gdziekolwiek  w zespole  jest  równe  jedności. 
Równość  ta  jest  prostą  konsekwencją  tego,  że  do  ze- 
społu statystycznego  wchodzą  wszystkie  układy  fi- 
zyczne o identycznej  wartości  określonych  parame- 


trów makroskopowych.  W każdym  stanie  kwanto- 
wym / £ M dowolna  wielkość  fizyczna  A ma  okre- 
śloną wartość  średnią  Ai.  Występowanie  tej  wartości 
średniej  nie  jest  związane  z istnieniem  zespołu  sta- 
tystycznego, lecz  z kwantowym  charakterem  rozpa- 
trywanego układu.  (Jeśli  wziąć  pod  uwagę  np.  paczkę 
fal  odpowiadających  jednej  cząstce,  to  ze  względu  na 
rozmycie  przestrzenne,  położenie  cząstki  nie  będzie 
ściśle  określone,  można  będzie  natomiast  mówić 
o wartości  średniej  składowych  wektora  położenia 
cząstki).  Zgodnie  z powyższym,  średnia  wartość 
wielkości  A w zespole  statystycznym  M wyniesie 

(A}  = ^AiP,.  (2) 

Nieco  trudniej  wprowadzić  pojęcie  średniej  w ze- 
spole statystycznym  układów  opisywanych  przez 
mechanikę  klasyczną,  mimo  że  mechanika  klasyczna 
opisuje  układy  fizyczne  zawsze  w sposób  mniej  do- 
kładny od  mechaniki  kwantowej.  Stan  układu  kla- 
sycznego można  określić  znając  wektory  położeń 

r i,  r2, ...» rjv  i pędów pup2y  ...yp n wszystkich  N cząstek. 
Uwzględniając  fakt,  że  wektor  w przestrzeni  K- wy- 
miarowej to  uporządkowany  zbiór  K liczb,  można 
uznać,  że  stan  układu  klasycznego  jest  określony 
przez  wektor  w przestrzeni  6 N- wy  miarowej,  zwanej 
przestrzenią  fazową  lub  przestrzenią  układu  N czą- 
stek. Oznaczamy  ten  wektor  przez  Ry  jego  składo- 
wymi są  współrzędne  wektorów  położenia  i pędu 
wszystkich  N cząstek  w prostokątnym  układzie  współ- 
rzędnych, będziemy  je  wszystkie  nazywali  składowymi 

Ric(k  = 1,2,...,  6N)  wektora  R.  Zmienne  Rk  zmienia- 
ją się  w sposób  ciągły  i można  wprowadzić  dla  nich 
funkcję  gęstości  prawdopodobieństwa.  Prawdopo- 
dobieństwo znalezienia  układu  w nieskończenie  małej 
6 /'/-wymiarowej  kostce  określonej  przez  nierówność 
Rk o < Rk  < Rko+dRk,  k = 1,2,  ...,  6Ny  będzie  dane 

przez  f(R)  dry  gdzie  dr  jest  objętością  owej  kostki, 

a nieujemna  funkcja  f{R)  — gęstością  prawdopodo- 
bieństwa. Wielkość  dr  można  zapisać  jako  iloczyn 
dRxdR2 . . . dR6Ny  czyli  dx1dy1dzl...  dxNdyNdzsdpx xdpyt 
dpzi . . . dpXNdpyNdpzyy  gdzie  xtf  yu  zi ; pXi , Pyv  Pzi  ozna- 
czają współrzędne*  wektorów  położenia  i pędu  /-tej 
cząstki  w prostokątnym  układzie  współrzędnych. 

Aby  funkcja  f(R)  miała  sens  gęstości  prawdopodo- 
bieństwa musi  spełnić  warunek 

/ f(R)dr  = i , 

r 

w którym  występuje  całka  óN-krotna  po  całej  prze- 
strzeni r.  Wielkości  makroskopowe,  stanowiące 
przedmiot  zainteresowania  termodynamiki  staty- 
stycznej, są  zazwyczaj  funkcjami  wektora  R w prze- 
strzeni r.  Na  przykład,  energię  kinetyczną  układu 
określa  wzór 

A 1 

£kin  = -^-(Pzi+Pli+Pzi), 

i-i 

w którym  m jest  masą  cząstek,  przy  czym  energia 
całkowita  to 

£km4 -V(ru  r2y  ... , r„v), 

gdzie  Kjest  energią  potencjalną. 

Teraz  możemy  już  określić  średnią  wartość  w ze- 
spole statystycznym  układów  klasycznych  dowolnej 

wielkości  fizycznej  A będącej  funkcją  R: 

<A(R)>  = fA(R)/(R)dr. 

Opis  układów  kwantowych  i klasycznych  można 
formalnie  ujednolicić,  dzieląc  przestrzeń  fazową  na 
komórki  o róv/nej  objętości  Qy  na  tyle  małe,  aby  za- 
równo gęstość  prawdopodobieństwa,  jak  i rozpa- 
trywane wielkości  makroskopowe  zmieniały  się  zni- 
komo mało  w granicach  jednej  komórki.  Wtedy, 


wartość 
średnia 
w zespole 
statystycz- 
nym układów 
klasycznych 


gęstość 
prawdopodo- 
bieństwa 
w przestrzeni 
gazowej 
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wartość 

średnia 


jeśli  ponumerować  komórki  wskaźnikiem  / i wybrać 

po  jednym  wektorze  Ri  z każdej  komórki,  to  prawdo- 
podobieństwo znalezienia  układu  w /-tej  komórce 

będzie  równe  Pi  = f(Ri)  Q,  wartość  średnia  zaś  będzie 
określona  następująco 

<a(r»  = JT  A(Ri)f(R,)Q  = V Ai Pt. 

l£M  lŹ-M 


Konkretyzacja  pojęcia  zespołu  statystycznego 

Poprzednie  rozważania  były  z konieczności  dość 
abstrakcyjne.  Obecnie  dostosujemy  pojęcie  zespołu 
statystycznego  do  warunków  oddziaływania  makro- 
skopowego układu  z otoczeniem.  Zacznijmy  od  przy- 
padku najprostszego  — układu  izolowanego  od  oto- 
czenia i zajmującego  określoną  objętość  V.  Taki 
układ  ma  energię  E ustaloną  z dokładnością  do  błędu 
pomiaru  6E , przy  założeniu,  że  SE  <ś  l^l.  Wskaźnik 
/ oznacza  tym  razem  różne  stany  kwantowe  układu 
o energii  E < Ei  <c  E+SE , bądź  też  numeruje  ko- 
mórki przestrzeni  fazowej,  których  energie  spełnia- 
ją taką  nierówność.  Zakładamy,  że  SE  jest  na  tyle 
duże,  iż  w przedziale  £*,  E+  SE  znajduje  się  bardzo 
wiele  stanów  o energii  Ei.  Jest  to  łatwe  do  spełnienia 
przy  podziale  przestrzeni  fazowej  na  odpowiednio 
małe  komórki,  albo  przy  odpowiednio  dużych  ukła- 
dach kwantowych,  których  poziomy  energetyczne  są 
prawie  ciągłe.  Sprawdźmy  to  na  przykładzie  pojedyn- 
czej cząstki  zamkniętej  w pudle  sześciennym  o krawę- 
dzi L , gdy  pęd  cząstki  p spełnia  warunki  Borna-Kar- 

, . — * — ► * 

mana,  tj.  p = hnlL,  gdzie  h jest  stałą  Plancka,  a n — 

wektorem  o całkowitych  współrzędnych.  Dla  dużych 
L siatka  wektorów  p = hnjL  staje  się  bardzo  gęsta, 

podobnie  jak  i zbiór  wartości  energii  c(p),  jeśli  tylko 
jest  to  funkcja  ciągła.  Podobnie  będzie  dla  układu 
wielu  cząstek,  co  szczególnie  łatwo  uzasadnić,  jeśli 
cząstki  ze  sobą  nie  oddziałują  i energia  ich  układu 
jest  sumą  energii  poszczególnych  cząstek, 
prawdopodo-  Przyjmijmy  chwilowo,  że  układ  niekoniecznie  znaj- 
bieństwo  duje  się  w równowadze;  wtedy  prawdopodobieństwo 
znalezienia  znalezienia  go  w /-tym  stanie  powinno  zależeć  od 
układu  czasu,  oznaczamy  je  Pi(t).  Zakładamy  wtedy,  że 
w /-tym  prawdopodobieństwo  to  spełnia  zależność 

Pi  ( t+A ) = 2 Pk(t)Ak—i(A) , (3) 

k£M 

w której  Ak-*i(z 0 oznacza  prawdopodobieństwo 
przejścia  ze  stanu  k do  stanu  / po  upływie  czasu  A. 
Zależność  ta  oznacza,  że  jeśli  układ  znalazł  się  w sta- 
nie k w chwili  t9  to  z prawdopodobieństwem  Ak-*i(A) 
znajdzie  się  w chwili  t+A  w stanie  /,  że  zaś  w stanie  k 
układ  znalazł  się  z prawdopodobieństwem  />*(/),  więc 
pomnożenie  Ak-*i(A)  przez  nie  i zsumowanie 
takich  wyrażeń  dla  wszystkich  różnych  wartości  k 
daje  pełne  prawdopodobieństwo  znalezienia  układu 
w stanie  / w chwili  t+A.  Zależność  ta  ma  więc  sens 
bilansu  prawdopodobieństwa,  przy  czym  jedynym 
istotnym  założeniem  przyjętym  przy  jej  wprowadzaniu 
jest  założenie  o niezależności  zdarzeń  polegających  na 
znalezieniu  się  układu  w stanie  k i na  jego  przejściu 
z k do  /,  co  prowadzi  do  mnożenia  prawdopodo- 
bieństw. Prawdopodobieństwa  Ak-*i(A)  muszą  speł- 
niać związek 

£ Ak-i(A)  = 1 (4) 

l£M 

oznaczający,  że  jeśli  układ  znalazł  się  w stanie  k, 
to  jest  pewne,  że  znajdzie  się  w jakimkolwiek  innym 
stanie  po  chwili  A.  Przeprowadzając  sumowanie  za- 
leżności (3)  po  wszystkich  / £ M i korzystając  z rów- 
ności (4),  łatwo  udowodnić,  że  jeżeli  suma  wszystkich 
prawdopodobieństw  Pi(t)  była  równa  jedności,  to 
będzie  to  spełnione  automatycznie  również  w chwili 
t+A.  Podobnie,  z równości  (3)  i (4),  w prosty  sposób 
wynika,  że  jeśli  prawdopodobieństwa  wszystkich 


stanów  k są  w pewnej  chwili  sobie  równe  (to  znaczy 
niezależne  od  k)y  to  będą  również  spełniały  ten  zwią- 
zek dowolnie  długo,  co  oznacza  stan  równowagi. 

Przy  stanie  równowagi  — z równości  prawdopo- 
dobieństw wszystkich  stanów  / £ A. f — otrzymujemy 
zatem 

Pi  = M-'(E,SE\  (5) 

gdzie  M jest  liczbą  stanów  (lub  komórek),  których 
energia  (£*)  spełnia  nierówność  E < Ei  < E+  SE. 

Dla  pozostałych  stanów,  oczywiście,  Pk  = 0. 

Można  wykazać,  że  jeśli  Ak-.Z(A)  > 0 dla  do- 
wolnej pary  stanów  kt  l i A > 0,  co  oznacza  możli- 
wość przejścia  od  każdego  stanu  k do  każdego  stanu 
/,  to  wyrażenie  (5)  jest  jedynym  wyrażeniem  nieza- 
leżnym od  czasu  spełniającym  zależność  (3).  W takiej 
sytuacji  mamy  również 

lim  Pi(t)  = Pi  = M-1  ( E , SE\  (6) 

t — *00 

# 

co  oznacza,  że  przy  / oo  rozkład  prawdopodobień- 
stwa stanów  dąży  do  rozkładu  występującego  w rów- 
nowadze, i to  niezależnie  od  tego,  jakie  prawdopodo- 
bieństwa Pi(t')  były  w pewnej  chwili  początkowej  t' . 

Równość  (6)  oznacza,  że  Pi(t)  różni  się  dowolnie 
mało  od  Pi  po  odpowiednio  długim  czasie.  Powoduje 
to,  że  dowolna  wielkość  fizyczna  A,  uśredniona  w cza- 
sie zgodnie  ze  wzorem  (1),  równa  jest  równowagowej 
średniej 

<A>  = ~M{E,6E)ĘAl'  (7> 

przy  czym  sumowanie  ogranicza  się  do  takich  /,  że 
E < Ei  < E+SE. 

W ten  sposób  określiliśmy  zespół  statystyczny  zespół  mikro- 
układu izolowanego  od  otoczenia,  dla  którego  wszy-  kanoniczny 
stkie  prawdopodobieństwa  stanów  kwantowych  o 
energiach  w podanym  przedziale  są  równe.  Zespół 
taki  nazywa  się  zespołem  mikrokanonicznym.  Wyka- 
zaliśmy również,  że  średnia  po  czasie  (1)  jest  równa 
średniej  w takim  zespole  (7).  Wniosek  ten  znany 
jest  pod  nazwą  twierdzenia  ergodycznego.  Zostało 
ono  wprowadzone  przez  L.E.  Boltzmanna  dla  ukła-  twierdzenie 
dów  opisywanych  przez  mechanikę  Newtona.  Boltz-  ergodyczne 
mann  podał  wiele  istotnych  argumentów  przemawia- 
jących za  prawdziwością  twierdzenia  ergodycznego, 
ścisły  zaś  matematyczny  dowód  tego  twierdzenia 
został  podany  przez  G.  Birkhoffa  i J.  von  Neumanna 
dopiero  w latach  trzydziestych  naszego  wieku. 

Rozkład  mikrokanoniczny  nie  wyróżnia  ani  stanów 
kwantowych  ani  też  punktów  w przestrzeni  fazowej. 

Taki  stan  często  określa  się  mianem  „chaosu  mole- 
kularnego”. Dla  układów  klasycznych  tor  wektora  R 
w przestrzeni  fazowej  przy  1 -+  oo  pokrywa  wówczas 
powierzchnię  ustalonej  energii  w sposób  ciągły 
i równomierny. 

Jak  już  wyjaśniono,  lim  Pi(t)  = Pi  niezależnie 

t — ►oo 

od  początkowego  rozkładu  prawdopodobieństwa. 

Jest  to  stwierdzenie  istnienia  relaksacji,  tj.  procesu 
dochodzenia  do  równowagi.  Zjawisko  to  ma  nie- 
odwracalny charakter,  ponieważ  stan  równowagi  raz 
osiągnięty  trwać  będzie  nieograniczenie  długo  i nie  ma 
możliwości  powrotu  do  wyjściowego  rozkładu  praw- 
dopodobieństw. Do  faktu  tego  doszliśmy  już  jako  do 
wniosku  zależności  (3)  przy  uwzględnieniu  warunku 
(4).  Zwróćmy  uwagę,  że  wniosek  ten  jest  prawdziwy 
nawet  wtedy,  gdy  Ak-*i(A)  = Ai-> k(A)9  co  ozna- 
cza, że  prawdopodobieństwo  przejścia  ze  stanu  k 
do  / jest  równe  prawdopodobieństwu  przejścia  z / 
do  ky  i co  można  by  nazwać  warunkiem  odwra- 
calności  mikroskopowej. 

Należy  podkreślić,  że  nie  sposób  traktować  przy- 
toczonego wyprowadzenia  równości  wartości  śred- 
nich po  czasie  i średnich  w zespole  mikrokanonicz- 
nym jako  dowodu  twierdzenia  ergodycznego  dla 
układów  kwantowych.  Zależność  (3)  została  bowiem 
tylko  przyjęta,  nie  zaś  wyprowadzona  na  podstawie 
m.in.  równania  Schródingera.  Wyprowadzenie  takie 
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wymaga  z reguły  dodatkowych  założeń  o układzie 
fizycznym.  Dlatego  też  rozważania  niniejsze  mają, 
przynajmniej  częściowo,  charakter  tylko  wyjaśnia- 
jący pojawianie  się  takich  własności  procesów  fizycz- 
nych, jak  relaksacja,  nieodwracalność  itp.  Rozważa- 
nia te  pozwalają  również  zrozumieć  statystyczny 
charakter  podstaw  termodynamiki. 


Entropia  i granica  termodynamiczna 

Na  podstawie  wyrażenia  (7)  można  znaleźć  wartości 
obserwowane  tych  wielkości  fizycznych,  które  mają 
określone  wartości  średnie  bądź  w stanie  kwanto- 
wym, bądź  też  dla  funkcji  Ry  tj.  n oraz  w układzie 
klasycznym.  Do  wielkości  tego  rodzaju  nie  należy 
ani  wymiana  ciepła  AQ , ani  też  entropia,  zdefiniowana 
w termodynamice  przez  równanie  AS  = AQ/Ty  gdzie 
Tjest  temperaturą  w skali  Kelvina.  Podana  definicja 
jest  słuszna  przy  nieskończenie  małych  różnicach 
AQ  i AS.  Wymianę  ciepła  określa  się  jako  różnicę 
energii  stanu  końcowego  i początkowego  układu, 
jeśli  nie  wykonano  nad  nim  pracy.  Taka  sama  róż- 
nica energii  może  powstać  w wyniku  jednoczesnej 
wymiany  ciepła  z otoczeniem  i wykonania  pracy 
nad  układem.  Dlatego  można  mówić  raczej  o wy- 
mianie ciepła  niż  o cieple  i nie  można  wyrazić  tej 

wielkości  w funkcji  R ani  też  przypisać  jej  wartości 
stanowi  kwantowemu.  Z tego  także  powodu  nie  można 
wyrazić  entropii  jako  wartości  średniej  pewnej 

funkcji  od  R lub  też  funkcji  wskaźnika  stanu  kwanto- 
wego, tylko  jest  konieczne  podanie  osobnej  staty- 
stycznej definicji  entropii.  Zostało  to  dokonane  przez 
Boltzmanna. 

granica  Ograniczymy  się  teraz  do  wprowadzenia  entropii 
termodyna-  dla  układów  makroskopowych,  a nawet  tylko  dla 

miczna  układów  w tzw.  granicy  termodynamicznej,  tj.  przy 
objętości  Ki  liczbie  N dążących  do  nieskończoności 
tak,  aby  iloraz  N/V  (gęstość  cząstek)  pozostawał 
skończony  i niezerowy.  Założymy  również,  że  istotne 
w opisie  układu  makroskopowego  wielkości  dzielą 
się  na  dwie  klasy:  wielkości  ekstensywne  i wielkości 
intensywne. 

Pierwsze  z nich,  przy  wzroście  liczby  cząstek 
dużego  układu,  rosną  wraz  z N prawie  liniowo,  dru- 
gie — prawie  nie  zmieniają  swojej  wartości.  Uściśla- 
jąc to  matematycznie,  można  uznać,  że  wielkości 
ekstensywne  są  rozbieżne  przy  N ->  oo  tak,  że  dla 
dowolnej  takiej  wielkości  S,  granica  E{N  istnieje 
wielkości  i jest  niezerowa.  Wielkości  intensywne  są  natomiast 
ekstensywne  przy  N -*■  oo  zbieżne  do  liczby.  Do  wielkości  eksten- 
i intensywne  sywnych  należą  np.':  energia,  objętość  i ładunek  elek- 
tryczny, do  intensywnych  zaś:  ciśnienie,  tempera- 
tura, stała  dielektryczna  itd.  W granicy  termodyna- 
micznej— podanie  jednej  wielkości  ekstensywnej 
i wielu  wielkości  intensywnych  pozwala  określić  każdą 
inną  wielkość  ekstensywną,  np.  zamiast  wielkości 
ekstensywnych  wymienionych  wyżej  można  podać: 
objętość,  gęstość  energii  ( E/V ) oraz  gęstość  ładunku. 
Przyjęcie  układów  w granicy  termodynamicznej 
prowadzi  do  rezygnacji  z rozpatrywania  efektów 
powierzchniowych.  Dlatego  też,  w granicy  termody- 
namicznej, wielkości  ekstensywne  stają  się  makro- 
skopowo addytywne,  co  oznacza,  że  np.  energia  ciała 
makroskopowego  jest  równa  sumie  energii  jego 
makroskopowych  części.  Wniosek  ten,  oczywisty 
w odniesieniu  do  ilości  cząstek,  ładunku,  czy  objęto- 
ści, dla  energii  wymaga  pewnego  uzasadnienia.  Jeśli 
w układzie  działają  siły  o skończonym  zasięgu  rzędu 
n odległości  międzycząsteczkowych,  to  energia 
oddziaływania  makroskopowych  podukładów  kon- 
taktujących się  przez  powierzchnię  powinna  być 
rozbieżna  wraz  z jak  nN*l\  nie  zaś  jak  N.  Poprawka 
do  energii,  a więc  wielkości  ekstensywnej,  rzędu 
jest  w granicy  termodynamicznej  pomijalna, 
co  uzasadnia  makroskopową  addytywność  energii. 
Warto  dodać,  że  ekranowanie  ładunku  przez  elektro- 


ny w ośrodkach  ciągłych  sprawia,  że  siły  Coulomba, 
działające  między  elektronami  i jonami,  stają  się 
również  siłami  o skończonym  zasięgu. 

Dodajmy,  że  wnioski,  do  których  poprzednio 
doszliśmy,  dotyczące  nieodwracalności  i dochodzenia 
do  równowagi  są  słuszne  jedynie  w granicy  termody- 
namicznej. W dużych  ale  skończonych  układach  ma- 
my do  czynienia  z ruchem  zbliżonym  do  okresowego, 
o niezwykle  dużych  okresach.  Dlatego  też,  przy  do- 
świadczeniach np.  nad  molem  gazu,  trwających  do- 
wolnie długo  w ludzkiej  skali  czasu,  możemy  śmiało 
potraktować  procesy  tam  zachodzące  jako  procesy 
nieodwracalne.  Na  kłopoty  związane  z przybliżoną 
okresowością  ruchu  układów  skończonych  zwracano 
uwagę  już  w dziewiętnastym  stuleciu. 

Ponieważ  wymiana  ciepła  jest  określona  przez  entropia 
różnicę  energii,  więc  jest  również  wielkością  eksten- 
sywną. Stąd,  jak  i z definicji  — entropia  jest  również 
wielkością  ekstensywną.  Entropia  układów  opisywa- 
nych przez  mechanikę  kwantową  będzie  zdefinio- 
wana następująco: 

S = k\nM(E,  6E),  (8) 

gdzie  k jest  stałą  Boltzmanna,  M (£,  6E)  zaś  zostało 
określone  wzorem  (5).  Wzór  (8)  jest  jedynie  definicją 
entropii.  Później  uzasadnimy,  że  „entropia  staty- 
styczna” (8)  ma  wszelkie  własności  entropii  termody- 
namicznej. W podanym  wcześniej  termodynamicznym 
określeniu  entropii,  AS  = AQ/T,  występuje  wyłącz- 
nie różnica  entropii,  a więc  można  ją  określić  jedynie 
z dokładnością  do  stałej ; statystyczna  definicja  okre- 
śla entropię  bez  jej  dowolności.  Z drugiej  strony, 
niepokoi  zależność  S nie  tylko  od  E i innych  parame- 
trów, od  których  M zależy  w sposób  niejawny,  ale 
również  od  <5 E.  Można  wykazać,  że  zależność  ta  jest 
nieistotna  w granicy  termodynamicznej. 

Jak  można  zdefiniować  entropię  dla  układów  opi- 
sywanych przez  mechanikę  klasyczną?  Objętości 

przestrzeni  fazowej  obszaru  E < E(R)  < E+&E, 
gdzie  E(R)  jest  energią  układu  klasycznego,  nie  można 
traktować  jako  odpowiednika  M{E , ÓE)y  ponieważ 
jest  to  wielkość  wymiarowa  i jej  logarytm  jest  nie- 
określony poza  wybranym  układem  jednostek. 

Ale  jeśli  tę  objętość  fazową  podzielić  przez  /i3iN,  gdzie 
h jest  stałą  Plancka,  to  otrzymamy  wielkość  bezwy- 
miarową. 

Gibbs  zauważył  ponadto,  że  jeśli  objętości  fazowej  paradoks 
nie  podzielić  przez  N\y  to  S będzie  zależała  od  N sil-  Gibbsa 
niej  niż  liniowo  przy  N oo,  a więc  nie  będzie  wiel- 
kością ekstensywną.  Co  gorsze,  powstaje  przy  tym 
niemożność  jednoznacznego  określenia  entropii. 

Wykażemy  to  na  podstawie  następującego  rozumo- 
wania: wyobraźmy  sobie  dwa  naczynia,  wypełnione 
identycznym  gazem,  o tym  samym  ciśnieniu  i tempe- 
raturze. Niech  Sx  i S2  będą  entropią  gazu  znajdującego 
się  w pierwszym  i drugim  naczyniu.  Entropia  S ukła- 
du naczyń  połączonych  ze  sobą,  równa  jest  Sx+S2 
ze  względu  na  odwracalność  mieszania  gazu  w takich 
warunkach.  Jeśli  Sx  i S2  są  ekstensywne,  to  Sx  = Nxs0y 
S2  = N2s0y  gdzie  wielkość  s0  oznacza  entropię  na 
jedną  cząstkę  i jest  intensywna.  Wtedy  S = (Nx-r 
+N2)s0  = Ns0  i entropia  naczyń  połączonych  zależy 
jedynie  od  stanu  układu.  Jeśli  jednak  5lł8  ^ 
to  do  określenia  S jest  jeszcze  potrzebne  podanie 
Nx  lub  N2y  a więc  historii  układu. 

Dlatego  też  entropia  połączonego  układu  zależa- 
łaby od  miejsca,  z którego  wyciągnięto  przegródkę 


Rys.  3.  Entropia  połączonego  układu  zależy  od  miejsca,  z którego 
wyciągnięto  przegródkę  A oddzielający  jednakowe  i znajdujące 
się  w jednakowych  warunkach  gazy  w naczyniach  1 i 2 
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A (rys.  3)  oddzielającą  dwa  jednakowe  i znajdujące 
się  w jednakowych  warunkach  gazy  w naczyniach 

I iczba  stanów  Z niniejszych  rozważań  wynika,  że  właściwa  postać 
w warstwie  * wyrażenia  na  liczbę  stanów  w warstwie  energetycznej 

energetycznej  o grubości  SE  ma  postać 

1 r dr  _* 

A#(E.4EJ-  — J — , E<E(R)<E+SE  (9) 

Wyrażenie  to  można  również  otrzymać  przez  przej- 
ście graniczne  od  mechaniki  kwantowej  do  klasycz- 
nej. Ponieważ  A™  to  liczba  wszystkich  możliwych 
permutacji  N elementów,  więc  podzielenie  przez  N\ 
oznacza  odpowiednie  zredukowanie  liczby  stanów 
z uwagi  na  to,  że  permutacja  położeń  i pędów  czą- 
stek jednakowych  nie  powoduje  zmiany  sytuacji 
fizycznej,  co  stanowi  jakby  klasyczną  zapowiedź 
nierozróżnialności  jednakowych  cząstek  w mecha- 
nice kwantowej. 

Pokażemy  teraz,  jak  znaleźć  własności  termodyna- 
miczne układu,  jeśli  znamy  S w funkcji  E i V.  Za- 
łóżmy dla  uproszczenia,  że  nad  układem  można 
wykonywać  jedynie  pracę  objętościową.  Jeśli  więc 
objętość  V będzie  stała,  to  praca  nie  będzie  wykony- 
wana i AQ  — AE . Stąd  oraz  z termodynamicznej 
definicji  entropii  wynika,  że  (dSjdE)  = l/F,  co  poz- 
wala wyrazić  energię  (a  tym  samym  — entropię) 
przez  objętość  i temperaturę.  Ponadto,  jeśli  E jest 
stałe,  to  praca  objętościowa  układu  pAVy  gdzie  p 

— ciśnienie,  równa  się  zmianie  ciepła.  Powstaje  to 
stąd,  że  ( dS / dV)  = pl Ti  jeśli  podstawić  tu  E w funkcji 
objętości  i temperatury,  to  otrzymamy  zależność 
typu  p = /(K,  T ),  a więc  równanie  stanu,  co  byłoby 
niemożliwe  bez  użycia  metod  termodynamiki  sta- 
tystycznej. 

prawo  Statystyczna  definicja  entropii  (8)  pozwala  łatwo 
wzrostu  uzasadnić  prawo  jej  wzrostu.  Weźmy  w tym  celu  dwa 
entropii  układy  o energiach  E±  i E2  i liczbie  stanów  M1(E1,SE) 
oraz  M2(E2y  SE).  Jeśli  układy  te  nie  mogą  wymieniać 
między  sobą  energii,  to  liczba  stanów  całego  układu 
będzie  po  prostu  iloczynem  MxM2y  bowiem  stany 
każdego  z podukładów  określają  stan  układu.  Na- 
tomiast jeżeli  podukłady  mogą  wymieniać  energię 
między  sobą,  to  aby  otrzymać  liczbę  stanów  całego 
układu,  trzeba  jeszcze  wysumować  iloczyn  M1(E1— 

— mSEy  SE)  M2{E2+mSEy  SE)  po  wszystkich  całko- 
witych k takich,  że  El—mSE  oraz  E2-rmSE  są  do- 
puszczalnymi energiami  obydwu  podukładów. 
Zauważmy,  że  w podanym  wyżej  iloczynie  suma 
energii  podukładów  musi  być  równa  Ex+E2y  tzn, 
uwzględniono  tu  prawo  zachowania  energii.  Gdy 
podany  iloczyn  osiąga  maksimum  dla  m = 0,  to 
w granicy  termodynamicznej  można  wykazać,  że 
entropia  układu  będzie  równa  sumie  entropii  pod- 
układów. Jeśli  jednak  maksimum  tego  iloczynu  jest 
osiągnięte  przy  m ^ 0,  to  wspomniana  suma  iloczynów 
jest  większa  od  M1(Ely  SE)  M2(E2y  SE)y  co  oznacza 
wzrost  entropii  połączonego  układu.  Nietrudno  rów- 
nież zauważyć,  że  warunek  na  maksimum  iloczynu 
jest  równoważny  warunkowi  równości  temperatury 
w obydwu  podukładach. 

Należy  przy  tym  podkreślić  nieco  inny  charakter 
prawa  wzróstu  entropii  w termodynamice  statystycz- 
nej niż  w fenomenologicznej.  Polega  to  na  możliwości 
nawet  przejściowego  zmniejszania  się  entropii  w pro- 
cesie wymiany  energii  między  podukladami,  ponieważ 
M1(E1—mSEy  SE)  M2(E2+ mSEy  SE)  może  być  mniej- 
sze od  Afi(£i,  SE)  M2(E2.  SE)  przy  odpowiednim  m. 
Zmiana  energii  właśnie  o mSE  jest  — dla  dużych 
układów  — wysoce  nieprawdopodobna,  nie  jest  jed- 
nak całkowicie  wykluczona.  Widzimy  więc,  że  prawo 
wzrostu  entropii  traci,  przy  statystycznym  podejściu 
do  termodynamiki,  swój  absolutny  charakter.  Ujmu- 
jąc rzecz  ogólnie,  podejście  statystyczne  charaktery- 
zuje występowanie  fluktuacji  — odchyleń  parametrów 
fizycznych  od  ich  wartości  średnich  A(t)—A. 
Miarą  fluktuacji  nie  może  być  wartość  średnia  A(t)  — 


—Ay  wielkość  ta  bowiem  znika;  za  miarę  tę  przyj- 
muje się  pierwiastek  ze  średniego  kwadratu  (A  (t)-A), 
tj.  zgodnie  z (1) 

1 r — 

lim — | (A(/)-A)2d/y 

T— *00  T J 
o 

czyli  średnie  odchylenie  kwadratowe  wielkości  A(t). 

Ze  względu  na  równość  średniej  w czasie  i średniej 
w zespole  statystycznym,  miarę  fluktuacji  można 
wyrazić  również  w postaci  średniej  w zespole  staty- 
stycznym. Doświadczalne  obserwacje  fluktuacji  wiel- 
kości fizycznych  potwierdziły  statystyczny  charakter 
termodynamiki.  Wielki  wkład  do  tego  zagadnienia 
wniósł  polski  fizyk  Marian  Smoluchowski. 

Z wyrażeń  na  entropię  oraz  prawdopodobieństwo 
w zespole  mikrokanonicznym  można,  w stosunkowo 
prosty  sposób,  otrzymać  prawdopodobieństwa  stanów 
makroskopowego  podukładu  należącego  do  znacznie  zespół 
większego  od  niego  układu  i wymieniającego  z nim  kanoniczny 
energię.  Zespół  statystyczny  opisujący  taki  podukład  i makroka- 
nazywa  się  zespołem  kanonicznym  lub  zespołem  noniczny 
kanonicznym  Gibbsa.  Funkcja  prawdopodobieństwa 
dla  podukładu  kwantowego  ma  postać 

e-WT/Zy  (10) 

gdzie  Z otrzymuje  się  z warunku,  że  prawdopodo-  suma  stanów 
bieństwo  zsumowane  po  l daje  jedność,  czyli 

Z = JT1  e~KiJkT . 

i 

Wielkość  Z nazywa  się  sumą  stanów.  Znalezienie  jej, 
co  jest  z reguły  łatwiejsze  niż  określenie  M(Ey  SE)y 
pozwala  obliczyć  wszystkie  funkcje  termodynamiczne 

układu.  Jeśli  zamiast  Ei  podstawić  E(R),  a zamiast 
sumy  po  / — całkę  po  dTy  to  otrzymamy  odpowiednio 
gęstość  prawdopodobieństwa  oraz  sumę  stanów  dla 
układu  klasycznego  pomnożoną  przez  h3NN\.  Równie 
często  używa  się  w termodynamice  statystycznej 
zespołu  statystycznego  podukładu  makroskopowego 
wymieniającego  zarówno  energię,  jak  i cząstki,  ze 
znacznie  większą  od  siebie  resztą  układu.  Zespół 
taki  nazywany  jest  zespołem  makrokanonicznym. 

Ostatnie  zdania  wydają  się  sugerować,  że  istnieje 
osobna  termodynamika  „mikro”  i „makro”  oraz  po 
prostu  „kanoniczna”.  Okazuje  się  jednak,  że  nieza- 
leżnie od  ustalenia  energii,  liczby  cząstek  czy  też 
możliwości  ich  wymiany,  wielkości  te  są  i tak  prak- 
tycznie stałe,  ponieważ  ich  średnie  odchylenia  kwa- 
dratowe są  rzędu  N1!2,  dzięki  czemu  względne  odchy- 
lenia energii  czy  liczby  cząstek  są  rzędu  W1/2,  co  jest 
pomijalne  w granicy  termodynamicznej. 

Z postaci  wzoru  (10)  widać,  że  przy  T ->  0 prawdo-  1 1 1 zasada 
podobieństwo  stanu  o najniższej  energii  dąży  do  termodyna- 
jedności,  pozostałe  zaś  prawdopodobieństwa  dążą  miki 
do  zera.  Zatem  przy  T = 0 układ  będzie  znajdował 
się  w stanie  podstawowym.  Stan  ten  jest  bądź  niezwy- 
rodniały,  bądź  też  jego  zwyrodnienie  jest  skończone 
przy  N — >•  oo.  Powoduje  to,  że  przy  T — 0 entropia 
jest  zerowa  w granicy  termodynamicznej,  co  stanowi 
treść  trzeciej  zasady  termodynamiki.  Była  ona  uza- 
sadniana początkowo  wyłącznie  empirycznie,  widzi- 
my jednak,  że  wynika  ona  w nie  dający  się  zaprzeczyć 
sposób  z definicji  entropii  (8)  i kwantowości  układu. 


Gazy  klasyczne  i kwantowe 

Po  raczej  abstrakcyjnych  rozważaniach  przejdźmy 
do  zastosowań,  czyli  do  teorii  gazów  doskonałych  — 
klasycznych  i kwantowych.  Przez  gaz  doskonały 
rozumie  się  układ,  którego  energię  całkowitą  można 
zapisać  w postaci 

E = ^EiNi, 

l 

gdzie  Ni  jest  liczbą  cząstek  w stanie  o energii  Ei. 
Stan  o energii  Ei  wygodniej  będzie  potraktować  nie 
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jako  oddzielny  stan  kwantowy,  ale  jako  zbiór  liczby 
stanów  wielkości  ekstensywnej  o bliskich  energiach. 
Ei  zaś  będzie  oznaczać  pewną  energię  średnią.  Dla 
odpowiednio  dużych  układów  kwantowych  bądź  też 
dla  układów  klasycznych,  jeśli  tylko  przedział  energii 
SE  wokół  Ei  jest  wielkością  — tym  razem  — inten- 
sywną, liczba  stanów  jest  wielkością  ekstensywną. 
Nałóżmy  na  pęd  warunki  Boma-Karmana  (założenie 
przyjmowane  zwykle  w teorii  ciała  stałego),  tj. 

przyjmijmy,  że  pęd  spełnia  warunki  p = hnjLy  gdzie 

n jest  wektorem  o współrzędnych  równych  liczbom 
całkowitym,  a L — długością  krawędzi  sześcianu 
zajmowanego  przez  układ.  W tym  wypadku  różnym 


statystyka 

Maxwella- 

-Boltzmanna 


statystyka 

Bosego- 

-Einsteina 


statystyka 
Fermiogo- 
~ Diraca 


stanom  kwantowym  odpowiadają  różne  wektory  w, 
czemu  z kolei  odpowiada  sieć  regularna  prosta 
w przestrzeni  pędów  o długości  krawędzi  hfL. 
Dlatego  właśnie  gęstość  stanów  kwantowych  w prze- 
strzeni pędu  wynosi  Vjh3.  Zatem  pomnożenie  obję- 
tości obszaru  przestrzeni  pędów  przez  Vjh 3 daje 
liczbę  stanów  w tym  obszarze,  przy  czym  będzie  to 
wielkość  ekstensywna.  Taki  sam  rezultat  daje  wyra- 
żenie (9)  na  liczbę  stanów  układu  klasycznego  przy 
N = 1 , gdyż  występująca  tam  całka  po  zmiennych 
przestrzennych  daje  czynnik  V.  Widzimy  więc,  że 
podzielenie  klasycznej  objętości  fazowej  przez  h*Ny 
zastosowane  ze  względów  wymiarowych,  ma  znacznie 
głębsze  uzasadnienie. 

Oznaczmy  liczbę  stanów  o średniej  energii  Ei 
(wielkość  ekstensywna)  przez  gi.  Zastanówmy  się,  na 
ile  sposobów  można  rozmieścić  Ni  cząstek  w gi 
stanach.  W tym  celu  trzeba  ustalić,  które  rozmiesz- 
czenia uznajemy  za  różne  i jakie  dodatkowe  własności 
muszą  spełniać  rozmieszczenia.  W mechanice  kla- 
sycznej cząstki  jednakowe  są  rozróżnialne,  ponieważ 
można  prześledzić  tor  każdej  z nich,  nie  wpływając 
na  ruch  cząstki.  Nie  ma  przy  tym  żadnych  ograniczeń 
na  1 iczbę  cząstek  w poszczególnych  stanach.  W takim 
wypadku  będziemy  mówili,  że  cząstki  podlegają 
statystyce  Maxwella-Boltzmanna  (M.B.).  W mecha- 
nice kwantowej  cząstki  są  nierozróżnialne,  ale  możli- 
we są  dwa  przypadki:  albo  nie  ma  ograniczeń  na 
liczbę  cząstek  w danym  stanie  kwantowym,  albo  też 
liczba  cząstek  w danym  stanie  kwantowym  nie  może 
przewyższać  jedności.  W pierwszym  z nich  mówimy 
o statystyce  Bosego-Einsteina  (B.E.)  lub  po  prostu 
Bosego,  a cząstki  nazywamy  bozonami,  w drugim  — 
o statystyce  Fermiego-Diraca  (F.D.)  lub  po  prostu 
Fermiego,  a cząstki  nazywamy  fermionami.  Aby 
zrozumieć  różnicę  między  tymi  trzema  możliwościa- 
mi, popatrzmy  na  rys.  4,  gdzie  przedstawiono  roz- 
mieszczenie dwóch  cząstek  w trzech  stanach.  Dla 
cząstek  podlegających  statastyce  F.D.  możliwe  są 
tylko  trzy  stany  Ay  B,  C,  dla  cząstek  podlegających 
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statystyce  B.E.  — wszystkie  stany  A-F.  Jak  widzimy, 
każdemu  ze  stanów  A,  B,  C odpowiadają  po  dwa 
stany  układu  klasycznego.  Razem  mamy  3 różne 
rozmieszczenia  w wypadku  statystyki  F.D.,  6 w wy- 
padku — B.E.  i 9 w razie  — M.B.  Ogólne  wyrażenia 
na  liczbę  Wi  rozmieszczeń  cząstek  w zależności  od 
gi  i Ni  mają  postać : 


Wi  = 


(dla*'  > N,)  ~ FD- 

fo+M-1)! 

Ni\(gi- 1)! 


— B.E. 


■f1 


M.B. 


Wyprowadzenie  tych  wzorów  można  znaleźć  w każ- 
dej niemalże  książce  poświęconej  kombinatoryce  czy 
rachunkowi  prawdopodobieństwa,  dlatego  też  pozwo- 
limy je  sobie  opuścić. 

Ogólna  liczba  sposobów  rozmieszczenia  cząstek 
nierozróżnialnych  jest  równa  iloczynowi  wszystkich 
Wi  dla  wszystkich  różnych  wartości  /,  natomiast  dla 
cząstek  rozróżnialnych  trzeba  taki  iloczyn  jeszcze  po- 
mnożyć przez  czynnik  Nl/Ny.  Nzl ...  Nil ...  (N  — 
= A^i+N2,  ...),  określający  na  ile  sposobów  można 
wydzielić  z N rozróżnialnych  cząstek  grupy  po  Nu 
Niy...y  Ni...  cząstek.  Zgodnie  z tym  co  zauważył 
Gibbs,  rezultat  dla  cząstek  rozróżnialnych  należy  poza 
tym  podzielić  przez  NI.  Zatem  wzory  na  liczbę  możli- 
wych stanów  będą  miały  postać: 


M = 


n 


gil 

Ni\(gi-Nt)\ 


n(gi+Ni-iy. 

Ni\(gi- 1)! 

r7  — 

i 1 Nil 


— F.D. 

— B.E. 

— M.B. 


przy  spełnieniu  warunku,  że  2 E1N1  — E oraz  że 

1 

Ni  = N.  Wielkość  M oznacza  liczbę  stanów  przy 
1 

określonych  liczbach  cząstek  Nly  N»y  ...,  Ni ...  . Aby 
otrzymać  całkowitą  liczbę  stanów  trzeba  zsumować 
takie  wyrażenia  na  M po  wszystkich  możliwych  Ni 
spełniających  dwa  wypisane  warunki.  Skorzystamy 
teraz  ze  wzoru  Stirlinga,  który  ma  postać: 

ln  (jc!)  x(Injc—  1)  przy  x ->  00, 

co  oznacza,  że  iloraz  obydwu  stron  dąży  do  jedności 
przy  x -»■  00.  Związek  taki  zachodzi  dla  ekstensyw- 
nych Ni  i gi  ( Niy  gi  00):  ze  wzoru  Stirlinga  zasto- 
sowanego do  M podanych  wyżej  wynika,  że  ln  M 
jest  również  wielkością  ekstensywną.  Aby  to  udo- 
wodnić zauważmy,  że  nawet  gdy  M ' jest  równe  M to 
ln(Af-fAT)  = ln  Af+ln  2 ^ ln  M. 

Warunek  na  maksimum  M (równoważny  warun- 
kowi na  maksimum  ln  M)  przy  ustalonej  energii 
i całkowitej  liczbie  cząstek  można  zapisać  jako  zni- 
kanie różniczki  (stosujemy  tutaj  metodę  mnożników 
Lagrange’a): 

d[\nM-p  £ EiNi+fr  JT  jVi)  = O, 

l l 

gdzie  zmienne  Ni  można  traktować  obecnie  jako  nie- 
zależne oraz  ze  względu  na  ich  ekstensywność  — 
ciągłe.  Wielkość  lnM  osiąga  maksimum  przy  Ni  —Jfiy 
gdzie 

gi  /F*DA 

Nt  ~ e-**e'Bi±l  * \B.E./’ 


Rys.  4.  Możliwe  rozmieszczenia  dwóch  cząstek  w trzech  stanach  — E 

zależą  od  statystyki,  której  te  cząsteczki  podlegają  Ni  — g^e^e  p l,  M.B, 
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Stałe  fi  i fi  należy  określić  z warunków 
J?EiNi=E,  JT1 /7*  = 

i i 

Pomnożenie  In  M przez  stałą  Boltzmanna  i podsta- 
wienie Ni  zamiast  Ni  daje  wartość  entropii.  Jeśli  po- 
służyć się  układem  otrzymanych  równości  i obliczyć 

i fjkr^ przy stałym  Ny  to  dostaniemy  k&>  stąd  P = 

zapełnienie  Wielkości  Ni/gi  mają  sens  najbardziej  prawdo- 

jednego  podobnego  i,  ze  względu  na  makroskopowość  Ni 
pozaomu  . , . /=- 

oraz  wielkość  ich  fluktuacji  ~]/  Ni , również  średniego 
zapełnienia  jednego  poziomu.  Na  to,  ażeby  Ni  dla 
statystyki  B.E.  były  dodatnie,  jeśli  — jak  zazwyczaj  — 
przyjąć,  że  najniższa  wartość  Ei  = 0,  potrzeba  aby 
^ 1,  tj.  fi  ^ 0.  Jeśli  nie  obowiązuje  prawo  za- 
chowania liczby  bozonów,  jak  np.  dla  fotonów,  które 
podlegają  emisji  i absorpcji,  to  warunku  £ Ni  = N 

nie  trzeba  wprowadzać,  dzięki  czemu  fi  = 0.  Podob- 
nie jak  można  się  przekonać,  anharmoniczność 
drgań  sieci  prowadzi  do  niezachowania  liczby  fono- 
nów, dzięki  czemu  dla  nich  również  fi  = 0.  Jeśli 
ę-pn  l 9 co  odpowiada  wysokim  temperaturom 

i małym  gęstościom,  to  Ni  dla  obydwu  statystyk 
kwantowych  dążą  do  wartości  klasycznej  statystyki 
M.B.  Nie  jest  to  bynajmniej  własność  wyróżniająca 
gazy  doskonałe,  bowiem  wszystkie  ciała  makrosko- 
powe wykazują  odstępstwa  od  klasycznego  opisu 
w granicy  niskich  temperatur  i dużych  gęstości  oraz 
zachowują  się  klasycznie  w sytuacji  odwrotnej.  Gra- 
nica ta,  dla  różnych  zjawisk  i ciał,  może  odpowiadać 
różnym  zakresom  temperatur  i gęstości. 

Należy  odróżnić  rozkład  kanoniczny  Gibbsa,  w któ- 
rym Ei  jest  ekstensywną  energią  układu,  od  rozkła- 
dów F.D.,  B.E.  i M.B.,  w których  Ei  jest  intensywną 
energią  jednej  cząstki.  Dzięki  temu  nie  ma  sprzecz- 
ności między  rozkładami  F.D.  i B.E.  a rozkładem 
kanonicznym.  Jeśli  zamiast  Ei  podstawić  p2/2m , 
uwzględnić  fakt,  że 

SiKEi)  = j d3p/(p2/2m ) 

i 

i obliczyć  wielkość  e^  dla  rozkładu  M.B.,  to  można 
otrzymać  rozkład  Maxwella  w postaci 

f(p2l2m)  = -^-h3  j . 

Ponadto,  jeśli  dla  rozkładu  M.B.  In  M jest  wielkością 
ekstensywną,  to  In  (N\M),  a więc  przed  podzieleniem 
przez  NI,  zawiera  składnik  N(\nN-\)  i wielkością 
ekstensywną  nie  jest.  Fakt  ten  uprawomocnia  para- 
doks Gibbsa,  rozważany  poprzednio. 


Aktualne  problemy  termodynamiki 
statystycznej 

Trudno  byłoby  stwierdzić,  że  udało  się  nam  tutaj 
przedstawić  współczesne  oblicze  termodynamiki 
statystycznej,  zajęliśmy  się  raczej  zapoznaniem  Czy- 
telnika z niezbędnym  arsenałem  środków  najpow- 
szechniej w niej  używanych.  Przejdziemy  teraz  do 
zagadnień  bardziej  aktualnych.  Ograniczymy  się  na 
razie  do  termodynamiki  statystycznej  stanów  równo- 
wagi. Do  otrzymania  równowagowych  funkcji  termo- 
dynamicznych wystarcza  obliczenie  sumy  stanów  Z 
lub  też  M(E,  ÓE).  Niestety,  dla  układów  cząstek 
oddziałujących  jest  to,  ogólnie  biorąc,  niemożliwe. 
Dlatego  też  oblicza  się  te  wielkości  w sposób  przy- 
bliżony dla  pewnego  zakresu  temperatur  lub  gęstości 
bądź  też  dla  pewnych  szczególnych  modeli  oddziały- 
wania. Rozwinięto  ponadto  metody  pozwalające 
obliczyć  funkcje  termodynamiczne,  gdy  odziaływa- 
nie  międzycząstkowe  jest  słabe. 


Omówimy  pokrótce  przybliżone  metody  oblicza- 
nia funkcji  termodynamicznych.  Dla  niskich  tempera- 
tur, a więc  w układzie  słabo  wzbudzonym,  jego  wzbu- 
dzenia można  opisać  w języku  kwazicząstek  (->  Wzbu- 
dzenia elementarne  w ciałach  stałych).  Kwazicząstki  te 
podlegają  określonej  statystyce  kwantowej  — B.E. 
lub  F.D.  Stąd  obliczenie  pewnych  funkcji  termodyna- 
micznych w granicy  niskotemperaturowej  daje  się 
sprowadzić  do  obliczenia  analogicznych  funkcji  dla 
gazu  kwazicząstek.  Dlatego  właśnie  gaz  kwantowy 
doskonały  ma  tak  doniosłe  znaczenie  w wyjaśnianiu 
niskotemperaturowych  własności  układów  z silnym 
oddziaływaniem  międzycząstkowym.  Z kolei,  przy 
dostatecznie  wysokich  temperaturach,  kwantowość 
przestaje  odgrywać  istotną  rolę,  co  pozwala  znacznie 
uprościć  obliczenie  funkcji  termodynamicznych. 

Jeśli  przyjąć  normalną  postać  energii,  tj.  e(r)  = 
= ^kin+  £4  to  wykonanie  w sumie  stanów  Z (zob.  10) 
całki  po  pędach  staje  się  trywialne  i obliczenie  Z 
sprowadza  się  do  obliczenia  całki  z funkcji  e~vtkT  po 
współrzędnych  położenia  cząstek.  Energia  potencjalna 
gazów  V jest  z dobrą  dokładnością  sumą  energii 
potencjalnej  oddziaływania  wszystkich  par  cząstek. 
Dla  takich  V znaleziono  bardzo  efektywne  metody 
obliczania  Z,  zwane  metodami  rozwinięć  grupowych. 
Nie  pozwalają  one  wprawdzie  obliczyć  Z dowolnej 
funkcji  oddziaływania  dwóch  cząstek,  ale  umożli- 
wiają, poza  dowodem  pewnych  własności  ogólnych, 
np.  rozwiązanie  zagadnienia  przy  granicznie  małej 
gęstości.  W tym  wypadku  zasięg  oddziaływania  dwu- 
cząstkowego  jest  znacznie  mniejszy  od  średniej 
odległości  między  cząstkami. 

Dzięki  temu  dowolna  wybrana  cząstka  oddziałuje 
z pozostałymi  stosunkowo  rzadko,  co  daje  możliwość 
ropyiazania  zagadnienia  przy  granicznie  małych  war- 
tościach N/V.  Zagadnienie  obliczania  Z w sytua- 
cjach granicznych  nie  zostało  tu  wyczerpane.  Cho- 
dziło bowiem  tylko  o uwidocznienie  podstaw  fizycz- 
nych takich  obliczeń. 

Przejdźmy  do  omówienia  pewnych  modeli  oddziały- 
wania. Oczekuje  się  wówczas,  że  ln  Z da  się  obliczyć 
asymptotycznie  dokładnie  w granicy  termodyna- 
micznej. Takich  modeli  może  można  znaleźć  i dużo, 
niestety  niewiele  z nich  ma  coś  wspólnego  z rzeczy- 
wistością fizyczną.  Wśród  tych  chlubnych  wyjątków 
wymieńmy  międzyelektronowe  oddziaływanie  Bardee- 
na-Coopera-Schrieflfera,  opisujące  całkiem  poprawnie 
termodynamikę  nadprzewodników  oraz  model  Isinga. 
Model  ten  może  opisywać  własności  magnetyczne 
niektórych  substancji  lub  też  stop  dwuskładnikowy. 
Omówimy  niektóre  cechy  tego  modelu. 

Wyobraźmy  sobie  regularną  sieć  krystaliczną. 
W każdym  jej  węźle  j znajduje  się  moment  magne- 
tyczny Sj,  przyjmujący  dwie  wartości  ±1  (rys.  5). 


Rys.  5.  Układ  16  mo- 
mentów magnetycznych ; 
strzałka  do  góry  oznacza 
wartość  Sj  = -fi , w dół 
Sf  = —1.  Węzły  ozna- 
czone kółkami.  Energia 
układu  wynosi  —H—Aj 


Oddziaływanie  momentów  ze  sobą  oraz  z zewnętrz- 
nym polem  magnetycznym  H ma  postać 

E=-  2 HSj-J 2 SjSk, 
i u*> 

gdzie  pierwsza  suma  przebiega  wszystkie  N węzłów 
sieci  krystalicznej,  druga  zaś  — wszystkie  pary  ( jk ) 
najbliższych  sąsiadów  w sieci.  Aby  obliczyć  sumę 


metody 

rozwinięć 

grupowych 


model  Isinga 


58 


stanów  Z należy  E podstawić  na  miejsce  Ei  i wysu- 
mować  po  wszystkich  możliwościach  Sj  = ±1, 
liczba  tych  możliwości  jest  dana  przez  2N.  Jeżeli  H>  0 
i J > 0,  to  najniższa  wartość  E jest  osiągana,  gdy 
wszystkie  Sj  — 1,  natomiast  przy  H = 0 również 
średni  wtedy,  gdy  wszystkie  Sj  = —1.  Obliczmy  średni  mo- 
moment  sieci  ment  sieci  przypadający  na  jeden  węzeł  (wielkość 
intensywna).  W tym  celu  wielkość  <r  = (X  Sj)/N 

trzeba  pomnożyć  przez  Z~1c~E,kT  i wysumować  po 
wszystkich  Sj  — ±1.  Jeśli  H — 0,  to  przy  skończo- 
nych N wielkość  ta  znika,  ponieważ  prawdopodobień- 
stwo dowolnego  układu  momentów  Sj  jest  wtedy 
dokładnie  równe  prawdopodobieństwu  układu  Sj 
zorientowanych  przeciwnie.  Stąd  przy  skończonych 
N lim  <or)jv  = 0 (gdzie  <...)isr  oznacza  wartość 

H-+  0 

średnią  przy  ustalonym  N ) ze  względu  na  ciągłą 
zależność  prawdopodobieństwa  od  H.  Może  się  jed- 
nak zdarzyć,  że  granica  termodynamiczna  i granica 
H 0 są  nieprzemienne,  tj.  że 

lim  lim  <<*>#  ^ lim  lim  <cr>tf  — 0, 

H — .0  N — ►«>  N — >00  H — >0 

przy  T < Tk  zwanej  temperaturą  krytyczną.  Przykład 
zależności  od  Hy.  przy  różnych  N i przy  usta- 
lonej temperaturze  w zakresie  0 < T < 7*,  poka- 
zano na  rys.  6.  Mniejszym  N odpowiadają  krzywe 
położone  bliżej  osi  poziomej.  Krzywa  najdalsza,  nie- 
ciągła w punkcie  H = 0 granica  ciągu  funkcji  ciąg- 
łych < cr}y , odpowiada  granicy  termodynamicznej. 


Rys.  6.  Zależność  średniego  momentu  sieci  przypadającego  na 
jeden  węzeł  <cr>.v  od  poła  magnetycznego  H 


Jeśli  wielkość  lim  lim  <<x)xy  nie  znika,  to  nazy- 

H-+  0 N-^  oo 

wamy  ją  momentem  spontanicznym  na  jeden  węzeł. 
Pojawienie  się  momentu  spontanicznego  przy  T = Tk 
oznacza  przejście  fazowe  od  fazy  paramagnetycznej 
do  ferromagnetycznej.  W punkcie  T = Tk  drugie  po- 
chodne ln  Z względem  H i Ty  związane  z podatnością 
magnetyczną  i ciepłem  właściwym,  mają  osobliwość. 
Dla  skończonych  N jest  to  niemożliwe,  bowiem  Z 
jest  wtedy  sumą  1N  dodatnich  funkcji  zmiennych  H 
i T , ciągłych  i różniczkowalnych  dowolną  ilość  razy. 
Widzimy  z tego,  że  poza  granicą  termodynamiczną 
przejście  fazowe  nie  istnieje.  W rzeczywistości  mamy 
do  czynienia  z bardzo  dużą,  ale  skończoną  liczbą 
cząstek.  W tym  wypadku  np.  biegun  funkcji  termo- 
dynamicznej przechodzi  w bardzo  ostre  maksimum, 
o wartości  zależnej  od  N.  Zbadanie  tej  zależności  jest 
interesujące  zarówno  z teoretycznego  jak  i doświad- 
czalnego punktu  widzenia.  Niestety,  dokładność  po- 
miarów jest  na  ogół  niewystarczająca  do  jej  wyja- 
śnienia. 

W latach  dwudziestych  E.  Ising  wykazał,  że  łań- 
cuch jednowymiarowy  nie  ma  przejścia  fazowego. 
W latach  czterdziestych  L.  Onsager  otrzymał  do- 
kładne funkcje  termodynamiczne  modelu  Isinga  dla 
sieci  kwadratowej  płaskiej.  Okazało  się,  że  przejście 
fazowe  występuje  przy  kTk  = 2/[ln(}/2 -f  l)]“ł  ^ 


» 2,269185/.  Było  to  pierwsze  przejście  fazowe 
obliczone  w sposób  ścisły  na  podstawie  modelu 
oddziaływania. 

Wiadomo  również,  że  przejście  fazowe  występuje 
w wypadku  sieci  trójwymiarowych,  choć  dokładnych 
funkcji  termodynamicznych  i Tk  dotychczas  dla  nich 
nie  znaleziono. 

Osobliwości  funkcji  termodynamicznych  prowadzą 
do  wzrostu  fluktuacji  momentu  magnetycznego  przy 
T -►  Tk.  Ponadto  w otoczeniu  Tk  momenty  magne- 
tyczne zaczynają  się  porządkować.  Stąd,  jeśli  w jakim- 
kolwiek miejscu  pojawi  się  fluktuacja  momentu,  to 
spowoduje  ona  uporządkowanie  w dużym  obszarze 
wokół  tego  miejsca.  Można  więc  stwierdzić,  że  pro- 
mień korelacji  fluktuacji  momentu  rośnie  przy  T Tk. 

Ze  względu  na  wzrost  fluktuacji  i ich  promienia  kore- 
lacji, fluktuacje  stają  się  makroskopowe  przy  T ->  Tk. 

Daje  to  możliwość  niekwantowego  potraktowania 
pola  fluktuacji  i operowania  nim  jako  obiektem 
wyjściowym  dla  teorii.  Pozwoliło  to  wyznaczyć  postać 
asymptotyczną  funkcji  termodynamicznych  przy 
T Tk  i stało  się  źródłem  szybkiego  rozwoju  teorii 
przejść  fazowych  w ostatnim  dziesięcioleciu,  mimo 
braku  wyraźnego  postępu  w zakresie  modeli  dokład- 
nie rozwiązalnych.  Zasadnicza  rola  klasycznego  pola 
fluktuacji  w pobliżu  Tk  powoduje,  że  przejścia  fazowe, 
niezależnie  od  różnicy  ich  mechanizmów,  stają  się 
do  siebie  bardzo  podobne. 

Omawialiśmy  dotychczas  termodynamikę  staty- 
styczną stanów  równowagi.  Na  zakończenie  dołączmy 
parę  słów  o nierównowagowej  termodynamice  sta- 
tystycznej. Wyobraźmy  sobie,  że  na  znajdujący  się  nierównowa- 
w równowadze  układ  makroskopowy  podziałaliśmy  gowa  termo- 
polem  zewnętrznym,  wywołującym  zaburzenia  stanu  dynamika 
równowagi.  Prawdopodobieństwa  znalezienia  stanu  statystyczna 
kwantowego  / w zespole  zaczynają  zależeć  wtedy  od 
czasu,  podobnie  jak  i wartości  średnie  wielkości 
fizycznych.  Równania  opisujące  zmiany  tych  wielkości 
pod  wpływem  przyłożonych  pól  zewnętrznych  wy- 
wodzą się,  podobnie  jak  równowagowa  termodyna- 
mika statystyczna,  z równań  ruchu  oraz  podejścia 
statystycznego,  związanego  z niepełnym  opisem  ukła- 
du. Ostatnia  kwestia  wynika  z zainteresowania  jedy- 
nie wielkościami  makroskopowymi  opisującymi 
układ.  Otrzymane  równania  nie  mają,  z reguły, 
zamkniętej  postaci  układu  skończonej  liczby  n rów- 
nań dla  n niewiadomych  funkcji.  Układ  taki  udaje 
się  doprowadzić  do  postaci  zamkniętej  w szczególnych 
warunkach  fizycznych.  Dotyczy  to  przede  wszystkim 
gazów  rozrzedzonych,  tj.  takich,  dla  których  promień 
oddziaływania  międzycząsteczkowego  jest  znacznie 
mniejszy  od  średniej  odległości  między  cząsteczkami. 

Równania  dla  takiego  układu,  w przypadku  klasycz- 
nym, zostały  podane  przez  Boltzmanna  w latach 
siedemdziesiątych  ubiegłego  stulecia.  Mają  one  kształt 
równań  bilansu  prawdopodobieństwa  w przestrzeni 
fazowej  jednej  cząstki,  przy  czym  zderzenia  między- 
cząstkowe  grają  istotną  rolę  w bilansie.  Podobnie 
można  z reguły  podać  zamknięty  układ  równań 
dla  układów  słabowzbudzonych,  kiedy  możemy 
posłużyć  się  obrazem  kwazicząstek,  przy  czym  wła- 
sności kwantowe  ich  gazu  są  bardzo  istotne.  Można 
wreszcie  mówić  o zamknięciu  układu  równań  dla 
niektórych  modeli  oddziaływania.  Podobnie  można 
przewidzieć  nierównowagowe  własności  układów 
w pobliżu  punktu  krytycznego  Tk.  Dodajmy  jeszcze, 
że  listę  tę  trudno  jest  wyczerpać. 

We  wszystkich  sytuacjach  równania  istotnie  uprasz-  słabo  polo 
czają  się,  gdy  pole  zaburzające  jest  na  tyle  słabe,  zaburzając© 
że  odchylenie  od  równowagi  można  uznać  za  liniową 
funkcję  pola.  Prawa  Ohma  czy  Fouriera  wynikają 
z nierównowagowej  termodynamiki  statystycznej 
właśnie  jako  rezultat  takiego  zlinearyzowanego 
podejścia.  Podobnie,  jeśli  pole  zmienia  się  bardzo 
słabo  na  średniej  odległości  międzycząstkowej,  to 
reakcję  układu  na  pole  można  potraktować  w sposób 
makroskopowy,  co  znakomicie  upraszcza  zarówno 
równania  jak  i ich  rozwiązania. 
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Należy  stwierdzić,  że  bardziej  ścisłe  lub  dokładne 
rozwiązanie  zagadnienia  wielu  oddziałujących  cząstek 
jest  bardzo  często  trudne  lub  wręcz  niemożliwe.  Jest  to 
przyczyną  rozwoju  wszelkiego  rodzaju  metod  ekstra- 
polacyjnych w termodynamice  statystycznej,  których 


dokładność  dość  trudno  oszacować.  Wspomniane 
trudności  sprawiają,  że  bada  się  również  nierówności 
dla  funkcji  termodynamicznych. 

L.  Landu,  E.  Lifszic  Fizyka  teoretyczna.  Fizyka  statystycz- 
na, Warszawa  1959;  F.  Rejf  Fizyka  statystyczna.  Warszawa  1971. 


Przejścia  fazowe  i zjawiska  krytyczne 

Bogusia  w Mrygoń 


Układy  fizyczne  złożone  z wielu  cząstek  (atomów, 
molekuł)  możemy  podzielić  na  dwa  rodzaje.  Do  pier- 
układy  wszej  kategorii  zaklasyfikujemy  takie  układy,  które 
cząstek  można  opisać  traktując  je  jako  zbiory  cząstek  nie- 
nieoddzia-  oddziałujących  ze  sobą.  Przykładem  takiego  układu 
fujących  jest  gaz  idealny  złożony  z nieoddziałujących  atomów 
lub  paramagnetyk,  w którym  oddziaływanie  momen- 
tów magnetycznych  atomów  jest  na  tyle  słabe,  że  nie 
wpływa  na  właściwości  magnetyczne  układu.  Drugą 
grupę  stanowią  układy,  których  nawet  w przybliżeniu 
nie  można  opisać  teoretycznie,  nie  uwzględniając 
mikroskopowych  oddziaływań.  Jeżeli  układ  taki 
znajduje  się  w odpowiednich  warunkach  zewnętrz- 
układy  nych,  to  mikroskopowe  oddziaływania  mają  charakter 
oząstok  zjawiska  kolektywnego,  które  w zależności  od  rodzaju 
oddziałują-  oddziaływań  przejawia  się  jako  określone  właści- 
cych  wości  makroskopowe  układu.  Dla  zilustrowania  tego 
wymienimy  kilka  najbardziej  typowych  układów, 
których  specyficzne  właściwości  są  wynikiem  kolek- 
tywnych oddziaływań  mikroskopowych.  Sponta- 
niczne namagnesowanie  kryształu  ferromagnetyczne- 
go jest  rezultatem  oddziaływania  wymiany  spinów 
atomowych. 

W metalach  w niskich  temperaturach  pojawia  się 
stan  nadprzewodnictwa,  który  jest  wynikiem  specy- 
ficznego (niekulombowskiego)  oddziaływania  elek- 
tronów. Krystaliczny  stan  skupienia  wynika  z oddzia- 
ływań międzyatomowych. 

W wymienionych  tutaj  przykładach  kolektywne 
oddziaływania  mikroskopowe  powodują  powstawa- 
nie określonych  stanów  układu,  którym  ogólnie 
można  przypisać  pewien  rodzaj  mikroskopowego 
uporządkowania.  Wyjątek  stanowi  kondensacja  ideal- 
nego gazu  Bosego.  Stan  układu  — lub  jego  części  — 
charakteryzujący  się  przestrzenną  jednorodnością 
makroskopową  i określonym  mikroskopowym  upo- 
faza  układu  rządkowaniem  nazywamy  fazą.  Układ  może  się  znaj- 
dować w danej  fazie  tylko  w ściśle  określonych  prze- 
działach wartości  zmiennych  termodynamicznych, 
takich  jak:  temperatura,  ciśnienie,  natężenie  pola 
magnetycznego.  W ogólności  możliwe  jest  istnienie 
kilku  faz  danego  układu.  Przejście  układu  od  jednej 
do  drugiej  fazy,  nazywane  ogólnie  przejściem  (prze- 
mianą) fazowym,  zachodzi  w określonych  warunkach 
termodynamicznych,  np.  gdy  temperatura  osiąga 
wartość  krytyczną  7*,  nazywaną  też  punktem  kry- 
tycznym układu.  Przejścia  fazowe  należą  do  zjawisk 
występujących  powszechnie  w różnych  układach 
fizycznych.  Najważniejsze  z nich  to:  zmiany  stanu 
skupienia,  przejścia  magnetyczne  typu  ferromagne- 
tyk-paramagnetyk,  przejścia  typu  porządek-niepo- 
rządek  w stopach  podwójnych  oraz  przejścia  do  stanu 
nadprzewodnictwa.  Lista  ta  nie  wyczerpuje  wszyst- 
kich przejść  fazowych,  które  występują  szczególnie 
w ciałach  stałych.  Z przejściami  fazowymi  związane 
są  zjawiska  nazywane  krytycznymi,  których  przeja- 
wem jest  charakterystyczne  zachowanie  się  w pobliżu 
punktu  krytycznego  niektórych  właściwości  układu, 
np.  ciepła  właściwego.  Mimo  ogromnych  różnic 
między  naturą  mikroskopowych  oddziaływań  w róż- 
nych układach,  przejścia  fazowe  i zjawiska  krytyczne 
zachodzące  w tych  układach  wykazują  wiele  wspól- 
nych cech  i analogii.  Fakt  ten  umożliwia  podanie 
ogólnego,  jednolitego  opisu  wszystkich  przejść 
fazowych  i zjawisk  krytycznych. 


W fenomenologicznym  opisie  zachowania  się  ukła-  termodyna- 
du  fizycznego  posługujemy  się  zbiorem  zmiennych  micznyopis 
termodynamicznych.  Dla  każdego  szczególnego  ukła-  przejścia 
du  możemy  wyodrębnić  wiele  zmiennych  termodyna-  fazowego 
micznych,  ale  do  kompletnego  opisu  jednoskładniko- 
wego układu  znajdującego  się  w jednej  fazie  wystarczą 
trzy  zmienne  termodynamiczne,  przy  czym  tylko 
dwie  z nich  są  zmiennymi  niezależnymi.  Liczbę 
zmiennych  niezależnych  n zwaną  liczbą  termodyna- 
micznych stopni  swobody  wyraża  się  wzorem 

n = c+2— r,  (1) 

gdzie  c jest  liczbą  niezależnych  składników  układu, 
a r — liczbą  faz  współistniejących  w równowadze. 

W zależności  od  wyboru  zmiennych  niezależnych 
określona  jest  charakterystyczna  funkcja  stanu.  Jeżeli 
do  opisu  gazu  złożonego  z Anatomów  wybierzemy  jako 
zmienne  niezależne  temperaturę  T i ciśnienie  py  to 
wszystkie  informacje  o zachowaniu  się  i właściwo- 
ściach układu  zawarte  są  w funkcji  stanu  G(T,  p) 
i możemy  je  otrzymać  z odpowiednich  związków 
termodynamicznych.  Funkcja  G(T,p ) jest  często  na- 
zywana potencjałem  Gibbsa.  Jeżeli  parę  zmiennych 
niezależnych  tworzy  temperatura  T i objętość  V 
układu,  to  funkcją  stanu  jest  F(TyV) — zwana  energią 
swobodną.  Wszystkie  możliwe  termodynamiczne 
funkcje  stanu  są  ogólnie  nazywane  potencjałami  ter- 
modynamicznymi, ponieważ  pracę  związaną  z przej- 
ściem układu  od  stanu  a do  stanu  b można  wyrazić 
przez  spowodowany  tym  przejściem  przyrost  funkcji 
stanu. 

Warunkiem  równowagi  termodynamicznej  układu 
jest  minimum  potencjałów  termodynamicznych 
(—►Termodynamika  fenomenologiczna)  przy  ustalo- 
nych wartościach  odpowiednich  zmiennych  niezależ- 
nych. Każdy  układ  zamknięty  osiąga  po  pewnym 
czasie  stan  równowagi  termodynamicznej.  Jeżeli  przej- 
ście fazowe  zachodzi  w dostatecznie  długim  cza- 
sie, to  możemy  założyć,  że  wszystkie  stany  pośrednie 
układu  w otoczeniu  punktu  krytycznego  są  stanami 
równowagi,  a więc  do  opisu  przejścia  fazowego  mo- 
żemy stosować  formalizm  termodynamiki  procesów 
odwracalnych. 

Rozpatrzmy  przy  ustalonej  temperaturze  T i ci-  układ 
śnieniu  p jednoskładnikowy  układ  (rys.  1),  który  znaj-  dwufazowy 
duje  się  w stanie  równowagi  dwu  faz  (układ  dwufa- 
zowy). Może  to  być  faza  ciekła  w kontakcie  z fazą 
gazową.  Ciecz  i gaz  mogą  współistnieć  w równowadze, 
jeżeli  temperatura  i ciśnienie  obydwu  faz  są  sobie 
równe.  Przyjmijmy,  że  Nx  i N2  oznaczają  odpowiednio 
liczby  atomów,  a i — wartości  potencjału  Gib- 
bsa na  jeden  atom  w obydwu  fazach  (jz  — G/N  jest 
potencjałem  chemicznym).  Funkcję  G(T,p)  możemy 
więc  wyrazić  wzorem: 

G(Ttp)  = Nlfh+N2p2.  (2) 

Ponieważ  ciśnienie  i temperatura  układu  są  stałe, 
warunek  na  minimum  potencjału  termodynamicznego  Rys.  i. 

(w  tym  wypadku  dG  — 0)  zredukuje  się  do  postaci: 

= 0.  (3) 

W rozpatrywanym  układzie  całkowita  liczba  atomów 
jest  zachowana  (dNx+dN2  = 0)  zatem 

= fh-  (4) 
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potencjał  Gibbsa 


Jest  to  jeden  z ważniejszych  wniosków  termody- 
namiki przejść  fazowych:  w obszarze  współist- 
nienia, a tym  samym  również  w punkcie  krytycz- 
nym, potencjały  chemiczne  obydwu  faz  są  sobie 
równe. 

przejścia  Analizując  fakty  doświadczalne,  Ehrenfest  wprowa- 
f azowe  dził  klasyfikację  przejść  fazowych;  przemianę  nazy- 
/7-tego  wa  się  przejściem  fazowym  /i-tego  rodzaju,  jeżeli  ko- 
rodzaju  lejne  pochodne  potencjału  Gibbsa  aż  do  (n  — l)-szej 
włącznie  są  funkcjami  ciągłymi,  natomiast  /i-ta  po- 
chodna ma  w punkcie  przejścia  nieciągłość  skokową. 
Zgodnie  z takim  określeniem,  potencjał  G i jego  po- 
chodne będą  miały  następujący  przebieg  względem 
każdej  zmiennej  niezależnej : przy  przejściu  I rodzaju 
funkcja  G jest  ciągła  załamana  (rys.  2a),  natomiast 
jej  pochodne  są  nieciągłe;  przy  przejściu  II  rodzaju 
funkcja  G jest  ciągła  gładka  (rys.  2b),  jej  pierwsza 
pochodna  jest  ciągła  załamana,  natomiast  wyższe  po- 
chodne są  nieciągłe.  Opis  przejść  fazowych  zastoso- 
wany w definicjach  Ehrenfesta  należy  traktować  jako 


a)  b) 

Rys.  2.  Przykłady  możliwych  przebiegów  potencjału  termody- 
namicznego w obszarze  przejścia  fazowego:  a)  I rodzaju,  b)  II  ro- 
dzaju 


ideał izację  rzeczywistych  przebiegów  funkcji  G i jej 
pochodnych.  Pochodne  te  mają  określony  sens  fi- 
zyczny, np.  ciepło  właściwe  przy  stałym  ciśnieniu 
wyraża  się  przez  drugą  pochodną  funkcji  G wzglę- 
dem temperatury: 


Obserwowane  w otoczeniu  punktu  krytycznego  prze- 
biegi wielkości  fizycznych  w układach  rzeczywistych 
o skończonych  rozmiarach  są  co  najwyżej  zbliżone 
przejścia  do  teoretycznie  przewidywanych  w klasyfikacji 
fazowe  Ehrenfesta.  Za  typowe  przejścia  I rodzaju  uważa  się 
li II rodzaju  zmiany  stanu  skupienia  oraz  zmiany  struktury  kry- 
stalicznej. Najczęściej  wymienianymi  przykładami 
przejść  II  rodzaju  są  przejścia  od  stanu  ferromagne- 
tycznego do  paramagnetycznego  w punkcie  Curie 
oraz  przejście  od  stanu  nadprzewodnictwa  do  stanu 
zwykłego  przewodzenia,  zachodzące  w temperaturze 
krytycznej  przy  nieobecności  zewnętrznego  pola 
magnetycznego.  Wiele  przejść  fazowych  nie  mieści 
się  w ogóle  w klasyfikacji  Ehrenfesta.  Znane  są  rów- 
nież inne  klasyfikacje  przejść  fazowych,  np.  oparta 
na  przebiegu  ciepła  właściwego  w pobliżu  tempera- 


tury krytycznej.  Istnieje  przy  tym  dość  duża  dowol- 
ność zaszeregowania  konkretnych  przejść  fazowych 
do  określonego  rodzaju. 

Na  rys.  3 przedstawiono  schematycznie  wykres  fa- 
zowy wszystkich,  z wyjątkiem  helu  (-►  Nadpłynność), 
substancji  jednoskładnikowych.  Krzywe  7,  2 i 3 od- 
dzielają obszary,  w których  substancja  występuje 
w określonym  stanie  skupienia  i nazywane  są  krzy- 
wymi równowagi  faz.  Dla  wartości  zmiennych  ter- 
modynamicznych, określonych  przez  te  krzywe, 
możliwe  jest  współistnienie  odpowiednich  faz  w rów- 
nowadze. W punkcie  wspólnym  trzech  krzywych  rów- 
nowagi mogą  zatem  współistnieć  trzy  fazy.  Punkt 
ten  nazywany  jest  punktem  potrójnym. 

Jak  już  wspomniano,  zmiany  stanu  skupienia  są 
przejściami  fazowymi  I rodzaju.  Przejścia  te  połą- 
czone są  z wydzieleniem  lub  pochłonięciem  ciepła 
(tzw.  utajone  ciepło  przemiany:  ciepło  parowania, 
ciepło  topnienia,  ciepło  sublimacji).  Wyjątek  stanowi 
przejście  fazowe  w punkcie  Ky  które  jest  ciągłe,  tzn. 
w punkcie  K można  przemienić  ciecz  w gaz  i odwrot- 
nie w sposób  ciągły.  Ciepło  przemiany  w punkcie  Ky 
zwanym  punktem  krytycznym,  znika.  W obszarach 
fazy  ciała  stałego  różnych  substancji  obserwujemy 
wiele  innych  przejść  fazowych,  których  przykłady 
podano  na  wstępie.  Zachowanie  się  substancji  w po- 
bliżu punktów  krytycznych  zlokalizowanych  w fazie 
stałej  (np.  krytyczne  zachowanie  magnetyków,  ferro- 
elektryków, nadprzewodników)  wykazuje  wiele  ana- 
logii do  zachowania  się  gazu  w pobliżu  punktu  kry- 
tycznego K.  Z tego  względu  omówimy  tu  bardziej 
szczegółowo  krzywą  równowagi  faz  w układzie  ciecz- 
-gaz. 

Przejście  ciągłe  w układzie  ciecz-gaz  odkryte  zo- 
stało w 1869  r.  przez  Andrewsa,  który  badał  zacho- 
wanie się  krytyczne  dwutlenku  węgla.  Zachowanie 
się  gazu  opisąne  jest  przez  równanie  stanu.  Zakłada- 
jąc, że  znamy  potencjał  oddziaływania  U(r)  między 
atomami,  możemy  dla  gazu  złożonego  z N atomów 
w objętości  V napisać  ścisłe  równanie  stanu  w po- 
staci : 


NkT  W 

P = ~T~+1 V’ 


(6) 


zmiany  stanu 
skupienia 


punkt 

potrójny 


przejście 
fazowe 
w gazie 
rzeczywis- 
tym 


gdzie  k oznacza  stałą  Boltzmanna,  a W jest  wielko- 
ścią związaną  z siłami  międzyatomowych  oddziały- 
wań, nazywaną  wiriałem  sił  wewnętrznych: 


i-1  j-1 


(7) 


Wektory  n i rj  oznaczają  położenia  atomów,  a Fy 
jest  siłą,  z jaką  te  atomy  oddziałują.  Wyrażenie  (7) 
uwzględnia  oddziaływania  wszystkich  par  atomów 
w układzie,  przy  czym  aby  każda  para  była  liczona 
tylko  raz,  przed  znakiem  sumy  występuje  współczyn- 
nik 1/2.  Siła  F zależy  od  potencjału  £/(r),  którego 
kształt  jest  przedstawiony  na  rys.  4,  przy  czym 
F = —dU(r)/dr.  Pierwszy  wyraz  równania  (6),  tzw. 
ciśnienie  kinetyczne,  jest  związane  z energią  kine- 
tyczną atomów  i opisuje  zachowanie  się  gazu  ideal- 
nego, w którym  przejście  fazowe  nie  zachodzi. 
Drugi  wyraz  — ciśnienie  statyczne  — stanowi  po- 
prawkę do  równania  stanu  związaną  z energią  po- 


Rys.  3.  Schematyczny 
wykres  fazowy  substan- 
cji jednoskładnikowej 


Rys.  4.  Potencjał  oddzia- 
ływania międzyatomo- 
wego  w gazie  rzeczywis- 
tym. Widać,  że  przy  r>r0 
cU/dr  >0, zatem  działają 
siły  przyciągające,  nato- 
miast przy  r<r0  działają 
siły  odpychające 
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tencjalną  wzajemnego  oddziaływania  atomów.  W opi- 
sie gazu  rzeczywistego  posługujemy  się  różnymi  przy- 
bliżeniami równania  stanu  (6).  Rozpatrzymy  jedno 
z najbardziej  znanych  przybliżeń  tego  równania,  hi- 
storycznie znacznie  od  niego  wcześniejsze,  półempi- 
ryczne  równanie  van  der  Waalsa 

(/>+  (V-Nb)  = NkT,  (8) 

gdzie  stałe  a i b określane  są  dla  każdego  gazu  eks- 
perymentalnie. Stała  a związana  jest  z oddziaływa- 
niem między  atomami  (molekułami),  b — ze  skoń- 
czonymi rozmiarami  atomów.  Na  rys.  5 przedsta- 
wiona jest  typowa  izoterma  otrzymana  z równania 
(8).  Warunek  równowagi  (minimum  potencjału  ter- 
modynamicznego) można,  wykorzystując  tożsamo- 
ściowe związki  termodynamiki,  zapisać  w postaci 


Nierówność  ta,  nazywana  warunkiem  stabilności 
mechanicznej,  oznacza,  że  jeżeli  przy  stałej  tempera- 
turze ciśnienie  układu  wzrasta,  to  jego  objętość  musi 
maleć.  Z rys.  5 widać,  że  na  odcinku  BC  izoterma  van 
der  Waalsa  nie  spełnia  warunku  (9).  Oznacza  to,  że 
izotermy  otrzymane  z równania  (8)  są  przynajmniej 


Waalsa  odpowiadają  stany  cieczy  przegrzanej  i gazu 
przechłodzonego  — możliwe  w szczególnych  warun- 
kach. 

Rys.  6 przedstawia  rodzinę  izoterm  (8)  wykreślo- 
nych przy  wykorzystaniu  konstrukcji  Maxwella. 
Miejscem  geometrycznym  końcowych  punktów  fi- 
zycznych gałęzi  izoterm  jest  krzywa  BKC  (rys.  6) 
ograniczająca  obszar,  w którym  układ  nie  może 
w żadnym  wypadku  występować  jako  jednofazowy. 
Podobnie  otrzymuje  się  krzywą  równowagi  faz  AKD 
ograniczającą  obszar,  w którym  dwie  fazy  współ- 
istnieją w równowadze.  W obszarach  między  krzywą 
AKD  i BKC  możliwe  jest  występowanie  cieczy  prze- 
grzanej lub  gazu  przechłodzonego.  Punkt  K,  w któ- 
rym krzywe  BKC  i AKD  są  styczne,  tzn.  punkt  okre- 
ślony współrzędnymi  pky  K*,  Tk,  któremu  odpo- 
wiada nieskończenie  mała  długość  odcinka  AD  — 
nazywamy  punktem  krytycznym.  W punkcie  krytycz- 
nym 


Aby  stan  układu  w punkcie  krytycznym  był  stanem 
równowagi,  musi  znikać  również  druga  pochodna, 
tzn. 


Rys.  5.  Izoterma  opisana  równaniem  van  der  Waalsa 


Rys.  6.  Wykres  fazowy  gazu  rzeczywistego 


Warunek  ten  wynika  z ogólniejszych  rozważań  termo- 
dynamicznych. Spełnienie  obu  warunków  zostało  po- 
twierdzone doświadczalnie,  w granicach  dokładności 
pomiarów.  Z warunków  równowagi  stanu  krytycz- 
nego wynika,  że  ciepło  właściwe  gazu  przy  stałym  ci- 
śnieniu dąży  w punkcie  krytycznym  do  nieskończo- 
ności. Równania  (8),  (10)  i (11)  pozwalają  wyrazić 
temperaturę  krytyczną  7*,  ciśnienie  krytyczne  pk 
i objętość  krytyczną  Vk  przez  stałe  a i b: 


8 a 

Tk=Hr~bk'  Vk 


3 Nb,  Pk=±-JL.  (12) 


Wprowadzając  następnie  bezwymiarowe  zmienne 
zredukowane 


p=  pip*;  V=  V/Vk,  T — TfTk,  (13) 


otrzymujemy  zredukowane  równanie  van  der  Waalsa: 


W równaniu  tym  nie  ma  żadnych  stałych  charaktery- 
zujących dany  gaz.  Zatem  jest  to  równanie  stanu 
wszystkich  układów,  do  których  można  stosować  rów- 
nanie van  der  Waalsa.  Stany  dwóch  układów,  któ- 
rych zmienne  zredukowane  mają  takie  same  w-artości, 
nazywamy  stanami  odpowiednimi  lub  stanami  od- 
powiadającymi sobie.  Zredukowane  izotermy  okre- 
ślone równaniem  (14),  są  jednakowe  dla  wszystkich 
gazów.  Wynik  taki  jest  znany  jako  prawo  stanów 
odpowiednich.  Stany  krytyczne  wszystkich  gazów 
też  są  oczywiście  stanami  odpowiednimi.  Na  pod- 
stawie wyznaczonych  wartości  7*,  pk  i Vk  znajdu- 
jemy, że  dla  jednego  mola  gazu  zachodzi 


PkVk  = _3_ 
RTk  8 ' 


(15) 


w części  niefizyczne.  Wynika  to  z faktu,  że  równanie 
(8)  jest  tylko  przybliżeniem  równania  (6).  Niefizycz- 
ną  izotermę  van  der  Waalsa  można  poprawić,  posłu- 
konstrukcja  gojąc  się  tzw.  konstrukcją  Maxwella.  Polega  ona  na 
Maxwel!a  wykreśleniu  poziomego  odcinka  AD  (linia  przery- 
wana), który  łączy  dwie  gałęzie  izotermy  FA  i DG 
odpowiadające  fazie  ciekłej  i fazie  gazowej  układu. 
Z warunku  (4)  wynika,  że  odcinek  AD  należy  tak  wy- 
kreślić, aby  powierzchnie  Sx  i S2  były  sobie  równe. 
Między  punktem  A i D układ  jest  niejednorodny, 
tzn.  podzielony  na  dwie  fazy  współistniejące  w rów- 
nowadze. Odcinkom  AB  i CD  izotermy  van  der 


gdzie  R jest  stałą  gazową  niezależną  od  rodzaju 
gazu.  Zostało  stwierdzone  doświadczalnie,  że  stosu- 
nek (15),  nazywany  krytycznym,  rzeczywiście  jest 
prawie  taki  sam  dla  różnych  gazów.  Np.  wartość  sto- 
sunku krytycznego  wyznaczona  doświadczalnie  dla 
neonu  wynosi  0,295,  dla  argonu  0,290,  ksenonu  0,293, 
azotu  0,291,  tlenu  0,292,  etanu  0,288.  Średnia  dla 
wielu  gazów  wynosi  0,292.  Wprawdzie  niezgodność 
między  teoretycznym  wynikiem  (15)  i wartością  do- 
świadczalną stosunku  krytycznego  jest  dość  duża  (ok. 
25%),  ale  trzeba  pamiętać,  że  równanie  van  der 
Waalsa  jest  tylko  przybliżeniem  ścisłego  równania 
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krytyczny 


stany  odpo 
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stanu.  Niemniej  jednak  równanie  to  daje  ogólny 
i zgodny  jakościowo  z faktami  doświadczalnymi  opis 
przejścia  fazowego  w gazie  rzeczywistym. 

Można  podać  analogiczne  opisy  przejść  fazowych 
w innych  układach  fizycznych.  Dla  każdego  rodzaju 
układu  fizycznego  istnieją  charakterystyczne  zmienne 
termodynamiczne,  ale  ogólna  postać  związków  ter- 
modynamicznych jest  wspólna  dla  wszystkich  ukła- 
dów. Jeżeli  dokonamy  np.  następującej  zamiany 
zmiennych:  V ->  (M  oznacza  namagneso- 

wanie układu,  a H — natężenie  pola  magnetycznego), 
to  funkcje  termodynamiczne  wyrażone  w nowych 
zmiennych  będą  opisywały  układ  magnetyczny.  Po- 
tencjał termodynamiczny  G układu  magnetycznego 
jest  więc  funkcją  temperatury  T i natężenia  pola  H. 
Wzór  (5)  określa  w tym  wypadku  magnetyczne  ciepło 
właściwe.  Dla  każdego  układu  możemy  również 
wyprowadzić  odpowiednie  równanie  stanu.  Poniżej 
podamy  tylko  ogólne  charakterystyki  różnych  przejść 
fazowych  w wybranych  układach  fizycznych, 
przejścia  W temperaturze  Curie  w ferromagnetykach  lub 
magnetyczne  temperaturze  Nećla  w antyferromagnetykach  układ 
magnetyczny  przechodzi  od  stanu  paramagnetycznego 
do  ferro-  lub  antyferromagnetycznego  (-►  Teoria 
magnetyzmu).  Spiny  atomów  zorientowane  chaotycz- 
nie w fazie  para-  tworzą  poniżej  punktu  krytycznego 
odpowiednie  uporządkowanie  magnetyczne.  W ferro- 
magnetyku  powstaje  spontaniczne  namagnesowanie 
układu.  W antyferromagnetyku  wypadkowy  moment 
magnetyczny  układu  równy  jest  zeru,  można  nato- 
miast mówić  o spontanicznym  namagnesowaniu  pod- 
sieci. Są  również  znane  przejścia  typu  paramagnetyk- 
-ferrimagnetyk  (ferryty),  w których  faza  odpowiada- 
jąca uporządkowaniu  magnetycznemu  spinów  ma 
wypadkowe  namagnesowanie  wynikające  z niepełnej 
kompensacji  momentów  magnetycznych  dwu  pod- 
sieci. 

W punktach  przejścia  magnetycznego  niektóre 
wielkości  termodynamiczne  wykazują  anomalie  (rys. 
7,  punkt  Tc),  mające  ten  sam  charakter  w różnych 
magnetykach.  Bardzo  podobne  przejścia  fazowe  ob- 
serwuje się  w ferroelektrykach, 
przejścia  W wielu  kryształach  występują  przejścia  fazowe 
strukturalne  polegające  na  zmianie  symetrii  struktury  krystalicznej, 
w kryształach  Zachodzą  one  przy  zmianie  temperatury  lub  ciśnienia 
i są  najczęściej  przejściami  fazowymi  I rodzaju.  To- 
warzyszy im  wydzielenie  lub  pochłonięcie  ciepła 
(rys.  7,  punkty  Tkl  i 7*2). 


Rys.  7.  Ciepło  właściwe  żelaza  w funkcji  temperatury.  Punkt  Tc 
odpowiada  temperaturze  Curie  (przejście  magnetyczne).  W punk- 
tach Tki  i Tkt  zachodzą  przejścia  strukturalne.  Żelazo  w fazie 
fi  i ó tworzy  sieć  regularną  przestrzennie  centrowaną,  a w fazie 
y — płasko  centrowaną 


uporządko-  W dwuskładnikowych  stopach  o składzie  stechio- 
wanie  metrycznym  powstają  w określonych  temperaturach 
stopów  stany  mające  cechy  związku  chemicznego.  Oznacza 
to,  że  poniżej  temperatury  przejścia  fazowego  pow- 
staje faza  o całkowitym,  wzajemnym  uporządkowa- 
niu dwóch  rodzajów  atomów  A i By  np.  AB  AB  AB ... . 
Wzajemne  położenia  atomów  A i B powyżej  tempera- 
tury krytycznej  są  zupełnie  przypadkowe. 


Wiele  metali  i stopów  ochłodzonych  do  dostatecz- 
nie niskich  temperatur  staje  się  nadprzewodnikami. 
Zjawisko  to  stwierdzono  w próbkach  ponad  30% 
pierwiastków  i więcej  niż  1000  stepów.  W fazie  nad- 
przewodzącej znika  opór  elektryczny  (-►  Nadprze- 
wodnictwo), przy  czym  przejście  od  stanu  przewo- 
dzenia normalnego  do  stanu  nadprzewodnictwa  jest 
bardzo  ostre.  Ponadto  nadprzewodnik  umieszczony 
w słabym  polu  magnetycznym  zachowuje  się  jak  do- 
skonały diamagnetyk,  tzn.  indukcja  magnetyczna 
wewnątrz  nadprzewodzącego  kryształu  jest  równa 
zeru  (zjawisko  Meissnera).  Przejście  od  stanu  nad- 
przewodnictwa do  stanu  przewodzenia  normalnego 
może  być  spowodowane  wzrostem  temperatury  po- 
wyżej wartości  krytycznej  7*  lub  zewnętrznym  polem 
magnetycznym  o natężeniu  większym  od  wartości 


krytycznej  Hk.  Temperatury  krytyczne  zbadanych 
nadprzewodników  znajdują  się  w przedziale  0,1-20  K. 
Natężenie  pola  krytycznego  Hk  jest  funkcją  tempera- 
tury (rys.  8). 

Charakterystyczną,  doświadczalnie  stwierdzoną 
cechą  wszystkich  przejść  fazowych  jest  anomalne  za- 
chowanie się  niektórych  wielkości  termodynamicz- 
nych, gdy  układ  zbliża  się  do  punktu  krytycznego. 
Charakter  anomalnego  przebiegu  wielkości  termody- 
namicznej /(fi)  w otoczeniu  punktu  krytycznego  moż- 
na przedstawić  w ogólnej  postaci: 

/(fi)~ev,  gdy  £->0,  (16) 


gdzie  fi  = |T- 7*1/7*  oznacza  zredukowaną  odległość 
od  punktu  krytycznego  na  osi  temperatury,  a v jest 
tzw.  wykładnikiem  krytycznym.  Zależność  (16)  nie 
oznacza,  że  wartość  wielkości  /(e)  jest  proporcjonalna 
do  prostego  wyrażenia  potęgowego  £v,  a określa  jedynie 
charakter  zachowania  się  tej  wielkości,  gdy  T->Tk. 
Przy  założeniu,  że /(e)  jest  funkcją  dodatnią,  wykład- 
nik krytyczny  jest  zdefiniowany  następująco: 


In  /(fi) 
ln£ 


(17) 


Z zależności  (16)  widać,  że  jeżeli  v > 0,  to  funkcja 
/(fi)  dąży  do  zera,  gdy  T~>Tk.  Dla  v < 0 funkcja  f(e) 
w punkcie  krytycznym  jest  rozbieżna  do  nieskoń- 
czoności. Gdy  funkcja  f(e)  jest  w temperaturze  kry- 
tycznej rozbieżna  logarytmicznie  lub  ma  wartość 
skończoną,  to  v = 0.  Dla  danego  przejścia  fazowego 
można  wprowadzić  zbiór  wykładników  krytycznych, 
przypisując  każdej  zachowującej  się  krytycznie  wiel- 
kości termodynamicznej  odpowiedni  wykładnik  kry- 
tyczny. Wartości  wykładników  krytycznych  wyznacza 
się  albo  doświadczalnie,  albo  teoretycznie,  rozpatru- 
jąc odpowiedni  model  oddziaływań  w danym  układzie 
fizycznym.  Tak  więc  za  pomocą  jednej  ogólnej  relacji 
typu  (16)  można  w sposób  przybliżony  opisać  w oto- 
czeniu punktu  krytycznego  przebieg  wszystkich  wiel- 
kości termodynamicznych  zachowujących  się  kry- 
tycznie, niezależnie  od  rodzaju  układu  fizycznego 
i typu  przejścia  fazowego. 

Istnienie  wykładników  krytycznych  nie  wynika 
z ogólnych  zasad  termodynamiki.  Relację  (16)  można 
wyprowadzić  z jednego  założenia  dotyczącego  poten- 
cjału termodynamicznego.  Wyraża  się  ją  w formie 
hipotezy,  że  potencjał  Gibbsa  jest  funkcją  jednorodną 
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zredukowanej  temperatury  s oraz  drugiej  zmiennej 
A — właściwej  dla  tej  funkcji  stanu  i danego  układu 
fizycznego.  Jeżeli  G(e , ^4)  jest  funkcją  jednorodną,  to 
zachodzi  dla  dowolnych  wartości  X następująca  rów- 
ność: 

G(X«e,  XbA)  = XG(et  A)  (18) 

(a  i b — pewne  parametry).  Funkcja  jednorodna  ma 
tę  właściwość,  że  jeżeli  znamy  jej  wartości  wzdłuż 
dowolnej  krzywej  otaczającej  początek  układu,  to 
możemy  wyznaczyć  jej  wartość  w dowolnym  punkcie 
przestrzeni  drogą  przeskalowania  układu  współrzęd- 
nych, gdy  znamy  wartości  parametrów  skalujących 
a i b.  Stąd  też  założenie  (18)  nazywane  jest  hipotezą 
skalowania.  Hipoteza  skalowania  pozwala  wyrazić 
wszystkie  wykładniki  krytyczne  dla  układu  opisanego 
funkcją  stanu  G(e , A)  przez  dwa  parametry  skalujące 
a i b.  Z faktu  tego  wynika,  że  wykładniki  krytyczne  nie 
są  wzajemnie  niezależne.  Związki  między  różnymi 
wykładnikami  krytycznymi  otrzymane  z hipotezy 
skalowania  są  ogólnie  nazywane  prawami  skalowa- 
nia. Jeden  z bardziej  znanych  związków  między  wy- 
kładnikami krytycznymi  opisującymi  przejście  fa- 
zowe w ferromagnetyku  ma  np.  postać: 

cc+2fi+y=2y  (19) 

gdzie  a,  /?,  y są  wykładnikami  krytycznymi  opisują- 
cymi zgodnie  z relacją  (16)  zachowanie  w pobliżu 
temperatury  7*  odpowiednio  magnetycznego  ciepła 
właściwego,  spontanicznego  namagnesowania  i po- 
datności magnetycznej.  W praktyce,  prawa  skalowa- 
nia typu  (19)  stanowią  bardzo  użyteczny  sprawdzian 
dokładności  przy  wyznaczaniu  wartości  wykładników 
krytycznych  z danych  doświadczalnych.  Hipoteza 
skalowania  nie  daje  możliwości  wyznaczenia  wartości 
wykładników  krytycznych,  a jedynie  pozwala  okre- 
ślić ogólne  związki  między  nimi.  Założenie,  że  po- 
tencjały termodynamiczne  są  funkcjami  jednorod- 
nymi, nie  zostało  udowodnione.  Tym  niemniej,  jed- 
nolity i w przybliżeniu  zgodny  z doświadczeniami 
opis  zjawisk  krytycznych,  jaki  uzyskujemy  zakładając 
potencjał  termodynamiczny  w postaci  (18),  pozwala 
sądzić,  że  hipoteza  skalowania  zawiera  w sobie  pewną 
ogólną  właściwość  wyidealizowanych  układów  fizycz- 
nych. 

Dla  pewnych  modeli  (np.  modelu  Isinga,  ->  Termo- 
dynamika statystyczna)  możliwe  jest  ścisłe  obliczenie 
funkcji  termodynamicznych,  jeżeli  z układem  prze- 
chodzimy do  granicy  termodynamicznej,  tzn.  dla 
N-> oo,  K->oo,  NjV=  const.  Przejścia  fazowe  w ta- 
kich modelach  związane  są  z punktami  osobliwymi 
funkcji  termodynamicznych.  Hipoteza  skalowania 
opisuje  układy  w granicy  termodynamicznej. 

Szczególnie  ciekawą  grupę  zjawisk  krytycznych 
tworzą  efekty  związane  z rozpraszaniem  promienio- 
wania przez  układ  znajdujący  się  w obszarze  przej- 
ścia fazowego.  Ośrodki,  które  w normalnych  warun- 
kach są  optycznie  przezroczyste,  w pobliżu  punktu 
krytycznego  stają  się  mętne.  Natężenie  promienio- 
wania rozproszonego  przez  układ  pod  kątem  wzglę- 
dem kierunku  fali  padającej  gwałtownie  rośnie,  gdy 
T->  Tk.  Zjawisko  to,  wyraźne  w gazie  rzeczywistym 
lub  w cieczach  podwójnych,  nazywane  jest  krytyczną 
opalescencją.  Temperaturowy  przebieg  zjawiska  po- 
kazany jest  na  rys.  9.  Zjawisko  krytycznej  opales- 


Rys.  9.  Krytyczna  opałescencja  w gazie 

nym  kątem  spowodowany  jest  przez  fluktuacje  gę- 
stości. (Pojęcie  fluktuacji  gęstości  wprowadził  do 
fizyki  Smoluchowski ; pociął  on  wyrażenie  na  prawdo- 
podobieństwo ich  powstawania).  W stanach  dale- 
kich od  punktu  krytycznego  fluktuacje  są  bardzo  małe 
i w opisie  właściwości  układu  można  je  pominąć. 
Gdy  temperatura  zbliża  się  do  punktu  kostycznego, 
lokalne  fluktuacje  gwałtownie  rosną,  dzięki  czemu 
układ  staje  się  przestrzennie  niejednorodny  i wyka- 
zuje strukturę  „ziarnistą”.  Fluktuacje  w pobliżu 
punktu  krytycznego  można  traktować  jako  pojawia- 
jące się  zarodki  nowej  fazy.  Krytyczna  opałescencja 
jest  wynikiem  rozpraszania  światła  na  fluktuacjach 
gęstości.  Analogiczne  zjawiska  występują  także  w in- 
nych układach  fizycznych.  Na  przykład,  w magnety- 
kach obserwuje  się  krytyczne  rozpraszanie  neutro- 
nów na  fluktuacjach  momentu  magnetycznego  w po- 
bliżu temperatury  Curie;  w stopach  podwójnych 
i ferroelektrykach  — krytyczne  rozpraszanie  promie- 
ni rentgenowskich. 

Teoria  krytycznego  rozpraszania  oparta  na  modelu 
Smoluchowskiego  nie  jest  jedyną  teorią  wyjaśniającą 
te  zjawiska.  Opis  teoretyczny  krytycznego  rozprasza- 
nia można  np.  uzyskać  na  podstawie  hipotezy  ska- 
lowania. 

W wynikach  doświadczalnych  dotyczących  przejść 
fazowych  i zjawisk  krytycznych  jest  wiele  niejasności, 
a teoria  tych  zjawisk  zawiera  liczne  luki  i kontro- 
wersje. W tej  dziedzinie  fizyki  prowadzi  się  intensywne 
badania,  a każdy  rok  przynosi  nowe  osiągnięcia. 
W ostatnich  latach  główny  wysiłek  badawczy  skiero- 
wany był  na  teoretyczne  i doświadczalne  wyznacza- 
nie wskaźników  krytycznych.  Jedną  z metod  wyzna- 
czania tych  wskaźników  jest  metoda  grupy  renorma- 
lizacyjnej,  podana  przez  K.  Wilsona  (1971  r.);  sta- 
nowi ona  konsekwentny  etap  rozwoju  teorii  skalo- 
wania. 


metoda 
grupy  renor- 
malizacyjnej 


H.E.  Stanley  Introduction  to  Phase  Transitions  and  Critical 
Phenomena , Oxford  1971  (tłum.  ros.,  Moskwa  1973). 


Elektrodynam  i ka 

Jan  Mostowski 


Trudno  jest  wyobrazić  sobie  współczesne  życie  bez 
elektryczności.  Urządzenia  wykorzystujące  zjawiska 
elektryczne  spotyka  się  dosłownie  na  każdym  kroku 
i nie  można  podać  dziedziny  życia,  w której  urządze- 
nia elektryczne  nie  odgrywają  roli. 


Tymczasem  historia  prac  nad  poznaniem  i wykorzy- 
staniem elektryczności  w zasadzie  nie  jest  długa,  ma 
dopiero  ok.  200  lat.  Wprawdzie  najprostsze  zjawiska, 
takie  jak  elektryzowanie  się  niektórych  ciał,  znane 
były  już  w starożytności,  ale  nie  było  wówczas  mowy 


64 


efekty  elek- 
tromagne- 
tyczne wy- 
magające 
badań 


zakres  sto- 
sowalności 
elektro- 
dynamiki 


0 ich  głębszym  zrozumieniu  lub  wykorzystaniu.  Do- 
piero w drugiej  połowie  XVIII  w.  rozpoczęto  iloś- 
ciowe badania  elektryczności.  Punktem  wyjścia  było 
stwierdzenie  Charlesa  Coulomba,  że  punktowe  ła- 
dunki działają  na  siebie  siłą  odwrotnie  proporcjonalną 
do  kwadratu  odległości  między  nimi. 

Wiek  XIX  to  okres  niesłychanie  intensywnych  prac 
zmierzających  do  wyjaśnienia  zjawisk  elektrycznych 

1 magnetycznych.  Ich  ukoronowaniem  stała  się  teoria 
Maxwella,  porządkująca  i systematyzująca  wszystkie 
zjawiska  elektryczne  i magnetyczne. 

Niemal  równocześnie  z badaniami  podstawowymi 
pojawiły  się  urządzenia  wykorzystujące  zjawiska  elek- 
tryczne do  celów  praktycznych. 

W XX  w.  powstała  nowa  gałąź  elektrodynamiki  — 
elektrodynamika  kwantowa,  która  opisuje  oddziały- 
wanie pola  elektromagnetycznego,  m.in.  o wielkiej 
częstotliwości,  z mikroskopowymi  obiektami,  głów- 
nie elektronami. 

Elektrodynamikę  można  obecnie  uważać  za  najdo- 
skonalszą teorię  fizyczną.  Jej  prawom  podlegają  za- 
równo pola  elektromagnetyczne  w przestrzeni  mię- 
dzygalaktycznej  i międzygwiezdnej,  jak  i we  wnętrzu 
atomu.  Elektrodynamika  opisuje  olbrzymie  bogactwo 
zjawisk  z dziedziny  spektroskopii  atomów  i molekuł, 
fizyki  plazmy  i wszystkich  innych  dziedzin  nauki, 
w których  występują  ładunki  elektryczne.  Należy  pod- 
kreślić, że  w żadnym  dotychczas  przeprowadzonym 
eksperymencie  nie  stwierdzono  odstępstw  od  przewi- 
dywań elektrodynamiki,  mimo  iż  niektóre  doświad- 
czenia były  przeprowadzane  z dokładnością  do  10“  4%. 
Żadna  inna  teoria  fizyczna  nie  może  się  szczycić  po- 
dobnymi sukcesami.  Nie  oznacza  to  bynajmniej,  że 
wszelkie  efekty  elektromagnetyczne  są  zrozumiałe, 
wiele  pozostało  do  zrobienia  w tej  dziedzinie.  Mo- 
żna tu  wymienić  kilka  ważnych  tematów,  nad  któ- 
rymi współcześnie  pracują  fizycy. 

Pierwsza  sprawa  wiąże  się  z optyką  i dotyczy  sil- 
nych pól  elektromagnetycznych  otrzymywanych  z la- 
serów. Duże  natężenie  pola  elektromagnetycznego 
panujące  w wiązce  światła  laserowego  może  powodo- 
wać występowanie  tzw.  zjawisk  nieliniowych.  Mimo 
że  podstawowe  prawa  oddziaływania  światła  z materią 
są  zrozumiałe,  to  jednak  ich  zastosowanie  do  opisu 
konkretnych  zjawisk  jest  sprawą  trudną  i nie  jest  jesz- 
cze jasne,  jaki  jest  mechanizm  powstawania  niektó- 
rych efektów.  Nowo  odkryte  nieliniowe  zjawiska  op- 
tyczne zachęciły  do  ogólnych  badań  nad  silnymi  wiąz 
kami  światła  i ich  oddziaływaniem  z materią  (-► 
Optyka  nieliniowa). 

Drugie  bardzo  ważne  zagadnienie  to  zakres  stoso- 
walności elektrodynamiki.  Jak  każda  teoria  fizyczna, 
tak  i elektrodynamika  została  oparta  na  doświadcze- 
niach przeprowadzonych  z określoną  dokładnością. 
Zwiększanie  dokładności  pomiarów  rozszerza  zakres 
stosowalności  teorii  lub  nakłada  na  nią  ograniczenia. 
W dalszym  ciągu  wykonuje  się  szereg  bardzo  subtel- 
nych doświadczeń,  mających  na  celu  sprawdzenie  po- 
prawności elektrodynamiki.  Nigdzie  nie  znaleziono 
odstępstw  od  elektrodynamiki,  rozszerzył  się  tylko 
zakres  jej  stosowalności. 

Trzecia  dziedzina  współczesnych  prac  nad  elektro- 
dynamiką to  kwestia  pewnych  sprzeczności  tkwiących 
w teorii  Maxwella.  Chodzi  tu  o zrozumienie  nieskoń- 
czonej energii  oddziaływania  punktowego  ładunku, 
np.  elektronu,  na  siebie.  Próby  modyfikacji  teorii 
Maxwella,  które  by  pozwoliły  usunąć  te  trudności, 
nie  dały  dotąd  pozytywnych  rezultatów,  lecz  są  ciągle 
na  nowo  podejmowane. 


Co  to  jest  elektrodynamika  klasyczna 

Elektrodynamika  jest  teorią  pola  elektromagnetycz- 
nego i ładunków  elektrycznych.  Wiemy,  że  między 
ładunkami  elektrycznymi  działają  siły.  Wyrażenie  opi- 
sujące te  siły  jest  dość  zawiłe,  więc  dla  wygody  wpro- 
wadzono pojęcie  pola  elektromagnetycznego. 


Wyobraźmy  sobie  dowolny  układ  ładunków  elek-  siła 
trycznych,  w którym  ładunki  mogą  się  poruszać,  działająca 
Układ  taki  wytwarza  wokół  siebie  pole  elektryczne  na  ładunek 
i magnetyczne.  Pola  te  charakteryzujemy  przez  po-  znajdujący 


danie  dwóch  wektorów:  E (natężenie  pola  elektrycz-  sję  ™ po*u 
— > filckf  roni3* 

nego)  i B (indukcja  pola  magnetycznego).  Istnienie  gnetycznym 
pola  elektromagnetycznego  wokół  ładunków  ozna- 
cza, że  na  dowolny  inny  ładunek  e działa  siła: 


F — eEĄ-evx  B, 

gdzie  v oznacza  prędkość  ładunku.  Wzór  ten  stanowi 
definicję  wektorów  E i B (rys.  1). 


Rys.  1.  Siła  działająca  na  cząstkę  o ładunku  e poruszającą  się 
z prędkością  v jest  sumą  dwóch  składowych  eE  i ev  X B 


Widzimy,  że  siła  działająca  na  ładunek  składa  się 
z dwóch  członów:  pierwszy  pochodzi  od  pola  elek- 
trycznego, drugi  — od  magnetycznego.  Jeśli  się  ła- 
dunek e nie  porusza,  to  działa  na  niego  tylko  siła 

ze  strony  pola  elektrycznego,  eE.  Jest  to  dobrze  znana 
siła,  za  pomocą  której  definiuje  się  wektor  natężenia 
pola  elektrycznego 

Jeśli  się  ładunek  e porusza,  działa  na  niego  dodat- 
kowo siła  ze  strony  pola  magnetycznego,  ev  x By  na- 
zywana siłą  Lorentza.  Jest  ona  prostopadła  do  kie- 
runku prędkości  ładunku  i definiuje  wektor  indukcji 
poia  magnetycznego. 

Znając  siłę  działającą  na  cząstkę  obdarzoną  ładun-  równanie 
kiem,  można  określić  jej  ruch.  Wyznaczony  on  jest  Newtona 
przez  równanie  Newtona: 

d — - — — 

-~7-mv  = eE+evx  2?, 

at 

gdzie  m jest  masą  cząstki. 

Jeśli  przez  m rozumiemy  zależną  od  prędkości  ma- 
sę m = mj ]/ 1 — v2/c2 , a przez  m0  — masę  spoczynko- 
wą cząstki,  to  równanie  powyższe  opisuje  poprawnie 
ruch  cząstki  o prędkości  zbliżonej  do  prędkości 
światła. 

Z tej  dość  zawiłej  postaci  równania  ruchu  wynika, 

że  w zależności  od  konkretnej  postaci  pól  E i B ruch 
ładunków  odbywa  się  po  różnych,  często  bardzo 
skomplikowanych  krzywych.  Powyższe  równanie 
ruchu  opisuje  więc  olbrzymie  bogactwo  zjawisk  za- 
chodzących np.  w rozrzedzonej  plazmie. 

Zajmijmy  się  teraz  dokładniej  samym  polem  elek-  pole  elektro- 
tromagnetycznym.  Zastanówmy  się,  czy  w ogóle  ko-  magnetyczne 
nieczne  jest  wprowadzanie  tego  pojęcia.  W istocie  nie 
powiedzieliśmy  nic  ponad  to,  że  ładunki  działają  na 
siebie  siłami.  Przyjmowanie,  że  jeden  ładunek  wy- 
twarza pole  elektryczne,  a drugi  doznaje  ze  strony  pola 
działania  siły,  może  się  wydać  sztuczną  komplikacją. 

Podobnie  jest  z siłami  magnetycznymi:  przewodnik, 
przez  który  płynie  prąd,  działa  siłą  na  poruszające  się 


5 - Encyklopedia  fizyki  współczesnej 
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ładunki  lub  na  igłę  magnetyczną,  ale  czy  koniecznie 
trzeba  tu  mówić,  że  prąd  elektryczny  powoduje  po- 
wstanie pola  magnetycznego? 

Pole  elektromagnetyczne,  pojęcie  wprowadzone 
przez  M.  Faradaya  (1830  r.)  w sposób  trochę  sztuczny, 
jako  pewna  interpretacja  oddziaływań  elektromagne- 
tycznych ładunków  elektrycznych,  okazało  się  jednak 
niesłychanie  głębokie.  Pełne  zrozumienie  konsek- 
wencji płynących  z postulatu  istnienia  pola  elektro- 
magnetycznego zawdzięczamy  J.  C.  MaxweIlowi 
(1861  r.).  Maxweli  uogólnił  wcześniej  znane  wyniki 
Faradaya,  Ampera  i in.  oraz  sformułował  słynne  rów- 
nania, zwane  równaniami  Maxwella,  opisujące  pole 
elektromagnetyczne. 

Pełny  układ  równań  Maxwella  jest  następujący: 


fodiyE  = q , 

U) 

- dB 

rotE= 

(2) 

div  i?  = 0, 

(3) 

- dE  - 

rot  B = +/, 

(4) 

gdzie  E oznacza  wektor  natężenia  pola  elektrycznego, 

B — wektor  indukcji  pola  magnetycznego,  e0  — 
przenikalność  dielektryczną  próżni,  /x0  — przenikal- 
ność  magnetyczną  próżni,  q — gęstość  ładunku  elek- 
trycznego, j — gęstość  prądu  elektrycznego. 

Treść  fizyczna  równań  Maxwella  jest  następująca: 
Z pierwszego  równania  wynika,  że  strumień  pola  elek- 
trycznego przechodzącego  przez  powierzchnię  otacza- 
jącą ładunek  jest  proporcjonalny  do  wartości  tego 
ładunku.  Ponadto  strumień  ten  nie  zależy  od  wielko- 
ści powierzchni  ani  od  jej  odległości  od  ładunku. 
Innymi  słowy,  liczba  linii  sił  pola  elektrycznego  prze- 
chodzącego przez  powierzchnię  otaczającą  ładunek 
jest  stała.  Jeśli  będziemy  oddalać  tę  powierzchnię  od 
ładunku  nie  zmieniając  jej  kształtu,  to  jej  pole  będzie 
rosnąć  proporcjonalnie  do  kwadratu  odległości  od 
ładunku.  A zatem  pole  elektryczne  ładunku  musi  być 
odwrotnie  proporcjonalne  do  kwadratu  odległości. 
Prawidłowość  ta  zwana  jest  prawem  Gaussa. 

Z drugiego  równania  Maxwella  wynika,  że  zmienne 
w czasie  pola  magnetyczne  wytwarza  wirowe  pole 
elektryczne.  Prawo  to  znane  jest  też  jako  prawo  in- 
dukcji Faradaya. 

Z trzeciego  równania  Maxwella  wynika,  że  w przy- 
rodzie nie  istnieją  ładunki  magnetyczne.  Linie  sił  pola 
magnetycznego  są  zawsze  zamknięte  — w przeciwień- 
stwie do  linii  sił  pola  elektrycznego,  które  mogą  się 
zaczynać  i kończyć  na  ładunkach  elektrycznych.  Ten 
brak  symetrii  między  polem  elektrycznym  i magne- 
tycznym stał  się  punktem  wyjścia  hipotezy  istnienia 
monopoli  magnetycznych. 

Czwarte  równanie  Maxwella  ma  najbardziej  złożo- 
ną postać.  Powiada  ono,  że  źródłami  pola  magnetycz- 
nego są:  zmiana  w czasie  pola  elektrycznego  i prąd 
elektryczny. 

Nie  możemy  tu  rozważać  wszystkich  wniosków 
płynących  z tych  równań,  powiemy  jedynie,  że  rów- 
nania Maxwella  pozwalają  znaleźć  pole  elektromag- 
netyczne E i B wówczas,  gdy  znane  jest  położenie 
i prędkość  ładunków.  I tak  np.,  gdy  szukamy  pola 
elektromagnetycznego  w otoczeniu  pojedynczego  spo- 
czywającego punktowego  ładunku  elektrycznego 
to  równanie  Maxwella  dają : 


r 


B = 0. 


Jest  to  znane  prawo  Coulornba. 

Wokół  poruszających  się  ładunków  oprócz  pola 
elektrycznego  istnieje  również  pole  magnetyczne. 
Równania  Maxwella  pozwalają  wyznaczyć  to  pole 
i odtworzyć  np.  prawa  magnetycznego  działania  prą- 
dów 
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Omówiliśmy  dwa  odrębne  zagadnienia:  jakie  pole 
elektromagnetyczne  powstaje  wokół  ładunków  oraz 
jak  się  poruszają  ładunki  w danym  polu  elektromag- 
netycznym. Pełna  teoria  elektromagnetyzmu  powinna 
opisywać  oba  te  procesy  łącznie:  poruszające  się  ła- 
dunki wytwarzają  pola,  które  z kolei  wpływają  na  ich 
ruch.  A więc  konieczna  jest  teoria  samozgodna,  opi- 
sująca ruch  ładunków  w polach,  które  są  wytworzone 
przez  te  same  ładunki.  Warunki  te  spełniają  równania 
Maxwella  oraz  równania  ruchu  ładunków  Newtona, 
traktowane  jako  jeden  układ  równań.  Pola  powodu- 
jące ruch  ładunków  powstają  w wyniku  istnienia 
i ruchu  ładunków,  a ruch  ładunków  odbywa  się  pod 
wpływem  sił  pola  elektromagnetycznego. 

Równania  Maxwella  i równania  ruchu  ładunku 
w polu  elektromagnetycznym  stanowią  komplet  praw 
elektrodynamiki  w próżni. 

Olbrzymim  osiągnięciem  teorii  Maxwella  było  to, 
że  przewidziała  ona  istnienie  fal  elektromagnetycz- 
nych (rys.  2).  O ich  istnieniu  może  przekonać  nastę- 
pujące rozumowanie:  Z równań  Maxwella  wynika,  że 


Rys.  2.  W fali  elektromagnetycznej  źródłem  pola  elektrycznego 
są  zmiany  pola  magnetycznego,  a źródłem  pola  magnetycznego  — 
zmiany  pola  elektrycznego 


w obszarach,  w których  nie  ma  ładunków  ani  prądów 
elektrycznych,  pola  elektryczne  i magnetyczne  speł- 
niają równania  falowe : 


i e2E 
c 2 dt 2 


+ AE=  0, 


1 d2B  — 

-7^+J5  = 0’ 


gdzie  c = ]/e0/*o  - 

Z tych  równań  wynika,  że  w próżni  pola  elektryczne 
i magnetyczne  mogą  istnieć  w postaci  fal  rozchodzą- 
cych się  z prędkością  c.  Doświadczalne  potwierdzenie 
istnienia  fal  elektromagnetycznych  jest  dziełem 
H.  Hertza,  który  też  zbadał  ich  podstawowe  własno- 
ści. Wkrótce  też  stwierdzono,  że  fale  świetlne  są  fa- 
lami elektromagnetycznymi  o dużej  częstości.  Tak  to 
dokonano  syntezy  dwóch  dziedzin : nauki  o elektrycz- 
ności i magnetyzmie  z optyką.  Należy  podkreślić,  że 
równania  Maxwella  poprawnie  opisują  zjawiska 
optyczne  — takie  jak  dyfrakcja  i interferencja  fal 
świetlnych. 

Fale  elektromagnetyczne  poruszają  się  z olbrzymią 
prędkością  (2,997924562  ± 0,00000001 1)  • 108  m-s"1 
w próżni,  przy  czym  prędkość  ta  nie  zależy  od  dłu- 
gości fali.  Z taką  prędkością  rozchodzą  się  wszystkie 
zaburzenia  pola  elektromagnetycznego.  Skończona 
prędkość  rozchodzenia  się  zaburzeń  pola  elektromag- 
netycznego stała  się  punktem  wyjścia  szczególnej  teorii 
względności  (->  O niektórych  podstawowych  poję- 
ciach fizycznych). 

Podamy  kilka  prostych,  ale  fundamentalnych  wnio- 
sków wynikających  ze  skończonej  prędkości  rozcho- 
dzenia się  zaburzeń  pola  elektromagnetycznego. 

Wyobraźmy  sobie  dwa  poruszające  się  ładunki 
(rys.  3).  Ładunek  2 znajduje  się  w polu  wytworzonym 
przez  ładunek  1.  Ale  wartość  pola  w punkcie  2 jest 


Rys.  3.  Siły  elektryczne  działające  między  ładunkami  w ruchu. 
Siła  działająca  na  ładunek  2 jest  skierowana  w stronę  punktu  i\ 
w którym  znajdował  się  ładunek  I we  wcześniejszej  chwili.  Zatem 
siły  elektromagnetyczne  nie  są  centralne 


faSe  elektro- 
magnetyczne 


p rędkość  fal 
elektroma- 
gnetycznych 
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taka,  jaką  wytworzył  ładunek  1 będąc  we  wcześniej- 
szej chwili  w punkcie  lf.  W efekcie  siła  działająca  na 
ładunek  2 nie  jest  skierowana  do  ładunku  i,  ale 
w kierunku  V . A więc  siły  elektryczne  działające  mię- 
dzy ładunkami  w ruchu  nie  są  centralne  i ich  suma 
algebraiczna  nie  jest  równa  zeru.  Jak  wiemy  (-*  Za- 
sady zachowania),  oznacza  to,  że  pęd  układu  ładun- 
ków nie  jest  zachowany.  I tak  doszliśmy  do  para- 
doksu, że  w izolowanym  układzie  dwóch  ładunków 
pęd  nie  jest  zachowany. 

pęd  pola  Paradoks  można  usunąć,  ale  trzeba  przyjąć,  że  pole 

tromag«a-  elektromagnetyczne  wytwarzane  przez  ładunek  ma 
tycznego  pewien  pęd.  Pęd  pola  elektromagnetycznego  dokład- 
nie kompensuje  nadmiar  pędu  ładunków.  Tak  więc 
pęd  samych  ładunków  nie  jest  wielkością  stałą  (nie 
jest  zachowany),  a te  pęd  układu  składającego  się  z ła- 
dunków i pola  elektromagnetycznego  jest  zachowany. 
[ momen  pędu  7 doświadczenia  przedstawionego  na  rys.  4 wynika, 
pola  ełektm-  że  pole  elektromagnetyczne  ma  pewien  moment  pędu. 
magnetyce-  Powyższe  rozważania  wykazują,  że  pole  elektro- 
n&go  magnetyczne  nie  jest  jedynie  abstrakcyjnym  tworem, 


Rys.  4.  Na  obwodzie  tarczy  znajdują  się  naładowane,  izolowane 
kulki.  Współosiowo  z tarczą  umieszczony  jest  solenoid,  przez 
który  płynie  prąd  z baterii.  Gdy  przepływ  prądu  ustanie,  tarcza 
zacznie  się  obracać.  Moment  pędu  zostanie  przekazany  tarczy 
przez  poić  elektromagnetyczne  wytworzone  przez  solenoid  (wg 
R.  P.  Feynmana) 

służącym  do  opisu  oddziaływań  ładunków.  Jest  ono 
obiektem  materialnym,  mającym  określone  parame- 
try, jak  energię,  pęd  i moment  pędu.  Materialność 
pola  występuje  jeszcze  wyraźniej  w elektrodynamice 
kwantowej,  gdzie  polu  elektromagnetycznemu  przy- 
pisujemy własność  cząstek,  kwantów  y (fotonów), 
i obserwujemy  przemianę  kwantów  y w inne  cząstki. 

Zauważyliśmy,  że  spoczywający  ładunek  wytwarza 
pole  elektryczne,  natomiast  poruszający  się  ładunek 
jest  źródłem  również  pola  magnetycznego.  Ale  pręd- 
kość ładunku  zależy  od  wyboru  układu  odniesienia. 
Jeśli  więc  w układzie,  w którym  ładunek  spoczywa, 
pole  magnetyczne  nie  występuje,  to  w innym  układzie, 
poruszającym  się  ruchem  prostoliniowym  jednostaj- 
nym względem  pierwszego,  wystąpi  niezerowe  pole 
magnetyczne.  Podobnie  jeśli  w jednym  układzie  wy- 
stępuje tylko  pole  magnetyczne,  to  w innym  wystąpi 
również  pole  elektryczne.  Tak  więc  pole  elektryczne 
i magnetyczne  nie  mają  charakteru  bezwzględnego, 
lecz  są  składowymi  jednej  wielkości  fizycznej  — pola 
elektromagnetycznego;  podział  tego  pola  na  pole 
elektryczne  i magnetyczne  zależy  od  wyboru  układu. 

Warto  zwrócić  uwagę  na  fakt,  że  rozważania  tego 
rodzaju  stały  się  punktem  wyjścia  dla  sformułowania 
szczególnej  teorii  względności.  Aby  prawa  elektrody- 
namiki nie  zależały  od  wyboru  inercjalnego  układu 
odniesienia,  transformacja  między  układami  musi  być 
transformacją  Lorentza.  Należało  więc  tak  zmodyfi- 
kować prawa  mechaniki  klasycznej,  aby  teoria  ruchu 
ładunków  i pola  elektromagnetycznego  nie  zależała 
od  wyboru  układu  odniesienia. 


Co  to  jest  elektrodynamika  kwantowa 

Oddziaływanie  pola  elektromagnetycznego  z materią, 
szczególnie  zaś  fal  o wielkiej  częstości  z atomami, 
jest  bardziej  złożone,  niż  to  wynika  z klasycznych 
równań  Maxwella.  Nie  ma  w tym  nic  dziwnego; 
atomy  nie  są  obiektami  klasycznymi  i do  analizy  ich 
zachowania  się  koniecznie  trzeba  stosować  opis 
kwantowy.  Zatem  analiza  oddziaływania  pola  elek- 
tromagnetycznego z atomami  także  wymaga  spójnego 
kwantowego  opisu.  Teoria  kwantowa  opisująca  od- 
działywanie pola  elektromagnetycznego  z atomami 
nosi  nazwę  elektrodynamiki  kwantowej.  Jej  początki 
datują  się  na  rok  1900,  kiedy  to  M.  Planck  ogłosił 
teorię  promieniowania  ciała  doskonale  czarnego; 
pełne  sformułowanie  zasad  elektrodynamiki  kwanto- 
wej nastąpiło  na  przełomie  lat  czterdziestych  i pięć- 
dziesiątych, w pracach  R.  Feynmana  i J.  Schwingera. 

Trudno  jest  w tym  miejscu  podać  choćby  przybli- 
żony zarys  formalizmu  matematycznego  używanego 
w elektrodynamice  kwantowej  (-*  Teoria  pola). 

Ograniczymy  się  do  podania  najważniejszych  cech  fi- 
zycznych odróżniających  elektrodynamikę  kwantową 
od  elektrodynamiki  klasycznej. 

Z elektrodynamiki  klasyczriej  wynika,  że  przekazy-  efektro- 
wanie  energii  między  układami  ładunków  i polem  dynamika 
elektromagnetycznym  ma  charakter  ciągły.  Porusza-  kwantowa 
jące  się  ładunki  wysyłają  lub  pochłaniają  promienio-  a klasyczna 
wanie  elektromagnetyczne;  ilość  energii  pochłoniętej 
lub  wysłanej  zależy  od  ruchu  ładunków  i może  przy- 
bierać dowolną  wartość.  Taki  wynik  jest  zgodny 
z faktami  doświadczalnymi  w dziedzinie  fal  długich  — 
radiowych  czy  mikrofal.  Jednakże  w dziedzinie  fal 
krótkich,  np.  rentgenowskich,  wynik  ten  nie  jest 
zgodny  z obserwacjami.  Oddziaływanie  pola  elektro- 
magnetycznego o wielkiej  częstości  z atomami  ma 
charakter  wybitnie  nieciągły.  Okazało  się,  że  atomy 
nie  mogą  przekazać  dowolnej  ilości  energii  polu 
elektromagnetycznemu,  lecz  tylko  określoną  jej 
ilość,  równą  różnicy  energii  poziomów  atomu,  mięcLzy 
którymi  zachodzi  przejście.  Energia  ta  pojawia  się 
jako  najmniejsza  ilość  pola  elektromagnetycznego  — 
foton. 

Oddziaływanie  pola  elektromagnetycznego  z ła-  fotony 
dunkami  polega  na  emisji  i absorpcji  fotonów,  od- 
bywa się  więc  porcjami,  w sposób  nieciągły.  Jak  wia- 
domo, tylko  takie  podejście  prowadzi  do  popraw- 
nego, to  znaczy  zgodnego  z doświadczeniem  opisu 
takich  procesów  jak  zjawisko  fotoelektryczne,  zja- 
wisko Comptona  i in.  (rys.  5,  6). 


Rys.  5.  Zjawisko  foto- 
elcktryczne  polega  na 
wybijaniu  elektronów 
z katody  przez  wiązkę 
światła.  Poprawną  za- 
leżność natężenia 
w obwodzie  od  natę- 
żenia światła  i jego 
częstości  otrzymuje 
się  przy  założeniu,  że 
elektron  zostaje  wybi- 
ty z metalu  przez  poje- 
dynczy foton 
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foton  elektron 
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Rys.  6.  Zjawisko  Comptona  — foton  o częstości  co  ,, zderza  się” 
z elektronem  i w wyniku  tego  powstaje  foton  o innej  częstości  co1 
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Elektrodynamika  kwantowa  przypisuje  więc  polu 
elektromagnetycznemu  pewne  właściwości  cząstkowe. 
Fale  elektromagnetyczne  są  interpretowane  jako  stru- 
mień cząstek  — fotonów.  Fala  o możliwie  najmniej- 
szym natężeniu  zawiera  jeden  foton. 

Fotony  pod  niektórymi  względami  różnią  się  za- 
sadniczo od  innych  „zwykłych”  cząstek.  Fotony  mają 
zerową  masę  spoczynkową.  Mimo  to  niosą  one  ze 
sobą  strumień  energii,  pędu  oraz  momentu  pędu. 

Takie  właściwości  fotonów  są  zgodne  z mechaniką 
relatywistyczną.  Związek  między  energią  E i pędem 
cząstki  o masie  spoczynkowej  m jest  następujący 
E = }/ m2c*+p2c 2.  Jeśli  masa  spoczynkowa  jest  równa 
zeru,  to  E=pc.  Związek  ten  oznacza,  że  fotonów  nie 
można  zatrzymać,  innymi  słowy  — fale  elektromag- 
zerowa  masa  netyczne  nie  mogą  być  nieruchome.  Gdyby  bowiem 
spoczynkowa  pęd  fotonu  był  zerem,  to  jego  całkowita  energia  by- 
fotonu  łaby  zerowa  i foton  po  prostu  nie  istniałby. 

O zerowej  masie  spoczynkowej  fotonu  możemy  się 
też  przekonać  na  podstawie  innego  rozumowania. 
Jak  wspomnieliśmy,  z praw  Maxwella  wynika,  że 
pole  elektryczne  i pole  magnetyczne  w pełni  spełniają 
równania  falowe.  Równanie  falowe  jest  identyczne 
z równaniem  pola  cząstki  o zerowej  masie  (-►  Teoria 
pola).  Dlatego  też  założenie,  że  fotony,  czyli  cząstki 
związane  z polem  elektromagnetycznym,  mają  zero- 
wą masę,  jest  konieczne  do  tego,  aby  uzyskać  zgod- 
ność praw  elektromagnetyzmu  za  pomocą  teorii  pól 
i z uwzględnieniem  istnienia  fotonu. 

Istotną  kwestią  jest  zrozumienie,  jak  elektrodyna- 
mika kwantowa  opisuje  zjawiska  falowe  takie  jak 
dyfrakcja  i interferencja  fal.  Jednoczesny  opis  zjawisk 
falowych  i cząstkowych  jest  zgodny  z duchem  teorii 
kwantowych;  inne  cząstki,  np.  elektrony,  również 
wykazują  jednocześnie  właściwości  cząstkowe  i fa- 
lowe (-►  O niektórych  podstawowych  pojęciach  fi- 
zycznych). 

Właściwości  cząstkowe  fotonów  ujawniają  się  wy- 
raźnie wtedy,  gdy  mamy  do  czynienia  z bardzo  małą 
liczbą  fotonów  — możemy  wtedy  mówić  o reakcji 
pojedynczego  fotonu  z pojedynczym  elektronem.  Tak 
jest  w wiązkach  fal  o dużej  częstości,  np.  fal  ultrafio- 
letowych czy  rentgenowskich ; w tym  zakresie  fal  naj- 
częściej obserwujemy  efekty  kwantowe.  Kiedy  roz- 
ważamy wiązki  fal  elektromagnetycznych  o dużym 
natężeniu,  w reakcji  bierze  udział  z reguły  wielka 
liczba  fotonów.  Właściwości  cząstkowe  pola  elektro- 
magnetycznego zacierają  się,  ujawniają  się  nato- 
miast wyraźnie  efekty  falowe. 

Ciekawa  sytuacja  występuje  w optyce.  Wiązki  świa- 
tła o częstości  widzialnej  uzyskiwane  z laserów  mogą 
mieć  bardzo  duże  natężenie,  mogą  nieść  wiele  foto- 
nów. Z drugiej  jednak  strony  energia  pojedynczego 
potwierdzę-  fotonu  może  być  bardzo  bliska  różnicy  dwóch  pozio- 
me slusz-  mów  energetycznych  atomu,  co  sprzyja  reakcji  atomu 
ności  prawa  z pojedynczym  fotonem.  Tak  więc  w oddziaływaniach 
Gaussa  wiązek  laserowych  z atomami  ujawniają  się  często 
zarówno  cząstkowe,  jak  i falowe  właściwości  pola 
elektromagnetycznego. 

Dlaczego  uważamy  elektrodynamikę 
za  najdoskonalszą  teorię  fizyczną 

Klasyczna  i kwantowa  teoria  elektromagnetyzmu  zo- 
stała stworzona  na  podstawie  szeregu  doświadczeń 
i pomiarów.  Były  to  przede  wszystkim  mało  precy- 
zyjne doświadczenia  dziewiętnastowieczne.  Współ- 
cześnie wykonuje  się  liczne  eksperymenty  i pomiary 
mające  na  celu  dokładniejsze  zbadanie  zakresu  sto- 
sowalności elektrodynamiki.  Opiszemy  tu  kilka  z nich. 
Zaczniemy  od  doświadczeń  potwierdzających  słusz- 
ność elektrostatyki  i magnetostatyki.  Dotyczą  one 
samych  podstaw  elektrodynamiki. 

Według  jednego  z ważniejszych  twierdzeń  elektro- 
statyki — we  wnętrzu  naładowanej  powierzchni  pole 
elektryczne  znika.  Twierdzenie  to  wynika  bezpośred- 
nio z pierwszego  równania  Maxwella,  nazywanego 
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też  prawem  Gaussa.  Dlatego  badanie,  czy  istnieje  pole 
wewnątrz  naładowanej  powierzchni,  jest  bezpośred- 
nim sprawdzianem  prawa  Gaussa.  Dokładność,  z jaką 
można  stwierdzić,  że  natężenie  pola  jest  zerowe, 
ogranicza  dokładność  sprawdzenia  słuszności  prawa 
Gaussa.  Pierwsze  doświadczenie  tego  typu  wykonał 
H.  Cavendish  w 1773  r.  Schemat  jego  współczesnej 
wersji,  opracowanej  w 1971  r.  przez  E.R.  Williamsa, 
J.E.  Fallera  i H.A.  Hilla  w USA,  jest  przedstawiony 
na  rys.  7.  Doświadczenia  tego  typu  pozwalają  osza- 
cować słuszność  prawa  Gaussa,  czy  też  wynikającego 


Rys.  7.  Współczesna  aparatura  do  sprawdzania  prawa  Gaussa 
składa  się  z pięciu  metalowych  powierzchni  w kształcie  dwu- 
dziestościanów.  Do  dwóch  zewnętrznych  powierzchni  przykłada 
się  zmienne  wysokie  napięcie,  które  powoduje  powstawanie  ła- 
dunku na  tych  powierzchniach.  Gdyby  pole  elektryczne  istniało 
we  wnętrzu  powierzchni  metalowych,  to  powodowałoby  ono 
powstanie  napięcia  między  dwiema  wewnętrznymi  powierzch- 
niami. Celem  doświadczenia  jest  stwierdzenie,  czy  istnieje  między 
powierzchniami  wewnętrznymi  zmienne  napięcie  o tej  samej  czę- 
stości, co  napięcie  przyłożone  do  powierzchni  zewnętrznych. 
Obecność  takiego  napięcia  świadczyłaby  o istnieniu  pola  elek- 
trycznego wewnątrz  powierzchni  metalowych 


z niego  prawa  Coulomba.  Gdyby  np.  pole  ładunku 
punktowego  nie  było  odwrotnie  proporcjonalne  do 
kwadratu  odległości  od  ładunku,  lecz  było  proporcjo- 
nalne do  e“&r/'*2> to  wynik  cytowanego  doświadczenia 
nakładałby  na  parametr  b ograniczenie  ó<2-10“8 
cm-1.  A zatem  prawo  Coulomba  jest  słuszne  przy 
odległościach  r mniejszych  odó-1  = 5 -107  cm,  wtedy 
bowiem  czynnik  e“br  jest  z dobrym  przybliżeniem 
równy  jedności. 

Badanie  pól  magnetycznych  dostarcza  też  infor-  badanie  pól 
macji  na  temat  słuszności  praw  Maxwella.  Pola  mag-  magnetycz-  I 
netyczne  są  o tyle  łatwe  do  badania,  że  w przyrodzie  nych 
występują  one  w naturalny  sposób  w olbrzymiej 
skali;  mowa  tu  oczywiście  o polu  magnetycznym 
Ziemi  i innych  planet.  Pomiary  linii  sił  pola  magne- 
tycznego dostarczają  informacji,  czy  pole  wokół  mag- 
nesu, którym  jest  planeta,  spełnia  równania  Maxwella, 
czy  nie.  Bardzo  subtelnych  pomiarów  pola  magne- 
tycznego ziemskiego  dokonują  sztuczne  satelity.  Po- 
zwoliły one  stwierdzić  słuszność  praw  Maxwella 
w odległościach  rzędu  109  m. 

Doświadczenia  te,  potwierdzające  słuszność  elek- 
trodynamiki klasycznej,  stanowią  też  sprawdzenie 
elektrodynamiki  kwantowej.  W teorii  kwantowej  na- 
bierają one  nowej  interpretacji,  nakładają  ogranicze- 
nia na  ewentualną  masę  fotonów.  Wynika  z nich, 
że  masa  fotonu  wynosi  mniej  niż  10“ 47  kg  (dla  po- 
równania: masa  elektronu,  najlżejszej  cząstki,  wy- 
nosi ok.  10“30  kg). 

Dalsze  doświadczenia  dotyczą  typowo  kwanto-  pomiary 
wych  efektów.  Jednym  z bardzo  subtelnych  efektów  przesunięcia  ♦ 
przewidzianych  przez  elektrodynamikę  kwantową  Lamba 
jest  istnienie  tak  zwanego  przesunięcia  Lamba.  Jest 
to  różnica  między  poziomami  energetycznymi  w ato- 
mie wodoru  oznaczanymi  przez  2S1/2  i 2P1/2  (rys.  8). 

Gdyby  nie  kwantowa  natura  promieniowania  elek- 
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Rys.  8.  Struktura  stanów  energetycznych  atomu  wodoru.  Prze- 
sunięcie Lamba  to  różnica  poziomów  25, /*  i 2P,/X 


tromagnetycznego,  stany  te  miałyby  tę  samą  energię. 
Dlatego  też  pomiary  przesunięcia  Lamba  i porówny- 
wanie wielkości  eksperymentalnych  z teoretycznymi 
mają  podstawowe  znaczenie  w kwantowej  teorii  pola 
elektromagnetycznego.  Pierwsze  obliczenie  tego  efektu 
wykonał  w 1947  r.  H.A.  Bethe,  a pomiary  zostały 
w tym  samym  roku  wykonane  przez  W.E.  Lamba 
i R.C.  Retherforda.  Przy  pomiarach  autorzy  wyko- 
rzystali rezonans  magnetyczny  między  mierzonymi 
poziomami  (-►  Spektroskopia  atomowa),  co  na 
owe  czasy  było  bardzo  nowoczesnym  pomysłem.  Po- 
nieważ częstości  radiowe,  których  tu  użyto,  dają  się 
mierzyć  z bardzo  dużą  dokładnością,  również  prze- 
sunięcie poziomów  można  w ten  sposób  wyznaczyć 
dokładnie. 

Już  pierwsze  pomiary  wykazały  bardzo  dobrą  zgod- 
ność wyników  doświadczalnych  z teoretycznymi. 
Obecnie  zarówno  dokładność  obliczeń,  jak  pomia- 
rów niepomiernie  wzrosła.  Pomiary  przesunięcia 
Lamba  wykonali  ostatnio  R.  Robiscoe  i T.  Shyn 
z USA  (1970);  należy  podkreślić,  że  nie  stwierdzono 
tu  żadnych  odstępstw  od  wartości  teoretycznej,  wy- 
noszącej (1057,911  ±0,12)  MHz. 

Jednym  z piękniejszych  osiągnięć  potwierdzających 
słuszność  elektrodynamiki  kwantowej  jest  obliczenie 
momentu  magnetycznego  elektronu.  W myśl  elektro- 
dynamiki kwantowej  elektron,  mimo  że  jest  cząstką 
punktową,  zachowuje  się  podobnie  jak  obracająca  się 
naładowana  kulka.  Taka  obracająca  się  kulka  to 
jakby  igła  magnetyczna  — oś  obrotu  kulki  wykonuje 
precesję  w polu  magnetycznym  wokół  linii  sił  pola 
(rys.  9).  Częstość  tej  precesji  zależy  od  wartości  mo- 
mentu magnetycznego.  Tak  więc  elektron  ma  mo- 
ment magnetyczny  fi.  Teoretyczne  obliczenie  tego 
momentu  wykonał  P.A.M.  Dirac,  otrzymał  on  wynik 
fi  = 2 (efilmc).  Dokładniejsze  wyniki  uwzględniające 
kwantową  strukturę  pola  elektromagnetycznego  uzy- 
skał J.  Schwinger  (1948),  a później  inni  autorzy. 


Rys.  9.  Elektron  w 
polu  magnetycznym 
jest  w pewnym  sensie 
podobny  do  obraca- 
jącej się  naładowanej 
kuleczki,  wykonuje 
precesję  wokół  pola 
magnetycznego.  Ob- 
liczenie częstości  pre- 
cesji, a zatem  momen- 
tu magnetycznego 
elektronu  to  jedno  z 
największych  osiąg- 
nięć elektrodynamiki 
kwantowej 

Pomiarów  momentu  magnetycznego  elektronu  do- 
konywały liczne  grupy  badaczy,  ale  wszystkie  do- 
świadczenia opierały  się  na  tej  samej  zasadzie:  spola- 
ryzowane elektrony  (tzn.  o równoległych  momentach 
magnetycznych)  przelatywały  przez  pole  magnetycz- 
ne, mierzony  był  kąt  skręcenia  momentów  magne- 
tycznych. 

Jednym  z najdokładniejszych  wyników  było  /i  = 
= (2,0011 596577  ± 0,0000000035)e^//?7c;  jest  on  zgo- 
dny z obliczeniami  teoretycznymi,  a uzyskali  go  J.C. 
Wesley  i A.  Rich  w 1971  r. 

Mierzono  także  momenty  magnetyczne  innych  czą- 
stek — pozytonów  i mionów,  a wyniki  porównywano 
z wartościami  obliczonymi  teoretycznie.  Odstępstw 
od  nich  nie  stwierdzono,  ale  wyniki  pomiarów  były 
znacznie  mniej  dokładne. 

Wykazaliśmy  na  przykładach,  że  elektrodynamika 
jest  teorią  opisującą  z wielką  precyzją  szeroki  zakres 
zjawisk  fizycznych.  O innych  zastosowaniach  elek- 
trodynamiki w różnych  dziedzinach  fizyki  można 
znaleźć  informacje  w innych  hasłach  niniejszej  En- 
cyklopedii. Przykłady  te  dobitnie  dowodzą,  że  elektro- 


dynamika jest  teorią  o niesłychanie  szerokim  zakresie 
stosowalności. 

Ale  nie  tylko  zgodność  z eksperymentem  świadczy 
o doskonałości  elektrodynamiki.  Ma  ona  również 
daleko  idące  zalety  formalne.  Na  podobieństwo 
elektrodynamiki,  szczególnie  kwantowej,  próbowano 
formułować  teorie  innych  oddziaływań  elementar- 
nych (-►  Cząstki  elementarne  i ich  oddziaływania). 
Pewne  sukcesy  odniesiono  przy  takim  podejściu  do 
opisu  oddziaływań  słabych.  Powstała  w ten  sposób 
teoria  Fermiego  rozpadu  p,  a ostatnio  bardzo  burzli- 
wie rozwijają  się  tzw.  zunifikowane  teorie  oddziały- 
wań elektromagnetycznych  i słabych.  Metody  zbli- 
żone do  użytych  w elektrodynamice  kwantowej  pró- 
bowano też  stosować  do  opisu  oddziaływań  silnych, 
w szczególności  oddziaływań  pionów  (->  Oddziały- 
wania silne). 


Wewnętrzne  sprzeczności  elektrodynamiki 


Pomimo,  że  elektrodynamika  dobrze  wyjaśnia  wiele 
zjawisk,  nie  można  zapominać  o zasadniczych  jej 
niekonsekwencjach.  W samym  bowiem  sformułowa- 
niu elektrodynamiki  tkwią  wewnętrzne  sprzeczności, 

0 których  istocie  tu  powiemy. 

Zastanówmy  się,  jaka  jest  energia  pola  elektrycz- 
nego w otoczeniu  ładunku  e w kształcie  kuli  o pro- 
mieniu a.  Ponieważ  pole  elektryczne  w punkcie  od- 
ległym o r od  środka  kuli  wynosi  E=el4K£0r*9  to  ener- 
gia pola  dana  jest  przez  wzór  W = 1U  f E?dVy  przy 
czym  po  wykonaniu  łatwego  rachunku  otrzymujemy 
W = e^/e^a.  Energia  kuli  jest  odwrotnie  proporcjo- 
nalna do°jej  promienia.  Na  pierwszy  rzut  oka  nic 
nas  tu  nie  razi.  Trudność  zaczyna  się  wtedy,  gdy  roz- 
ważany ładunek  jest  punktowy,  to  znaczy,  gdy  jego 
promień  jest  zerem.  Wtedy  bowiem  energia  pola 
elektrycznego  otaczającego  ładunek  staje  się  nie- 
skończenie wielka.  Ta  „nieskończoność”  jest  pod- 
stawową trudnością  elektrodynamiki.  Nie  można 
się  jej  pozbyć  zakładając,  że  w przyrodzie  nie  wystę- 
pują ładunki  punktowe,  mamy  bowiem  powody  uwa- 
żać elementarne  ładunki  — elektrony,  za  cząstki 
punktowe.  Gdyby  elektron  nie  był  punktowy,  lecz 
był  jakąś  kulką  o skończonym  promieniu,  trudno 
byłoby  go  uznać  za  elementarną  cząstkę.  Wszystko 
świadczy  o tym,  że  elektron  jest  cząstką  punktową. 

Nieskończoność,  o której  mówiliśmy,  przejawia 
się  i w innych,  bardziej  jeszcze  drastycznych  miejscach. 
Jeśli  np.  chcemy  nadać  elektronowi  przyśpieszenie, 
to  oprócz  pokonania  zwykłej  bezwładności  elektronu, 
pochodzącej  od  jego  masy,  musimy  pokonać  bez- 
władność pola  elektrycznego  otaczającego  elektron. 
Niestety  — siła,  jakiej  trzeba  użyć  do  pokonania 
bezwładności  pola,  jest  nieskończenie  wielka.  Wy- 
gląda to  tak,  jakby  masa  elektronu  była  nieskoń- 
czenie wielka,  nie  można  bowiem  oddzielić  elektronu 
od  pola,  które  wytwarza.  Wiemy  jednak,  że  masa 
elektronu  wynosi  ok.  9*10-31  kg  i na  pewno  nie  jest 
nieskończona. 

Wydawać  by  się  mogło,  że  trudności  te  powinny 
zniknąć  w elektrodynamice  kwantowej,  która  kon- 
sekwentnie uwzględnia  wszelkie  efekty  kwantowe 
w małych  odległościach  od  ładunku.  Do  pewnego 
stopnia  istotnie  tak  jest.  W elektrodynamice  kwan- 
towej można  się  nie  posługiwać  wielkościami  nie- 
skończonymi. Jednakże  w takim  sformułowaniu  masa 

1 ładunek  elektronu  nie  mogą  być  obliczone  w ramach 
teorii,  lecz  muszą  być  wzięte  z doświadczenia. 

Tak  więc,  mimo  że  potrafimy  z wielką  precyzją 
obliczać  przebieg  różnych  procesów  elektromagne- 
tycznych, a wyniki  naszych  obliczeń  zgodne  są  z do- 
świadczeniami, to  jednak  nie  bardzo  rozumiemy,  dla- 
czego się  tak  dzieje,  nie  rozumiemy  bowiem  do  końca 
podstaw  elektromagnetyzmu. 

L.N.  Cooper  Istota  i struktura  fizyki , Warszawa  1975; 
R.P.  Feynman  i in.  Feynmana  wykłady  z fizyki.  Warszawa  1974; 
R.H.  March  Fizyka  dla  poetów , Warszawa  1974. 
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Teoria  po!a 

Marian  Kupczyński 

Teoria  pola  jest  jednym  z najtrudniejszych  i najcie- 
kawszych działów  fizyki-  Stosuje  się  w niej  bardzo 
zaawansowane  metody  matematyczne,  a przeprowa- 
wadzane  obliczenia  są  długie  i żmudne.  Należą  do 
niej  najwspanialsze  osiągnięcia  fizyki  teoretycznej  — 
ogólna  teoria  względności  oraz  elektrodynamika  kla- 
syczna i kwantowa  (->  Elektrodynamika). 

Na  gruncie  kwantowej  teorii  pola  przewidziano 
istnienie  antymaterii,  a ostatnio  cząstek  powabnych 
(-*•  Cząstki  elementarne  i ich  oddziaływania).  Cała 
teoria  cząstek  elementarnych  oparta  jest  na  ideach 
kwantowej  teorii  pola.  Metody  teorii  pola  są  ostat- 
nio szeroko  stosowane  w fizyce  statystycznej. 

Kwantowa  teoria  pola  nie  jest  teorią  zamkniętą. 
Problemów  nie  rozwiązanych  i trudnych  jest  bardzo 
wiele.  Po  ostatnich  sukcesach  nowej  teorii  oddziały- 
wań słabych  (-►  Oddziaływania  słabe)  teoria  pola 
jest  działem  fizyki,  w którym  są  prowadzone  najinten- 
sywniejsze badania  teoretyczne. 

Fizyka  jest  nauką,  która  szuka  wyjaśnienia  obser- 
wowanych zjawisk  (— ► Czym  jest  fizyka).  Podstawowe 
idee  teorii  fizycznych  można  sformułować  dość  pro- 
sto, podobnie  jak  prosto  można  sporządzić  plan  naj- 
trudniejszej wspinaczki  w Himalajach, 
modeie  Typowe  dla  fizyki  jest  tworzenie  modeli  dwojakiego 
w fizyce  rodzaju.  Pierwszy  rodzaj  to  modele  jakościowe  zja- 
wisk (obrazy)  odwołujące  się  do  intuicji  i wyobraźni. 
Stają  się  one  elementem  języka,  którym  fizycy  mówią 
potocznie  o rzeczywistości.  Drugi  — to  abstrakcyjne 
modele  matematyczne,  które  umożliwiają  obliczanie 
porównywalnych  z doświadczeniem  liczb.  Zgodność 
przewidywań  modelu  z doświadczeniem  decyduje 
o sukcesie  lub  niepowodzeniu  modelu.  Ten  drugi  ro- 
dzaj modeli  to  właściwe  modele  tworzone  przez  fizy- 
kę. Związek  obrazu  jakościowego  z modelem  ścisłym 
jest  dość  luźny.  Często  niewłaściwy  model  jakościowy 
bardzo  utrudnia  sformułowanie  właściwego  modelu 
abstrakcyjnego.  Rozwój  metod  stosowanych  w fizyce 
zmierza  wyraźnie  w kierunku  coraz  bardziej  abstrak- 
cyjnego opisu  zjawisk  fizycznych.  Mimo  wszystko 
tworzenie  obrazów  (które  nie  są  rozumiane  jak  wierne 
odbicie  procesów  rzeczywistych)  jest  często  pomocne 
w konstruowaniu  czy  modyfikowaniu  schematu  ma- 
tematycznego. 

Tak  więc  omawiając  teorię  pola  będziemy  przed- 
stawiać zarówno  obrazy  zjawisk  jak  i zarys  schematu 
matematycznego  teorii.  Bez  tego  schematu  byłaby 
to  nie  opowieść  o teorii,  lecz  tylko  bajka  o niej. 


O czasoprzestrzeni,  polu 
temperatury  i pochodnych 
cząstkowych 


Podstawowym  pojęciem  w fizyce  jest  czasoprzestrzeń 
i od  niej  zaczniemy  nasze  rozważania  o polu  (-*  O nie- 
których podstawowych  pojęciach  fizycznych).  Cza- 
soprzestrzeń jest  to  zbiór  wszystkich  możliwych  zda- 
rzeń. Marzeniem  nazywamy  takie  wydarzenie,  które 
można  scharakteryzować  przez  podanie  czterech  Jiczb 
t , jc,  y,  z,  gdzie  x,  y,  z są  współrzędnymi  wektora  po- 
łożenia r,  a t jest  czasem,  w którym  to  zdarzenie  za- 
chodzi. Na  przykład  (rys.  1)  jeśli  o godz.  1500  mała 
muszka  siada  w kącie  prostopadłościennego  pokoju 
o wymiarach  axbxc  i jeśli  umówimy  się,  że  określimy 
położenia  przedmiotów  podając  ich  odległość  od 
trzech  krawędzi  ścian  wychodzących  z kąta  wybrane- 
czasoprzes-  go  przez  naszą  muszkę,  to  omawiane  zdarzenie  z jej 
trzeń  i punkty  życia  w wybranym  przez  nas  układzie  odniesienia  ma 
materialne  współrzędne:  1500,  0,  0,  0.  Można  by  się  dziwić,  że 
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wybraliśmy  muszkę,  a nie  stół.  Ale  widać  od  razu,  że 
położenia  stołu  nie  można  określić  przez  podanie 
trzech  liczb.  Stół  w pokoju  o godz.  1500  to  zbiór  bar- 


Rys.  1.  W pokoju  o wymiarach  axbxc  znajduje  się  mucha.  Po- 
nieważ mucha  nie  jest  punktowa,  zaznaczamy  na  jej  tułowiu 
punkt,  którego  położenie  określa  położenie  muchy  o godz.  1510. 
Zdarzenie  przedstawione  na  rysunku  ma  współrzędne  (1510, 
x0,  -o) 


dzo  wielu  zdarzeń  w czasoprzestrzeni,  z których  każde 
jest  położeniem  odpowiedniego  punktu  stołu  o tej 
godzinie.  Małą  muszkę  możemy  traktować  jako  punkt 
materialny,  najprostszy  obiekt  fizyczny  poruszający 
się  w czasoprzestrzeni. 

Reprezentowanie  obiektu  fizycznego  przez  punkt 
materialny  okazuje  się  b.  dobrą  ideał izacją  w opisie 
wielu  zjawisk.  Ruch  planet  wokół  Słońca  i naładowa- 
nych cząstek  elementarnych  w zewnętrznym  polu 
elektromagnetycznym  można  przedstawić  jako  ruch 
punktów  materialnych.  Wróćmy  do  ruchu  punktu  ma- 
terialnego w czasoprzestrzeni.  Ruch  ten  jest  w pełni 
określony,  jeśli  znamy  trzy  funkcje  zależne  od  czasu 
*(0>  A 0*  z(0>  tworzące  razem  funkcję  o wartościach 

wektorowych  r(t).  Minimalna  liczba  zmiennych  w 
czasie  parametrów  koniecznych  do  opisu  układu  fi- 
zycznego nazywa  się  liczbą  stopni  swobody  układu. 
Tak  więc  punkt  materialny  (gdy  nie  ma  więzów)  ma 
trzy  stopnie  swobody. 

Wyobraźmy  sobie  teraz  nieskończoną  liczbę  punk- 
towych obserwatorów  wyposażonych  w punktowe 
i niezwykle  czułe  termometry  i zsynchronizowane 
zegary,  którzy  umówili  się  notować  mierzoną  tempe- 
raturę w każdym  punkcie  przestrzeni  w każdej  chwili 
(czyli  w każdym  punkcie  czasoprzestrzeni).  Zebrane 
wyniki  pomiarów  można  zapisać  jako  funkcję  okre- 
śloną na  czasoprzestrzeni.  Każdemu  punktowi  /,  r 
przyporządkowana  jest  liczba  T(J,r)  — temperatura 


X 

Rys.  2.  Wybrane  wartości  pola  temperatury  T (1600,  Jt,.y,0)  przed- 
stawione w postaci  izoterm  — krzywych,  na  których  funkcja 
T (r  = const,  jc,  y,  0)  jest  stała 


stopnie 

swobody 


pole 

temperatury 


w punkcie  r w chwili  t (rys.  2).  Mówimy,  że  T(ty  r) 
określa  pole  temperatury  w przestrzeni.  Załóżmy  te- 
raz, że  pomiary  są  wykonywane  na  przykład  w pokoju, 
w którym  rozmieszczono  odpowiednie  grzejniki  i ter- 
mostaty utrzymujące  na  wszystkich  ścianach,  podło- 
dze i suficie  tę  samą  stałą  temperaturę  T0.  Zastanów- 
my się,  jakie  pytanie,  czy  też  jakie  zadanie  może  posta- 
wić sobie  fizyk  w tej  sytuacji.  Podobnie  jak  w mecha- 
nice punktów  materialnych  na  podstawie  znajomości 
początkowych  położeń  i prędkości  chcemy  przy  po- 
mocy równań  Newtona  wydedukować  położenia 
punktów  materialnych  w przyszłości,  tak  w naszym 
problemie  chcielibyśmy  — na  podstawie  znajomości 
pola  w chwili  t = 0 i znajomości  warunków  doświad- 
czalnych — umieć  przewidywać  pole  temperatury  w 
poszufciwa-  przyszłości.  Aby  to  zadanie  zrealizować,  musimy 
nie  równani  dojść,  jakie  jest  równanie  pola,  i rozwiązać  je  przy 
P°^'a  danych  warunkach  początkowych : 

mo=/(7>,  o) 

gdzie  / jest  znaną  funkcją,  oraz  warunkach  brzego- 
wych: 

T(ty0yyyz)  = 7X/,*,0,r)  = T(tyxyy,  0)  = 

= T(t,a,y,z ) = T(tyxybyz)  = T(t,x,yyc ) = T0.  (2) 


Ponieważ  pokój  ma  wymiary  axbxc,  szukamy  roz- 
wiązania dla  r takich,  że: 

0 ^ y < ó i 0 < z < c. 

Poszukiwanie  równań  pola  poprzedzimy  przypomnie- 
niem równań  ruchu  punktu  materialnego  (równań 

Newtona).  Mają  one  dobrze  znaną  postać  F(ryvyt)  = 

= ma.  Prędkość  v i przyspieszenie  a wyrażają  się 
przez  pochodne  względem  czasu  wektora  położenia 

#*(/),  a mianowicie : 


lim  r(t+4Q-r(t)  gf  fj? 

At-*  o At  dt 


oraz 


— 1 > ..  v(t+ At)—  v(t)  d*  dv  _ d2 r 

a = lim  = — - — — . 

At-*  o At  dt  dt2 


Po  skorzystaniu  z tych  związków  równanie  Newtona 
można  zapisać : > 


m d*r  dr 


(3) 


Równanie  to  jest  równaniem  różniczkowym  zwyczaj- 
nym drugiego  rzędu.  Jednoznaczne  rozwiązanie  tego 
równania  otrzymuje  się  przy  warunkach  początko- 
wych 

r (t  = 0)  = r0  oraz  v (t  = 0)  = v0. 

Ponieważ  pole  T(jyr)  zależy  od  czterech  zmiennych, 
w równaniach  pola  mogą  się  pojawić  pochodne  wzglę- 
dem wszystkich  tych  zmiennych.  Są  to  tzw.  pochodne 
cząstkowe.  Na  przykład  pochodna  cząstkowa  wzglę- 
dem czasu  /,  oznaczana  dTJdty  jest  określona  wzorem: 

ST  ,im  TUĄAt,  x,  y,  z)~T(/,x,y,z)  (4) 

dt  ~ At 

pochodne  Podobnie  definiuje  się  pochodne  cząstkowe  wzglę- 
cząstkowe  dem  innych  zmiennych:  dTjdxy  dTldy , dTjdz  oraz 
drugie  pochodne  cząstkowe  (jest  ich  10): 

c2T  d2T  d2T  d2T  d2T  d2T 
dt2  * dx2  9 dy 2 9 dz2  * dxdy 9 dydz* 
d2T  c2T  d2T  d2T 
dtdx  9 dtdy 9 dt  dz  9 dxdz 

Pochodne  te  określone  są  wzorem  analogicznym  do 
wzoru  (4),  w którym  zamiast  funkcji  T występują 
funkcje  (czterech  zmiennych)  dTfdt,  dTfdx,  dT/dy, 


dT/dz.  Najogólniejsze  równanie  pola  T(t,  r)  mogłoby 
mieć  postać  : 

rtdT  dT  dT  dT 

r 9 fiy  9 ' wyzsze pochodne  cząstko- 

we)  = 0.  (5) 

Równanie  typu  (5)  jest  równaniem  różniczkowym 

cząstkowym.  Aby  opisać  w pełni  zmienność  w czasie 

pola  dla  każdego  ustalonego  wektora  r,  musimy  znać 

funkcję  T(ty  r).  Ponieważ  wszystkich  wektorów  r jest 
tyle,  ile  punktów  w przestrzeni,  czyli  nieprzeliczalnie 
wiele  (pole  jest  układem  fizycznym  o nieprzeliczalnej 
liczbie  stopni  swobody),  więc  warunek  (1)  jest  poję- 
ciowo równoważny  daniu  położenia  początkowego 
dla  punktu  materialnego.  Ponieważ  chcemy,  aby 
warunek  początkowy  (1)  wystarczał  do  wyznaczenia 
rozwiązania  (w  przyszłości),  równanie  (5)  może 

zawierać  pochodne  cząstkowe  względem  czasu  tylko 
pierwszego  rzędu.  Dokładna  analiza  problemu  pro- 
wadzi do  równania  na  pole  temperatury: 

j_  ar  _ a*r  &T 

X dt  - cx2  dy2  dz2 

gdzie  x(ty  xy  yy  z)  jest  pewną  funkcją  dodatnią  charak- 
teryzującą ośrodek.  Jest  to  równanie  przewodnictwa 
cieplnego. 

Innym  rodzajem  pola  jest  pole,  które  otrzymaliby 
punktowi  obserwatorzy  mierzący  zamiast  tempera- 
tury prędkość  wiatru  w punkcie  r.  Prędkość  wiatru  V 
w punkcie  r jest  wektorem  o trzech  współrzędnych 

V(U  r)  = (Vx(U  r),  Vy(U  r)y  V+ty  r)). 
Informacja  zebrana  z całej  przestrzeni  z różnych 

chwil  daje  się  zapisać  jako  pole  prędkości  V(t,  r ) 
w czasoprzestrzeni  (w  każdym  punkcie  zaczepiony 
jest  odpowiedni  wektor). 

Przykład  ten,  podobnie  jak  poprzedni,  nie  da  się 
zrealizować  praktycznie.  Nie  jesteśmy  w stanie 
nigdy  zmierzyć  temperatury  i prędkości  w punkcie. 
Mierzymy  zawsze  tylko  pewne  wartości  średnie  w od- 
powiednio małych  obszarach  przestrzeni.  Pole  jest 
wygodną  ideał  izacją,  która  te  małe  obszary  ściąga 
do  pojedynczych  punktów. 

W ten  sposób  wprowadziliśmy  pole  jako  pewien 
obiekt  matematyczny,  który  służy  do  wygodnego  za- 
pisu obserwacji  dokonywanych  w czasoprzestrzeni. 
Teraz  przejdziemy  do  pól,  które  są  obiektami  fizycz- 
nymi (mówiąc  inaczej,  są  one  formą  istnienia  materii). 


0 polach,  które  niosą  energię, 
obiektach  geometrycznych 

1 zasadzie  wariacyjnej 


Spójrzmy  na  równanie  (3);  jeśli  siła  F działająca  na 
obiekt  materialny  w punkcie  r nie  zależy  od  prędkości 

tego  obiektu,  to  w każdym  punkcie  przestrzeni  r, 
w którym  znajdzie  się  ten  obiekt,  mamy  jednoznacz- 
nie określony  wektor  siły  F(jy  /*),  czyli  pole  sił.  Pole 
F(ty  r) zawiera  informację  o przyspieszeniu,  jakie  zo- 
stanie nadane  cząstce  o masie  m w punkcie  r.  W tym 
ujęciu  pole  F(ty  r)  nie  jest  traktowane  jako  obiekt 

fizyczny,  lecz  jako  twór  podobny  do  T{ty  r ) i V(ty  r). 

Istotną  cechą  równań  Newtona  jest  ich  nielokal- 
ność.  Na  przykład  w problemie  dwóch  ciał  przy  opi- 
sie ruchu  planety  wokół  Słońca  przyspieszenie  pla- 
nety w chwili  / zależy  od  położenia  Słońca  w tej  samej 
chwili.  Zmiana  położenia  Słońca  w chwili  t+At 
zmienia  siłę  działającą  na  planetę  w chwili  t+At. 
Zdumiewające  jest,  że  przyczyna  i skutek  są  tak  od- 
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dalone.  Teoria  Newtona  zajmuje  się  tylko  wyznacza- 
niem ruchu  ciał  bez  wnikania  w mechanizm  uzysk- 
wania  przez  nie  przyspieszeń.  Spróbujemy  wyjaśnić 
ten  mechanizm. 


Rys.  3.  Niefortunny  przypadek  na  stole  bilardowym.  Litery  A 
B,  C,  D i E oznaczają  punkty,  w których  lokalnie  następuje 
zmiana  prędkości  bili.  Odcinki  ruchu  swobodnego  zaznaczone 
są  linią  przerywaną 


Doświadczenie  dnia  codziennego  uczy,  że  najpro- 
ściej jest  zmienić  prędkość  ciała  oddziałując  na  nie 
bezpośrednio.  Wyobraźmy  sobie  np.  kulę  porusza- 
jącą się  po  stole  bilardowym  (rys.  3).  Prędkość  jej 
ulegnie  zmianie  wtedy  i tylko  wtedy,  gdy  uderzymy  ją 
kijem,  trafimy  ją  drugą  kulą  lub  też  ona  sama  wpad- 
nie na  przeszkodę,  którą  może  być  ściana  stołu,  druga 
kula  lub  grzybek.  Nadanie  przyspieszenia  następuje 
jedynie  w momencie  odpowiedniego  zderzenia  i uzy- 
skiwane jest  w określonym  punkcie  stołu, 
pole  jako  Naturalną  tendencją  jest  próba  redukcji  niezna- 
obiekt  nego  do  czegoś  prostego  i dobrze  rozumianego.  Taką 
fizyczny  próbą  jest  wprowadzenie  pola  jako  obiektu  fizycz- 
nego, istniejącego  niezależnie  od  cząstek,  które  od- 
grywa rolę  niewidzialnego  sprawcy  uzyskiwanych 
przez  te  cząstki  przyspieszeń.  Ponieważ  energia  i pęd 
pojedynczych  cząstek  ulegają  zmianie  (a  wiadomo,  że 
całkowita  energia  i pęd  układu  powinny  być  zacho- 
wane), należy  ze  zmianą  energii  i pędu  cząstki  w punk- 
cie 7 wiązać  zmianę  energii  i pędu  hipotetycznego 
pola.  Ilustruje  to  jeszcze  jeden  mechaniczny  model 
dokładniej  opisany  pod  rys.  4. 


pole 


Rys.  4.  Mechaniczny  model  pola  — zbiór  bardzo  małych  mas 
połączonych  sprężynkami:  a)  kula  A z prędkością  Vx  zbliża  się 
do  obszaru,  w którym  jest  pole,  b)  widzimy  kulę  A ze  zmienioną 
energią  i pędem  oraz  pole,  któremu  energia  i pęd  zostały  przeka- 
zane, poruszające  się  z prędkością  v i drgające  przy  tym  zawzięcie. 
Widać,  że  po  pewnym  czasie  nastąpi  oddziaływanie  tego  pola 
z kulą  B 


Program  opisu  oddziaływań  cząstek  za  pośrednic- 
twem pola  został  uwieńczony  sukcesem  — wspania- 
łym rozwojem  elektrodynamiki  (-*  Elektrodynamika, 
Oddziaływania  elektromagnetyczne),  a następnie  sfor- 
mułowaniem einsteinowskiej  teorii  grawitacji.  Przy- 
pomnimy tu  kilka  etapów  tego  rozwoju, 
pole  elektro-  Podstawowe  wielkości  charakteryzujące  pole  elek- 
magnetyczne  tromagnetyczne  to  E i B,  występujące  we  wzorze 
Lorentza  na  siłę  działającą  na  ładunek  ą: 

F = q(EĄ-  v xB). 


Natężenie  pola  elektrycznego  £■(/*)  oraz  wektor  in- 
dukcji magnetycznej  B{r)  są  polami  bezpośrednio 
mierzalnymi.  W elektrostatyce  w wypadku  stacjonar- 
nego pola  if  wprowadza  się  bezpośrednio  niemie- 
rzalne pola  <p{r)  i ~Mr)y  zw.  potencjałem  skalarnym 
i wektorowym.  Związki  między  E i <p  oraz  między  B 
i A są  następujące: 

d<p  dtp  dtp  \ 


E = — grad? 


= -(- 


B = rotżf = 


SAz  SAy  SAz  _ SAz 

dy  dz  * dz  dx 


dAy  dAx  \ 
~dx  dy~ / 


(dla  pól  zmiennych  w czasie  związki  te  mają  bardziej 
skomplikowaną  postać). 

Okazuje  się,  że  znajomość  pola  elektrostatycznego 
w całej  przestrzeni  dają  pełną  informację  o rodzaju 
i rozmieszczeniu  ładunków,  a mianowicie  gęstość 

rozkładu  ładunku  q (7)  jest  określona  przez  potencjał 
<P  za  pośrednictwem  równania  Poissona: 


A <p(r)=  - 


e 


(6) 


(e  — przenikalność  elektryczna  ośrodka).  Gdy  ładunek 
punktowy  znajduje  się  w punkcie  R , <p  ma  osobliwość: 

q>(r  = R)  = oo.  Tak  więc  miejsce,  w którym  pole  ma 
osobliwość,  odpowiada  miejscu,  w którym  znajduje 
się  ładunek  punktowy.  Operacja  A we  wzorze  (6) 
nazywa  się  laplasjanem  i zdefiniowana  jest  jak  na- 
stępuje: 


A y>(0  = 


ć)2<p  d2<p  d2tp 


Jeszcze  jedną  operacją  występującą  w elektrodynami- 
ce jest  dywergencja  pola  wektorowego: 


ładunki  jako 
osobliwości 
pola 


divl?  = 


dEz  dEy  dEz 


dx  ' dy  dz 
Maxwell  doszedł  do  swoich  równan  wyobrażając 
sobie  pole  elektromagnetyczne  jako  odkształcenie 
idealnego  niewidzialnego  sprężystego  ośrodka  zwa- 
nego eterem.  Odkrycie  przewidzianych  przez  jego 
teorię  fal  elektromagnetycznych  i interpretacja  świa- 
tła jako  fali  elektromagetycznej  to  jedno  z najwięk- 
szych odkryć  w fizyce.  Subtelne  doświadczenia  do- 
prowadziły do  odrzucenia  koncepcji  eteru.  Po  od- 
rzuceniu tej  koncepcji  w zasadzie  nie  mamy  na  gruncie 
elektrodynamiki  klasycznej  żadnego  intuicyjnego 
obrazu  rozchodzenia  się  fali  elektromagnetycznej. 
Mimo  to,  potrafimy  przewidywać  wyniki  eksperymen- 
tów optycznych  ze  światłem,  zachowanie  ładunków 
próbnych  pod  wpływem  fali  elektromagnetycznej 
i wiele  innych  efektów.  Otrzymujemy  to  wszystko 
z abstrakcyjnego  modelu  matematycznego,  którym 
są  równania  Maxwella.  Spotyka  się  często  sformuło- 
wanie „fala  elektromagnetyczna  rozchodzi  się  w próż- 
ni”. Wydaje  się  wskazanym  wyjaśnić,  jak  to  należy 
rozumieć,  by  uniknąć  zbędnych  metafizycznych  dy- 
skusji. Próżnia  w tym  sformułowaniu  jest  rozumiana 
jako  obszar  przestrzeni,  z którego  usunięte  zostały 
wszystkie  cząstki  materialne  mające  masę  spoczynko- 
wą. Tak  właśnie,  rozrzedzając  gaz  do  granic  technicz- 
nych możliwości,  otrzymuje  się  w technice  stany  wy- 
sokiej próżni.  Usuwając  cząstki  nie  usuwamy  jednak 
pola,  które  może  zmieniać  swój  stan  w czasie.  Jed- 
nym z rodzajów  tych  zmian  jest  fala  elektromagne- 
tyczna. Przeto  zamiast  mówić  „fala  elektromagne- 
tyczna może  rozchodzić  się  w próżni”,  lepiej  jest  po- 
wiedzieć: „stan  pola  zwany  falą  elektromagnetyczną 
może  ewoluować  w przestrzeni  pod  nieobecność 
cząstek  materialnych”.  Termin  „próżnia”  pojawia 
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ne stowa- 
rzyszone 
z czaso- 
przestrzenią 


się  jeszcze  w innym  znaczeniu  w kwantowej  teorii 
pola. 

Tak  jak  sygnalizowaliśmy,  polu  elektromagnetycz- 
nemu możemy  przypisać  energię  i pęd.  Wzór  na  ener- 
gię pola  elektromagnetycznego  w próżni  ma  postać: 


(7) 


gdzie  e0  i //0  są  stałymi,  zw.  przenikał nością  elektrycz- 
ną i magnetyczną  próżni. 

Z wielu  eksperymentów  wynikło,  że  fala  elektro- 
magnetyczna może  przekazywać  swą  energię  w ściśle 
określonych  porcjach,  tzw.  kwantach.  Najmniejsza 
porcja,  czy  kwant  pola  elektromagnetycznego,  nazy- 
wa się  fotonem.  Odkrycie  to  doprowadziło  do  sfor- 
mułowania elektrodynamiki  kwantowej,  a następnie 
kwantowej  teorii  pola.  Kwantowa  teoria  pola  z każdą 
obserwowaną  cząstką  wiąże  pole.  Skoro  cząstki  mają 
atrybuty  takie  jak  masa,  ładunek,  spin  itp.,  to  i po- 
lom wiązanym  z nimi  nadaje  się  te  same  atrybuty. 
Tak  więc  wyprzedzając  rozdział  o kwantowej  teorii  po- 
la będziemy  mówić  o klasycznych  polach  masowych 
naładowanych  itp.  Ponieważ  nie  udało  się  dotych- 
czas stworzyć  w pełni  zadowalającej  teorii  cząstek 
elementarnych,  prowadzi  się  wiele  badań  modelo- 
wych wprowadzając  różne  hipotetyczne  pola  i pró- 
bując przy  ich  pomocy  wyjaśnić  wyniki  eksperymen- 
tów. Badanie  różnorodnych  pól  klasycznych  ma  więc 
duże  znaczenie,  choć  często  sens  fizyczny  zostaje  im 
nadany  dopiero  po  ich  skwantowaniu.  Omówimy 
teraz  krótko  klasyczne  pola  swobodne  i oddziału- 
jące. Pola  klasyczne  nazywamy  oddziałującymi,  jeśli 
w równaniu  każdego  z nich  występują  inne  pola.  Od- 
działywanie pól  występuje  np.  przy  rozchodzeniu  się 
fali  elektromagnetycznej  i fali  akustycznej  w ośrodku 
sprężystym,  którego  stan  wpływa  na  pole  elektro- 
magnetyczne. Wówczas  równania  pola  elektromagne- 
tycznego będą  oczywiście  zawierały  parametry  fali 
akustycznej. 

Przed  ogólnym  omówieniem  metod  otrzymywania  równań 
pól  klasycznych  oddziałujących  między  sobą  zrobimy  dygresję 
o obiektach  geometrycznych  stowarzyszonych  z czasoprzestrzenią. 

Wiemy,  że  w różnych  układach  odniesienia  otrzymujemy  różne 
współrzędne  zdarzeń.  Struktura  czasoprzestrzeni  jest  dana  przez 
określenie  klasy  równoważnych  układów  odniesienia  i podanie 
związków  między  współrzędnymi  dowolnego  zdarzenia  dla  do- 
wolnej pary  układów  O i O'  z klasy  równoważnej.  Oznaczmy 
współrzędne  zdarzenia  p w układzie  O:  pQ  = (*0,  xl,  x2,  *3), 
gdzie  = ct.  Oznaczmy  współrzędne  tego  samego  zdarzenia 
w układzie  odniesienia  O’  : p0*  = (*0',  x1'  ,x*\  x3').  Związek 
między  tymi  współrzędnymi  ma  postać: 


x»'  = B»'x°  + +££'**  + B»'xz-ra»'. 


Przyjmując  umowę,  że  powtarzające  się  te  same  indeksy  — jeden 
„na  górze”,  a drugi  „na  dole”  — oznaczają  sumowanie,  możemy 
powyższy  wzór  zapisać  w prostszej  postaci : 

x»'  = 


(zbiór  16  liczb  J 3%'  nazywa  się  macierzą  transformacji).  Wyróż- 
nioną klasę  układów-  odniesienia  w teorii  Newtona  i w szczególnej 
teorii  względności  tworzą  układy  inercjalne.  Obie  te  teorie  różnią 
się  wyborem  macierzy  . W obu  teoriach  występują  macierze 
obrotów  w trzech  wymiarach,  które  oznaczymy  A\  . W teorii 
Einsteina  w miejsce  transformacji  Galileusza  występują  transfor- 
macje Lorentza , które  oznaczymy  (-*■  O niektórych  podsta- 
wowych pojęciach  fizycznych). 

Obiektem  geometrycznym  stowarzyszonym  z czasoprzestrze- 
nią nazywamy  obiekt  określony  w każdym  układzie  współrzęd- 
nych przez  tabelę  liczb,  które  przy  zmianie  układu  współrzędnych 
zmieniają  się  w ściśle  określony  sposób.  Wyróżniamy  następu- 
jące obiekty  geometryczne: 
skalary  — To  — To ; 

wektory  (kartezjariskie)  — a1  (przy  B\  — A\  ),  ax  ~ A*  — A\  a*; 
czterowektory  — au  (przy  = ^£'),  a?  ==  o4; 

tensory  kartezjańskie  drugiego  rzędu  — T*  ^ = A\  A ^ • 

tensory  lorentzowskie  drugiego  rzędu  — TM  v = A%  A y Tt,x- 
Analogicznie  wprowadza  się  tensory  wyższego  rzędu.  Przykładem 

skalara  kartezjańskiego  jest  iloczyn  skalarny  wektorów  a • bt 
przykładem  zaś  wektora  kartezjańskiego  są  wektory  takie,  jak 
wektor  siły,  prędkości,  przyspieszenia.  W przyjętej  notacji  su- 
macyjnej 

a'  b — a*bi:  i = 1,  2,  3. 


Przykładem  skalara  lorenizowskiego  jest 

— a°a°-aW—  a*o*—  a*a*t 


gdzie  a,  = 


o°,  oi  = —o1,  o2  = —o*  i o*  = —o3. 


Własności  geometryczne  określają  wskaźniki,  po  których  nie  ma 
sumowania.  Wskaźniki  tensorów  lorentzowskich  będziemy  ozna- 
czać literami  greckimi,  kartezjańskich  — łacińskimi.  Zgodnie 
z tymi  ustaleniami  wektorami  są  wielkości 

f»vgv,  lm**rn9t  YMt 
a skalarami  — wielkości 

Skalary,  które  przy  transformacji  odbicia  przestrzennego  r—>—r 
zmieniają  znak,  nazywa  się  pseudoskalarami,  a wektory  nie 
zmieniające  znaku  — pseudowektorami  (np.  moment  pędu). 
Wprowadza  się  też  bispinory  — kolumienki  y/A  czterech  liczb  ze- 
spolonych, o specyficznym  prawie  transformacji.  Z bispinorów 
zbudować  można  skalar  lorentzowski  y/A  y/A- 


Einstein  wysunął  postulat,  że  w każdym  z równo- 
ważnych układów  odniesienia  równania  fizyki  po- 
winny mieć  tę  samą  postać.  Winny  być  one  związkami 
między  obiektami  geometrycznymi  4-wektorami,  ten- 
sorami itp.  Taką  postać  mają  równania  Newtona 

(3),  w których  zarówno  d^rjdt 2 jak  i F są  wektorami 
kartezjańskimi.  Czysta  (bez  obrotów)  transformacja 
Galileusza  nie  zmienia  współrzędnych  tych  wektorów. 
Zbiór  transformacji  współrzędnych  zdarzeń  w szcze- 
gólnej teorii  względności  (określonych  macierzami 
Bi')  nazywamy  grupą  Lorentza,  a po  dołączeniu  prze- 
sunięć czasoprzestrzennych  — grupą  Poincarego. 
Ponieważ  czasoprzestrzeń  ma  strukturę  wyznaczoną 
przez  tę  grupę  (nazywa  się  ją  grupą  symetrii  czaso- 
przestrzeni), przeto  wszystkie  równania  powinny 
mieć  formę  współzmienniczą  (tensorową)  ze  względu 
na  transformacje  tej  grupy.  Taki  postulat  doprowa- 
dził Einsteina  do  zmodyfikowanej  postaci  równań 
Newtona  (3) : 

ŚŹL-f* 

dr 

W równaniach  tych  p»  = ( E/c , p ) i 


F» 


F v F 

|/l  — r*/c*  ’ }/\  —vz/c* 


gdzie  wielkości  E,  p,  F i v są  odpowiednio  energią, 
pędem,  siłą  i prędkością,  zaś  r jest  skalarem  loren- 
tzowskim  (czasem  własnym,  mierzonym  na  zegarze 
poruszającym  się  z punktem  materialnym).  Postu- 
lat Einsteina  ułatwia  znalezienie  właściwych  równań 
pola. 

Efektywną  metodą  otrzymywania  równań  pola 
o dobrze  określonych  własnościach  transformacyj- 
nych jest  metoda  wariacyjna.  Wywodzi  się  ona  z sie- 
demnastowiecznej zasady  Fermata,  która  brzmi : 
między  dowolnymi  dwoma  punktami  A i B światło 
wybiera  drogę,  dla  której  czas  przebiegu  jest  naj- 
krótszy lub  — rzadziej  — najdłuższy.  Ponieważ  pręd- 
kość światła  w punkcie  r w ośrodku  o współczynniku 

załamania  n(r)  wynosi  c/«(r),  to  światło  przebywa 

, dl  nd\ 

odcinek  łuku  krzywej  dl  w czasie  dt  ~ cjn  ~ c • 

Czas  Ta  *[#],  w którym  światło  przebiega  krzywą  Ky 
dany  jest  wzorem: 

K 

Metoda  matematyczna  zwana  rachunkiem  wariacyj- 
nym umożliwia  otrzymanie  równania  różniczkowego 
krzywej  K , dla  której  wielkość  Tab[K]  ma  wartość 
najmniejszą  lub  największą.  Równanie  to  zapisuje  się 
w postaci 

ÓT  = 0;  (8) 

odczytujemy  je:  wariacja  T równa  jest  zeru.  Korzy- 
stając z rachunku  wariacyjnego  i znając  wyrażenie  na 
T można  otrzymać  z równania  (8)  równanie  szukanej 
krzywej. 

Wykazano,  że  równanie  ruchu  układu  punktów 
materialnych  również  można  zapisać  w formie  wa- 


postulat 

Einsteina 


wariacyjna 

postać 

równań  ruchu 
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zasada  naj- 
mniejszego 
działania 


gęstości 
lagrangianów 
i równania 
pół  swobod- 
nych 


riacyjnej  <5/  = 0,  gdzie  /,  zwane  działaniem,  ma  po- 
stać: 

l = jLd<, 

a L jest  funkcją  Lagrange’a  (lagrangianem) : 

L = energia  kinetyczna  — energia  potencjalna. 
Znajdowanie  równań  ruchu  metodą  wariacyjną  ma 
kilka  zalet.  Otrzymane  równania  mają  dobrze  okre- 
ślone właściwości  tensorowe,  o ile  działanie  jest  ska- 
larem  ze  względu  na  odpowiednią  dla  problemu  gru- 
pę symetrii.  Z każdą  transformacją  zmiennych  wy- 
stępujących w funkcji  L nie  zmieniającą  działania 
związane  jest  istnienie  odpowiedniej  całki  równań 
ruchu.  Twierdzenie  Noether  daje  efektywną  metodę 
znajdywania  tych  całek  równań  ruchu.  Na  przykład 
z niezmienniczości  ze  względu  na  przesunięcia  w cza- 
sie wynika  całka  energii,  ze  względu  na  przesunięcia 
w przestrzeni  — całka  pędu,  ze  względu  na  obroty 
— całka  momentu  pędu  (-*  Zasady  zachowania). 

Te  wszystkie  zalety  metody  wariacyjnej  spowodo- 
wały, że  się  ją  najczęściej  stosuje  do  wyprowadzania 
równań  pola.  Ponieważ  właściwą  grupą  symetrii  cza- 
soprzestrzeni jest  grupa  Poincarego,  działanie  / za- 
pisuje się  w relatywistycznej  teorii  pola  w trochę  innej 
postaci : 

/= i£(x>rS’-)dtx’ 

gdzie  £(x)  jest  gęstością  lagrangianu,  a a oznacza 
wszystkie  indeksy  pola  <p,  łącznie  z indeksami  ten- 
sorowymi ze  względu  na  grupę  Lorentza.  Ponieważ 
element  objętości  czasoprzestrzeni  dx x jest  skalarem 
lorentzowskim,  to  aby  działanie  było  skalarem,  gę- 
stość lagrangianu  musi  też  być  skalarem. 

Dla  układu  pól  oddziałujących  gęstość  lagrangianu 
składa  się  z sumy  gęstości  lagrangianów  odpowiada- 
jących polom  swobodnym  i gęstości  lagrangianu 
oddziaływania  £j . W £j  występują  przeważnie 
najprostsze  skalary  lorentzowskie  skonstruowane 
z pól  swobodnych  występujących  w rozważanym 
problemie. 


Zanim  podamy  najważniejsze  gęstości  lagrangianów  i równania 
pola,  wprowadzimy  pewne  upraszczające  oznaczenia : 


bx» 


A*  = d»Av  = Avm , 


dxu 


Av  = buAv, 


. 1 ^ 

D A c2  dt * 


-bud*. 


Operację  □ nazywa  się  operatorem  d’Alemberta.  Pola  można 
reprezentować  również  przez  funkcje  o wartościach  zespolonych ; 
sprzężenie  zespolone  oznaczamy  gwiazdką,  np.  (p*  jest  funkcją 
sprzężoną  zespoloną  do  <p.  Pola  takie  służą  do  opisu  cząstek  na- 
ładowanych. 

Podstawowe  gęstości  lagrangianów  i równania  pól  swobod- 
nych są  następujące : 

Naładowane  pola  skalarne  o masie  m i spinie  0 

£ = (8 u (P)*^  <p)—m*<p<p* , (9) 

(□-m*)ę>=0.  (10) 

Naładowane  pole  wektorowe  o masie  m i spinie  1 

£ = - _L  jp*mv  Ffit  + Un  U» 

4 2 

(gdzie  F,tv  = ^i/v-avŁ/“), 

(O-m2)  U**  « 0. 

Swobodne  pole  elektromagnetyczne 

£ = -‘/./X*/**,  do 

(gdzie  = a‘Mv-£v  A“), 

DA * = 0; 

pole  Au  wyraża  się  przez  potencjał  elektrostatyczny  <p  i potencjał 

wektorowy  A w następujący  sposób : AM  = ( cę , A). 

Pole  o spinie  l/Ł  i masie  m 

£ = — — — mlf/y/ t(iyu dn— rn)  i//(x)  = 0;  (12) 

V i y oznaczają  pola  bispinorowe,  a y*  (ji  = 0,  1,  2,  3)  — cztery 
macierze  4x4  transformujące  się  jak  składowe  czterowektora 
przy  zmianie  układu  odniesienia  (dla  uproszczenia  opuszczamy 
we  wzorze  12  i następnych  w'ysumowane  wskaźniki  bispinorowe). 


Podamy  teraz  kilka  podstawowych  gęstości  lagrangianów  £i 
opisujących  oddziaływania  pól.  W elektrodynamice 

£i  = —eAujUy 

gdzi ej*  nazywa  się  prądem  elektromagnetycznym.  Prąd 7*  może 
być  klasyczny  lub  kwantowy;  jeśli  jest  kwantowy,  to y4  wyraża  się 
przez  bispinorowe  pole  elektronowe: 

ju  = yy* 

czyli  j*  to  najprostszy  wektor  lorentzowski  zbudowany  z yr,  y/ 
i y^.  Podobnie  najprostszym  oddziaływaniem  pola  bispinorowego 
V z polem  skalarnym  <p  jest 

£i  = gifrW, 

a z polem  pseudoskalamym  <p' : 

£z  = gv/Vi  W 

gdzie  y4  transformuje  się  jak  pseudoskalar.  To  ostatnie  oddziały- 
wanie zwie  się  oddziaływaniem  Yukawy  i zaproponowane  było 
do  opisu  oddziaływania  np.  nukleonów  z pionami.  Stałą  g nazy- 
wa się  stałą  sprzężenia. 

Oprócz  indeksów  lorentzowskich  dodaje  się  polom 
indeksy  określające  ich  własności  ze  względu  na  inne 
grupy  symetrii,  np.  określające  izospin,  spin  unitarny, 
kolor,  zapach  itp.  (-*  Zasady  zachowania).  Wtedy, 
kiedy  oddziaływanie  łamie  symetrię,  £ / nie  może 
być  skalarem  ze  względu  na  grupę  określającą  tę  sy- 
metrię. Jest  to  pewna  wskazówka  przy  poszukiwaniu 
odpowiedniej  gęstości  lagrangianu.  Dodatkowe  ogra- 
niczenie daje  żądanie  renormalizowalności  teorii  po 
skwantowaniu,  do  czego  wrócimy  później. 

Bardzo  ważną  symetrią,  która  odegrała  kluczową 
rolę  w konstruowaniu  najnowszej  teorii  oddziaływań 
słabych  i elektromagnetycznych,  jest  symetria  cecho- 
wania. Zilustrujemy  ją  na  przykładzie  skalarnego  pola 
naładowanego  (9).  Pole  to,  jako  najprostsze  najczę- 
ściej jest  stosowane  w rozważaniach  modelowych. 
Widać,  że  gęstość  lagrangianu  w tym  wzorze  jest 
niezmiennicza  ze  względu  na  transformację  zw.  glo- 
balną transformacją  cechowania : 

<p'  = ei<w?>,  (13) 

gdzie  Q to  ustalony,  aż  — dowolny  rzeczywisty  pa- 
rametr niezależny  od  *.  Dowód  jest  oczywisty,  bo  ze 
wzoru  (13)  wynika,  że  <p'*  = t~iQx<p*  i odpowiednie 
czynniki  fazowe  się  znoszą.  Pole  <p  jest  polem  o war- 
tościach zespolonych,  czyli  9?  = Re <p+ zim <p.  Trans- 
formacja (13)  ma  interpretację  obrotu  na  wykresie, 
na  którym  na  osi  * odkłada  się  Re??,  a na  osi  y odkła- 
da się  Im<?. 

Lokalną  transformację  cechowania  wprowadza  się 
wzorem 

<pf  « e<QA<*V.  (14) 

Okazuje  się,  że  stała  Q we  wzorze  (14)  ma  interpre- 
tację elektrycznego  ładunku  pola.  Widać,  że  gęstość 
(9)  nie  jest  niezmiennicza  ze  względu  na  tę  transfor- 
mację, ponieważ: 

ZW  = tiWx\d^iQdWx)). 

Zastanówmy  się,  jak  należy  zmienić  gęstość  (9),  żeby 
nowa  gęstość  lagrangianu  była  niezmiennicza  ze 
względu  na  transformację  (14).  Jedno  z rozwiązań 
jest  następujące:  dodajemy  do  operatora  Zu  pole 
wektorowe  AM  pisząc: 

= Z fi  iQAft;  (15) 

wtedy  w miejsce  wzoru  (9)  otrzymujemy 

£ = m2(p<p*.  (16) 

Aby  £ było  niezmiennicze  ze  względu  na  (14),  mu- 
simy określić,  jak  pole  Au  transformuje  się  przy  trans- 
formacji cechowania.  Jeśli: 

A'u  — Au  Z^A(x)y  (17) 

to  łatwo  wykazać,  że  £>'  D,fl  = czyli  £'  = £. 

(Elementarną  ilustracją  lokalnych  i globalnych  trans- 
formacji cechowania  jest  rys.  5).  Z tego  wynika  wnio- 
sek, że  z niezmienniczością  ze  względu  na  lokalną 
transformację  cechowania  naładowanych  pól  (trans- 
formacje (14)  tworzą  grupę  U(  1)),  związane  jest  w na- 
turalny sposób  wektorowe  pole  cechowania  AM  sprzę 
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transforma- 
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os  obrotu 


N 


b) 

Rys.  5.  Ilustracja  lokalnej  grupy  cechowania  0(2)  obejmującej 
obroty  wokół  osi  z.  a)  Sześcian  ułożony  z identycznych  klocków, 
b)  sześcian  złożony  z prętów  i odpowiednio  naciętych  kul,  tak 
aby  wygląd  kuli  nie  zależał  od  obrotu  wokół  osi  r,  oraz  aby 
każda  kula  mogła  być  obracana  niezależnie  bez  psucia  konstrukcji. 
Obie  bryły  są  niezmiennicze  ze  względu  na  globalną  grupę  ce- 
chowania — czyli  na  obroty  bryły  jako  całości  wokół  osi  z. 
Przy  przejściu  do  lokalnej  grupy  cechowania  — niezależne 
obroty  klocków  i kul  — bryła  pierwsza  ulegnie  deformacji, 
a druga  zachowa  swój  kształt 


po8e  gające  się  z polem  naładowanym  tak,  jak  we  wzorze 
cechowania  (]6).  Do  £ musimy  dodać  gęstość  lagrangianu  swo- 
bodnego pola  cechowania  A„.  Widać,  że  pole  musi 
. być  bezmasowe,  ponieważ  tylko  gęstość  lagrangianu 
swobodnego  pola  wektorowego  bezmasowego  (11) 
jest  niezmiennicza  ze  względu  na  transformację  (17). 
Po  dodaniu  tej  swobodnej  gęstości  i rozpisaniu  wzoru 
(16)  przy  pomocy  wzoru  (15),  otrzymujemy  gęstość 
lagrangianu,  którą  przez  analogię  do  elektrodyna- 
miki wypisalibyśmy  dla  naładowanego  pola  skalarne- 
go oddziałującego  z polem  elektromagnetycznym. 
Pozwała  to  utożsamić  w tym  przypadku  pole  cecho- 
wania Au  z polem  elektromagnetycznym  (nieprzypad- 
kowa zbieżność  oznaczeń).  Podobnie  startując  z na- 
ładowanego pola  bispinorowego  (którego  kwanty 
odpowiadają  elektronom)  i szukając  najprostszej 
gęstości  lagrangianu  niezmienniczej  ze  względu  na 
lokalną  grupę  cechowania,  otrzymujemy  gęstość 
lagrangianu  elektrodynamiki.  Stąd  bierze  się  idea 
poszukiwania  nowych  interesujących  fizycznie  pól 
jako  pól  cechowania. 

teorie  z wyi-  Wyposażając  pola  w dodatkowe  własności  można 
szymi  grupa-  budować  gęstości  lagrangianu  niezmiennicze  ze  wzglę- 
mi  lokalnymi  du  na  grupy  bardziej  złożone,  takie  jak  SU(2),  SU(3) 
cechowania  (-►  Cząstki  elementarne  i ich  oddziaływania).  Trans- 
formacje np.  z grupy  SU( 2)  można  przedstawić  w po- 
staci : 

e7^  U l + (A4l0+1/.(AłW+  .... 

gdzie  /A,  /2,  /3  są  pewnymi  macierzami  zwanymi  ge- 
neratorami grupy  SC/(2).  Dla  grupy  Sf/(3)  mamy  8 ge- 
neratorów. Żądając,  aby  gęstość  lagrangianu  była 
niezmiennicza  ze  względu  na  lokalną  grupę  SU( 2), 
czyli  ze  względu  na  transformacje: 
er{^(x) 

otrzymuje  się  w naturalny  sposób  (analogiczny  do 
dyskutowanego  wyżej)  3 bezmasowe  wektorowe  pola 
cechowania.  Ponieważ  w przyrodzie  nie  są  znane  żad- 
ne cząstki  wektorowe  bezmasowe  poza  fotonem,  wy- 
dawało się  przez  wiele  lat,  że  teorie  z wyższymi  gru- 
pami lokalnymi  cechowania  nie  znajdą  zastosowania 
w fizyce.  Subtelne  rozważania  na  gruncie  kwantowej 
teorii  pola  wykazały,  że  jest  inaczej. 


Czym  zajmuje  się  mechanika 
kwantowa 


Podstawowym  przesłankami  powstania  mechaniki 
kwantowej  były  następujące  obserwacje.  Zauważono, 
że  w mikroświecie  pewne  wielkości  fizyczne,  takie  jak 


energia  E i moment  pędu  7,  mogą  zmieniać  się  tylko 
skokowo.  Stwierdzono  poza  tym,  że  pewne  wielkości 
fizyczne,  zwane  komplementarnymi,  mają  tę  wła- 
sność, że  ich  jednoczesny  dokładny  pomiar  jest  nie- 
możliwy (np.  im  bardziej  precyzyjny  będzie' pomiar 
położenia  mikrocząstki,  tym  większą  niekontrolo- 
waną zmianę  jej  pędu  pomiar  ten  spowoduje).  Mimo 
silnego  wpływu  pomiarów  na  stan  mikrocząstki  ob- 
serwuje się  wiele  regularności  w eksperymentach  prze- 
prowadzanych z bardzo  dużą  liczbą  identycznie  przy- 
gotowanych mikrocząstek.  Na  przykład,  nie  jesteśmy 
w stanie  przewidzieć,  kiedy  rozpadnie  się  obserwo- 
wana mikrocząstka  nietrwała;  natomiast  okazuje  się, 
że  czas,  w jakim  rozpada  się  połowa  cząstek  z próbki 
materiału  radioaktywnego,  nie  zależy  od  wielkości 
próbki,  tylko  od  wybranego  pierwiastka  i wszystkie 
eksperymenty  dają  bardzo  zbliżoną  jego  wartość. 
Podobnie  promienie  rentgenowskie,  elektrony  lub 
neutrony  po  przejściu  przez  kryształ  tworzą  piękne 
obrazy  dyfrakcyjne  (rys.  6),  natomiast  zachowania 
się  wybranej  mikrocząstki  nie  jesteśmy  w stanie  prze- 
widzieć. Tak  więc  regularności  obserwowane  w mi- 
kroświecie mają  charakter  statystyczny,  to  znaczy, 
jeśli  w pewnym  eksperymencie  mamy  dużą  liczbę 
identycznie  przygotowanych  mikroukładów  fizycz- 
nych (w  stanie  początkowym  /),  to  z reguły  w wyniku 
eksperymentu  otrzymamy  grupy  układów  różniące 
się  od  siebie  (w  różnych  stanach  końcowych  f).  Re- 
gularność przyrody  polega  na  tym,  że  powtarzając 
ten  sam  eksperyment  wiele  razy  zawsze  otrzymujemy 
te  samą  częstość  występowania  mikroukładu  w sta- 
nie końcowym  /,  jeśli  był  on  w stanie  początkowym 
i;  prawdopodobieństwa  Pif  występowania  stanów/ 
spełniają  związek 

N 

/-I 


statystyczny 

charakter 

mechaniki 

kwantowej 


promieniowanie 

rentgenowskie 


elektrony 


(N  oznacza  liczbę  stanów  końcowych).  Celem  me- 
chaniki kwantowej  jest  wyznaczanie  wartości  praw- 
dopodobieństw Pif  odnoszących  się  do  różnych 
eksperymentów,  jak  również  znajdowania  dopuszczal- 
nych wartości  wielkości  fizycznych  charakteryzują- 
cych stan  mikroukładów  (np.  poziomy  energetyczne 
atomów). 

Jeśli  podzielimy  przestrzeń  na  bardzo  wiele  (N 
bliskie  nieskończoności)  sześcianików,  możemy  za 
stan /mikrocząstki  uznać  fakt  obserwacji  jej  w /-tym 
sześcianiku.  Wyobraźmy  sobie,  że  mamy  urządzenie 
wysyłające  mikrocząstki  (źródło  promieniotwórcze, 
wyjście  z akceleratora  itp.)  i interesuje  nas  położenie 
mikrocząstki  po  czasie  T od  chwili  wyjścia  z urządze- 
nia. Stanem  i jest  teraz  wyjście  cząstki  z określonego 
urządzenia,  a Pif(T) — prawdopodobieństwem  reje- 
stracji jej  po  czasie  T w f- tym  sześcianiku.  Aby  obli- 
czyć prawdopodobieństwa  Pif{T)  wprowadza  się 

w mechanice  kwantowej  funkcję  falową  P(ryt).  Praw- 
dopodobieństwa Pif{T)  otrzymuje  się  przy  pomocy 


• o 

neutrony 

Rys.  6.  Obrazy  dy- 
frakcyjne Lauego 
wytworzone  przez: 
promieniowanie 
rentgenowskie, 
elektrony  i neutrony 


wzoru 

Pif(T)  = f <fvV*(7,  rm7  r)~ 

~ V*ty/,  T)Y{r/,  T) | V/\, 


gdzie  Vf  oznacza  sześcianik,  r/ — jego  środek,  a | Vf\  — 

jego  objętość.  Funkcja  falowa  *P(r,  t)  jest  obiektem  funkcja 
abstrakcyjnym.  Jest  to  funkcja  o wartościach  ze-  fałowa 
spolonych,  a ponieważ  służy  do  obliczania  prawdo- 
podobieństw, nazywa  się  ją  amplitudą  prawdopodo- 
bieństwa; oczywiście  musi  mieć  własność 


f *P*(7,r)^(P,/)^v=  i. 

R3 


Zmienność  w czasie  funkcji  falowej  cząstki  o masie 
m jest  dana  przez  równanie  Schródingera : 


ńi4-v=--!!-W(r,0+v<f)'rór,t).  08) 

dt  2 m 
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równanie 

Schródingera 


Równanie  to  zapisuje  się  również  w postaci:  Ten  postulat  odegrał  podstawową  rolę  w sformuło- 

3 A waniu  mechaniki  kwantowej  przez  Feynmana.  Opię- 
to~Ź7  rają  się  na  nim  rozważania  w artykule  „Oddziaływa- 

nia elektromagnetyczne”.  Jeśli  procesów  jest  nieprze- 
zasada  gdzie  operator  różniczkowy  H nazywa  się  hamilto-  wiele,  suma  we  wzorze  (21)  musi  być  zastą- 

korespon-  nianem.  Ważną  rolę  przy  wypisywaniu  równania  (18)  ca  struktura  amplitud  przejścia  jest 

dencji  Bohra  dla  konkretnego  problemu  odgrywa  zasada  korespon-  właściwa  dla  kwantowej  teorii  pola,  którą  buduje  się 
dencji  Bohra,  zgodnie  z którą,  jeżeli  dokonujemy  w P°dobny  sposób  jak  mechanikę  kwantową. 


pomiary  z dokładnością  makroskopową  (np.  obser- 
wujemy tor  cząstki  elementarnej  w komorze  pęche- 
rzykowej, iskrowej  czy  w emulsji),  to  wartość  mierzo- 
na wielkości  fizycznej  musi  się  zmieniać  zgodnie  z pra- 
wami mechaniki  klasycznej  (położenie  „makrosko- 
powe” musi  zmieniać  się  w czasie  zgodnie  z równa- 
niami Newtona  dla  danego  problemu).  Panuje  prze- 
konanie, że  w funkcji  falowej  danego  układu  fizycz- 
nego jest  zawarta  najpełniejsza  możliwa  informacja 
o własnościach  mikrocząstek.  W ostatnim  rozdziale 
wspomnimy  o poglądach  odmiennych.  W istocie  przy 
pomocy  funkcji  y>  można  przewidzieć  wyniki  bardzo 
różnych  eksperymentów.  Na  przykład  jeśli  zamiast 
położenia  mierzylibyśmy  w omawianym  powyżej 
eksperymencie  średni  pęd  mikrocząstek  w kierunku 
osi  * w chwili  T9  </>x(7’)>,  to  dany  on  byłby  wzorem 

<Pz(T)>  = j ¥"(?,  T)~V(7,  T)d7. 

Podobnie  z każdą  inną  wielkością  fizyczną  O można 
skojarzyć  operator  Ó tak,  żeby  średnia  mierzona 
wartość  <0(D>  była  dana  wzorem: 

<0(T)}  = J !P*(7,  T)ón7,  T)d7.  (19) 

tf3 

Ponieważ  funkcję  falową  można  zapisy wać  jako  funk- 
cję innych  zmiennych  niż  r,  na  przykład  pędu  py  używa 
się  ściślejszego  i bardziej  abstrakcyjnego  języka  mó- 
wiąc, że  każdemu  stanowi  mikrocząstki  odpowiada 
wektor  stanu  należący  do  przestrzeni  Hilberta, 
a każdej  wielkości  fizycznej  O — operator  samosprzę- 
żony  6 w tej  przestrzeni  taki,  że  średnia  wartość 
<0>  wynosi: 

<0>  = <!P, 

gdzie  ^Py  ÓY}  oznacza  iloczyn  skalamy;  dla  = 
= ma  on  postać  (19).  Intuicje  klasyczne  są  istot- 

ne przy  wyborze  H.  Na  przykład  dla  atomu  wodoru 
(który  klasycznie  wyobrażamy  sobie  jako  oddziału- 
jące punktowe  cząstki:  lekki  elektron  i ciężki  proton, 
tworzące  stan  związany)  w równaniu  Schrodingera 

(18)  w pierwszym  przybliżeniu  w miejsce  V(r)  pojawi 
się  klasyczny  potencjał  elektrostatyczny.  Równanie 
to  umożliwi  wyznaczenie  poziomów  energetycznych 
atomu  wodoru  i wielu  zjawisk  dotyczących  tego  ato- 
mu, nie  da  nam  jednak  żadnego  wyobrażenia  o bu- 
dowie atomu.  Nie  wiemy,  co  się  dzieje  z elektronem 
w atomie.  Wszelkie  rysunkowe  wyobrażenia  są  nie- 
prawdziwe. 

prawdopo-  Jak  już  wspominaliśmy,  mechanika  kwantowa 
dobieństwo  umożliwia  również  obliczenie  prawdopodobieństw 
przejścia  przejścia  Pif : 

= I2,  (20) 


0 kwantowaniu  pól 
swobodnych 

Jak  już  wspominaliśmy,  fale  elektromagnetyczne 
w wielu  eksperymentach  (efekt  fotoelektryczny,  zja- 
wisko Comptona)  zachowują  się  jak  strumienie  czą- 
stek — fotonów  o dobrze  określonej  energii,  pędzie 

1 o zerowej  masie.  Cząstki  te  biorą  udział  w wielu 
oddziaływaniach  z elektronami  i pozytonami  (anihi- 
lacja  par  e+e ~,  kreacja  par,  produkcja  dodatkowych 
fotonów  przy  zderzeniach  e+e~  i e~e~  itp.).  Dla  opi- 
sania tych  oddziaływań  powstała  elektrodynamika 
kwantowa.  Służy  ona  do  znajdowania  amplitud  praw- 
dopodobieństwa wyżej  wymienionych  procesów.  Dla 

opisania  procesów  oddziaływania  cząstek  elementar-  kwantowa 
nych  powstała  kwantowa  teoria  pola.  Według  kwan-  teoria  pola 
towej  teorii  pola  z każdą  obserwowaną  w przyrodzie 
cząstką  elementarną  jest  stowarzyszone  pole.  Od- 
działywania cząstek  to  oddziaływania  odpowiednich 
pól.  Pole  będąc  obiektem  fizycznym  może  znajdować 
się  w różnych  stanach,  np.  1 foton  to  stan  jednofoto- 
nowy,  2 fotony  to  stan  dwufotonowy.  W kwantowej 
teorii  pola,  podobnie  jak  w mechanice  kwantowej, 
stanom  układu  przyporządkowuje  się  wektory  stanu 
w przestrzeni  Hilberta,  a wielkościom  mierzalnym, 
tzw.  obserwablom  — operatory.  Pomocą  przy  znaj- 
dowaniu takiej  reprezentacji  matematycznej  jest 
znajomość  teorii  klasycznej,  wyników  doświadczeń 
oraz  zasada  korespondencji.  Podstawowymi  obser- 

wablami  w mikroświecie  są  energia  E i pęd  p.  Energia 
pola  i pęd  są  w teorii  klasycznej  funkcjami  samych 
pól  (np.  wzór  13).  Dla  pól  bez  analogii  klasycznej 

wzory  na  E i p otrzymuje  się  z twierdzenia  Noether. 

— ► 

Ponieważ  £i/>w  teorii  kwantowej  mają  być  operato- 
rami, więc  pola  kwantowe,  z których  zgodnie  z zasadą 
korespondencji  są  one  zbudowane,  muszą  być  ope- 
ratorami. Mówiąc  ściślej,  operatorami  są  pola  po 
wy  całkowani  u ich  z funkcją  odpowiednio  regularną. 

W matematyce  obiekty  takie  nazywa  się  dystrybucja- 
mi o wartościach  operatorowych. 

Prześledzimy  strukturę  matematyczną  teorii  na 
przykładzie  swobodnego  bezmasowego  pola  skalar- 
nego. Stan  pola,  w którym  jest  n kwantów  o energii 
—¥ 

h(o  i pędzie  hk  jest  z definicji  stanem  o określonej 
energii  i pędzie.  Oznaczmy  wektor  z przestrzeni  Hil- 
berta reprezentujący  ten  stan  przez  <Pn  = | n,  X>. 

Wartości  oczekiwane  energii  i pędu  są  równe: 

Z7  Ł oczekiwane 

E=nft<o  i </>>  = nfik,  (22)  energii  i pędu 

uwzględniając  (20)  i wprowadzając  oznaczenia 


gdzie  iJP/  oznaczają  początkową  i końcową  funkcję 
falową,  S — pewien  operator  dający  się  wyznaczyć 
z równania  Schrodingera.  Jeśli  stan  końcowy  można 
otrzymać  w wyniku  N różnych  procesów,  a eks- 
peryment nie  pozwala  na  rozstrzygnięcie,  który 
proces  zaszedł  w danym  wypadku,  to  amplituda 
Afi  = <?P/,  SPi)  daje  się  przedstawić  jako  suma  N 
amplitud  Avfi(Avn  jest  amplitudą  odpowiadającą  ^-te- 
mu procesowi): 

An-fĄ.  (21) 

p-i 


<n,k\E\n,k>  " <tf> „,E<Pn>, 

(n,k\p\n,  k>  = 
można  to  zapisać  w postaci 

</i,  k | E\n9  k}  = nh<o9  (23) 

</?,  k \p\n9  ky  — nhk,  (24) 

gdzie  wielkości  co  i k = \k\  związane  są  równością 
( oi/c2—k 2 = 0.  Wielkości  E i p tworzą  razem  cztero- 
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operatory 
kreasjś 
i anihiśacji 


kwantowa  nie 

poSa 


wektor,  zatem  (22)  można  zapisać  krótko 
</>">  = nfik*,  fi  = 0, 1, 2, 3, 

gdzie  k*  = (co/c,  k).  Najprostsze  rozwiązanie  rów- 
nania (10)  dla  m = 0 ma  postać: 

<pk  = = c'(k)eik»x,t,  (25) 

gdzie  c'  to  dowolna  stała,  która  może  zależeć  od  k. 
Energia  pola  klasycznego  odpowiadająca  (na  pod- 
stawie twierdzenia  Noether)  temu  rozwiązaniu  wyno- 
si : _ _ 

E(<fic)  = c'*(k)c'(k)o)(k)  = c*(k)c(k)fia>(k). 

Najprostszym  sposobem  przyporządkowania  energii 
E — operatora'—  (w  zgodzie  ze  wzorem  23)  jest  za- 
stąpienie współczynnika  c*(k ) c(k)  operatorem  liczby 
cząstek  o pędzie  k,  mającym  własność: 
h(Jć)\n,  k}  = n\n , k >. 

Operator  h{k)  ma  żądane  własności,  jeśli  współczyn- 
nikom c*  i c przyporządkujemy  operatory  ć i ć+  ta- 
kie, że 

c(k)\nyky  = }/n\n-lyky,  (26) 

c+mn,k>  = }/n+T\n+l,  F>.  (27> 

Operatory  (26)  i (27)  nazywamy  odpowiednio  opera- 
torem anihilacji  i kreacji  cząstek  o pędzie  Ar.  Najogól- 
niejsze rozwiązanie  równania  (10)  dla  m — 0 jest 
kombinacją  liniową  rozwiązań  (25): 

?(*)=  (28) 
J ylco 

R 3 r 

a energia 

£(?)  = * f ^(r)c(A)W3k.  (29) 

R9  _ 

Zastępując  we  wzorach  (28)  i (29)  stałe  c(k)  i c*(k) 
przez  operatory  (26)  i (27)  otrzymujemy  operator 
pola  qy  i operator  energii  E: 

?W=  f (30) 

V2«> 

i = r>(*)£#)a>(*)rf€ 

R* 

Podobnie  wszystkie  inne  obserwable  wyrażające  się 
przez  pole  <p(x)  stają  się  po  uwzględnieniu  wzoru  (30) 
operatorami 

0(<p)-+:0(ą>):. 

Procedurę  przyporządkowywania  polom  klasycznym 
pól  kwantowych  nazywa  się  kwantowaniem.  Symbol 
: : oznacza  tzw.  normalne  uporządkowanie  iloczy- 

nów operatorów  kreacji  i anihilacji  występujących  w 
0(£);  uporządkowanie  musi  być  takie,  aby  wszystkie 
operatory  anihilacji  stały  na  prawo  od  operatorów 
kreacji,  np. : 

:ć(k2)ć+(k1)c(ri)c+(r2):  = c+(k1)c+&2)c(k2)c(k1). 


Przy  takim  opisie  okazuje  się,  że  stany  pola  klasycz- 
nego mogą  być  reprezentowane  przez  wektory  stanu 
z nieskończoną  liczbą  cząstek,  które  nazywa  się  sta- 
nami koherentnymi.  Wartość  oczekiwana  pola  kwan- 
towego # w tych  stanach  równa  jest  poju  klasycz- 
nemu. Z doświadczenia  wiadomo,  że  w stanach  o nie- 
wielkiej liczbie  kwantów  pole  przejawia  własności 
cząstkowe,  natomiast  w stanach  o bardzo  wielkiej 
liczbie  kwantów  (np.  klasyczna  makroskopowa  fala 
elektromagnetyczna)  pole  przejawia  własności  fa- 
lowe. Na  tym  polega  dualizm  falowo-korpuskulamy. 

Aby  wartość  oczekiwana  pola  kwantowego  ?<*)  (30) 
dla  stanu  koherentnego  spełniała  równanie  pola  kla- 
sycznego, przyjmuje  się  taką  samą  postać  równania 
pola  kwantowego  $,  jak  pola  klasycznego  <p.  Przy 
takim  założeniu  wektory  stanu  pola  nie  zależą  od 
czasu.  Tego  rodzaju  opis  ewolucji  układu  w czasie 
nazywamy  obrazem  Heisenberga.  Inny  możliwy  opis 
to  obraz  Schródingera,  w którym  operatory  pola  nie 
zależą  od  czasu,  a wektory  stanu  <P  spełniają  rów- 
nanie: 

= H<P(t), 
at 

gdzie  przeważnie  za  operator  H można  przyjąć  ope- 
rator energii  E.  Dygresja  ta  będzie  rozszerzona  po 
wprowadzeniu  oddziaływań  pól  kwantowych. 

Kwantowanie  innych  swobodnych  pól  klasycznych 
przebiega  podobnie,  z tym  że  dopuszczalne  stany  pól 
są  bogatsze,  kwanty  ich  charakteryzuje  ładunek,  nie- 
zerowy  spin  (całkowity  dla  pól  wektorowych  i dla  pól 
bispinorowych)  oraz  dodatkowe  własności  takie  jak 

izospin,  spin  unitarny  itp.  Tak  więc  operatory  ć(k) 
przechodzą  w ća{k),  a wskaźnik  a oznacza  dodatkowe 
własności. 

Okazuje  się,  że  dla  każdego  kwantu  pola,  który 
charakteryzuje  masa  m , czteropęd  fik*,  ładunki  qi 
(ładunek,  hiperładunek,  liczba  barionowa),  rzut  spinu 
Sz  na  oś  z,  istnieje  kwant  pola  (zwany  antycząstką) 
o masie  m , czteropędzie  fik*,  ładunkach  —qt  i rzucie 
spinu  -Sz.  Często  spotyka  się  w literaturze  popular- 
nonaukowej zdanie,  od  którego  zwykłemu  czytelni- 
kowi jeżą  się  włosy:  „Antycząstką  to  cząstka  o energii 
ujemnej  poruszająca  się  wstecz  w czasie”.  W przy- 
rodzie nic  nie  porusza  się  wstecz  w czasie.  Zdanie 
powyższe  należy  rozumieć  w następujący  sposób: 
jeśli  w równaniu  opisującym  cząstkę  zmienimy  wy- 
stępujący tam  parametr  energii  E na  — Eoraz  / na  — /, 
to  otrzymamy  równanie  opisujące  antycząstkę  o ener- 
gii E(E>  0),  poruszającą  się  w przód  w czasie.  Bez 
tego  wyjaśnienia  zdanie  przytoczone  (które  jest  wła- 
ściwie rozumiane  przez  fizyków)  zmienia  się  w zdanie 
nonsensowne.  Należy  go  więc  unikać. 

Konieczność  porządkowania  normalnego  wymaga 
w pewnych  sytuacjach  znajomości  własności  opera- 
torów ć(k)  i c+{k)  przy  ich  przestawieniu,  czyli  znajo- 
mości tzw.  związków  przemienności.  Aby  wyrażenie 
mające  interpretację  energii  było  dodatnie,  muszą  za- 
chodzić następujące  związki: 

(ća(Jt),  cJ(F')]±  = i,(k)c*(k')±c*{}P)c%(k)  = 

= d„6(k-l?),  (31) 


Szczególne  znaczenie  ma  stan  pola  O zwany  próżnią, 
zdefiniowany  równościami 

ć(k)Q  = 0 dla  każdego  k. 

stan  próżni  Za  pomocą  Q i operatorów  kreacji  można  przedsta- 
wić każdy  stan  pola  jako  stan  otrzymany  z próżni 
przez  działanie  operatorów  kreacji: 

11  ,k>=c+(k)Q, 

|2,F>  = V2  c+(k)c+(k)Q, 


{ć+(k))n  0 


gdzie  da„ó(k-iP)  znika  dla  i kćk'.  Znak  plus 
odpowiada  polom  o spinie  połówkowym,  a minus  — 
polom  o spinie  całkowitym.  Mówimy,  że  kwanty  tych 
pól  podlegają  odpowiednio  statystyce  Fermiego-Dira- 
ca  lub  Bosego-Einsteina  (->  Termodynamika  sta- 
tystyczna).   

Za  pomocą  operatorów  ćj  budujemy  z prozm  rożne 
stany  m-cząstkowe  o ustalonych  pędach,  np. 

\m,k>  - Aićt&y* ... 

gdzie /i-ł-r2+  ...  = m,  aa1# ...  otp  oznaczają  róż- 

niące się  zbiory  parametrów.  Dla  cząstek  o spinach 
połówkowych  n = 0 lub  1 — wynika  to  ze  związków 
przemienności  i nazywa  się  zakazem  Pauliego. 


istnienie 

antycząstek 


związki 

przemienno- 

ści 
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O diagramach  Feynmana,  renor- 
maiizacjji  i kłopotach  z silnymi 
oddziaływaniami 

Doświadczenie  sugeruje,  że  oddziaływania  pól  wiążą 
tworzenie  się  z tworzeniem  i znikaniem  cząstek.  Na  przykład 
i znikanie  zderzenie  neutronu  o wielkiej  energii  z jądrem  srebra 
cząstek  zarejestrowane  zostało  w emulsji  jądrowej  (rys.  7) 
w postaci  „gwiazdy”  — tor  protonu  zakończony  jest 
pękiem  torów  wychodzących  z jednego  punktu.  To, 
co  wydarzyło  się  w czasie  właściwego  oddziaływania 
na  odległościach  rzędu  10" 13  cm  i w czasie  rzędu  10_23s, 
jest  dla  nas  tylko  źródłem  domysłów'.  Jedno  jest  pewne : 
szybko  zmieniające  się  w obrazie  Schrodingera  stany 
pola  oddziałującego  nie  mogą  być  stanami  o ustalonej 
liczbie  cząstek.  Nie  jest  w pełni  jasne,  jak  należy  kon- 
struować wektory  odpowiadające  tym  stanom,  ani  jak 


Rys.  7.  Neutron  z promieniowania  kosmicznego  zderza  się 
z jądrem  srebra  w emulsji  jądrowej.  Można  rozróżnić  169  na- 
ładowanych cząstek,  z których  co  najmniej  130  jest  cząstkami 
wyprodukowanymi.  Strzałka  oznacza  kierunek  padającego 
neutronu,  który  jako  cząstka  nienaładowana  nie  pozostawił 
śladu  w emulsji 

przedstawiać  operatory  pola.  Najogólniej  postawiony 
problem  to  zapisanie  w obrazie  Heisenberga  równań 
klasycznych  oddziałujących  pól  i szukanie  rozwiązań 
tych  równań  w postaci  funkcji  (dystrybucji),  których 
wartościami  są  operatory  działające  na  przestrzeni 
Hilberta  stanów  pól  oddziałujących.  Podkreślmy, 
że  nie  znamy  zarówno  przestrzeni  Hilberta  jak  i ope- 
ratorów. Równania  oddziałujących  pól  są  skompliko- 
wanymi operatorowymi  równaniami  nieliniowymi. 
Dotychczas  nikomu  nie  udało  się  ich  rozwiązać  dla 
realistycznej  teorii. 

Sukcesy  i to  duże  osiągnięto  jedynie  w wypadku, 
gdy  oddziaływanie  między  polami  jest  słabe  (jak  np. 
w elektrodynamice  kwantowej),  dzięki  czemu  można 
rachunek  stosować  metodę  rachunkową  zw.  rachunkiem  za- 
zaburzeń  burzeń.  Metodę  tę  można  stosować  wtedy;  kiedy  gę- 
stość lagrangianu  oddziaływania  J2i  zawiera  małą  stałą 
sprzężenia  oraz  kiedy  procesy  fizyczne  obserwowane 
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w przyrodzie  wyglądają  tak,  jakby  oddziaływanie  się 
włączało  i wyłączało.  Innymi  słowy — kiedy  można 
wyróżnić  trzy  fazy:  pierwszą  i ostatnią,  w których 
występują  kwanty  pól  swobodnych,  oraz  środkową, 
w której  odbywa  się  oddziaływanie.  Wygodne  jest 
wówczas  stosowanie  opisu  zw.  obrazem  oddziały- 
wania. W obrazie  tym  zarówno  operatory  pola  jak  obraz  oddzia 
i wektory  stanu  zależą  od  czasu.  Operatory  poła  speł-  bywania 
niają  równania  pola  swobodnego,  zaś  wektory  stanu 
równanie  następujące: 

„ d 

= (32) 

gdzie  /f/,  zwany  hamiltonianem  oddziaływania,  wy- 
raża się  w prosty  sposób  przez  gęstość  lagrangianu 
oddziaływania  £i,  jeśli  £i  nie  zależy  od  pochodnych 
pól,  to 

Hi  = — f :£i:d*x. 

r* 

Podstawowymi  wielkościami,  które  chcemy  obli- 
czać, są  amplitudy  prawdopodobieństwa  przejścia  A fi 
ze  stanów  początkowych  J/>  do  stanów  końcowych 
|/).  Amplitudy  te  można  otrzymać  w postaci 

Aft  = </|5j/>.  (33) 

] Unitarny  operator  S zw.  macierzą  rozpraszania  (lub 
macierzą  S)  można  przedstawić  w postaci  rozwinięcia 
perturbacyjnego,  czyli  nieskończonego  szeregu  zw.  macierz  5 
perturbacyjnym : 

S = ?+  Ż (i)  i f dix'  - ***•[:&(*): 

n-i  ' ' 

...:£/(*«):],  (34) 

gdzie  / — macierz  jednostkowa,  zaś  T[...J,  zw.  iloczy- 
nem chronologicznym,  oznacza  czasowe  uporządko- 
wanie wyrażeń  w nawiasie  kwadratowym  od  najwięk- 
szej współrzędnej  czasowej  (na  lewym  końcu)  do  naj- 
mniejszej (na  prawym).  Wyrażenie  (34)  jest  formalnym 
rozwiązaniem  równania  (32).  Ponieważ  w każdym 
£i  (*i)  zawarta  jest  mała  stała  sprzężenia  g , tak  więc 
n-ty  wyraz  szeregu  Śn  zawiera  czynnik  gn « 1. 

To  jednak  nie  wystarcza  do  rozstrzygnięcia,  czy  for- 
malny szereg  (34)  jest  zbieżny,  tzn.  czyjego  suma  jest 
dobrze  określonym  operatorem.  Aby  się  o tym  prze- 
konać, należałoby  oszacować  wszystkie  wkłady  do 
amplitud  co  nie  jest  możliwe.  Dotychczas 

nie  ma  dowodu  zbieżności  szeregu  (34),  nawet  w elek- 
trodynamice. Nie  zmienia  to  faktu,  że  już  kilka  pierw- 
szych wyrazów  tego  szeregu  (po  renormalizacji, 
o której  za  chwilę  będzie  mowa)  daje  w elektrodyna- 
mice wyniki  wspaniale  zgodne  z doświadczeniem 
(-*  Elektrodynamika,  Oddziaływania  elektromagne- 
tyczne). 

Operator  Sn  po  wyrażeniu  przez  operatory  pola 
staje  się  kombinacją  operatorów  kreacji  i anihilacji, 
a po  przeprowadzeniu  uporządkowania  normalnego 
staje  się  sumą  normalnie  uporządkowanych  składni- 
ków. Otrzymujemy  sumę,  bo  na  mocy  związków  prze- 
mienności  (31)  każde  przestawienie  operatorów  pola 
powoduje  konieczność  dodania  pewnej  funkcji,  np. 
dla  pola  bispinorowego : , 

V (*i)  W (*2)  = V ( *2)  V>  0*i) + S (*1  - x2) , 

s 

gdzie  S fo—  *2)  jest  pewną  dobrze  określoną  funkcją. 

Tak  więc  wyrażenie,  w którym  było  n operatorów  po- 
la, przechodzi  po  jednokrotnym  przestawieniu  dwóch 
odpowiednich  operatorów  na  sumę  dwóch  wyrażeń  — 
jednego  z n operatorami  pola  i drugiego  z n—  2 ope- 
ratorami. Wykonując  wszystkie  wymagane  przez 
operację  : : przestawienia  otrzymujemy  Śn  w postaci 
złożonej  sumy.  Każdy  wyraz  tej  sumy  jest  graficznie 
przedstawiony  przez  diagram  zw.  diagramem  Feyn- 
mana.  Ograniczymy  się  tylko  do  omówienia  diagra- 


diagramy  mów  Feynmana  dla  amplitud  A/i  (33)  w reprezentacji 


Feyrnnana 


XLL\J  TT  A 1 J ~ ^ “ 

pędowej.  Diagramy  te  są  reprezentacją  rysunkową 
składników  sumy,  którą  staje  się  A /i  po  uporządkowa- 
niu normalnym  każdego  Sn.  Diagramy  składają  się 
z wierzchołków,  linii  wewnętrznych  i linii  zewnętrz- 
nych. Rodzaj  wierzchołków  zależy  od  gęstości  lagran- 
gianu  oddziaływania  £i.  Jeśli  Jdi  jest  sumą  n gęstości 
= 1,  takich,  że  h\  jest  iloczynem  normal- 
nym pi  operatorów  pola,  to  w diagramach  występuje  n 
typów  wierzchołków  takich,  że  z wierzchołka  /-tego 
typu  wychodzi  pi  linii.  Każdej  linii  i każdemu  wierz- 
chołkowi odpowiada  w sposób  wzajemnie  jedno- 
znaczny wyrażenie  analityczne.  Rysunki  8 i 9 przed- 
stawiają przykładowo  kilka  diagramów  dla  amplitudy 
opisującej  elastyczne  rozpraszanie  dwóch  elektronów. 
Jako  stan  początkowy  przyjmujemy  dwa  elektrony 
o czteropędach  px  i /?2,  a jako  stan  końcowy  te 
same  elektrony  o czteropędach  p3  i p4  takich,  że 
P1+P2  = Pa+Pi-  Przypominamy, że  A/i  jest  amplitudą 
prawdopodobieństwa  zajścia  wyżej  omawianego 
procesu.  Wkłady  do  amplitudy  A/i  dają  wszystkie 
operatory  Sn.  Wkłady  pochodzące  od  Sn  nazywamy 
H-tego  rzędu  względem  stałej  sprzężenia.  Na  rys.  8 
przedstawione  są  wszystkie  wkłady  do  omawianego 
procesu  drugiego  rzędu,  a na  rys.  9 — kilka  wkładów 
czwartego  rzędu  względem  stałej  sprzężenia  e.  Dia- 
gramy c),  d)  i e)  z rys.  9 nazywa  się  poprawkami  pro- 
mienistymi do  diagramu  a)  z rys.  8.  Całkowanie  po 
czteropędzie  c,  konieczne  przy  obliczaniu  wyrażeń 
odpowiadających  tym  diagramom,  prowadzi  do  war- 
tości nieskończonych.  Procedura,  która  pozwala  z tych 


Rys.  8.  Diagramy  Feynmana  2.  rzędu  względem  stałej  sprzę- 
żenia c dla  procesu  px-tp.  — >P*+Py  Różnym  rodzajom  linii 
przyporządkowane  są  odpowiednie  wyrażenia  analityczne. 
Zewnętrznym  liniom  elektronowym  (czarne  ze  strzałkami)  o I- 
powiadają  funkcje  zależne  od  czteropędów  pt\  wewnętrznej  unii 
fotonowej  zw.  propagatorem  (wężyk  niebieski)  jest  przyporząd- 
kowane wyrażenie  analityczne  zależne  od  czteropędu  tak  do- 
branego, aby  w każdym  wierzchołku  czteropęd  był  zachowany. 
Tak  więc  dla  rysunku  (a)  k — ps—Pi,  a dla  rysunku  (b)  k — 
Wyrażenie  przypisane  wierzchołkowi  zawiera  czynnik  e (ładunek 
elektronu).  Po  wykonaniu  wszystkich  obliczeń  obu  diagramom 
odpowiadają  wyrażenia  postaci  a/(pi,  ...Pt),  gdzie  a = e2/4ittortC  ~ 
* 7m-  Odwrócenie  strzałki  czasu  pozwala  interpretować  oba 
grafy  jako  wkłady  do  amplitudy  elastycznego  rozpraszania  po- 
zytonów 


Rys.  9.  Kilka  diagramów  4.  rzędu  względem  stałej  sprzężenia 
e (drugiego  rzędu  względem  stałej  sprzężenia  a).  Na  diagramach 
tych  pojawia  się  nowy  element  - — wewnętrzna  linia  elektronowa, 
propagator  elektronu  (czarna  linia  prosta  ze  strzałką).  Po  czte- 
ropędach związanych  z liniami  wewnętrznymi  zawsze  musi  być 
wykonane  całkowanie  z uwzględnieniem  ograniczeń  wynikają- 
cych z zachowania  czteropędu  w wierzchołkach.  Ograniczenia  te 
umożliwiają  w grafach  a)  i b)  wykonanie  całek  po  wszystkich 
czteropędach  kj,m,  n,  zaś  w grafach  c),  d)  i e)  pozostaje  jedna 
całka  do  wykonania,  np.  po  czteropędzie  / (bez  żadnych  ograni- 
czeń na  wartości  /).  Całki  te  są  rozbieżne.  W diagramie  e)  wy- 
stępuje również  wewnętrzna  linia  pozytonowa  — jest  to  linia,  na 
której  strzałka  ma  przeciwny  kierunek  niż  kierunek  biegu  czasu 


nieskończoności  wydobyć  w sposób  jednoznaczny 
wartości  skończone,  nazywa  się  renormalizacją. 

Renormalizację  przeprowadza  się  poczynając  od  renormali- 
modyfikacji  rozbieżnych  całek  przez  wprowadzenie  xac*a 
odpowiednich  parametrów,  tak  aby  całki  te  były  zbież- 
ne, a rozbieżności  można  było  otrzymać  przez  odpo- 
wiednie przejście  graniczne  z wprowadzonymi  para- 
metrami—jest  to  tzw.  regularyzacja.  Ostatnio  naj- 
częściej używa  się  regularyzacji  wymiarowej,  która 
polega  na  potraktowaniu  czteropędu,  po  którym  wy- 
stępuje całkowanie  w rozbieżnej  całce,  jako  wektora  n- 
wymiarowego,  n > 4 (dla  n — 4 otrzymuje  się  roz- 
bieżność). Ze  zregularyzowanej  całki  staramy  się  wy- 
dobyć część,  która  w granicy,  gdy  n ->  4,  pozostaje 
skończona.  W elektrodynamice  w jednoznacznym 
wydobyciu  tej  części  pomaga  żądanie,  aby  teoria  była 
niezmiennicza  ze  względu  na  transformacje  cechowa- 
nia pól.  Aby  usunąć  część  osobliwą  przy  przejściu 
n ->  4 dodajemy  do  wyjściowej  gęstości  lagrangianu 
odpowiedni  wyraz  J2c , zw.  kontrezłonem,  tak  aby  ge- 
nerował on  diagram,  którego  osobliwa  część  znosiłaby 
się  z osobliwą  częścią  diagramu  znormalizowanego. 

Procedurę  tę  można  przeprowadzić  przy  dowolnej 
gęstości  £i.  W celu  usuwania  coraz  to  nowych  osobli- 
wości pojawiających  się  w wyższych  rzędach  rachunku 
zaburzeń  trzeba  w ogólności  wprowadzać  nieskończe- 
nie wiele  kontrezłonów.  Wprowadzenie  każdego  kontr- 
członu  prowadzi  do  pojawienia  się  w teorii  stałej  do- 
wolnej. Jeśli  wystarczy  wprowadzić  skończoną  liczbę 
typów  kontrezłonów,  teorię  nazywamy  renormalizo- 
walną. 

W elektrodynamice  wyrażenia  operatorowe  w 
kontrczłonach  są  tego  samego  typu,  co  w wyjściowej 
gęstości  lagrangianu  j Go+J2i.  W rezultacie  dodanie 
kontrezłonów  zmienia  parametry  stojące  w wyjścio- 
wej teorii  przy  wyrażeniach  operatorowych,  np.  za- 
miast masy  m stojącej  w elektrodynamice  przy  wiel- 
kości yy  we  wzorze  (12)  pojawisię  rri  = m — 

Stałe  <5i(/?i)  > 0 dążą  do  nieskończoności,  gdy  n -*  4. 

Widzimy,  że  wyjściowy  parametr  m zw.  gołą  masą 
musi  być  nieskończony,  aby  tri  zw.  masą  zrenorma- 
lizowaną  mógł  być  skończony.  Ponieważ  masę  elek- 
tronu znamy  z doświadczenia,  przyjmujemy,  że  rri 
to  ta  dobrze  znana  masa.  Podobnie  dzieje  się  z ładun- 
kiem. Teorię  renormalizowalną  można  tak  wprowa- 
dzić, aby  renormalizacja  sprowadzała  się  tylko  do 
zmiany  mas  i stałych  sprzężenia.  Warunek  renormali- 
zowalności  narzucony  na  kwantową  teorię  pola  jest 
bardzo  ograniczający.  Wyróżnia  on  kilka  typów  te- 
orii wśród  nieskończonej  liczby  teorii  pola,  jakie  by 
można  sformułować.  Nieprzypadkowo  okazuje  się,  że 
teorie  renormalizowalne  odgrywają  dużą  rolę  w fizyce. 

Nie  będziemy  omawiać  sukcesów  elektrodynamiki 
kwantowej,  gdyż  są  one  omówione  w innych  artyku- 
łach. Przejdziemy  teraz  do  porównania  otrzymanego 
formalizmu  obliczania  amplitud  A/i  z obrazem  fizycz- 
nym oddziaływania  elektronów  z fotonami. 

W klasycznym  polowym  obrazie  oddziaływania 
elektronów  oddziałują  one  za  pośrednictwem  pola, 
tak  więc  nie  widać  powodów,  dla  których  całkowita 
energia  elektronów  miałaby  być  zachowana.  Podsta- 
wowym procesem  jest  proces,  w którym  energia  ta 
maleje,  ponieważ  w wyniku  oddziaływania  jest  ona 
przekazywana  polu,  inaczej  mówiąc  — wypromicnio- 
wana.  To  właśnie  jest  przyczyną,  że  klasyczny  atom 
wodoru  nie  może  być  trwały.  Z drugiej  strony  wiemy, 
że  obserwuje  się  elastyczne  rozpraszanie  elektronów 
i innych  ładunków.  Elastyczne  rozpraszanie  elektro- 
nów jest  możliwe  wtedy  i tylko  wtedy,  gdy  całkowita 
energia  i pęd  przekazane  polu  przez  jeden  elektron 
są  pobrane  z pola  przez  drugi  elektron.  Wiedząc  już, 
że  przekazy  energii  i pędu  są  skwantowane,  można 
powiedzieć,  że  elektron  zmienia  pęd  i energię  emitu- 
jąc odpowiedni  kwant  pola,  czyli  foton,  który  zostaje 
pochłonięty  przez  drugi  elektron.  Foton  ten  jest  prze- 
ważnie fotonem  wirtualnym,  tzn.  jego  czteropęd  k»  nie 
spełnia  warunku  kjk*  = 0,  który  to  warunek  określa 


poglądowy 
obraz  od- 
działywania 
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fotony  swobodnej  fali  elektromagnetycznej.  W istocie 
k*  = (jPfY—(piY9  gdzie  ( piY  i (pfY  określają  począt- 
kowy i końcowy  czteropęd  elektronu,  czyli 

kuk*  = (piMpiY+(j?f)u(pfY-(2pi)M<j>fY 

i zwykle  kuk * ^ 0.  Tak  więc  widzimy,  że  podstawo- 
wymi aktami  oddziaływania  są  emisje  i absorpcje 
fotonów.  Elektron  może  również  absorbować  fotony, 
które  wcześniej  sam  wyemitował.  Elastyczne  rozpra- 
szanie elektronów:  p1+pt  p^-r-p^  może  wystąpić 
w wyniku  wielu  z tych  procesów.  Każdemu  z nich 
przyporządkowana  jest  amplituda  prawdopodobień- 
stwa. Jeśli  dany  stan  końcowy  / może  być  osiągnięty 
ze  stanu  początkowego  i w wyniku  różnych,  nieroz- 
różnialnych  w eksperymencie  procesów  fizycznych, 
to  amplitudę  prawdopodobieństwa  Afi  należy  przed- 
stawić jako  sumę  amplitud  (21)  odpowiadających 
każdemu  z tych  procesów.  Widzimy,  że  otrzymana 
w elektrodynamice  kwantowej  amplituda  reakcji 
w postaci  sumy  ma  żądaną  strukturę.  Diagramy  odpo- 
wiadające wyrazom  sumy  umożliwiają  stworzenie 
prostego  obrazu  fizycznego,  który  nazwiemy  procesem 
wirtualnym.  Musimy  tu  podkreślić  z całą  mocą,  że 
proces  wirtualny  nie  daje  żadnej  informacji  dlaczego 
i w jaki  sposób  należy  obliczać  odpowiadającą  mu 
amplitudę.  Informacja  ta  zawarta  jest  tylko  w forma- 
lizmie matematycznym.  Proces  wirtualny  nie  jest 
realnym  procesem,  gdyż  przy  założeniu,  że  każdy 
obserwowany  przypadek  jest  konkretną  realizacją 
jednego  z tych  procesów,  całkowite  prawdopodobień- 
stwo reakcji  powinno  być  sumą  prawdopodobieństw, 
z których  każde  byłoby  prawdopodobieństwem  otrzy- 
mania stanu  końcowego  w wyniku  odpowiedniego 
procesu  wirtualnego.  Dodawanie  prawdopodobieństw 
prowadzi  często  do  innych  wyników  niż  dodawanie 
amplitud  prawdopodobieństwa.  Tak  więc  zwrotu: 
elektrony  oddziałują  ze  sobą  wymieniając  fotony  — 
nie  należy  rozumieć  dosłownie. 

Obraz  fizyczny  okazuje  się  jednak  pomocny  nie 
tylko  wówczas,  gdy  mówimy  o zjawiskach  fizycznych, 
lecz  również  przy  formułowaniu  nowych  ściślejszych 
modeli.  Po  tym,  jak  stwierdzono  istnienie  krótkoza- 
sięgowego  (rzędu  10“ 13  cm)  oddziaływania  wiążącego 
silnie  protony  i neutrony  w jądrze  atomowym, 
H.  Yukawa  zaproponował  opisywanie  tego  oddziały- 
wania przez  wymianę  hipotetycznych  kwantów  pola, 
które  nazwano  mezonami. 

oszacowanie  Proste  rozumowanie,  prowadzące  do  oszacowania 
masy  mezonu  maSy  mezonu,  jest  na  tyle  ciekawe,  że  warto  je  tu 
przytoczyć.  Wyobraźmy  sobie  spoczywające  dwa  nu- 
kleony w odległości  od  siebie  R rzędu  10" 12  cm  (z  do- 
przybliżeniem  nukleony  w jądrze  spoczywają). 
Jeśli  ich  oddziaływanie  polega  na  wymianie  mezonu, 
to  w stanie  pośrednim  powinny  istnieć  dwa  nukleony 
i dodatkowo  jeszcze  mezon.  Proces  tworzenia  tego 
stanu  nie  jest  możliwy  w fizyce  klasycznej,  naruszone 
byłoby  bowiem  prawo  zachowania  energii.  Energia 
musi  się  zmienić  o wielkość  A E,  która  co  najmniej  jest 
równa  energii  spoczynkowej  mezonu  mc2  (AE  ^ mc2). 
Natomiast  w mechanice  kwantowej  udowadnia  się,  że 
dokładność  określenia  energii  AE  w czasie  At  jest 
ograniczona  od  dołu  AE  ^ hjAt.  Ponieważ  prędkość 
wirtualnego  mezonu  jest  rzędu  prędkości  światła  c,  to 
At  ~ R/c.  Stąd  mc2  x ftc/R,  co  daje  masę  m równą 
ok.  250  masom  elektronu.  Ponieważ  możliwe  są  pro- 
cesy p+n  -*  n+p,  n+p  -* p+n  i p+p  -►  me- 
zony muszą  być  trzech  rodzajów  i nieść  ładunek  0, 
-j-e  i —e.  Dopiero  w 12  lat  po  tym,  jak  Yukawa  wy- 
sunął swoją  hipotezę,  odkryto  cząstki  o zbliżonych 
własnościach  — mezony  n;  masa  ich  wynosi  273  masy 
elektronu. 

Ścisły  opis  połowy  oddziaływań  silnych  napotkał 
poważne  trudności.  Oddziaływania  te  są  na  tyle  silne, 
że  zrenormalizowana  stała  sprzężenia  występująca 
w gęstości  lagrangianu  oddziały waria  Yukawy  £j 
łopoty  wynosi  ok.  10,  czyli  nie  jest  mała.  Stosowanie  rachunku 
z modelem  zaburzeń  wydaje  się  kompletnie  nieuzasadnione,  a w 
Yukawy  dodatku  praktycznie  nieprzydatne.  Poza  tym  liczba 
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zaobserwowanych  cząstek  elementarnych,  a szczegól- 
nie hadronów  jest  tak  wielka,  że  opis,  w którym 
każdej  z tych  cząstek  odpowiadałoby  swoiste  pole 
kwantowe,  a w £ / występowałyby  wszystkie  możliwe 
sprzężenia  typu  Yukawy  tych  pól,  wydaje  się  nie- 
właściwy. Nie  wiadomo  też,  co  zrobić  z bardzo  dużą 
liczbą  cząstek  zw.  rezonansami.  Te  trudności  spowo- 
dowały sceptycyzm  i odejście  od  metod  teorii  pola 
w teorii  oddziaływań  silnych  w latach  50-ych  i 60-ych 
(-*  Oddziaływania  silne).  Mimo  to  obraz  Yukawy, 
według  którego  nukleon  otoczony  jest  chmurą  wir- 
tualnych mezonów,  został  przyjęty  przez  ogół  fizyków 
i do  dziś  większość  danych  na  temat  rozpraszania 
mezonów  n na  sobie  otrzymuje  się  interpretując  pewne 
oddziaływania  mezonów  n z nukleonami  jako  oddzia- 
ływania tych  mezonów  z mezonami  chmury  wir- 
tualnej. 

Bardzo  płodną  okazała  się  koncepcja  M.  Gell-Man- 
na,  zgodnie  z którą  wszystkie  cząstki  elementarne  od- 
działujące silnie  są  zbudowane  z 3 podstawowych 
cząstek  o ładunkach  ułamkowych  i spinach  połówko- 
wych, zw.  kwarkami.  Obecnie  najczęściej  przyjmuje 
się,  że  obiektów  tych  jest  18  (-*  Cząstki  elementarne 
i ich  oddziaływania).  Kwarki  różnią  się  kolorami  (trzy 
kolory)  i zapachami  (których  jest  co  najmniej  cztery, 
a ostatnio  są  dane,  aby  sądzić,  że  jest  ich  sześć). 

Zadziwiające  jest  to,  że  w wielu  procesach  hadrony  uwięzienie  j 
zachowują  się  tak,  jakby  były  złożone  ze  swobodnych  kwarków 
i lekkich  kwarków,  natomiast  mimo  usilnych  poszuki- 
wań swobodnych  kwarków,  nie  udało  się  ich  odkryć. 

Zjawisko  to  nazywa  się  uwięzieniem  kwarków.  Istnieje 
prosty  model  klasyczny  mezonu  — punkty  materialne 
połączone  elastyczną  struną  o długości  spoczynkowej 
/0.  Kiedy  struna  nie  jest  napięta,  punkty  zachowują  się 
tak,  jak  swobodne.  Przy  próbie  oddalenia  punktów  od 
siebie  na  odległość  większą  od  /0  struna  wytwarza  siłę 
o potencjale  wprost  proporcjonalnym  do  kwadratu 
jej  wydłużenia,  a przy  stałym  napięciu  — o potencjale 
wprost  proporcjonalnym  do  jej  wydłużenia.  Jeśli  za- 
łożymy, że  odpowiednio  napięta  struna  może  pęknąć, 
przy  tym  na  nowych  końcach  pojawią  się  natychmiast 
odpowiednie  punkty  materialne,  to  obraz  ten  będzie 
bliski  „obrazowi  polowemu”  mezonu.  W obrazie  tym 
rolę  punktów  odgrywają  kolorowe  kwarki  i anty- 
kwarki,  a oddziaływanie  typu  struny  jest  generowane 
w niecałkiem  jeszcze  zrozumiany  sposób  przez  wy- 
miany kolorowych  bezmasowych  wektorowych  glu- 
onów,  będących  kwantami  pól  cechowania  typu 
Yanga-Millsa,  związanymi  z grupą  cechowania 
SUO).  Nie  musimy  już  powtarzać,  że  poglądowe 
obrazy  są  dość  złudne.  Poza  tym  prawidłowość  tego 
przedstawienia  nie  została  wykazana  za  pomocą  żad- 
nego ścisłego  matematycznego  modelu.  Istnieje  jednak 
nadzieja,  że  zjawisko  uwięzienia  kwarków  będzie  w 
ten  sposób  wyjaśnione.  Nadzieja  ta  jest  oparta  na 
obserwacji,  że  efektywny  parametr  występujący  w 
perturbacyjnym  rozwinięciu  zależy  od  energii.  W re- 
normalizowalnych  teoriach  Yanga-Millsa  parametr 
ten  dąży  do  zera,  jeśli  energia  dąży  do  nieskończo- 
ności, natomiast  rośnie,  gdy  energia  maleje.  Procesy 
wysokoenergetyczne  wydają  się  być  związane  z od- 
działywaniem na  bardzo  małych  odległościach.  Proce-  niewola 
sy  niskoenergetyczne  zaś  — z dużymi  odległościami,  podczerwona 
Obszar  niskich  energii  nazywa  się  często  obszarem 
podczerwonym  (przez  analogie  z optyką  i z uwagi  na 
związek  między  energią  i częstością  E = hv).  Wzrost 
parametru  rozwinięcia  interpretuje  się  jako  wzrost  siły 
oddziaływań,  tak  więc  wydaje  się,  że  efekt  ten  wiąże 
się  z uwięzieniem  kwarków  i został  nazwany  przez 
fizyka  amerykańskiego  S.  Glashowa  niewolą  pod- 
czerwoną (ang.  infrared  s1avery).  Droga  od  tych  przy- 
puszczeń do  ścisłego  udowodnienia,  że  kwarki  muszą 
być  uwięzione  na  dużych,  a swobodne  — na  małych 
odległościach,  wydaje  się  jeszcze  daleka.  Pojawia  się 
przy  tym  jeszcze  jedna  poważna  trudność  techniczna. 

Istnieją  w teorii  pola  efektywne  algorytmy  obliczania  problem 
amplitud  rozpraszania  procesów,  w których  zmienia  ze  stanami 
się  liczba  swobodnych  kwantów  pola,  oraz  oblicza-  związanymi 
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nia  czasów  życia  cząstek  nietrwałych.  Nie  ma  nato- 
miast, jak  dotąd,  algorytmów  obliczeń  dotyczących 
procesów  rozpraszania  stanów  związanych,  a w mo- 
delu kwarkowym  wszystkie  hadrony  są  uważane  za 
takie  stany. 

Nowy  zwrot  w kierunku  metod  polowych  w teorii 
oddziaływań  silnych  jest  wynikiem  znalezienia  renor- 
malizowalnej  teorii  oddziaływań  słabych.  Teoria  ta 
omawiana  jest  w artykule  „Oddziaływania  słabe”,  tu 
podkreślimy  kilka  jej  aspektów.  Jak  już  wspominaliś- 
my, pole  elektromagnetyczne  ma  interpretację  pola 
cechowania  stowarzyszonego  z grupą  cechowania  ł/(l). 
Niezmienniczość  ze  względu  na  tę  grupę  jest  cechą 
bardzo  istotną  w przeprowadzaniu  renormalizacji. 
Poszukując  renormalizowalnej  teorii  oddziaływań 
słabych  natrafiono  na  renormalizowalną  teorię  pól 
cechowania  Yanga-Millsa,  opartą  na  grupie  cecho- 
wania SU( 2).  Występują  w niej  trzy  bezmasowe  wek- 
torowe pola  cechowania  (dwa  naładowane,  jedno 
neutralne).  Można  sobie  łatwo  wyobrazić,  że  oddzia- 
ływania słabe  polegają  na  wymianie  cząstek  wektoro- 
wych naładowanych.  Okazuje  się  jednak,  że  odpowied- 
nie cząstki  powinny  mieć  masę  i to  masę  większą  od 
masy  protonu  ok.  30  razy.  Wprowadzenie  członu  ma- 
sowego do  teorii  Yanga-Millsa  łamie  symetrię  ce- 
chowania i psuje  renormalizowalność  teorii.  Po  wielu 
trudach  okazało  się,  że  jeśli  się  wprowadzi  do  teorii 
dodatkowe  pole  skalarne  (pole  Higgsa)  i założy,  że 
stan  próżni  nie  jest  niezmienniczy  ze  względu  na  grupę 
cechowania,  to  pola  cechowania  mogą  zyskać  masę 
i teoria  pozostanie  renormalizowalna.  Mechanizm 
wprowadzania  w ten  sposób  masy  nazywa  się  mecha- 
nizmem Higgsa. 

Wyniki  te  leżą  u podstaw  teorii  Weinberga-Salama, 
w której  zakłada  się  istnienie  trzech  nowych  wektoro- 
wych cząstek:  W+  i W~  o masach  większych  od  39,8 
mas  protonu  oraz  Z°  o masie  większej  od  79,6  mas 
protonu.  Wprowadzenie  cząstki  Z°  implikuje  istnienie 
nowych  reakcji,  np.  rozpraszania  elektronów  przez 
neutrina  mionowe.  Reakcje  te  zostały  zaobserwowane, 
co  było  pierwszym  wielkim  sukcesem  modelu.  Pełnym 
sukcesem  teorii  byłoby  odkrycie  cząstek  W±  i Z°.  Na 
rys.  10  przedstawione  są  diagramy  Feynmana,  dające 
po  renormalizacji  wkład  najniższego  rzędu  do  pro- 
cesu n+ve  -y  n+ve  w teorii  Weinberga-Salama.  Po- 
zwala to  zorientować  się,  o ile  teoria  ta  jest  bardziej 
złożona  od  elektrodynamiki  kwantowej. 


Rys.  10.  Diagramy,  które  muszą  być  uwzględnione,  aby  po  re- 
normalizacji otrzymać  skończony  wkład  najniższego  rzędu  do 
amplitudy  rozpraszania  elastycznego  neutrina  elektronowego  na 
neutronie.  W odróżnieniu  od  rys.  8 i 9 zaznaczony  jest  tylko  rodzaj 
wymienianych  cząstek 


Łamanie  symetrii  cechowania  przez  stan  próżni 
(zw.  spontanicznym  łamaniem  symetrii)  wskazuje  na 
to,  że  próżnia  — stan  pola  o najniższej  energii  — ma 
ciekawe  własności  fizyczne.  Nie  powinien  nas  wpro- 


wadzać w błąd  fakt,  że  energia  i pęd  tego  stanu  wy- 
noszą 0.  Po  prostu  wprowadzając  w definicji  opera- 
torów energii  i pędu  uporządkowanie  normalne 
przyjęliśmy  energię  próżni  za  punkt  zerowy  na  skali 
wartości  energii. 

Możliwość  zmiany  masy  cząstki  dzięki  wprowadze- 
niu odpowiednich  własności  próżni  skłania  do  przy- 
jęcia obrazu  próżni  jako  pewnego  skomplikowanego 
ośrodka.  Wiadomo,  że  pole  elektromagnetyczne  może 
wnikać  do  nadprzewodnika  tylko  bardzo  płytko.  In- 
terpretuje się  to  często  jako  zjawisko  zyskiwania 
masy  przez  fotony  w ośrodku  nadprzewodzącym, 
a stąd  już  krok  do  analogii  z mechanizmem  Higgsa. 
Z kolei  to,  że  wirtualny  foton  emitowany  przez  ładu- 
nek może  wytworzyć  wirtualną  parę  elektron-pozyton 
(co  efektywnie  prowadzi  do  renormalizacji  wyjścio- 
wego ładunku),  przypomina  zjawisko  polaryzacji  di- 
elektryka; nazywa  się  je  dlatego  polaryzacją  próżni. 
Tak  więc  stan  próżni  jest  skomplikowanym  stanem 
pola,  którego  zrozumienie  jest  pomocne  przy  formu- 
łowaniu nowych  ścisłych  modeli. 


0 optymizmie,  wątpliwościach 

1 głównych  kierunkach  badań 


Optymiści  sądzą,  że  kwantowa  teoria  pola  łącznie 
z procedurą  renormalizacji  jest  tym  ogólnym  schema- 
tem, w ramach  którego  zostanie  znaleziony  jednolity 
opis  zjawisk  we  Wszechświecie. 

Tak  więc  cele,  które  sobie  stawiają,  to : znalezienie 
podstawowych  pól  i odpowiadających  im  gęstości 
iagrangianu,  rozwiązanie  problemu  stanów  związa- 
nych i uwięzienia  kwarków  oraz  stworzenie  efektyw- 
nych algorytmów  obliczania  wszystkich  fizycznie  inte- 
resujących wielkości.  Niektórzy  natomiast  sądzą,  że 
podstawowym  pojęciem  przyszłej  teorii  będą  pola  ce- 
chowania Yanga-Millsa.  Teoria  tych  pól  jest  skom- 
plikowana, dlatego  bada  się  często  modelowe  teorie 
pól  w czasoprzestrzeni  o zmniejszonej  liczbie  wymia- 
rów lub  na  nieskończonych  dyskretnych  sieciach 
czasoprzestrzennych.  Badania  te  stanowią  obecnie 
główny  nurt  w teorii  pola.  Wynika  z nich  m.in.  ko- 
nieczność modyfikacji  ogólnej  teorii  względności  dla 
małych  odległości,  ponieważ  obecna  teoria  pola  gra- 
witacyjnego po  skwantowaniu  daje  teorię  nierenor- 
malizowalną. 

Drugą  grupę  badań,  którą  charakteryzuje  wysoka 
ścisłość  i zaawansowanie  metod  matematycznych,  sta- 
nowią prace  nad  aksjomatyczną  teorią  pola.  Celem 
ich  jest  takie  sformułowanie  elektrodynamiki  i in- 
nych znanych  teorii  pola,  aby  od  początku  nie  wystę- 
powały w nich  żadne  rozbieżności.  Poszukuje  się  wy- 
ników, które  można  uzyskać  w sposób  ścisły,  a w wy- 
padku stosowania  rachunku  zaburzeń  bada  się  zbież- 
ność szeregu  perturbacyjnego.  Ten  kierunek  badań 
rozwinął  się  w wyniku  niezadowolenia  ze  zwykłej  pro- 
cedury renormalizacji,  która  bardziej  przypomina 
przepis  rachunkowy  niż  element  podstawowej  teorii 
(podkreślał  to  wielokrotnie  P.A.M.  Dirac,  jeden 
z twórców  kwantowej  teorii  pola).  Można  zaliczyć 
do  tej  grupy  pojawiające  się  ostatnio  prace  poświęco- 
ne kwantowej  teorii  solitonów.  Ponieważ  solitony  cie- 
szą się  dużym  zainteresowaniem,  zamieścimy  o nich 
krótką  dygresję. 

Zacznijmy  od  historii.  Pierwszy  soliton  został 
zaobserwowany  w 1834  r.  przez  J.  Russela.  Przejeż- 
dżając konno  wzdłuż  wąskiego  kanału  zauważył  on, 
że  gwałtowne  zatrzymanie  się  barki  spowodowało 
powstanie  fali  o wysokości  ok.  30  cm  i długości  ok. 
9 m,  która  bez  zmiany  kształtu  przesuwała  się  z jed- 
nakową prędkością  kilkunastu  kilometrów  na  godzinę 
wzdłuż  kanału.  Russel  towarzyszył  tej  fali  na  koniu 
na  odcinku  ok.  2 km.  Liczne  doświadczenia  potwier- 
dziły tę  obserwację.  Stwierdzono,  że  im  wyższa  fala, 
tym  szybciej  się  porusza.  Zjawisko  to,  zw.  falą  samot- 
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ną,  zostało  analitycznie  wyjaśnione  przez  otrzymanie 
w 1895  r.  rozwiązania  (o  żądanych  własnościach) 
nieliniowego  równania  różniczkowego  cząstkowego: 

du(x,t)  e3u(x,t) 

dt  dx*  ~ ’ 

które  nazwano  od  nazwisk  twórców  równaniem  Korte- 
wega-de  Vriesa  (K-d  V).  W roku  1 965  M.  Kruskal  i N. 
Zabusky  wykazali,  że  dwa  rozwiązania  równania 
K-dV  odpowiadające  dwóm  samotnym  falom  skiero- 
wanym ku  sobie,  przechodzą  przez  siebie  bez  defor- 
macji, zachowując  stabilność  (rys.  11).  Fale  samotne 

0 tej  właściwości  nazwano  solitonami,  a rozwiąza- 
nie równania  nieliniowego,  rozpadające  się  dla  t -> 
-+ — °°  i t ->  -foo  na  N rozwiązań  solitonowych  — roz- 
wiązaniem AT-solitonowym.  Znaleziono  również  inne 
równania  dopuszczające  rozwiązania  solitonowe. 
Bardzo  ważne  z nich  jest  skalarne  równanie  falowe 
w czasoprzestrzeni  (1 +1)- wymiarowej  (1  zmienna 
przestrzenna  i czas)  z członem  nieliniowym  sin  <P 
zw.  równaniem  sG  (sinusowym  Gordona).  Równanie 
to  opisuje  ruch  defektów  w ośrodkach  uporządkowa- 
nych, takich  jak  np.  ruch  zlokalizowanych  dyslokacji 
w kryształach.  Równanie  K-dV  spotyka  się  np.  przy 
opisie  płytkich  fal  wodnych,  jonowych  fal  akustycz- 
nych, fal  Alfvena  w zimnej  plazmie  itp.  Równanie  sG 
można  traktować  jako  nieliniowe  równanie  pola 
w 1 + 1 wymiarach,  podejmuje  się  więc  próby  kwan- 
towania tego  pola.  Odkrycie  i badanie  solitonów  to 
postęp  w teorii  nieliniowych  równań  cząstkowych 
oraz  postęp  w rozumieniu  różnych  nieliniowych  zja- 
wisk fizycznych.  Soliton  w 1+1  wymiarach  jest  pod 
wieloma  względami  podobny  do  cząstki  elementar- 
nej : gęstość  jego  energii  jest  zlokalizowana,  całkowita 
energia  jest  skończona,  zderza  się  zachowując  swą 
tożsamość,  istnieją  rozwiązania  równania  sG  odpo- 
wiadające stanom  związanym  soliton-antysoliton 
(ang.  breather  'dychacz')  itp.  Niektórzy  chcieliby  tę 
analogię  rozwinąć  i wierzą,  że  w 3 + 1 wymiarach 
zaobserwuje  się  w pewnej  klasie  równań  produkcję 
solitonów  przy  zderzeniach  lub  ich  rozpraszanie,  co 
uwożliwi  stworzenie  obrazu  cząstki  elementarnej  jako 
solitonu.  Program  ten  napotyka  na  razie  trudności 
zarówno  natury  matematycznej,  jak  i fizycznej. 

Trzecia  grupa  badań  to  próby  wyjścia  poza  lokalną 
teorię  pola.  Motywacja  tych  badań  może  być  różno- 
rodna. Już  na  gruncie  klasycznym  widzieliśmy,  że 
pomiar  pola  w punkcie  jest  idealizacją  (zbiory  obser- 
wowanych zdarzeń  są  zawsze  dyskretne,  a odrzucenie 
założenia  ciągłości  czasoprzestrzeni  i konstrukcja 
czasoprzestrzeni  dyskretnych  nie  daje,  jak  dotychczas, 
zadowalających  wyników).  Idealizacją  jest  również 
wprowadzenie  punktowych  ładunków.  Pole  punkto- 
wego ładunku  jest  osobliwe  w punkcie,  w którym 
ładunek  ten  się  znajduje:  klasyczna  energia  samood- 
działy wania  jest  nieskończona.  Osobliwość  ta  znaj- 
duje odbicie  w nieskończonościach  pojawiających  się 
w kwantowej  teorii  pola.  Wydaje  się,  że  najprostszym 
sposobem  zniknięcia  tych  nieskończoności  byłaby 
odpowiednia  modyfikacja  teorii  klasycznej  na  małych 
odległościach,  a następnie  skwantowanie  zmodyfiko- 
wanej teorii.  Elegancką  i niesprzeczną  modyfikacją 
elektrodynamiki  klasycznej  jest  nieliniowa  teoria 
Borna-Infelda,  jednak  trudności  pojawiają  się  przy 
jej  kwantowaniu,  podobnie  jak  przy  kwantowaniu 
każdej  teorii,  w której  nieliniowość  odgrywa  istotną 
rolę.  Wraz  z rezygnacją  z punktowości  pojawia  się 
możliwość  wystąpienia  tzw.  oddziaływań  nielokal- 
nych. Wiąże  się  to  z możliwością  równoczesnego  od- 
działywania z różnymi  punktami  obiektu  rozciągłego. 
Istnieją  metody  kwantowania  nielokalnych  teorii  pola 

1 próbowano  już  nawet  zastosować  takie  teorie  do 
opisu  hadronów. 

Założenie  punktowości  elektronów  w elektrody- 
namice, stosowanej  do  opisu  procesów  atomowych 
przy  odległościach  między  ładunkami  rzędu  10" 8 cm. 


wydaje  się  przybliżeniem  rozsądnym.  Natomiast  bo- 
gata struktura  hadronów  i bardzo  krótki,  ale  dobrze 
określony  zasięg  oddziaływań  silnych  rzędu  10" 13  cm 
uniemożliwiają  założenie  punktowości  hadronów. 
Dlatego  podejmuje  się  próby  k\/antowania  rozciąg- 
łych klasycznych  układów,  takich  jak  struny,  membra- 
ny i worki.  Przy  próbach  porównania  otrzymanych 
modeli  z doświadczeniem  pojawia  się  konieczność 
wprowadzenia  dodatkowych  upraszczających  zało- 
żeń, co  stawia  pod  znakiem  zapytania  większość 
otrzymywanych  tym  sposobem  wyników. 

Zwolennicy  lokalnej  teorii  pola  utrzymują,  że  obraz 
punktowej  cząstki  otoczonej  „chmurą”  wirtualnych 
punktowych  kwantów  oraz  obraz  stanu  związanego 
punktowych  kwarków,  jakie  ta  teoria  daje,  dobrze 
uwzględnia  strukturę  cząstek. 

Można  sobie  wyobrazić  bardziej  drastyczne  odejście 
od  założenia  punktowości  hadronów  przy  odległoś- 
ciach 10“ 13  cm  niż  to  ma  miejsce  w teoriach  nielokal- 
nych czy  też  w obrazie  chmury  wirtualnych  kwantów. 
Klasycznym  przykładem  drastycznego  załamania  za- 
łożenia punktowości  jest  przejście  od  opisu  ruchu  me- 
teorytu (z  dobrym  przybliżeniem  punktowego)  do 
opisu  jego  zderzenia  z powierzchnią  Ziemi.  Do  opisu 
procesu  tworzenia  się  potężnego  leja  (np.  słynny  krater 
w Arizonie)  trzeba  używać  metod  zupełnie  różnych 
matematycznie  i fizycznie  od  równań  Newtona  dla 
punktów  materialnych.  W przykładzie  tym  charakte- 
rystyczny jest  brak  ciągłego  przejścia  pomiędzy  tymi 
dwoma  opisami  fizycznymi.  Wątpliwość  co  do  stoso- 
walności teorii  kwantowej  do  opisu  zjawisk  fizycz- 
nych na  odległościach  10" 13  cm  wysunął  pierwszy 
W.C.  Heisenberg  już  w latach  30-ych.  Zaproponował 
on  wprowadzenie  nowej  uniwersalnej  stałej  fizycznej 
(o  wymiarze  długości)  — tzw.  długości  elementarnej  — 
takiej,  że  przy  odległościach  mniejszych  od  tej  stałej 
powinna  nastąpić  zmiana  sposobu  opisu  zjawisk. 
Wobec  wspomnianych  wątpliwości  i trudności  doty- 
czących po! owego  opisu  oddziaływań  silnych  zaczęto 
konstruować  modele  innego  rodzaju  (jak  np.  różne 
modele  statystyczne  i hydrodynamiczne  stosowane 
z dużym  niekiedy  powodzeniem  do  opisu  produkcji 
wielorodnej  przy  wysokoenergetycznych  zderzeniach 
hadronów). 

Tak  więc  pesymiści  nie  wierzący  w ostateczny  suk- 
ces badań  nurtu  głównego  mogą  konstruować  modele 
niezależne  i porównywać  je  z doświadczeniem,  mogą 
też  sprawdzać  prawdziwość  najbardziej  ogólnych 
twierdzeń  dowodzonych  na  gruncie  standardowego 
podejścia  do  lokalnej  kwantowej  teorii  pola  oraz  po- 
szukiwać nowych  subtelnych  efektów  doświadczal- 
nych, wynikających  z obrazu  inspirowanego  istnie- 
niem długości  elementarnej.  Badania  te  wiążą  się 
w pewien  sposób  ze  współczesnymi  badaniami  pod- 
staw mechaniki  kwantowej  w duchu  wątpliwości 
Einsteina,  Schródingera,  de  Broglie’a  i Bohma, 
którzy  kwestionowali  traktowanie  mechaniki  kwan- 
towej jako  najbardziej  kompletnej  teorii  pojedyn- 
czych mikroukładów  fizycznych  (->  O niektórych 
podstawowych  pojęciach  fizycznych). 

Cały  program  tych  pesymistycznych  badań  nie  cie- 
szy się  wielkim  uznaniem  i sympatią  optymistów,  choć 
na  tej  drodze  mogą  być  znalezione  dodatkowe  argu- 
menty zarówfio  teoretyczne  jak  i doświadczalne  prze- 
mawiające za  słusznością  czy  też  koniecznością  opisu 
wszystkich  zjawisk  w obrębie  konwencjonalnie  rozu- 
mianej teorii  kwantowej. 

I.  Bialynicki-Birula  Wstęp  do  teorii  pól  kwantowych.  War- 
szawa 1971;  I.  Bialynicki-Birula,  Z.  Bialynicka-Birula  Elek- 
trodynamika kwantowa,  Warszawa  1974;  W.B.  Bierestecki  i in. 
Relatywistyczna  teoria  kwantów  cż.  1 Warszawa,  1972;  L.N. 
Cooper  Istota  i struktura  fizyki.  Warszawa  1975;  R.P.  Feynman 
i in.  Feynmana  wykłady  z fizyki , t.  3 Warszawa  1974;  M.  Kup- 
czyński  Odkrycie  powabu , Post.  Fiz.  28,  275  (1977);  E.M.  Lifszyc 
i L.P.  Pitajewski  Relatywistyczna  teoria  kwantów  cz.  2,  Warsza- 
wa 1973;  L.I.  Schiff  Mechanika  kwantowa,  Warszawa  1977;  A. 
Szymacha  Zunifikowane  teorie  oddziaływań  słabych  i elektroma- 
gnetycznych Post.  Fiz.  27,  117  (1976);  E.H.  Wichmann  Fizyka 
kwantowa  Warszawa  1975. 
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Cząstki  elementarne  i ich  oddziaływania 

Grzegorz  Białkowski 


pojęcie  Cząstki  elementarne  są  to  obiekty  fizyczne,  z któ- 
cząstki  rych,  według  obecnego  stanu  wiedzy,  składają  się 
elementarnej  wszystkie  ciała  materialne  oraz  rozmaite  rodzaje  pro- 
mieniowania. Ujmując  rzecz  historycznie,  za  jedną 
z podstawowych  cech  cząstek  elementarnych  uważano 
ich  niepodzielność,  co  jest  wyrażone  w greckim  termi- 
nie atom  — atomos  — niepodzielny.  Niepodzielność 
cząstki  elementarnej  można  rozumieć  dwojako:  albo 
jako  nierozbijalność  (a  więc  trwałość),  albo  też  jako 
brak  struktury  wewnętrznej  (a  więc  niezłożoność). 
Oba  możliwe  kryteria  elementamości  cząstek,  oparte 
na  tych  dwu  cechach,  są  jednak  zawodne.  Wiadomo 
dziś,  że  obiekty  uważane  za  cząstki  elementarne  mają 
strukturę  wewnętrzną,  są  więc  tworami  złożonymi. 
Poza  tym,  w przyrodzie  istnieje  tylko  bardzo  nie- 
liczna grupa  cząstek  trwałych  (lub  też  mających  tak 
długie  czasy  życia,  że  obecnie  uważa  się  je  za  trwałe). 

Trwałymi  cząstkami  elementarnymi  są : proton,  ele- 
ktron, foton  oraz  neutrina  elektronowe  i mionowe. 

Trwałości  cząstki  nie  można  uważać  za  kryterium 
elementamości  z następujących  powodów.  Po  pierw- 
sze, liczne  obiekty,  których  nieelementarność  jest 
pewna  (np.  jądra  atomowe  lub  atomy  w stanie  pod- 
stawowym), są  trwałe.  Po  drugie,  trwałe  cząstki  ele- 
mentarne mają  zwykle  „kuzynów”  nietrwałych;  po- 
krewieństwo cząstek  trwałych  i nietrwałych  jest  tak 
wyraźne,  że  logicznie  jest  jedne  i drugie  uznać  za  ele- 
mentarne. Na  przykład  proton  i neutron  tworzą  parę 
cząstek  elementarnych,  mimo  iż  proton  jest  trwały, 
a neutron  — nie.  Po  trzecie  wreszcie,  zdarza  się  często, 
iż  w wyniku  niektórych  oddziaływań  cząstki  elemen- 
tarne trwałe  przemieniają  się  w inne  cząstki,  nietrwałe. 
W takich  wypadkach  trudno  jest  uznać,  że  cząstki 
trwałe  stają  się  składnikami  obiektów  nietrwałych. 
Przykładem  takiego  procesu  może  być  np.  anihilacja 
pary  proton-antyproton  v kilka  mezonów  7r,  czyli 
w cząstki  nietrwałe. 

W tej  sytuacji  nie  jest  łatwo  podać  proste  kryterium 
elementamości  cząstki,  odwołujące  się  wprost  do 
faktów  eksperymentalnych.  Nasuwa  się  więc  myśl, 
aby  za  elementarne  uznać  te  i tylko  te  cząstki,  których 
istnienie  jest  z punktu  widzenia  teorii  warunkiem  ko- 
niecznym występowania  wszystkich  innych  obiektów 
fizycznych.  Praktyczne  stosowanie  tego  kryterium 
byłoby  jednak  możliwe  tylko  wtedy,  gdyby  istniała 
pełna,  sprawna  rachunkowo  i przynosząca  jedno- 
znaczne odpowiedzi  teoria  cząstek.  Mimo,  że  opraco- 
waniem takiej  teorii  zajmuje  się  wielu  najwybitniej- 
szych fizyków  doby  dzisiejszej,  teoria  ta  jeszcze  nie 
została  sformułowana.  W najlepszym  razie  można 
uznać,  że  stworzono  pewne  teorie  cząstkowe,  które 


zapewne  wejdą  w skład  teorii  kompletnej.  Ostatecznie 
istnieje  możliwość  zdefiniowania  cząstek  elementar- 
nych przez  ich  wyliczenie.  Najlepiej  zbadane  cząstki 
są  wymienione  w załączonej  tabeli. 

Już  pierwszy  rzut  oka  na  tę  tabelę  pozwala  stwier- 
dzić, że  sytuacja  nie  jest  najlepsza,  gdyż  obiektów 
elementarnych  jest  bardzo  dużo,  a liczba  ich  przy  tym 
wzrasta  z roku  na  rok.  Ponieważ  zaś,  jak  stwierdzi- 
liśmy poprzednio,  żadna  ze  znanych  cząstek  nie  wy- 
daje się  być  bardziej  elementarna  od  innych,  pozostają 
jeszcze  dwie  inne  możliwości  poradzenia  sobie  z tym 
chaosem.  Po  pierwsze,  można  przyjąć,  że  rzeczywiście 
wszystkie  obiekty  uznawane  obecnie  za  cząstki  ele- 
mentarne są  naprawdę  równie  elementarne  w tym 
sensie,  że  każda  z nich  wymaga  do  swojego  istnienia 
wszystkich  innych  cząstek,  z których  jest  w jakiś  spo- 
sób zbudowana.  Ta  hipoteza  zwana  hipotezą  demo- 
kracji cząstek  nie  zyskała  sobie  powszechnego  uzna- 
nia, m.in.  w związku  z trudnościami  rachunkowymi 
występującymi  przy  próbach  jej  sprawdzenia.  Po 
drugie,  nasuwa  się  myśl,  że  może  żadna  z cząstek  zna- 
nych teraz  jako  elementarne,  naprawdę  elementarna 
nie  jest,  i że  taką  prawdziwie  elementarną  cząstkę  czy 
cząstki  należy  dopiero  wykryć.  Za  „kandydatów” 
na  takie  cząstki  prawdziwie  elementarne  uważa  się 
m.in.  kwarki. 

Hipoteza  kwarków  jest  obecnie  niemal  powszech- 
nie uważana  za  słuszną.  Powstaje  więc  pytanie,  czy 
same  kwarki  są  obiektami  elementarnymi,  i czy 
dalsze  badania  nie  doprowadzą  do  wniosku,  że  należy 
szukać  cząstek  jeszcze  bardziej  elementarnych.  W tym 
wypadku  to,  co  uważamy  za  elementarne  byłoby 
funkcją  niewiedzy;  elementarne  jest  to,  o czym  jeszcze 
nie  wiemy,  że  naprawdę  elementarne  nie  jest.  Do- 
świadczenie skłania  jednak  do  przypuszczenia,  że  po- 
gląd ten  może  nie  jest  słuszny.  Okazuje  się  mianowicie, 
że  kwarki  dotychczas  nie  zostały  wykryte  jako  cząstki 
swobodne  i znane  są  jedynie  jako  składniki  hadro- 
nów. Być  może  kwarki  swobodne  zostaną  w przyszłości 
wykryte,  ale  wielu  fizyków  sądzi,  że  nie  nastąpi  to 
nigdy,  gdyż  kwarki  — według  nich  — mogą  istnieć 
jedynie  wewnątrz  hadronu,  a więc  jako  cząstki  zwią- 
zane. Ta  hipoteza  kwarków  uwięzionych  rozstrzyga- 
łaby więc  problem  elementamości  w sposób  nieocze- 
kiwany: cząstki  elementarne  byłyby  wprawdzie  złożo- 
ne, ale  nie  mogłyby  być  nigdy  rozbite  na  swoje  skład- 
niki. Poznawanie  coraz  głębszych  poziomów  struktury 
materii  zostałoby  wtedy  w zasadniczy  sposób  zmodyfi- 
kowane. Można  by  nadal  poszukiwać  składników  czą- 
stek takich  jak  kwarki,  ale  sens  tego  pojęcia  w istotny 
sposób  różniłby  się  od  pojęcia  składnika  np.  atomu. 


hipoteza 

demokracji 

cząstek 


kwarki 


hipoteza 

uwięzionych 

kwarków 
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Tabela  cząstek  elementarnych 


Nazwa 

Symbol 

jr 

" 

" 

s,c 

Masa  MeV 

Czas  życia,  s 
lub  r,  MeV 

Główny  ka- 
nały rozpadu 

Względne 

prawdopodo- 

bieństwo 

FOTON 

y 

1- 

-1 

0,0 

0 

<6-  10“M 

trwały 

LEPTONY 

Neutrino 

Vt 



1/2 

1 

0 

trwale 

elektronowe 

<6-10“* 

trwale 

Neutrino 

1/2 

0 

mionowe 

<0,57 

trwałe 

Neutrino 

yt 

1/2 

<250 

taonowe 

Elektron 

e 

1/2 

0,511 

trwały 

100% 

Mion 

p 

1/2 

105,66 

2,197- 10-* 

Taon 

' 

112 

1784 

< 2,3- 10-1* 

HADRONY 

MEZONY 

, 

100% 

Pion 

*± 

o- 

1- 

0,0 

139,57 

2,603 -10-* 

eve 

1,27-10 -* 

Jt* 

o- 

1- 

+ 1 

0,0 

134,96 

8,3-  10~XT 

yy 

98,85% 

Kaon 

K 

o- 

1/2 

±1,0 

493,7 

1,24-10“* 

63,S% 

ifn*1 

21,2% 

7l±7l~1Z+ 

5,6% 

7t±TĆ>Te° 

1.7% 

P±7^Vlt 

3,2% 

4,8% 

K‘s 

0- 

1/2 

497,7 

8,92-10-“ 

7Z+7T- 

68,67% 

31,4% 

kI 

o- 

1/2 

497,7 

5,18- 10-* 

****** 

21,5% 

*+*-*• 

12,4% 

27,0% 

38,8% 

Tt+7Z~ 

0,203% 

***• 

0,094% 

tf 

o- 

0+ 

+ 1 

0,0 

548,8 

0,85  keV 

yy 

38% 

3 n° 

29,9% 

*+*“** 

23,6% 

7t+Jt~Y 

4,9% 

ft+ff- 

2,2-10-* 

p 

i- 

1+ 

-l 

0,0 

776 

158  MeV 

mt 

-100% 

7cy 

0,024% 

e+er 

0,0043% 

p+ji- 

0,0067% 

0> 

i- 

0- 

-1 

0,0 

782,4 

10,1  MeV 

7t+it~n • 

89,8% 

7Z+7T~ 

1,4% 

n°y 

8,8% 

e+e~ 

0,0076% 

tf 

o- 

0+ 

+1 

0,0 

957,6 

0,92  MeV 

rjnn 

65,6% 

p°y 

29,8% 

coy 

2,7% 

yy 

1.9% 

9 

l- 

o- 

-I 

0,0 

1019,6 

4,1  MeV 

K+K- 

48,6% 

KlKs 

35,2% 

7C+7t~1 r* 

14,7% 

ny 

1,3% 

e+er 

0,032% 

p+pr 

0,025% 

Ax 

i+ 

1“ 

+1 

0,0 

-1100 

-300  MeV 

pn 

interpretacja 

niepewna 

B 

t+ 

1+ 

-1 

0,0 

1231 

129  MeV 

awr 

jedyny  zaob- 
serwowany 

f 

2+ 

0+ 

+1 

0,0 

1273 

178  MeV 

me 

83% 

2*+2*“ 

2,9% 

KK~ 

2,8% 

At 

2+ 

1- 

+1 

0,0 

1317 

102  MeV 

pn 

70,0% 

7jn 

14,6% 

COTZ1Z 

10,6% 

KK~ 

4.8% 

r 

2+ 

0+ 

+1 

0,0 

1516 

67  MeV 

KK~ 

główny  kanał 

p' 

1- 

1+ 

-1 

0,0 

-1600 

- 300  MeV 

An 

główny  kanał 

At 

2- 

1- 

+1 

0,0 

-1660 

-200  MeV 

fi* 

interpretacja 

niepewna 

g 

3“ 

1+ 

-1 

0,0 

1690 

180  MeV 

2 * 

24% 

An 

72,1% 

h 

4+ 

0+ 

+1 

0,0 

-2040 

- 150  MeV 

2n,  KK~ 

jedyne  zaob- 
serwowane 

K* 

1- 

1/2 

±1,0 

891,8 

50,3  MeV 

Kn 

-100% 

K? 

0,15% 

mCST*0)  = 
= 898,5 

49,1% 

K • 

2+ 

1/2 

±1,0 

1434 

100  MeV 

Kn 

K*n 

27,0% 

Kp 

6,6% 

Kco 

3,7% 

K* 

3- 

1/2 

+ 1.0 

1785 

126  MeV 

7% 

Jlw 

1- 

0- 

-1 

0,0 

3097 

0,063  MeV 

e+e~,  p+pr 

hadrony 

86% 

V* 

1- 

o- 

-1 

0,0 

3685 

0,215  MeV 

e+e~,  p+pr 

0,9% 

badrony,  np. : 

98,1% 

ip7t+n- 

33% 

yfnPjt9 

17% 

W 

4,2% 

1- 

? 

-1 

0,0 

4414 

43  MeV 

e+er 

0,0013% 

hadrony 

głównie 
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Nazwa 

Symbol 

J*> 

1° 

Pc 

s,c 

Masa  McV 

Czas  życia  s 
lub  r,  MeV 

Główne  ka- 
nały rozpadu 

Względne 

prawdopodo- 

bieństwo 

Ypsilon 

T 

1-  j 

o- 

-1 

0,0 

9458 

0,060 

e+e~,  p+p~ 

hadrony 

T' 

1- 

o- 

-1 

0,0 

10016 

< 12 

o- 

1/2 

0,1 

1868,3±0,9 

2,5+J'5'10-1Bs 

D+-+ 

-►  K~it+n+ 

3,9% 

w+fti©-*. 

— *■  K9n+ 

1,5% 

D * 

o- 

1/2 

0,1 

1863,1  ±0,9 

D*  — ► K-JZ+-+- 
K~n+i? 
-►  K~n+n+it~ 

1,8% 

12% 

3,5% 

— ► rirt+ 
(widziane) 

/>•+ 

1- 

1/2 

0,1 

2008,6 

< 2 

D°n+ 

64% 

D+n° 

28% 

Z)*° 

1/2 

0,1 

2006,0 

< 5 

D°n° 

55% 

2,24+i’jfclO-1* 

D*y 

45% 

F+ 

0- 

0 

! 

-1,1 

2030±60 

BARIONY 

p 

1/2+ 

1/2 

0,0 

£38,28 

trwały 

Proton 

(r>2- 10**  lat) 

, 

100% 

Neutron 

n 

1/2+ 

1/2 

0,0 

939,57 

917 

pe-v 

A 

1/2+ 

0 

-1,0 

1115,6 

2,63  10-1* 

pit- 

64,2% 

ni? 

35,8% 

pe~v 

8,07*  10-4 

pp~y 

1,57- 10-4 

pic-y 

0,85  10-» 

27+ 

1/2+ 

1 

-1,0 

1189,4 

0,80-  10~x* 

pi? 

51,6% 

MZ+ 

48,4% 

py 

1,24- 10-* 

rnt+y 

0,93  10-* 

Ae+v 

2,02- 10-4 

27* 

1/2+ 

l 

-1,0 

1192,5 

0,58*  10-” 

Ay 

~ 100% 

Ae+e~ 

5,45'  10“* 

z- 

1/2+ 

1 

-1,0 

1197,3 

1,48  10-» 

mt~ 

~ 100% 

nc  v 

1,110-* 

nprv 

0,45* 10-* 

Ae~v 

0,6- 10-4 

nury 

4,610-4 

3 • 

1/2+ 

1/2 

-2,0 

1314,9 

2,90- 10-1* 

Ai? 

100% 

3~ 

1/2+ 

1/2 

-2,0 

1321,3 

1,64  10-1* 

An~ 

100% 

Ae~v 

2,810-4 

Ap~v 

3,1  10-4 

A 

3/2+ 

3/2 

0,0 

1232 

1,10  MeV 

Nit 

99,4% 

py 

0,6% 

Z (1385) 

3/2+ 

1 

-1,0 

+ :1 383 

35,0  MeV\ 

88% 

— :1386 

42  MeV  / 

12% 

i:  (1530) 

3/2+ 

1/2 

-2,0 

0:1532 

9,1  MeV 

100% 

— *.1535 

10,1  McV 

Q~ 

3/2+ 

0 

-3,0 

1672 

0,82- 10- w 

3nrt  S~i?y 

31,4% 

AK- 

68,6% 

N( 1470) 

1/2+ 

1/2 

0,0 

pomiędzy 

120-350  MeV 

Nic 

-60% 

1390  a 1470 

Nit 

~ 18% 

Nitit 

-25% 

Ml  520) 

3/2- 

1/2 

0,0 

pomiędzy 

110-150  MeV 

Nit 

-55% 

1510  a 1530 

Nitit 

~45% 

M1688) 

5/2+ 

1/2 

0,0 

pomiędzy 

120-145  MeV 

Nit 

60% 

1670  a 1690 

Nitit 

40% 

A (1950) 

7/2+ 

3/2 

0,0 

pomiędzy 

200-240  MeV 

Nit 

40% 

1910  a 1940 

Nitit 

ponad  25% 

,4(1405) 

1/2 - 

0 

-1,0 

1405 

40  MeV 

Zn 

100% 

yl(1520) 

3/1- 

0 

-1,0 

1519 

15  MeV 

NK 

46% 

Zn 

42% 

Ann 

10% 

,4(1815) 

5/2+ 

0 

-1,0 

1820 

70-100  MeV 

NK 

60% 

Zn 

12% 

27(1385)* 

15-20% 

27(1670) 

3/2- 

1 

-1,0 

1670 

35-70  MeV 

NK 

10-25% 

Zn 

20-60% 

27(1915) 

5/2+ 

1 

-1,0 

od  1905 

70-140  MeV 

NK 

5-15% 

do  1930 

An 

20% 

27(2030) 

7/2+ 

1 

-1,0 

od  2020 

120-200  MeV 

NK 

-20% 

do  2040 

An 

-20% 

Zn 

5-10% 

Ae 

1/2 

0 

0,+l 

2273 

Oddziaływania  cząstek 
elementarnych 

Jedną  z podstawowych  cech  cząstek  elementarnych 
jest  ich  zdolność  do  oddziaływania  wzajemnego, 
która  umożliwia  m.in.  ich  obserwację  i badanie.  Zdol- 
ność tę  mają  nie  tylko  te  cząstki,  które  rzeczywiście 
w danym  miejscu  i w danej  chwili  oddziałują  z innymi, 
ale  i te,  które  znajdują  się  tak  daleko  od  innych  czą- 
stek, że  możemy  je  uważać  za  swobodne.  W tym 
drugim  wypadku  mamy  do  czynienia  z tzw.  samood- 
proce  s samo-  działywaniem.  Polega  ono  na  stałym  emitowaniu  i po- 
chłanianiu  przez  daną  cząstkę  innych  cząstek,  tych 
nia  cząstek  mianowicie,  z którymi  dana  cząstka  może  oddziały- 


wać. W wyniku  tych  nieustannych  aktów  emisji 
i absorpcji  rozważana  cząstka  otacza  się  jakby  chmurą 
cząstek,  które  nazywa  się  „wirtualnymi”.  Jeżeli  bo- 
wiem rozważana  cząstka  jest  trwała,  to  emitowane 
i pochłaniane  przez  nią  cząstki  nie  mogą  być  praw- 
dziwymi cząstkami  fizycznymi,  które  można  by  wprost 
zaobserwować  doświadczalnie.  Proces  rzeczywistej 
emisji  bądź  też  absorpcji  jest  wówczas  wzbroniony 
przez  prawo  zachowania  czteropędu.  W polu  własnym 
danej  cząstki  pojawiają  się  więc  wyłącznie  obiekty 
przypominające  cząstki  rzeczywiste  wszystkimi  swoimi 
własnościami,  poza  masą,  której  wartość  nie  jest  rów- 
na masie  cząstek  fizycznych  i może  przybierać  m.in.  cząstki 
także  wartości  urojone.  Są  to  tzw.  cząstki  wirtualne,  wirtualne 
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Tak  więc  proces  samooddziaływania  cząstek  elemen- 
tarnych nie  jest  dostępny  bezpośredniej  obserwacji 
i o jego  istnieniu  można  dowiedzieć  się  a posteriori 
z analizy  teoretycznej  danych  eksperymentalnych. 
Analizę  tę  przeprowadza  się  w ramach  kwantowej 
teorii  pola  (rys.  1). 

Wyobraźmy  sobie  dwie  cząstki  elementarne,  które 
znajdują  się  bardzo  blisko  siebie.  Może  się  wówczas 
zdarzyć,  że  cząstka  wirtualna  wyemitowana  przez 
jedną  z nich  zostanie  pochłonięta  nie  przez  tę  samą 
cząstkę,  lecz  przez  inną.  Dojdzie  wtedy  nie  do  samo- 
oddziaływania, lecz  do  oddziaływania  dwu  cząstek 


\K 

l\ 

\ v 
\ 


\ 

A 

/ ! 
/ 

/ 


a) 

Rys.  1.  Cząstka  fermionowa  (rze- 
czywista) otoczona  chmurą  wirtual- 
nych bozonów  (linie  przerywane). 
Na  rys.  Ib  zostały  narysowane 
także  pętle  wirtualnych  par  fer- 
mion-antyfermion.  Zakładamy,  że 
badamy  cząstkę  w jej  układzie  spo- 
czynkowym, a więc  oś  czasu  jest 
równoległa  do  linii  świata  tej  cząstki 
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// 
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Rys.  2.  Dwie  cząstki  rzeczywiste 
fermionowe  otoczone  chmurami 
cząstek  wirtualnych  oddziałują 
przez  wymianę  wirtualnego  bo- 
zonu 


przez  wymianę  między  nimi  jednej  — lub  wielu  — 
cząstek  wirtualnych  (rys.  2).  Można  więc  powiedzieć 
obrazowo,  że  akt  emisji  cząstki  wirtualnej  jest  de- 
monstracją zdolności  do  oddziaływania  cząstki  emi- 
oddziatywa-  tującej.  Jeżeli  natomiast  cząstka  wirtualna  zostanie 
nie  przez  reabsorbowana  przez  cząstkę  macierzystą,  to  właśnie 
wymianę  zachodzi  samooddziaływanie. 


wania  krótkozasięgowe  (których  potencjał  maleje 
szybciej  niż  1/r).  Znane  z fizyki  makroskopowej 
oddziaływania  elementarne  są  długozasięgowe.  Są  to 
oddziaływania  grawitacyjne  (opisane  w fizyce  kla- 
sycznej prawem  powszechnego  ciążenia  Newtona) 
oraz  elektromagnetyczne,  opisane  w wypadku  od- 
działywania dwu  spoczywających  względem  siebie 
ładunków  elektrycznych  prawem  Coulomba.  Nato- 
miast oddziaływania  krótkozasięgowe  (silne  i słabe) 
są  znane  wyłącznie  w fizyce  mikroświata,  gdyż  ujaw- 
niają się  one  dopiero  na  bardzo  małych  odległościach. 

Prawo  zaniku  potencjału  krótkozasięgowego  na  du- 
żych odległościach  ma  postać  [exp(— pr)]/r9  przy 
czym  p jest  pewną  stałą  o wymiarze  m"1.  Jako  zasięg 
oddziaływania  przyjmuje  się  odległość  równą  pr1. 
Oddziaływania  długozasięgowe  mają  zatem  zasięg 
nieskończony.  Natomiast  jako  zasięg  oddziaływań 
krótkozasięgowych  (wartość  stałej  p'1)  przyjmuje  się 
długość  fali  comptonowskiej  odpowiadającej  najlżej- 
szej cząstce  zdolnej  do  przenoszenia  danego  rodzaju 
oddziaływania.  W oddziaływaniach  silnych  taką  naj- 
lżejszą cząstką  jest  mezon  n.  Wobec  tego  dla  oddzia- 
ływań silnych  p = 0,7  fm"1.  Oddziaływania  słabe  zaś 
mają  zasięg  znacznie  mniejszy  niż  oddziaływania 
silne.  Przez  wiele  lat  uważano,  że  zasięg  ten  jest  równy 
zeru.  Odpowiadałoby  to  sytuacji,  w której  cząstka 
przenosząca  oddziaływanie  słabe  miałaby  masę  nie- 
skończenie dużą.  Obecnie  przypuszcza  się,  że  zasięg 
oddziaływań  słabych  jest  skończony,  a bozonami 
przenoszącymi  te  oddziaływania  (bozony  Z i W)  są 
cząstki  o masie  ok.  80  GeV/c2,  czyli  cięższe  ok.  600 
razy  od  mezonu  tt.  Tylokrotnie  też  krótszy  byłby  zasięg 
oddziaływań  słabych  od  zasięgu  oddziaływań  silnych. 

Należy  podkreślić,  że  zarówno  hipoteza  istnienia  bo- 
zonów W i Z jak  i oszacowanie  wartości  ich  mas 
nie  mają  pełnego  potwierdzenia  eksperymentalnego. 

Intensywność  oddziaływania  t stała 
sprzężenia 

Trudniej  jest  wyjaśnić,  co  to  znaczy,  iż  poszczególne 
typy  oddziaływań  różnią  się  intensywnością.  Intuicyj- 
nie jest  zrozumiałe,  że  niektóre  oddziaływania  są  sil- 
niejsze niż  inne.  Ilościowo  intensywność  oddziaływa-  sta&* 
nia  charakteryzujemy  wartością  stałej  sprzężenia.  sprzę 

Fizyczny  sens  stałej  sprzężenia  jest  łatwiej  zrozu- 
mieć, rozważając  znane  z fizyki  klasycznej  prawa 
Newtona  i Coulomba.  We  wzorach  wyrażających  te 
prawa  oprócz  odległości  r między  oddziałującymi 
obiektami  fizycznymi  występuje  jeszcze  — jako  miara 
liczbowa  zdolności  tych  obiektów  do  oddziaływania — 
wielkość  taka  jak  masa  (we  wzorze  Newtona)  czy  też 
ładunek  (we  wzorze  Coulomba).  Posługując  się  języ- 
kiem fizyki  cząstek  elementarnych  można  powiedzieć, 
że  wielkość  ładunku  elektrycznego  lub  grawitacyjnego 
(za  który  można  uważać  masę  ciężką)  charakteryzuje 
ilościowo  zdolność  danej  cząstki  elementarnej  do 
emisji  (lub  absorpcji)  cząstki  przenoszącej  oddziały- 
wanie. W wypadku  oddziaływania  elektromagnetycz- 
nego cząstką  tą  jest  dobrze  znany  foton  (o  masie  spo- 
czynkowej równej  zeru,  stąd  stała  p dla  tego  oddziały- 
wania ma  także  wartość  równą  zeru!),  natomiast  dla 
oddziaływań  grawitacyjnych  analogiczną  funkcję 
pełniłby  hipotetyczny  na  razie  grawiton,  o masie  spo- 
czynkowej równej  także  zeru. 

Ponieważ  oddziaływanie  wzajemne  polega  na  emisji 
oraz  absorpcji  cząstki  przenoszącej  oddziaływanie, 
więc  liczbowo  będzie  ono  charakteryzowane  przez 
wielkość  zawierającą  kwadrat  ładunku.  Wielkość 
tę  dobiera  się  tak,  aby  była  bezwymiarowa.  W rezul- 
tacie, jako  stałą  sprzężenia  oddziaływania  elektro- 
magnetycznego dostajemy  wielkość 

aei  = (4jc£0  )“V/(ćc),  (I) 

a oddziaływania  grawitacyjnego  wielkość 

agr  = Cm1m2l(ńc)y  (2) 

gdzie:  e — ładunek  elementarny,  G — stała  grawita- 


Typy  oddziaływań 

W przyrodzie  istnieje  kilka  typów  oddziaływań  wy- 
raźnie różniących  się  od  siebie.  Różnice  te  przejawiają 
się  w doświadczeniu  w ten  sposób,  że  procesy  wywo- 
ływane przez  poszczególne  oddziaływania  przebiegają 
różnie.  Wnikliwsze  zbadanie  tych  procesów  prowadzi 
do  wniosku,  iż  oddziaływania  te  różnią  się  od  siebie 
zasięgiem,  intensywnością  oraz  symetrią.  Rozważania 
te  wskazują  na  istnienie  w przyrodzie  co  najmniej 
czterech  podstawowych  typów  oddziaływań,  a miano- 
wicie oddziaływania  grawitacyjnego,  słabego,  elektro- 
magnetycznego i silnego,  przy  czym  oddziaływania 
silne  kwarków  wewnątrz  hadronu  mogą  się  zasadniczo 
różnić  od  silnych  oddziaływań  hadronów.  Zarazem 
dąży  się  do  ujednolicenia  wszystkich  typów  oddziały- 
wań według  pewnych  określonych  kryteriów.  W prze- 
szłości np.  oddziaływania  elektryczne  i magnetyczne 
uważano  za  odrębne  i dopiero  dzięki  badaniom  pro- 
wadzonym przede  wszystkim  przez  Faradaya  i Max- 
wella  okazało  się,  że  w istocie  istnieje  tylko  jedno 
oddziaływanie  elektromagnetyczne.  Obecnie  prace 
nad  podobną  unifikacją  oddziaływań  słabych  i elek- 
tromagnetycznych zostały  zakończone.  Na  razie  te 
dwa  typy  oddziaływań  omawiamy  oddzielnie. 


Zasięg  oddziaływania 

Z wymienionych  powyżej  cech  oddziaływań  najłat- 
wiejszy do  zdefiniowania  jest  ich  zasięg.  Rozróżniamy 
oddziaływania  długozasięgowe  (których  potencjał 
maleje  dla  dużych  odległości  jak  1/r)  oraz  oddziały- 
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Rys.  3.  Oddziały- 
wanie nukleon-nu- 
kleon  przez  wymia- 
nę wirtualnego  me- 
zonu (chmury  zo- 
stały pominięte) 


cji,  mx  i m2 — masy  oddziałujących  cząstek,  e0  — 
przenikalność  elektryczna  próżni. 

Jak  widać  ze  wzorów  (1)  i (2)  stałą  sprzężenia  od- 
działywania elektromagnetycznego  udało  się  zdefinio- 
wać w sposób  uniwersalny,  natomiast  stała  sprzę- 
żenia oddziaływania  grawitacyjnego  zależy  od  rodzaju 
oddziałujących  cząstek.  Dla  cząstek  elementarnych 
aKr  jest  zawsze  znacznie  mniejsza  od  aei-  I tak  np. 
dla  dwu  protonów  agr  wynosi  ok.  5,9  1 0"39,  nato- 
miast (uniwersalna)  wartość  Oei  jest  z dobrym  przy- 
bliżeniem równa  1/137.  Toteż  oddziaływania  grawi- 
tacyjne cząstek  elementarnych  są  zawsze  znacznie 
słabsze  od  elektromagnetycznych;  tym  się  też  tłuma- 
czy fakt,  dlaczego  wolno  pomijać  oddziaływania 
grawitacyjne  w opisie  zachowania  się  cząstek  ele- 
mentarnych (przy  obecnie  osiąganych  energiach). 

Przy  oddziaływaniach  krótkozasięgowych  sytuacja 
jest  trudniejsza,  ponieważ  nie  znamy  wzoru  opisują- 
cego te  oddziaływania,  który  by  stanowił  analogię 
do  wzoru  Newtona  czy  też  Coulomba.  (Wzór  e-"/r, 
którym  się  posługiwaliśmy  przy  omawianiu  zasięgu 
oddziaływania,  ma  znaczenie  jedynie  poglądowe  i pół- 
jakościowe,  nie  nadaje  się  jednak  do  rozważań  ilościo- 
wych). Aby  więc  zdefiniować  stałą  sprzężenia,  sko- 
rzystamy z analogii  fizycznej  do  poprzednich  przykła- 
dów oddziaływań. 

Rozpatrzmy  dwa  protony  oddziałujące  wzajemnie 
przez  wymianę  jednego  (oczywiście  wirtualnego) 
mezonu  n.  Aktowi  emisji  mezonu  wirtualnego  przez 
proton  przyporządkujemy  silny  ładunek gNNn  (rys.  3), 
podobnie  jak  aktowi  emisji  fotonu  wirtualnego  przez 
np.  elektron  został  przyporządkowany  ładunek 
elektryczny.  Wielkość 


ois  n = (4rc  he)~lg2NNx  (3) 


jest  zwana  stałą  sprzężenia  oddziaływań  silnych 
nukleon-mezon  n.  Ta  bezwymiarowa  wielkość  jest 
mierzalna  (-*  Oddziaływania  silne)  i wartość  jej 
wynosi  w przybliżeniu  15.  Wobec  tego,  oddziaływa- 
nia silne  są  rzeczywiście  znacznie  silniejsze  od  oddzia- 
ływań elektromagnetycznych,  co  uzasadnia  ich  nazwę. 

Stosując  tę  terminologię  należy  jednak  pamiętać, 
że  oddziaływania  silne  są  krótkozasięgowe  i wobec 
tego  dla  dużych  odległości  są  efektywnie  znacznie 
słabsze  od  oddziaływań  elektromagnetycznych.  Dla- 
tego też  porównując  intensywności  różnych  typów 
oddziaływań  należy  wyraźnie  określić,  w jakiej  odle- 
głości od  siebie  znajdują  się  cząstki  oddziałujące. 

Sytuacja  ta  jest  jeszcze  wyraźniejsza  w wypadku 
oddziaływań  słabych.  Początkowo  sądzono,  że  od- 
działywania te  mają  zasięg  zerowy.  Wtedy  z fenome- 
nologicznego punktu  widzenia  podstawowym  aktem 
oddziaływania  słabego  nie  byłaby  emisja  pojedynczej 
cząstki  wirtualnej,  lecz  proces,  w którym  brałyby 
udział  4 cząstki  fizyczne  o spinach  1j2  (np.  w procesie 
rozpadu  mionu — rys.  4,//“->e“+v«-J-v*,alboteż  pro- 


Rys.  4.  Oddziaływanie  Fermiego  między  czterema  fermionami 
odpowiadające  wychwytowi  elektronu  przez  proton  z przejściem 
do  stanu  neutron  + neutrino.  Na  rys.  Ib  ten  sam  proces  przed- 
stawiony jest  przy  założeniu  istnienia  hipotetycznego  bozonu  W 
przenoszącego  oddziaływania  słabe 


ces  zderzenia  neutrina  z elektronem,  ve+e  v«-f  e). 
Okazuje  się  (-►  Oddziaływania  słabe),  że  wielkość 
charakteryzująca  taki  proces  nie  jest  bezwymiarowa 
i wynosi,  jak  wynika  z danych  doświadczalnych,  G = 
= 1,02  • 10“ 6 -m'2  (gdzie  mv  — masa  protonu).  Stałą  G 
jest  dość  trudno  porównać  ze  stałą  sprzężenia  np.  od- 


działywania elektromagnetycznego  ze  względu  na 
zupełnie  inny  charakter  zależności  tych  dwu  rodzajów 
oddziaływania  od  odległości. 

Jeśli,  zgodnie  z nowymi  poglądami  na  oddziaływa- 
nia słabe,  są  one  przenoszone  przez  bozony  Z i W , 
to  można,  znając  stałą  G,  obliczyć  stałą  sprzężenia 

asi  = (4jt  hc)~lg\pW.  (4) 

Wartość  tej  stałej  jest  rzędu  stałej  sprzężenia  oddzia- 
ływań elektromagnetycznych. 

Rozważania  dotyczące  uszeregowania  oddziaływań 
cząstek  elementarnych  na  podstawie  wartości  stałych 
sprzężenia  można  poprzeć  innymi  jeszcze  argumen- 
tami ilościowymi. 

Argumenty  te  czerpie  się  z danych  podających  mąsy  cząstek 
różnice  mas  cząstek  elementarnych  oraz  różnice  ich  eJementar- 
czasów  życia.  Należy  zwrócić  uwagę,  że  energia  nych 
samooddziaływania,  jak  każda  w ogóle  energia 
(zgodnie  z zasadami  szczególnej  teorii  względności), 
wiąże  się  z pewną  masą.  Ponieważ  zaś  cząstka  jest 
zawsze  w stanie  samooddziaływania,  przeto  jej  zmie- 
rzona masa  zawiera  już  w sobie  ów  dodatek  (masę 
połową)  pochodzący  z samooddziaływania.  Można 
więc  oczekiwać,  że  każde  dwie  cząstki,  które  się  róż- 
nią samooddziaływaniem  będą  mieć  różne  wartości 
masy.  Porównując  zatem  masy  tych  cząstek,  co  do 
których  można  żywić  nadzieję,  że  ich  masy  niepolowe 
są  dokładnie  jednakowe,  możemy  uzyskać  dane 

0 sile  oddziaływania,  powodującego  przyrost  masy. 

Intensywność  oddziaływania  zależy  zaś  od  wartości 
stałej  sprzężenia.  Tym  samym  różnice  mas  cząstek 
elementarnych  są  jakąś  miarą  wartości  stałych  sprzę- 
żenia poszczególnych  rodzajów  oddziaływań. 

Mimo,  że  problem  ten  przedstawia  się  dość  jasno 
od  strony  jakościowej,  to  jednak  dotychczas  nie 
opracowano  konsekwentnej  metody  obliczania  po- 
prawek do  masy  pochodzących  od  samooddziaływa- 
nia. Jest  to  więc  zagadnienie,  którego  nie  można 
jeszcze  przedstawić  od  strony  ilościowej. 

Dotychczas  jest  znany  jeden  przykład  dwu  cząstek  różnice  mas 
elementarnych,  różniących  się  jedynie  swymi  od-  cząstek  po- 
działywaniami  słabymi  — są  to  K ® i Kg  (patrz  tabela  krewnych 
na  str.  84).  Różnica  ich  mas  jest  bardzo  mała,  wy- 
nosi zaledwie  3,5  *10“ 12  MeW/ć2.  Znacznie  większe 
wartości  mają  różnice  mas  między  pokrewnymi  czą- 
stkami wynikające  z oddziaływań  elektromagnetycz- 
nych. I tak  np.  neutron  jest  cięższy  od  protonu  o 1,29 
MeV/c2,  mezon  n+(i7i~)  od  mezonu  n°  o 4,6  MeV/c2, 
hiperon  Z~  od  hiperonu  Z°  o 4,8  MeV/c2,  ten  ostatni 
zaś  od  hiperonu  Z+  o 3,1  MeV/c2  itd.  Patrząc  na 
tabelę,  można  się  przekonać,  że  różnice  te  są  z reguły 
mniejsze  niż  10  MeV/c2. 

Jeszcze  większe  różnice  mas  występują  między 
cząstkami  pokrewnymi,  różniącymi  sięjednak  oddzia- 
ływaniem silnym.  I tak  np.  różnica  masy  między  hipe- 
ronem A a nukleonem  wynosi  ok.  175  MeV/c2,  mię- 
dzy hiperonami  Z i A — ok.  75  MeV/c2,  między  hi- 
peronami S i Z — ok.  130  MeY/c2,  między  mezo- 
nem K a mezonem  n ok.  350  MeV/c2  (wartość  wyjątko- 
wo duża!),  między  mezonem  K*  a mezonem  o ok. 

130  MeV/c2  itd.  Jak  widać  z tego  zestawienia,  różnice 
mas  spowodowane  oddziaływaniami  silnymi  zawierają 
się  orientacyjnie  między  100  a 400  MeV/c2.  Są  to 
więc  wartości  mniej  więcej  100  razy  większe  od  różnic 
mas  elektromagnetycznych,  co  się  z grubsza  zgadza 
ze  stosunkiem  odpowiednich  ładunków:  silnego 

1 elektrycznego.  Wszelkie  dokładniejsze  porównania 
ilościowe  mają  jednak  niewielkie  znaczenie,  ponieważ 
nie  ma  konsekwentnej  teorii  mas  polowych. 

Następnym  kryterium  służącym  do  rozróżniania  średnie  czasy 
rozmaitych  rodzajów  oddziaływań  mogą  być  średnie  życia 
czasy  życia  cząstek  nietrwałych.  Cząstki  nietrwałe  — 
z punktu  widzenia  struktury  pola  własnego  — tym 
się  różnią  od  cząstek  trwałych,  że  mogą  emitować 
także  cząstki  rzeczywiste  (fizyczne),  a nie  tylko  wirtu- 
alne; taki  akt  emisji  nie  zachodzi  bowiem  z pogwał- 
ceniem zasady  zachowania  czteropędu.  Jednakże  emi- 
sja cząstki  czy  to  wirtualnej  czy  też  rzeczywistej  jest 
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liczba  pomiarów  N (jednostki  dowolne) 


uzależniona  od  zdolności  cząstki  emitującej  do 
oddziaływania  i wobec  tego  zależy  od  wartości  stałej 
sprzężenia.  Należy  więc  oczekiwać,  że  cząstki  rozpa- 
dające się  w wyniku  oddziaływania  silnego  mają 
średnie  czasy  życia  krótsze  niż  cząstki  rozpadające  się 
elektromagnetycznie,  a te  z kolei  żyją  średnio  krócej 
niż  cząstki  rozpadające  się  w wyniku  oddziaływań 
słabych.  Jak  wynika  z tabeli  na  str.  84  dane  doświad- 
czalne potwierdzają  to  przypuszczenie.  Istotnie, 
wszystkie  średnie  czasy  życia  cząstek  nietrwałych 
można  podzielić  na  trzy  grupy.  Warto  tu  dodać, 
że  średnie  czasy  życia  cząstek  rozpadających  się 
w rezultacie  oddziaływań  silnych  ocenia  się  na  pod- 
stawie zasady  nieokreśloności  czasu  i energii.  Z zasady 


Rys.  5.  Charakterystyczny  przebieg  krzywej  rozkładu  masy  czą- 
stki nietrwałej,  z którego  można  odczytać  wartość  szerokości  po- 
łówkowej. Na  osi  poziomej  odłożona  jest  masa,  a na  pionowej 
liczba  pomiarów,  w których  została  zmierzona  dana  wartość  masy 


tej  wynika  m.in.,  że  średni  czas  życia  cząstek  nietrwa- 
łych r,  pomnożony  przez  szerokość  połówkową 
charakteryzującą  niepewność  w określeniu  masy 
cząstki  nietrwałej,  wynosi  fi.  Na  tej  podstawie  można 
zapisać  zależność  z(s)r(MeV)  « 6,58  -10" 22  (rys.  5). 
zależność  Jedną  grupę  stanowią  średnie  czasy  życia  rzędu 
czasu  życia  10"21-10"24  s.  Zaliczyć  tu  można  czasy  życia  takich 
od  typu  od-  cząstek  jak  A (t  = 4,3  -10“24  s),  co  (t  = 6,6  -10“23  s), 
działy wania  ^(t  = 5,7  10“ 24  s)  itd.  Najdłuższe  czasy  życia  w tej 
grupie  mają  mezony  9 (1,6*  10“ 22  s)  oraz  niedawno  od- 
kryte mezony  //v>  (9,8  T0"21s)i  v>'(2,9  -10"21s).  Wszy- 
stkie te  rozpady  przypisuje  się  oddziaływaniom  silnym. 

Drugą  (nieliczną)  grupę  średnich  czasów  życia 
tworzą  r rzędu  10“ 16  -10" 19  s.  Zaliczyć  tu  można  śred- 
nie czasy  życia  mezonu  7c°  (0,83  TO"16),  mezonu 
rj  (0,77  TO"18)  czy  wreszcie  hiperonu  27°  (0,58  T0~19  s). 
Wszystkie  te  rozpady  przypisuje  się  oddziaływaniom 
elektromagnetycznym. 

Trzecią  natomiast  grupę  tworzą  średnie  czasy  życia 
rzędu  10"®-10"13  s.  Zaliczyć  tu  można  czasy  życia 
mezonów  tc*,  JC*,  K^y  K%,  hiperonów  A9  27+,  27", 

S~,  13.  Zestaw  danych  liczbowych  znajduje  się  w ta- 
beli na  str.  84.  Można  tu  też  zaliczyć  średni  czas  życia 
mionu.  Pozornym  wyjątkiem  jest  rozpad  neutronu, 
lecz  wyjątkową  powolność  tego  rozpadu  wyjaśnia 
się  działaniem  czynników  ubocznych.  Wszystkie  te 
rozpady  powstają  wskutek  oddziaływań  słabych. 

Tak  więc  między  czasami  życia  charakterystycznymi 
dla  oddziaływań  silnych  i elektromagnetycznych 
istnieje  różnica  co  najmniej  dwu  rzędów  wielkości, 
szczególnie,  jeśli  pominąć  wyjątkowo  powolne — jak 
na  oddziaływania  silne  — rozpady  cząstek  J/\p  i y>\ 
Podobna,  a nawet  większa  różnica  (co  najmniej  pięć 
rzędów  wielkości)  dzieli  czasy  życia  wywołane  roz- 
padami elektromagnetycznymi  i słabymi. 

Podsumowując  można  powiedzieć,  że  dane  do- 
świadczalne przemawiają  za  istnieniem  trzech  dobrze 
wyodrębnionych  fenomenologicznie  rodzajów  od- 
działywań (nie  biorąc  pod  uwagę  oddziaływań 
grawitacyjnych). 

Najtrudniejsza  do  wyjaśnienia  jest  różnica  w sy- 


metrii poszczególnych  rodzajów  oddziaływań.  Do 
tego  zagadnienia  przejdziemy  dopiero  po  omówieniu 
głównych  rodzajów  cząstek  i charakteryzujących  je 
liczb  kwantowych. 


Klasyfikacja  cząstek 
elementarnych 


fermkn> 


foton 


leptony 


hadrony . 


mezony 


barw 


Podstawą  klasyfikacji  cząstek  elementarnych  są 
dwa  niezależne  kryteria  — wartość  liczby  spinowej  bozony 

i zdolność  do  oddziaływań  silnych.  Wszystkie  czą-  

stki  dzielimy  na  fermiony  (ich  spin  wynosi  V2, 3/2, ...) 
oraz  bozony  (mające  spin  całkowity  — 0, 1 ,2,...).  Jed- 
nocześnie wszystkie  cząstki  dzieli  się  na  hadrony,  czyli  ~ 
cząstki  zdolne  do  oddziaływań  silnych,  oraz  pozostałe 
cząstki,  które  nie  mają  odrębnej  nazwy.  Hadrony  bę- 
dące fermionami  są  nazywane  barionami,  a hadrony 
będące  bozonami  — mezonami.  Natomiast  fermiony, 
które  nie  są  hadronami  tworzą  grupę  leptonów,  a od- 
powiednie bozony  — grupę  zawierającą  jedną  tylko 
znaną  cząstkę  elementarną,  a mianowicie  foton.  Do 
tej  samej  grupy  można  by  zaliczyć  także  bozony  od- 
działywań słabych,  a wśród  nich  bozon  W,  gdyby  ich 
istnienie  zostało  potwierdzone  doświadczalnie.  Liczba 
hadronów  znacznie  przewyższa  liczbę  cząstek  pozo- 
stałych i główny  problem  klasyfikacyjny  wiąże  się 
właśnie  z uporządkowaniem  hadronów. 

Istnieje  kilka  wielkości  fizycznych,  które  cha-  powszechne 
rakteryzują  wszystkie  bez  wyjątku  cząstki  elementarne,  liczby 
Są  to  wielkości  znane  już  z fizyki  klasycznej,  kwantowe 
jak  pęd,  energia,  masa,  czas  życia  (niekiedy  wyrażany 
przez  swoją  odwrotność,  a mianowicie  przez  szero- 
kość połówkową  r ),  własny  moment  pędu  (spin) 
czy  ładunek  elektryczny.  Jednakże  wartość  pędu 
i energii  nie  odgrywa  żadnej  roli  w klasyfikacji  czą- 
stek, gdyż  może  ona  ulec  zmianie  w wyniku  przyspie- 
szenia lub  spowolnienia  ruchu  tej  samej  cząstki. 

Oprócz  ładunku  elektrycznego  są  jeszcze  znane 
z fizyki  klasycznej  inne  wielkości  fizyczne  charak- 
teryzujące oddziaływanie  obiektów  fizycznych  z po- 
lem elektromagnetycznym,  jak  np.  momenty  dipolowe 
(elektryczne  i magnetyczne),  kwadrupolowe,  oktupo- 
lowe  itd.  W odniesieniu  do  cząstek  elementarnych 
teoria  pozwala  na  sformułowanie  kilku  twierdzeń 
ogólnych.  Weźmy  pod  uwagę  cząstkę  elementarną 
o spinowej  liczbie  kwantowej  J.  Zgodnie  z ogólnymi 
twierdzeniami  teorii  cząstek  elementarnych  oddziały- 
wanie takiej  cząstki  z polem  elektromagnetycznym 
scharakteryzowane  jest  2/-fl  wielkościami.  Twier- 
dzenie to  jest  słuszne  z taką  dokładnością,  z jaką 
można  pominąć  oddziaływania  słabe,  a w pewnych 
wypadkach  nawet  z lepszą  (z  dokładnością,  z jaką 
zachowana  jest  parzystość  kombinowana  CP).  Tak 
więc  oddziaływania  elektromagnetyczne  cząstki  o spi- 
nie J = 0 są  opisywane  tylko  przez  jedną  wielkość, 
a mianowicie  ładunek  elektryczny ; dla  cząstek  o / = 

= 1/2  może  się  pojawić  druga  wielkość  — dipolowy 
moment  magnetyczny ; dla  cząstek  o/=l  oprócz 
dwu  wymienionych  może  wystąpić  jeszcze  niezerowa 
wartość  kwadrupolowego  momentu  elektrycznego 
itd.  Oczywiście  nie  wszystkie  te  wielkości,  poczynając 
od  ładunku,  muszą  być  różne  od  zera.  Ponieważ 
trudno  jest  zmierzyć  te  wielkości  dla  cząstek  bardzo 
nietrwałych  (wyjątkiem  jest  ładunek),  przeto  o elek- 
tromagnetycznych liczbach  kwantowych  cząstek  ele- 
mentarnych wiadomo  na  razie  jeszcze  niewiele. 

Liczby  kwantowe:  barionowa  B , leptonowa  L, 
taonowa  Lt,  mionowa  Lu  i elektronowa  Le  są  także 
powszechnymi  liczbami  kwantowymi,  które  można 
przyporządkować  wszystkim  cząstkom.  Przyporząd- 
kowania tego  dokonuje  się  w ten  sposób,  że  wszystkim 
barionom  przypisuje  się  B = 1,  wszystkim  antybario- 
nom  B = —1  (szerzej  o pojęciu  antycząstki  będzie 
mowa  dalej),  natomiast  wszystkim  nie-barionom  B — 

= 0.  Podobnie  są  definiowane  pozostałe  liczby,  np. 
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mionową:  przypisujemy  = 1 mionowi  pT  oraz 
neutrinie  mionowemu  v„,  a ich  antycząstkom  — 
Lu  — —1.  Natomiast  wszystkie  inne  cząstki  mają 
z definicji  Lu  — 0. 

Wymienione  dotychczas  liczby  kwantowe,  takie  jak 
np.  pęd,  moment  pędu,  ładunek,  czy  wreszcie  liczby 
barionowa  i leptonowa  mają  tę  własność,  że  aby 
obliczyć  wartość  danej  liczby  kwantowej  dla  układu 
dwu  lub  więcej  cząstek  elementarnych  należy  po 
prostu  dodać  liczby  kwantowe  charakteryzujące 
poszczególne  cząstki  (przy  momencie  pędu  należy 
oczywiście  uwzględnić  oprócz  spinowego  także  orbi- 
talny moment  pędu  i zastosować  kwantowe  prawo 
dodawania  tej  wielkości  fizycznej).  Takie  liczby 
kwantowe  są  nazywane  addytywnymi.  Oprócz  nich 
mamy  też  do  czynienia  z multiplikatywnymi  liczbami 
kwantowymi,  które  należy  mnożyć  przez  siebie, 
aby  uzyskać  wartość  danej  liczby  kwantowej  dla 
układu  cząstek. 

Przykładem  multiplikatywnej  liczby  kwantowej 
jest  parzystość  P.  Określa  ona  zachowanie  się  funk- 
cji falowych  opisujących  układy  kwantowe  przy  do- 
konaniu inwersji,  tzn.  zmiany  znaku  wszystkich  trzech 
przestrzennych  osi  układu  odniesieniu.  Jest  oczywiste, 
że  dwukrotne  wykonanie  inwersji  przywraca  stan 
pierwotny,  można  więc  oczekiwać,  iż  parzystość  P 
wszystkich  cząstek  może  przybierać  tylko  dwie  war- 
tości, a mianowicie  +1  i —1.  Okazuje  się  jednak,  że 
funkcja  falowa  fermionów  nie  ma  określonego  za- 
chowania przy  inwersji,  co  uniemożliwia  bezwzględne 
przyporządkowanie  parzystości  cząstkom  o spinie 
połówkowym.  Można  jednak  określić  parzystość 
względną  dwu  fermionów,  gdyż  para  fermionów 
ma  spin  całkowity  i jest  bozonem.  Bardziej  szczegóło- 
wa analiza  prowadzi  do  wniosku,  że  kilku  wybranym 
fermionom  należy  umownie  przyporządkować  pa- 
rzystość, a wtedy  parzystości  pozostałych  cząstek 
będą  jednoznacznie  określone.  Wybranymi  fermio- 
nami są:  proton,  neutron,  hiperon  A,  elektron,  mion 
i taon.  Cząstkom  tym  przypisuje  się  P = + 1. 
Dodajmy,  że  określenie  parzystości  dla  neutrin  nie 
ma  sensu,  gdyż  cząstki  te  biorą  udział  tylko  w od- 
działywaniach słabych,  które  nie  zachowują  parzy- 
stości (zostanie  to  omówione  nieco  dalej). 

Należy  jeszcze  pamiętać  o tym,  że  parzystość 
układu  cząstek  elementarnych  nie  jest  po  prostu 
równa  iloczynowi  parzystości  tych  cząstek,  lecz  temuż 
iloczynowi  pomnożonemu  dodatkowo  przez  parzy- 
stość związaną  z ruchem  orbitalnym  składników 
układu.  Dla  układu  dwucząstkowego  mamy  np. 

P układu  = Pi^(~  1)  * 

przy  czym  Pu  P2  — parzystości  składników  układu, 
/ — liczba  kwantowa  orbitalnego  momentu  pędu 
tych  składników. 

Powstaje  pytanie,  czy  oprócz  dotychczas  omawianej  parzy- 
stości, którą  można  by  nazwać  przestrzenną,  istnieje  także  pa- 
rzystość czasowa,  związana  z zachowaniem  się  funkcji  falowej 
przy  odwróceniu  biegu  czasu.  Pozornie  nie  ma  ona  sensu,  gdyż 
przecież  rzeczywistego  czasu  odwrócić  się  nie  da.  Jednakże  dla 
każdego  ruchu  można  znaleźć  ruch  odwrócony  w czasie,  to  zna- 
czy taki,  który  zachodzi  w ten  sam  sposób,  w jaki  zachodziłby 
ruch  wyjściowy  oglądany  przez  obserwatora  poruszającego  się 
wstecz  w czasie. 

Aby  to  lepiej  zrozumieć,  rozważmy  ciało  poruszające  się  w da- 
nym potu  sił,  zależnym  tylko  od  odległości,  z pewną  — w usta- 
lonej chwili  i w ustalonym  punkcie  — prędkością.  Nic  zmie- 
niając położenia  ciała  oraz  sił  działających  na  to  ciało  zmieńmy 
po  prostu  zwrot  jego  prędkości.  Nastąpi  wówczas  ruch  tego  ciała 
w danym  polu  sił,  lecz  odwrócony  w czasie.  Gdyby  zaś  siły  dzia- 
łające na  to  ciało  były  zależne  od  czasu,  należałoby  rdzpatrywać 

ruch  ciała  w polu  sił  F{  — /),  przy  jednoczesnym  odwróceniu 
zwrotu  jego  prędkości.  Widać  więc,  że  transformacja  odwrócenia 
czasu  ma  sens  fizyczny. 

\W  mechanice  klasycznej  z transformacją  odwrócenia  czasu, 
zresztą  podobnie  jak  z operacją  inwersji,  nie  wiąże  się  żadna  stała 
ruchu.  Jednakże  w mechanice  kwantowej  sytuacja  ta  — teo- 
retycznie rzecz  biorąc  — mogłaby  się  zmienić,  podobnie  jak 
dla  inwersji,  której  wartość  własna,  a mianowicie  parzystość 
przestrzenna,  jest  pewną  liczbą  kwantową  charakteryzującą  za- 
równo pojedyncze  cząstki  elementarne  jak  i ich  układy.  Wyka- 
żemy teraz,  że  sytuacja  taka  nie  zachodzi  dla  odwrócenia  czasu, 
a więc  że  nie  istnieje  żadna  parzystość  czasowa 

Podstawowe  w mechanice  kwantowej  równanie  ruchu  czyli 
równanie  Schródingera  ma  postać 


przy  czym : 


i dt 


(6) 


a*  a* 

A — operator  Laplace’a  równy  + ~^x  4-  * 


fx stała  Plancka,  m — masa  rozważanego  obiektu  kwanto- 

wego, a ty — funkcja  falowa  opisująca  ten  obiekt.  Z równania 
Schródingera  wynika,  że  zamiana  t na  -/  prowadzi  do  zmiany 
znaku  prawej  strony  równania,  natomiast  nie  powoduje  żadnej 
zmiany  po  stronie  lewej.  Dąży  się  jednak  do  tego,  aby  ruch  kwan- 
towy odwrócony  w czasie  przebiegał  wedle  tych  samych  praw  co 
i ruch  nieodwrócony.  Trzeba  wobec  tego  przyjąć,  że  operacja 
odwrócenia  czasu  zawiera  w sobie  także  operator  sprzężenia  ze- 
spolonego, przy  którym  liczby  rzeczywiste  nie  zmieniają  się, 
zmienia  się  natomiast  znak  jednostki  urojonej  i.  Ta  drobna  na 
pozór  sprawa  ma  poważne  konsekwencje,  uniemożliwia  bowiem 
sformułowanie  w ramach  mechaniki  kwantowej  zagadnienia  wła- 
snego dla  operatora  odwrócenia  czasu.  Zgodnie  bowiem  z pra- 
wami mechaniki  kwantowej  dwie  funkcje  ty  i ety  (c  — dowolna 
stała  zespolona)  opisują  dokładnie  ten  sam  stan  fizyczny.  Jeśli 
v jest  funkcją  własną  operatora  odwrócenia  czasu,  to,  oznacza- 
jąc ten  operator  symbolem  T,  mamy  Tty  — T ty , gdzie  T jest  od- 
powiednią wartością  własną  charakteryzującą  stan  kwantowy  ty. 
Jednakże  ety  musi  być  wtedy  także  funkcją  własną  operatora  T 
przynależną  do  tej  samej  wartości  własnej,  a więc  powinna  za- 
chodzić Tcty  = Tc\y ; wszelako  mamy  też  związek  Tery  = c*  Tty  =• 
= c*7>.  Dwie  te  równości  nie  mogą  być  ze  sobą  zgodne  dla  do- 
wolnej zespolonej  wartości  c.  Tak  więc  nie  ma  parzystości  cza- 
sowej. 

Bardzo  wiele  liczb  kwantowych  charakteryzuje 
wyłącznie  (lub  prawie  wyłącznie)  hadrony.  Na  pier- 
wszym miejscu  zostanie  tu  wymieniona  dziwność  S. 
Jest  to  addytywna  liczba  kwantowa  przybierająca 
wartość  0 dla  fotonu  oraz  dla  hadronów  niedziwnych. 
Do  hadronów  niedziwnych  zalicza  się  proton  i neutron 
(wraz  z ich  antycząstkami)  oraz  wszystkie  cząstki, 
które  mogą  powstawać  pojedynczo  w reakcjach 
zachodzących  między  wymienionymi  cząstkami  wy- 
wołanych oddziaływaniami  silnymi.  Hiperonowi  A 
jest  przypisywana  dziwność  —1.  Łatwo  wobec  tego 
określić  dziwność  wszystkich  innych  hadronów, 
przestrzegając  reguły  addytywności  oraz  warunku, 
aby  cząstka,  której  dziwność  chcemy  określić,  pow- 
stawała pojedynczo  w reakcji  wywołanej  oddziały- 
waniami silnymi.  Obecnie  są  znane  bariony  o dziw- 
ności 5 = 0,  —1,  -2,  -3  oraz  mezony  o dziwności 
5 = -1,0,  +1. 

Z dziwnością  wiąże  się  ściśle  hiperładunek  Y — B- f 
+5.  Inną  liczbą  kwantową  charakteryzującą  wyłącz- 
nie bariony  jest  izospin  I.  Podstawą  fenomenologiczną 
do  wprowadzenia  tej  liczby  kwantowej  była  obserwa- 
cja grupowania  się  hadronów  w pewne  rodziny  o na- 
stępujących własnościach:  a)  wszystkie  cząstki  na- 
leżące do  tej  samej  rodziny  mają  w przybliżeniu  takie 
same  masy  (ich  różnice  są  rzędu  kilku  MeV/c2,  b) 
wszystkie  cząstki  należące  do  tej  samej  rodziny  mają 
te  same  wartości  spinu,  parzystości,  liczby  barionowej 
i dziwności,  c)  ładunki  elektryczne  tych  cząstek 
przybierają  (w  jednostkach  e)  wszystkie  wartości 
z przedziału  — /+  T/2  aż  do  + /+  T/2,  gdzie  /—  pew- 
na liczba  całkowita  lub  połówkowa,  nieujemna. 
Nazywa  się  ją  izospinem  całej  rodziny  cząstek,  a tę  ro- 
dzinę z kolei  — multipletem  izospinowym.  Liczeb- 
ność takiej  rodziny  wynosi  oczywiście  Nr  = 2/+1. 

Analogia  formalna  izospinu  do  zwykłego  spinu, 
częściowo  tłumaczy  wybór  nazwy  dla  tej  wielkości 
fizycznej.  Mianowicie  (dla  zwykłego  spinu)  danej 
wartości  7 odpowiada  27+1  stanów,  różniących  się 
wartością  jednej  ze  składowych  spinu,  którą  zwykle 
wybieramy  jako  z-ową  (albo  trzecią)  składową  7, 
tzn.  73.  Liczba  kwantowa  73  przybiera  wszystkie 
bez  wyjątku  wartości  ze  zbioru  —7,  —7+1, 

7-  1,  7.  Na  tej  zasadzie  możemy  też  wprowadzić 
trzecią  składową  izospinu,  /3,  która  także  przybiera 
wszystkie  wartości  — /,  —7+1,  •••>  7— 1»  A P°  czym 
można  zapisać  wzór  na  ładunek  cząstek  należących 
do  tego  samego  multipletu  izospinowego  w postaci 
Q = /3+  T/2  (7) 


(wzór  Gell-Manna-Nishijimy). 

Oczywiście,  rozpatrując  składową  izospinu  mamy 
na  myśli  jakąś  interpretację  geometryczną  izospinu 
jako  wektora.  Rozumie  się  jednak,  że  nie  jest  to 
wektor  w zwykłej  przestrzeni,  lecz  jakiejś  dodatko- 
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wej  przestrzeni  ładunkowej,  a lepiej  — izosprzestrze- 
ni.  Tę  izoprzestrzeń  należy  także  uważać  za  trójwy- 
miarową. W zwykłej  przestrzeni  oprócz  spinowego 
istnieje  też  orbitalny  moment  pędu,  związany  z ru- 
chem postępowym  dwu  obiektów  względem  siebie. 
Jednakże  w przestrzeni  izospinowej  nie  występuje 
ruch  postępowy,  nie  ma  więc  także  np.  „izopędu” 
lub  „izoenergii”,  a w konsekwencji  nie  ma  też  „izo- 
momentu  orbitalnego”.  Tak  więc,  chcąc  znaleźć 
wartość  izospinu  układu  dwu  cząstek  należy  dodać 
izospiny  składników  układu  (nie  dbając  o nie  istniejący 
w tym  wypadku  moment  orbitalny),  pamiętając 
jedynie,  że  izospin  należy  składać  zgodnie  z kwanto- 
wymi regułami  dodawania  momentu  pędu. 
powab  C Niedawno  pojawiła  się  w fizyce  nowa  liczba  kwan- 
towa, charakteryzująca  wyłącznie  hadrony,  a miano- 
wicie powab  C.  Wszystkie  dotychczas  wymienione 
cząstki,  umieszczone  w tabeli  na  str.  84,  miałyby  C = 0, 
byłyby  więc  cząstkami  niepowabnymi.  Powab  jest 
liczbą  kwantową  addytywną,  pod  wieloma  względa- 
mi podobną  do  dziwności.  Dla  cząstek  powabnych 
trzeba  nieco  zmodyfikować  wzór  GeH-Manna-Nishiji- 
my,  który  przybierze  wówczas  postać 

Q = /3+(r4-C)/2.  (8) 

Znamy  też  od  niedawna,  choć  bardzo  niedokładnie, 
jeszcze  jedną  liczbę  kwantową  charakteryzującą  had- 
rony, a mianowicie  B'  (ang.  beauty ),  piękno.  Liczba 
ta  miałaby  podobny  status  jak  powab, 
antycząstki  Należy  teraz  dokładnie  sprecyzować  pojęcie  anty- 
cząstki.  Anty  cząstką  danej  cząstki  a nazywamy  taką 
cząstkę  at  która  ma  te  same  co  a wartości  masy, 
izospinu,  spinu,  czasu  życia,  przeciwne  zaś  By  Lty  LUy 
Le  (a  więc  i L),  Qy  S i C.  Moment  magnetyczny  anty- 
cząstki jest  ustawiony  w stosunku  do  jej  spinu  prze- 
ciwnie niż  moment  magnetyczny  cząstki.  Parzystość 
antyfermionu  jest  przeciwna  parzystości  fermionu,  a 
parzystość  antybozonu  jest  taka  sama  jak  parzystość 
bozonu.  To,  co  uznajemy  za  cząstkę,  _a  co  za  anty- 
cząstkę,  jest  oczywiście  umowne,  gdyż  a — a. 

Z powyższego  zestawienia  liczb  kwantowych  anty- 
cząstek  wynika,  że  jest  możliwe  istnienie  takich 
cząstek,  które  są  identyczne  ze  swymi  antycząstkami, 
a = d gdyż  mają  zerowe  wartości  tych  wszystkich 
liczb  kwantowych,  które  zmieniają  znak  przy  przej- 
ciąstki  ściu  od  cząstki  do  antycząstki.  Cząstki  te  nazywać 
iistof nie  będziemy  istotnie  obojętnymi.  Tak  więc,  dla  cząstek 
obojętne  istotnie  obojętnych  musi  być  B=S=Q=C=  0, 
Lt  = — Le  = L = 0.  Cząstką  istotnie  obojętną 

jest  np.  foton  oraz  każdy  nienaładowany,  niedziwny, 
niepowabny  mezon  (np.  mezon  7r°).  Operację  polega- 
jącą na  zmianie  cząstki  w antycząstkę  nazywa  się 
sprzężenie  sprzężeniem  cząstka-antycząstka.  Z powyższych  defi- 
cząstka-  nicji  wynika,  że  funkcja  falowa  opisująca  stan  cząstki 
-antycząstka  istotnie  obojętnej  jest  funkcją  własną  operatora  tego 
sprzężenia.  Ze  względu  na  relację  u = a kwadrat  ope- 
ratora sprzężenia  cząstka-antycząstka  jest  operatorem 
jednostkowym.  Tym  samym  jego  wartości  własne  mu- 
szą, podobnie  jak  dla  parzystości  przestrzennej,  wyno- 
sić +1  lub  —1.  Wartość  własną  operatora  sprzężenia 
parzystość  cząstka-antycząstka  Pc  nazywa  się  parzystością  ła- 
ładunfeowa  dunkową.  Z powyższego  wynika,  że  tylko  cząstki  isto- 
Pc  tnie  obojętne  mają  określoną  parzystość  ładunkową. 
Parzystość  ładunkowa  jest  multiplikatywną  liczbą 
kwantową. 

Warto  zauważyć,  że  układ  dwucząstkowy  składają- 
cy się  z cząstki  i jej  antycząstki  tworzy  także  układ 
istotnie  obojętny,  ma  więc  określoną  parzystość  ła- 
dunkową, nawet  wtedy,  gdy  jego  składniki  nie  są 
cząstkami  istotnie  obojętnymi.  Wartość  tej  parzy- 
stości jest  dana  wyrażeniem 

Pc-(-l)^,  (9) 

w którym  / — liczba  kwantowa  orbitalnego  momentu 
pędu  układu,  j — wartość  spinu  tego  układu. 

Inną  multiplikatywną  liczbą  kwantową  jest  izo- 
izoparzy-  parzystość  G.  Jest  ona  wartością  własną  operatora 
stość  G izoparzystości,  który  jest  zdefiniowany  jako  iloczyn 
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operatora  sprzężenia  cząstka-antycząstka  i operatora 
obrotu  w izosprzestrzeni  o kąt  71  wokół  drugiej 
osi  w tej  przestrzeni.  Izoparzystość  ma  określoną 
wartość  dla  każdej  cząstk  i należącej  do  takiego  multi- 
pletu izospinu,  do  którego  należy  także  cząstka 
istotnie  obojętna.  W multiplecie  takim  bowiem  wszy- 
stkie cząstki  mają  B = S = C = 0,  a zatem  wzór 
Gell-Manna-Nishijimy  przybiera  szczególnie  prostą 
postać  Q = /3.  Sprzężenie  cząstka-antycząstka  zmie- 
nia Q na  — Q,  co  zgodnie  z powyższą  relacją  jest  rów- 
noważne ze  zmianą  /3  na  — /8.  Jednakże  obrót  o kąt 
7i  wokół  osi  2 w izoprzestrzeni  powoduje  odwró- 
cenie znaku  osi  trzeciej  w tejże  przestrzeni,  a więc 
automatycznie  zmianę  znaku  /3.  Te  dwie  zmiany  zna- 
ku kompensują  się  więc  i łącznie  sprzężenie  G zamie- 
nia daną  cząstkę  w samą  siebie.  I tu  znów  G2  = 1, 
więc  izoparzystość  może  mieć  wartości  jedynie  -1-1 
i —1.  Dla  cząstki  istotnie  obojętnej  można  ją  obliczyć 
ze  wzoru 

G = C(-1)',  (10) 

zaś  inne  cząstki  wchodzące  w skład  tego  samego 
izomultipletu  mają  tę  samą  izoparzystość. 

Łatwo  dostrzec,  że  inne  cząstki  nie  mają  określonej 
wartości  G.  Na  przykład  proton  pod  działaniem  sprzę- 
żenia cząstka-antycząstka  przechodzi  w antyproton, 
a ten  pod  wpływem  obrotu  w przestrzeni  izospinu 
zmienia  znak  /3,  stając  się  antyneutronem.  Operator 
G przeprowadza  więc  proton  nie  w proton,  lecz 
w anty  neutron.  Proton  nie  jest  więc  stanem  własnym 
G i nie  ma  określonej  izoparzystości. 

Należy  przy  tym  dodać,  że  w teorii  oddziaływań 
słabych  używa  się  jeszcze  jednej  multiplikatywnej 
liczby  kwantowej,  zwanej  parzystością  kombinowaną,  parzystość 
będącej  wartością  własną  operatora  zdefiniowanego  kombinc- 
jako  iloczyn  operatora  inwersji  i sprzężenia  cząstka-  warta 
antycząstka. 


Rodzaje  oddziaływań  a prawa  zachowania 

Rozważmy  dowolny  proces  z udziałem  cząstek  ele- 
mentarnych. W takim  procesie  na  ogół  ulega  zmianie 
natura  a nawet  liczba  cząstek.  Doświadczenie  wyka- 
zuje, że  nie  wszystkie  możliwe  a priori  procesy  za- 
chodzą w przyrodzie,  a także,  że  niektóre  z nich  za- 
chodzą powoli,  a inne  — szybko.  Aby  zdać  sobie 
sprawę  z tych  regularności  wprowadzamy  pojęcie 
zachowania  wielkości  fizycznych  charakteryzujących 
cząstki  elementarne  i ich  układy. 

Wykorzystując  podane  w poprzednim  punkcie 
reguły,  możemy  obliczyć  wartość  określonej  wielkości 
fizycznej  dla  układu  cząstek  wyjściowych  oraz  od- 
dzielnie dla  układu  cząstek  końcowych.  Mówimy,  że 
pewna  wielkość  fizyczna  jest  zachowana  w danym 
procesie,  jeżeli  dwie  tak  obliczone  wartości  są  jedna- 
kowe oraz,  że  wielkość  ta  jest  zachowana  przez  od- 
działywania silne  (elektromagnetyczne,  słabe),  jeżeli 
jest  ona  zachowana  we  wszystkich  procesach  prze- 
biegających w czasie  charakterystycznym  dla  oddzia- 
ływań silnych  (elektromagnetycznych,  słabych),  tj. 
w czasie  10"21-10-24s(lubteż  10-16-10~19s,  lub  wresz- 
cie J0-6-10“10  s).  Wielkości  zachowywane  we  wszyst-  wielkości 
kich  w ogóle  oddziaływaniach  nazywa  się  wielkoś-  zachowywa- ; 
ciami  bezwzględnie  zachowanymi.  ne  bez- 

Z doświadczenia  wynika  niesłychanie  interesująca  względnie 
zależność.  Okazuje  się,  że  jeżeli  jakaś  wielkość  fizyczna 
jest  zachowana  przez  oddziaływania  słabe,  to  na 
pewno  jest  też  zachowana  przez  oddziaływania  elek- 
tromagnetyczne, oraz  jeśli  jest  zachowana  przez 
oddziaływania  elektromagnetyczne,  to  jest  też  zacho- 
wana przez  oddziaływania  silne. 

Wielkościami  zachowanymi  bezwzględnie  są:  pęd, 
energia  i moment  pędu,  oraz  ładunek  elektryczny, 
liczba  barionowa  i liczby  leptonowe.  Oddziaływania 
słabe  zachowują  jeszcze  dodatkowo  parzystość  kom- 
binowaną. Występują  jednak  procesy,  które  zachodzą 
jeszcze  wolniej  niż  procesy  uwarunkowane  oddziały- 


waniami  słabymi,  w których  parzystość  kombino- 
wana nie  jest  zachowana.  Są  to  pewne  rozpady  me- 
zonów Kl . Jak  wynika  z tabeli  na  str.  84  jednym 
z głównych  kanałów  rozpadu  tych  mezonów  jest 
rozpad  na  trzy  mezony  n,  zgodny  z prawem  zachowa- 
nia parzystości  kombinowanej.  Jednakże  przekonano 
się,  że  w pewnym  bardzo  niewielkim  procencie  wy- 
padków, następuje  też  rozpad  Kl  na  dwa  mezony  n 
z pogwałceniem  tego  prawa.  Fenomenologicznie  od- 
oddziaływa-  powiada  to  istnieniu  oddziaływań  podsłabych,  słab- 
nia  podsłabe  szych  od  słabych,  nie  zachowujących  nawet  parzystości 
kombinowanej.  Rzeczywiste  jednak  wyjaśnienie  tego 
zjawiska  jest  inne. 

Poza  wielkościami  zachowywanymi  przez  oddziały- 
wania słabe,  oddziaływania  elektromagnetyczne  za- 
chowują jeszcze  parzystość  i parzystość  ładunkową 
(z  osobna)  oraz  S i /3  (te  dwie  ostatnie  wielkości 
dla  procesów,  w których  uczestniczą  wyłącznie  hadro- 
ny i foton,  przy  założeniu,  że  dla  fotonu  /,  = 0, 
aby  utrzymać  w mocy  prawo  Gell-Manna-Nishijimy). 
Oddziaływania  silne  zachowują  ponadto  izospin 
i izoparzystość.  Powab  byłby  zachowany  już  przez 
oddziaływania  elektromagnetyczne. 

Ta  degradacja  oddziaływań  ze  względu  na  liczbę 
zachowywanych  przez  nie  wielkości  fizycznych,  pokry- 
wająca się  przy  tym  ze  spadkiem  intensywności  od- 
działywania, nie  jest  w pełni  jasna.  Lepsze  zrozumienie 
znaczenia  tego  faktu  można  uzyskać  po  zbadaniu 
związku  między  prawami  zachowania  a symetrią 
teorii  fizycznej. 


Symetrie  a prawa  zachowania 

Jedną  z najgłębszych  i najciekawszych  idei  już  nie 
tylko  fizyki  cząstek  elementarnych,  ale  fizyki  w ogóle 
jest  związek  między  symetrią  a prawami  zachowania 
(->-  Zasady  zachowania).  Układy  fizyczne  wykazują 
na  ogół  pewne  własności  symetrii.  Na  przykład, 
własności  pojedyncza  cząstka  elementarna  swoimi  własnościami 
symetńi  symetrii  nie  wyróżnia  w przestrzeni  żadnego  kierunku 
cząstką  dzięki  czemu  można,  nie  zmieniając  jej  opisu,  w do- 
swobodneś  wolny  sposób  skierować  osie  układu  odniesienia. 

' ' ’ * Jest  też  możliwe  dowolne  wybranie  początku  układu 

odniesienia,  gdyż  każdy  punkt  w przestrzeni  jest 
równoważny  innemu,  skoro  w przestrzeni  tej  nie  ma 
innych  cząstek,  jak  również  dowolne  wybranie  chwili 
początkowej  jako  punktu  zerowego  na  osi  czasu. 
Co  więcej,  taka  pojedyncza,  swobodna  cząstka  poru- 
sza się,  zgodnie  z I zasadą  dynamiki,  ruchem  jedno- 
stajnym prostoliniowym;  prędkość  tego  ruchu  jest 
jednak  dowolna.  Ta  dowolność  prędkości  odpowiada 
swobodzie  przy  wyborze  do  opisu  cząstki  jednego 
z nieskończenie  wielu  układów  inercjalnych,  poru- 
szających się  względem  siebie  ze  stałą  prędkością. 

Intuicyjnie  jest  dość  zrozumiałe,  że  ze  swobodą 
przy  wyborze  tego  czy  innego  układu  odniesienia  po- 
winna się  wiązać  jakaś  niezmienna  własność  rozwa- 
twierdzenśa  żanego  ciała  lub  układu  ciał.  Ścisłe  uzasadnienie  tego 
S^oether  przekonania  jest  jednak  dość  trudne.  Dokładne 
rozważania  prowadzą  do  twierdzenia  Noether, 
które  orzeka,  że  każda  wielkość,  będąca  stałą  ruchu 
(a  więc  spełniająca  prawo  zachowania),  wiąże  się 
z jakimś  stopniem  swobody,  który  mamy  do  dyspo- 
zycji przy  wyborze  sposobu  opisu  zachowania  się 
układu  fizycznego.  Twierdzenie  odwrotne  nie  byłoby 
jednak  zawsze  prawdziwe. 

W fizyce  klasycznej  występują  prawa  zachowania 
pędu  energii,  momentu  pędu  i ładunku  elektrycznego. 
Twierdzenie  Noether  pozwala  na  ustalenie,  że  prawo 
zachowania  pędu  wynika  ze  swobody  przy  wyborze 
początku  układu  odniesienia  (w  przestrzeni  trójwy- 
miarowej są  to  trzy  stopnie  swobody,  odpowiada 
więc  im  zachowana  wielkość  trójskładnikowa  — wek- 
tor). Prawo  zachowania  energii  wynika  ze  swobody 
przy  wyborze  chwili  początkowej  na  osi  czasu,  a pra- 
wo zachowania  momentu  pędu  — ze  swobody  przy 
wyborze  kierunków  osi  układu  odniesienia. 


Nieco  trudniej  opisać  symetrię  układu  fizycznego, 
z której  wynika  prawo  zachowania  ładunku.  Przypom- 
nijmy, że  podstawowe  równania  teorii  elektromagne- 
tyzmu, a mianowicie  równania  Maxwella,  dotyczą 

dwu  wektorów  — natężenia  pola  elektrycznego  E 

i indukcji  magnetycznej  B.  Okazuje  się,  że  wektory  te 
przez  pewne  operacje  różniczkowe  można  otrzymać 

z dwu  potencjałów  — skalarnego  <p  i wektorowego  A. 

Potencjały  te  jednak  nie  są  wyznaczone  jednoznacz- 
nie przez  wartości  pól  E i B;  można  je  w pewien 
sposób  przekształcić  nie  zmieniając  samych  pól. 

Każde  takie  przekształcenie  nazywano  przekształce- 
niem cechowania.  Zakładając,  że  potencjał  skalarny  przekształ- 
można  traktować  jako  zerową  (czasową)  składową  cenią 
czterowektora  potencjału,  którego  składowymi  prze-  cechowania 
strzennymi  są  składowe  potencjału  wektorowego, 
można  przyjąć,  że  przekształcenie  cechowania  spro- 
wadza się  w przybliżeniu  do  dodania  do  każdej 
składowej  czterowektora  potencjału  pochodnej  czą- 
stkowej pewnej  (jednakowej  dla  wszystkich  składo- 
wych) funkcji  skalarnej  fi,  wziętej  względem  tej  zmien- 
nej, która  odpowiada  danej  składowej.  Na  przykład 
do  Ax  można  dodać  cfi!dx,  a do  A0  (czyli  <p/c ) — 

— (dfijdt)lc. 

Wyrażenie  na  gęstość  energii  oddziaływania  cząstki 
naładowanej  z polem  elektromagnetycznym  ma 
postać 

eUA*  = e(j0A0-jA),  (11) 

gdzie  ja  — czterowektor  gęstości  prądu  (jego  skła- 
dową zerową  jest  gęstość  ładunku).  W mechanice 
kwantowej  analogiczna  wielkość  jest  zbudowana 
z funkcji  falowych  cząstek  naładowanych  w sposób 
zależny  od  natury  tych  cząstek,  jednakże  zawsze 
w taki  sposób,  że  każda  składowa  prądu  zawiera 
funkcję  falową  cząstki  i funkcję  z nią  sprzężoną 
(zespoloną).  Jeśli  chcemy,  aby  przekształcenie  cecho- 
wania nie  zmieniało  postaci  równań  opisujących 
ruch  cząstki  naładowanej  w polu  elektromagnetycz- 
nym, to  nie  może  się  ono  ograniczyć  do  pola  elektro- 
magnetycznego, lecz  musi  też  objąć  prąd,  a więc 
i funkcje  falowe  cząstek  naładowanych.  Okazuje  się, 
się  przekształcenie  to,  wykonane  na  tych  funkcjach 
sprowadza  się  do  ich  obrotu  w płaszczyźnie  zespolo- 
nej (Re  \py  Im  v0  o pewien  kąt  fi'  = (e}c)  fi: 

(Reip)'  — Rey?  cos  fi'  - j-  Im  v*  sin  fi' , 

(Im  y)'  = — Re  rp  sinjff' +Imy  cos  fi'. 

Kąt  ten  (rys.  6),  co  widać  już  z powyższego  wzoru, 
jest  proporcjonalny  do  funkcji  fi,  której  pochodne 
dodaje  się  do  składowych  wektora  czteropotencjału. 


W powyższych  wzorach  założono,  że  fi  jest  funkcją 
położenia  i czasu.  Takie  przekształcenie  cechowania 
jest  nazywane  przekształceniem  drugiego  rodzaju,  cechowanie 
Zakładając,  że  fi  nie  zależy  od  r i /,  a więc  jest  pewną  pierwszego 
stałą,  otrzymujemy  cechowanie  pierwszego  rodzaju,  j drugiego 
Okazuje  się,  że  zachowanie  ładunku  (jedna  wielkość !)  rodzaju 
wynika  ze  swobody  wyboru  kierunków  osi  w płasz- 
czyźnie (Rey,  Im  rp),  co  się  wyTaża  w dowolności 
kąta  obrotu  fi'.  Ładunek  elektryczny  pełni  w fizyce 
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podwójną  rolę:  jest  stałą  ruchu  oraz  źródłem  pola 
elektromagnetycznego.  Jak  się  okazuje  należy  używać 
w tym  wypadku  przekształcenia  cechowania  drugiego 
rodzaju. 

W przyrodzie  istnieją  inne  stałe  ruchu,  których 
formalne  podobieństwo  do  ładunku  elektrycznego 
wyraża  się  tym,  że  ich  zachowanie  jest  także  konsek- 
wencją pewnej  transformacji  cechowania,  ale  które 
nie  są  źródłami  żadnego  pola  fizycznego.  Wielkościa- 
mi takimi  są  liczba  barionowa  i liczba  leptonowa. 
Tak  też,  w pewnym  ujęciu,  można  traktować  dziwność 
i powab.  W tych  wszystkich  wypadkach  mamy  do 
czynienia  z przekształceniem  cechowania  pierwszego 
rodzaju. 

Prawo  zachowania  parzystości  wiąże  się  ze  swobodą 
przy  wyborze  lewo-  i prawoskrętnego  układu  odnie- 
sienia, a więc  z symetrią  względem  inwersji.  Podobnie 
prawo  zachowania  parzystości  ładunkowej  wynika 
ze  swobody  przy  wyborze  tego,  co  uznamy  za  cząstkę, 
a co  za  antycząstkę,  a więc  z symetrii  względem 
sprzężenia  cząstka-antycząstka. 

Przekształcenie  odwrócenia  czasu  jest  przykładem 
sytuacji,  w której  symetria  teorii  względem  pewnego 
przekształcenia  nie  prowadzi  do  żadnego  prawa 
zachowania.  Istotnie,  prawa  fizyki  klasycznej,  czy 
też  mechaniki  kwantowej  są  (z  pewnym  wyjątkiem, 
o czym  dalej)  symetryczne  ze  względu  na  odwrócenie 
czasu.  Nie  wiąże  się  z tym  jednak  zachowanie  parzy- 
stości czasowej,  gdyż  po  prostu  wielkości  takiej  nie 
można  zdefiniować,  jak  to  zostało  zaznaczone  po- 
wyżej. 

sprzężenie  Do  podstawowych  twierdzeń  teorii  cząstek  elemen- 
PCT  tarnych  należy  hipoteza  (w  pewnych  konkretnych 
wypadkach  udało  się  ją  udowodnić),  że  wszystkie 
rodzaje  oddziaływań  wykazują  symetrię  względem 
przekształcenia  będącego  iloczynem  inwersji,  sprzę- 
żenia cząstka-antycząstka  i odwTÓcenia  czasu  (zwa- 
nego sprzężeniem  PCT).  Mimo,  że  z symetrią  tą, 
skoro  zawiera  ona  odwrócenie  czasu,  nie  wiąże  się 
żadna  stała  ruchu,  to  jest  ona  bardzo  ważnym  skład- 
nikiem teorii  cząstek.  Wymienione  wyżej  twierdzenie 
zapewnia  bowiem  równość  mas  cząstki  i antycząstki 
oraz  równość  ich  czasów  życia. 

Warto  zauważyć,  że  wykonanie  po  sobie  dwu  prze- 
kształceń symetrii  jest  znów  pewnym  przekształce- 
niem symetrii.  Przez  przekształcenie  symetrii  rozumie 
się  takie  przekształcenie,  które  nie  zmienia  opisu 
badanego  obiektu  fizycznego,  a więc  jest  zgodne  z sy- 
metrią tego  obiektu.  Za  przekształcenie  symetrii 
należy  też  uważać  przekształcenie  tożsamościowe. 
Nasuwa  się  więc  wniosek,  że  wszystkie  przekształce- 
nia symetrii  danego  układu  tworzą  grupę,  zwaną 
jego  grupą  symetrii. 

grupa  Wspomnieliśmy  poprzednio,  iż  najwięcej  praw 
symetrii  zachowania  wiąże  się  z oddziaływaniami  silnymi,  a na 
podstawie  obecnych  rozważań  wnioskujemy,  że 
układom  cząstek  oddziałujących  silnie  odpowiada 
najwięcej  przekształceń  symetrii.  Można  zatem  po- 
wiedzieć, że  oddziaływania  silne  są  najbardziej 
symetryczne,  mniej  symetryczne  są  oddziaływania 
elektromagnetyczne,  a jeszcze  mniej  — oddziaływa- 
nia słabe.  Najobszerniejsza  grupa  symetrii  charakte- 
ryzuje oddziaływania  silne,  a grupa  symetrii  oddzia- 
ływań elektromagnetycznych  jest  jej  podgrupą; 
podgrupą  zaś  jej  z kolei  jest  grupa  symetrii  oddzia- 
ływań słabych.  Wniosek  ten  wyciągnęliśmy  już  teraz, 
mimo,  że  nie  jest  jeszcze  znana  pełna  grupa  symetrii 
oddziaływań  silnych,  do  czego  przechodzimy  w na- 
stępnym punkcie. 


Izospin  i wyższe  grupy  symetrii 

Przy  wprowadzaniu  pojęcia  izospinu  stwierdzono, 
że  ma  on  własności  podobne  do  zwykłego  spinu.  Spin 
jest  momentem  pędu,  a zachowanie  momentu  pędu 
wiąże  się  z symetrią  względem  obrotów  w trójwy- 
miarowej przestrzeni  zmiennych  jr,  y,  z.  Analogicznie 


zachowanie  izospinu  wiąże  się  z symetrią  względem 
obrotów  w trójwymiarowej  izoprzestrzeni. 

Okazuje  się  jednak,  że  takie  ujęcie  teorii  zarówno 
momentu  pędu  jak  i izospinu  nie  jest  dogodne.  Nie- 
dogodność ta  pojawia  się  z chwilą  wprowadzenia 
cząstek  o spinie  połówkowym.  Wydaje  się  oczywiste, 
że  obroty  o kąt  0 i 2k  są  geometrycznie  równoważne. 
Dla  cząstek  o spinie  całkowitym  obroty  te  są  sobie 
równoważne  także  fizycznie,  gdyż  funkcja  falowa  ta- 
kich cząstek  po  obrocie  o kąt  2k  nie  zmienia  się. 
Inaczej  jest  dla  cząstek  o spinie  połówkowym,  gdyż 
obrót  o kąt  2 n zmienia  znak  funkcji  falowej  tych 
cząstek  i dopiero  obrót  o kąt  4rc  jest  równoważny 
nie  tylko  geometrycznie  ale  i fizycznie  obrotowi 
o kąt  0.  W celu  uniknięcia  tej  dwuznaczności  wprowa- 
dzono zamiast  grupy  obrotów  w trójwymiarowej 
przestrzeni  zmiennych  rzeczywistych  jc,  v,  z,  grupę 
przekształceń  unitarnych  unimodularnych  w prze- 
strzeni dwuwymiarowej  zmiennych  zespolonych, 
które  można  oznaczyć  £,  >].  Każde  przekształcenie 
tego  typu  zapisuje  się  w postaci 

£'  ~ Aa  £ T*  J/,  1 )'  = Ani  s 4 Ann  lh 

przy  czym  macierz  współczynników  w tym  prze- 
kształceniu A , 


spełnia  warunki  AfA  = 1 (unitarność). 


gdzie 


i Det(/I)  = 1 (unimodularność),  Det(/4)  oznacza  symetria 
wyznacznik  macierzy  A.  Grupę  takich  przekształceń  Só/(2) 
nazywamy  grupą  SU{ 2). 

Grupa  SU{ 2)  umożliwia  matematycznie  poprawne 
sformułowanie  teorii  momentu  pędu  i izospinu. 

Zachowanie  izospinu  jest  konsekwencją  symetrii 
teorii  względem  przekształceń  należących  do  izospi- 
nowej  grupy  SU( 2). 

W kwantowej  teorii  momentu  pędu  wykazuje  się, 
że  przy  dodawaniu  dwu  momentów  pędu,  Jx  i />, 

— «/,  liczba  kwantowa  J kwadratu  momentu 
pędu  J musi  spełniać  w-arunek 

Jx  /j,  ^ J ^ (12) 

Dodając  zatem  dwa  momenty  pędu  l/2  dostajemy  J 
wypadkowe  równe  0 lub  I . Podobnie  jest  oczywiście 
z izospinem.  Łatwo  można  się  przekonać,  że  dodając 
do  siebie  co  najmniej  2/-krotnie  izospin  V2  dostaje- 
my, jako  największą  wartość  wypadkowego  izospinu, 
izospin  /.  Izospin  x/2  odgrywa  podstawową  rolę 
w teorii  izospinu  jako  elementarna  cegiełka,  z której 
można  uzyskać  wszystkie  inne  wartości  /.  Innymi 
słowy,  każdy  multiplet  izospinu  może  być  zbudo- 
wany z dubletów. 

Omówioną  przed  chwilą  operację  składania  dwu 
izospinów  7a  można  wyrazić  w następującej  formie 

2$2=l©3,  (13) 

przy  czym  znak  mnożenia  i dodawania  zostały  wzięte 
w kółka  dla  zaznaczenia,  że  nie  chodzi  tu  o mnoże- 
nie i dodawanie  liczb  naturalnych  lecz  o składanie 
izospinów;  liczby  2,  1 i 3 odpowiadają  liczebnościom 
izomultipletów  o / — 72,  0 i 1.  Podobnie  można  na- 
pisać 

2©2®2  = 2©2e4.  (14) 

W miarę  wykrywania  coraz  to  nowych  cząstek  ele- 
mentarnych, głównie  hadronów,  zaczęły  się  ujaw- 
niać pewne  dalsze  podobieństwa  między  nimi,  które 
doprowadziły,  po  wielu  wcześniejszych  nieudanych  symetria 
próbach,  do  sformułowania  teorii  symetrii  51/(3)  SU( 3) 
oddziaływań  silnych. 

Podstawę  stanowiło  tu,  podobnie  jak  w wypadku 
izospinu,  grupowanie  się  hadronów  w pewne  rodziny, 
charakteryzujące  się  następującymi  własnościami: 
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rodziny  a)  do  tej  samej  rodziny  należą  hadrony  o tych  samych 

hadronów  wartościach  7,  P,  B\  b)  w skład  takiej  rodziny  wcho- 
dzi zawsze  cały  multiplet  izospinowy;  c)  wchodzące 
w skład  takiej  rodziny  izomultiplety  mają  na  ogół 
różne  wartości  / oraz  Y,  jednakże  zbiór  tych  wartości 
nie  wykazuje  żadnych  luk,  tj.  / zmienia  się  co 
a Y co  I ; d)  charakterystyczne  różnice  mas  między 
poszczególnymi  izomultipletami  są  w danej  rodzinie 
rzędu  ok.  100-300  MeV/c2;  e)  hadrony  należące 
do  tej  samej  rodziny  wykazują  analogiczne  własności 
z punktu  widzenia  oddziaływań  silnych  (np.  nukleon 
wiąże  się  z mezonem  n w nietrwały  stan  barionu  A 
o spinie  2/2  i parzystości  dodatniej,  a podobne  stany 
nietrwałe  powstają  też  z oddziaływania  z mezonem  n 
hiperonów  A i 3).  Liczebność  zaobserwowanych 
rodzin  wynosi  dla  wszystkich  hadronów  I i 8,  a dla 
barionów  ponadto  10. 

W 1961  r.  Gell-Mann  odkrył,  że  multiplety  o tej 
liczebności  pojawiają  się  właśnie  w symetrii  5£/(3). 
Jest  to,  jak  łatwo  odgadnąć  przez  analogię  z SU( 2), 
grupa  przekształceń  unitarnych  i unimodularnych, 
lecz  w przestrzeni  zespolonej  trójwymiarowej.  Ten 
dodatkowy  wymiar  przestrzeni  jest  potrzebny,  aby 
włączyć  hiperładunek  do  schematu  klasyfikacyj- 
nego. 

multiplety  W grupie  symetrii  5(/(3)  multipletem  podstawo- 
podstawowe  wym  jest  tryplet  podobnie  jak  w grupie  SU( 2)  — 
dublet.  Okazuje  się  jednak,  że  w odróżnieniu  od  grupy 
SU(2)  multiplet  podstawowy  istnieje  w dwu  odmia- 
nach — zwykłej,  oznaczonej  symbolem  3 oraz  sprzę- 
żonej, oznaczonej  przez  3.  Konieczność  wprowadze- 
nia takich  dwu  multipletów  można  uzasadnić  na- 
stępująco. W multiplecie  podstawowym  symetrii 
SU( 3)  powinien  tkwić,  jako  jego  część,  multiplet 
podstawowy  izospinu,  a więc  dublet.  Zatem  podsta- 
wowy tryplet  SU( 3)  musi  się  składać  z dubletu  i sing- 
letu  SU( 2).  Jednakże,  należy  tu  jeszcze  dodać  hiper- 
ładunek lub  dziwność,  jako  wielkość  dodatkowo 
definiującą  grupę  SU( 3).  Chcąc  budować  z multipletu 
podstawowego  5Ł/(3)  wyższe  multiplety  o różnych 
wartościach  nie  tylko  I ale  i 5,  trzeba  składowym 
multipletu  3 przyporządkować  jakąś  niezerową 
wartość  dziwności.  Gdyby  wszystkie  trzy  składowe 
3 miały  tę  samą  dziwność,  równą  np.  Si,  to  izospinow  i 
/ = 0 lub  też  / — l towarzyszyłaby  zawsze  dziwność, 
co  najmniej  równa  2 5X,  izospinowi  3/2  dziwność 
co  najmniej  35!  itd.  Tak  jednak  nie  jest.  Poza  tym 
powyższe  przyporządkowanie  spowodowałoby,  że 
pojawiłyby  się  tylko  multiplety  o dodatnim  5 (jeśli 
Si  > 0)  lub  ujemnym  5 (w  przeciwnym  razie).  Tym- 
czasem dziwności  ujemne  i dodatnie  występują  w przy- 
rodzie symetrycznie,  gdyż  jeśli  cząstka  ma  dziwność  5, 
to  jej  antycząstka  ma  dziwność  —5.  Tak  więc  po- 
winno się  skonstruować  multiplet  3 w taki  sposób, 
aby  wartość  5 dla  izodubletu  była  inna  niż  dla  izo- 
singletu,  oraz  oprócz  3 należy  wprowadzić  tryplet  3, 
o przeciwnych  wartościach  dziwności.  Łatwo  też 
zauważyć,  że  wartości  5 dla  izodubletu  i izosingletu 
należącego  do  3 powinny  się  różnić  o I.  Ostatecznie 
dokonujemy  przyporządkowania  tak,  iż  izodublet 
w 3 ma  5 = 0,  a izosinglet  w 3 ma  S = - 1,  nato- 
miast w 3 mamy  izodublet  o S ~ 0 i izosinglet 
o S = 4-1. 

W ramach  symetrii  SU( 3)  można  podać  wzory 
analogiczne  do  (13)  i (14).  Mamy  mianowicie: 

3®3=l©8  (15) 

oraz 

3®3©3  = 1©8@8©10.  (16) 

Z powyższych  wzorów  wynika,  że  istotnie,  w ramach 
symetrii  5t/(3)  pojawiają  się  — obok  wielu  innych  — 
także  multiplety  o liczebności  1,  8 i 10. 

Przyporządkowanie  znanych  hadronów  poszcze- 
gólnym multipletom  SU( 3)  na  ogół  nie  nastręcza 
większych  trudności.  I tak  np.  znamy  8 barionów 
o Jp  — * + , a mianowicie  neutron  i proton  (o  5 = 0 


czyli  Y = -^-1),  tworzące  dublet  izospinu,  hiperon  .1  oktet  bario- 
i trzy  hiperony  £ o S = — 1 (więc  Y = 0),  oraz  dwa  nów  i mezo- 
hiperony  3 o 5 = —2  (więc  Y = - I,  rys.  7).  Po-  nów 
dobnie  można  sklasyfikować  razem  — w ramach 
tego  samego  oktetu  — osiem  mezonów  o Jp  = 0“ 

(rys.  8).  Należą  do  niego  dwa  mezony  K o 5 = Y - 
— * I,  trzy  mezony  n i jeden  mezon  »/o5  Y 0 


Rys.  8.  Oktet  mezonów  Jp  - 0"  przedstawiony  w płaszczyźnie 
Y) 


oraz  dwa  mezony  K o S — Y — — 1 . Okazuje  się,  że 
struktura  wewnętrzna  oktetu  barionowego  i mezono- 
wego jest  identyczna,  jeśli  do  klasyfikacji  użyje  się  nic 
dziwności  lecz  hiperładunku.  Ta  sama  struktura 
cechuje  też  wszystkie  inne  oktety  symetrii  SU( 3). 

W pewnych  wypadkach  obserwujemy  więcej  czą- 
stek niż  np.  osiem,  o tych  samych  wartościach  7,  P, 

B.  Powstaje  wtedy  pytanie,  jakimi  kryteriami  należy 
się  kierować,  aby  we  wspólnym  multiplecie  umieścić 
te  a nie  inne  cząstki.  Wówczas  należy  uciec  się  do 
rozważań  ilościowych  opartych  na  pewnych  założe- 
niach dynamicznych. 

Jeśli  chodzi  o dekuplet  10,  to  zaliczamy  tu  cztery  dekupiet 
bariony  A(Y  — 4-1),  trzy  bariony  K*  (1385)  o K—  barionów 
— 0,  dwa  bariony  3*  (1520)  o Y = — 1 i wreszcie 
jeden  barion  Q~  o Y = -2  (rys.  9).  Wtedy  gdy  sfor- 
mułowano hipotezę  że  symetria  SU( 3)  jest  symetrią 
świata  hadronów,  hiperon  O nie  był  jeszcze  znany 
z doświadczenia.  Podobnie  jednak,  jak  to  było  z tabli- 
cą Mendelejewa,  symetria  SU( 3)  przewidywała  dla 
tego  hiperonu  wolne  miejsce  właśnie  w ramach  de- 
kupletu.  Późniejsze  odkrycie  tej  cząstki  było  więc 
poważnym  sukcesem  teorii,  tym  bardziej,  że  była  przewidzenie 
ona  w stanie  przewidzieć  także,  i to  z bardzo  dobrą  hiperonu  Q 
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dekuplet 

•10 


symetria 
SU(  4) 


multiplet 

20, 


Rys.  9.  Dckuplet  barionów  Jp  - v‘  przedstawiony  na  płaszczy- 
źnie C/3ł  Y) 


dokładnością  masę  Q~  na  podstawie  wzoru  masowego 
Gell-Manna-Okubo. 

Wiele  przesłanek  przemawia  za  tym,  że  w rzeczy- 
wistości grupa  symetrii  SU{  3)  nie  jest  najszerszą  grupą 
symetrii  hadronów.  Ogólniejszą  mogłaby  być  grupa 
SU( 4)  lub  może  nawet  jeszcze  wyższa  (5(7(6)).  Roz- 
ważając grupę  5f/(4),  musimy  znów  wprowadzić  pe- 
wien wymiar  cząstek  elementarnych,  a więc  nową, 
analogiczną  do  hiperładunku  liczbę  kwantową;  taką 
liczbą  może  być  powab  C.  Zatem  podstawowy  multi- 
plet symetrii  5£/(4)  byłby  czeroskładnikowy,  i zawie- 
rałby — oprócz  podstawowego  trypletu  symetrii  SU (3) 
— jeszcze  singlet  o C = 1.  Prawa  analogiczne  do  (15) 
i (16)  miałyby  wtedy  postać: 

4®4=1©15  (17) 

oraz 

4©4®4  = 4©201©201©202.  (18) 

1 w tym  wypadku  trzeba  wprowadzić  oprócz  4 multi- 
plet sprzężony  4,  w którym  dodatkowy  izosinglet 
ma  C = — 1.  Zauważmy  przy  tym,  że  w prawie 
wyrażonym  wzorem  (18)  występują  dwa  różne  multi- 
plety dwudziestowymiarowe,  odróżnione  od  siebie 
dolnym  wskaźnikiem  1 i 2.  Multiplety  te  mają  całko- 
wicie odmienną  strukturę.  W 20x  jest  zawarty  oktet 
symetrii  5(7(3)  o C = 0,  a poza  tym  sekstet  5(7(3) 


Rys.  II.  Multiplet  20;  symetrii  SU( 4)  obejmujący  bariony  o 
Jp  — a+.  W multiplecie  tym  w płaszczyźnie  C - • 0 znajduje  się 
dekuplet  10  symetrii  Inne  cząstki  należące  do  202  nie 

zostały  jeszcze  wykryte 


Rys.  12.  Multiplet  15  symetrii  SL(4).  Ma  on  tę  samą  budowę  nie- 
zależnie od  wartości  Jr.  Dla  mezonów  o Jp  = I w płaszczyźnie 
C — 0 znajdowałyby  się  następujące  cząstki:/?-,  /?°,  p\  <p,  w,  J V 
K*\  K*+ . K*°,  K*~ 


multipiiet 

20; 


multiplet 

15 


{§)  stany  obsadzone  przez  2 cząstki 

Rys.  10.  Multiplet  20Ł  symetrii  SU(4)  przedstawiony  w przestrzeni 
zmiennych  (/3.  Y.  C ).  Multiplet  ten  obejmuje  oktet  barionów, 
położony  w płaszczyźnie  C -=  0,  oraz  jeden  sekstet  o C =*  -*-J, 
jeden  tryplet  o C - 1 i wreszcie  jeden  tryplet  oC  «2.  Niektóre 
cząstki  należące  do  multipletów  C dL  Ó zostały  już  z zupełną 
pewnością  zidentyfikowane  w doświadczeniu.  Wszystkie  bariony 
należące  do  tego  multipletu  miałyby  Jp  — ■§* 


0 C = -4-1,  i dwa  tryplety  odpowiednio  o C = i-I 

1 C = 4-2  (rys.  10).  Natomiast  w 20>  mieści  się  de- 
kuplet 5(7(3)  o C = 0,  a poza  tym  sekstet  SU( 3) 
oC=  4-1,  tryplet  5(7(3)  o C = 42  i wreszcie  singlet 
5(7(3)  o C — 43  (rys.  11).  Struktura  multipletu  15 
obejmującego  mezony  (podczas  gdy  20i  i 202  obejmo- 
wałyby bariony)  jest  przedstawiona  na  rys.  12. 
Multiplet  ten  zawierałby  oprócz  oktetu  symetrii 
SU (3)  o C = 0 także  dwa  tryplety  odpowiednio 
o C — 4 1 i C = — 1 oraz  dodatkową  cząstkę  nie- 
powabną,  singlet  oC  = 0.  Gromadzenie  bezpośred- 
nich dowodów  doświadczalnych  występowania  sy- 
metrii 5£/(4)  rozpoczęło  się  w gruncie  rzeczy  od 
wykrycia  mezonu  Jjy,  który  interpretuje  się  jako  czą- 
stkę związaną  z tym  właśnie  dodatkowym  singletem 
niepowabnym  symetrii  5£/(4). 

W poprzednich  punktach  wspominaliśmy  o tym,  że 
różnice  mas  wiążące  się  z poszczególnymi  oddziały- 
waniami powiększają  się  wraz  ze  wzrostem  siły  od- 
działywania. Schemat  ten  można  by  rozbudowywać  po 
przejściu  do  symetrii  SU{ 4).  Istotnie,  różnice  mas 
mogą  być  jeszcze  większe.  Na  przykład  cząstka  J y/, 
która  byłaby  analogiem  cząstki  <p,  lecz  należałaby  do 
innego  multipletu  symetrii  5(7(3),  pozostając  w tym 
samym  multiplecie  symetrii  5£/(4)  różniłaby  się  od 
niej  masą  aż  o ok.  2 GeV/c2. 

Podsumowując  te  rozważania,  można  obecnie 
lepiej  uzasadnić  pogląd,  że  im  większe  jest  natężenie 
oddziaływania,  tym  większa  też  jest  jego  symetria. 
Mogliśmy  tę  zastanawiającą  regularność  śledzić 


94 


własność* 

kwarków 


tryplet 

kwarków 


poczynając  od  oddziaływań  podsłabych  do  oddziały- 
wań bardzo  silnych. 


Kwarki 

Jest  rzeczą  zastanawiającą,  że  znane  z doświadczenia 
cząstki  wypełniają  tak  niewiele  różnych  multipletów 
symetrii  SU( 3) : mezony  tylko  1.  i 8,  a bariony  tylko 
1,  8 i 10.  Nie  są  zatem  wykorzystane  przez  przyrodę 
(przynajmniej  w obrębie  cząstek  niepowabnych) 
inne  liczne  możliwości,  włączając  tu,  co  jest  może 
szczególnie  dziwne,  także  multiplet  podstawowy 
SU( 3),  a mianowicie  triplety  3 i 3.  Z wzorów  (15) 
i (16)  wynika,  że  te  i tylko  te  multiplety,  które  są 
obsadzone  w naturze  można  zbudować  w wypadku 
mezonów  z multipletów  3 i 3,  a w wypadku  barionów 
z trzech  trypletów  3.  Załóżmy  więc,  że  multiplet  3 
jest  obsadzony  przez  hipotetyczne  cząstki  o spinie  1f2 
zwane  kwarkami  (3  obsadzałyby  więc  anty  kwarki). 
B dla  kwarków  wynosiłoby  7a-  Wówczas,  trzy  kwarki 
miałyby  łącznie  B = 1,  a kwark  i antykwark  — B = 
= 0,  przy  czym  układy  trzy  kwarkowe  miałyby  spin 
połówkowy,  a dwukwarkowe  — całkowity. 

Założenie  to  wywołuje  dalsze  nieoczekiwane  kon- 
sekwencje. Po  pierwsze,  dostajemy  wówczas  także 
ułamkowe  wartości  dla  hiperładunku  i ładunku  elek- 
trycznego kwarków.  I tak  np.  dla  dubletu  kwarków 
o / = Va  (oraz  5 = 0)  mamy  Y = V3,  natomiast  dla 
singletu  1 = 0 (i  5 = — 1) — Y = — 2/3.  Po  drugie, 
ze  wzoru  Gell-Manna-Nishijimy  wynika  zaś,  że  ła- 
dunki kwarków  są  wielokrotnościami  nie  ładunku  ele- 
mentarnego e,  lecz  el$  (patrz  tabela  poniżej,  rys.  13). 


Rys.  13.  Multiplet  podstawowy  symetrii  51/(3)  — trypletu  kwar- 
ków, przedstawionego  w płaszczyźnie  (/,,  Y ) 


Liczby  kwantowe  kwarków 


Symbol 

kwarku 

B 
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F 

C 

Bf 

' 1 

Q 

u 

1/3 

0 

1/3 

0 

0 

1/2 

+ 1/2 

2/3 
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1/3 

0 

1/3 

0 

0 

1/2 

-1/2 

jf—  1/3 
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1/3 

-1 

-2/3 

0 

0 

0 

0 

-1/3 
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1/3 

0 

1/3 

1 

0 

0 

0 

2/3 

b 

1/3 

0 

1/3 

0 

-1 

0 

0 

-1/3 

Fakt  ten  rokuje  nadzieje  na  możliwość  wykrycia 
kwarków  swobodnych,  gdyż,  zgodnie  z prawem  za- 
chowania ładunku,  cząstki  o ładunku  ułamkowym  nie 
mogą  się  rozpadać  na  cząstki  o ładunkach  wyłącznie 
całkowitych.  Tak  więc  co  najmniej  jeden  kwark  po- 
wiiien  być  cząstką  trwałą,  stosunkowo  łatwą  do  wy- 
krycia. Jednakże  dotychczasowe  poszukiwania  nie 
dały  żadnego  wyniku.  Brak  danych  potwierdzających 
istnienie  kwarków  swobodnych  można  wyjaśniać 
jedną  z czterech  możliwych  hipotez. 

Pc  pierwsze,  kwarki  mogą  być  cząstkami  bardzo 
ciężkimi  (obecnie  dolna  granica  eksperymentalna 
byłaby  dla  cząstek  silnie  oddziałujących  rzędu  10 
GeV/c2).  Gdyby  tak  było  używane  obecnie  akcelera- 


tory nie  mogłyby  ich  wyprodukować.  Po  drugie,  kwar- 
ki mogłyby  być  cząstkami  stosunkowo  lekkimi,  ale 
nie  oddziałującymi  dostatecznie  silnie  (wówczas 
byłyby  one  wytwarzane  rzadko  i szansa  ich  zaobser- 
wowania byłaby  odpowiednio  mniejsza).  Po  trzecie, 
być  może  kwarki  w ogóle  nie  istnieją.  Po  czwarte 
vyreszcie,  być  może  kwarki  mogą  istnieć  wyłącznie 
w stanie  związanym,  a więc  wewnątrz  hadronów. 

Żadna  z wymienionych  hipotez  nie  może  być  w tej 
chwili  odrzucona.  Jednakże  druga  z nich  przedstawia 
się  dziwacznie:  oto  cząstki  zbudowane  z kwarków 
mogłyby  oddziaływać  silniej  niż  ich  składniki.  Także 
i pierwsza  hipoteza  nie  jest  najlepsza.  Bardzo  ciężki 
kwark  wiążąc  się  w stosunkowo  lekki  barion  musiałby 
tracić  ogromną  część  swej  masy  na  wiązanie.  Tak 
duża  energia  wiązania  wskazywałaby  na  ogromną 
siłę  oddziaływań  wiążących  kwarki.  Kwarki  takie 
musiałyby  mieć  same  bardzo  skomplikowaną  struk- 
turę chmury,  co  trochę  nie  jest  zgodne  z przedsta- 
wianiem ich  jako  obiektów  elementarnych.  W każdym 
razie  wtedy  teoria  kwarka  musiałaby  być  może  nawet 
bardziej  skomplikowana  niż  teoria  hadronu.  Poza 
tym  taka  chmura  dawałaby  zapewne  bardzo  duży 
wkład  do  momentu  magnetycznego  kwarka  (-►  Od- 
działywania elektromagnetyczne),  i to  momentu 
anomalnego,  polowego.  Ten  wniosek  jest,  jak  się 
wydaje,  niezgodny  z prostym  modelem,  z którego 
można  obliczyć  momenty  magnetyczne  nukleonów, 
zakładając  pewien  efektywny  moment  magnetyczny 
kwarków.  Trzecia  koncepcja  także  nie  znalazłaby 
obecnie  zbyt  wielu  zwolenników,  gdyż  wiele  prostych, 
nawet  jakościowych  przewidywań  modelu  kwarko- 
wego jest  zdumiewająco  zgodnych  z faktami  doświad- 
czalnymi. 

Pozostaje  więc  hipoteza  czwarta,  kwarków  uwięzio- 
nych wewnątrz  hadronu.  Jaka  miałaby  być  jednak 
przyczyna  tego  uwięzienia,  nie  jest  łatwo  ustalić,  to- 
też sformułowanie  konsekwentnej  teorii  opartej  na 
tej  hipotezie  jest  dalekie  od  zakończenia. 

Przejście  do  modelu  opartego  na  symetrii  5C/(4) 
wymaga  powiększenia  liczby  kwarków  do  czterech. 
Czwarty  kwark  byłby  kwarkiem  powabnym,  o C = 
= 4- 1 (tabela  obok  i rys.  14).  Przejście  do  jeszcze  wyż- 
szych symetrii  pociąga  za  sobą  dalsze  rozszerzenie 
liczby  kwarków. 


Rys.  14.  Multiplet  podstawowy  symetrii  5t/(4)  — kwartetu 
kwarków  przedstawionego  w przestrzeni  zmiennych  (/3,  Y,  C ) 

Patrząc  na  rozmaite  możliwe  podklasy  oddziały- 
wań silnych  z punktu  widzenia  modelu  kwarkowego, 
dostrzegamy  inną  możliwość  wyjaśnienia  łamania  sy- 
metrii SU( 3)  a także  5£/( 4).  Można  bowiem  przyjąć, 
że  oddziaływania  kwarków  są  w pełni  zgodne  z zasa- 
dami symetrii  SU( 3)  czy  też  SU( 4),  ale  że  kwarki 
te  mają  różne  masy  niepolowe.  Kwark  dziwny  byłby 
wówczas  cięższy  od  kwarków  niedziwnych  o ok.  200- 
300  MeV/c2,  kwark  powabny  od  kwarków  niepo- 
wabnych o ok.  1-2  GeV/c2. 

Gdyby  hipoteza  kwarków  uwięzionych  okazała  się 
poprawna,  pytanie,  która  z wyżej  wymienionych  kon- 
cepcji łamania  wyższych  symetrii  jest  słuszna,  miałoby 
charakter  w znacznym  stopniu  akademicki.  Nie  ma- 
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jąc  do  dyspozycji  kwarków  swobodnych,  nie  mogli- 
byśmy z sensem  mówić  o ich  masie,  a tylko  o ich 
masie  efektywnej  wewnątrz  hadronu. 

Jednym  ze  sprawdzianów  ogólnej  poprawności 
obrazu  kwarkowego  jest  zagadnienie  istnienia  cząstek 
egzotycznych.  Mianem  tym  określa  się  ogólnie  takie 
cząstki,  które  by  były  składnikami  innych  multiple- 
cząstki  tów  symetrii  SU( 3)  poza  singletem  i oktetem  dla 
egzotyczne  mezonów  oraz  singletem,  oktetem  i dekupletem  dla 
barionów.  Przykładami  cząstek  egzotycznych  byłyby: 
a)  mezon  niedziwny  podwójnie  naładowany  o / = 2 
lub  więcej;  b)  mezon  dziwny  o / = 3/2;  c)  barion 
o S = +1.  Żadna  jednak  z tych  cząstek  (ani  innych 
cząstek  egzotycznych)  nie  została  wykryta.  Gdyby 
to  w przyszłości  nastąpiło,  to  nie  musielibyśmy  re- 
zygnować z modelu  kwarkowego,  a tylko  rozszerzyć 
schemat  budowy  hadronów  z kwarków.  Oprócz 
układów  kwark-antykwark  lub  też  trzy  kwarki  na- 
leżałoby dopuścić  np.  układy  dwa  kwarki  i dwa  anty- 
k warki  czy  też  cztery  kwarki  i jeden  anty  kwark. 
Wobec  tego  niewystępowanie  w przyrodzie  cząstek 
egzotycznych  przemawia  nie  tylko  za  modelem 
kwarkowym,  ale  także  dodatkowo  za  pewnym  kon- 
kretnym schematem  budowy  hadronów  z kwarków. 

Sytuacja  jednak  nie  może  być  tak  prosta,  jakby 
to  wynikało  z poprzednich  uwag.  I rzeczywiście, 
między  kwarkami  muszą  przecież  działać  jakieś  siły, 
skoro  łączą  się  one  w układy  o takim  stopniu  trwałości 
jak  hadrony.  Musi  to  więc  być  jakieś  nowe  pole  odpo- 
wiadające tym  siłom  oraz  cząstki,  które  by  mogły  być 
wymieniane  między  kwarkami.  Takie  hipotetyczne 
gluony  obiekty  nazywa  się  gluonami.  Byłyby  to  cząstki 
o B = Q = C = S=  I=  L = 0 oraz  Jp  = 1~. 
Ta  ostatnia  własność  gluonów  wynikałaby  z założe- 
nia, iż  fundamentalną  rolę  w przenoszeniu  oddziały- 
wań odgrywają  właśnie  cząstki  fotonopodobne. 
(Również  bozon,  czy  też  bozony  przenoszące  oddzia- 
ływania słabe  miałyby  Jp  — 1“).  Posuwając  się  o krok 
dalej  należałoby  powiedzieć,  iż  skoro  istnieją  gluony, 
zdolne  do  oddziaływań  z kwarkami,  to  niewątpliwie 
wewnątrz  hadronu  zachodzą  też  procesy  wirtualn*' 
kreacji  par  kwark-antykwark  z gluonów.  Hadron 
byłby  więc  bardzo  skomplikowaną  strukturą,  w któ- 
rej występowałyby : a)  zespół  kwarków  i antykwarków 
decydujący  o własnościach  hadronu  z punktu  widze- 
nia symetrii  5'f/(3),  a więc  o jego  zdolności  do  wcho- 
dzenia w oddziaływania  silne  (te  kwarki  nazywamy 
często  walencyjnymi);  b)  gluony;  c)  wiele  („morze”) 
par  kwark-antykwark  w takich  samych  stanach  jak 
gluony,  a więc  oC  = S=  Q = f = 0.  Oczywiście  pary 
te,  będąc  singletami  St/(3),  nie  naruszałyby  przypo- 
rządkowania danego  hadronu  do  określonego  multi- 
pletu tej  symetrii. 

Przedstawienie  hadronów  jako  układów  zbudowa- 
nych z kwarków  walencyjnych,  gluonów  oraz  par 
kwark-antykwark  należących  do  „morza”,  jest 
w ogólnych  zarysach  potwierdzone  przez  dane 
doświadczalne  dotyczące  zderzeń  głęboko  nieela- 
stycznych leptonów  z hadronami. 


Kolor  jako  nowa  liczba  kwantowa 

Do  rozwiązania  pozostał  jeszcze  niezmiernie  skompli- 
kowany problem  dynamiczny:  jak  kwarki  wiążą  się 
w hadronie  i czy  rzeczywiście  powinny  one  być  w nim 
całkowicie  uwięzione.  Pochodzenie  sił  działających 
między  kwarkami  jesttrudnedo rozszyfrowania.  Jedną 
z trudności  stanowi  konieczność  zrozumienia,  dlacze- 
go układy  dwukwarkowe  są  wiązane  słabo  (jeśli  już 
w ogóle),  natomiast  układy  trzykwarkowe  — mocno, 
tak  że  tworzą  bariony.  Siły  kwark-kwark  nie  są  więc 
z jakichś  powodów  wystarczająco  silne  w układach 
dwukwarkowych.  Czy  są  to  wobec  tego  siły  głównie 
trzyciałowe?  Jak  fakt  ten  uwzględnić  w dynamicznej 
teorii  kwarków? 

Dodatkową  komplikacją  są  niezwykłe  własności 
symetrii  funkcji  falowej  w'  związanych  układach  trzy- 


kwarkowych.  Wszystkie  cząstki  o spinie  połówkowym,  trudności  j 
a więc  i kwarki  powinny  spełniać  zasady  statystyki  dynamicznej 
Fermiego-Diraca.  Funkcja  falowa  układu  fermionów  teorii  kwar- 
powinna  być  całkowicie  antysymetryczna  względem  Jców 
zamiany  dwu  fermionów  należących  do  tego  układu. 

Na  te  własności  symetrii  funkcji  falowej  składają 
się  w wypadku  kwarków  związanych  w barionie 
własności  symetrii:  — względem  przestawienia  liczb 
kwantowych  odpowiadających  symetrii  S(J( 3),  — 
względem  przestawienia  zmiennych  spinowych  oraz  — 
względem  zamiany  położeń.  Z punktu  widzenia  dy- 
namicznej struktury  oddziaływań  kwark-kwark  inte- 
resujący jest  przede  wszystkim  ten  ostatni  czynnik 
w funkcji  falowej.  Pewne  informacje  na  ten  temat 
można  uzyskać  w następujący  sposób.  Załóżmy,  że 
wszystkie  hadrony  zbudowane  z kwarków  niepo- 
wabnych  tworzą  multiplety  symetrii  5f/(6),  na  którą 
składają  się  symetria  SU( 3)  oraz  symetria  S(J( 2) 
zwykłego  spinu.  Podstawowy  multiplet  tej  symetrii 
SU(  6)  — zgodnie  z ogólnymi  regułami  — będzie 
mieć  6 składowych,  przy  czym  jako  jedną  składową 
traktuje  się  jeden  kwark  znajdujący  się  w określonym 
stanie  spinowym.  Ponieważ  spin  kwarku  z założenia 
wynosi  1U>  przeto  każdy  kwark  może  występować 
w dwu  stanach  spinowych  Jz  = + 72  oraz  Jz  = 7* 

Okazuje  się,  że: 

6®Ś  = 1©35,  (19) 

6^606  = 20©  56©  70©  70.  (20) 

Tak  więc  wszystkie  stany  mezonowe  powinny  nale- 
żeć do  multipletów  1 i 35  symetrii  S£/(6),  a wszystkie 
stany  barionowe  do  jednej  lub  więcej  rodziny  spo- 
śród 20,  56  i 70.  Na  multiplet  35  składa  się  oktet 
St/(3)  o spinie  0 (8  stanów),  plus  singlet  SU( 3)  o spi- 
nie 1 (3  stany,  bo  spin  1 ma  trzy  możliwe  ustawienia), 
i wreszcie  oktet  SU( 3)  też  o spinie  1,  a więc  łącznie 
24  stany.  Spośród  multipletów  barionowych  na 
szczególną  uwagę  zasługuje  multiplet  56,  mieszczący 
w sobie  oktet  SU( 3)  o spinie  7*  (16  stanów)  i dekuplet 
SU(3)  o spinie  3/s  (40  stanów).  Jest  rzeczą  naturalną 
zaliczenie  do  tego  multipletu  symetrii  St/(6)  znanego 
dekupletu  barionowego  zawierającego  m.in.  bariony 
A oraz  oktetu  barionowego  zawierającego  m.in. 
nukleony. 

Można  jednak  sprawdzić,  że  multiplet  symetrii 
SU( 6)  o wymiarze  56  jest  opisywany  funkcją  falową 
całkowicie  symetryczną  względem  przestawień  stopni 
swobody  kwarków  odpowiadających  grupie  St/(3) 
i grupie  SU( 2)  zwykłego  spinu.  Tym  samym  funkcja 
falowa  zarówno  nukleonów  jak  i barionów  z dekup- 
letu musi  mieć  część  przestrzenną  antysymetryczną 
względem  przestawień  położeń  kwarków.  Z drugiej 
jednak  strony  jest  to  stan  o najniższej  energii  układu 
trzech  kwarków  (nie  ma  lżejszych  barionów),  a więc 
stan  zwany  stanem  podstawowym.  Największa  trud- 
ność polega  na  tym,  że  nikomu  nie  udało  się  skon- 
struować takiego  potencjału  oddziaływania,  który  by 
dawał  antysymetryczną  funkcję  falową  (przestrzenną) 
w stanie  podstawowym. 

Tę  trudność  dynamicznej  teorii  kwarków  można 
ominąć,  zakładając,  że  mają  one  jeszcze  jeden  sto- 
pień swobody,  który  należy  włączyć  do  rozważań 
nad  symetrią  układów  trójkwarkowych.  Ten  dodat- 
kowy stopień  swobody  nazywa  się  kolorem.  Zgodnie 
z tą  hipotezą  kwarki  mogłyby  istnieć  w trzech  kolo- 
rach, których  zespół  tworzyłby  multiplet  podsta-  grupa  koloru 
wowy  nowej  grupy  SU( 3),  zwanej  grupą  koloru, 
niezależnej  od  poprzednio  wprowadzonej  grupy 
SU( 3)  izospinowo-hiperładunkowej. 

Najczęściej  zakłada  się,  że  wszystkie  cząstki  obser- 
wowane w przyrodzie  są  singletami  symetrii  S(J( 3) 
koloru,  a więc,  są  cząstkami  białymi.  Zagadnienie 
istnienia  hadronów  kolorowych  i możliwości  wykry- 
cia ich  doświadczalnie  w przyszłości  jest  otwarte,  choć 
obecnie  przeważa  pogląd,  że  kolor  jest  liczbą  kwan- 
tową wewnątrzhadronową,  która  na  zewnątrz  nie 
może  się  ujawnić.  Natomiast  koncepcja  koloru  jest 
właściwym  rozwiązaniem  zagadnienia  budowy  bario- 
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nów  białych:  singlet  SU( 3)  jest  bowiem  opisywany 
funkcją  falową  całkowicie  antysymetryczną.  Antysy- 
metria  funkcji  falowej  układu  trzech  kwarków  byłaby 
więc  przesunięta  z części  przestrzennej  na  część  kolo- 
rową tej  funkcji.  Hipoteza  koloru  znajduje  także 
pośrednie  potwierdzenie  w danych  doświadczalnych 
dotyczących  anihilacji  par  elektron-pozyton  w obsza- 
rze bardzo  wysokich  energii.  Wprowadzenie  grupy 
SU( 3)  koloru  jako  symetrii  (ścisłej !)  świata  hadronów 
jest  dodatkowym  elementem  świadczącym  o wysokiej 
symetrii  oddziaływań  silnych. 

Często  uogólnia  się  pojęcie  koloru,  tworząc  kolor 
czwarty,  leptonowy.  W takiej  koncepcji  podstawowe 
dwie  grupy  symetrii  cząstek  elementarnych  byłyby 
grupą  St/(4)  (grupą  koloru  — trzy  kolory  kwarkowe 
i jeden  leptonowy)  oraz  grupą  izospinowo-hiper-ła- 
dunkowo-powabną  SU(ri)  ( n = 6?).  W tym  jednoli- 
tym obrazie  świat  byłby  zbudowany  z 16  fermionów 
(4  leptonów  oraz  4 kwarków  w trzech  odmianach  ko- 
loru każdy)  oraz  z kilku  cząstek  o Jp  — 1“  (byłyby  to 
fotony,  gluony  oraz  bozony  przenoszące  oddziaływa- 
nia słabe),  składających  się  na  dynamikę  układów 
fermionów. 

Wspominaliśmy  już  o próbach  dodania  do  4 kwar- 
ków jeszcze  dwu  dalszych  kwarków,  cięższych  nawet 
od  kwarka  powabnego.  Wówczas  musielibyśmy  ocze- 
kiwać wykrycia  nowych  cząstek  o niezwykłych  własno- 
ściach. Na  ślad  jednej  z nich  (odpowiednika  cząstki 
Jjrp)  udało  się  już  natrafić.  Jest  to  bardzo  ciężki  me- 
zon o masie  ponad  9,4G  eY/c2,  niedawno  zaobser- 
wowany. Niezależnie  od  tych  sugestii  rozszerzyła  się 
lista  leptonów  do  6 przez  dodanie  do  czterech  znanych 
leptonów  jeszcze  dwu  lepton  ów,  jednego  o masie  1782 
GeV/c2  (lepton  r)  i drugiego  o masie  bardzo  małej 
(neutrino  taonowe).  Nie  jest  więc  wykluczone,  że  na- 


leży konstruować  świat  z 24  rozmaitych  fermionów, 
a mianowicie  6 leptonów  i 6 kwarków,  z których  każdy 
występowałby  w trzech  stanach  koloru. 

Jak  wynika  z powyższych  danych,  fizyka  cząstek 
elementarnych  znajduje  się  wciąż  na  etapie  wstępnym, 
mimo  ogromnych  osiągnięć.  Podstawową  jej  wadą 
jest  brak  aparatu  teoretycznego,  który  by  umożliwiał 
wykonanie  obliczeń,  sprawdzających  w jednoznaczny 
sposób  konkretne  hipotezy  budowy  cząstek  i ich 
oddziaływań.  Istnieje  oczywiście  wiele  rozmaitych 
metod  rachunkowych  opierających  się  na  mniej  czy 
bardziej  wiarygodnych  założeniach.  Często  mają 
one  zastosowanie  do  jednego  tylko  rodzaju  oddziały- 
wań, a nawet  do  jeszcze  węższego  kręgu  zjawisk. 

Mimo  tego  braku,  z istniejących  danych  doświad- 
czalnych oraz  koncepcji  teoretycznych  wyłania  się 
coraz  lepiej  uporządkowany  obraz  świata  cząstek 
elementarnych,  zawierających  więcej  czynników  uni- 
fikacyjnych. Niewątpliwie  największym  osiągnięciem 
w tej  dziedzinie  jest  sformułowanie  teorii  ujmującej 
wspólnie  oddziaływania  słabe  i elektromagnetyczne. 
To  postępujące  porządkowanie  koncepcji  dotyczą- 
cych cząstek  elementarnych  jest  nierozerwalnie  zwią- 
zane z hipotezą  kwarków.  Jest  ona,  niezależnie  od 
wciąż  jeszcze  ogromnych  trudności  pojęciowych 
i matematycznych,  niewątpliwie  jednym  z najważniej- 
szych składników  obecnego  obrazu  cząstek  elementar- 
nych i ich  oddziaływań.  Na  razie  trudno  sobie  wy- 
obrazić, aby  przyszła  teoria  cząstek  elementarnych 
mogła  się  obejść  bez  pojęcia  kwarku. 

G.  Białkowski,  R.  Sosnowski  Cząstki  elementarne.  Warsza- 
wa 1971;  B.H.  Bransden,  D.  Evans,  J.V.  Major  Cząstki  ele- 
mentarne, Warszawa  1981;  I.J .J.Kokkedee  The  Quark  Model, 
New  York  1969  (ros.  Moskwa  1971);  Mezony,  grawitacja,  anty- 
materia, Warszawa  1962;  J.  Nowożyłow  Cząstki  elementarne. 
Warszawa  1961. 


Struktura  cząstek  elementarnych 

Michał  Święckt 


Mówiąc  o strukturze  badanego  ciała,  mamy  zwykle 
na  myśli  jego  skład.  Wiemy  np.,  że  kawałek  żelaza 
składa  się  z atomów,  które  z kolei  składają  się  z elek- 
tronów i jąder  atomowych.  Te  ostatnie  są  również 
obdarzone  strukturą  — składają  się  z protonów  i neu- 
tronów. Wydaje  się,  że  moglibyśmy  rozkładanie 
struktur  na  ich  składniki  kontynuować  bez  istotnych 
zmian  natury  metodologicznej.  Jednak  gdy  przecho- 
dzimy do  obiektów  niesłychanie  małych,  jakimi  są 
cząstki  elementarne  (->  Cząstki  elementarne  i ich 
oddziaływania),  ta  wydawałoby  się  naturalna  metoda 
postępowania  przestaje  być  prosta  i łatwa.  Jest  tak 
dlatego,  że  dla  obiektów  o rozmiarach  rzędu  np.  10"15 
m i charakterystycznych  czasach  trwania  oddziały- 
wań rzędu  np.  10" 24  s intuicyjny  opis  klasyczny 
zupełnie  zawodzi.  Obserwowane  w doświadczeniach 
zachowanie  się  cząstek  elementarnych  ma,  jak  się 
okazuje,  charakter  czysto  statystyczny.  Statystyczna 
jest  też  teoria,  za  pomocą  której  z ogromnym  po- 
wodzeniem opisujemy  wyniki  tych  doświadczeń. 
Teorią,  którą  mamy  na  myśli  jest  oczywiście  mecha- 
nika kwantowa  a właściwie  kwantowa  teoria  pola 
(-►  Teoria  pola.  Oddziaływania  elektromagnetyczne). 


Statystyczny  charakter  struktury  cząstek 

Wróćmy  do  kawałka  żelaza.  Podgrzany  do  odpowied- 
niej temperatury  zaczyna  świecić,  czyli  promieniować 
świetlne  fale  elektromagnetyczne.  Emisja,  a także 
absorpcja  światła  odbywa  się  zawsze  porcjami, 
które  zwiemy  fotonami.  Tak  więc  rozżarzony  (i  nie 
tylko)  kawałek  żelaza  promieniuje  fotony.  Można 
by  się  więc  zapytać,  z ilu  fotonów  składa  się  ten 
kawałek.  Jest  rzeczą  oczywistą,  że  nie  potrafimy  podać 


żadnego  rozsądnego  sposobu  pomiaru  tej  liczby. 
Możemy  ją  określić  jedynie  statystycznie,  szacując 
np.  średnią  liczbę  fotonów  na  jednostkę  czasu.  Zu- 
pełnie podobnie  jest  w wypadku  struktury  protonów, 
neutronów  i innych  cząstek.  Skład  ich  możemy  okreś- 
lić jedynie  statystycznie,  podając  prawdopodobień- 
stwo (na  jednostkę  czasu)  wystąpienia  pewnej  struk- 
tury. Dlaczego  więc  mówiąc  o jądrze  atomowym 
mamy  prawo  twierdzić  z całym  przekonaniem,  że 
składa  się  ono  z określonej  liczby  protonów  i neutro- 
nów, skoro  struktury  samych  nukleonów  nie  możemy 
poznać  jednoznacznie? 

Popatrzmy  na  te  zagadnienia  nieco  bardziej  for- 
malnie. Podstawowymi  regułami  obowiązującymi 
w fizyce  są  tzw.  zasady  nieokreśloności,  które  okre- 
ślają warunki,  przy  których  zjawisko  fizyczne  ma 
przebieg  klasyczny,  a także  warunki,  w których  istotne 
stają  się  cechy  statystyczne,  kwantowe.  Jedną  z owych 
zasad  jest  zasada  nieokreśloności  czasu  i energii: 

AE-At  ^ 1l2fiy 

która  wiąże  minimalny  czas  At,  po  jakim  można 
przy  użyciu  dowolnych  metod  zaobserwować  zmianę 
stanu  badanego  obiektu  z nieokreślonością  AE  jego 
energii  (a  więc  i masy,  bo  E = rac2).  Stała  Plancka  h 
jest  bardzo  mała  (h  = hf2n  = 1,05  -10“34  J • s)  i dla 
obiektów  makroskopowych  iloczyn  AE-At  wielo- 
krotnie ją  przewyższa  (np.  1030  razy),  co  prowadzi 
do  klasycznego,  jednoznacznego  ich  zachowania  się. 
Dla  cząstek  elementarnych  natomiast  iloczyn  ten 
niewiele  różni  się  od  h i powyższa  zasada  mocno 
ogranicza  własności  tych  cząstek.  Gdybyśmy  np. 
obserwowali  atomy  żelaza  w przedziałach  czasu 
rzędu  10" 10  s,  to  tak  dokładnymi  pomiarami  wywo- 
łalibyśmy nieokreśloność  ich  energii  rzędu  10  eV. 


hipoteza: 

6 leptonów 
i 6x3 
kwarków 


zasada  nie- 
określoności 
czasu 
i energii 
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Doprowadziłoby  to  do  niekontrolowanej  emisji 
fotonów  o takiej  właśnie  energii,  a więc  o długościach 
fal  rzędu  charakterystycznego  dla  fal  świetlnych 
(gdyż  E = hv  = hcjk).  Pomiary  przeprowadzane  z 
mniejszą  dokładnością  nic  by  nie  dały,  gdyż  już  czas 
10~10  s wielokrotnie  przewyższa  typowy  czas  emisji 
fotonu.  Dlatego  właśnie  skład  fotonowy  kawałka 
żelaza  możemy  określić  jedynie  statystycznie.  Przy 
opisie  struktury  kawałka  żelaza  nie  jest  to  jednak 
ważne,  gdyż  wkład  fotonów  do  energii  (masy)  żelaza 
jest  zupełnie  nieistotny.  Przy  opisie  struktury  nukleo- 
nów zagadnienia  podobnego  typu  stają  się  znacznie 
bardziej  istotne,  gdyż  masy  składników  nukleonów' 
mogą  być  rzędu  masy  samych  nukleonów.  Nukleo- 
nowa  struktura  jąder  atomowych  jest  z kolei  równie 
prosta  (?),  jak  struktura  atomowa  kawałka  żelaza. 
Nukleony  bowiem  mają  wewnątrz  jąder  masy  rzędu 
1 GeV  (ubytek  ich  masy  na  koszt  energii  wiązania 
jest  niewielki  i wynosi  ok.  8 MeV)  i dopiero  pomiary 
przeprowadzane  z niewiarygodną  dokładnością  10~24 
s mogłyby  doprowadzić  do  wykrycia  w jądrze  dodat- 
kowych par  nukleonów,  czy  też  innych  hadronów 
(masa  najlżejszych  z nich  — mezonów  n — wynosi 
mn  « 140  MeV).  Wykonując  pomiary  z mniejszą 
dokładnością  będziemy  zawsze  obserwować  typowy 
nukleonowy  skład  jąder.  Nie  jest  to  przypadek 
odosobniony.  Okazuje  się,  że  dla  każdej  cząstki  ele- 
mentarnej można  określić  takie  warunki  doświad- 
czalne, przy  których  skład  cząstki  staje  się  prawie  jed- 
noznaczny. Dzięki  temu  możemy  w ogóle  mówić  o ja- 
kimkolwiek ich  składzie. 


Kwantowopolowy  opis  własności  cząstek 


czas 

Rys.  1.  Rozprasza- 
nie elektronu  na 
elektronie  zachodzi 
przez  wymianę  fo- 
tonu wirtualnego 


cząstki 

punktowe 


Przejdźmy  do  zagadnienia  struktury  cząstek.  Jak  już 
mówiliśmy,  zgodnie  z zasadą  nieokreśloności  w do- 
statecznie krótkim  przedziale  czasu  nieokreśloność 
energii  (masy)  każdego  obiektu  fizycznego,  a więc 
i cząsiki,  jest  tak  duża,  że  może  nastąpić  niekontro- 
lowana emisja  innych  cząstek  (nie  tylko  fotonów). 
Taki  krótkotrwały  proces  wysyłania  cząstek  przez 
inne  cząstki  jest  podstawą  występowania  wszelkich 
rodzajów  oddziaływań  w przyrodzie.  Na  rys.  1 przed- 
stawiliśmy proces,  w którym  elektron  wysłał  foton 
(tzw.  foton  wirtualny),  pochłonięty  następnie  po 
krótkiej  chwili  przez  inny  elektron.  W wyniku  tej  wy- 
miany fotonu  nastąpiło  przekazanie  energii  oraz  pędu 
od  jednego  elektronu  do  drugiego,  czyli  ich  oddziały- 
wanie (rozpraszanie).  Szczegółowa  teoria  tego  ro- 
dzaju oddziały  wań  została  opisana  w artykule  „Od- 
działywania elektromagnetyczne”.  Tam  też  znajduje 
się  opis  idei  trudnych  a zarazem  pięknych  doświad- 
czeń, które  umożliwiły  poznanie  struktury  cząstek. 
Doświadczalne  zbadanie  owej  struktury  nie  było  bo- 
wiem wcale  trywialne.  Nie  będziemy  tu  powtarzać 
wszystkich  argumentów  doświadczalnych  dotyczą- 
cych składu  cząstek  elementarnych.  Przedstawimy  je- 
dynie współczesny  stan  wiedzy  na  ten  temat.  Niestety 
nie  jest  to  jeszcze  wiedza  kompletna.  Mimo  to  w ciągu 
ostatnich  lat  zrobiono  ogromny  krok  w kierunku  peł- 
nego zrozumienia  świata  cząstek.  Wystarczy  powie- 
dzieć, że  przed  1969  rokiem  artykuł  ten  nie  mógłby 
zawierać  niemal  żadnych  informacji  na  temat  struk- 
tury hadronów. 

Podstawą  opisu  oddziaływań  cząstek  elementarnych 
jest  kwantowa  teoria  pola,  której  najlepiej  zbadaną 
częścią  jest  elektrodynamika  kwantowa  (->  Teoria 
pola).  Jest  to  teoria  lokalna,  co  znaczy,  że  np.  proces 
emisji  (lub  absorpcji)  fotonu  z elektronu  zachodzi 
lokalnie,  w jednym  miejscu  i jednej  chwili,  choć  za- 
równo owo  miejsce,  jak  i chwila  są  nieokreślone 
statystycznie.  W związku  z tym  podstawą  badań 
fizyki  cząstek  elementarnych  są  cząstki  bez  struktury, 
punktowe.  Takie  cząstki  mogą  bowiem  punktowo 
wysyłać  inne,  również  punktowe  cząstki.  Przy- 
miotnik „punktowy”  należy  tu  rozumieć  umownie. 
Żadnej  cząstki  nie  można  dostatecznie  dobrze  zloka- 


lizować doświadczalnie,  gdyż  zgodnie  z zasadą 
nieokreśloności  pędu  i położenia, 

ApAx  ^ x/2h, 

doprowadziłoby  to  do  nadania  jej  dużego  pędu,  a więc 
i energii,  co  w konsekwencji  wywołałoby  emisję  innych 
cząstek.  Dokładnie  zlokalizowana  cząstka  nie  może 
być  cząstką  pojedynczą.  Zwróćmy  przy  okazji  uwagę 
na  fakt,  że  daleko  nam  do  osiągnięcia  dokładności 
10-13  m (rozmiary  nukleonów).  Wracając  do  struk- 
tury cząstek  elementarnych  — próbujemy  opisywać 
ją  poprzez  składniki  nie  mające  już  żadnej  struktury. 
Na  szczęście  okazuje  się,  że  opis  taki  jest  możliwy. 


zasada  nie* 
określonośt 
pędu 
i położeń 


Struktura  leptonów 


Najprostszym  obiektem  badań  są  leptony  ( e , p,  v€,  vv, 
t)  nie  podlegające  oddziaływaniom  silnym.  Najsilniej- 
szymi są  dla  nich  oddziaływania  elektromagnetyczne, 
które  charakteryzują  się  stałą  sprzężenia  a* i * 7i*. 
Znaczy  to,  że  prawdopodobieństwo  emisji  fotonu 
z elektronu  bądź  mionu  (neutrina  są  pozbawione  ła- 
dunku elektrycznego)  jest  proporcjonalne  właśnie  do 
aei  (rys.  2).  Wysłany  foton  musi  po  krótkim  czasie 
być  pochłonięty,  np.  przez  ten  sam  elektron  (rys.  3), 
a prawdopodobieństwo  tego  jest  rzędu  ajj  ^ (SW2. 
Wysłany  foton  może  też  wytworzyć  parę  elektron-po- 
zyton, która  następnie,  wciąż  bardzo  szybko,  zamieni 
się  z powrotem  w foton.  Prawdopodobieństwo  każde- 


Rys.  2.  Prawdra 
dobienstwo  zajkk 
procesu  emisji  fott 


Rys.  3.  Prawdopodo- 
bieństwo pochłonięcia 
fotonu  przez  ten  sam  ele- 
ktron jest  rzędu 


czas 


Rys.  4.  Prawdopodo- 
bieństwo zajścia  takiego 
procesu  jest  rzędu  «<el  ^ 

go  z tych  procesów  jest  znów  rzędu  acl.  Prawdopodo- 
bieństwo, że  elektron  na  krótką  chwilę  przejdzie  w 
elektron  oraz  parę  elektron-pozyton,  jest  więc  rzędu 
a|i  » C/137)4  (rys.  4).  To  już  bardzo  mało.  Możemy 
więc  powiedzieć,  że  fizyczny  elektron  składa  się  z 
prawdopodobieństwem  (na  jednostkę  czasu)  bliskim 
jedności  z jednego  elektronu  bez  struktury,  z prawdo- 
podobieństwem rzędu  O/137)2  z pozbawionych  struk- 
tury elektronu  i fotonu  oraz  z prawdopodobieństwem 
rzędu  C/137)4  z elektronu  i pary  elektron-pozyton  itd. 
(rys.  5).  Elektron  i wszystkie  inne  leptony  są  zatem 
niemal  pozbawione  struktury.  Jest  to  wywołane  małą 


e 


Rys.  5.  Różny  skład  elektronu  fizycznego  ma  różne  prawdopo- 
dobieństwo na  jednostkę  czasu 


wartością  elektromagnetycznej  stałej  sprzężenia,  ocel. 
Oddziaływania  słabe  leptonów,  jako  jeszcze  słabsze, 
nie  zmieniają  tego  obrazu.  Neutrina  więc  (jak  i foto- 
ny) też  są  bez  struktury. 


Kwarkowa  struktura  hadronów 

W przypadku  leptonów  sytuacja  była  prosta,  kom- 
plikuje się  jednak,  gdy  przechodzimy  do  opisu  hadro- 
nów. Cząstki  te  podlegają  oddziaływaniom  silnym, 
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których  stała  sprzężenia  nie  jest  mała.  Dlatego  poś- 
więcono wiele  lat  na  zbadanie  struktury  hadronów. 
W wyniku  tych  badań  prawdziwy  obraz  rysuje  się 
dosyć  jasno. 

Podstawą  struktury  wszystkich  hadronów  są  pozba- 
wione już  struktury  kwarki.  Wprawdzie  nikomu  nie 
udało  się  wybić  kwarku  ze  struktury  hadronu,  ale  nie- 
wielu jest  fizyków,  którzy  nie  wierzyliby  w kwarkową 
naturę  oddziaływań  silnych.  Kwarki  tkw'ią  więc  wew- 
nątrz hadronów  jak  głaz  w studni  i trzeba  ogromnej 
(prawdopodobnie  nieskończonej)  energii,  żeby  je 
stamtąd  wydobyć.  Podstawowym  mankamentem  te- 
orii kw-arków  jest  niekompletne  poznanie  natury 
owych  ogromnych  sił,  które  nie  pozwalają  kwarkom 
na  wydostanie  się  z wnętrza  hadronów.  Dlatego  na- 
leży być  może  traktować  tę  teorię  z pewną  rezerwą. 
Mimo  to  teoria  kwarków  wyjaśnia  tyle  faktów  i jest 
potwierdzona  przez  tyle  niezależnych  od  siebie  do- 
świadczeń, że  rezerwa  ta  powinna  być  naprawdę  nie- 
wielka. 

Zobaczymy  dalej,  że  hadrony  składają  się  nie  tylko 
z kwarków,  ale  i z pewnych  innych  cząstek  — nośni- 
ków oddziaływań  międzykwarkowych.  Jednak  kwarki 
pełnią  w strukturze  hadronów  rolę  szczególną.  Tylko 
bowiem  kwarki  biorą  udział  w oddziaływaniach  ele- 
ktromagnetycznych i słabych.  Różne  masy  kwarków 
decydują  też  o różnicach  mas  samych  hadronów,  a 
obserwowane  w doświadczeniach  prawo  zachowania 
liczby  barionów  ma  swoje  źródło  w ścisłym  prawie 
zachowania  liczby  kwarków  (liczba  kwarków  minus 
liczba  antykwarków  nie  zmienia  się  w żadnym  pro- 
cesie), Można  powiedzieć,  że  własności  kwarków 
(przede  wszystkim  ich  masy)  są  odpowiedzialne  za 
wszelkiego  rodzaju  symetrie  obowiązujące  w świecie 
hadronów. 

hipoteza  Jakie  więc  są  same  kwarki?  Najważniejsza,  spraw- 
k warko wa  dzona  w wielu  doświadczeniach  hipoteza  teorii  kwar- 
ków mówi,  że  wszystkie  bariony  (hadrony  o spinach 
połówkowych:  1/2, 3 U itd.)  składają  się  z trzech  kwar- 
ków, zaś  mezony  (hadrony  o spinach  całkowitych: 
0,  1 itd.)  z pary  kwark-antykwark.  Anty  bariony  skła- 
dają się  oczywiście  z trzech  antykwarków.  Wynika 
z tego,  że  kwarki  są  fermionami  o spinie  1/2  (z  trzech 
fermionów  można  zbudować  tylko  fermion  o spinie 
połówkowym,  a z dwóch  jedynie  bozon  o spinie 
całkowitym)  i podlegają  zakazowi  Pauliego,  podobnie 
jak  bariony  i leptony.  W przyrodzie  obserwujemy 
jedynie  układy  związane  trzech  kwarków  lub  par 
kwark-antykwark.  Inne  układy,  podobnie  jak  i same 
kwarki,  nie  zostały  dotychczas  znalezione.  Liczba  ob- 
serwowanych kwarkowych  układów  związanych, 
hadronów,  zależy  oczywiście  od  liczby  samych  kwar- 
ków, dla  której  nie  znamy  żadnego  ograniczenia 
teoretycznego.  Liczba  kwarków  może  więc  być  do- 
wolna, choć  doświadczalnie  dowiedzieliśmy  się  o 
istnieniu  jedynie  kilku  pierwszych,  najlżejszych.  Zna- 
my z pewnością  cztery  rodzaje  kwarków,  a ostatnio 
odkryto  hadrony,  w których  składzie  znajduje  się 
prawdopodobnie  kwark  piąty.  Zapomnijmy  na  chwilę 
o spinach  kwarków.  Wtedy  z czterech  kwarków  mo- 
żemy zbudować  4x4x4  = 64  bariony  oraz  4x4  = 
= 16  mezonów.  Po  dodaniu  spinów  i uwzględnieniu 
istnienia  stanów  wzbudzonych  liczba  ta  znacznie  się 
zwiększa.  Teoria  kwarków  jest  więc  bardzo  oszczędna, 
pomimo  że  liczba  odkrytych  kwarków  wciąż  wzrasta. 

symboie  Cztery  kwarki,  których  istnienie  zostało  mocno 
kwarków  ugruntowane  doświadczalnie,  mają  następujące  sym- 
(zapachy)  bole:  u (ang.  up  'górny’),  d (ang.  down  'dolny’),  s (ang. 

strange  'dziwny’)  oraz  c (ang.  charmed  'powabny’). 
W klasyfikacji  hadronów  i ich  oddziaływań  stosuje 
się  wciąż  nieco  inną  symbolikę  mającą  dziś  już  raczej 
historyczne  znaczenie.  Zamiast  mówić,  że  proton 
składa  się  z dwóch  kwarków  u oraz  jednego  d , po- 
wiada się,  że  proton  ma  liczbę  barionową  B = 1, 
trzecią  składową  izospinu  /3  = +Vs«  dziwność 
5 = 0 oraz  powab  C = 0.  W tej  terminologii  np. 
kwark  u nosi  następujące  wyróżniające  go  symbole: 
B = V„  /3  = -f  V2,  5 = 0,  C = 0 przy  czym  war- 


tości liczb  j B,  /3, 5 i C dla  układu  złożonego  z kwarków 
równają  się  sumom  tych  liczb  dla  poszczególnych 
kwarków.  Prościej  chyba  jednak  pisać  uud  niż  B = 1, 
/3  — 1U>  5 = 0,  C = 0.  Zamieszczona  niżej  tabela 


Addytywne  liczby  kwantowe  kwarków 
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B 

Trzecia 
składo- 
wa izo- 
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0 

0 

2/3 
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1/3 

-1/2 

0 

0 

-1/3 

s 

1/3 

0 

-1 

0 

-1/3 

c 

1/3 

0 

0 

1 

2/3 

podaje  liczby  kwantowe  wszystkich  czterech  kwar- 
ków. Antykwarki  mają  liczby  kwantowe  przeciwnego 
znaku.  Łatwo  się  przekonać,  że  dla  wszystkich  kwar- 
ków spełniony  jest  związek 

0 = /3+£(R+5+C). 

Ze  względu  na  własność  addytywności  wszystkich  vvzór  Geil- 
występujących  w nim  liczb  kwantowych  wzór  ten  -SWanna- 
obowiązuje  także  dla  hadronów'.  W przypadku  C = -Nishijimy 
= 0 jest  to  znany  już  od  przeszło  25  lat  wzór  Gell- 
Manna-Nishijimy.Suma  Y — j?-f  5 zwana  jest  hiper- 
ładunkiem  cząstki. 

Znając  skład  kwarkowy  hadronu  możemy  na  pod- 
stawie powyższej  tabeli  łatwo  odczytać  liczby  kw-an- 
towe  tego  hadronu.  I tak  np. : układ  uud  (B  — 1, 

/3  = +V2,  5 = 0,  C = 0,  0 = 1)  to  proton,  układ 
udd  (B  = 1 , J3  = -V2,  5 = 0,  C = 0,  0 = 0)  to 
neutron,  układ  uuu  (B  = 1 , /3  = 5 = 0,  C = 0, 

0 = 2)  to  rezonans  J+  + , układ  uus  (B  = 1,  /3  = 1, 

5 = — 1,  C = 0,  Q = 1)  to  hiperon  £+,  układ  ud 
(B  = 0,  /3  = +1,  5 = 0,  C = 0,  0 = 1)  to  mezon 
n+,  zaś  układ  us  ( B = 0,  /3  = 1/2 , 5=1,  C = 0, 

0 = 1)  to  mezon  K+.  Wszystko  to  można  odczytać 
w Tabeli  cząstek  elementarnych  (-►  Cząstki  elemen- 
tarne i ich  oddziaływania),  na  którą  będziemy  się 
wielokrotnie  powoływać.  Oczywiście  powyższe  war- 
tości liczb  kwantowych  mają  nie  tylko  wymienione 
stany  podstawowe  hadronów,  ale  i zamieszczona 
w tabeli  cząstek  cała  rodzina  ich  stanów  wzbudzo- 
nych (rezonansów). 

Ostatnią  pozycją  w tabeli  liczb  kwantowych  kwar-  ładunek 
ków  jest  ładunek  elektryczny.  Nie  jest  on  całkowitą  elektryczny 
wielokrotnością  ładunku  elementarnego.  Ułamkowa  kwarków 
wartość  ładunku  kwarków  została  potwierdzona 
w doświadczeniach  nieelastycznego  rozpraszania  elek- 
tronów na  nukleonach.  Oczywiście  same  hadrony  — • 
układy  trzykwarkowe  lub  kwark-antykwark  — mają 
ładunki  całkowite. 

Przejdźmy  teraz  do  bardziej  szczegółowego  opisu 
własności  hadronów  z punktu  widzenia  ich  składu 
kwarkowego.  Jak  się  dalej  okaże,  o własnościach 
tych  decydują  różnice  mas  kwarków.  Kwark  po- 
wabny c jest  znacznie  cięższy  od  pozostałej  trójki. 

Wyłączymy  go  więc  z naszych  rozważań  i zajmiemy 
się  hadronami  złożonymi  z kwarków  u , d i s.  Hadro- 
nów powabnych  znamy  zresztą  stosunkowo  niewiele 

1 niewiele  też  wiemy  o obowiązujących  dla  nich  sy- 
metriach. Zajmiemy  się  dalej  symetriami  hadronów 
wynikającymi  z ich  składu  kwarkowego. 


Symetrie  hadronów  i ich  oddziaływań 

Fundamentalną  własnością  każdego  układu  cząstek 
jest  rodzaj  symetrii  amplitudy  falowej  (tzw.  amplitu- 
dy prawdopodobieństwa),  której  kwadrat  określa 
prawdopodobieństwo  znalezienia  układu  w pewnym 
stanie.  Amplituda  układu  złożonego  np.  z dwóch 
cząstek  może  być  funkcją  symetryczną  albo  antysy- 
metryczną  ze  względu  na  operację  wzajemnego  prze- 
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stawienia  cząstek,  tzn.  zamiany  wszystkich  współ- 
rzędnych i liczb  kwantowych  cząstek.  Symetria  ukła- 
du może  być  także  mieszana.  Jeśli  cząstki  są  identycz- 
ne, to  obie  sytuacje  (przed  i po  zamianie)  nie  mogą 
być  w żaden  sposób  rozróżnione,  a opisujące  je  ampli- 
tudy różnią  się  co  najwyżej  znakiem,  przez  co  nie 
zmienia  się  prawdopodobieństwo.  Amplituda  falowa 
układu  cząstek  identycznych  nie  może  więc  mieć  sy- 
metrii mieszanej,  musi  być  albo  funkcją  symetryczną 
albo  antysymetryczną.  Rodzaj  symetrii  nie  może  przy 
tym  zależeć  od  układu  odniesienia,  nie  może  zmieniać 
się  przy  żadnych  transformacjach,  jakim  poddajemy 
układ.  Jest  to  dosyć  oczywiste,  gdyż  np.  antysyme- 
tria  amplitudy  falowej  powoduje,  że  prawdopodobień- 
stwo znalezienia  obu  identycznych  cząstek  w tym 
samym  stanie  równa  się  zeru  i fakt  ten  nie  może  oczy- 
wiście zależeć  od  tego,  z jakiego  układu  go  obserwu- 
jemy. Tak  właśnie  zachowują  się  wszystkie  identyczne 
fermiony.  Ta  ich  własność  jest  treścią  słynnego  za- 
kazu Pauliego.  Zagadnienie  powyższe  możemy  nieco 
uogólnić.  Możemy  mianowicie  rozważać  problem 
przestawienia  cząstek  prawie  identycznych,  a także 
symetrię  ze  względu  na  zamianę  tylko  niektórych 
liczb  kwantowych. 

Niektóre  liczby  kwantowe  cząstek  nie  ulegają 
zmianie  przy  pewnych  przekształceniach  układu  od- 
niesienia. Taką  liczbą  jest  np.  wewnętrzny  moment 
pędu,  czyli  spin  cząstki,  którego  wartość  nie  zależy 
od  ustawienia  (względem  cząstki)  układu  mierzącego 
ten  spin.  Przy  obrotach  zmienia  się  jedynie  ustawienie 
spinu,  jego  rzut  na  pewną  oś,  ale  nie  wartość  spinu. 
Zupełnie  podobny  do  poprzedniego  argument  prze- 
konuje nas  teraz,  że  cząstka  elementarna  złożona 
z dwóch  innych  cząstek  niekoniecznie  identycznych 
ale  obdarzonych  takim  samym  spinem  musi  być  opi- 
sywana symetryczną  albo  antysymetryczną  amplitudą 
falową  ze  względu  na  przestawienie  zmiennych  spi- 
nowych. Przy  czym  określonej  cząstce  złożonej  przy- 
pisana jest  odpowiednia  symetria  (spin)  w sposób 
jednoznaczny. 

Kwarki  mają  spin  1/2.  Rzut  spinu  na  dowolną  oś 
wyróżnioną  przez  warunki  zewnętrzne  (np.  na  kieru- 
nek zewnętrznego  pola  magnetycznego,  za  pomocą 
którego  analizujemy  spiny  cząstek)  przyjmuje  jedynie 
wartości  ±1/2  zgodnie  z zasadami  mechaniki  kwan- 
towej. Dla  pary  kwark-antykwark  możliwe  są  więc 
4 ustawienia  spinów  składników  (rys.  6).  Dwie  pierw- 
sze sytuacje,  w których  rzut  spinu  sumarycznego  jest 
równy  ± 1 , są  oczywiście  symetryczne  ze  względu  na 
przestawienie  rzutów  spinu  kwarków.  Pozostałe  dwie 
sytuacje  o sumarycznym  rzucie  równym  zeru  mogą 
tworzyć  zarówno  kombinację  symetryczną,  jak  i anty- 
symetryczną. Ostatecznie,  trzy  symetryczne  ustawienia 
dają  cząstkę  złożoną  (mezon)  o spinie  \ (rys.  7),  pod- 
czas gdy  jedna  kombinacja  antysymetryczną  odpo- 
wiada cząstce  o spinie  0 (rys.  8).  Z tego  wynika,  że 
stany  podstawowe  układu  kwark-antykwark  to  me- 
zony o spinie  0 (zwane  pseudoskalarnymi)  oraz  me- 
zony o spinie  1 (zwane  wektorowymi).  Pierwsze  z nich 
są  opisywane  antysymetryczną,  a drugie  — syme- 
tryczną amplitudą  falową.  Podobną  sytuację  mamy 
dla  układów  trzykwarkowych  (barionów).  Tu  jednak 
amplituda  falowa  może  być  np.  symetryczna  dla  pary 
kwarków  i antysymetryczną  ze  względu  na  rzut  spinu 
kwarku  trzeciego.  Całkowita  antysymetria  trzech 
rzutów  spinu  o dwóch  tylko  możliwych  wartościach 
nie  daje  się  zrealizować  i pozostają  jedynie  dwie  sy- 
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Rys.  9.  Cztery  całko- 
wicie symetryczne  kom- 
binacje ustawień  spinów 
opisują  cząstkę  o spinie 
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Rys.  10.  Dwie  kombina- 
cje o symetrii  złożonej 
opisują  cząstkę  o spinie 
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tuacje  przedstawione  na  rys.  9 i 10.  W jednej  z nich 
są  cztery  możliwości  opisywane  amplitudą  całkowicie 
symetryczną  i przedstawiające  cząstkę  o spinie  3/2. 
W drugiej  amplituda  ma  symetrię  złożoną  (ale  okreś- 
loną, nie  mieszaną)  i przedstawia  dwa  możliwe  stany 
cząstki  o spinie  1}2 . Stany  podstawowe  układów  trzy- 
kwarkowych to  bariony  o spinie  1/2  oraz  3/2. 

Wyciągamy  stąd  wniosek,  że  zależnie  od  ustawie- 
nia spinów  kwarków  określony  skład  kwarkowy  może 
odpowiadać  różnym  hadronom.  I tak  np.  układ  uud 
to  albo  proton  (spin  1/2)  albo  rezonans  A + (spin  3/2), 
układ  ud  to  albo  mezon  n+  (spin  0)  albo  mezon  q+ 
(spin  1)  itd.  Masy  tych  cząstek  są  oczywiście  różne, 
gdyż  energia  wiązania  kwarków  zależy  od  wzajem- 
nego ustawienia  ich  spinów'. 

Przejdziemy  teraz  do  symetrii  przybliżonych  obo- 
wiązujących wśród  hadronów.  Wiążą  się  one  z pew- 
nymi podobieństwami  różnych  kwarków.  Kwarki 
mogą  się  różnić  nie  tylko  ustawieniem  spinu,  ale  rów- 
nież masami  oraz  ładunkami  elektrycznymi.  To,  że 
kwarki  mają  różne  ładunki,  jest  przyczyną  zróżnico- 
wania własności  elektromagnetycznych  hadronów. 
Nie  ma  to  jednak  istotnego  znaczenia  przy  badaniu 
oddziaływań  silnych.  W oddziaływaniach  tych  ładunki 
kwarków  i hadronów  nie  odgrywają  istotnej  roli 
i niemal  o wszystkim  decydują  różnice  mas  kwarków. 

Wiadomo,  że  proton  (uud)  oraz  neutron  (udd) 
mają  prawie  jednakowe  masy.  Wnioskujemy  stąd,  że 
i kwarki  u oraz  d niewiele  różnią  się  masami.  Różne 
ładunki  powodują,  że  nie  są  to  cząstki  identyczne 
(mezon  n+  — ud  to  wcale  nie  to  samo,  co  mezon 
n~  — du),  ale  w oddziaływaniach  silnych  nie  ma  to 
większego  znaczenia.  Oddziaływania  silne  powinny 
być  więc  symetryczne  ze  względu  na  wymianę  kwar- 
ków u oraz  d.  Symetrię  tę  nazwano  wiele  lat  temu 
niezmienniczością  ze  względu  na  obroty  w tzw.  prze- 
strzeni izotopowej,  lub  też  symetrią  SU( 2).  Oznacza 
to  po  prostu  niezmienniczość  ze  względu  na  wspom- 
nianą zamianę  kwarków.  Zwróćmy  uwagę,  że  sy- 
metria ta  jest  w oczywisty  sposób  naruszona  przez 
oddziaływania  elektromagnetyczne  hadronów. 

Jakie  są  konsekwencje  niezmienniczości  izotopo- 
wej oddziaływań  silnych?  Weźmy  pod  uwagę  dwie 
reakcje  rozpraszania:  n+p^n+p  oraz  n~n-+jCn. 
Stan  n+p  (uduud)  przechodzi  po  wymianie  u^±d 
w stan  n~n  (dii udd).  Stąd  przekroje  czynne  obu  reakcji 
powinny  być  jednakowe.  I takie  są  rzeczywiście. 
Podobnie  jak  przekroje  czynne  reakcji  n+n  ->  n+n 
oraz  n~p  -*iCp  i wielu  innych.  Symetria  izotopowa 
została  sprawdzona  dla  wielu  reakcji.  Znacznie  bar- 
dziej spektakularne  są  jednak  przewidywania  odno- 
szące się  do  mas  hadronów  tłumaczące  występowanie 
tzw.  multipletów  izotopowych.  Jeżeli  bowiem  kwarki 
u oraz  d mają  w przybliżeniu  takie  same  masy,  to 
zbliżone  masy  powinny  mieć  całe  grupy,  czyli  multi- 
plety hadronów,  np. : mezony  n (n+  — ud , tC  — du , 
n°  — antysymetryczną  kombinacja  dd oraz  uu),  mezony 
K (K+  — us , K°  — ds,  K°  — sd,  K~  — sw),  rezonanse 
A (A++  — uuu,  A+  — uud,  A°  — udd,  A~  — ddd),  hipe- 
rony Z1  (Z+  — uus , Z°  — uds , Z"  — dds ),  hiperony 
Z (Z°  — uss,  Z~  — dss).  Przybliżona  równość  mas 
składników  multipletów  jest  doskonale  potwierdzona 
przez  dane  doświadczalne  (Tabela  cząstek  elemen- 
tarnych, str.  84).  Zachodzi  ona  oczywiście  także  dla 
innych  stanów  spinowych  (np.  mezony  o,  K *,  czy  też 
rezonanse  Z (1 385))  oraz  stanów  wzbudzonych  cząstek. 

Symetrię  izotopową  SU (2)  doskonale  potwierdzają 
wszystkie  dane  doświadczalne.  Natomiast  nieco 
ogólniejsza  symetria  — symetria  unitarna  SU( 3)  — 
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nie  jest  już  tak  dokładnie  spełniona.  Byłaby  ona  sy- 
metrią ścisłą  oddziaływań  silnych,  gdyby  również 
kwark  .9  miał  taką  samą  masę  Jak  kwarki  u i d.  Mezon 
K+  (uś)  ma  jednak  masę  znacznie  większą  niż  mezon 
7 r+  (ud)  i kwark  5 musi  być  wyraźnie  cięższy.  Ze  składu 
kwarkowego  cząstek  możemy  jednak  i w tym  wypad- 
ku wyciągnąć  pewne  ciekawe  wnioski. 

Zwróciliśmy  już  uwagę  na  fakt,  że  oddziaływania 
silne  wszystkich  kwarków  są  takie  same,  a obserwo- 
wane różnice  mają  rzec  można,  naturę  kinematyczną 
i wywołane  są  różnicami  mas  kwarków.  Stąd,  jeżeli 
istnieje  cząstka,  której  amplituda  falowa,  traktowana 
jako  amplituda  układu  kwarków,  ma  określoną  sy- 
metrię, to  musi  też  istnieć  inna  cząstka  o tej  samej 
symetrii,  ale  innym  składzie  kwarkowym. 

Zajmijmy  się  najpierw  barionami.  Układy  uuu 
(A++),  ddd(A~)  oraz  sss  (Q~)  muszą  mieć  spiny 
i muszą  być  opisywane  amplitudami  falowymi  całko- 
wicie symetrycznymi  ze  względu  na  przestawienie 
cząstek.  Może  się  bowiem  zdarzyć  sytuacja,  w której 
trzy  jednakowe  kwarki  mają  identyczne  rzuty  spi- 
nów. Sytuację  tę  można  zrealizować  przez  odpowiedni 
obrót  układu  współrzędnych.  W wyniku  tego  wszyst- 
kie trzy  identyczne  kwarki  znajdą  się  w tych  samych 
stanach  i muszą  być  opisywane  całkowicie  syme- 
tryczną amplitudą.  Stąd  też  muszą  istnieć  następujące 
symetryczne  kombinacje  układów  trzykwarkowych 
o spinie  */2:  uud  (A+),  udd  (A°),  uus  (rezonans  £+), 
uds  (rezonans  Z°),  dds  (rezonans  £“),  uss  (rezonans 
5'°)  oraz  dss  (rezonans  *£“).  Razem  z poprzednimi 
mamy  więc  dziesięć  barionów  o spinie  tzw.  de- 
kuplet  barionowy.  Dekuplet  ten  składa  się  z kwartetu 
izospinowego  rezonansów  A,  trypletu  rezonansów 
Z,  dubletu  rezonansów  S i singletu  Q~ . Biorąc  pod 
uwagę,  że  każdy  kolejny  multiplet  zawiera  o jeden 
kwark  s więcej,  łatwo  wyciągamy  wniosek,  że  różnice 
mas  między  sąsiednimi  multipletami  są  takie  same: 


neutralne  złożone  z par  uu,  dd  oraz  ss.  Układy  takie 
mogą  bowiem  swobodnie  przechodzić  jeden  w drugi 
(np.  uu  ->  dd  lub  uu  ->  ss ).  Przejścia  uu  -►  dd  między 
stanami  o bardzo  zbliżonych  masach  mają  jedynie 
znaczenie  przy  wypisywaniu  jawnej  postaci  amplitud 
falowych  mezonów.  Ważniejsze  są  przejścia  ss  -*•  uu 
lub  dd , dzięki  którym  mezon  złożony  z pary  kwarków 
dziwnych  może  przechodzić  w mezon  złożony  z pary 
kwarków  niedziwnych  i na  odwrót.  Ustala  się  jakaś 
równowaga,  w której  stanami  mezonowymi  o określo- 
nej masie  nie  są  już  układy  ss , uuy  czy  też  ddy  ale 
pewne  ich  kombinacje  o składzie  zależnym^  od  in- 
tensywności procesu  przejścia  ss  dd  lub  uu.  Oka- 
zuje się,  że  dla  układów  o spinie  1 przejścia  te  są  mało 
prawdopodobne  i dlatego  własności  cząstek  o spinie  1 
(mezonów  wektorowych)  są  prostsze.  W przypadku 
mezonów  pseudoskalarnych  o spinie  0 powyższe 
przejścia  są  istotne  i odpowiednie  reguły  masowe  do- 
syć złożone.  Mezonów  pseudoskalarnych  j es t oczy- 
wiście dziewięć  (3x3):  trypjet  n (ud,  du , dd—uu ), 
dwa  dublety  K(us , ds  oraz  su,  sd)  oraz  dwa  singlety 
j)  i rf  złożone  z pewnych  kombinacji  par  uu,  dd  oraz 
ss.  Podobnie  dziewięć  jest  mezonów  wektorowych 
(tzw.  nonet  mezonowy):  tryplet  j)  (ud,  du,  uu+dd ), 
dwa  dublety  K*(us,  ds  oraz  su,  sd) oraz  dwa  singlety: 
ca(uu+dd)i<p(ss).  W tym  ostatnim  wypadku  możemy 
łatwo  wyprowadzić  odpowiednie  zależności  między 
masami.  Po  pierwsze,  masa  q jest  oczywiście  równa 
masie  co.  m(g)  — m (co). 

Po  drugie,  porównując  liczby  kwarków  dziwnych 
i niedziwnych  w różnych  mezonach  dochodzimy  do 
wniosku,  że  podwojona  masa  mezonu  K*(us  us)  po- 
winna być  równa  sumie  mas  mezonu  <p  oraz  mezonu 


m(0  )—m(£)  = m(S)  —m(£)  — m(£)  m(A) , q(ss  ud).  2m(K*)  = m{<p)-\-m((>). 


nonety 

mezonowe 


co  możemy  sprawdzić  w tabeli  cząstek.  Przy  wypro- 
wadzaniu tej  reguły  dla  mas  korzystaliśmy  z faktu,  że 
wszystkie  spiny  kwarków  w dekuplecie  mogą  być 
ustawione  w tę  samą  stronę  i dlatego  nie  odgrywa 
roli  ewentualna  zależność  energii  wiązania  od  wza- 
oktet  jemnego  ustawienia  spinów  (masa  cząstki  nie  zależy 
barionowy  od  rzutu  jej  spinu).  Nie  odnosi  się  to  do  ośmiu  bario- 
nów  tworzących  tzw.  oktet  barionowy  o spinie  7 2 
i dlatego  reguła  dla  mas  nie  jest  tutaj  tak  prosta.  Nie 
będziemy  jej  wyprowadzać,  wymienimy  jedynie  skład- 
niki oktetu  barionow-ego.  Nie  są  one  oczywiście  opi- 
sywane całkowicie  symetrycznymi  amplitudami  falo- 
wymi, te  bowiem  odnoszą  się  do  cząstek  dekupletu. 
Nie  ma  w'ięc  hadronów  o spinie  1/2  i składzie  uuu,  ddd 
oraz  ws.  Pozostają  nam  następujące  kombinacje:  uud 
(proton),  ddu  (neutron),  uus  (hiperon  Z+),  dds  (hiperon 
Z1-),  ssu  (hiperon  S°),  ssd  (hiperon  S+)  oraz  układ 
złożony  z trzech  różnych  kwarków  uds.  W sześciu 
pierwszych  cząstkach  dwa  spośród  kwarków  (umiesz- 
czone na  pierwszym  miejscu)  są  takie  same,  mogą 
mieć  spiny  skierowane  w tę  samą  stronę  (wtedy  trzeci 
kwark  ma  spin  skierowany  w stronę  przeciwną)  i muszą 
być  opisywane  przez  symetryczną  amplitudę  falową. 
Stąd  i układ  uds  musi  mieć  tę  samą  symetrię  i może 
istnieć  w dwóch  stanach:  symetrycznym  ze  względu  na 
parę  ud  (hiperon  Z°  uzupełniający  multiplet  Z)  oraz  sy- 
metrycznym ze  względu  na  parę  us  lub  ds  (hiperon  A). 
Ostatecznie  oktet  barionowy  składa  się  z następują- 
cych multipletów  izospinowych : dubletu  nukleonów, 
singletu  A,  trypletu  Z oraz  dubletu  S.  Z tego,  co 
powiedzieliśmy  wyżej  wynika,  że  wszystkie  bariony 
(również  stany  wzbudzone  układów  trzykwarkowych) 
mogą  istnieć  jedynie  w oktetach  i dekupletach  i że 
zawsze  odpowiednie  reguły  dla  mas  są  takie  same. 
Fakt  ten  jest  obecnie  mocno  potwierdzony  przez 
doświadczenie. 

Znacznie  prościej  niż  z barionami  przedstawia  się 
sprawa  z mezonami.  Komplikują  ją  jedynie  mezony 


Reguły  te  zupełnie  dobrze  zgadzają  się  dla  mas  wy- 
znaczonych doświadczalnie.  Dodajmy  wreszcie,  że 
wszystkie  mezony  (także  stany  wzbudzone)  muszą 
również  grupować  się  w podobne  dziewiątki  (3  X 3). 
Masy  i inne  liczby  kwantowe  wszystkich  znanych 
cząstek  (oczywiście  bez  cząstek  powabnych,  na  które 
jednak  łatwo  uogólnić  powyższe  rozważania)  dają  się 
wyjaśnić  przez  założenie,  że  wszystkie  mezony  gru- 
pują się  w nonety,  a wszystkie  bariony  w oktety  i de- 
kuplety. 


Kolory  i zapachy  kwarków 

Na  początku  artykułu  stwierdziliśmy,  że  podstawą 
opisu  oddziaływań  cząstek  jest  kwantowa  teoria  pola. 
Powiedzieliśmy  już  chyba  wystarczająco  wiele  o prze- 
widywaniach i sukcesach  hipotezy  kwarkowej.  Spró- 
bujmy więc  teraz  zbudować  kwantową  teorię  pola 
kwarkowego.  Na  wstępie  zauważmy,  że  w dotych- 
czasowych rozważaniach  popełnialiśmy  stale  bardzo 
poważny  błąd.  Z jednej  strony  twierdziliśmy,  że  warunki 
układy  identyczne  fermionów  muszą  być  opisywane  symetrii 
antysymetrycznymi  amplitudami  falowymi  (stąd  za- 
kaz Pauliego).  Równocześnie  jednak  okazało  się,  że 
barionowe  układy  trójkwarkowe  muszą  być  opisywa- 
ne aplitudami  symetrycznymi.  Np.  stan  podstawowy 
identycznych  kwarków  uuu  jest  symetryczny  ze  wzglę- 
du na  ich  przestawienia.  I nie  może  być  inny. 

Ponieważ  kwarki  są  fermionami,  więc  układ  taki  nie 
mógłby  po  prostu  istnieć.  Zauważmy,  że  gdy  wszystkie 
spiny  skierowane  są  np.  w górę,  wszystkie  trzy  kwarki 
u znajdują  się  w tym  samym  stanie,  co  nie  mogłoby 
się  zdarzyć,  gdyby  kwarki  te  były  rzeczywiście  iden- 
tyczne. Natrafiamy  więc  na  sprzeczność,  którą  może- 
my usunąć  jedynie  przez  wprowadzenie  pewnej  do- 
datkowej cechy,  która  rozróżniałaby  te  trzy  kwarki. 

Wtedy  zamiast  układu  uuu  mielibyśmy  układ  WiW2w3, 
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który  już  może  być  całkowicie  antysy metryczny  ze 
względu  na  wskaźniki  1,  2,  3 oraz  symetryczny  ze 
względu  na  pozostałe  liczby  kwantowe.  Owe  wskaź- 
niki nazwano  kolorami  kwarków  (rodzaje  kwarków 
u,  d , 5,  c nazywa  się  często  ich  zapachami)  przez  ana- 
logię do  własności  światła  białego,  które  może  z jednej 
strony  składać  się  z trzech  barw  podstawowych 
(czerwonej,  zielonej  i niebieskiej),  ale  również  dowol- 
nej barwy  oraz  barwy  do  niej  dopełniającej  (zwykle 
nie  jest  to  barwa  czysta).  Jak  zobaczymy,  hadrony  są 
zupełnie  podobnie  zbudowane  z kwarków  koloro- 
wych. Mówimy  często,  że  hadrony  są  bezbarwne, 
kolory  Wprowadzamy  więc  dla  wszystkich  kwarków  trzy 
kwarków  kolory:  czerwony  (c),  zielony  (z)  oraz  niebieski  («). 

Aby  jednak  nie  podważyć  dotychczasowych  rozważań, 
owo  potrojenie  liczby  kwarków  nie  może  spowodo- 
wać wzrostu  liczby  hadronów.  Kwarki  różnego  ko- 
loru, lecz  tego  samego  rodzaju  (zapachu)  nie  mogą 
więc  różnić  się  ani  masą,  ani  ładunkiem.  Poza  tym 
jedynie  pojedyncza  symetria  amplitudy  falowej  ze 
względu  na  przestawienia  kolorów,  może  być  reali- 
zowana w naturze.  W przeciwnym  razie  mielibyśmy 
tyle  cząstek,  ile  rodzajów  symetrii.  I wreszcie  po  to, 
by  owa  symetria  „kolorowa”  nie  ulegała  zmianie 
podczas  oddziaływań  hadronów,  musimy  mieć  ścisłe 
prawo  prawo  zachowania  każdego  koloru  w każdym  proce- 
zachowania  sie-  Oznacza  to,  że  np.  liczba  kolorów  czerwonych 
koloru  minus  liczba  kolorów  antyczerwonych  (anty barwy 
czyli  barwy  dopełniające  mają  oczywiście  antykwar- 
ki)  nie  zmienia  się  w żadnej  reakcji.  Przy  spełnieniu 
tych  wszystkich  warunków  poprzednio  opisane  wy- 
niki teorii  kwarkowej  nie  ulegają  żadnym  zmianom. 
Musimy  tylko  odpowiedzieć  na  pytanie,  jaka  to  sy- 
metria wskaźników  kolorowych  jest  realizowana 
w przyrodzie  w postaci  hadronów.  W przypadku  ba- 
rionów  odpowiedź  już  znamy.  Opisująca  je  amplituda 
falowa  jest  całkowicie  antysy  metryczna  ze  względu 
na  wszystkie  kolory.  Na  przykład 

UUU  ->  UcUzUn-UcUnUz  + UnUcUz- f- 
— UnUzUc-\-Uz  UnUc  — UzUcUn • 

Zwróciliśmy  poprzednio  uwagę  na  fakt,  że  trzykwar- 
kowe  układy  złożone  z różnych  kombinacji  kwarków 
u>  d i s mogą  tworzyć  całkowicie  symetryczne  deku- 
plety  bądź  oktety  o symetrii  złożonej.  Nie  rozważa- 
liśmy tam  możliwego  pojedynczego  układu  całko- 
wicie antysymetrycznego : singletu  SU( 3)  uds  (inne 
układy  nie  mogą  być  całkowicie  antysymetryczne), 
bowiem  ma  on  stosunkowo  dużą  masę  i nie  został 
dotychczas  zidentyfikowany  doświadczalnie.  Podob- 
nie teraz,  w \ zypadku  trzech  kolorów,  wyżej  skon- 
struowany całkowicie  antysymetryczny  układ  jest 
singletem  kolorowym  (symetria  kolorowa  jest  rów- 
nież pewnego  rodzaju  symetrią  SU (3)). 

Spodziewamy  się  więc,  że  i mezony  będą  singletami 
kolorowymi.  Jeżeli  chcemy,  by  zachowanie  koloru 
było  ścisłym  prawem  przyrody  i równocześnie  żeby 
bezbarwny  hadron  (singlet  kolorowy),  np.  nukleon, 
mógł  wysyłać  mezon,  np.  n,  pozostając  nadal  bez- 
barwnym hadronem  (proces  ten  jest  źródłem  występo- 
wania sił  jądrowych),  to  mezony  muszą  też  być  bez- 
barwne. Podobnie  jak  z trzech  kolorów  i trzech  kwar- 
ków można  utworzyć  tylko  jeden  stan  całkowicie 
antysymetryczny  (automatycznie  musi  to  być  bez- 
barwny singlet  nie  wyróżniający  żadnego  koloru), 
tak  w wypadku  par  kolor-antykolor  można  utworzyć 
tylko  jeden  stan  nie  wyróżniający  żadnego  koloru, 
singlet v symetryczny  ze  względu  na  zamianę  dowolnego  ko- 
kolorowe  loru  (wraz  z odpowiadającym  mu  antykolorem)  na 
inny.  Na  przykład 

ud  - ucd-+uj;+undn. 

Taka  kombinacja  jest  więc  znów  singletem  koloro- 
wym i w ten  właśnie  sposób  zbudowane  są  wszystkie 
mezony. 

Zauważmy  też,  że  singletu  kolorowego  nie  można 
zbudować  ani  z dwóch,  ani  z czterech  czy  pięciu  kwar- 


ków (o  trzech  możliwych  kolorach),  ani  też  z kwarku 
i pary  kwark-anty kwark  itp.  Możemy  łatwo  spraw- 
dzić, że  w każdym  z tych  wypadków  dowolnego  typu 
symetria  kolorowa  amplitudy  falowej  albo  nie  może 
być  w ogóle  zrealizowana,  albo  ma  więcej  niż  jedną 
realizację  (nie  odpowiada  wtedy  singletowi  o jednej 
składowej).  Pojedynczy  kwark  jest  oczywiście  tryple- 
tem  kolorowym.  Widzimy  więc,  że  jedynie  układy 
trzykwarkowe  oraz  kwark-antykwark  (a  także  ich 
wielokrotności)  mogą  tworzyć  singlety  kolorowe,  co 
prowadzi  do  reguły : tylko  singlety  kolorowe  są  obser- 
wowane w postaci  hadronów. 


Chromodynamika  kwantowa 

Przypisanie  kwarkom  trzech  różnych  kolorów  nie 
rozwiązuje  problemu.  Aby  kwarki  różniące  się  kolo- 
rem były  naprawdę  różne,  musi  istnieć  jakieś  oddzia- 
ływanie, które  rozróżniałoby  kolory.  Oddziaływanie 
to  musi  być  przenoszone  przez  jakieś  cząstki.  Cząstki 
te,  nośniki  oddziaływań  międzykwarkowych,  nazywa 
się  gluonami  (ang.  glue  'klej’).  Na  wzór  elektrodyna-  gluony 
miki  kwantowej  buduje  się  teorię  kwarkowo-gluono- 
wą  zwaną  chromodynamiką  kwantową.  Gluony,  po- 
dobnie jak  fotony,  mają  w niej  zerowe  masy  i spin 
równy  jedności.  Oczywiście,  że  gluony  nie  zostały, 
jak  dotychczas,  wyprodukowane  w żadnym  doświad- 
czeniu. Mają  wprawdzie  masę  zero,  ale  dzięki  ich 
uwięzieniu  wewnątrz  hadronów  zasięg  oddziaływań 
silnych  jest  skończony  (-►  Oddziaływania  elektro- 
magnetyczne). Zbadajmy,  jakie  kolory  mają  gluony. 

W tym  celu  musimy  rozważyć  elementarny  diagram 
produkcji  gluonu  z kwarku  o określonym  kolorze 
(rys.  11).  Na  przykład  kwark  czerwony  wysyła  gluon 
i zmienia  (lub  nie)  swoją  barwę.  Ponieważ  obowiązuje 
ścisłe  prawo  zachowania  każdej  barwy,  więc  wysyłany 
gluon  musi  mieć  dwa  kolory:  kolor  kwarku  przed 
aktem  wysłania  i antykolor  (kolor  dopełniający) 
kwarku  końcowego.  Każdy  więc  gluon  ma  dwa  kolo- 
ry, z czego  łatwo  możemy  obliczyć  całkowitą  liczbę 
gluonów.  Zwróćmy  jednak  uwagę  na  fakt,  że  wartości 
prawdopodobieństwa  wysłania  gluonu  z kwarków 
różnego  koloru  muszą  być  takie  same.  W przeciwnym 
razie  wymiana  gluonów  nie  tylko  powodowałaby 
zmianę  kolorów  kwarków,  ale  także  dla  różnych  ko- 
lorów prowadziłaby  do  różnej  energii  oddziaływania, 
co  musiałoby  wywołać  wystąpienie  różnic  mas  w try-  gluonu  może  zm£ 
plecie  kolorowym  kwarków.  nić  lub  nie  zmienić 

Tak  więc  wysłanie  gluonu  z każdego  kwarku  wiąże  koloru  kwarku.  Ni- 
się  z tą  samą  stałą  sprzężenia,  która  wynosi  prawdo-  zmienia  jego  redza* 
podobnie  ac  ~ 0,5.  ju  (zapachu) 

Ile  więc  jest  gluonów  mających  kolor  i antykolor? 

Ponieważ  kolory  są  trzy,  więc  wydawałoby  się,  że 
gluonów  musi  być  dziewięć.  Jednak  trzy  układy  ko- 
lorów, cc,  zz,  nn  nie  zmieniają  koloru  kwarku.  Nie 
oznacza  to,  że  gluony  mające  takie  pary  kolorów 
nie  rozróżniają  wcale  kolorów  kwarków,  gdyż  np. 
gluon  cc  może  być  wysłany  tylko  z kwarku  czerwone- 
go. Jedynie  znana  nam  już  całkowicie  symetryczna 
kombinacja  kolorów  cc+zz+nn  (singlet  kolorowy) 
nie  wyróżnia  żadnego  koloru  kwarków.  Wysłanie 
takiego  gluonu  nie  zmieniłoby  nawet  względnych 
znaków  amplitud  falowych  odpowiadających  kwar- 
kom o różnych  kolorach.  Taki  bezbarwny  gluon 
musi  być  wyeliminowany  z teorii,  w której  obowiązuje 
reguła,  że  wszystkie  singlety  kolorowe  nie  są  uwię- 
zione w hadronach,  mogą  być  więc  obserwowane 
w doświadczeniach  i wymieniane  w reakcjach  między 
hadronami.  Teoria  minimalna  zawiera  więc  osiem 
gluonów  o masie  zero  i spinie  1 . Dodajmy  jeszcze,  że 
gluony  nie  mają  ładunku  elektrycznego  i nie  biorą 
udziału  w oddziaływaniach  słabych. 

Podstawą  chromodynamiki  kwantowej  zbudowanej 
na  wzór  elektrodynamiki  kwantowej  są  elementarne 
procesy  wysyłania  i pochłaniania  gluonów  przez 
kwarki  oraz  kreacji  par  kwark-antykwark  przez  gluo- 
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kwark  ny  a także  anihilacji  tych  par  z wytworzeniem  gluo- 
fizyczny  nów.  Teoria  ta  różni  się  od  elektrodynamiki  jedynie 
liczbą  nośników  sił — gluonów  oraz  większą  stałą 
sprzężenia,  <xc  « 1/2-  Kwark  fizyczny,  podobnie  jak 
poprzednio  elektron,  składa  się,  z prawdopodobień- 
stwem bliskim  jedności,  z kwarku  pozbawionego 
struktury,  z prawdopodobieństwem  rzędu  (ac)2  « 7« 
z kwarku  i gluonu,  z prawdopodobieństwem  rzędu 
(ac)4  « Vi6  z kwarku  oraz  pary  kwark-anty kwark  itd. 
Podobnie  proton  składa  się  z trzech  punktowych 
kwarków  uud  z prawdopodobieństwem  niewiele  róż- 
nym od  jedności.  To  wszystko  jest  jednak  prawdziwe 
jedynie  w odniesieniu  do  wewnętrznego  obszaru  pro- 
tonu, położonego  blisko  środka,  i ten  właśnie  obszar 
był  badany  w doświadczeniach  nieelastycznego  roz- 
praszania elektronów  na  nukleonach.  W obszarze  ze- 
wnętrznym na  kwarki  i gluony  działają  ogromne  siły 
nie  pozwalające  im  na  opuszczenie  hadronów.  Tak 
więc  dla  dużych  odległości  między  kwarkami  stała 
sprzężenia  ac  z niewyjaśnionych  do  końca  powodów 
silnie  wzrasta  i nie  możemy  już  klasyfikować  składu 
hadronów  mówiąc  o trzech  kwarkach  pozbawionych 
struktury  itp.  W zewnętrznych  regionach  hadronu 
kwarki  mają  bogatą,  trudną  do  opisania  strukturę. 
Jednak  przedstawiony  poprzednio  kwarkowy  obraz 
hadronów  nadal  obowiązuje,  choć  przeważnie  nie  są 
to  kwarki  bez  struktury. 

Przeprowadzona  analiza  własności  i symetrii  ha- 
dronów nie  zależała  oczywiście  od  tego,  czy  kwarki 
wewnątrz  hadronów  miały  jakąś  strukturę,  czy  też 
były  punktowe.  Ważne  tam  były  tylko  masy,  rodzaje 
oraz  liczba  kwarków'. 

Zastanówmy  się  jeszcze,  jak  chromodynamika  kwan- 
towa opisuje  reakcje  produkcji  dodatkowych  hadro- 
nów (głównie  mezonów)  w procesach  ich  rozprasza- 
nia. Będzie  to  analiza  czysto  jakościowa,  ponieważ 
zarówno  mechanizm  uwięzienia  kwarków,  jak  i włas- 
ności kwarków  znajdujących  się  w pobliżu  brzegów 
hadronu  nie  dają  się  łatwo  opisać  przy  użyciu  metod 
rachunkowych  kwantowej  teorii  pola.  Są  to  obszary 
teorii  wkraczające  w dziedzinę,  którą  można  nazwać 
chemią  oddziaływań  silnych  i jako  .takie  mogą  być 
traktowane  jedynie  fenomenologicznie. 


Fenomenologiczny  opis  oddziaływań 
silnych 

Wyobraźmy  sobie,  że  para  kwarków  jest  uwięziona 
w obszarze  mezonowym  o określonej  z grubsza  obję- 
tości. Zderzając  ten  mezon  z innym  hadronem  lub 
też  elektronem  możemy  jednemu  z kwarków  nadać 
duży  pęd  względem  kwarku  drugiego  (rys.  12).  Obszar 


Rys.  12.  Produkcja  dwóch  mezonów  n~  i n^_  z mezonu  n 0 na- 
stępuje w wyniku  kreacji  dodatkowej  pary  dd 


mezonowy  zaczyna  się  rozciągać  i słabe,  rozproszone 
początkowo  statyczne  pole  gluonowe  (o  bardzo  po- 
dobnych własnościach  do  fotonowego  pola  elektro- 
statycznego) zaczyna  się  wydłużać  i przybiera  postać 
pola  jednorodnego.  Na  kwarki  zaczyna  wtedy  działać 
stała  siła,  a energia  obszaru  mezonowego  zaczyna  być 
proporcjonalna  do  jego  długości.  W pewnym  momen- 
cie energia  jest  tak  duża,  że  wystarcza  na  utworzenie 
nowej  pary  kwark-anty  kwark.  Na  tych  nowych  cząst- 
kach zamykają  się  teraz  linie  sił  pola  gluonowego 
i obszar  mezonowy  rozpada  się  na  dwa  nowe  mezony. 
Proces  ten  powtarza  się  prowadząc  do  wytworzenia 
wielocząstkowego  stanu  końcowego.  W ten  sposób 
w zderzeniach  cząstek  z hadronami  produkowane  są 
inne  hadrony.  Widzimy,  że  zawsze  polega  to  na  wy- 
tworzeniu wzbudzonego  stanu  mezonowego,  a na- 
stępnie na  jego  rozpadzie.  Własności  tego  stanu  wzbu- 
dzonego nie  zależą  od  rodzaju  cząstki,  która  wywo- 
łała wzbudzenie  (elektron,  mezon  7 r,  proton),  a jedynie 
od  przekazanego  kwarkom  pędu.  Procesy  produkcji 
wielu  cząstek  powinny  więc  wyglądać  podobnie  bez 
względu  na  rodzaj  zderzających  się  cząstek.  Fakt  ten 
bardzo  dobrze  zgadza  się  z wynikami  wielu  doświad- 
czeń. 

A dlaczego  mówimy  często,  że  w oddziaływaniach 
wewnątrzjądrowych  i innych  oddziaływaniach  silnych 
decydującą  rolę  odgrywa  wymiana  mezonów,  np.  me- 
zonu 7t,  a nie  wymiana  gluonów?  Otóż  w krótkich 
przedziałach  czasu  nieokreśloność  energii  (masy) 
hadronu  staje  się  na  tyle  duża,  że  hadron  ten  może 
wydłużyć  się  i pęknąć  wysyłając  np.  wirtualny  mezon 
7i,  który  następnie  może  zostać  pochłonięty  przez  inny 
lub  ten  sam  hadron.  Z fenomenologicznego  więc  punk- 
tu widzenia  oddziaływania  silne  to  wymiana  wirtual- 
nych mezonów  n i innych  hadronów.  Podobnie  można 
opisywać  fenomenologicznie  strukturę  np.  protonu 
jako  cząstki  złożonej  częściowo  (z  pewnym  prawdo- 
podobieństwem) z pojedynczego  protonu,  częściowo 
z protonu  i mezonu  n itd.  Taki  obraz  oddziaływań  sil- 
nych i struktury  hadronów  mógłby  być  najbardziej 
odpowiedni  do  opisu  większości  reakcji  z udziałem 
hadronów.  W reakcjach  tych  bowiem  przeważnie 
bierze  udział  zewnętrzna  część  hadronów,  a wtedy 
nie  można  już  stosować  prostych  metod  rachunko- 
wych lokalnej  chromodynamiki  kwantowej.  Niestety, 
prawdopodobieństwo  wysłania  np.  wirtualnego  me- 
zonu 7i  z protonu  jest  duże  i związana  z tym  procesem 
stała  sprzężenia  wynosi  aż  14,4.  Nie  można  więc  sto- 
sować takiego  rachunku  zaburzeń  (diagramów  Feyn- 
mana),  jaki  stał  się  podstawą  sukcesów  elektrodyna- 
miki kwantowej.  Pozostają  metody  znacznie  bardziej 
złożone,  do  jakich  należy  np.  model  wymiany  biegu- 
nów Reggego  (->  Oddziaływania  silne),  wykorzystanie 
tzw.  związków  dyspersyjnych  itp.  Metody  te  zupełnie 
poprawnie  opisują  wielką  ilość  danych  doświadczal- 
nych dotyczących  rozpraszania  i produkcji  hadronów. 
Warto  jednak  pamiętać,  że  znikoma  zaledwie  część 
tych  danych  ma  bezpośredni  związek  z lokalnymi  od- 
działywaniami kwarków  i gluonów,  a te  przecież  sta- 
nowią fundament  wszystkich  oddziaływań  silnych. 
Podobnie  analizując  widmo  promieniowania  jakiej- 
kolwiek cząsteczki  chemicznej  nie  domyślilibyśmy  się 
łatwo,  że  struktura  tej  cząsteczki  opiera  się  na  jednym 
prostym  prawie  Coulomba.  Dopiero  zbadanie  szcze- 
gólnego rodzaju  widma  — widma  atomu  wodoru  — 
wyjaśniłoby  szybko  naturę  owego  fundamentalnego 
rodzaju  sił. 

Materia  jest  prawie  zawsze  bardzo  złożona  i od- 
krycie najprostszych  rządzących  nią  zasad  wymaga 
przeprowadzenia  bardzo  szczególnych  doświadczeń. 
Są  to  zwykle  doświadczenia  zupełnie  dla  danej  dzie- 
dziny nietypowe.  Takimi  właśnie  były  doświadczenia 
nieelastycznego  rozpraszania  elektronów  na  nukleo^ 
nach,  dzięki  którym  dowiedzieliśmy  się,  że  kwarki 
nie  mają  struktury. 

G.  Białkowski,  R.  Sosnowski  Cząstki  elementarne , War- 
szawa 1971;  L.N.  Cooper  Istota  i struktura  fizyki , Warszawa 
1975;  R.P.  Feynman  i in.  Feynmana  wykłady  z fizyki,  t.  3,  War- 
szawa 1974. 
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Atomy  egzotyczne 

Janusz  Zakrzewski 

Atom  zwyczajny  o liczbie  atomowej  Z składa  się 
z jądra  o ładunku  dodatnim  +Zqey  wiążącego  za  po- 
średnictwem oddziaływania  elektromagnetycznego 
(przyciągających  sił  kulombowskich)  Z ujemnie  nała- 
dowanych elektronów,  z których  każdy  ma  ładunek 
elementarny  -qe  (\qe\  = 1,6*  10“19C).  Jako  całość 
atom  jest  więc  elektrycznie  obojętny.  Składnikami 
zwyczajnego  jądra  są  nukleony:  Z dodatnio  nałado- 
wanych protonów,  każdy  o ładunku  +qfy  oraz  (A  -Z) 
obojętnych  elektrycznie  neutronów  (A  jest  liczbą  ma- 
sową jądra  oznaczonego  symbolem  zX). 

Najprostszym  atomem  zwyczajnym  jest  atom  wo- 
doru, składający  się  z protonu,  deuteronu  lub  trytonu 
jako  jądra  i jednego  elektronu  powłokowego.  Jeżeli 
w takim  atomie  jądro  zostanie  zastąpione  cząstką 
elementarną,  naładowaną  dodatnio,  np.  pozytonem 
e+  lub  mionem  (lepton  /*+),  powstanie  układ  zwią- 
zany cząstki  dodatniej  i ujemnego  elektronu,  zwany 
odpowiednio  pozytonium  (e+e~)  lub  mionium 
(,u+e~).  Jeżeli  natomiast  w atomie  zwyczajnym  o licz- 
bie atomowej  Z jeden  z elektronów  powłokowych  e~ 
atomy  zostanie  zastąpiony  cząstką  elementarną  naładowaną 
mionowe,  ujemnie,  np.  mionem  (lepton  n~\  pionem  (mezon 
pionowe,  kaonem  (mezon  K~)y  antyprotonem/?  lub  hipe- 
kaonowe,  ronem  Z-,  powstanie  odpowiednio  atom  mionowy, 
antyproto-  pionowy,  kaonowy,  antyprotonowy  lub  hiperonowy 
nowe  i hipe-  (r*  Cząstki  elementarne  i ich  oddziaływania).  Składa 
r ono  we  się  on  z jądra  o liczbie  atomowej  Z,  cząstki  ujemnej 
(o  masie  o wiele  większej  niż  elektron)  związanej 
w polu  kul ombowskim  jądra  oraz  (Z— 1)  elektronów 
powłokowych.  Takie  atomy  będziemy  zwali  ogólnie 
atomami  egzotycznymi;  stosuje  się  też  często  ogólną 
nazwę  mezoatomyJub  atomy  mezonowe  (i  to  nie  tylko 
w tych  wypadkach,  gdy  cząstką  związaną  jest  mezon 
n ozy  K~y  lecz  i wtedy,  gdy  jest  nią  lepton  pr  lub 
barion  — anty  proton  czy  hiperon  Z~). 

Wszystkie  wymienione  atomy  egzotyczne  zostały 
zaobserwowane  w doświadczeniach.  Pierwszej  obser- 
wacji egzotycznych  atomów  mionowych  dokonano 
w 1947  r.  i w tym  samym  roku  pojawiły  się  pierwsze 
analizy  teoretyczne  tego  zjawiska.  Atomy  egzotyczne 
stanowią  do  chwili  obecnej  przedmiot  intensywnych 
badań  eksperymentalnych  i teoretycznych,  dostar- 
czających informacji  o własnościach  cząstek  elemen- 
tarnych, ich  oddziaływaniach  z nukleonami  oraz 
o strukturze  jąder  atomowych. 

Ponieważ  atomy  mionowe  i pionowe  bada  się 
przeszło  25  lat,  w dalszym  ciągu  omówimy  jedynie 
najnowsze  wyniki  doświadczeń  nad  atomami  hadro- 
nowymi  (hadroatomami)  — kaonowymi,  antyproto- 
nowymi  i hiperonowymi.  Badania  w tej  dziedzinie 
rozwinęły  się  dopiero  w latach  siedemdziesiątych,  gdy 
w kilku  laboratoriach  dysponujących  akceleratorami 
protonowymi  wielkich  energii  (Argonne,  Berkeley, 
Brookhaven,  Genewa)  wytworzono  intensywne  wiązki 
cząstek  ujemnych  o małej  energii.  Umożliwiło  to  za- 
stosowanie liczników  półprzewodnikowych,  germa- 
nowych i krzemowych,  do  badania  mezoa tomów  za- 
wierających mezony  K~y  hiperony  i antyprotony. 


Procesy  elektromagnetyczne 

Omówimy  wpierw  zjawiska  wspólne  dla  wszystkich 
atomów  egzotycznych.  Historię  życia  cząstki  nałado- 
wanej, która  utworzyła  atom  egzotyczny  w ośrodku 
materialnym,  do  momentu  jej  zniknięcia  w końcowym 
procesie  oddziaływania  można  podzielić  na  trzy  etapy : 
spowolnienie  spowolnienie,  wychwyt  atomowy  i deekscytację  utwo- 
rzonego atomu  egzotycznego.  Wszystkie  trzy  procesy 
wywołane  są  oddziaływaniem  elektromagnetycznym. 
Końcowy  proces  oddziaływania  — rozpad  lub  absorp- 
cja jądrowa  — zależy  od  rodzaju  cząstki. 
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Poruszając  się  w ośrodku  materialnym,  cząstka  na- 
ładowana ujemnie,  traci  swą  energię  kinetyczną  w od- 
działywaniu elektromagnetycznym  z atomami  ośrod- 
ka na  wzbudzanie  ich  i jonizację.  Czas  potrzebny  na 
spowolnienie  cząstki  od  typowej  energii  ok.  100  MeV 
do  ok.  2 keV  wynosi  w przybliżeniu  10“10-10"9  s. 
Gdy  energia  cząstki  staje  się  dostatecznie  mała,  cząst- 
ka może  ulec  schwytaniu  przez  pole  kulombowskie 
jądra  atomu  ośrodka  i zastąpić  w atomie  jeden  z jego 
elektronów  powłokowych,  który  ulegnie  wyrzuceniu 
z atomu  w tzw.  procesie  Augera: 

cząstka  -f  atom  -►  atom  egzotyczny  + elektron. 
Powstaje  atom  egzotyczny  w stanie  wysoce  wzbu- 
dzonym. Podstawowe  własności  tego  atomu  można 
opisać  poglądowo  posługując  się  najprostszym  mode- 
lem atomu  — modelem  Bohra,  z którego  wynika,  że 
energia  cząstki  ujemnej  związanej  w polu  kulombow- 
skim  jądra  punktowego  o liczbie  atomowej  Z (wpływ 
pozostałych  elektronów  powłokowych  jest  tu  pomi- 
nięty) może  mieć  wartości 


En  = - 


fic2  i 

f olZ' 

2 1 

(1) 


promień  zaś  orbity  kołowej,  odpowiadającej  stanowi 
o głównej  liczbie  kwantowej  ny  wynosi 


rn  — — (2) 

, . uc  ccZ  y v } 

m,(l  +mlmA)  ->est  mas3  zredukowaną  cząst- 
ki o masie  spoczynkowej  m i jądra  o masie  spoczyn- 

kowej  mA,  oc  x 1/137  jest  stałą  struktury  subtelnej, 
c = 3 108  m/s  — prędkością  światła  w próżni,  a h = 
- h/2n  = 1,05  10"34  J-s  — stałą  Plancka.  Taki  sam 
wzór  na  energię  stanów  stacjonarnych  otrzymuje  się 
z nierelatywistycznego  równania  falowego  — rów- 
nania Schródingera  (— ► Spektroskopia  atomowa. 
Chemia  kwantowa). 

Ze  wzorów  (1)  i (2)  otrzymujemy  następujące  związ- 
ki między  energią  En  oraz  promieniem  bohrowskim  rn 
cząstki  w atomie  egzotycznym  i odpowiednimi  wiel- 
kościami atomu  zwyczajnego  w stanie  o tej  samej  licz- 
bie kwantowej  n: 

En  — Ene(j*) f*e\  rn  — rne{j*el (*)  , 


gdzie  symbole  ze  wskaźnikiem  e odnoszą  się  do  elek- 
tronu w atomie  zwyczajnym.  Zatem  w atomie  egzo- 
tycznym poziomy  energii  leżą  o wiele  niżej  (mają  więk- 
szą wartość  bezwzględną),  a promienie  bohrowskie 
są  o wiele  mniejsze  niż  w atomie  zwyczajnym  (nawet 
dla  cząstki  o najmniejszej  masie  — mionu  — war- 
tość fi/pe  ~ 207).  Tylko  w stanie  o dużych  wartościach 
głównej  liczby  kwantowej  n jądro  jest  osłaniane  przez 
elektrony  powłokowe.  Przy  mniejszych  wartościach  n 
wszystkie  elektrony  powłokowe  są  znacznie  dalej  od 
jądra,  tak  że  cząstkę  w atomie  egzotycznym  można 


Własności  cząstek  i tworzonych  przez  nie  atomów 
egzotycznych  (wg  modelu  Bohra) 
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Wartości  obliczone  przy  założeniu  nieskończenie  dużej  masy  ją- 
dra; E0  — 13,6  eV,  a0  — 5,3  -104  fm  są  wartościami  energii  i pro- 
mienia Bohra  zwyczajnego  atomu  wodoru  (wg  N.  Barash-Schmi- 
dta  i in.,  1980). 
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traktować  z dobrym  przybliżeniem  jak  elektron  w ato- 
mie wodoropodobnym  (o  jednym  elektronie).  Stan 
cząstki  na  orbicie  bohrowskiej  o promieniu  r„  równym 
promieniowi  rle  elektronu  o najniższej  energii  Eu 
\ne  — 1)  jest  nadal  stanem  wysoce  wzbudzonym:  od- 
powiada mu  główna  liczba  kwantowa  n = |/ (/'/za- 
wartości tej  liczby  n oraz  energii  wiązania  Eb  — —Ex 
i promieni  bohrowskich  m — r x cząstek  w stanach 
podstawowych  różnych  atomów  egzotycznych  podane 
są  w tabeli  wraz  z masami  m i średnimi  czasami  życia  r 
tych  cząstek  — składników  odpowiednich  atomów. 

Przy  analizie  danych  doświadczalnych  energie  sta- 
nów w atomie  egzotycznym  należy  obliczać  dokład- 
niej, niż  na  to  pozwala  model  Bohra.  Stosuje  się  za- 
tem relatywistyczne  równanie  falowe:  Kleina-Gor- 
dona  dla  cząstki  o spinie  0 (bozonu  — np.  pionu, 
kaonu)  lub  Diraca  dla  cząstki  o spinie  */*  (fermionu  — 
np.  mionu,  antyprotonu,  hiperonu  E~).  Przy  zało- 
żeniu, że  jądro  jest  punktowa,  wzór  na  energię  wyni- 
kający z tych  równań  ma  postać : 


gdzie  dla  bozonu  j /,  dla  fermionu  zaś  j — /±7 2, 
przy  czym  / jest  orbitalną  liczbą  kwantową.  (Wzór  (1) 
stanowi  przybliżenie  wzoru  (3),  jeśli  się  w nawiasie 
kwadratowym  pominie  mniejsze  od  1 wyrazy  zawie- 
rające czynnik  a Z).  Widać,  że  dla  fermionów  poziomy 
energii  E„,j  są  rozszczepione  wskutek  istnienia  włas- 
nego momentu  magnetycznego  cząstki,  tworzą  dublety 
struktury  subtelnej  (tej  samej  wartości  n odpowiadają 
dwie  wartości/).  Wyrażenie  na  energię  należy  uzupeł- 
nić dodając  do  wzoru  (3)  poprawki  wynikające  z 
uwzględnienia  skończonych  rozmiarów  jądra  (roz- 
kładu ładunku  w jądrze),  poprawki  promieniste  (wy- 
nikające przede  wszystkim  z efektu  polaryzacji  próżni) 
oraz  poprawki  uwzględniające  osłanianie  elektronów 
powłokowych  (do  pominięcia  przy  małych  wartoś- 
ciach n ).  Energię  Eem  stanu  w atomie  egzotycznym 
z uwzględnieniem  wszystkich  poprawek  elektromag- 
netycznych A Eem  można  ostatecznie  zapisać  w posta- 
ci : 

Eem  = EkG.dĄ-  AEem,  (4) 


gdzie  członem  dominującym  (Ekg,d)  jest  energia  wy- 
nikająca z równania  Kleina-G ordona  lub  Diraca. 

Poziomy  energii  w atomie  egzotycznym  można  wy- 
znaczać badając  promieniowanie  wysyłane  w procesie 
deekscytacji  powstałego  atomu  wzbudzonego,  tzn. 
przy  przejściach  elektromagnetycznych  między  pozio- 
mami. W procesie  deekscytacji  atom  pozbywa  się 
energii  wzbudzenia,  równej  różnicy  energii  stanu  po- 
czątkowego p i końcowego  k \ Ev  Ek  pozbywa 

się  jej  w postaci  energii  kinetycznej  elektronu  powło- 
kowego, wyrzuconego  z atomu  w procesie  Augera, 
lub  promieniowania  rentgenowskiego  o częstości  cu. 
Proces  pierwszy  dominuje  we  wczesnych  etapach  roz- 
wijającej się  w atomie  egzotyczriym  kaskady  elektro- 
magnetycznej, drugi  — w stanach  o mniejszych  war- 
tościach głównej  liczby  kwantowej  /?,  jak  to  ilustruje 
schemat  poziomów  energii  dla  kaonowego  atomu  siar- 
ki (rys.  1).  Reguły  wyboru  rządzące  tymi  procesami, 
At  — £ 1 (z  uprzywilejowaniem  Ai  = — 1 i z dopusz- 
czalnie małą  zmianą  An  dla  procesu  Augera,  a dużą 
dla  promieniowania  rentgenowskiego)  powodują,  że 
cząstka  zmierza  do  stanu  o maksymalnej  wartości 
orbitalnej  liczby  kwantowej  / = #7—1  (do  „orbity 
kołowej”  — w języku  prostego  modelu  Bohra). 
Z chwilą  osiągnięcia  stanu  o liczbach  kwantowych 
(#?,  / — n — 1 ) zachodzą  tylko  przejścia  elektromagne- 
tyczne typu  (#7,  #7  — 1)  ->■  (#7—  1 , #7  2)  ->  (#7  — 2,  #7  — 3)-> 

...,  tzn.  przejścia  między  kolejnymi  orbitami  koło- 
wymi. Całość  procesów  elektromagnetycznych,  spro- 
wadzających cząstkę  do  najniższego  stanu,  w którym 
następuje  końcowy  proces  oddziaływania,  trwa  w su- 
mie 10“12-I0“10  s. 


Badanie  własności  cząstek  elementarnych 

Informacje  o utworzeniu  i deekscytacji  atomu  egzo- 
tycznego pochodzą  przede  wszystkim  z obserwacji 
promieniowania  rentgenowskiego.  Pomiary  energii 
przeprowadza  się  przy  użyciu  detektorów  półprzewod- 
nikowych o rozdzielczości  energetycznej  AEjE  < 10" 2 
w zakresie  energii  ok.  100  keV.  Identyfikacji  przejść 
elektromagnetycznych  zachodzących  z emisją  promie- 
niowania rentgenowskiego  dokonuje  się  na  podstawie 
porównania  precyzyjnie  zmierzonych  wartości  energii 
kwantu  hco  z energią  przejścia  Eem  Eem , obliczoną 
z dużą  dokładnością  ze  wzorów  (3)  i (4).  Identyfikację 
taką  opiera  się  na  obserwacji  serii  widmowych  zna- 
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Rys.  1.  Schemat  poziomów  energii  kaonowego  atomu  siarki  SK~.  Wychwyt  atomowy  kaonów  prowadzi  do  obsadzenia  poziomów 
z prawdopodobieństwem  proporcjonalnym  do  (2 /+  1).  Przejścia  o największym  natężeniu,  w miarę  rozwoju  kaskady  elektromagnetycz- 
nej, zachodzą  między  orbitami  kołowymi.  Kaskada  urywa  się  po  osiągnięciu  poziomu  3rf  wskutek  absorpcji  jądrowej;  ostatnim  przej- 
ściem obserwowanym  w atomie  siarki  jest  4/— > 3 d (wg  H.  Kccha,  1973) 
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liczba  zliczeń 


energia  Rys  2.  Widmo  promieniowania  rentgenowskiego  kaonowych  ato- 
mów fosforu  j $Pk~.  Linie  7 — > 6,  6 — > 5,  5 — * 4,  4 — > 3 oraz 
9 4,  8 ->  4.  7 -+  4,  6-^4  (przejście  do  stanu  o nic  — 4)  są 

liniami  odpowiadającymi  przejściom  kaonowym.  Widać  też  li- 
nie widma  atomów  hiperonowych(I7  7 — ► 6 i L 6 —►5)  i linie  wi- 
dma atomów  pionowych  (n  4 — > 3,  n 3 — > 2)  oraz  linie  wzorco- 
wania y.  Linia  4 — ► 3 wykazuje  poszerzenie  spowodowane  od- 
działywaniem silnym  (wg  G,  Backenstossa  i in.,  1974) 


pomiar  masy 


nych  ze  zwyczajnej  spektroskopii  rentgenowskiej. 
Rysunek  2 przedstawia  widmo  promieniowania  rent- 
genowskiego kaonowych  atomów  fosforu  i6P — 
z zaznaczonymi  przejściami  (np— /**)  między  stanami 
o głównych  liczbach  kwantowych  stanu  początkowego 
nv  i końcowego  n*. 

Pomiar  energii  przejścia  atomu  egzotycznego  umoż- 
liwia wyznaczenie  masy  cząstki  schwytanej  przez  taki 
atom  (masa  cząstki  występuje  we  wzorze  na  energię 
przejścia  w atomie  egzotycznym).  Jedne  z najdokład- 
niejszych pomiarów  mas  hadronów  ujemnych  po- 
chodzą właśnie  z wyznaczenia  energii  atomów  egzo- 
tycznych. Z precyzyjnych  pomiarów  energii  przejścia 
między  stanami  o dostatecznie  dużych  wartościach 
liczby  n w kaonowych  atomach  baru  BaK_  (5  < n < 
< 11)  i złota  Aux_(6  < n < 12)  oraz  ołowiu 
Pb^-(7  < n < 13)  wyznaczono  w dwóch  niezależ- 
nych doświadczeniach,  wykonanych  w latach  siedem- 
dziesiątych masę  mezonu  K~  i otrzymano  wartości 
zgodne  w granicach  błędu;  ich  wartość  średnia  wy- 
nosiła 


= 493,667  ±0,01 7 MeV, 


z błędem  względnym  3,5  10“5.  Wyznaczono  wówczas 
również  masę  hiperonu  27”  na  podstawie  obserwacji 
promieniowania  rentgenowskiego  hiperonowych  ato- 
mów ołowiu  Pbri(9  < n < 16)  i otrzymano  wartość 


mz-  = 1197,24±0,14  MeV, 


zgodną  z wynikami  pomiarów  za  pomocą  emulsji 
jądrowej  mz-  = 1197,24±0,23  MeV  oraz  z wynikiem 
uzyskanym  przy  użyciu  komory  pęcherzykowej 
mz-  = 11 97,43  ±0,08  MeV.  Dokonano  też  pomiaru 
masy  antyprotonu  posługując  się  antyprotonowymi 
atomami  ołowiu  Pb^  (9  < n < 17); 


mp  = 938,179±0,058  MeV. 

Odejmując  tę  wartość  od  masy  protonu  otrzymuje 
się  różnicę  mas  protonu  i antyprotonu,  mp—mp  = 
= 100 ±58  keV,  równą  zeru  w granicach  błędu, 
pomiar  zgodnie  z przewidywaniami  elektrodynamiki  kwan- 

momentów  towej.  • * 

mag  nety cz-  Rozszczepienie  struktury  subtelnej  linii  promienio- 
wych wania  rentgenowskiego  jest  w pierwszym  przybliżeniu 
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Rys.  3.  Przejście  11—*  10  w anty  protonowych  atomach  uranu 
wykazujące  rozszczepienie  struktury  subtelnej  spowodowane 
przez  moment  magnetyczny  antyprotonu  (wg  L.  Tauschera,  1975) 


proporcjonalne  do  momentu  magnetycznego  cząstki 
związanej  w atomie  egzotycznym.  Na  tej  podstawie 
zmierzono  moment  magnetyczny  antyprotonu  w 
dwóch  niezależnych  eksperymentach,  w których  bada- 
no przejścia  11  -*■  10  w anty  protonowych  atomach 
ołowiu  Pbp  i uranu  Up  (rys.  3).  Uzyskano  wartości : 

= —2,819  ±0,056^ 

oraz 

lip  — —2,790  ±0,021  fiNy 

zgodne  ze  sobą  oraz  bliskie  wartości  momentu  ma- 
gnetycznego protonu  iip  — 2,7928456^  (jednostką 
momentu  magnetycznego  w fizyce  jądrowej  jest  mag- 
neton  jądrowy  jin  = ftqe!2mp  = 5,05  *10" 27  J*T  1). 

Pomiar  momentu  magnetycznego  hiperonu  27 
jest  znacznie  trudniejszy  ze  względu  na  małe  natężenie 
promieniowania  rentgenowskiego  atomów  hiperono- 
wych i duże  tło  pochodzące  z innych  procesów.  Około 
8-10%  aktów  oddziaływania  mezonów  K~  z jądrami 
tarczy  prowadzi  do  powstania  hiperonów  27".  Tylko 
te  hiperony,  które  przeżyją  procesy  spowalniania,  mo- 
gą ulec  schwytaniu  w polu  kulom bowskim  jądra-tarczy 
i utworzyć  atomy  hiperonowe.  W tym  samym  widmie 
pojawiają  się  więc  linie  promieniowania  atomów  kao- 
nowych i pionowych  stanowiące  tło  (zob.  rys.  2). 
Z powyższych  względów  wyznaczenie  momentu  mag- 
netycznego hiperonu  27“  jest  mniej  pewne  i opiera  się 
na  subtelnej  analizie  statystycznej  widma. 


Wpływ  oddziaływania  silnego 

Na  elektromagnetyczne  stany  związane  hadronu 
w atomie  egzotycznym  wpływa  oddziaływanie  silne 
hadronu  z jądrem.  Gdy  hadron  jest  związany  w stanie 
o dużej  wartości  liczby  kwantowej  «,  tzn.  w dużej  od- 
ległości od  jądra,  wpływ  tego  oddziaływania  ze  wzglę- 
du na  jego  krótki  zasięg  jest  pomijalnie  mały  (z  tego 
względu  pomiary  mas  i momentów  magnetycznych 
hadronów  wykonuje  się  dla  przejść  między  stanami 
o dużych  wartościach  liczby  «).  Jednakże  w miarę 
deekscytacji  promienistej  atomu  egzotycznego  cząstka 
osiąga  stan  o mniejszej  wartości  w,  w którym  jej  orbita 
bohrowską  wnika  w obszar  jądra.  W takim  stanie 
wpływ  oddziaływania  silnego  zaczyna  odgrywać  istot- 
ną rolę  i powoduje  odstępstwa  od  schematu  elektro- 
magnetycznych poziomów  energii  (zob.  wzór  4). 
Wpływ  ten  można  zaobserwować  za  pośrednictwem 
trzech  zjawisk:  przesunięcia  poziomu  energii 
jego  poszerzenia  ra  oraz  zmniejszenia  wydajności  Y 
przejść  z emisją  promieniowania  rentgenowskiego 
wskutek  absorpcji  jądrowej,  stanowiącej  najbardziej 
prawdopodobny  końcowy  proces  oddziaływania  ha- 
dronu. 


keV 


iTobi»  z uwzględnieniem  wszelkich  poprawek  elektro- 
magnetycznych (zob.  wzór  4):  AEn  = Eeksp  — iiobi- 
Szerokość  poziomu  Ta,  spowodowana  oddziaływa- 
niem silnym,  jest  związana  z szybkością  Wa  absorpcji 
jądrowej  z tego  poziomu:  ra  = hWa.  Można  je  wy- 
znaczyć bezpośrednio,  obserwując  poszerzenie  linii 
promieniowania  rentgenowskiego,  co  widać  na  przy- 
kładzie przejścia  4 3 w atomie  PK-  (rys.  2).  Otrzy- 

muje się  w ten  sposób  szerokość  /'"(/z—  1,  / = n — 2) 
poziomu  niższego,  z którego  hadron  jest  absorbowany 
z prawdopodobieństwem  100%  (zob.  rys.  I);  jest  ona 
o 2-3  rzędy  wielkości  większa  od  szerokości  r ™ 
{n,l  = n—  I)  poziomu  wyższego,  fa  = A(p/F  — 1)  — 
~rA  można  obliczyć  mierząc  wydajność  Y przejść  z 
emisją  promieniowania  rentgenowskiego.  Jest  ona 
związaną  z prawdopodobieństwem  obsadzenia  pozio- 
mu wyższego,  które  albo  oblicza  się  uwzględniając  roz- 
wój kaskady  elektromagnetycznej  w atomie  egzotycz- 
nym albo  wyznacza  się  doświadczalnie,  mierząc  wydaj- 
ność wszystkich  przejść  elektromagnetycznych  zasila- 
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jących  ten  poziom.  W tabeli  przytoczono  niektóre 
dane  dla  atomów  kaonowych,  ilustrujące  wartości 
omawianych  wyżej  wielkości.  Tego  rodzaju  dane  sta- 
nowią ważny  sprawdzian  każdej  teorii  usiłującej  opi- 
sać oddziaływanie  silne  hadronu  z jądrem. 


absorpcja  Absorpcja  jądrowa  staje  się  dominująca  po  przejściu 

jądrowa  do  następnego,  niższego  poziomu,  o liczbie  kwanto- 
wej n—  1;  hadron  ulega  unicestwieniu  w oddziaływa- 
niu silnym,  o czym  świadczy  urywanie  się  serii  wid- 
mowej. Widać  to  z rys.  4,  przedstawiającego  zależność 
wydajności  przejścia  rentgenowskiego  od  liczby  ato- 
mowej Z atomów  kaonowych,  zmierzonej  w zakresie 
od  Z = 2 do  Z = 92.  Rysunek  ten  ilustruje  najbar- 
dziej charakterystyczną  cechę  atomów  hadronowych 
świadczącą  o jądrowej  absorpcji  hadronów  — zmniej- 
szanie się  natężenia  określonego  przejścia  (n,  n — 1)  -* 
->  (n—  1,  n— 2)  w miarę  zwiększania  się  liczby  ato- 
mowej pierwiastka,  z ostatecznym  zniknięciem  tego 


Rys.  4.  Wydajność  przejść  rentgenowskich  między  orbitami  ko- 
łowymi w atomach  kaonowych.  Kończenie  się  danego  przejścia 
przy  określonej  wartości  liczby  atomowej  Z stanowi  najbardziej 
charakterystyczną  cechę  hadronowych  atomów  egzotycznych 
(wg  E.  Wieganda  i G.  L.  Godfreya,  1974) 

przejścia  przy  pewnej  wartości  Z.  Zmiany  wydajności 
przejścia,  w tym  minima  przy  wartościach  Z ok.  28, 
38,  60  i 75,  wiążą  się  z procesem  atomowego  wychwytu 
kaonu  i wynikającym  stąd  obsadzeniem  początko- 
wych stanów  w atomie  egzotycznym. 

Przesunięcie  i poszerzenie  poziomów  energii 

Wskutek  oddziaływania  silnego  poziom  energii  ulega 
przesunięciu  AEn , które  się  definiuje  jako  różnicę 
między  wartością  energii  zmierzonej  Z^ksp  i obliczonej 


Procesy  absorpcji  jądrowej 

Absorpcja  jądrowa  hadronu  w atomie  egzotycznym 
zachodzi  w elementarnym  procesie  silnego  oddziały- 
wania hadronu  z nukleonami.  Dla  mezonów  K~  do-  absorpcja  K 
minuje  proces  oddziaływania  jednonukleonowego 
z produkcją  mezonu  n (oddziaływanie  mezonowe): 

tf--l-Ar-*r(lub 

'->  Z +N  -+  A+N  (w  materii  jądrowej), 

gdzie  N oznacza  nukleon  (proton  lub  neutron),  a Z 
i A — odpowiednie  hiperony  (w  stanie  końcowym 
muszą  się  pojawiać  hiperony  Z lub  A ze  względu  na 
zasadę  zachowania  dziwności  w silnym  oddziaływa- 
niu). W 20-30%  przypadków  mezon  K~  jest  absorbo- 
wany w oddziaływaniu  dwunukleonowym  (wielonu- 
kleonowym),  bez  produkcji  mezonu  n (oddziaływanie 
niemezonowe): 

K~+2N  Z (\ub  4)4- AT 

Z +N  ->  A+N  w (materii  jądrowej). 

W procesie  takim  bierze  udział  skorelowana  para  nu- 
kleonów, może  więc  on  służyć  do  badania  korelacji 
nukleonowych  w jądrach  atomowych. 

Hiperony  Z-  ulegają  absorpcji  w oddziaływaniu  absorpcja  Z~ 
silnym  z protonami, 

Z~+p  ->  A+n, 

co  prowadzi,  podobnie  jak  w wypadku  kaonów,  do 
powstania  hiperonów  A jako  produktu  końcowego. 

Wskutek  przyciągającego  oddziaływania  silnego  hi- 
peronu A z nukleonami  hiperon  4 może  zostać  zwią- 
zany w materii  jądrowej  i utworzyć  hiperjądro  (-►  Hi- 
perjądra).  Absorpcja  jądrowa  antyprotonów  zachodzi  absorpcja  p 
w procesie  anihilacji  z produkcją  wielu  mezonów, 
głównie  pionów: 

p+N  ->  7r-f  n. 


\ 
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We  wszystkich  dyskutowanych  wyżej  wypadkach 
wpływ  oddziaływań  silnych  uwzględnia  się  przez 
wprow-adzenie  do  falowego  równania  jądrowego  po- 
tencjału optycznego,  opisującego  oddziaływanie  ha- 
dronu z jądrem  (— ► Siły  jądrowe).  Najprostszą  postać 
dla  kaonów  ma  potencjał  proporcjonalny  do  gęstości 
materii  jądrowej  £>(r): 


gdzie  niK-  i mw  oznaczają  masy  mezonu  K~  i nukleo- 
nu, fi  — masę  zredukowaną  układu  kaon-jądro,  A zaś 
jest  parametrem  zespolonym.  Przyjmuje  się  przy  tym, 
dla  uproszczenia,  że  rozkład  neutronów'  i protonów 
jest  taki  sam  ęn(r)  = QP(r)  = ę(r)  i że  jest  równy  gęsto- 
ści ładunku  w jądrze.  Opis  oddziaływania  kaonów  z ją- 
drem jest  jednakże  utrudniony  wskutek  występowania 
w układzie  kaon-proton  podprogowego  stanu  rezo- 
nansowego A (1405)  (-*  Cząstki  elementarne  i ich 
oddziaływania).  Prawdopodobnie  z tego  względu 
prosta  ekstrapolacja  danych  dotyczących  rozprasza- 
nia kaonów  na  nukleonach,  przy  niskich  energiach,  do 
obszaru  energii  odpowiadającego  kaonom  związanym 
w’  atomach  egzotycznch  nie  prowadzi  do  wyników 
zgodnych  z doświadczeniem. 

Poprawny  opis  oddziaływania  kaon-nukleon  w ato- 
mie egzotycznym  umożliwiłby  wykorzystanie  K~ 
(a  także  hiperonów  i anty  protonów)  jako  cząstek 

sondujących  strukturę  jądrową.  Ponieważ  mezony  K~ 
absorbowane  są  głównie  w obszarze  powierzchnio- 
wym, gdzie  gęstość  materii  jądrow;ej  nie  przekracza 
ok.  10%  wartości  centralnej,  można  by  użyć  ich  do 
badania  powierzchni  jądra,  w tym  — rozkładu  neu- 
tronów i protonów  oraz  korelacji  nukleonowych  na 
powierzchni  jądra. 

Absorpcja  jądrowa  mezonów  — pionów  i kao- 
nów — często  prowadzi  do  emisji  ugrupowań  nukleo- 
nowych, w'  szczególności  takich  jak  cząstki  a.  Infor- 
macje o tym  zjawisku  uzyskuje  się  bądź  bezpośrednio, 
obserwując  końcowe  fragmenty  jądrowe,  bądź  po- 
średnio, wykrywając  fotony  y emitowane  z jąder  koń- 
cowych. Rysunek  5 przedstawia  wychwyt  niemezono- 
wy  kaonu  przez  jądro  węgla,  zarejestrowany  w emulsji 
jądrowej.  Zaobserwowany  proces  dowodzi,  że  mezon 
K~  może  oddziaływać  z dwoma  nukleonami  (lub  ich 
większą  liczbą)  w procesie  niemezonowym,  powodu- 
jąc rozpad  jądra  końcowego  na  cząstki  a.  Częstą 
emisję  cząstek  a w oddziaływaniach  mezonów  można 
przypisywać  albo  własnościom  jądra,  albo  mecha- 
nizmowi reakcji,  np.  wychwytowi  wielonukleono- 
wemu. 

Dalsze  badania  atomów  egzotycznych,  a zwłaszcza 


Detekcja  cząstek 

Tomasz  Hofmokf 

Czy  można  zobaczyć  cząstkę,  której  rozmiary  są 
mniejsze  niż  10~15  m,  a masa  jest  rzędu  10-30  kg?  Na 
to  pytanie  odpowiada  się  często  przecząco  argumen- 
tując tym,  że  zdolność  rozdzielcza  układu  optycznego 
nie  może  być  mniejsza  od  długości  fali  padającego 
światła,  która  dla  zakresu  promieniowania  widzial- 
nego zawiera  się  w granicach  4 — 7 TO'7  m,  a rozmiary 
cząstki  są  o kilka  rzędów  wielkości  mniejsze  .Taka  od- 
powiedź zakłada  jednak  potoczne,  bardzo  ograniczone 
znaczenie  słowa  widzieć.  Zastanówmy  się  nad  fizyczną 
stroną  procesu  widzenia.  Jak  przebiega  z punktu  wi- 
dzenia fizyka  oglądanie  czerwonego  przedmiotu  w sło- 
neczny dzień?  Mamy  do  dyspozycji  źródło  kwantów 
promieniowania  elektromagnetycznego  (fotonów)  o 
energiach  3-5  -10” 19  J (zakres  światła  widzialnego), 
co  odpowiada  w częściej  używanych  w tej  dziedzinie 
jednostkach  1, 8-3,1  eV.  Doprowadzamy  fotony  do 


4 

/ 

5 


i 


Rys.  5.  Mikrofotografia  oddziaływania  w emulsji  jądrowej  me- 
zonu K~  z jądrem  węgla  12C  (punkt  a)  z produkcją  hiperonu 
27“  (/),  protonu  (2), dwóch  cząstek  a (3,4)  i dcuteronu  (5).  Cząstki 
a pochodzą  prawdopodobnie  z rozpadu  jądra  końcowego  (®Be 
w stanie  podstawowym).  Hiperon  Ż~  w punkcie  b rozpada  się 
w locie  na  mezon  n~  (wg  D.  Evansa  i in.,  1961) 


badanie  koincydencji  między  promieniowaniem  rent- 
genowskim a cząstkami  wtórnymi,  powstałymi  w wy- 
niku absorpcji  hadronu  przez  jądro,  przyniosą  nie- 
wątpliwie odpowiedź  na  wiele  problemów'  otwartych, 
jeszcze  nie  rozstrzygniętych  w dotychczasowych  do- 
świadczeniach. 

G.  Backenstoss  Ann.Rev.Nuclear  Sci.  20,  467  (1970);  G.  Bac- 
kenstoss  i J.  Zakrzewski  Contemp.  Phys.  15,  197  (1974); 
E.H.S.  Burhop  High-Energy  Physics  3,  109  (1969)  oraz  Contemp. 
Phys.  11,  335  (1970);  S.  Devons  i I.  Duerdoth  Advances  Nuclear 
Phys.  2,  295  (1969);  R.  Sęki,  C.E.  Wiegand  Kaonic  and  other 
Exot\c  Atoms,  w:  Ann.  Rev.  Nuci.  Sci.  25,  241  (1975);  C.S.Wu 
i L.  Wilets  Ann.  Rev.  Nuclear  Sci.  19,  527  (1969). 


zderzenia  z tarczą  (przedmiot)  i rejestrujemy  energię 
i częstości  kwantów  wpadających  do  urządzenia  po- 
miarowego (oko).  Stwierdzamy,  że  wśród  cząstek 
dochodzących  po  zderzeniu  do  detektora  przeważają 
kwanty  o energii  2 eV,  a pozostałe  cząstki  zostały 
pochłonięte  przez  tarczę.  Wnioskujemy  stąd,  że  tarcza 
odbija  promieniowanie  elektromagnetyczne  o długości 
fali  6,2  *10“ 7 m.  Potocznie  mówimy,  że  przedmiot 
jest  czerwony.  W rzeczywistości  to  powiedzenie  cha- 
rakteryzuje nie  sam  przedmiot  (w  świetle  zielonym 
przedmiot  będzie  czarny),  a proces  oddziaływania 
z przedmiotem  fal  elektromagnetycznych  o określo- 
nym rozkładzie  długości  fali.  Oglądanie  przedmiotu 
to  badanie  oddziaływania  z nim  światła. 

Rozszerzmy  to  określenie  dopuszczając  dowolne 
oddziaływanie  czegokolwiek  z badanym  obiektem. 
Wtedy  obmacywanie  po  ciemku  ściany  będzie  rów- 


oddziaływa- 
nie mezony 
z jądrem  12 
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nież  jej  oglądaniem.  Takie  rozszerzenie  pojęcia  wi- 
dzenia pozwoli  nam  obejrzeć  cząstki  elementarne. 
Postępowanie  będzie  analogiczne  do  oglądania  przed- 
miotu. Należy  w tym  celu  dysponować  źródłem  czą- 
stek, na  przykład  akceleratorem.  Powinny  mieć  one 
odpowiednio  dużą  energię,  aby  długość  fali  de  Brog- 
lie’a  była  rozmiarów  porównywalnych  lub  mniejszych 
niż  obszar  oddziaływania.  Przykładem  oglądania  pro- 
tonów jest  eksperyment,  w którym  korzystano  z wiąz- 
ki mezonów  pi  plus  (n+)  o energii  16  GeV.  Energii  tej 
odpowiada  długość  fali  de  Broglie’a  7,7  10“ 17  m,  co 
jest  długością  znacznie  mniejszą  niż  rozmiary  proto- 
nu. Zderzano  mezony  (piony)  z tarczą  z ciekłego  wo- 
doru, a więc  praktycznie  z protonami  i obserwowano 
cząstki  rozproszone. 

Oczywiście  na  podstawie  jednej  obserwacji  nie 
można  wyciągać  żadnych  wniosków.  Ze  zderzenia 
jednego  fotonu  z przedmiotem  też  byśmy  nic  nie  po- 
wiedzieli o kształcie  i kolorze  przedmiotu.  Należy 
zbadać  wiele,  od  kilkuset  do  kilkudziesięciu  tysięcy 
zarejestrowanych  zderzeń,  aby  móc  coś  powiedzieć 

0 oddziaływaniu. 

Nie  wchodząc  na  razie  w zagadnienie  co  chcemy 
wiedzieć  globalnie  o badanym  oddziaływaniu,  może- 
my od  razu  wyliczyć  co  należałoby  wiedzieć  o każdej 
cząstce  biorącej  udział  w każdym  pojedynczym  zda- 
rzeniu, wchodzącej  lub  opuszczającej  obszar  oddziały- 
wania. Najczęściej  wystarcza  znajomość  energii 

1 trzech  składowych  pędu  każdej  cząstki.  Ideałem  by- 
łaby znajomość  również  ustawienia  w przestrzeni  spi- 
nów pojedyncżych  cząstek  (o  ile  spin  jest  różny  od 
zera),  ale  o tym  można  jeszcze  tylko  marzyć.  W prak- 
tyce zagadnienie  sprowadza  się  do  wyznaczenia  pędu 
oraz  masy  lub  energii  każdej  interesującej  w danym 
doświadczeniu  cząstki. 

Bardzo  często  musimy  się  jednak  ograniczać  ze 
względów  technicznych  do  niepełnej  informacji,  zre- 
dukowanej niekiedy  tylko  do  sygnału  czy  cząstka 
przeszła  przez  detektor  czy  też  nie. 

Nazwa  „detektor”  pochodzi  od  łacińskiego  cza- 
sownika detegere  — odkryć,  odsłonić,  wyjawić.  De- 
tektor cząstek  pozwala  wykryć  przejście  cząstki  i do- 
starcza różnych  informacji  umożliwiających  identy- 
fikację i określenie  stanu  jej  ruchu.  Podstawą  detekcji 
cząstek  jest  ich  elektromagnetyczne  oddziaływanie 
z materią  (->  Oddziaływania  elektromagnetyczne). 
Cząstki  nie  oddziałujące  elektromagnetycznie  (neu- 
trina) można  zarejestrować  obserwując  produkty  wy- 
woływanych przez  nie  reakcji  zdolne  do  oddziaływań 
elektromagnetycznych.  Celem  detekcji  jest  znalezienie 
odpowiedzi  na  następujące  pytania:  Jaka  cząstka  zo- 
stała zarejestrowana?  Jaka  jest  energia  (pęd)  cząstki? 
Jaka  jest  lokalizacja  toru?  W jakiej  chwili  pojawiła  się 
cząstka? 

Rzadko  udaje  się,  używając  jednego  typu  detektora, 
uzyskać  odpowiedź  na  wszystkie  pytania.  Toteż  bu- 
duje się  złożone  układy  detekcyjne.  W tabeli  przed- 
stawionej poniżej  zestawione  są  zjawiska  fizyczne  mo- 
gące służyć  do  rejestracji  i identyfikacji  cząstek  oraz 
stanu  ich  ruchu. 


Podstawowe  zjawiska 
wykorzystywane  przy  rejestracji 
cząstek 

Rejestracja  cząstki  polega  na  zaobserwowaniu  skut- 
ków oddziaływania  cząstki  z otaczającą  ęnaterią. 

Poza  bardzo  słabymi  oddziaływaniami  grawitacyjnymi 
rozróżnia  się  oddziaływania  słabe,  silne  i elektromag-  rejestracja 
netyczne.  Te  ostatnie  są  najczęściej  wykorzystywane  cząstki 
do  rejestracji.  Omówimy  pokrótce  te  zjawiska  fizycz- 
ne, które  mogą  służyć  do  rejestracji  i identyfikacji 
cząstek  (tabela  poniżej). 


Ruch  naładowanej  cząstki  w poiu 
elektromagnetycznym 

Na  poruszającą  się  naładowaną  cząstkę  o ładunku  e 
w polu  elektromagnetycznym  działa  siła 

F = e(E+vx  B), 

gdzie  E — wektor  natężenia  pola  elektrycznego,  B — 

wektor  indukcji  pola  magnetycznego,  r — wektor 
prędkości  cząstki.  Siła  pochodząca  od  pola  elektrycz- 
nego jest  skierowana  wzdłuż  wektora  tego  pola,  a przy- 
czynek od  pola  magnetycznego  (proporcjonalny  do  ilo- 
czynu wektorowego  v i B)  jest  prostopadły  zarówno 
do  prędkości,  jak  i do  wektora  indukcji  pola.  Spo- 
strzeżenie to  jest  bardzo  ważne,  albowiem  w jedno- 
rodnym, stałym  polu  magnetycznym  cząstka  porusza 
się  po  okręgu  (jeżeli  nie  traci  energii  po  drodze),  któ- 
rego promień  krzywizny  r zależy  od  pędu,  ładunku 
i indukcji  pola: 

p 0,3333  -10"2 
r~  ZB 

gdzie  r jest  wyrażone  w m,  pęd  p w MeV/c,  indukcja 
B w teslach,  a ładunek  Z w jednostkach  ładunku 
elementarnego. 

Znajomość  krzywizny  toru  cząstki  w znanym  polu 
magnetycznym  pozwala  wyznaczyć  stosunek  pędu  do  wyznaczanie 
ładunku,  co  w większości  przypadków  jest  równo-  pędu 
znaczne  z wyznaczeniem  pędu,  ponieważ  praktycznie 
zawsze  mamy  do  czynienia  z cząstkami  o ładunku 
jednostkowym  (wyjątek  stanowią  oddziaływania  z ją- 
drami atomowymi).  Wielkość  odchylenia  w polu 
elektrycznym  prostopadłym  do  ruchu  cząstki  zależy 
od  prędkości  cząstki,  a nie  od  pędu.  Układ,  który 
wykorzystuje  oba  rodzaje  pól,  pozwala  na  wyznacze- 
nie pędu  i energii  cząstki,  a zatem  — jej  masy. 


Rozpraszanie  kulombowskie  na  jądrach 

Niezależnie  od  stosowania  do  identyfikacji  cząstek 
silnych  pól  zewnętrznych  można  do  tego  celu  wyko- 
rzystać silne  pola  elektryczne  w pobliżu  jądra.  Nała- 
dowana cząstka  przechodząca  przez  materię  napotyka 


Zestawienie  zjawisk  lub  wielkości  pomocnych  przy  detekcji  i identyfikacji  cząstek 


Wielkość  mierzona  lub  zjawisko 


Od  czego  zależy 


Krzywizna  toru  w polu  magnetycznym 
Krzywizna  toru  w polu  elektrycznym 


pęd/ładunek 

pęd  x prędkość/ładunek 


Jonizacja  i zjawiska  pokrewne 
Zasięg 

Wielokrotne  rozpraszanie 

Promieniowanie  Czerenkowa 

Zjawisko  Comptona  i tworzenie  par  e+e~ 

Kaskada  elektronowo-fotonowa 

Czas  przelotu  między  dwoma  licznikami 

Zderzenia  sprężyste  i rozpady  cząstek  nietrwałych 


ładunek  x prędkość 
ładunek  x prędkość 
ładunek; 
pęd  x prędkość 
ładunek  X prędkość 
energia  fotonu 
energia  fotonu 
prędkość 
masa  i energia 


Uwagi 


bardzo  często  stosowane  w pomiarach 
ograniczone  zastosowanie  ze  względu  na  trudności 
uzyskania  dużych  pól 
pomiar  często  wykonywany 
pomiar  stosowany  do  powolnych  cząstek 
pomiar  stosowany,  gdy  brak  pola  magnetycznego, 
a ślad  jest  dokładnie  zarejestrowany 
szerokie  zastosowanie  w licznikach  Czerenkowa 
stosowane  w pomiarach  kwantów  y 
stosowane  w pomiarach  kwantów  y i elektronów 
metoda  elektroniczna  szeroko  stosowana 
metoda  szczególnie  przydatna  do  badania  cząstek 
neutralnych;  stosuje  się  ją  również  do  naładowa- 
nych 
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obszary  o natężeniu  pola  elektrycznego  rzędu  1010 
V/m.  Istnienie  tak  dużych  pól  zawdzięczamy  ładun- 
kom elektrycznym  jądra.  Te  silne  pola  elektryczne  po- 
wodują tzw.  rozpraszanie  kulombowskie.  Przecho- 
dząc przez  warstwę  substancji,  cząstka  wielokrotnie 
ulega  rozpraszaniu  kulombowskiemu.  Małe  pojedyn- 
cze rozproszenia  w różnych  kierunkach  dodają  się 
i obserwujemy  wypadkowe  średnie  wielokrotne  roz- 
proszenie. W nieobecności  zewnętrznego  pola  elek- 
tromagnetycznego tor  cząstki  naładowanej  powinien 
być  prosty.  Jednak  wskutek  wielokrotnego  rozprasza- 
nia kulombowskiego  odchyla  się  on  od  prostej,  przy 
czym  średni  kwadrat  kąta  rozproszenia  zależy  od  pędu 
cząstki  i od  właściwości  ośrodka,  przez  który  cząstka 
przechodzi.  Średni  kwadrat  kąta  rozproszenia  <02> 
(w  radianach)  można  w przybliżeniu  wyrazić  w zależ- 
ności od  pędu  cząstki  p (podanego  w MeV/c),  jej 
prędkości  /?  (wyrażonej  w stosunku  do  prędkości 
światła)  i stałej  X charakteryzującej  materiał  ośrodka, 
długość  przez  który  cząstka  przechodzi,  zwanej  długością  ra- 
radiacyjna  diacyjną  (podanej  w centymetrach): 


W tabeli  zestawiono  wartości  długości  radiacyjnej 
kilku  częściej  używanych  substancji.  Z porównania 
danych  widać,  że  średnie  kulombowskie  rozproszenie 


Minimalne  straty  energii  na  jednostkę  drogi  cząstki 
w różnych  substancjach 


Substancja 

Gęstość 

g/cm3 

Długość 
! radiacyjna 
Xy  cm 

MeV 

\ dxf  min  cm 

Ciekły  wodór 

0,063 

1000 

0,26 

Propan  C3H8 

0,41 

111 

0,98 

Ksenon 

2,3 

3,9 

2,8 

Emulsja  jądrowa 

3,82 

2,94 

5,49 

Ołów 

11,35 

0,56 

12,8 

jest  praktycznie  pomijalne  dla  cząstek  poruszających 
się  w wodorze  (w  dokładnych  pomiarach  uwzględnia 
się  jednak  to  zjawisko),  ale  może  znacznie  zniekształcić 
tory  w ksenonie.  Ilustracją  są  zdjęcia  torów  z komór 
wypełnionych  wodorem,  propanem  i ksenonem 
(tabl.  9,  il.  28).  W ksenonie  wielokrotne  kulombow- 
skie rozpraszanie  odgrywa  tak  doniosłą  rolę,  że  prak- 
tycznie uniemożliwia  stosowanie  zewnętrznych  pól 
magnetycznych.  Musiałyby  one  mieć  ogromną  induk- 
cję, aby  dominować  nad  wielokrotnym  rozpraszaniem. 


Straty  energii  na  jonizację 

Przechodząc  przez  materię,  naładowana  cząstka  od- 
daje część  swojej  energii  napotkanym  atomom  powo- 
dując ich  wzbudzenie  lub  jonizację.  Dostarczona  ener- 
gia zostaje  pochłonięta  przez  któryś  z elektronów  po- 
włoki atomowej  przeniesiony  do  wyższego  stanu  ener- 
getycznego. Jeżeli  energia  ta  jest  dostatecznie  duża,  to 
elektron  może  się  całkowicie  uwolnić  z atomu.  Mówi- 
my wtedy  o jonizacji  atomu.  Przechodząca  cząstka 
pozostawia  więc  ślad  w postaci  wzbudzonych  lub  zjo- 
nizowanych  atomów.  Ilość  takich  wytrąconych  z rów- 
nowagi atomów  jest  ważną  informacją  o przejściu 
i o samej  naturze  cząstki. 

Straty  energii  na  jonizację  lub  wzbudzenie  są  spo- 
wodowane niesprężystym  oddziaływaniem  kulom- 
bowskim  przelatującej  cząstki  z elektronami.  Rysu- 
zaleźność  nek  1 ukazuje  zależność  względnej  jonizacji  (stosunku 
względnej  straty  energii  na  jednostkę  długości  do  minimalnej 
jonizacji  możliwej  straty  energii)  od  pędu  dla  mezonów  K 
od  pędu  i protonów.  Umiejąc  ocenić  jonizację  cząstki  i znając 
jej  pęd,  możemy  ją  zidentyfikować.  Rysunek  ten  moż- 
na uprościć  wykreślając  względną  jonizację  w zależ- 
ności od  pędu  podzielonego  przez  masę  cząstki  razy 
prędkość  światła  (rys.  2).  Pokazana  na  nim  krzywa 
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Rys.  1.  Zależność  względnej  jonizacji  gazu  używanego  w urzą- 
dzeniu identyfikującym  cząstki  od  pędu  protonów  i mezonów  K 


Rys.  2.  Zależność  względnej  jonizacji  od  zmiennej  pitne.  Krzywa 
jest  uniwersalna  dla  cząstek  o dowolnej  masie  i ładunku  jedno- 
stkowym 


jest  uniwersalna,  tzn.  że  można  ją  stosować  do  cząstek 
o dowolnej  masie,  a ładunku  — jednostkowym. 

Początkowo  krzywa  jonizacji  względnej  maleje 
bardzo  szybko,  odwrotnie  proporcjonalnie  do  kwa- 
dratu prędkości  cząstki,  osiąga  wartość  minimalną 
(minimum  jonizacji)  i wzrasta  do  wartości  maksy- 
malnej (maksimum  jonizacji),  przy  której  się  utrzy- 
muje niezależnie  od  energii.  Obszar  malenia  jonizacji 
z energią  i obszar  wzrostu  są  wykorzystywane  do  iden- 
tyfikacji cząstek. 

Znając  stratę  energii  na  jednostkę  przebytej  drogi, 
można  obliczyć  zasięg  cząstki,  czyli  drogę,  na  której 
straci  całą  swoją  energię  na  jonizację  i zatrzyma  się 
w ośrodku.  Można  wykazać,  że  stosunek  zasięgu  R 
do  masy  cząstki  m zależy  tylko  od  stosunku  energii 
cząstki  E do  jej  masy : 

R/m  = 

Jeżeli  więc  znana  jest  krzywa  zasięg-energra  jakiej- 
kolwiek cząstki  w danej  substancji,  to  można  łatwo 
wykreślić  również  krzywą  dla  innej  cząstki  o tym  -sa- 
mym ładunku.  Dla  stosunkowo  powolnych  cząstek, 
a tylko  takie  mają  szanse  zatrzymać  się  w urządze- 
niach detekcyjnych,  zasięg  R można  wyrazić  zależ- 
nością przybliżoną : 

R ~ m~2’3p3’z. 

Tak  więc  proton  o tym  samym  pędzie  co  mezon  tt 
zatrzyma  się  po  przebyciu  drogi  prawie  80  razy  krót- 
szej niż  pion,  ponieważ  ma  6,7  razy  większą  masę. 


Mechanizm  scyntylacji 

Atomy  wzbudzone  pozbywają  się  energii  emitując 
promieniowanie  elektromagnetyczne,  czyli  po  prostu 
świecą.  Średni  czas  życia  stanu  wzbudzonego  jest 


względna 

jonizacja 


rozróżnianie 
cząstek  wg 
zasięgu 


rzędu  10~9-10~8  s,  a więc  świecenie  jest  praktycznie 
natychmiastowe.  W omawianym  wypadku  interesuje 
radiolumi-  nas  zjawisko  fluorescencj  i lub  radioluminescencji,  czyli 
nescencja  fluorescencj  i pod  działaniem  cząstek  jonizujących. 

Substancję,  w której  można  obserwować  radiolumi- 
nescencję,  nazywamy  scyntylatorem.  Dobrymi  ma- 
teriałami scyntylacyjnymi  są  niektóre  gazy,  przede 
wszystkim  szlachetne,  związki  organiczne  oraz  krysz- 
tały nieorganiczne.  Niektóre  typy  scyntylatorów  omó- 
wimy opisując  detektory  scyntylacyjne. 


Zjawisko  Czesankowa 

Badając  w 1934  r.  zjawisko  emisji  światła  przy  prze- 
chodzeniu przez  substancję  cząstek  jonizujących, 
Czerenkow  zauważył,  że  istnieje  silna  korelacja  między 
kierunkiem  padania  cząstek  i kierunkiem  emisji 
światła.  Jeżeli  cząstka  jonizująca  porusza  się  w ośrod- 
ku o współczynniku  załamania  nv  dla  promieniowania 
o częstości  v,  a jej  prędkość  v jest  większa  niż  prędkość 
światła  w tym  ośrodku  c/nv : 
c 

v > , 


to  cząstka  wysyła  promieniowanie  elektromagnetycz-- 
ne  w stożku  skierowanym  w kierunku  lotu  cząstki 


(rys.  3).  Fale  o różnej  częstości  będą  wysyłane  pod 
różnymi  kątami : 


Im  w-iększa  prędkość  cząstki  padającej,  tym  większe 
rozw-arcie  stożka.  Maksymalny  kąt  rozwarcia 

1 

0v  mas  — 3XC  COS  . 

nv 

Typowe  wartości  parametrów  charakteryzujących 
zjawisko  Czerenkowa  zestawiono  w tabeli. 


Wartości  parametrów  charakteryzujących  zjawisko 
Czerenkowa 


Materiał 

Parametr 

tworzywo 

perspex 

woda 

powietrze 

Współczynnik 

1,33 

1,00029 

załamania,  n 

1,5 

6 max  = arc  cos  l/« 

48° 

41° 

1,3° 

fimin  = 1 Ifl 

Minimalny  pęd  czą- 

0,667 

0,751 

0,9997 

stek  odpowiadający 

/?mln  I 

elektronu 

0,46  MeV/c 

0,58  MeV/c 

21  MeV/c 

mezonu  n 

125  MeV/c 

159  MeV/c 

5,7  GeV/c 
38  GeV/c 

protonu 

840  MeV/c 

1,067  Ge V/c 

Promieniowanie  Czerenkowa  pojawia  się  dopiero 
wtedy,  gdy  pęd  cząstki  przekroczy  pewną  progową 
wartość  zależną  od  jej  masy.  Zjawisko  to  znalazło 
szerokie  zastosowanie  w identyfikacji  cząstek. 

Promieniowanie  hamowania 

Jeżeli  poruszająca  się  cząstka  naładowana  doznaje 
opóźnienia  w jakimś  polu  zewnętrznym  (np.  jeżeli 


jest  przyhamowana  w polu  jądra,  albo  tylko  zmienia 
kierunek),  to  emituje  kwant  promieniowania  elektro- 
magnetycznego. Promieniowanie  to  nazywamy  pro- 
mieniowaniem hamowania.  Jest  ono  szczególnie  waż- 
ne dla  elektronów.  Jeżeli  foton  o dużej  energii  prze- 
chodzi przez  substancję,  to  jest  duże  prawdopodo- 
bieństwo, że  wytworzy  parę  e+e~.  Każdy  z elektro- 
nów spowalniany  w substancji  wysyła  kwanty  pro- 
mieniowania hamowania,  te  z kolei  mogą  znowu 
tworzyć  pary  e+e~  i proces  powtarza  się,  w wyniku 
czego  tworzy  się  kaskada  elektronowo-fotonowa. 
Ilustracja  29  (tabl.  10)  przedstawia  rozwój  kaskady 
elektronowo-fotonowej  zarejestrowanej  w ksenono- 
wej  komorze  pęcherzykowej. 


Oddziaływanie  elektromagnetyczne 
kwantów  y 

Kwanty  y,  czyli  kwanty  promieniowania  elektromag- 
netycznego o dużej  energii,  są  obojętne  elektrycznie. 
O ich  przejściu  przez  substancję  możemy  wnioskować 
na  podstawie  charakterystycznych  zjawisk  oddziały- 
wania elektromagnetycznego  z materią. 

Kwant  y o dużej  energii,  przechodząc  przez  materię, 
może  się  zderzyć  z elektronem.  W wyniku  zderzenia 


Rys.  4.  Zjawisko  Comptona 

następuje  przekazanie  elektronowi  części  energii, 
kwant  y ze  zmniejszoną  energią  zmienia  kierunek  lotu, 
a elektron  zostaje  odrzucony  z pewną  prędkością 
(rys.  4).  Energia,  a więc  częstość  V rozproszonego 
kwantu,  E'  = hv\  zależy  od  kąta  rozproszenia  0 
i energii  pierwotnej  E = hv: 

_ Emecz 

mecŁjrE{  1— cos0)  * 

Energia  rozproszonego  kwantu  jest  maksymalna 
(£*'  = E)y  gdy  0 = 0,  i minimalna,  gdy  0 = n.  Dla 


energia  y 

Rys.  5.  Przekrój  czynny  na  tworzenie  się  par  e+e~  i zjawisko 
Comptona  w powietrzu  wyrażony  w jednostkach  4,5l0“!fl  cm1 
na  nukleon 


zjawisko 

Comptona 


przekrój 
czynny 
na  zjawisko 
Comptona 
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dużych  energii  E > mec\  £^ax  = mecz/2.  Rysunek  5 
przedstawia  wykres  przekroju  czynnego  na  rozpra- 
szanie komptonowskie  w powietrzu  kwantów  y w za- 
leżności od  ich  energii.  Na  zdjęciu  (tabl.  10,  ii.  32) 
pokazano  elektron  zarejestrowany  w komorze  freo- 
nowej wybity  w zjawisku  Comptona.  W procesie  tym 
zjawisko  kwant  y znika,  a jego  energia  przekształca  się 
tworzenia  par  całkowicie  w energię  pary  elektron-pozyton.  Zdjęcie 
ilustruje  powstanie  pary  elektronowo-pozy tonowej 
w komorze  wodorowej  w obecności  pola  magnetycz- 
nego. Z kierunku  zakrzywienia  torów  wnioskujemy, 
że  musiały  to  być  cząstki  o przeciwnych  znakach.  Ze 
względu  na  zasadę  zachowania  pędu  produkcja  par 
musi  następować  w pobliżu  jądra,  które  przejmuje 
część  pędu  fotonu.  Przekazanie  energii  jądru  można 
pominąć,  ponieważ  ma  ono  masę  znacznie  większą 
od  elektronu.  Prawo  zachowania  energii  może  być  za- 
pisane w postaci 

E = £'+ E"-\- 2mec2, 

gdzie  E'  i E"  są  energiami  kinetycznymi  pozytonu 
i elektronu,  a E — energią  fotonu.  Na  rys.  5 przed- 
stawiono przekrój  czynny  na  tworzenie  par  w zależ- 
ności od  energii.  Porównanie  z zależnością  przekroju 
czynnego  na  rozpraszanie  komptonowskie  wskazuje, 
że  przy  dużych  energiach  najważniejszym  zjawiskiem 
pozwalającym  wnioskować,  że  przez  materię  przele- 
ciał foton,  jest  tworzenie  się  par. 


Inne  zjawiska 

Z praktycznego  punktu  widzenia  należy  wymienić 
jeszcze  dwa  zjawiska  stanowiące  oddziaływanie  elek- 
tromagnetyczne fotonu  z całym  atomem:  zjawisko 
fotoelektryczne  i zjawisko  wzbudzenia  atomu.  Wzbu- 
dzenie atomu  omawialiśmy  przy  okazji  przechodzenia 
promieniowania  jonizującego  przez  materię.  Powro- 
towi atomu  do  niższego  stanu  energetycznego  może 
towarzyszyć  emisja  promieniowania,  które  łatwo  zare- 
jestrować w detektorze. 

Zjawisko  fotoelektryczne,  polegające  na  wybijaniu 
z substancji  elektronów,  ma  duże  zastosowanie  w foto- 
powielaczach,  pozwalających  rejestrować  słabe  sygna- 
ły świetlne. 


Detektory  cząstek 


Cząstki  — i to  zarówno  naładowane  elektrycznie,  jak 
i neutralne  — mają  zawsze  różne  od  zera  prawdopo- 
dobieństwo oddziaływania  z materią,  przez  którą 
przechodzą.  Niekiedy  to  prawdopodobieństwo  od- 
oddzialywa-  działywania  jest  niezwykle  małe,  jak  np.  neutrina, 
nie  cząstek  które  bierze  udział  tylko  w oddziaływaniach  słabych, 
z materią  Wtedy  o przejściu  takiej  cząstki  możemy  wnioskować 
tylko  na  podstawie  zaobserwowanych  produktów  od- 
działywania słabego.  W znacznie  lepszej  sytuacji 
jesteśmy,  badając  cząstki,  które  mogą  brać  udział 
w procesach  elektromagnetycznych.  Oddziałującelek- 
tromagnetycznie  z materią,  zostawiają  śladnp.  w pos- 
taci zjonizowanych  atomów  (tym  samym  sygnalizują 
swoje  przejście),  przy  czym  tracą  na  to  bardzo  mało 
energii. 

Problem  detekcji  cząstek  sprowadza  się  do  zaobser- 
wowania i zinterpretowania  pozostawionych  przez 
cząstkę  śladów.  Ze  względów  praktycznych  detektory 
dzieli  się  na  takie,  które  możliwie  wiernie  rejestrują 
ślad  cząstki  (detektory  śladowe),  oraz  takie,  w których 
istotne  jest  tylko  zarejestrowanie  faktu,  że  cząstka 
przeszła,  i ewentualnie  określenie  jej  natury.  Granica 
podziału  zaciera  się  obecnie  coraz  bardziej,  buduje  się 
bowiem  układy  hybrydowe,  w których  możliwie  do- 
kładnie określa  się  i tor  cząstki  i jej  naturę  za  pomocą 
wielu  typów  współdziałających  detektorów. 


Emulsja  jądrowa 

Historia  zastosowania  emulsji  fotograficznej  do  reje- 
stracji cząstek  sięga  badań  A.  Becąuerela  w 1896  r. 
nad  fluorescencją  związków  uranu.  Zauważył  on,  że 
związki  te  zadymiały  kliszę  fotograficzną.  Chociaż 
Becąuerel  szybko  się  przekonał,  że  zadymienie  nie 
miało  nic  wspólnego  z fluorescencją,  minęło  wiele  lat, 
zanim  stwierdzono,  że  jest  ono  związane  z przechodze- 
niem przez  emulsję  cząstek  jonizujących.  Dopiero 
w 1911  r.  M.  Reinganum  zarejestrował  fotograficznie 
ślad  cząstki  a,  ale  przez  wiele  następnych  lat  nie  umia- 
no wyprodukować  takiej  emulsji  fotograficznej,  która 
byłaby  czuła  na  dowolne  cząstki  naładowane.  W 1948  r. 
firma  Kodak  dokonała  tego,  a odtąd  udoskonalano 
emulsje  wielokrotnie  i stosowano  w wielu  ekspery- 
mentach. 

Emulsja  fotograficzna  składa  się  z halogenków 
srebra,  głównie  AgBr  w zawiesinie  żelatynowej. 

Reakcja  na  światło  lub  na  cząstki  zależy  od  jonizacji 
wytworzonej  w aktywnych  ziarnach.  Jonizacja  ta,  czyli 
oderwanie  elektronu  z powłoki  atomowej,  powstaje 
w wyniku  przekazania  atomowi  przez  przechodzącą 
cząstkę  naładowaną  lub  kwant  promieniowania  elek- 
tromagnetycznego odpowiedniej  energii.  Jonizacja 
atomów  nie  powoduje  żadnych  widocznych  zmian  w 
ziarnach  halogenków  srebra,  lecz  zmienia  ich  struk- 
turę w ten  sposób,  że  mogą  reagować  z czynnikiem 
wywołującym.  Ziarna,  w których  nie  nastąpiła  joni-  mechanizm 
zacja,  nie  dają  się  wywołać.  Mechanizm  zmian  we-  rejestraoji 
wnętrznych  w ziarnie  kryształu  bromku  srebra  można 
w przybliżeniu  przedstawić  następująco:  Na  po- 
wierzchni kryształu  AgBr  są  małe  centra  czułości  skła- 
dające się  z cząsteczek  Ag2S,  które  mogą  wychwyty- 
wać swobodne  elektrony  poruszające  się  w krysztale. 

Elektrony  uwolnione  z atomów  wskutek  ich  jonizacji 
dyfundują  aż  na  powierzchnię  kryształu  i tam  są  wy- 
łapywane przez  centra  czułości,  które  ładują  się  ujem- 
nie. W krysztale  AgBr  są  zawsze  swobodne  dodatnio 
naładowane  jony  srebra,  które  wskutek  dyfuzji  rów- 
nież mogą  dotrzeć  do  ujemnych  już  teraz  centrów 
czułości.  Tam  następuje  zobojętnienie  ładunków  i na 
powierzchni  kryształu  osadzają  się  kryształy  srebra  — 
powstaje  obraz  utajony.  W procesie  wywoływania 
srebro  to  katalizuje  redukcję  jonów  srebra  z wnętrza 
kryształu  do  srebra  metalicznego.  Tak  powstaje  obraz 
wywołany.  Na  str.  216  (rys.  1)  przedstawione  jest  his- 
toryczne już  dzisiaj  zdjęcie  pierwszego  zarejestrowa- 
nego przypadku  produkcji  i rozpadu  najprawdopo- 
dobniej hiperjądra  "B,  czyli  jądra  boru  11,  w którym 
jeden  z nukleonów  został  zastąpiony  przez  hiperon 
A°.  Zdarzenie  to  zaobserwowali  w 1953  r.  Marian 
Danysz  i Jerzy  Pniewski  z Uniwersytetu  Warszaw- 
skiego, zapoczątkowując  tym  odkryciem  nową  dzie- 
dzinę fizyki  — fizykę  hiperjąder. 

Spójrzmy  uważnie  na  zdjęcie  z punktu  widzenia  wyznaczanie 
charakteru  torów.  Niektóre  z nich  są  ciemne,  „tłu-  pędu  i 
ste”  — to  te  pozostawione  przez  cząstki  o dużym  ła-  prędkości 
dunku,  np.  przez  hiperfragment  “B,  lub  cząstki  bar- 
dzo powolne.  Gęstość  liniowa  ziaren  srebra  jest  miarą 
jonizacji.  Z odstępstw  śladu  od  linii  prostej  można 
wyznaczyć  średnią  wartość  kwadratu  wielokrotnego 
rozproszenia.  Te  dwa  pomiary  pozwalają  na  określe- 
nie pędu  i prędkości  cząstki,  a co  za  tym  idzie — jej 
masy. 

Technika  emulsji  jądrowych  przeżyła  już  okres 
swojej  świetności.  Jest  jednak  używana  jako  technika 
pomocnicza,  szczególnie  gdy  wymagana  jest  duża 
zdolność  rozdzielcza,  długi  czas  czułości  oraz  małe 
rozmiary  detektora. 


Koniora  Wilsona  (komora  mgłowa) 

Zjonizowane  atomy  w przesyconej  (przechłodzonej) 
parze  odgrywają  rolę  zarodzi  kondensacji  dla  krope- 
lek cieczy  powstających  ze  skraplającej  się  pary.  Ko- 
mora Wilsona  składa  się  zasadniczo  z naczynia  zawie- 
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rającego  gaz  w stanie  dalekim  od  skroplenia  oraz  parę 
jakiejś  cieczy  nasyconą  lub  bliską  nasycenia.  Objętość 
naczynia  można  nagle  powiększać.  Temperatura  mie- 
szaniny przy  tym  maleje  i para  przechodzi  w stan  prze- 
sycenia. Jeżeli  w gazie  jest  kurz,  nawet  niewielkie  roz- 
prężenie powoduje  powstanie  w całym  naczyniu 
mgły,  ponieważ  kondensacja  rozpoczyna  się  na  czą- 
steczkach pyłu.  W komorze  wolnej  od  pyłu  nie  obser- 
wuje się  kondensacji,  dopóki  stosunek  objętości  ko- 
mory po  i przed  rozprężeniem  (stosunek  rozprężenia) 
granica  nie  osiągnie  tzw.  granicy  jonowej.  Po  jej  przekrocze- 
jonowa  niu  kropelki  cieczy  pojawiają  się  tam,  gdzie  są  jony. 

W silnym  oświetleniu  kropelki  te  widać  jako  jaskrawe 
punkty  na  czarnym  tle.  Jony  powstałe  wskutek  przej- 
ścia przez  komorę  naładowanej  cząstki  są  zarodziami 
kropelek  układających  się  w ślad  cząstki.  Ilustracja  27 
(tabl.  9)  przedstawia  wykonaną  przy  użyciu  komory 
Wilsona  pierwszą  rejestrację  hiperonu  S~  (ksi),  który 
się  rozpada  na  hiperon  A°  i mezon  n~ : 

S-  ->  A0-j-7i~ . 

Hiperon  A°  z kolei  rozpada  się  na  proton  i n~ . Stąd 
załamanie  śladu  cząstki  pierwotnej  jest  miejscem  roz- 
padu hiperonu  na  hiperon  neutralny  A° , który  nie 

zostawił  śladu  w komorze,  i ujemnie  naładowany  n~ . 
Hiperon  A°  przeleciał  pewien  odcinek  drogi  i rozpadł 
się  na  dwie  cząstki  naładowane,  tworząc  charaktery- 
styczny ślad  w kształcie  widełek. 

Komory  Wilsona  nie  są  obecnie  stosowane.  Są  one 
mało  wydajne,  ponieważ  nie  można  zbyt  często  po- 
wtarzać rozprężenia.  Gaz  wypełniający  ma  niewielką 
gęstość,  czyli  małą  liczbę  jąder  w porównaniu  z emul- 
sją jądrową  lub  komorą  pęcherzykową,  i dlatego  praw- 
dopodobieństwo zaobserwowania  oddziaływania  jest 
stosunkowo  małe.  Komora  Wilsona  nadaje  się  nato- 
miast do  badania  cząstek  promieniowania  kosmicz- 
nego. Jony  w tej  komorze  żyją  dostatecznie  długo, 
aby  można  było  wywoływać  rozprężenie  w jakiś  czas 
po  przejściu  cząstki.  Pozwala  to  na  współpracę  ko- 
mory z licznikowym  urządzeniem  wyzwalającym  roz- 
prężanie wtedy,  gdy  zdarzenie  spełnia  założone  kry- 
teria. 


Komora  pęcherzykowa 

W komorze  tej  pęcherzyki  pary  tworzą  się  w cieczy 
przegrzanej.  Istnienie  stanu  cieczy  przegrzanej  jest 
zjawiskiem  bardzo  dobrze  znanym.  Wiadomo  rów- 
nież, że  naruszenie  równowagi  przez  dostarczenie 
niewielkich  nawet  ilości  energii  zapoczątkowuje  pro- 
ces wrzenia.  Przejście  z jednego  do  drugiego  stanu 
skupienia  jest  przejściem  fazowym  I rodzaju  (-► 
Przejścia  fazowe).  Jeżeli  nowym  stanem  skupienia 
jest  ciecz  (albo  gaz),  powierzchnia  rozdziału  faz  przy- 
. biera  kształt  kuli,  aby  zminimalizować  energię  po- 
promien  wjerzchniową.  Można  wykazać,  że  istnieje  promień 
kryły czny  krytyczny  takiej  kuli,  poniżej  którego  nowa  faza  jest 
niestabilna,  powyżej  zaś  kula  rośnie,  a metatrwały 
stan  starej  fazy  zanika.  Aby  kula  — pęcherzyk  osiąg- 
nęła promień  krytyczny,  należy  wykonać  pewną  pra- 
cę. Jeżeli  nie  ma  mechanizmu  dostarczającego  energię, 
krytyczny  promień  nigdy  nie  zostaje  osiągnięty  i ciecz 
pozostaje  w początkowym  stanie  skupienia  nieskoń- 
czenie długo. 

Cząstka  naładowana,  przelatując  przez  przegrzaną 
ciecz,  jonizuje  atomy,  czyli  dostarcza  im  energii. 
Jeżeli  energia  ta  zostanie  przekazana  pęcherzykom 
pary,  będą  one  mogły  osiągnąć  krytyczny  promień 
i wzdłuż  śladu  cząstki  rozpocznie  się  wrzenie  cieczy. 

Pomijając  szczegółowe  rozważania  teoretyczne  co 
do  mechanizmu  przekazywania  energii  cząstki  pęche- 
rzykowi pary,  stwierdzamy,  że  podwyższenie  tem- 
peratury w pęcherzyku  powoduje  wzrost  jego  roz- 
miaru powyżej  promienia  krytycznego,  a tym  samym 
umożliwia  dalszy  jego  rozwój.  Duży  pęcherzyk  można 
zobaczyć  widząc  tym  samym  ślad  cząstki.  Rysunek  6 
przedstawia  wykres  zależności  ciśnienia  od  temperatu- 


Rys.  6.  Krzywa  ciśnienie-temperatura  dla  ciekłego  wodoru.  Pio- 
nowa linia  wskazuje  możliwe  warunki  pracy  komory 


ry  dla  ciekłego  wodoru.  Obszar  zacieni owany  odpo- 
wiada takim  wartościom  ciśnienia  i temperatury, 
w których  się  nie  rozpoczyna  jeszcze  samorzutne  wrze- 
nie, lecz  energia  jonizacji  jest  już  wystarczająca  do 
wzrostu  pęcherzyków.  Jest  to  obszar  czułości.  Piono- 
wa linia  odpowiada  pracy  komory  w temperaturze 
T = 27  K.  Zasada  działania  komory  jest  prosta. 
Załóżmy,  że  ciecz  komory  jest  we  właściwej  temperatu- 
rze. Jedynym  problemem  jest  sterowanie  ciśnieniem. 
W pierwszej  fazie  ciśnienie  jest  większe  niż  ciśnienie 
pary  nasyconej  ( 1 ).  W drugiej  fazie  następuje  rozprę- 
żenie do  ciśnienia  odpowiadającego  obszarowi  czu- 
łości (2).  Jeżeli  teraz  przez  komorę  przejdzie  cząstka 
naładowana,  to  zjonizuje  atomy  na  swej  drodze  i do- 
starczy energii  na  wzrost  pęcherzyków  do  rozmiarów 
krytycznych.  Pęcherzyki  rosną  przez  kilka  milisekund 
i są  fotografowane.  Ostatnią  fazą  jest  zwiększanie 
ciśnienia  do  stanu  początkowego.  Rysunek  7 pokazuje 
schematyczny  szkic  komory  pęcherzykowej. 

wysokie  ciśnienie  niskie  ciśnienie 


Rys.  7.  Schemat  komory  pęcherzykowej 

Widać  stąd,  jak  bardzo  ważną  rzeczą  jest  synchro- 
nizacja czasu  nadejścia  cząstki,  chwili  rozprężenia 
komory  i zapłonu  lamp  błyskowych,  umożliwiających 
fotografowanie.  Dlatego  komora  pęcherzykowa  może 
współpracować  tylko  z akceleratorem,  wtedy  dokład- 
nie wiadomo,  w której  chwili  nadleci  wiązka  przy- 
spieszanych cząstek.  Schemat  blokowy  sterowania 
komorą  podaje  rys.  8.  Na  rys.  9 przedstawiono  moż- 
liwy zapis  oscyloskopowy  impulsów  informujących 
o przebiegu  pracy  układu  akcelerator-komora. 


warunki 

pracy 

komory 

wodorowe] 


obszar 

czułości 
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impuls 

z akceleratora 


do  zaworów 


do  lampy 


do  aparatury 
fotograficznej 


Rys.  8.  Schemat  blokowy  sterowania  komorą 


Największa  istniejąca  obecnie  komora  wodorowa  BEBC 
BEBC  {Big  European  Bubble  Chamber ) mieści  33,5  m3 
wodoru.  Na  rys.  10  jest  schematyczny  przekrój  tej 
komory.  Całość  jest  umieszczona  w polu  magnetycz- 
nym 3,5  T nadprzewodzącego  magnesu.  Celem 
uzmysłowienia  skali  urządzenia  na  dolnym  podeście 
narysowana  jest  postać  ludzka.  Na  zdjęciu  35  (tabl. 

11),  pokazano  komorę  wraz  z urządzeniem  do  identy- 
fikacji cząstek. 

Badania  z użyciem  komór  wodorowych  ogromnie 
rozszerzyły  zakres  wiedzy  o cząstkach  i ich  oddzia- 
ływaniach. 


impuls  przybycie  cząstek 


czas  w milisekundach 


Rys.  9.  Przykład  zapisu  oscyloskopowego  impulsów  steru- 
jących komorą  i zmian  ciśnienia 


Rys.  10.  Przekrój  pionowy  przez  Wielką  Europejską  Komorę 
Pęcherzykową 


Pierwszą  komorę  pęcherzykową  zbudował  D.A. 
Glaser  w 1953  r.  Była  ona  bardzo  mała.  Zdjęcie 
33  (tabl.  10)  przedstawia  ślad  elektronu  w szklanej  ko- 
morze pęcherzykowej  o rozmiarach : V2  cala  (1,27  cm) 
średnicy  i 1 cal  (2,54  cm)  długości,  wypełnionej  izo- 
pentanem,  w temperaturze  130°.  W następnych  latach 
rozwinięto  technikę  budowy  komór  wypełnionych 
różnymi  cieczami,  w szczególności  ciekłym  wodorem. 


Komory  iskrowe 

Podstawową  rolę  w komorach  iskrowych  odgrywa 
wyładowanie  w gazie  w przerwie  między  dwiema  elek- 
trodami (rys.  11).  Między  elektrodami  wytwarza  się 
różnicę  potencjałów  dostatecznie  dużą,  aby  spowodo- 
wać wyładowanie  elektryczne,  jeżeli  w przerwie  mię- 
dzy nimi  pojawią  się  elektrony  lub  jony.  Przebieg 
zjawiska  jest  złożony.  W uproszczeniu  można  po- 
wiedzieć, że  jony  i elektrony  w zewnętrznym  polu 


elektrycznym  uzyskują  dostateczną  energię,  by  jo- 
nizować napotkane  atomy,  wywołując  tym  samym  la- 
winowe narastanie  wyładowania.  Przeskok  iskry  nas- 
tępuje najłatwiej  w miejscu,  gdzie  się  znajdują  zjo- 
nizowane  atomy.  Przestrzeń  między  płytami  odle- 
głymi o 1-2  cm  wypełnia  się  gazem.  Stosując  szereg 
równoległych  płyt  pod  napięciem,  można  uzyskać  ślad 
toru  w postaci  szeregu  iskier.  Zdjęcie  30  (tabl.  10) 
zostało  wykonane  w dużym  układzie  komór  iskrowych 
zbudowanym  w Zjednoczonym  Instytucie  Badań 
Jądrowych  w Dubnej.  Widać  na  nim  oddziaływanie 
pionu  o energii  40  GeV  z jądrem  żelaza,  w wyniku 
czego  powstało  6 cząstek  naładowanych.  Zdjęcie  to  metody 
było  przykładem  optycznego  (fotograficznego)  od-  odczytu 
czytu  informacji.  W praktyce  stosuje  się  jeszcze  inne  informacji 
metody,  np.: 

metoda  akustyczna,  polegająca  na  detekcji  fali 
dźwiękowej  towarzyszącej  iskrze: 

metoda  rdzeni  ferrytowych,  które  ulegają  przemag- 
nesowaniu  przez  prąd  iskry;  informację  o przemag- 
nesowaniu  rdzeni  odczytuje  się  elektrycznie ; 

metoda  magnetostrykcji ; w pobliżu  drutów  zasila- 
jących umieszcza  się  metalowy  pręt;  gdy  przeskakuje 
iskra,  w pręcie  generuje  się  mechaniczny  impuls; 
opóźnienie  w dotarciu  fali  sprężystej  do  końca  pręta 
określa  pozycję  drutu,  a więc  i płyty,  która  brała 
udział  w wyładowaniu; 

metoda  pojemnościowa;  przeskok  iskry  powoduje 
zmianę  pojemności  w układzie  kondensatorów 
sprzężonych  z płytami;  rejestrację  przeprowadza 
układ  elektroniczny. 

Bardzo  dokładne  informacje  o współrzędnych  toru 
cząstki  (z  dokładnością  do  100  /um)  można  uzyskać 
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Licznik  proporcjonalny 


komora  dry- 
fowa  ii  pro- 
porcjonalna 
wielodm- 
towa 


komora 

drutowa 


komora 

strimerowa 


z komory  iskrowej  z przerwą  między  płytami  rzędu 
4-10  cm.  Iskra  biegnie  wtedy  prawie  dokładnie  wzdłuż 
śladu  jonizacji.  Zjawisko  rozwoju  wyładowania  w ga- 
zie, będące  podstawą  działania  komory  iskrowej,  jest 
wykorzystywane  w pokrewnych  typach  detektorów, 
jak  np.  "komora  dryfowa,  strimerowa,  proporcjonalna 
wielodrutowa.  Komory  dryfowa  i proporcjonalna 
wielodrutowa  wykorzystują  zjawisko  wzmocnienia 
gazowego.  Chmura  elektronów  wytworzona  przez  jo- 
nizującą cząstkę  porusza  się  (dryfuje)  w kierunku 
bardzo  cienkiego  przewodnika  (np.  pozłacany  drut 
wolframowy  o średnicy  20  pm).  W pobliżu  (ok.  50 
pm)  drutu  istnieje  pole  elektryczne  o bardzo  dużym 
natężeniu,  tak  przyspieszające  elektrony,  że  następuje 
jonizacja  lawinowa  atomów.  Wypadkowy  impuls  po- 
tencjału na  drucie  może  być  wzmocniony  10r>  razy 
w stosunku  do  impulsu,  jaki  by  wywołała  pierwotna 
chmura  elektronów. 

W komorze  dryfowej  mierzy  się  opóźnienie  sygnału 
z drutu  względem  chwili  przejścia  cząstki  przez  ko- 
morę wyznaczonej  za  pomocą  np.  licznika  scyntyla- 
cyjnego. Znając  prędkość  dryfu  (rzędu  5-10fi  cm/s 
przy  natężeniu  pola  1 kV/cm),  można  ocenić  położe- 
nie miejsca,  w którym  nastąpiła  jonizacja,  z dokład- 
nością do  100  pm. 

W komorze  drutowej,  złożonej  z dużej  liczby  cien- 
kich drutów  odległych  od  siebie  o 1-5  mm,  sygnał 
z drutu  określa  równocześnie  jego  pozycję.  Należy 
stosować  układy  wzajemnie  prostopadłych  przewodni- 
ków, jeżeli  się  chce  odczytać  trzy  współrzędne  miej- 
sca, w którym  cząstka  zjonizowała  gaz.  Komora 
strimerowa  jest  komorą  iskrową  o dużej  przerwie. 
Napięcie  przykłada  się  do  elektrod  na  bardzo  krótko 
(2  * 10"s  s),  tak  że  iskra  dopiero  się  zaczyna  formować. 
Na  filmie  fotografuje  się  zaczątki  iskier  (strimery), 
które  pokazują  przebieg  cząstki.  Wszystkie  detektory 
oparte  na  2asad?ie  rozwoju  wyładowania  w gazie 
odznaczają  się  dużą  szybkością  działania,  tzn.  mogą 
wykonać  kilka  milionów  rejestracji  w ciągu  sekundy. 
Ma  to  ogromne  znaczenie  przy  poszukiwaniu  i ba- 
daniu rzadkich  procesów. 


Liczniki  Czerenkowa 

W działaniu  licznika  wykorzystuje  się  zjawisko 
Czerenkowa.  Cząstka  jonizująca  przechodzi  przez 
odpowiednio  dobrany  ośrodek,  zwany  konwerterem. 
Promieniowanie  elektromagnetyczne  zjawiska  Czeren- 
kowa, w większości  w zakresie  długości  fal  widzial- 
nych,’jest  rejestrowane  przez  fotopowielacze  i daje 
informację  o przejściu  cząstki  o prędkości  większej  niż 
prędkość  graniczna  (patrz  tabela  str.  1 11),  a w ięc  licz- 
nik Czerenkow-a  jest  licznikiem  progowym.  Ponieważ 
emisja  promieniowania  elektromagnetycznego  odby- 
wa się  pod  ściśle  określonym  kątem  do  kierunku  lotu 
cząstki,  zależnym  od  jej  prędkości  i współczynnika 
załamania  ośrodka  konwentera,  można  budować  licz- 
niki czułe  tylko  na  wybrane  cząstki.  Światło  emitowa- 
ne w stożku  o określonym  kącie  rozwarcia  jest 
ogniskowane  na  pierścieniu  z fotopowielaczy.  Fotony 
nie  spełniające  danych  kryteriów  są  ogniskowane  poza 
obszarem  czułego  pierścienia  i nie  są  rejestrowane. 
Prędkość  fi  wszystkich  cząstek  o dużej  energii  — nie- 
zależnie od  ich  masy  — zdąża  do  jedności  (fi  = v/c). 
W takim  wypadku  konwerter  musi  mieć  współczynnik 
załamania  bliski  jedności, 

n < 1 i fi, 

i dlatego  trzeba  używać  gazu  pod  małym  ciśnieniem. 
To  z kolei  zmniejsza  ilość  fotonów  emitowanych  na 
jednostkę  drogi  w konwerterze  i zmusza  do  stosowania 
bardzo  długich  konwerterów. 

Licznik  ogniskujący  fotony  promieniowania  Czeren- 
kowa na  wybranym  pierścieniu  pozwala  określić 
równocześnie  kierunek  lotu  i prędkość.  Ilustracja  36 
na  tablicy  11  przedstawia  wygląd  zewnętrzny  licznika 
Czerenkowa. 


Zasadę  działania  tego  typu  detektora  ilustruje  rys.  12. 
W przewodzącej  rurce  wypełnionej  gazem  przeciągnię- 
ty jest  wzdłuż  osi  cienki  drut.  Między  rurką  a osłoną 
panuje  różnica  potencjałów  ok.  1 kV.  Przejściu 


Rys.  12.  Zasada  działania  licznika  proporcjonalnego 


cząstki  naładowanej  przez  licznik  towarzyszy  joni- 
zacja. Swobodne  ładunki  elektryczne  wędrują  do  e- 
lektrod.  W pobliżu  środkowej  elektrody  następuje 
zjawisko  wzmocnienia  gazowego,  tak  więc  ładunek 
elektryczny  powstający  na  elektrodzie  zbierającej 
licznika  jest  N razy  większy  od  ładunku  jonizacji  współczynnik 
pierwotnej.  Współczynnik  N nazywa  się  współczyn-  wzmocnienia 
nikiem  wzmocnienia  gazowego;  jego  wartość  zależy  gazowego 
od  napięcia  zasilania  oraz  rodzaju  i ciśnienia  gazu 
wypełniającego  licznik.  Liczniki  proporcjonalne  zna- 
lazły bardzo  szerokie  zastosowanie  w detekcji  cząstek, 
w pomiarze  jonizacji,  a w szczególności  do  pomiarów 
aktywności  źródeł  promieniotwórczości  o małej 
energii  wysyłanych  cząstek. 


Urządzenie  do  pomiaru  jonizacji 

II.  35  (tabl.  1 1)  przedstawia  52-tonowe  urządzenie  do 
identyfikacji  cząstek,  umieszczone  za  (patrząc  od 

strony  nadlatujących  cząstek)  Wielką  Europejską  Ko- 
morą" Pęcherzykową.  Do  identyfikacji  cząstek  wyko- 
rzystuje się  zjawisko  wzrostu  jonizacji  przy  bardzo  du- 
żych prędkościach  cząstek  (rys.  1).  Detektor  składa 
się  z 4096  liczników  proporcjonalnych,  ułożonych  w 
ciśnieniowym  pojemniku  w 128  warstwach,  po  32 
liczniki  w każdej  warstwie.  Długość  detektora  wynosi 
8,5  m,  a efektywna  powierzchnia  detekcji  1 m x 2 m. 
Energia  jonizacji,  wydzielona  w każdym  l iczniku  przez 
cząstkę  jonizującą,  jest  automatycznie  mierzona  przez 
układ  elektroniczny.  Dla  każdego  toru  odbywa  się 
więc  128  pomiarów  wydzielonej  energii.  Stąd  można 
wyznaczyć  jonizację  z dokładnością  do  ok.  3%,  a tym 
samym  można  określić  prędkość  cząstki.  Jeżeli  znany 
jest  pęd  z pomiaru  krzywizny  toru  w polu  magnetycz- 
nym, to  można  zidentyfikować  cząstkę. 


Układy  eksperymentalne 


Dwuramienny  spektrometr  mionów 

W laboratorium  imienia  Fermiego  grupa  fizyków  odkrycie 
pod  kierunkiem  Leona  Ledermana  odkryła  w 1977  r.,  cząstki  F 
badając  reakcje  p -F  tarcza  ->  n+pT  + cokolwiek, 
nową  cząstkę  — ypsilon.  Pęd  protonu  dobrze  znano, 
należało  zidentyfikować,  zarejestrować  i wyznaczyć 
pędy  obu  mionów  p.  W tym  celu  użyto  dwuramienne- 
go  spektrometru,  przedstawionego  na  zdjęciu  (tabl. 

11,  il.  37)  wykonanym  z osłony  tarczy  wzdłuż  wiązki. 

Na  pierwszym  planie  widać  dwa  duże  analizujące 
magnesy,  za  nimi  umieszczone  są  układy  liczników 
wyzwalających  układ,  następnie  wielodrutowe  komory 
proporcjonalne,  liczniki  Czerenkowa  i absorbery 
stalowe.  Układ  ten  mógł  zarejestrować  zdarzenia, 
podczas  których  zarówno  w jednym,  jak  i drugim 
ramieniu  przeleciał  mion,  oraz  określić  pęd  i kierunek 
lotu  każdego  mionu.  Pozwoliło  to  na  poszukiwanie 
cząstek,  które  rozpadają  się  na  dwa  miony.  Ekspery- 
ment zakończył  się  sukcesem.  Odkryto  cząstkę 
ypsilon,  T. 
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Zdjęcie  38  (tabl.  11)  przedstawia  widok  ogólny  spek- 
trometru Cl.  Urządzenie  to  łączy  zalety  komory  pę- 
cherzykowej — umożliwiającej  rejestrację  cząstek 
emitowanych  w dowolnym  kierunku  z punktu  od- 
działy'wania  — z szybkością  pracy  komór  iskrowych. 
Szybkość  rejestracji  jest  tu  bardzo  istotna.  Można 


Dodatkowe  liczniki  scyntylacyjne  S pozwalają 
stwierdzić  przejście  cząstki  i określić  natężenie 
wiązki  padającej.  Za  komorą  umieszczono  dwa  duże 
liczniki  Czerenkowa,  Cl  i C 2,  pozwalające  zidenty- 
fikować szybką  cząstkę  opuszczającą  obszar  oddzia- 
ływania, jeżeli  znany  jest  jej  pęd.  Pęd  ten  wyznaczają 
dwie  drutowa  komory  proporcjonalne  Yz  i Y4.  Znając 
położenie  tarczy,  a więc  tym  samym  przybliżone 


możSiwość  bowiem  dokonywać  bezpośredniej  selekcji  zdarzeń 
selekcji  zda-  i rejestrować  tylko  określone  procesy.  Rysunek  13 
rżeń  ukazuje  schematycznie  budowy  spektrometru.  W 
1400-tonowym  jarzmie  elektromagnesu  umieszczono 
2 nadprzewodzące  cewki,  pozwalające  przy  natężeniu 
prądu  4800  A wytwarzać  pole  magnetyczne  o indukcji 
1,8  T w obszarze  14  m3.  Wewnątrz  tego  obszaru  znaj- 
dują się  tarcza  wodorowa  oraz  dwa  układy  komór 
iskrowych  G2  i Cl.  Komory  są  „widziane”  przez 
specjalne  kamery  telewizyjne,  tzw.  plumbikony,  które 
automatycznie  rejestrują  współrzędne  iskry.  Infor- 
macja ta  może  być  zapisana  na  taśmie  magnetycznej 
maszyny  cyfrowej,  jeżeli  przypadek  spełnia  dane  kry- 
teria eksperymentu.  O tym  decyduje  układ  liczników 
sterujących  systemem  wyboru  danych  i zmieniających 
się  w zależności  od  potrzeb  eksperymentu.  Opiszemy 
układ  wybierający  tylko  zdarzenia  z bardzo  szybkim 
protonem  emitowanym  do  przodu.  W komorze  pę- 
cherzykowej, w której  się  rejestruje  wszystko  po  kolei, 
trzeba  by  wykonać  kilkadziesiąt  lub  kilkaset  tysięcy 
zdjęć  (zależnie  od  reakcji),  aby  zaobserwować  odpo- 
wiednią do  analizy  liczbę  zdarzeń  z szybkim  protonem. 
Identyfikacja  szybkiego  protonu  jest  w komorze  pę- 
cherzykowej trudna,  więc  nawet  zebrana  w ten  sposób 
próbka  zdarzeń  byłaby  „zanieczyszczona”.  W spek- 
trometrze Q zadanie  jest  łatwiejsze, 
układ  wy-  Wiązka  cząstek  ujemnych  o określonym  pędzie 
bierająoy  wchodzi  do  obszaru  tarczy  z lewej  strony,  przy  czym 
nie  pokazane  na  rys.  13  liczniki  Czerenkowa  pozwala- 
ją określić,  czy  jest  to  mezon  mezon  K~  czy  anty- 
proton.  Ponieważ  (tabela  str.  111)  przy  tej  samej 
prędkości  minimalnej  /?mln  proton  musi  mieć  znacz- 
nie większy  pęd  niż  mezon  n9  aby  wywołać  zjawisko 
Czerenkowa  wystarczy  więc  przy  określonym  pędzie 
cząstek  wiązki  umieścić  dwa  liczniki  Czerenkowa  o tak 
dobranych  substancjach,  aby  pierwszy  (C*)  reagował 
tylko  na  mezony  7 T,  drugi  ( Ck ) na  mezony  K~  i tT9 
a był  nieczuły  na  antyprotony.  Wtedy  przejściu  me- 
zonu 7t~  będzie  odpowiadał  sygnał  z obu  liczników, 
przejściu  K~  sygnał  tylko  z jednego  licznika,  a przy 
przejściu  antyprotonu  żaden  z liczników  nie  zareaguje. 
Oznaczając  kreską  poziomą  nad  symbolem  licznika 
brak  sygnału,  możemy  zapisać  symbolicznie  sygnały 
związane  z przejściem  cząstki: 

n"  : Cu  Ck,  K~  : C*  Ck,  p : C*  'Ck. 


położenie  punktu  oddziaływania,  oraz  współrzędne 
toru  w komorach  y3,  F4  i konfigurację  pola  magnety- 
cznego, można  określić  pęd  cząstki.  Sygnały  z dwóch 
liczników  Czerenkowa  o odpowiednio  dobranych 
parametrach  wraz  ze  znajomością  pędu  pozwaiają 
zidentyfikować  cząstkę.  Układ  zawiera  jeszcze  do- 
datkowe liczniki  Hu  Hz>  AQ,  wspomagające  układ 
sterowania.  W chwili,  gdy  ze  współpracujących  licz- 
ników nadejdą  sygnały  stwierdzające,  że  w obszarze 
tarczy  nastąpiło  oddziaływanie  i że  wśród  cząstek 
wtórnych  był  proton  o pędzie  powyżej  danej  wartości, 
układ  elektroniczny  sterowania  podejmie  decyzję 
zebrania  informacji  ze  wszystkich  komór  iskrowych 
i liczników  pomocniczych  i zapisania  jej  na  taśmie 
magnetycznej.  Decyzja  taka  jest  podejmowana 
w 7,5  • 10~7  s po  przejściu  cząstki.  Dalsze  opracowy- 
wanie danych  odbywa  się  już  znacznie  później, 
z wykorzystaniem  dużych  komputerów.  Jest  to  pro- 
ces żmudny,  wymagający  wielu  obliczeń,  prowadzący 
do  rekonstrukcji  w przestrzeni  zaszłego  zdarzenia. 

Komputer,  znając  współrzędne  wszystkich  iskier, 
może  na  żądanie  operatora  odtworzyć  na  ekranie 
telewizyjnym  obraz  zdarzenia. 

Urządzenie  TPC 

Pod  tym  skrótem  kryje  się  angielska  nazwa  Time  TPC — komo 
Projection  Chamber , czyli  komora  z projekcją  czasu,  ra  z projekcji 
Urządzenie  jest  dopiero  w budowie  w Berkeley  i bę-  czasu 
dzie  gotowe  kosztem  10  min  dolarów  w pierwszej  po- 
łowie lat  osiemdziesiątych.  W założeniu  konstrukto- 
rów .komora  zapewni  rejestrację  torów  poszczegól- 
nych cząstek  oraz  identyfikację  elektronów,  pionów, 
kaonów  i protonów  w bardzo  szerokim  zakresie  kąta 
bryłowego,  a nawet  dla  zdarzeń  z wieloma  cząstkami 
wtórnymi.  Komora  pozwoli  wyznaczyć  również  ener- 
gię kwantów  y oraz  zidentyfikować  miony.  Jednym 
słowem  ma  to  być  niemal  idealny  detektor,  o jakim 
śnili  fizycy.  Ma  on  współdziałać  z przeciwbieżnymi 
wiązkami  e+  i e~  w eksperymentach  mających  na  celu 
poszukiwanie  nowych  cząstek. 

Urządzenie  to  składa  się  z dużej  cylindrycznej  • 
komory  dryfowej  o średnicy  i długości  2 m (rys.  14). 

Współrzędne  prostopadłe  do  kierunku  dryfu  będą 
odczytywane  za  pomocą  układu  drutów.  Informację 
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Rys.  14.  Szkic  budowy  urządzenia  TPC 


dotyczącą  współrzędnej  wzdłuż  kierunku  dryfu 
uzyska  się  na  podstawie  pomiaru  opóźnienia  sygnału 
w drutach  w stosunku  do  czasu  przejścia  cząstki. 
Prędkość  dryfu  elektronów  ma  wynosić  7 cm/ps. 
Na  torze  cząstki  można  będzie  mieć  do  192  odczytów 
współrzędnych  (tyle  bowiem  jest  drutów).  Pozwoli  to 
zrekonstruować  nawet  oddziaływania  o dużej  liczbie 
cząstek  wtórnych.  Z wielkości  sygnału  na  każdym 
drucie  można  będzie  ocenić  pierwotny  ładunek 
jonizacji,  a więc  wyznaczyć  straty  energii  przechodzą- 
cej cząstki  na  jonizację.  Informacja  ta  wraz  ze  zna- 
jomością pędu  cząstki  pozwoli  na  jej  pełną  identy- 
fikację. Oczekuje  się,  że  elektrony,  piony,  kaony, 
protony  będzie  można  identyfikować  w zakresie 
pędów  100  MeV/c-15  GeV/c.  Cała  komora  będzie 
umieszczona  w polu  magnetycznym  nadprzewodzą- 
cych cewek  o indukcji  1,5  T.  Energia  i kierunek  kwan- 


pad  hiperonu  A°  (il.  31,  tabl.  10).  Hiperon  A°  ma 
średni  czas  życia  2,6  • 10“ 10  s,  a więc  żyje  stosunkowo 
długo.  Mezon  7r°  rozpada  się  średnio  po  czasie  0,8  • 

•10“ 16  s i tylko  z najwyższym  trudem  można  ocenić 
drogę,  którą  przebywa  w emulsji  jądrowej  od  pow- 
stania do  rozpadu.  Znamy  cząstki,  które  żyją  jeszcze 
parę  rzędów  wielkości  krócej  niż  n°.  Odległość  między 
punktem  produkcji  i punktem  rozpadu  jest  rzędu 
1 fm  = 10“ 15  m i bezpośrednia  obserwacja  toru  takiej 
cząstki,  zwanej  rezonansem,  jest  obecnie  niemożliwa; 
o jej  istnieniu  wnioskujemy  na  podstawie  analizy 
produktów  rozpadu. 

Omówimy  zagadnienie  na  przykładzie  doświadczę-  doświadcze- 
nia prowadzonego  przez  Leona  Ledermana  i zakon-  nie  Leder- 
czonego  odkryciem  nowej  cząstki  7°  (ypsilon)  o masie  mana 
9,5  GeV.  Omawialiśmy  już  spektrometr  dwuramien- 
ny,  który  ustawiono  w laboratorium  im.  Fermiego 
przy  akceleratorze  protonów.  Protony  o energii 
400  GeV  padały  na  tarczę,  za  którą  stał  spektrometr 
rejestrujący  tylko  miony  p+  i p~.  Badana  reakcja  prze- 
biegała następująco : 

p -b  jądro  tarczy  ->  p+  +p~  -j-  cokolwiek,  o czym  nic 
nie  wiemy. 

Mamy  natomiast  precyzyjną  informację,  że  zostały 
wyprodukowane  dwa  miony,  wiemy,  pod  jakimi 
kątami  zostały  emitowane  i z jaką  energią.  Sytuację 
przedstawia  rys.  16a.  Możemy  jednak  dopuścić, 
że  naprawdę  proces  przebiegał  inaczej  (rys.  16b). 

W wyniku  oddziaływania  proton-jądro  powstała 
jakaś  cząstka  o nieznanej  masie  która  po  bardzo 
krótkim  czasie  rozpadła  się  na  p+p~  . Jeżeli  czas  życia 
był  tak  krótki,  że  punkt  rozpadu  był  doświadczalnie 


uzwojenie  magnesu  kalorymetr  cewki  korekcyjne 
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Rys.  15.  Przekrój  poprzeczny  przez 
układ  detekcyjny  urządzenia  TPC, 
rury  próżniowe  wiązek  przeciwbież- 
nych e+ir  oraz  magnesy 


żelazny  absorber 


tów  7 ma  być  wyznaczony  przez  kalory metry  wypeł- 
nione ciekłym  argonem,  w których  się  będzie  mierzyć 
całkowitą  energię  kwantu  y.  Identyfikację  powolnych 
mionów'  uzyska  się  z pomiaru  jonizacji,  a mionów 
o większej  energii  — na  podstawie  zdolności  przeni- 
kania przez  warstwy  żelaza.  Cały  układ  będzie  ste- 
rowany przez  komputer  wybierający  według  danych 
kryteriów  określone  zdarzenia.  Rysunek  15  ilustruje 
przekrój  poprzeczny  przez  układ  detekcyjny,  rury 
próżniowe  wiązek  przeciwbieżnych  e+e~  oraz  mag- 
nesy. 


Badanie  krótkożyjących  cząstek 


Dotychczas  mówiliśmy  o cząstkach,  które  mogą 
przejść  przez  detektor,  tzn.  ich  droga  od  punktu 
powstania  do  punktu  rozpadu  jest  tak  długa,  że  można 
ją  zmierzyć.  Przykładem  może  być  powstanie  i roż- 


nie do  odróżnienia  od  punktu  produkcji,  to  obraz 
oddziaływania  będzie  taki  jak  na  rys.  16a.  O hipote- 
tycznej cząstce  nie  mamy  żadnych  informacji,  znamy 
natomiast  wektory  pędu  ewentualnych  produktów 

rozpadu  px  i pi-  Piszemy  „ewentualnych”,  ponieważ 

nie  wiemy,  czy  taka  cząstka  istnieje,  a jeżeli  istnieje, 

czy  rozpada  się  tylko  na  dwa  miony  p+  i p . Ponieważ 

nie  wiemy,  robimy  założenie:  a)  cząstka  istnieje,  b) 

rozpada  się  na  parę  p+p~.  Teraz  można  obliczyć 

masę  mr>  czyli  masę,  jaką  miałaby  cząstka  rozpadająca  obliczenie 

się  na  dwa  konkretnie  zarejestrowane  miony.  Masę  tę  masy  nie- 

nazywamy  masą  niezmienniczą  układu  (w  tym  wy-  zirńenniczej 

padku  układu  dwóch  mionów).  W mechanice  rela-  uktedu 

tywistycznej  energia  cząstki  wyraża  się  wzorem 

Ey.=  y/p^+mlc', 

z zasady  zachowania  pędu  otrzymujemy 

p^  = ]/ ( Pix  +P2z)2  + ( P\y  -rPzyY  + ( Piz  + PizY  » 
gdzie  px , Pyj  pz  są  składowymi  pędu  p wzdłuż  odpo- 
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wiednich  osi  współrzędnych,  a z zasady  zachowania 
energii  wynika.,. 

Et=  )/plcz+mlcl  +]/p~c2+m*c* . 

Znając  z pomiarów’  całkowite  pędy  obu  mionów  i ich 
składowe,  możemy  z powyższych  wzorów  obliczyć  mr. 

Mając  do  dyspozycji  tylko  jedną  rejestrację,  nie 
moglibyśmy  wyciągnąć  żadnego  wniosku.  Każde 
dwie  cząstki  dają  jakąś  masę  niezmienniczą,  choćby 
każda  z nich  powstała  w innym  procesie.  Dopiero 
dysponując  dużą  liczbą  rejestracji,  można  sprawdzić, 
czy  obliczone  masy  określonej  kombinacji  cząstek 
grupują  się  wokół  jakiejś  wartości.  Jeżeli  tak,  to  może 
znaczyć,  że  w oddziaływaniu  powstała  cząstka  (mó- 
wimy: rezonans)  o określonej  masie  (im  węższe 
jest  maksimum,  tym  dłużej  cząstka  żyje).  Rysunek  1 7 
przedstawia  wykres  zależności  częstości  pojawiania 
się  określonej  masy  pary  p+p~  od  wielkości  masy, 
wykazujący,  że  w obszarze  ok.  10  GeV  jest  wyraźne 
zgrupowanie  przypadków.  Bliższe  przyjrzenie  się 
rysunkowi  wskazuje  na  istnienie  dwóch  maksimów 
przy  9,4  GeV  i 10  GeV,  co  z kolei  wskazuje  na  istnie- 
nie dwóch  rezonansów  Ti  V'  o powyższych  masach. 
W podobny  sposób  wykryto  bardzo  wiele  cząstek. 


Metoda  badania  tak  krótkożyjących  tworów  jest 
statystyczna.  Nie  umiemy  na  razie  wskazać  zdarzenia 
i powiedzieć  o nim  z całą  pewnością,  że  w tym  wła- 
śnie wypadku  został  wytworzony  ypsilon.  Możemy 
tylko  powiedzieć,  że  w badanej  reakcji  produkuje  się 
ypsilon  z takim  to  a takim  przekrojem  czynnym. 
Nie  zmienia  to  faktu,  że  cząstka  taka  istnieje  w takim 
samym  sensie,  w jakim  istnieje  proton.  Wszędzie  tam, 
gdzie  się  będzie  produkował  ypsilon,  stwierdzimy 
nadmiar  kombinacji  mas  i pr  w obszarze  masy 
9,4  GeV,  jeśli  tylko  warunki  nie  będą  zabraniały 
rozpadu  na  //+  i p~. 

I.  Bartke  Wielka  Europejska  Komora  Pęcherzykowa,  Post. 
Fiz.  28,  433  ( 1977) ; D.A.  Bromlej  (ed.)  Dedectors  in  Nuclear 
Science , Nuclear  Instruments  and  Methods , t.  162,  Nr  1-3,  p.  1,  2 
(1979);  G.  Charpak.  Wielodrutowe  i dryfowe  komory  proporcjo- 
nalne, Post.  Fiz.  30, 579  (1979);  WJf.  Willis  Wielkie  spektrometry. 
Post.  Fiz.  31,  279  (1980);  J.W.  Zaniewskij  Prowołocznyje  dietie- 
ktory  elementarnych  czastic,  Moskwa  1978. 
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Akceleratory 

Ryszard  Sosnowski 

Akceleratorami  nazywamy  urządzenia,  które  pozwa- 
lają wytwarzać  strumienie  cząstek  obdarzonych  znacz- 
ną energią  kinetyczną.  Strumienie  rozpędzonych  czą- 
stek służą  fizykom  do  badania  bardzo  małych  obiek- 
tów, takich  jak  jądra  atomów  lub  cząstki  elementarne. 
Obecnie  coraz  częściej  wykorzystuje  się  akceleratory 
, na  potrzeby  techniki  oraz  terapii  medycznej, 

akcelerator  Pierwsze  akceleratory  cząstek  zbudowano  ok. 
— - narzędzie  1930  r.  Zapoczątkowały  one  nowy  okres  w fizyce 
badan  jądro-  jądrowej.  Z ich  pomocą  stała  się  możliwa  „alchemia 
wych  XX  wieku”  — przeprowadzanie  reakcji  jądrowych. 
Rozpędzone  cząstki,  uderzając  w jądra  ustawionych 
na  ich  drodze  tarcz,  zamieniały  je  w jądra  innych 
pierwiastków.  Procesy  te  badano  już  wcześniej, 
wykorzystując  cząstki  emitowane  przez  izotopy  radio- 
aktywne. Dopiero  jednak  zbudowanie  akceleratorów 
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pozwoliło  na  systematyczne  badanie  reakcji  jądrowych 
oraz  na  wytwarzanie  i zbadanie  własności  jąder  wielu 
nowych  izotopów. 

Budowa  alceleratorów  dostarczających  wiązek  akcelerator 
cząstek  o coraz  większej  energii  pozwoliła  fizykom  — narzędzie 
badać  w laboratoriach  obiekty  jeszcze  mniejsze  niż  badania 
jądra  atomów  — cząstki  elementarne  (-*  Cząstki  cząstek 
elementarne  i ich  oddziaływania).  W latach  pięćdzie-  elementar- 
siątych  powstały  akceleratory  nadające  protonom  nych 
tak  duże  energie,  że  mogły  one  wytworzyć  cząstki 
obserwowane  uprzednio  tylko  w zderzeniach  promie- 
ni kosmicznych  (— ► Promieniowanie  kosmiczne): 
mezony  i hiperony.  Ponadto  umożliwiły  odkrycie 
nowych,  nieobserwowanych  do  tego  czasu  antycząstek, 
a mianowicie:  antyprotonów,  antyneutronów  i anty- 
hi  peronów. 


Zwiększenie  intensywności  wiązek  przyspieszonych 
cząstek  oraz  ich  energii  pozwoliło  w latach  sześć- 
dziesiątych na  znaczne  powiększenie  rodziny  cząstek 
elementarnych  o tzw.  stany  rezonansowe.  Są  to  cząstki 
o tak  .krótkim  czasie  życia,  że  rozpadają  się  niemal 
natychmiast  (tzn.  po  czasie  ok.  10-23  s)  po  swym 
powstaniu.  Dalszy  rozwój  techniki  akceleracji  dopro- 
wadził do  odkrycia  w latach  siedemdziesiątych  nowej 
rodziny  cząstek  elementarnych  obdarzonych  tzw. 
powabem.  Nie  jest  przesadą  twierdzić,  że  bez  akcele- 
ratorów nie  potrafilibyśmy  zbadać  ani  własności  jąder 
atomowych,  ani  poznać  świata  najmniejszych  zna- 
nych obecnie  obiektów  fizycznych  — cząstek  ele- 
mentarnych. 


Akceleratory  elektrostatyczne 

Najprostszym  akceleratorem  cząstek  naładowanych 
jest  układ  dwóch  elektrod,  między  którymi  istnieje 
różnica  potencjału  elektrostatycznego.  Cząstka  na- 
ładowana, która  znajduje  się  w obszarze  między 
elektrodami  jest  odpychana  przez  elektrodę  o tym 
samym  znaku  ładunku  a przyciągana  przez  elektrodę 
naładowaną  przeciwnie.  Aby  cząstka  została  bez 
przeszkód  przyspieszona  między  elektrodami  musi 
istnieć  próżnia  taka,  by  średnia  droga  na  zderzenie 
przyspieszanej  cząstki  z cząsteczkami  gazu  była 
znacznie  większa  od  odległości  między  elektrodami. 
Wędrując  od  jednej  elektrody  do  drugiej  cząstka 
uzyskuje  energię  kinetyczną,  E , proporcjonalną  do 
różnicy  potencjałów  między  elektrodami,  K,  oraz  do 
wielkości  ładunku  elektrycznego  tej  cząstki,  e , 

E=  eV. 

Z tego  właśnie  względu  przyjęto  określać  energię 
przyspieszonych  cząstek  przez  podanie  różnicy  po- 
tencjałów, które  należałoby  zastosować  do  uzyskania 
elektrono-  tej  energii,  gdyby  cząstka  miała  ładunek  jednostkowy, 
wolt  Różnicę  potencjałów  wyrażamy  zazwyczaj  w woltach, 
a ładunek  jest  zawsze  wielokrotnością  ładunku 
elementarnego,  tzn.  takiego,  którym  jest  obdarzony 
np.  elektron.  Stąd  powszechnie  używaną  jednostką 
energii  jest  elektronowolt  (eV),  a jednostki  pochodne 
to  — kiloelektronowolt  (keV),  megaelektronowołt 
(MeV),  gigaelektronowolt  (GeV)  i teraelektronowolt 
(TeV), 

1 TeV  = 103GeV  = 106MeV  = 109keV  = 1012eV. 

Energię  jednego  elektronowolta  uzyskuje  cząstka 
o ładunku  takim  jaki  ma  elektron,  przyspieszona 
różnicą  potencjału  równą  1 wolt, 

1 eV  * 1,6  10-19J. 

rurki  Crooksa  Prototypem  pierwszych  akceleratorów  elektrosta- 
tycznych były  rurki  Crooksa,  w których  — w drugiej 
połowie  ubiegłego  wieku  — wytworzono  promienie 
katodowe,  będące  wiązkami  przyspieszonych  elek- 
tronów. Również  lampy  rentgenowskie  i wszelkie 
lampy  elektronowe,  są  małymi  akceleratorami  elek- 
tronów. Jednakże,  aby  badać  własności  jąder  ato- 
mowych należało  użyć  cząstek  o energiach  znacznie 
przewyższających  energie  uzyskiwane  w lampach 
rentgenowskich.  Ponadto  jako  pocisków  należało 
użyć  nie  elektronów  lecz  protonów. 

Akceleratory  typu  Cockrofta-Waltona 

J.D.  Cockroft  i E.T.S.  Walton  w 1932  r.  opubliko- 
wali opis  zbudowanego  przez  nich  akceleratora  pro- 
tonów. Protony  były  przyspieszane  różnicą  poten- 
cjałów 600  kV. 

W celu  uzyskania  tak  wysokiego  napięcia  Cockroft 
i Walton  zastosowali  układ  nazywany  generatorem 
kaskadowym,  którego  schemat  pokazany  jest  na 


rys.  1.  Transformator  prądu  zmiennego  wytwarza  na 
końcówkach  uzwojenia  wtórnego  zmienne  napięcie 
o amplitudzie  V0.  Gdy  końcówka  1 jest  biegunem 


generator 

kaskadowy 
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Rys.  I . Schemat  generatora  kaska- 
dowego typu  Cockrofta  i Wal  tona  <->  ~ v 

dodatnim  a końcówka  2 biegunem  ujemnym,  wówczas 
kondensator  Cx  ładuje  się  do  napięcia  V0y  gdyż  punkty 
1 i 3 są  zwarte  przez  prostownik  Px.  W drugiej  połów- 
ce okresu  końcówka  1 jest  biegunem  ujemnym,  lecz 
prostownik  Px  nie  pozwala  dodatniemu  ładunkowi 
odpłynąć  z puntu  3 do  punktu  1 . Transformator  i kon- 
densator Ci  są  wtedy  połączone  szeregowa,  wytwarza- 
jąc na  okładkach  kondensatora  C2  napięcie  2 V0.  W na- 
stępnej połówce  okresu  znowu  końcówka  1 jest  bie- 
gunem dodatnim  i wtórne  uzwojenie  transformatora 
jest  połączone  szeregowo  z kondensatorem  C2,  wy- 
twarzając między  punktem  5 i punktem  2 napięcie 
3 V0.  W kolejnej  połówce  półokresu  połączone 
szeregowo  kondensatory  C i Cs  oraz  wtórne  uzwoje- 
nie transformatora  wytwarza  między  punktem  1 i 
punktem  6 napięcie  4V0. 

Zastosowanie  odpowiedniej  liczby  prostowników 
i kondensatorów  pozwala  na  uzyskanie  większego 
zwielokrotnienia  napięcia.  Nie  możemy  jednak  zwięk- 
szać napięcia  nieograniczenie.  Ze  względu  na  wyła- 
dowania, które  powodują  ucieczkę  ładunku  elektrycz- 
nego z wyższych  stopni  kaskady,  generatory  wyso- 
kiego napięcia  typu  Cockrofta-Waltona  dostarczają 
napięcia  nie  większego  niż  3 M V . Ucieczkę  ładunku 
można  zmniejszyć,  zamykając  całe  urządzenie  w po- 
jemniku, w którym  zwiększa  się  ciśnienie  gazu.  W ten 
sposób  uzyskiwano  napięcie  do  6 MV. 

Wadą  akceleratorów  Cockrofta-Waltona  jest  mała 
stabilność  uzyskiwanego  napięcia  i dlatego  nie  zna- 
lazły one  większego  zastosowania  do  badania  jąder 
atomowych.  Używa  się  ich  natomiast  jako  pierwszego 
stopnia  przyspieszenia  cząstek,  które  są  następnie 
wprowadzane  do  akceleratorów  cyklicznych  wielkich 
energii.  Stosunkowo  duża  moc  prądu  wiązki  uzyski- 
wana za  pomocą  akceleratorów  kaskadowych  pozwa- 
la na  uzyskanie  intensywnych  wiązek.  Na  il.  39 
(tabl.  11)  jest  pokazany  generator  typu  Cockrofta- 
Waltona,  w którym  protony  są  przyspieszane  do 
energii  10  MeV.  Następnie  są  one  wprowadzane  do 
największego  obecnie  akceleratora,  synchrotronu 
Narodowego  Laboratorium  Akceleratorowego  im. 
H.  Fermiego  w Batavii  i uzyskują  energię  do  500  GeV. 

Wytworzona  przez  generator  wysokiego  napięcia 
różnica  potencjałów  wykorzystywana  jest  do  przy- 
spieszenia jonów.  Następuje  to  w tzw.  rurze  przy- 
spieszającej, w której  panuje  wysoka  próżnia.  Moż- 
liwie dokładne  usunięcie  z rury  gazu  jest  niezbędne 
z dwóch  powodów.  Po  pierwsze,  gaz  nie  powinien 
stwarzać  przeszkód  na  drodze  przyspieszanych  jonów. 
Po  drugie,  cząsteczki  zjonizowanego  gazu  w rurze 
akceleracyjnej  powodowałyby  odpływ  ładunku  z elek- 
trody wysokiego  napięcia.  Zmniejszenie  ucieczki 
ładunku  przez  gaz  jest  możliwe  albo  za  pomocą  zwięk- 
szenia ciśnienia  gazu,  albo  przez  możliwie  dokładne 
jego  usunięcie. 


zastosowania 
akcelerato- 
rów Cockro- 
fta— Waltona 
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źródło  Ważnym  elementem  każdego  akceleratora  jest  żró- 
cząstek  dło  cząstek,  które  mają  być  przyspieszane.  Na  ogół 
są  to  jony  określonego  typu.  Najczęściej  stosowano 
protony,  deuterony  i cząstki  a.  Ostatnio  jednak  przy- 
spiesza się  również  ciężkie  jony  (-*  Fizyka  ciężkich 
jonów).  Zadaniem  źródła  jonów  jest  wytworzenie 
i dostarczenie  tych  jonów  — żądanego  rodzaju  i ilo- 
ści — w pobliże  elektrody  wysokiego  napięcia.  Bardzo 
często  ważne  jest,  aby  energia  jonów  po  przyspiesze- 
niu była  dobrze  określona,  tzn.  aby  wszystkie  jony 
z wiązki  wychodzącej  z akceleratora  miały  tę  samą 
energię.  W tym  wypadku  oczywiście  rozrzut  energii 
jonów  przed  przyspieszeniem  musi  być  mały. 

Jony  dostarczone  przez  źródło  są  przyspieszane 
wzdłuż  rury  akceleracyjnej,  którą  wykonuje  się  z do- 
brych izolatorów,  aby  nie  powodować  upływu  ła- 
dunku, co  zmniejszałoby  wartość  napięcia.  Wzdłuż 
rury  umieszcza ' się  wiele  elektrod  pośrednich.  Ich 


Rys.  2.  Fragment  rury  ak- 
celeratora elektrostatycz- 
nego. Elektrody  pośrednie 
zapewniają  równomierny 
rozkład  pola  wzdłuż  rury 
oraz  ogniskują  cząstki 
wzdłuż  osi  symetrii  rury 

zadaniem  jest  ogniskowanie  wiązki  przyspieszonych 
cząstek  wokół  osi  rury.  Zmniejsza  to  straty  wiązki, 
zabezpiecza  przed  gromadzeniem  się  ładunków  na 
ściankach  rury  (co  mogłoby  zakłócić  proces  przy- 
spieszania) oraz  zapewnia  mały  wymiar  poprzeczny 
wiązki  na  wyjściu  z akceleratora,  ułatwiający  wyko- 
rzystanie przyspieszonych  cząstek  (rys.  2). 


Akceleratory  z generatorami  Van  de  Graaffa 

Nieomal  w tym  samym  czasie,  gdy  Cockroft  i Walton 
zbudowali  swój  pierwszy  akcelerator,  R.J.  Van  de 
generator  Graaff  skonstruował  generator  wysokiego  napięcia 
Van  de  działający  na  odmiennej  zasadzie.  Prototypem  tego 
Graaffa  generatora  było  urządzenie,  którego  pomysł  poddał 
lord  Kelvin.  Pozwalało  ono  na  uzyskanie  wysokiego 
napięcia  za  pomocą  źródła  o znacznie  niższym  na- 
pięciu. Zasada  działania  tego  urządzenia  pokazana 
jest  na  rys.  3.  Spadające  do  wnętrza  puszki  Faradaya 
krople  wody  przenoszą  do  niej  ładunek  elektryczny. 


Rys.  3.  Zasada  generatora 
Van  de  Graaffa.  Przeka- 
zywany do  puszki  Fara- 
daya ładunek  przenoszony 
przez  krople  wody  pozwala 
uzyskać  różnicę  potencja- 
łów znacznie  wyższą  niż 
wytwarzana  przez  genera- 
tor połączony  ze  zbiorni- 
kiem wody 
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niskie  napięcie  ładował  powierzchnię  pasa  jedwabne- 
go, który  przenosił  ładunek  do  wnętrza  metalowej 
kuli,  spełniającej  rolę  puszki  Faradaya  (rys.  4).  Tam 
ładunek  był  zbierany  z pasa  za  pomocą  szczotki  me- 
talowej. 

podwójny  W 1931  r.  Van  de  Graaff  zbudował  podwójny  gene- 
generator  rator  składający  się  z dwóch  identycznych  urządzeń, 
Van  de  z których  jedno  generowało  potencjał  dodatni, 
Graaff  a a drugie  ujemny.  Każda  z elektrod  osiągała  napięcie 
750  kV  względem  ziemi,  a więc  napięcie  między  elek- 
trodami wynosiło  1,5  MV.  Na  rys.  5 jest  pokazane 
zgłoszenie  patentowe  tego  urządzenia. 

Pierwszy  akcelerator,  w którym  generator  Van  de 
Graaffa  wyposażony  był  w rurę  akceleracyjną  i źródło 
jonów  przedstawiono  na  il.  34  (tabl.  10).  Dostarczał 
on  wiązki  protonów  i deuteronów  o energii  0,6  MeV. 

Współcześnie  działające  generatory  Van  de  Graaffa 
przekraczają  napięcie  20  MV,  a budowany  w Dares- 
bury  generator  ma  osiągnąć  napięcie  30  MV.  Przy 
tak  dużych  napięciach  urządzenia  te  muszą  być  zam- 
knięte w pojemnikach,  w których  panuje  wysokie 
ciśnienie  gazu  (ok.  500  hP).  Do  tego  celu  używa  się 
gazów  o szczególnie  dobrych  własnościach  izolacyj- 
nych, np.  SF6.  Wielkość  uzyskiwanego  napięcia  za- 
leży od  tego,  jak  szybko  można  uzupełniać  ucie- 
kający ładunek.  Do  transportu  ładunku  używa  się 
więc  pasów  poruszających  się  ze  znaczną  prędkością  — 
ok.  1 km/min.  Przenoszony  przez  te  pasy  prąd  łado- 
wania wynosi  100-500  jiA. 


Akcelaratory  typu  tandem 

Już  w 1932  r.  A.J.  Dempster,  stosując  różnice  po- 
tencjałów 22,5  kV,  otrzymał  protony  o energii  45  keV. 
Schemat  urządzenia  Dempstera  jest  pokazany  na 
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Rys.  6.  Zasada  działania  akceleratora  typu  tandem  zastosowana 
przez  Dempstera 


rys.  6.  Protony  są  przyspieszane  różnicą  potencjałów 
między  elektrodą  dodatnią  A i uziemioną  B.  W po- 
bliżu elektrody  B część  protonów  wychwytuje  elek- 
trony i już  jako  neutralne  atomy  wodoru  przebywają 
przestrzeń  BC.  Po  wyminięciu  elektrody  C znaczna 
część  obojętnych  atomów  w zderzeniu  z resztkami 
wodoru  traci  elektrony  i jako  jony  dodatnie  jest  przy- 
spieszana różnicą  potencjałów  panującą  między  C i D. 

Zasada  zmiany  ładunku  przyspieszanych  jonów 
została  wykorzystana  we  współczesnych  akcelerato- 
rach typu  tandem.  Powstały  one  w końcu  lat  pięć- 
dziesiątych mimo,  że  zasada  ich  działania  była  sfor- 
mułowana znacznie  wcześniej.  W.H.  Bennett  przed- 
stawił ją  jako  zgłoszenie  patentowe  w 1935  r.  Dopiero 
jednak  opracowanie  źródeł  jonów  ujemnych  oraz 
opanowanie  techniki  zamiany  ich  na  jony  dodatnie 
pozwoliło  budować  akceleratory  typu  tandem. 
W akceleratorach  tych  jony  są  przyspieszane  w dwóch 
etapach.  Ujemnie  naładowane  jony  są  przyspieszane 
w polu  między  uziemionym  źródłem  jonów  i elektrodą 
naładowaną  dodatnio.  Po  osiągnięciu  elektrody  jony 
przechodzą  przez  obszar  o nieco  wyższym  ciśnieniu 
gazu  lub  przez  cienką  folię.  W wyniku  zderzeń  część 


jonów  traci  pewną  ilość  elektronów  i staje  się  jonami 
dodatnimi.  Wiązka  dodatnich  jonów  jest  następnie 
przyspieszana  potencjałem  dodatnim  elektrody. 

Akceleratory  typu  tandem  znalazły  powszechne 
zastosowanie  w fizyce  jądrowej.  Pozwalają  one  uzys- 
kać wiązki  różnorodnych  jonów  o energiach  do  paru 
dziesiątków  MeV.  Ponadto  wiązki  te  mają  bardzo 
dobrze  określoną  energię.  Względny  rozrzut  energii 
jonów  wynosi  10" 5 energii  średniej. 


Akceleratory  liniowe 


W omawianych  dotychczas  akceleratorach  wykorzy- 
stywano stałe,  niezmieniające  się  w czasie  pole  elek- 
trostatyczne. Już  jednak  w 1924  r.  Ising  opublikował 
projekt,  w którym  pole  przyspieszające  pojawiało  się 


źródło 


generator 

wielkiej 

częstości 

Rys.  7.  Schemat  akceleratora  liniowego 


wiązka  jonów 


w poszczególnych  przerwach  między  elektrodami 
tylko  wtedy,  gdy  docierała  do  tej  przerwy  grupa 
przyspieszanych  jonów.  Na  rys.  7 pokazano  schemat 
takiego  akceleratora.  Generator  zmiennego  napięcia 
połączony  jest  z elektrodami  Eu  E2  i E 3 przez  linie 
opóźniające.  W obszarach  Su  S2  i Sz  powstaje  zmienne 
pole  elektryczne.  Długość  elektrod  E jest  tak  dobra- 
na, aby  w czasie,  gdy  w obszarach  S występuje  pole 
o znaku  przeciwnym  niż  potrzebny  do  przyspiesze- 
nia, jony  znajdowały  się  wewnątrz  cylindrycznych 
elektrod  E.  Ze  względu  na  uzyskiwaną  przez  jony 
coraz  większą  prędkość  każda  następna  elektroda 
jest  dłuższa  niż  poprzednia.  W akceleratorze  poka- 
zanym na  schemacie  jony  są  przyspieszane  trzykrot- 
nie. Akcelerator  ten  dostarcza  cząstek  nie  w postaci 
nieprzerwanego  strumienia,  lecz  jako  krótkotrwałe 
impulsy.  Akcelerator  pracujący  na  tej  zasadzie  został 
po  raz  pierwszy  zbudowany  przez  Wideroe.  Za  po- 
mocą generatora  o napięciu  20  kV  uzyskano  jony 
potasu  o energii  40  keV.  Jednakże  rozwój  akcelera- 
torów liniowych  nastąpił  dopiero  z chwilą  opanowa- 
nia techniki  mikrofal  i generatorów  wysokiej  często- 
ści. Technika  ta  przeżyła  gwałtowny  rozwój  w cza- 
sach II  wojny  światowej  dzięki  wprowadzeniu  radaru. 

Drugim  ważnym  czynnikiem  umożliwiającym  bu- 
dowę akceleratorów  liniowych  było  odkrycie  zasady 
samoogniskowania  się  cząstek.  Współczesny  akcele- 
rator liniowy  działa  w ten  sposób,  że  elektryczne  pole 
przyspieszające,  równoległe  do  osi  rury  akcelera- 
cyjnej,  jest  wytworzone  w niewielkim  stosunkowo 
obszarze,  który  przesuwa  się  wzdłuż  akceleratora 
z tą  samą  prędkością  z jaką  biegną  przyspieszone 
cząstki.  Na  pozór  realizacja  takiego  procesu  wydaje 
się  wymagać  niesłychanie  precyzyjnego  uregulowania 
prędkości  początkowej  cząstek,  wartości  natężenia 
pola  oraz  prędkości  przesuwania  się  tego  pola.  W pra- 
ktyce okazuje  się  jednak,  że  dochodzi  do  automa- 
tycznego dopasowania  się*  tych  wielkości,  ułatwiają- 
cego uzyskanie  efektu  przyspieszenia. 

Na  rys.  8 przedstawiono  rozkład  natężenia  pola 
elektrycznego  przyspieszającego  cząstki.  Pole  to 
przesuwa  się  z pewną  prędkością  wzdłuż  rury  akcele- 
ratora wraz  z cząstkami,  które  w tym  polu  uzyskują 
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Rys.  8.  Zasada  samodopasowania  wartości  pola  przyspieszają- 
cego w akceleratorze  liniowym  — E0  * prędkości  jego  przesu- 
wania się  wzdłuż  rury  akceleracyjnej  — V 

przyspieszenie.  Oznaczmy  przez  E0  tę  wartość  pola, 
która  zapewnia  takie  przyspieszenie  cząstek,  że  ich 
prędkość  jest  zawsze  identyczna  z prędkością  prze- 
suwania się  pola.  Wartość  E0  występuje  w dwóch 
punktach  A i B.  Załóżmy,  że  jakaś  cząstka  zamiast 
znaleźć  się  w punkcie  A opóźni  się  i pole  zacznie  ją 
wyprzedzać.  Wówczas  podlega  ona  działaniu  nieco 
silniejszego  pola,  prędkość  jej  wzrośnie  szybciej 
niż  innych  cząstek  i wkrótce  opóźniająca  się  cząstka 
dogoni  lub  nawet  przegoni  pole  przyspieszające. 
W wypadku  uzyskania  zbyt  dużego  przyspieszenia 
i wyprzedzenia  pola  cząstka  znajdzie  się  w obszarze 
pola  słabszego  i będzie  przyspieszana  mniej  efektyw- 
nie. Pozwoli  to  z kolei  przesuwającemu  się  polu 
elektrycznemu  dopędzić  uciekającą  cząstkę.  Widzimy 
więc,  że  w pobliżu  punktu  A występuje  mechanizm 
samoczynnego  dopasowania  się  prędkości  cząstek  do 
wartości  pola  przyspieszającego  i do  prędkości  prze- 
mieszczania się  tego  pola.  Warto  zauważyć,  że  w po- 
bliżu punktu  B mechanizm  samodopasowania  nie 
występuje. 

Akceleratory  liniowe  są  używane  zarówno  do  przy- 
spieszania protonów  jak  i elektronów.  Największy 
akcelerator  protonów  pracujący  w Los  Alamos  osiąga 
energię  800  MeV.  Największym  akceleratorem  linio- 
wym przyspieszającym  elektrony  jest  liniowy  akce- 
lerator w Stanford,  który  przyspiesza  elektrony  do 
energii  20  GeV. 


Akceleratory  cykliczne 


Poza  akceleratorami,  w których  tory  przyspieszanych 
cząstek  biegną  w przybliżeniu  po  liniach  prostych, 
istnieje  wiele  typów  akceleratorów  o torach  zbliżo- 
nych do  okręgów.  W akceleratorach  tych  przyspie- 
szane cząstki  biegną  w polu  magnetycznym  zakrzy- 
wiającym ich  tory.  Dzięki  temu  można  znacznie  wy- 
dłużyć drogę,  na  której  cząstki  doznają  przyspiesze- 
nia, bez  konieczności  budowy  bardzo  długich  rur 
akceleracyjnych.  W czasie  pokonywania  tej  drogi 
cząstki  doznają  drobnych,  lecz  wielokrotnych  przy- 
rostów energii,  co  powoduje  że  całkowity  przyrost 
energii  jest  znaczny.  Akceleratory  tego  typu  nazwano 
akceleratorami  cyklicznymi. 


Cyklotron 

Cyklotron  jest  najstarszym  akceleratorem  cyklicznym. 
Zasada  jego  działania  polega  na  tym,  że  cząstka 
naładowana  poruszająca  się  w jednorodnym  polu 
magnetycznym  prostopadle  do  linii  pola  biegnie  po 
torze  kołowym,  a czas  obiegu  wynosi 
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gdzie  m — masa  cząstki,  c — prędkość  światła,  e — 
ładunek  elektryczny  cząstki,  H — natężenie  pola 
magnetycznego,  r — promień  toru,  v — prędkość 


cząstki.  Jak  widzimy  okres  obiegu  cząstki  nie  zależy 
od  jej  energii,  jeśli  pominiemy  relatywistyczny 
wzrost  masy.  Zasadę  działania  cyklotronu  pokazano 
na  rys.  9.  Wzdłuż  średnicy  toru  cząstki  ustawione 
są  dwie  elektrody,  między  którymi  jest  przyłożone 
zmienne  pole  elektryczne  o częstości  równej  \/T. 
Naładowana  cząstka,  która  w pewnej  chwili  znajduje 


się  między  elektrodami,  zostanie  przyspieszona  i za- 
toczywszy półokrąg  po  czasie  7)2,  znajdzie  się  ponow- 
nie w obszarze  między  elektrodami.  Natrafi  wówczas 
na  pole,  które  jest  skierowane  zgodnie  z jej  ruchem 
i w zwitku  z tym  cząstka  ta  ulegnie  dalszemu  przy- 
spieszeniu. Promień  jej  toru  zwiększy  się.  Po  czasie 
172  cząstka  zatoczy  następne  pół  okręgu  i ulegnie 
dalszemu  przyspieszeniu.  W ten  sposób,  dzięki 
wielokrotnemu  przechodzeniu  przez  obszar  przyspie- 
szający, tor  cząstki  dojdzie  do  granicy  pola  jedno- 
rodnego i dalszy  wzrost  energii  cząstki  przestanie  być 
możliwy. 


Synchrocyklotron 


Możliwość  kontynuowania  przyspieszania  cząstek 
nie  jest  ograniczona  jedynie  skończonymi  rozmiarami 
pola  magnetycznego.  Ze  względu  na  relatywistyczny 
wzrost  masy  cząstki,  w miarę  wzrostu  jej  energii 
okres  obiegu  po  orbicie  kołowej  wydłuża  się  i cząstka 
zaczyna  się  pojawiać  w obszarze  między  elektrodami 
zbyt  późno,  aby  trafić  na  pole  przyspieszające. 

W celu  uzyskania  cząstek  o energiach  większych 
niż  to  jest  możliwe  w cyklotronach,  zaczęto  budować 
tzw.  synchrocyklotrony.  Są  to  akceleratory  działające 
w podobny  sposób  jak  cyklotrony,  lecz  w tym  wy-  wykorzysta* 
padku  częstość  pola  przyspieszającego  maleje  w mia-  nfe  zmiany 
rę,  jak  przyspieszone  cząstki  uzyskują  energię  i okres  częstości 
ich  obiegu  po  torze  kołowym  wzrasta.  Oczywiście  poja 
w odróżnieniu  od  cyklotronów,  w których  możliwe 
jest  jednoczesne  przyspieszanie  cząstek  w całym 
obszarze  pola  magnetycznego,  synchrocyklotrony 
przyspieszają  w danej  chwili  tylko  te  cząstki,  których 
energia  odpowiada  aktualnej  częstości  pola  przyspie- 
szającego. Wykorzystując  zasadę  synchrocyklotronu, 
uzyskano  wiązki  protonów  o energii  do 700  MeV. 


Rys.  10.  Zasada  samodopasowania  w synchrocyklotronic 
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sasnoognis-  W konstrukcji  synchrocyklotronów  ważną  rolę  od- 
kowanie  fazy  grywa  zasada  samoogniskowania  fazy  cząstek  oma- 
cząstek  wiana  już  przy  opisie  akceleratorów  liniowych.  Za- 
sada ta  działa  tutaj  następująco.  Niech  między  elektro- 
dami przyspieszającymi  synchrocyklotronu  panuje 
zmienne  pole  elektryczne  o wolno  malejącej  częstości. 
Przebieg  jego  amplitudy  przedstawiono  na  rys.  10. 
Punktem  A jest  oznaczona  wartość  pola  konieczna  do 
uzyskania  takiego  wzrostu  energii  cząstki,  by  po 
czasie  T natrafiła  ona  na  pole  A'  w celu  dalszego 
przyspieszenia.  Jeżeli  jednak  zamiast  w punkcie  A 
cząstka  znajdzie  się  w polu  przyspieszającym  wcześniej 
(punkt  B)y  to  uzyska  zbyt  dużo  energii.  Ze  względu 
na  relatywistyczny  wzrost  masy  okres  jej  obiegu 
wydłuży  się  i w następnym  cyklu  przyspieszania  zosta- 
nie ona  poddana  działaniu  słabszego  pola  (punkt  B'). 
W ten  sposób  zbyt  silne  przyspieszenie  w jednym 
cyklu  zostaje  skompensowane  słabszym  przyspiesze- 
niem w cyklu  następnym  i odwrotnie.  Warunkiem 
wystąpienia  takiego  samoregulującego  się  mechaniz- 
mu jest  pojawienie  się  cząstek  w obszarze  pola,  gdy 
pole  to  maleje  (obszar  wokół  punktu  A\  a nie  gdy 
rośnie  (obszar  wokół  punktu  C).  Należy  zauważyć, 
że  sytuacja  w synchrocyklotronie  jest  odmienna  niż 
w akceleratorze  liniowym.  Tam  cząstki  opóźniające 
się,  a więc  wolniejsze,  powinny  podlegać  działaniu 
silniejszego  pola  przyspieszającego.  W synchrocy- 
klotronie natomiast  spóźniają  się  cząstki  szybsze 
o zbyt  dużej  energii. 


Cyklotrony  izochronaczne 

Jak  wynika  ze  wzoru  na  okres  obiegu  cząstki  po  orbi- 
cie kołowej,  okres  ten  można  przy  wzroście  masy 
utrzymać  stały,  gdy  jednocześnie  zwiększy  się  wartość 
natężenia  pola  magnetycznego.  Ponieważ  cząstki 


Rys.  11.  Magnes  dający  pole  magnetyczne  o natężeniu  rosnącym 
w kierunku  zewnętrznym.  Pole  takie  nie  może  być  użyte  w cyklo- 
tronie, gdyż  nie  ogniskuje  cząstek  w pobliżu  poziomej  płaszczyzny 
symetrii  szczeliny  magnesu 


o większej  energii  poruszają  się  po  torach  o większym 
promieniu,  mogłoby  się  wydawać,  że  pole  magne- 
tyczne magnesu  (pokazanego  na  rys.  11)  może  za- 
pewnić możliwość  przyspieszania  cząstek  przy  stałej 
częstości  zmiennego  pola  elektrycznego.  W miarę 
uzyskiwania  coraz  większej  energii,  a więc  i wzrostu 
relatywistycznego  masy  cząstki,  porusza  się  ona  po 
torach  biegnących  w obszarze  silniejszego  pola 
magnetycznego.  Niestety,  pola  magnetycznego  po- 
kazanego na  rys.  11  nie  można  wykorzystać  w cyklo- 
tronie, ponieważ  charakteryzuje  się  ono  tym,  że  tylko 
cząstki  poruszające  się  w idealnie  poziomej  płaszczyź- 
nie symetrii  szczeliny  między  nabiegunnikami  pozo- 
staną w tej  płaszczyźnie.  Każde  najdrobniejsze  odchy- 
lenie od  tej  płaszczyzny  spowoduje,  że  cząstki  będą 
się  od  niej  stopniowo  oddalać  i uderzą  w nabiegunnik 
magnesu. 

Aby  temu  przeciwdziałać,  w cyklotronach  izochro- 
nicznych  stosuje  się  pole  magnetyczne,  którego 
natężenie  uśrednione  po  całej  orbicie  kołowej  wzrasta 
wpływ  wraz  z odległością  od  środka  cyklotronu.  Nabiegun- 
kształtu  niki  nie  mają  jednak  symetrii  cylindrycznej  jak  w cy- 
nabiegunni-  klotronach  i synchrocyklotronach.  Biegnące  cząstki 
ków  natrafią  kolejno  na  obszary  słabszego  i silniejszego 


Rys.  12.  Przykłady  kształtu  nabiegunników  magnesów  stosowa- 
nych w cyklotronach  izochronicznych 


pola  magnetycznego,  co  uniemożliwia  im  oddalanie 
się  od  płaszczyzny  symetrii  szczeliny  między  nabiegun- 
nikami. Na  rys.  12  pokazane  są  nabiegunniki  stoso- 
wane w cyklotronach  izochronicznych. 

Za  pomocą  cyklotronów  izochronicznych  można 
uzyskiwać  cząstki  o energiach  znacznie  większych 
niż  w cyklotronach  klasycznych.  W ten  sposób  uzys- 
kano protony  o energii  kilkuset  MeV.  Ograniczenie 
wielkości  otrzymywanych  energii  za  pomocą  cyklo- 
tronów izochronicznych  wynika  z faktu,  że  dla 
dużych  energii  wzrostowi  pędu  cząstki  towa- 
rzyszy bardzo  mały  wzrost  jej  prędkości.  Należy 
więc  poza  cyklotronem  utrzymywać  pole  rosnące 
bardzo  szybko  wraz  z promieniem.  W odległości 
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natężenie  pola  magnetycznego  powinno  osiągnąć 
wartość  nieskończoną.  We  wzorze  tymm0  oznacza 
masę  spoczynkową  cząstki,  a H0  — natężenie  pola 
magnetycznego  w pobliżu  osi  nabiegunnika.  Uzyskanie 
pola  magnetycznego  zmieniającego  się  gwałtownie 
z promieniem  orbity  jest  prawie  niemożliwe. 


Syrachrotron 

W odróżnieniu  od  cyklotronu  klasycznego,  czy  nawet 
izochronicznego,  synchrocyklotron  może  teoretycznie 
dostarczać  cząstki  o nieograniczenie  dużej  energii. 
Przeszkodą  jest  jednak  zbyt  duży  koszt  jego  budowy. 
Najkosztowniejszym  jego  elementem  jest  magnes, 
który  musi  wytwarzać  prawie  jednorodne  pole  magne- 
tyczne w bardzo  dużym  obszarze,  obejmującym  za- 
równo tory  cząstek  powolnych  jak  i tych  w końcowej 
fazie  przyspieszenia.  Aby  uniknąć  wysokich  kosztów 
magnesu,  buduje  się  akceleratory,  w których  przy- 
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spieszane  cząstki  krążą  po  stałych  orbitach.  Dopóki 
cząstki  mają  małą  energię,  elektromagnesy  wytwa- 
rzają pole  magnetyczne  o niewielkim  natężeniu. 
Natężenie  to  rośnie  w miarę  uzyskiwania  przez  cząs- 
tki coraz  wyższej  energii.  W ten  sposób  cząstki  biegną 
w akceleratorze  po  stałych,  w przybliżeniu,  torach 
i tylko  w tym  obszarze  potrzebne  jest  pole  magne- 
tyczne. Przyspieszanie  cząstek  odbywa  się  podobnie 
jak  w cyklotronach  za  pomocą  zmiennego  pola  elek- 
trycznego. Częstość  tego  pola  rośnie  w miarę,  jak 
rośnie  prędkość  cząstek. 

Schemat  synchrotronu  pokazany  jest  na  rys.  13. 
Wstępnie  przyspieszone  cząstki  wprowadzane  są  do 
synchrotronu,  gdzie  ich  tor  składa  się  z czterech 
ćwiartek  okręgu  połączonych  odcinkami  prostolinio- 
wymi. Rosnące  w procesie  akceleracji  pole  zlokali- 
zowane jest  tylko  w obszarze,  gdzie  tory  się  zakrzy- 
wiają. Przyspieszanie  cząstek  odbywa  się  na  jednym 
z prostych  odcinków.  Po  uzyskaniu  żądanej  energii 
cząstki  są  na  ogół  wyprowadzane  z akceleratora. 
W tym  celu  na  pewnym  odcinku  ich  orbity  pojawia 
się  pole  magnetyczne  skierowujące  wiązkę  cząstek 
w pożądanym  kierunku. 

Schemat  pokazany  na  rys.  13  przedstawia  synchro- 
tron  starszego  typu  z tzw.  „słabym”  ogniskowaniem. 
W akceleratorach  tego  typu  tory  przyspieszanych 
cząstek  mogły  się  znacznie  odchylać  od  średniego 
toru.  Zmuszało  to  konstruktorów  akceleratora  do 
stosowania  dużych  magnesów,  a próżniowy  kanał 
akceleratora  musiał  mieć  dużą  średnicę.  Odkrycie  za- 
sady silnego  ogniskowania  umożliwiło  stosowanie 
kanałów  o średnicy  paru  centymetrów  i tylko  w tym 
obszarze  powinno  się  wytworzyć  pole  magnetyczne. 
Zasada  silnego  ogniskowania  polega  na  zastosowaniu 
szeregu  magnesów,  które  na  przemian  skupiają  i roz- 
praszają wiązkę  przyspieszanych  cząstek.  W rezulta- 
cie, średnica  wiązki  zostaje  zmniejszona,  podobnie  jak 


Rys.  14.  Analogia  optyczna  zasady  „silnego  ogniskowania” 
cząstek 

zmniejszona  jest  średnica  wiązki  świetlnej  (pokazanej 
na  rys.  14)  na  skutek  przechodzenia  jej  przez  soczewki 
skupiające  i rozpraszające.  Synchrotrony  ze  słabym 
ogniskowaniem  pozwalały  na  przyspieszanie  proto- 
nów do  energii  ok.  10  GeV.  Zastosowanie  magnesów 
silnie  ogniskujących  pozwoliło  osiągnąć  znacznie  wyż- 
sze energie.  Supersynchrotron  protonowy  w Europej- 


kim  Centrum  Badań  Jądrowych  w Genewie  przy- 
spiesza protony  do  energii  450  GeV,  a zbudowany 
wcześniej  w Batavii  pod  Chicago  akcelerator  pro- 
tonów dostarcza  wiązek  o energii  do  500  GeV  (il.  40, 
tabl.  11). 


Układy  zderzających  się  wiązek 

Przy  badaniu  zderzeń  o wysokich  energiach  ważne 
jest,  aby  uzyskać  jak  największą  energię  w układzie 
środka  masy  dwóch  zderzających  się  cząstek.  Jeżeli 
cząstka  o masie  m1  spoczywa  w laboratorium  a ude- 
rzająca w nią  cząstka  o masie  m2  ma  energię  E , to 
energia  zderzenia  w układzie  środka  masy  tych  czą- 
stek E * wyniesie 

E*  = m\+ m\+2Emx. 

Jeżeliby  jednak  obu  cząstkom  nadać  energię  E i skie- 
rować jedną  przeciwko  drugiej,  to  energia  E*  wy- 
niosłaby w tym  przypadku 

E*  = 2 E. 

W ten  sposób  np.  dwie  wiązki  protonów,  każda  o ener- 
gii 20  GeV  będą  wywoływać  zderzenia  o energii  E* 
wynoszącej  40  GeV.  Ażeby  tę  energię  uzyskać  w wa- 
runkach, gdy  przyspieszony  zostaje  tylko  jeden  pro- 
ton a drugi  spoczywa,  należałoby  dysponować 
akceleratorem  na  energię  800  GeV.  Zasadę  zderzania 
ze  sobą  dwóch  protonowych  wiązek  przeciwbieżnych 
zastosowano  w Europejskim  Centrum  Badań  Jądro- 
wych w Genewie  w celu  badania  zderzeń  o najwyż- 
szych wytworzonych  przez  człowieka  energiach.  Dwie 
intensywne  wiązki  protonów  o natężeniu  20  amperów 
każda  krążą  po  przeciwbieżnych  torach  w wysokiej 
próżni.  „Czas  życia”  takiej  wiązki  wynosi  kilkadzie- 
siąt godzin.  W miejscu,  gdzie  te  wiązki  się  spotykają, 
zachodzą  zderzenia  dwóch  biegnących  naprzeciw 
siebie  protonów.  Energia  każdej  z wiązek  może  osiąg- 
nąć do  30  GeV,  co  daje  E * = 60  GeV.  Dla  osiągnięcia 
takiej  energii  w klasycznych  akceleratorach  należa- 
łoby przyspieszyć  protony  do  energii  1800  GcV. 

Dwie  wiązki  przeciwbieżne  stosuje  się  także  przy 
badaniu  zderzeń  elektronów  z pozytonami.  Jest  to 
zresztą  jedyny  sposób  badania  tych  zderzeń.  Istnieje 
w tej  chwili  na  świecie  sześć  akceleratorów  połączo- 
nych z układami  zderzających  się  wiązek  pozytono- 
wo-elektronowych.  Dwa  ostatnio  zbudowane  układy 
umożliwiają  badanie  zderzeń  elektronowo-pozytono- 
wych  przy  energii  każdej  z wiązek  dochodzącej  do 
20  GeV. 

W.S.  Scharf  Akceleratory  cząstek  naładowanych  i ich  zastoso- 
wania, Warszawa  1978. 


Oddziaływania  silne 

Grzegorz  Białkowski 


Oddziaływania  silne  cząstek 
trwałych  i nietrwałych 

Oddziaływania  silne  są  jednym  z typów  oddziaływań 
między  cząstkami  elementarnymi  (-*  Cząstki  ele- 
mentarne i ich  oddziaływania).  Biorą  w nich  udział 
tylko  hadrony.  Istnienie  tych  oddziaływań  zostało 
po  raz  pierwszy  dostrzeżone  przy  próbach  wyjaśnie- 
nia budowy  i własności  jąder  atomowych.  Początkowo 
zjawiska  wewnątrzjądrowe  próbowano  zrozumieć 
stosując  wyłącznie  prawa  elektrodynamiki.  Po  wy- 
kryciu neutronu  przez  Jamesa  Chadwicka  w 1932  r. 
stało  się  oczywiste,  że  są  one  do  tego  niewystarcza- 


jące. Na  właściwą  myśl  wpadł  Hideki  Yukawa,  który 
zaproponował,  aby  do  opisu  sił  jądrowych  wprowa- 
dzić nową  cząstkę  elementarną,  w owym  czasie  jeszcze 
nie  zaobserwowaną  w doświadczeniu,  którą  nazwano 
„mezonem”. 

W kilkanaście  lat  po  wypowiedzeniu  przez  Yukawę 
tej  hipotezy  mezony  rc,  oddziałujące  z nukleonami, 
zostały  istotnie  wykryte.  Był  to  jednak  dopiero  po- 
cząstek  lawiny  odkryć,  trwającej  zresztą  do  dziś, 
która  z fizyki  oddziaływań  silnych  czyni  dziedzinę 
szczególnie  pociągającą,  ale  też  i szczególnie  trudną. 
Fakty,  które  zostały  stwierdzone  doświadczalnie, 
dają  się  wyjaśnić  teoretycznie  na  razie  tylko  częś- 
ciowo. Mimo  to  można  powiedzieć  śmiało,  że  nie- 
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wiele  jest  takich  dziedzin  fizyki,  w których  postęp 
w ostatnich  latach  byłby  równie  szybki,  i w których 
zarazem  tak  zupełna  byłaby  świadomość  stąpania 
po  ziemi  całkowicie  nieznanej.  Jest  to  więc  dziedzina 
istotnie  potrzebująca  nowych  idei,  a w której  tak  nie- 
wiele da  się  przewidzieć  na  podstawie  znanych  już 
faktów. 

Informacje  eksperymentalne  dotyczące  oddziały- 
wań silnych  pochodzą  z dwu  nierównej  wartości 
źródeł:  z analizy  stanów  związanych  (jąder  atomo- 
wych i hiperjąder)  oraz  z analizy  procesów  zderzeń 
zachodzących  między  cząstkami  elementarnymi. 
Znacznie  bogatszy  materiał  pochodzi  z tego  drugiego 
źródła,  przy  czym  okazuje  się,  że  charakter  danych 
zależy  bardzo  silnie  od  energii  zderzających  się  obiek- 
tów. 

Istotne  znaczenie  dla  rozwoju  badań  miała  więc  — 
poza  udoskonaleniem  techniki  analizy  otrzymywa- 
nych danych  — także  budowa  coraz  to  potężniejszych 
akceleratorów  cząstek  (-*  Akceleratory).  Urządzenia 
te,  w których  dochodzi  do  zderzeń  między  hadronami, 
można  podzielić  na  dwie  grupy.  Do  pierwszej  można 
zaliczyć  urządzenia,  w których  przyspieszona  wiązka 
pada  na  nieruchomą  tarczę,  a do  drugiej  te,  w których 
dochodzi  do  czołowych  zderzeń  wiązek  przeciwbież- 
nych. Każdy  z tych  dwóch  typów  akceleratorów  ma 
swoje  zalety : w drugim  wykorzystuje  się  znacznie  wy- 
dajniej moc  akceleratora,  ponieważ  nie  traci  się  ener- 
gii na  (niemal)  bezproduktywny  fizycznie  ruch  środka 
masy  zderzających  się  obiektów.  Za  to  w pierwszym 
akceleratorze  uzyskuje  się  znacznie  większą  wydajność 
przy  danej  gęstości  wiązki,  a przede  wszystkim  istnieje 
możliwość  wytworzenia  wiązek  wtórnych,  zawiera- 
jących obiekty  nietrwałe,  których  nie  można  przy- 
spieszać ze  względu-  na  ich  krótki  czas  życia.  Osta- 
tecznie, jeśli  odliczyć  zderzenia,  w których  biorą  udział 
złożone  jądra  atomowe,  mamy  do  dyspozycji  dane 
pochodzące  z oddziaływań  na  tarczach  protonowych 
wiązek  złożonych  z protonów,  neutronów,  niektórych 
hiperonów,  mezonów  7 z±,  mezonów  K+  i K~  i wre- 
szcie mezonów  K*.  Badanie  zderzeń  z nukleonami  in- 
nych cząstek,  jeszcze  mniej  trwałych,  z których  nie 
można  sformować  nawet  wiązki  wtórnej,  jest  umo- 
żliwione (w  ograniczonym  zakresie  i z większą 
niepewnością)  przez  badanie  kaskad  wewnątrzjąd- 
rowych.  Także  analiza  oddziaływań  w stanie  koń- 
cowym dostarcza  pewnych  informacji  o oddziały- 
waniach cząstek  nietrwałych. 


Rys.  1.  Oddziały- 
wanie cząstek  nie- 
trwałych wewnątrz 
jąder  atomowych 


gim,  lub  jeszcze  dalszym.  Na  ogół  jednak,  znając 
wielkości  opisujące  procesy  rozpraszania  mezonu  n 
na  nukleonie  oraz  produkcji  mezonu  g w zderzeniu 
mezonu  n z nukleonem,  możemy  przystąpić  do  ana- 
lizy danych  dotyczących  produkcji  mezonów  g na 
jądrach  mając  tylko  jedną  wielkość  nieznaną,  a mia- 
nowicie amplitudę  rozpraszania  mezonów  g na  nu- 
kleonach. Tę  wielkość  więc  w zasadzie  można  wyzna- 
czyć. Oczywiście  postępowanie  takie  zawiera  wiele 
niezbyt  pewnych  elementów,  jednakże  można  się 
nim  posłużyć  do  uzyskania  co  najmniej  przybliżonych 
informacji  o procesie,  którego  innymi  metodami  nie 
można  byłoby  w ogóle  badać. 

Jeśli  chodzi  o oddziaływanie  w stanie  końcowym, 
to  dostarcza  nam  ono  informacji  o zderzeniach  czą- 
stek, które  zostały  właśnie  wytworzone  w danym 
procesie  i które  jeszcze  przez  jakiś  czas  po  akcie  pro- 
dukcji pozostają  w zasięgu  sił.  Takie  cząstki,  zanim 
się  od  siebie  dostatecznie  oddalą,  oddziałują  ze  sobą, 
co  modyfikuje  np.  ich  rozkłady  kątowe  i to  w sposób 
wyraźnie  zależny  od  energii  ruchu  względnego  tych 
obiektów.  Badając  owe  rozkłady  możemy  się  do- 
wiedzieć, jak  oddziaływałyby  cząstki,  gdybyśmy 
z nich  umieli  formować  wiązki  i tarcze,  stosując 
standardowe  metody  badania  zderzeń. 

W pewnych  wypadkach  analizę  oddziaływania 
wzajemnego  cząstek  nietrwałych  można  jeszcze 
bardziej  udoskonalić,  stosując  metodę  opartą  na 
przybliżeniu  biegunowym  (znaczenie  tego  pojęcia 
zostanie  wyjaśnione  nieco  dalej).  Zasada  postępowa- 
nia jest  przedstawiona  na  rys.  2.  Przykładem  może 
być  proces  produkcji  jednego  mezonu  tt  w zderzeniu 
mezonu  7r  z nukleonem.  Sądzimy  w tym  wypadku, 
że  główny  przyczynek  do  amplitudy  produkcji 
przy  bardzo  małych  przekazach  czteropędu  od  nukleo- 
nu początkowego  do  końcowego  wnosi  wymiana 
pojedynczego  mezonu  n,  jak  to  przedstawia  rys.  2. 
Gdy  bowiem  przekaz  czteropędu  jest  mały,  to  (zgod- 
nie z zasadą  nieokreśloności)  parametr  zderzenia 
jest  duży.  Z drugiej  strony,  średni  promień  chmury 
cząstek  wirtualnych  otaczających  nukleon  jest  od- 
wrotnie proporcjonalny  do  masy  tych  cząstek.  Skoro 
zaś  najlżejszym  hadronem  jest  mezon  7r,  możemy 
sądzić,  że  najbardziej  zewnętrzna  część  chmury  jest 
tworzona  przez  te  właśnie  cząstki.  Zatem  w zderzeniu 
peryferycznym  nadlatujący  mezon  n uderza  w wirtu- 
alny mezon  n znajdujący  się  w chmurze.  Taka  interpre- 
tacja umożliwia  przeprowadzenie  analizy  procesów 
produkcji  dodatkowego  mezonu  n w zderzeniu  n-N 
oraz  w zderzeniu  K-N  w taki  sposób,  aby  z niej 
uzyskać  informacje  dotyczące  odpowiednio  oddzia- 
ływań 7r-7T  i K-n.  Takie  właśnie  analizy  są  wykony- 
wane i dostarczają  nam  niezwykle  cennych  danych, 
choć  nie  całkiem  pewnych  i teoretycznie  uzasadnio- 
nych, głównie  ze  względu  na  istnienie  poprawki  odpo- 
wiadającej wymianie  więcej  niż  jednej  cząstki. 


Obszary  energii  dla  zderzeń  hadron-hadron 


Zasada  badania  oddziaływań  cząstek  nietrwałych 
w zderzeniach  wewnątrzjądrowych  jest  przedsta- 
wiona schematycznie  na  rys.  1.  Wiązka  cząstek 
padających  (np.  mezonów  n)  uderza  w jądro.  Jedna 
z tych  cząstek  wytwarza  w wyniku  oddziaływania 
z jednym  z nukleonów  znajdujących  się  w jądrze 
(w  punkcie  a)  inną  cząstkę,  bardzo  nietrwałą  (np. 
mezon  g).  Ze  względu  na  to,  że  odległości  między 
nukleonami  w jądrze  są  bardzo  małe,  ok.  1 fm,  ist- 
nieje duże  prawdopodobieństwo,  że  nowo  wytwo- 
rzona cząstka  zdąży  oddziałać  z kolejnym  nukleonem 
(w  punkcie  b ) zanim  się  rozpadnie.  Jeżeli  energia  tej 
cząstki  nie  jest  zbyt  duża,  to  w oddziaływaniu  tym  nie 
dojdzie  do  zmiany  rodzaju  cząstek  (oddziaływanie 
elastyczne).  Po  jednym  lub  kilku  takich  oddziaływa- 
niach cząstka  ta  opuści  jądro  i rozpadnie  się.  Oczy- 
wiście padający  na  jądro  mezon  n może  wytworzyć 
mezon  o nie  w swym  pierwszym  zderzeniu,  ale  w dru- 


Jak już  wspomniano,  charakterystyka  zderzeń  za- 
leży w dużym  stopniu  od  energii,  przy  której  zderze- 
nia te  zachodzą.  Można  wyróżnić  kilka  obszarów 
energetycznych,  w których  zderzenia  hadron-hadron 
mają  specyficzne  cechy.  (Opisany  tu  przebieg  za- 
leżności energetycznej  jest  wyidealizowany;  w rzeczy- 
wistości bowiem  nie  wszystkie  cząstki  zachowują  się 
jednakowo,  a poszczególne  obszary  energetyczne 
nie  są  od  siebie  wyraźnie  oddzielone).  W obszarze 
skrajnie  niskich  energii  oddziaływanie  kulombowskie 
nawet  przy  stosunkowo  dużych  kątach  rozpraszania 
konkuruje  z oddziaływaniem  silnym;  w tym  wypadku 
trudno  uzyskać  informacje  o oddziaływaniach  sil- 
nych hadronów  naładowanych.  Istnienie  oddziaływań 
kulombowskich  przejawia  się  też  w tym,  że  bardzo 
powolne  naładowane  ujemnie  hadrony  są  chwytane 
przez  protony,  co  prowadzi  od  powstania  specyficz- 
nych układów  atomowych,  zw.  hadroatomami  (jeśli 
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schwytaną  cząstką  jest  mezon,  taki  obiekt  nazywamy 
mezoa tomem,  — ► Atomy  egzotyczne).  Atomy  te  za- 
chowują się  podobnie  do  zwykłych  atomów,  w których 
na  orbicie  znajdują  się  elektrony,  z tą  tylko  różnicą, 
że  orbity  te  mają  znacznie  mniejsze  promienie  (w  sto- 
sunku równym  stosunkowi  mas  danego  hadronu 
i elektronu).  Z tych  orbit  hadrony  naładowane  ujem- 
nie są  chwytane  przez  jądra,  przy  czym  dochodzi  do 
anihilacji  ładunku,  a czasem  i innych  liczb  kwanto- 
wych (np.  liczby  bar ion owej,  jeśli  schwytaną  cząstką 
jest  antyproton).  Badanie  tych  procesów  ma  zasad- 
nicze znaczenie  dla  fizyki  jądra  atomowego,  pozwala 
bowiem  badać  jego  strukturę;  dla  fizyki  oddziaływań 
silnych  ma  ono  jednak  mniejsze  znaczenie. 

W kolejnym  obszarze,  energii  bardzo  niskich,  mo- 
żemy odróżnić  dwa  zasadnicze  przypadki.  Jeżeli 
zderzające  się  cząstki  nie  anihilują  ze  sobą,  to  znaczy, 
jeśli  nie  istnieje  stan  dwu  lub  więcej  cząstek  o niższej 
masie  lecz  tych  samych  wszystkich  liczbach  kwanto- 
wych, jakie  ma  układ  cząstek  zderzających  się  (do 
układów  nie  anihilujacych  należą  układy  p-p , 7i±-p, 
K+-p  i A-p)y  to  w obszarze  bardzo  niskich  energii 
w oddziaływaniu  nie  powstają  nowe  cząstki  i oddzia- 
ływanie to  można  bardzo  łatwo  opisać,  wprowadzając 
niewielką  liczbę  parametrów  fenomenologicznych, 
takich  jak  długość  rozpraszania  czy  też  zasięg  efektyw- 
ny (por.  tekst  dalej).  Jeżeli  jednak  zderzające  się 
cząstki  mogą  anihilować  (np.  dotyczy  to  układu 
p-p  lub  też  K~-p,  który  nawet  już  przy  energii 
progowej  może  przejść  np.  w układ  A-n0),  to  od- 
działywanie już  od  energii  progowej  ma  charakter 
nieelastyczny,  co  zwykle  prowadzi  do  istotnych 
komplikacji  w opisie  i interpretacji  danych. 

Kolejny  obszar  można  by  nazwać  obszarem  niskich 
energii.  W obszarze  tym  procesy  nieelastyczne  wy- 
stępują już  nawet  w tych  zderzeniach,  które  w obsza- 
rze poprzednim  miały  charakter  czysto  elastyczny,  ale 
zjawiska  nieelastyczne  odgrywają  w nim  jeszcze  nie- 
wielką rolę.  Można  tu  znów  rozróżnić  dwie  grupy 
procesów.  W jednej  z nich  w obszarze  niskich  energii 
dochodzi  do  powstania  jednocząstkowych  bardzo 
nietrwałych  obiektów,  które  nazywa  się  stanami 
rezonansowymi  układu  zderzających  się  cząstek. 
Do  grupy  tych  procesów  należy  m.in.  rozpraszanie 
7:±-/>,czy  7t+-7r~  lub  AT--/?.  Do  drugiej  grupy  procesów 
należy  rozpraszanie  K+-p  czy  7z+-;r+  lub  też  p-p. 
Zdania  co  do  istnienia  stanów  rezonansowych  także 
i w tych  układach  są  podzielone;  w każdym  razie 
można  uznać,  że  jeśli  one  istnieją,  to  do  ich  powstania 
dochodzi  trudniej  i nie  są  one  tak  bezpośrednio 
widoczne  jak  w pierwszej  grupie  procesów. 

W następnym  obszarze  energii  zwanym  obszarem 
średnich  energii,  struktury  rezonansowe  stopniowo 
zanikają,  rośnie  natomiast  nieelastyczność  zderzeń. 
Rezonanse  mają  coraz  to  krótsze  czasy  życia,  co 
utrudnia  ich  identyfikację.  W rezultacie  są  one  co- 
raz mniej  dostrzegalne.  Nie  sprzyja  temu  również 
wzrastająca  liczba  stanów  orbitalnych,  w których 
mogą  się  znaleźć  cząstki  silnie  oddziałujące  (por.  da- 
lej). Jest  to  obszar  może  najtrudniejszy  z punktu 
widzenia  analizy  teoretycznej,  ale  też  chyba  i najmniej 
interesujący. 

W obszarze  wysokich  energii  obraz  nieco  się  upra- 
szcza. Rezonanse  przestają  być  widoczne,  nato- 
miast można  wprowadzić  pewne  metody  specjalnie 
przystosowane  do  tego  obszaru  energii  (np.  metoda 
biegunów  Reggego;  zob.  dalej).  W obszarze  tym 
silnie  rośnie  krotność  wyprodukowanych  cząstek 
i wkład  procesów  nieelastycznych  znacznie  prze- 
wyższa wkład  procesów  elastycznych. 

Wreszcie,  w obszarze  skrajnie  wysokich  energii, 
zaczynamy  obserwować  pewne  regularności,  które 
zgodnie  z przewidywaniami  teoretycznymi  powinny 
cechować  zderzenia  przy  energiach  zmierzających  do 
nieskończoności.  Znaczna  część  tych  regularności  ma 
charakter  uniwersalny,  a więc  niezależny  od  rodzaju 
zderzających  się  cząstek.  Jest  sprawą  w pewnej 
mierze  otwartą,  czy  już  przy  obecnie  osiągalnych 


energiach  zbliżono  się  do  obszaru  „asymptotycznego’', 
a także  jak  dalece  przewidywania  teoretyczne,  oparte 
przecież  na  pewnych  założeniach,  będą  się  sprawdzać 
w praktyce. 


Wybór  zmiennych  kinematycznych 

Będziemy  rozważać  zderzenia  zachodzące  między 
dwiema  cząstkami  w stanie  początkowym : cząstką-po- 
ciskiem  a i cząstką-tarczą  b.  W stanie  końcowym 
mogą  pojawić  się  dwie  cząstki,  i wtedy  proces  na-  procesy 
żywa  się  binarnym,  albo  więcej  cząstek  i wtedy  binarne  i wi* 
proces  jest  wielocząstkowy.  W dalszym  ciągu  przez  locząstkowt 
cząstkę  trwałą  należy  rozumieć  cząstkę  trwałą  ze 
względu  na  oddziaływania  silne,  a więc  o czasie 
życia  rzędu  co  najmniej  10“ 20  s.  Może  się  zdarzyć, 
że  proces  wielocząstkowy  zachodzi  w ten  sposób,  że 
w rzeczywistości  są  wytwarzane  dwie  cząstki  nie- 
trwałe rozpadające  się  niemal  w miejscu  swej  pro-  procesy 
dukcji  na  cząstki  trwałe.  W takich  wypadkach  mówi  kwazibinarne 
się  o procesie  kwazi binarnym. 

Wśród  procesów  binarnych  można  wyróżnić 
ważną  klasę  procesów  elastycznych,  tj.  takich,  w któ- 
rych cząstki  końcowe  są  fizycznie  identyczne  z czą- 
stkami początkowymi.  Zbliżony  charakter  mają  te 
procesy,  w których  jedyna  zmiana  w porównaniu 
ze  stanem  początkowym  polega  na  wymianie  ła- 
dunku (procesy  wymiany  ładunku,  np.  tT -p  ->  7r°-/i) 
lub  też  na  wymianie  dziwności  (procesy  z wymianą 
dziwności,  np.  K~-p  -*  7C-2J+).  Niekiedy  mówi  się  też 
o procesach  z wymianą  innych  liczb  kwantowych. 

Z czteropędów  pa  i po  cząstek  początkowych  można 
utworzyć  jeden  niezmiennik  lorentzowski,  a więc 
wielkość  niezależną  od  wyboru  układu  odniesienia. 


Rys.  3.  Określenie  układu  laboratoryjnego  (a)  i układu  środka 
masy  (b)  dla  procesów  wielocząstkowych  i binarnych 


Wielkością  tą  jest  zmienna  s = ( pa+pb )2.  W układzie  zmienna  s 

laboratoryjnym,  zdefiniowanym  warunkiem  pb  = 0 
(rys.  3a),  zmienna  y wyraża  się  wzorem 

j = ml+ml+2móEla(j>a),  (1) 

gdzie  nia  i ntb  są  masami  zderzających  się  cząstek, 

a Ei,  jest  energią  cząstki-pocisku  w układzie  labora- 
toryjnym. Oczywiście,  energia  i pęd  §ą  związane  za- 
leżnością relatywistyczną,  tj.  (c  = 1) 

E = }V  + m2  . (2) 

W układzie  środka  masy  zdefiniowanym  warunkiem 
Pa+pb  = 0 (rys.  3b),  zmienna  y dana  jest  wzorem 
5 = W\  (3) 

gdzie  W jest  energią  całkowitą  obu  cząstek  w ukła- 
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zmienna  t 


zmienna  u 


pospieszność 


dzie  środka  masy  (nazywa  się  ją  także  masą  efektyw- 
ną układu  cząstek  a i b ),  daną  zatem  wzorem 

W — £■*+£■£  (4) 

(odtąd  gwiazdkami  będą  zawsze  oznaczane  wielkości 
zdefiniowane  w układzie  środka  masy). 

Dla  każdej  pary  cząstek,  jednej  początkowej 
i jednej  końcowej,  można  zdefiniować  wielkość 
zwaną  kwadratem  przekazu  czteropędu,  np.  / = 
= {pa—  pc)2.  W wypadku  procesów  binarnych  wpro- 
wadza się  jeszcze  zmienną  u—  (pa—pd)2.  Można 
łatwo  wykazać,  korzystając  z zasady  zachowania 
czteropędu, 

Pa+Pb=Pc+Pd , (5) 

że  zmienne  5,  t i u nie  są  niezależne,  gdyż  spełniają  one 
równość 

s+t+u  = (6) 

Zależności  — takie  jak  związek  (6)  — między 
zmiennymi  kinematycznymi  charakteryzującymi  dany 
proces  powodują,  że  proces  o n cząstkach  w stanie 
końcowym  (i,  oczywiście,  dwu  w stanie  początkowym) 
jest  opisywany  tylko  przez  3n  — 4 zmienne  niezależne. 
W procesie  binarnym  istnieją  więc  tylko  dwie  takie 
zmienne  i można  je  wybrać  jako  s i t.  W każdym 
ustalonym  układzie  odniesienia  można  też  wprowa- 
dzić dwie  inne  zmienne,  bliżej  powiązane  z pomiarem. 
Przykładem  takiej  pary  zmiennych  może  być  (w  ukła- 
dzie laboratoryjnym)  energia  lub  pęd  cząstki-po- 
cisku  oraz  kąt  między  kierunkiem  jej  lotu  i kierun- 
kiem lotu  jednej  z cząstek  końcowych,  np.  cząstki  c 
(kąt  produkcji  cząstki  c ).  W układzie  środka  masy 
dwiema  wybranymi  zmiennymi  są  często  wartość 
bezwzględna  pędu  cząstek  zderzających  się,  pi  — 

— \pa\  — \pb\  i kąt  między  kierunkiem  lotu  cząstki  a 
i cząstki  c,  0*.  Jeśli  cząstki  a i c są  identyczne,  to 
mówimy  nie  o kącie  produkcji,  lecz  o kącie  rozpra- 
szania. Zmienna  / wyraża  się  przez  zmienne  kinema- 
tyczne zdefiniowane  w układzie  środka  masy  wzorem 

/ = ml+ml-2E*E*+2p*p*cose\  (7) 

Ponieważ  w procesach  elastycznych  pęd  początkowy 
Pi  jest  dokładnie  równy  pędowi  końcowemu  p/  — 

= \pc\  = \pa\,  wzór  powyższy  znacznie  się  wtedy 
upraszcza  i przybiera  postać 


/ = — 2/r*(l  — cos0*).  (8) 

W procesach  wielocząstkowych  można  się  także 
posługiwać  zmiennymi  zdefiniowanymi  niezależnie 
od  wyboru  układu  odniesienia,  lecz  często  wtedy,  gdy 
dąży  się  do  określenia  stanu  jednej  lub  dwu  wybra- 
nych cząstek,  wprowadza  się  pojęcia  nowe,  które  są 
tu  bardziej  przydatne.  Wektor  pędu  cząstki  rozkłada 

się  na  pęd  podłużny  p :,  tj.  tę  składową  pędu,  która 
jest  skierowana  równolegle  do  pędu  cząstki  pocisku, 

oraz  pęd  poprzeczny  p± , znajdujący  się  w płaszczyźnie 
prostopadłej  do  lotu  pocisku.  Przy  transformacjach 
Lorentza,  w których  prędkość  względna  obu  układów 

jest  skierowana  zgodnie  z pa>  pędy  poprzeczne 
wszystkich  cząstek  nie  zmieniają  się,  gdyż  przekształ- 
ceniu ulegają  tylko  zmienne  />„.  Aby  dalej  uprościć 
problem  przechodzenia  od  układu  do  układu  wpro- 
wadza się  zmienną  zw.  pospiesznością  (ang.  rapidity ), 
zdefiniowaną  wzorem 


y = 


E+p 
E-p  ’ 


(8a) 


która  ma  tę  istotną  własność,  że  przy  zmianie  układu 
odniesienia  pospieszności  wszystkich  cząstek  zmienia- 
ją się  w szczególnie  prosty  sposób,  a mianowicie 
do  każdej  z nich  dodaje  się  ta  sama  stała  odpowia- 
dająca pospieszności  względnej  obu  układów  odnie- 
sienia. 


W doświadczeniu  mierzy  się  niekiedy  tylko  kąty,  pseudo- 
pod  którymi  wylatują  poszczególne  cząstki.  Wygodnie  pospieszność 
jest  wtedy  wprowadzić  wielkość  zw.  pseudopospiesz- 
nością,  zdefiniowaną  wzorem  : 

rj  = —ln  tg  (0/2).  (9) 

Użyteczność  tej  zmiennej  wynika  stąd,  że  jest  ona 
powiązana  z pospiesznością  wzorem : 

Pj  sinhł?  = )sinhy.  (10) 

Widać  z tego,  że  w tych  wszystkich  wypadkach, 
w których  masa  wyprodukowanej  cząstki  jest  mała 
w porównaniu  z jej  pędem  poprzecznym  (zachodzi  to 
często  dla  mezonów  n)y  pospieszność  i pseudopo- 
spieszność  są  w przybliżeniu  jednakowe. 

Zgodnie  z ogólnymi  zasadami  fizyki  kwantowej,  amplitudy 
przejścia  od  stanu  początkowego  do  końcowego  opi-  przejścia 
sywane  są  zespołem  funkcji  zw.  amplitudami  przej- 
ścia; przy  czym  każda  z nich  jest  zależna  od  wymie- 
nionych wcześniej  3n— 4 zmiennych  kinematycz- 
nych. Amplitudy  przejścia  są  funkcjami  zespolonymi 
tych  zmiennych,  a ich  znajomość  daje  kompletny 
opis  procesu.  Liczba  amplitud  zależy  od  spinów 
cząstek  zarówno  początkowych  jak  i końcowych. 

Ponieważ  hadron  o spinie  S może  występować 
w 25-fl  stanach  spinowych,  przeto  łączna  liczba 
amplitud  nie  może  przekraczać  wartości  (25,a-fl) 

(25&  + l)(25c+l)...  W rzeczywistości  jednak  jest  ona 
znacznie  mniejsza  ze  względu  na  to,  że  w oddziały- 
waniach silnych  zachowywana  jest  parzystość  (a  więc 
amplitudy  muszą  spełniać  warunki  wynikające  z nie- 
zmienniczości  teorii  względem  inwersji).  Ponadto 
dalsze  ograniczenia  liczby  amplitud  w procesach 
elastycznych  pochodzą  z niezmienniczości  teorii 
względem  odwrócenia  czasu,  £ jeśli  zderzające  się 
cząstki  są  jednakowe,  mogą  powstać  dodatkowe  za- 
leżności między  amplitudami  wynikające  z zasad  sy- 
metrii lub  antysymetrii  funkcji  falowej  zależnie  od 
tego,  czy  cząstki  te  są  bozonami  czy  też  fermionami. 

W rezultacie  liczba  amplitud  znacznie  się  zmniejsza. 

W dwu  szczególnie  ważnych  wypadkach  mamy:  dwie 
niezależne  amplitudy  dla  zderzeń  cząstek  o spinach 
0 i 7*  oraz  6 amplitud  dla  zderzeń  elastycznych 
cząstek  o spinie  1/2:  liczba  ta  zmniejsza  się  do  5,  gdy 
zderzające  się  cząstki  są  jednakowe  (np.  dla  zderzeń 
nukleon-nukleon).  Oczywiście  w procesach  nieela- 
stycznych, a szczególnie  wielociałowych,  liczba  nie- 
zależnych amplitud,  mimo  wszystkich  możliwych 
ograniczeń,  może  być  bardzo  duża.  Pojawienie  się 
efektów  zależnych  od  spinu  prowadzi  do  poważnych 
komplikacji  (co  prawda  czysto  technicznych),  któ- 
rych pełne  omówienie  nie  jest  tu  możliwe.  Wobec  tego 
wszędzie  tam,  gdzie  nie  będzie  to  specjalnie  zazna- 
czone, wszystkie  hadrony  będą  traktowane  tak,  jak 
gdyby  były  cząstkami  bezspinowymi. 


Przegląd  danych  doświadczalnych 

Wielkościami  mierzonymi  doświadczalnie  są  m.in.: 
a)  całkowity  przekrój  czynny  ffea;k  na  zderzenie  dwu 
danych  hadronów*;  b)  całkowity  przekrój  czynny  na 
zderzenie  elastyczne  dwu  hadronów,  orci  Całk ; c)  róż- 
niczkowy przekrój  czynny  na  rozmaite  procesy  bi- 
narne, w tym  także  na  proces  elastyczny,  da{d&; 
d)  rozmaite  wielkości  charakteryzujące  stany  spinowe 
zderzających  się  cząstek  (wektory  i tensory  polary- 
zacji); e)  rozkłady  krotności  wyprodukowanych 
cząstek,  w tym  przede  wszystkim  krotność  średnia 
n;  f)  rozkłady  kątowe  jednej  ustalonej  cząstki  wy-  rozkłady 
produkowanej  w zderzeniu  danych  dwu  hadronów  tnkluzywne 
(są  to  rozkłady  inkluzywne,  które  można  zapisać 
symbolicznie  w następujący  sposób: 

a~rb  — > c-\-X, 

gdzie  X oznacza  wszystkie  inne  cząstki,  które  zostały 
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przekrój  czynny  dcałk 


wyprodukowane  oprócz  cząstki  c , ale  nie  były  iden- 
tyfikowane); rozkłady  te  dane  są  wielkością 

_ da  da 

E— — — — S5  - — ; (11) 

dPi\dp±  dyd~p± 

g)  podobne  rozkłady  dla  dwu  łub  więcej  cząstek  od- 
powiadające procesom 

a+ b — c+d+X9 
a-rb  ->  c+d+e+X 
itd . 


Analiza  takich  danych  pozwala  na  wyznaczenie 
innych  wielkości  fizycznych,  które  mogą  mieć  głębszy 
sens  fizyczny  i które  są  przedmiotem  zainteresowania 
teorii  oddziaływań  silnych. 

W bardzo  schematycznym  zarysie  istniejące  dane 
doświadczalne  przedstawiają  się  następująco, 
zależność  Gdy  energia  zbliża  się  do  wartości  progowej  cał- 
p rzek  ro  ju  kowity  przekrój  czynny  reakcji  może  albo  zmierzać 
czynnego  od  do  nieskończoności  albo  do  pewnej  stałej,  niekiedy 
energii  równej  zeru.  Pierwszy  przypadek  odpowiada  tym 
procesom,  którym  od  progu  towarzyszy  anihilacja 
(w  ogólnym  sensie  tego  słowa) ; wówczas  <rcałk  zmierza 
do  nieskończoności  zgodnie  z prawem 


const 

°całk  ~ 


(12) 


w którym  v — prędkość  cząstki  padającej  w układzie 
laboratoryjnym.  Całkowity  przekrój  czynny  jest  bo- 
wiem ilorazem  dwu  czynników,  z których  licznik 
przedstawia  prawdopodobieństwo  zajścia  jakiegokol- 
wiek oddziaływania  przy  danym  stanie  początko- 
wym, mianownik  zaś  — gęstość  strumienia  cząstek 
padających,  proporcjonalną  do  v.  Próg  reakcji  jest 
określony  przez  znikanie  prędkości  cząstki  padają- 
cej, tak  więc  mianownik  wyrażenia  na  acai k zawsze 


zmierza  do  zera.  Jednakże  w procesach,  którym  już 
od  progu  towarzyszą  przejścia  nieelastyczne,  nawet 
w progu  nie  znika  prawdopodobieństwo  przejścia, 
co  prowadzi  do  nieskończonej  wartości  ilorazu.  Na- 
tomiast procesy,  które  w pobliżu  progu  są  czysto 
elastyczne,  charakteryzują  się  tym,  że  w progu  znika 
prawdopodobieństwo  przejścia  i w rezultacie  iloraz 
(który  ma  teraz  postać  0/0)  przybiera  pewną  wartość 
skończoną. 

Dalszy  przebieg  zależności  <rcalk  od  energii  zależy 
od  tego,  czy  w procesie  zderzenia  pojawiają  się  rezo- 
nanse, czy  też  nie.  W pierwszym  wypadku  wykres 
tfca}k(£)  jest  krzywą,  wykazującą  szereg  stopniowo 
coraz  to  niższych  i szerszych  maksimów,  które  po 
przekroczeniu  pewnej  wartości  energii  zanikają. 
Wartość  energii,  przy  której  takie  maksimum  wystę- 
puje, odpowiada  w przybliżeniu  wartości  energii 


Rys.  4.  Całkowity  przekrój  czynny  w pobliżu  energii  rezonan- 
sowej, odpowiadający  wzorowi  Breita-Wignera 


różniczkowy  przekrój  czynny  do/dlJ 


rezonansowej.  Zachowanie  się  przekroju  czynnego 
(rys.  4)  w otoczeniu  takiego  punktu  można  opisać 
w przybliżeniu  fenomenologicznym  wzorem  JBreita- 
Wignera 


(25+1)  r2/4 

ffcałk  />2  (E-E0)-+1i\n  • 


(13) 


wzór  Breita- 
-Wignera 


gdzie  r — szerokość  połówkowa  rezonansu,  E0  — 
energia  rezonansowa,  p — pęd  w układzie  środka 
masy  zderzających  się  obiektów,  a S — spin  rezo- 
nansu (całkowity  moment  pędu  zderzających  się 
cząstek).  Zgodnie  z zasadą  nieokreśloności,  rezonans  czas  życia 
możemy  traktować  jako  bardzo  nietrwałą  cząstkę,  rezonansu 
której  średni  czas  życia  wiąże  się  z r wzorem 

r-  t»*.  (14) 

W wypadku  drugim,  gdy  rezonansów  nie  ma,  albo 
też  gdy  są  one  mało  widoczne,  wykres  zależności 


Rys.  7.  Różniczkowy  przekrój  czynny  dcrfdQ  na  rozpraszanie 
elastyczne  n-p  w obszarze  niskich  energii 


Rys-  8.  Różniczkowy  przekrój  czynny  do {d O-  na 
rozpraszanie  elastyczne p-p  w obszarze  niskich  energi  i 


9 - Encyklopedia  fizyki  współczesnej 


129 


różniczkowy  przekrój  czynny  ddfdt 


tfcaik  od  energii  jest  krzywą  gładką,  zbliżoną  do  wy- 
kresu funkcji  stałej.  W obszarze  najwyższych  energii 
obserwuje  się  jednak  uniwersalny  wzrost  crCałk  pro- 
porcjonalny do  kwadratu  logarytmu  energii  (rys.  5). 

Zależność  od  energii  całkowitego  przekroju  czyn- 
nego na  proces  elastyczny,  a zatem  i na  wszystkie 
procesy  nieelastyczne,  ffmeei  = ^całk— ffeicałk,  dany 
jest  krzywą  zbliżoną  do  wykresu  całkowitego  prze- 
kroju czynnego,  mimo  że  stosunek  tych  wielkości  nie 
jest  stały  i wykazuje  pewną  zmienność  z energią 
(rys.  6). 

procesy  Różniczkowy  przekrój  czynny  na  zderzenie  ela- 
elastyczne  styczne  wykazuje  silną  zależność  zarówno  od  energii, 
jak  i (na  ogół)  od  kąta,  jak  wreszcie,  co  najmniej 
w obszarze  niezbyt  dużych  energii,  także  od  rodzaju 
zderzających  się  cząstek.  Na  rys.  7 i 8 podane  są 
przykładowo  różniczkowe  przekroje  czynne  na  ela- 
styczne rozpraszanie  n+-p  oraz  p-py  w obu  wy- 
padkach w obszarze  niskich  energii,  natomiast  na 


mb/(GeV/c)2 


-kwadrat  przekazu  czteropędu  (GeV/c)2 


Rys.  10.  Różniczkowy  przekrój  czynny  dojdt  na  rozpraszanie 
elastyczne  p-p  w obszarze  wysokich  energii 


rys.  9 i 10  — w obszarze  wysokich  energii.  Z rysun- 
ków tych  widać,  że  przy  przejściu  od  niskich  do  wy- 
sokich energii  obraz  całkowicie  się  zmienia.  Różnicz- 
kowy przekrój  czynny,  który  w obszarze  niskich 
energii  jest  niemal  izotropowy  lub  stosunkowo  wolno 
zmienny  z kątem  rozpraszania,  w obszarze  energii 
wysokich  jest  duży  tylko  dla  bardzo  małych  kątów, 
gdzie  obserwuje  się  ostre  maksimum.  Nachylenie 
krzywej  przedstawiającej  to  maksimum  rośnie  na 
ogół  ze  wzrostem  energii.  Przekrój  czynny  opada 
wykładniczo,  przybierając  w obszarze  kątów  bliskich 
90°  bardzo  małą  wartość.  Zwykle  przed  osiągnięciem 
tej  małej  wartości  krzywa  przechodzi  przez  kilka 
maksimów  i minimów.  W obszarze  kątów  bliskich 
180°  (w  rozpraszaniu  proton-proton  ze  względu  na 
identyczność  cząstek  jest  to  obszar  fizycznie  nieod- 
różnialny od  obszaru  kątów  bliskich  zeru)  pojawia 
się  nowe  maksimum,  znacznie  niższe  niż  dla  małych 
kątów. 

Ważną  — z teoretycznego  punktu  widzenia  — in-  wyznaczani 
formacją  doświadczalną  jest  wartość  stosunku  części  stosunku 
rzeczywistej  do  części  urojonej  amplitudy  rozprasza-  Re/lm 
nia.  W obszarze  niskich  energii  wielkość  tę  można 
zawsze  wyznaczyć  po  dokonaniu  analizy  fazowej, 
o czym  będzie  dalej  mowa.  Natomiast  w obszarze 
wysokich  energii  z różnych  powodów  nie  można 
wykonać  analizy  fazowej.  W tym  wypadku  wyznacza 
się  stosunek  Re/lm  badając  interferencję  amplitudy 
rozpraszania  jądrowego  z amplitudą  rozpraszania 
kulombowskiego.  W obszarze  bardzo  dużych  energii 
rozpraszanie  kulombowskie  jest  znaczne  tylko  dla 
bardzo  małych  kątów,  a więc  tylko  tam  wyraz  in- 
terferencyjny może  być  znaczny  i dostępny  obser- 
wacji. O rozpraszaniu  kulombowskim  wiadomo 
praktycznie  wszystko;  jego  amplituda  jest  niemal 
czysto  rzeczywista.  Tak  więc  w dobrym  przybliżeniu 
wyraz  interferencyjny  pochodzi  z iloczynu  części 
rzeczywistej  obu  amplitud.  W rezultacie  uzyskuje  się 
informacje  nie  tylko  o wartości  części  rzeczywistej 
amplitudy  uwarunkowanej  oddziaływaniem  silnym, 
ale  też  i o jej  znaku.  Oczywiście  metodę  tę  można 
stosować  tylko  dla  cząstek  naładowanych  elektrycz- 
nie, między  którymi  działa  siła  kulombowska.  Wy- 
niki przedstawione  są  na  rys.  11  i 12.  Dla  wszystkich 
zbadanych  reakcji  Re/lm  jest  małą  wielkością  zmniej- 
szającą się  wraz  z energią.  Można  powiedzieć  zatem, 
że  amplituda  rozpraszania  elastycznego  w obszarze 
wysokich  energii  jest  w przybliżeniu  funkcją  urojoną, 
przynajmniej  w obszarze  bardzo  małych  kątów. 

Oprócz  procesów  elastycznych  bardzo  duże  zna-  procesy 
czenie  w teorii  oddziaływań  silnych  mają  też  inne  z wymianą 
procesy  binarne.  Szczególnie  wiele  uwagi  poświęca  ładunku 
się  analizie  procesów'  z wymianą  ładunku.  Jednym 
z najlepiej  zbadanych  jest  proces 

n~+p  ->  n°-ł-n. 


mb/(GeV/c)2 


Rys.  11.  Różniczkowy  przekrój  czynny  dojdt  na  rozpraszanie  elastyczne  p-p  przy  wysokiej  energii  w tym  zakresie  wartości 
kwadratu  przekazu  czteropędu,  w którym  można  zaobserwować  interferencję  kulombowską 
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Rvs.  12.  Zależność  od  pędu  laboratoryjnego  stosunku  części  r*e5^**’ 
stej  do  urojonej  amplitudy  rozpraszania  elastycznego  rozmaitych  naar 
nów  na  protonach 


Rys.  13.  Zależność  od  energii  całkowitego  przekroju 
czynnego  na  procesy  wymiany  ładunku 


«b/(GeV/c)2 


Rys.  14.  Różniczkowy  przekrój  czynny  dajdt  na  proces  wymiany 
ładunku  n~  p ->  n°n  przy  kilku  wartościach  energii  w zakresie 
0 < j/j  < 1,3  (GcV/c)* 

Na  rys.  13  przedstawiona  jest  zależność  od  energii 
całkowitego  przekroju  czynnego  na  ten  proces.  Widać 
z niego,  że  w obszarze  dużych  energii  wielkość  ta 


szybko  maleje  z energią.  Różniczkowy  przekrój 
czynny  na  ten  proces  dła  dużych  energii  pokazany 
jest  na  rys.  14.  Istnieje  cała  grupa  tego  typu  procesów 
binarnych,  lecz  nieelastycznych  i niemal  wszystkie 
wykazują  szybki  spadek  całkowitego  przekroju  czyn- 
nego z energią.  Wyjątkowe  znaczenie  ma  więc  ta 
grupa  procesów  kwazielastycznych,  dla  których  cał- 
kowity przekrój  czynny  maleje  z energią  bardzo  po- 
woli lub  nawet  w ogóle  nie  maleje.  Zaobserwowano, 
że  dotyczy  to  przede  wszystkim  tych  procesów, 
w których  nie  ma  wymiany  ładunku,  dziwności  itd., 
czyli  które  spełniają  tzw.  warunek  Morrisona-Gribo- 
wa.  Właśnie  w tych  procesach  powstają  cząstki  w sta- 
nie końcowym,  które  różniąc  się  spmem  o AS  i pa- 
rzystością o AP  od  cząstki  początkowej,  mają 

di>  = (-  (15) 

Innymi  słowy,  jeśli  spin  cząstki  zmienia  się  o liczbę 
parzystą,  to  parzystość  cząstki  się  nie  zmienia,  nato- 
miast jeśli  spin  zmienia  się  o liczbę  nieparzystą,  to  pa- 
rzystość zmienia  się  z dodatniej  na  ujemną  lub 
z ujemnej  na  dodatnią.  . 

Ta  reguła  jest  przykładem  pewnej  ogólniejszej  za- 
leżności, która  wiąże  szybkość  zmniejszania  się 
przekroju  czynnego  na  dany  proces  z wartościami 
liczb  kwantowych,  które  są  „wymieniane”  między 
oddziałującymi  cząstkami.  Jest  zrozumiałe,  że  w pro- 
cesie elastycznym,  w którym  liczby  kwantowe  obu 
cząstek  nie  zmieniają  się,  przekazywane  są  między 
cząstkami  liczby  kwantowe  próżni  (zakładamy,  że 
próżnia  jest  obojętna  elektrycznie,  ma  dziwność, 
liczbę  barionową,  powab,  izospin  i spin  równe  zeru, 
a parzystość  zwykłą  i ładunkową  równą  +1).  Także 
w omówionych  procesach  są  wymieniane  liczby  kwan- 
towe próżni.  Okazuje  się  zaś,  że  gdy  wymieniane 
iiczby  kwantowe  odpowiadają  liczbom  kwantowym 
dowolnego  mezonu  niedziwnego,  spadek  przekroju 
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Rys.  1 5.  Przykłady  procesów  wymiany  różnych  liczb  kwantowych 
oraz  dane  doświadczalne  obrazujące  spadek  2e  wzrostem  energii 
crcaik  na  te  procesy.  Na  rysunku  przedstawiona  jest  liczba  pro- 
cesów o ustalonej  wartości  wykładnika  n występującego  we 
wzorze  crcaik  ~ p~n,  gdzie  p — pęd  laboratoryjny  cząstki  padają- 
cej; a)  wymiana  liczb  kwantowych  próżni  (3>),  b)  wymiana  ła- 
dunku, c)  wymiana  dziwności,  d)  wymiana  liczby  barionowej 
e)  wymiana  liczb  kwantowych  mezonu  egzotycznego 

mb/(GeV/c)2 


Rys.  16.  Zjawisko  przecinania  się  wykresów  obrazujących  różnicz- 
kowe przekroje  czynne  na  zderzenia  elastyczne  cząstki  i anty- 
cząstki  na  protonach  (p9  — pęd  laboratoryjny  cząstki  padającej) 


czynnego  następuje  z grubsza  biorąc  jak  s~\  jeśli 
byłby  to  mezon  dziwny  — to  jak  j”2,  jeśli  barion  — 
to  jak  s-3-s“\  a wreszcie,  jeśli  przenoszonym  licz- 
bom kwantowym  nie  można  przyporządkować  żad- 
nej znanej  cząstki  — spadek  jest  jeszcze  szybszy. 
Przykłady  poszczególnych  rodzajów  procesów  wy- 
miany liczb  kwantowych  oraz  dane  doświadczalne 
obrazujące  spadek  ze  wzrostem  całkowitego  przekroju 
czynnego  na  te  procesy  zostały  podane  na  rys.  15. 
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Ważne  informacje  uzyskuje  się  też,  porównując  ze 
sobą  wartości  przekrojów  czynnych  na  rozpraszanie 
elastyczne  na  protonach  cząstek  (o  ładunku  ujem- 
nym) i ich  antycząstek  (o  ładunku  dodatnim),  a więc 
np.  p-p  i p-p , 7 r-p  i n+-py  K~-p  i K+-p.  Jeśli  chodzi 
o wartości  całkowitych  przekrojów  czynnych  na 
rozpraszanie  takich  dwu  cząstek,  to  stwierdza  się,  że 
ich  różnica  maleje  szybko  z energią,  przy  czym  <rCałk 
dla  cząstki  jest  zawsze  większy  niż  dla  antycząstki. 

Odbija  się  to  także  w pewien  sposób  na  postaci  róż- 
niczkowego przekroju  czynnego  na  rozpraszanie  ela- 
styczne, który  w obszarze  małych  kątów  jest  zawsze 
większy  dla  cząstki.  Ciekawe  jednak,  że  przy  pewnej 
wartości  zmiennej  t wykresy  obu  różniczkowych 
przekrojów  czynnych  przecinają  się  i zaczyna  domi- 
nować przekrój  czynny  antycząstki  (rys.  16). 

Jednym  z najważniejszych  zadań  fizyki  oddziały-  wyznaczanie  | 
wań  silnych  jest  wyznaczenie  widma  mas  cząstek  widma  mas 
nietrwałych  (ze  względu  na  oddziaływania  silne),  cząstek 
Cząstki  te  mają  tak  mały  średni  czas  życia  (rzędu  nietrwałych 
10"20-10“24  s),  że  przed  rozpadem  mogą  przebyć 
tylko  bardzo  krótki  odcinek,  praktycznie  niedostrze- 
galny ze  względu  na  ograniczoną  zdolność  rozdzielczą 
przyrządów.  Innymi  słowy,  w doświadczeniu  zawsze 
obserwuje  się  już  tylko  produkty  rozpadu  tych  nie- 
trwałych obiektów^,  a o ich  istnieniu  i własnościach 
wnioskuje  się  z analizy  tych  właśnie  produktów  roz- 
padu. W niektórych  wypadkach,  jak  była  mowa  po- 
wyżej, takie  nietrwałe  obiekty  są  obserwowane  jako 
rezonanse  odpowiadające  maksimom  na  wykresie 
całkowitego  przekroju  czynnego  na  rozpraszanie 
danych  dwu  cząstek  trwałych.  Mówi  się  wtedy  o pro- 
cesie formacji  rezonansów.  W pewnych  wypadkach, 
szczególnie  w obszarze  wyższych  energii,  rezonan- 
som takim  nie  odpowiadają  żadne  widoczne  maksi- 
ma, a o ich  istnieniu  można  się  dowiedzieć  dopiero 
po  przeprowadzeniu  analizy  fazowej. 

Niekiedy  obserwuje  się  rezonanse  powstałe  nie 
w wyniku  oddziaływania  cząstek  początkowych,  lecz 
wskutek  oddziaływania  w stanie  końcowym.  Mówi 
się  wówczas  o procesie  produkcji  rezonansów.  Re- 
zonanse takie  są  widoczne  na  wykresach  przedsta- 
wiających prawdopodobieństwo  pojawiania  się  pary 
(rzadziej  większej  grupy)  cząstek,  zależnie  od  ich 
masy  efektywnej,  a więc  całkowitej  energii  całego 
układu  tych  cząstek  w ich  układzie  środka  masy. 

Przykłady  takiej  sytuacji  są  przedstawione  na  rys.  17. 

Cząstce  nietrwałej  odpowiada  wyraźnie  maksimum 
na  wykresie,  które  może  być  najczęściej  opisane 
wzorem  Breita-Wignera  (13).  W pewnych  wypad- 
kach (np.  rozpraszanie  n-n)  o istnieniu  rezonansów 
pochodzących  z produkcji  można  się  dowiedzieć 
także  po  wykonaniu  analizy  fazowej.  Najczęściej 
jednak  takiej  analizy  nie  można  wykonać,  wobec 
czego  uzyskane  dotychczas  informacje  na  temat 
widma  mas  cząstek  nietrwałych  na  pewno  są  nie- 
kompletne. Oddzielnym  problemem  jest  wyznaczenie 
liczb  kwantowych  cząstek  nietrwałych,  szczególnie 
zaś  ich  spinu  i parzystości.  I tu  znów  wielką  pomocą 
jest  wynik  analizy  fazowej,  jeśli  ją  można  przepro- 
wadzić. W wielu  wypadkach  trzeba  się  jednak  uciekać 
do  innych  metod,  czasem  dostosowanych  do  danego 
indywidualnego  wypadku. 

Analizę  procesów  wielociałowych  przeprowadza  pomiary 
się  w ten  sposób,  że  pomiarem  i identyfikacją  obejmuje  ekskluzywne 
się  albo  wszystkie  wyprodukowane  obiekty  (pomiar  i inkluzywne 
ekskluzywny),  albo  też  tylko  niektóre  spośród  nich 
(pomiary  te  nazwaliśmy  już  inkluzywnymi).  Metoda 
pierwsza,  aczkolwiek  dostarcza  pełnej  informacji 

0 stanie  końcowym  i jest  przez  to  szczególnie  cenna, 
nie  może  być  stosowana  wtedy,  gdy  krotność  cząstek 
jest  bardzo  duża.  Znaczną  część  wszystkich  cząstek 
stanowią  bowiem  zawsze  cząstki  neutralne,  które  nie 
są  rejestrowane  przez  większość  przyrządów.  Gdy 
rośnie  całkowita  krotność  wyprodukowanych  cząstek, 
wzrasta  automatycznie  udział  tych  procesów,  w któ- 
rych występuje  więcej  niż  jedna  neutralna  cząstka, 

1 które  nie  mogą  być  dokładnie  wyodrębnione  z ca- 
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łości  danych.  Nie  znaczy  to,  że  analiza  procesów  za- 
wierających najwyżej  jedną  cząstkę  neutralną,  w któ- 
rych wobec  tego  można  w zasadzie  zidentyfikować 
wszystkie  cząstki,  traci  swoje  znaczenie.  Jednakże  w 
ostatnich  latach  uwaga  fizyków  koncentrowała  się 
przede  wszystkim  na  pomiarach  inkluzywnych. 

Najprostszym  pojęciowo  pomiarem  inkluzywnym 
jest  pomiar  całkowitego  przekroju  czynnego.  Intere- 
sującą wielkością  jest  przecież  w tym  wypadku 
prawdopodobieństwo  zajścia,  przy  ustalonym  stanie 
początkowym,  procesu,  w którym  nie  identyfikuje  się 
ani  jednej  cząstki  w stanie  końcowym.  Identyfikując 
jedna  cząstkę  końcową,  znajduje  się  pojedynczy  roz- 
kład inkluzywny,  dwie  — rozkład  podwójny  itd. 
Rozkłady  potrójne,  a tym  bardziej  jeszcze  wyższe,  są 
na  razie  mało  zbadane  i nie  będą  tu  omawiane. 

Charakterystyczną  cechą  rozkładów  pojedynczych 
jest  szybki  spadek  prawdopodobieństwa  produkcji 
cząstek  wtórnych  ze  wzrostem  pędu  poprzecznego. 
Zjawisko  to  jest  dobrze  jakościowo  przedstawione 
na  rys.  18.  Jest  tam  także  widoczna  inna  charakte- 
rystyczna cecha  produkcji  cząstek,  a mianowicie  ist- 
...  nienie  tzw.  cząstek  wiodących.  Przez  cząstkę  wiodącą 
“ą.  rozumie  się  cząstkę,  która  jest  tego  samego  typu  co 
wiodące  cząst]ka  padająca  i która  kontynuuje  z dużym  pędem 
podłużnym  kierunek  lotu  cząstki  padającej.  I tak 


a)  b) 


Rys.  17.  Maksima  w rozkładzie  masy  efektywnej  układów  czą- 
stek produkowanych  w zderzeniach  hadronów,  wskazujące  na 
istnienie  rezonansów:  a)  para  7t~7t9  (mezon  /?,)  b)  para  n n+ 
(mezony  / i p),  c)  trójka  n+n"*9  (mezony  rj  i co) 


np.,  jeżeli  cząstką  padającą  jest  proton,  to  w dużej 
liczbie  zdarzeń  można  odnaleźć  proton  szybki  poru- 
szający się  zgodnie  z kierunkiem  lotu  protonu  po- 
czątkowego. To  samo,  choć  w mniejszym  stopniu, 
dotyczy  też  mezonów  A",  a w jeszcze  mniejszym  — 
mezonów  n. 

Na  rys.  19  i 20  pokazane  są  dla  przykładu  rozkłady 
inkluzywne  cząstek  produkowanych  w zderzeniach 
proton-proton.  Na  pierwszym  z nich  widać  (jakp 
funkcję  pospieszności)  rozkład  inkluzywny  rozmai- 
tych cząstek  powstałych  w zderzeniach  bardzo  wyso- 
kiej energii.  Na  uwagę  zasługuje  kilka  charaktery- 
stycznych cech  tych  rozkładów.  Po  pierwsze,  widać 
wyraźnie  znaczne  różnice  w wydajności  produkcji 
rozmaitych  rodzajów  cząstek.  Najobficiej  produko- 
wane są  mezony  7 z,  znacznie  rzadziej  — pary  mezo- 
nów K , a jeszcze  rzadziej  — pary  barion-antybarion. 
Ilościowo  fakt  ten  uwidacznia  fenomenologiczny 


Rys  18  Wykres  Peyrou  dla  protonów  i mezonów  n~  pochodzą- 
cych z procesu  n~p  ->  pn+n-Ti-n9  przy  pędzie  laboratoryjnym 
16  GeV/c 


pospieszność 

Rys.  19.  Rozkłady  inkluzywne  rozmaitych  cząstek  produkowa- 
nych w zderzeniach  p-p  wysokiej  energii  przy  pędzie  laborato- 
ryjnym zawartym  między  6,8  a 53  GeV/c  oraz  przy  ustalonej 
wartości  pędu  poprzecznego  p±  = 0,4  GeV/c 
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pseudopospieszność 


Rys.  20.  Rozkłady  inkluzywne  mezonów  produkowanych  w zde- 
rzeniach wiązek  przeciwbieżnych  przy  pędach  obu  wiązek  rów- 
nych; a)  ok.  15,4  GeV/c,  b)  ok.  26,6  GeV/c,  c)  przy  pędzie  jednej 
wiązki  jak  w (a),  a drugiej  jak  w (b) 


wzór  wyrażający  podział  całkowitej  średniej  krotności 
cząstek  produkowanych  w zderzeniach  proton-pro- 
ton  przy  pędzie  cząstki  padającej  ok.  1500  GeV/c. 
Wzór  ten  ma  postać 


»całk  = w±+«o  = 12,±6  = 4,7zr+  +4,57r0+4>37T  -f 
+ 0,43^+ + 0,3 1 ^ + 1 ,6p + 0, 1 5^ + . . . 


gdzie  n±  i ń0  są  to  średnie  krotności  cząstek  nałado- 
wanych i obojętnych. 

zagadniense  Oczywiście  ani  średnia  krotność  ani  też  (w  mniej- 
krotności  szym  stopniu)  podział  tej  krotności  między  poszcze- 
gólne rodzaje  cząstek  nie  są  niezależne  od  energii. 
Całkowita  krotność  wzrasta  z energią  dość  szybko, 
z grubsza  zgodnie  ze  wzorami: 

n = A+B  lns+C  ln2^ 

lub  (16) 

n — a+b  lns-h(cln.s)/s1/4. 


gdzie  A9  B , C oraz  a,  ó,  c są  pewnymi  liczbami  nie- 
zależnymi od  energii.  Oczywiście,  w braku  przesłanek 
teoretycznych,  wybór  wzoru  przedstawiającego  wzrost 
całkowitej  krotności  produkowanych  cząstek  nała- 
dowanych może  być  przypadkowy.  Jednakże  wydaje 
się,  że  w każdym  razie  średnia  krotność  rośnie  szyb- 
ciej niż  ln  s.  Warto  odnotować,  że  przy  każdej  war- 
tości energii  najwięcej  produkowanych  cząstek  to 
mezony  7t,  następnie  ze  wzrostem  energii  zaznacza  się 
powolny  wzrost  udziału  mezonów  K,  a w dalszej  ko- 
lejności także  par  barion-antybarion. 

Informacje  na  temat  całkowitej  krotności  średniej 
nie  wyczerpują  znajomości  problemu  krotności.  Ist- 
nieją bowiem  dość  dokładne  dane  dotyczące  rozkładu 
krotności  cząstek  naładowanych  przy  ustalonej  ener- 
gii w dużym  zakresie  energii.  Są  to  dane  bardzo  inte- 
resujące, które  rzucają  wiele  światła  na  mechanizm 
produkcji  cząstek.  Gdyby  bowiem  produkcja  cząstek 
miała  charakter  czysto  probabilistyczny,  oczekiwali- 
byśmy, że  rozkład  krotności  będzie  przypominać 
rozkład  Poissona.  Jedną  z charakterystycznych  cech 
tego  rozkładu  jest  to,  że  kwadrat  dyspersji  liczby 
cząstek,  Z)2  = «2  — w2,  jest  równy  średniej  liczbie 
cząstek,  n.  Dane  doświadczalne  przeczą  jednak  przy- 
puszczeniu, że  rozkład  krotności  cząstek  naładowa- 
nych dany  jest  wzorem  Poissona.  Istnieje  fenome- 
wzór  nologiczny  wzór,  podany  przez  Andrzeja  K .Wróblew- 
Wróble-  skiego,  który  trafnie  opisuje  dane  doświadczalne, 
wskiego  i który  ma  postać 

D = A («±  -a),  (17) 


gdzie  A = 0,58  dla  wszystkich  rodzajów  zderzeń,  zaś 
a a 1 i zależy  nieco  od  zderzających  się  cząstek. 
Rozkład  krotności  cząstek  produkowanych  jest  więc 
różny  od  rozkładu  Poissona,  co  wskazuje  na  istnienie 
korelacji  w procesie  produkcji  cząstek. 

Powracając  teraz  do  analizy  danych  przedstawio- 
nych na  rys.  19,  należy  zauważyć,  że  pomijając  istotny 
dla  rozkładu  protonów  efekt  cząstki  wiodącej,  roz- 
kłady cząstek  różnych  rodzajów  mają  podobny  cha- 
rakter. Ta  uniwersalność  (przybliżona  i nie  obejmu- 
jąca cząstek  wiodących)  jest  widoczna  także  wtedy, 
gdy  zmieni  się  cząstka  padająca. 

Ogólnie  rozkłady  inkluzywne  można  scharaktery- 
zować w następujący  sposób.  Dla  wartości  pospiesz- 
ności  bliskich  wartościom  granicznym  zaznacza  się 
bardzo  interesujący  fakt,  polegający  na  tym,  że 
kształt  a nawet  wartość  przekroju  czynnego  zależy 
tylko  od  charakterystyki  kinematycznej  jednej  ze 
zderzających  się  cząstek.  Aby  to  lepiej  opisać,  do- 
godnie jest  wprowadzić  trzy  obszary  kinematyczne: 
obszar  pft  bliskich  pędowi  pocisku  (obszar  fragmen- 
tacji  pocisku),  obszar  p*  bliskich  pędowi  tarczy 
(obszar  fragmentacji  tarczy)  i wreszcie  obszar  p* 
małych  (obszar  centralny).  Okazuje  się,  że  w dwu 
pierwszych  obszarach  rozkłady  nie  zależą  od  całko- 
witej energii  zderzenia  (a  więc  od  s),  a tylko  odpo- 
wiednio od  pędu  pocisku  i pędu  tarczy.  Jest  to  wy- 
raźnie widoczne  na  rys.  20.  Natomiast  w obszarze 
centralnym  zależność  od  s,  choć  słaba,  jednak  się  po- 
jawia. Postulowane  w niektórych  modelach  teore- 
tycznych centralne  plateau  niezależne  od  s-  nie  poja- 
wia się  (być  może  dlatego,  że  dostępne  obecnie  energie 
są  jeszcze  zbyt  niskie). 

Rozkłady  ze  względu  na  pęd  podłużny  i poprzeczny 
są  od  siebie  w przybliżeniu  niezależne.  Rozkład  w pę- 
dzie poprzecznym  wykazuje  wykładniczy  spadek 
z p±,  przy  czym  wartość  średnia  pędu  poprzecznego 
jest  niewielka,  rzędu  kilkuset  MeV/c,  wolno  rosnąc 
z masą  wyprodukowanej  cząstki. 

Niezwykle  ważnych  i cennych  informacji  dostar- 
czają rozkłady  podwójne.  Zamiast  posługiwać  się 
wprost  podwójnym  różniczkowym  przekrojem  czyn- 
nym, wprowadza  się  funkcje  korelacji,  w celu  stwier- 
dzenia, czy  produkcja  cząstek  następuje  niezależnie 
(w  tym  wypadku  podwójny  rozkład  byłby  równy  po 
prostu  iloczynowi  rozkładów  pojedynczych).  Intere- 
sującą wielkością  jest  więc  różnica  między  rozkładem 
podwójnym  i iloczynem  rozkładów  pojedynczych. 


1 d2a  1 der  da 
C{yu ^ ~ 


(18) 


Chcąc  tę  wielkość  przedstawić  jako  funkcję  dwu 
zmiennych,  należałoby  użyć  wykresu  trójwymiaro- 
wego. Zamiast  niego  można  też  posłużyć  się  metodą 
poziomic.  Poziomice  odpowiadające  funkcji  kore- 
lacji dwucząstkowych  pokazane  są  na  rys.  21.  Pod- 
stawową cechą  tych  korelacji  jest  silne  maksimum 
funkcji  korelacji  występujące  w pobliżu  przekątnej 
yx  — y2.  Innymi  słowy,  istnieją  wyraźne,  dodatnie 
korelacje  między  cząstkami  o małej  różnicy  po- 
spieszności  (zwane  korelacjami  krótkozasięgowymi). 
Na  rys.  21  zaznacza  się  jednak  także  istnienie  kore- 
lacji długozasięgowych,  w obszarach  y±  = — y9  przy 
dużych  wartościach  bezwzględnych  obu  tych  zmien- 
nych. Obraz  produkcji  cząstek  jest  więc  dość  skom- 
plikowany. Najprostsza  narzucająca  się  hipoteza  jest 
taka,  że  cząstki  końcowe  są  pierwotnie  produkowane 
w pewnych  grupach,  w jakichś  kawałkach  materii 
hadronowej,  zwane  czasem  zgęstkami  lub  klastrami 
(ang.  clusters),  które  być  może  choćby  częściowo  są 
znanymi  już  rezonansami.  Te  zgęstki  rozpadałyby  się 
izotropowe  w swoim  układzie  środka  masy.  Wszystkie 
mezony  n pochodzące  z tego  samego  zgęstka  miałyby 
zbliżone  wartości  pospieszności  i oczywiście  byłyby 
skorelowane  dodatnio.  Tak  więc,  znaczna  część, 
może  nawet  przeważająca,  cząstek  końcowych  byłaby 
produkowana  w procesie  dwuetapowym.  (Chodzi  tu 
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Rys.  21.  Funkcje  korelacji  dla  par  mezonów  produkowanych  w zderzeniach  p-p  przy  różnych  pędach:  a)  102  GeV/c,  b)  400  GeV/c, 
c)  240  GeV/c,  d)  2000  GeV/c 


korelacje  przede  wszystkim  o te  cząstki,  które  mają  małe  war- 
dfugo-  tości  pospieszności  w układzie  środka  masy).  Istnienie 
zasięgowe  korelacji  długozasięgowych  wskazuje  jednak  na  ist- 
nienie jeszcze  jakiegoś  innego  mechanizmu  dynamicz- 
nego produkcji  cząstek,  być  może  w postaci  wzbudze- 
nia i tarczy,  i pocisku  (bez  wymiany  liczb  kwanto- 
wych) oraz  ich  — w następnych  chwilach  — rozpadu 
na  cząstki  końcowe  (mechanizm  dyfrakcyjny).  Za- 
gadnienia te  nie  są  jednak  na  razie  ostatecznie  wy- 
jaśnione. 


Opis  teoretyczny  oddziaływań 
silnych 

Ogromne  bogactwo  danych,  które  tu  zostały  przed- 
stawione bardzo  fragmentarycznie,  wymaga  oczy- 
wiście jakiejś  interpretacji  teoretycznej.  Powstaje 
przede  wszystkim  problem,  na  jakich  podstawowych 
zasadach  teoria  ta  mogłaby  być  oparta.  W tej  kwestii 
zasadniczo  panuje  zgodność  między  fizykami  zaj- 
mującymi się  teorią  cząstek.  Teoria  ta  musi  być  po 
pierwsze  teorią  kwantową  (bo  odnosi  się  do  mikro- 
świata),  a po  drugie  zgodną  z teorią  względności 
(relatywistyczną),  gdyż  dotyczy  obiektów,  których 
energia  całkowita  jest  na  ogół  znacznie  większa  od 
ich  energii  spoczynkowej. 

Całkowitego  uzgodnienia  tych  dwu  zasadniczych 
idei  teoretycznych  nie  udało  się  jeszcze  dokonać. 
Trudności  wiążą  się  między  innymi  z tym,  że  w teorii 


takiej  z konieczności  musi  się  rozpatrywać  nie  poje- 
dyncze cząstki,  lecz  pola  fizyczne,  a przy  tym  nie 
można  pomijać  procesów  produkcji.  Innymi  słowy, 
musi  to  być  teoria  zawierająca  nieskończenie  wiele 
stopni  swobody.  Mimo  istniejących  ogromnych 
trudności  wyłoniło  się  wiele  zasad,  o charakterze 
ogólnym,  które  służą  za  przewodnika  w gąszczu  da- 
nych. 

Teoria  będzie  mieć  na  pewno  charakter  relatywi- 
styczny, jeśli  wszystkie  wielkości  teoretyczne  będą 
funkcjami  tylko  niezmienników  lorentzowskich.  Oczy- 
wiście, jak  stwierdzono  poprzednio,  w ustalonym 
układzie  odniesienia  od  niezmienników  tych  można 
zawsze  przejść  do  wielkości  zdefiniowanych  tylko 
w tym  układzie,  takich  jak  np.  kąt  rozpraszania. 

Kwantowy  charakter  teorii  zmusza  do  posługiwa- 
nia się  pewnymi  funkcjami  zespolonymi,  które  zależą 
od  wymienionych  powyżej  niezmienników.  Funkcje 
te  muszą  mieć  interpretację  probabilistyczną,  zgodnie 
z ogólnymi  zasadami  fizyki  kwantowej. 


Macierz  S 

Przyjmijmy,  że  stany  przed  oddziaływaniem  (w  chwili 
/ = — oo)  tworzą  zespół  stanów  opisywanych  określo- 
nymi wartościami  liczb  kwantowych  i ponumerowa- 
nych liczbami  iu  i2,  ...  a stany  cząstek  końcowych 
(w  chwili  t = +oo)  tworzą  zbiór  odpowiednich  sta- 
nów ponumerowanych /i, /2,  ...  . Amplitudę  prawdo-  amplituda 
podobieństwa  tego,  że  układ  cząstek,  znajdujących  prawdopo- 
się  początkowo  w jakimś  stanie  i przejdzie  w wyniku  dobieństwa 
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oddziaływania  do  jednego  ze  stanów  /,  oznacza  się 
symbolem  Sif.  Wielkości  Sif  zależą  od  pełnej  cha- 
rakterystyki stanu  zarówno  początkowego  jak  i koń- 
cowego, przy  czym  od  czteropędów,  ze  względu  na 
postulowaną  relatywistyczną  niezmienniczość  teorii 
Si/  zależeć  mogą  tylko  za  pośrednictwem  opisanych 
tu  niezmienników. 

Wielkości  Sif  tworzą  pewną  macierz,  nieskończo- 
nego rzędu,  zw.  macierzą  S.  Jest  to  kluczowe  pojęcie 
teorii  oddziaływań  silnych,  ponieważ  w macierzy  tej 
zawarta  jest  pełna  informacja  o wszystkich  procesach 
między  cząstkami  elementarnymi.  Powstają  pytania, 
czy  macierz  tę  można  obliczyć  w ramach  jakiejś 
teorii,  czy  jest  możliwe  choćby  powiązanie  ze  sobą 
w pewien  sposób  jej  elementów.  Rozwiązanie  tych 
problemów  stanowi  cel  teorii  oddziaływań  silnych 
między  hadronami.  W chwili  obecnej  powstały  kon- 
cepcje ujmujące  częściowo  własności  macierzy  S 
i pozwalające  na  pewne  przewidywania. 

Probabilistyczna  interpretacja  macierzy  S wraz 
z postulatem,  że  wśród  stanów  i oraz  / są  wszystkie 
możliwe  stany  fizyczne  dowolnych  układów  cząstek 
prowadzi  do  wniosku,  że  macierz  ta  musi  spełniać 
warunek  matematyczny  zwany  unitarnością,  aby  było 
zachowane  prawdopodobieństwo  w przejściu  od 
stanu  początkowego  do  końcowego.  Jeśli  symbolem 
S ł oznaczyć  macierz  sprzężoną  hermitowską  z ma- 
cierzą 5,  to  warunek  unitarności  można  zapisać  w po- 
staci 

55*  = 5*5  = 1,  (19) 

gdzie  macierz  1 jest  macierzą  jednostkową  tego  same- 
go rzędu  co  macierz  S. 

Z unitarności  macierzy  S wypływa  prosty  wniosek 
zw.  twierdzeniem  optycznym.  W twierdzeniu  tym 
występuje  amplituda  rozpraszania  elastycznego  dwu 
cząstek  a i b (ściślej  jej  część  urojona),  przy  czym 
w rozpraszaniu  nie  może  ulec  zmianie  ani  stan  spinowy 
ani  nawet  pędowy  zderzających  się  cząstek  Gest  to 
więc  rozpraszanie  pod  kątem  0°).  Twierdzenie  op- 
tyczne mówi,  że  wielkość  ta  jest  proporcjonalna  do 
całkowitego  przekroju  czynnego  na  jakiekolwiek 
zderzenie  ze  stanu  wyjściowego  a+b : 

Im  fa+b—*a+b  ( P>  0 = 0°)  = G>/4jt)crCałkO),  (20) 

gdzie  p — pęd  zderzających  się  cząstek. 

Właściwy  wybór  reprezentacji  odgrywa  istotną  rolę 
w lepszym  rozumieniu  danych  doświadczalnych. 
W wypadku  procesów  dwuciałowych  reprezentacją 
możliwą  jest  reprezentacja  pędowa,  w której  zmien- 
nymi niezależnymi  są  pędy  (w  układzie  środka  masy) 
cząstki  początkowej  i końcowej.  Ponieważ  długość 
wektora  pędu  jest  wyznaczona  przez  wartość  energii 
całkowitej  W,  przeto  dogodnymi  zmiennymi  mogą 
być  W i 0,  albo  też  np.  pęd  początkowy  p%  i 0.  Od  tej 
reprezentacji  warto  niekiedy  przejść  do  reprezentacji 
momentu  pędu,  w której  zmiennymi  niezależnymi  są 
Pi  oraz  liczba  kwantowa  orbitalnego  momentu  pędu  /. 
Element  macierzy  S odpowiadający  procesowi  ela- 
stycznemu w tej  reprezentacji,  Si(p\  spełnia  nierów- 
ność wynikającą  z warunku  unitarności 

S*Si  ^ 1,  (21) 

przy  czym  znak  równości  odpowiada  takiej  sytuacji 
kinematycznej,  w której  z danym  procesem  nie  kon- 
kuruje żaden  proces  nieelastyczny. 

Łatwo  wykazać,  że  amplitudę  rozpraszania  ela- 
stycznego można  przedstawić  w postaci 

f(p,  6)  = 1/p  £ (21+ 1)/,  (p)Pi(cosB),  (22) 

Z- o 

gdzie  Pi  — wielomian  Legendre’a  /-tego  rzędu,  zaś 
amplituda  cząstkowa  fi  dana  jest  wzorem 

fi  = (Si-l)/2i,  (23) 

spełnia  zatem  warunek 

l/tl2  ^ Im  fi.  (24) 


Warto  przy  tym  zaznaczyć,  że  jeśli  zderzające  się 
cząstki  mają  spin  różny  od  zera,  wzór  (22)  należy  za- 
stąpić wyrażeniem  ogólniejszym. 

Jeżeli  proces  ma  charakter  czysto  elastyczny,  wów- 
czas Si  można  sparametryzować  wprowadzając 
przesunięcie  fazowe  ^z, 

Si  = e2**.  (25) 

Wzór  (25)  można  stosować  nawet  wtedy,  gdy  wy- 
stępują konkurencyjne  procesy  nieelastyczne,  należy 
tylko  przyjąć,  że  przesunięcie  fazowe  jest  wielkością 
zespoloną  albo  też  wprowadzić  parametr  nieelastycz- 
ności  rji  ^ 1,  zdefiniowany  wzorem 

Si  = ni  exp  (2 iSi).  (26) 

Interpretacja  fizyczna  przesunięcia  fazowego  polega 
na  tym,  że  określa  ono  różnicę  fazy  fali  padającej 
i fali  końcowej  (w  obu  wypadkach  obliczaną  w ob- 
szarze bardzo  dalekim  od  obszaru  oddziaływania). 

Ograniczenie  (24)  powoduje,  że  wykres  amplitudy 
cząstkowej  rozpraszania  na  płaszczyźnie  zespolonej 
zawsze  za  warty  jest  w obrębie  koła  o środku  w punkcie 
Ref  = 0 i Imf  = V*  i o promieniu  równym  V2.  Koło 
to  nazywamy  kołem  unitarności.  Jest  to  tzw.  wykres 
Arganda  (rys.  22).  Widać  stąd,  że  gdy  proces  jest 
czysto  elastyczny,  wartości  amplitudy  leżą  dokładnie 
na  okręgu,  a w przeciwnym  razie  schodzą  do  wnętrza 
koła.  Można  się  przekonać,  że  jeśli  ni  = 1,  to  ampli- 
tuda ma  wartość  maksymalną  przy  ót  — n/2;  jest  to 


Rys.  22.  Zasada  budowy  wykresu  Arganda.  Krzywa  (a)  odpo- 
wiada amplitudzie  procesu  elastycznego  z oddziaływaniem  przy- 
ciągającym zachodzącym  w dużym  obszarze  energii  bez  kon- 
kurencji procesów  nieelastycznych.  Krzywa  (b)  odpowiada  wy- 
padkowi podobnemu,  ale  z odpychaniem;  aby  mógł  powstać 
rezonans,  amplituda  schodzi  z okręgu  unitarności  i obiega  mały 
okrąg  w przeciwnym  kierunku.  Krzywa  (c)  odpowiada  wypadkowi 
rozpraszania  elastycznego,  któremu  już  od  progu  towarzyszy 
rozpraszanie  nieelastyczne.  Krzyżyki  wskazują  orientacyjnie  po- 
łożenie rezonansów 

właśnie  ta  sytuacja,  która  odpowiada  rezonansowi. 
W wypadku  ni  < 1 amplituda  zakreśla  wewnątrz  koła 
unitarności  niekiedy  dość  skomplikowaną  krzywą, 
lecz  zawsze  lokalnie  w pobliżu  rezonansu  zakreśla 
okrąg  obiegając  go  w kierunku  przeciwnym  do  ruchu 
wskazówek  zegara  (odpowiada  to  rozpadowi  cząstki 
nietrwałej;  przeciwny  kierunek  ruchu  oznaczałby,  że 
cząstki  trwałe  skupiają  się  z powrotem  w stanie  rezo- 
nansowym). Tak  więc  patrząc  na  wykres  Arganda 
dla  danej  fali  cząstkowej  możemy  wykryć  rezonanse 
oraz  ustalić  ich  spin  (równy  1). 

Jednakże  powstaje  pytanie,  w jaki  sposób  uzyskać 
wartości  amplitud  cząstkowych,  które  następnie 
można  by  odkładać  na  wykresie  Arganda.  Zagadnie- 
nie to  jest  przedmiotem  analizy  fazowej.  Punktem 
wyjścia  są  wartości  całkowitego  i różniczkowego 
przekroju  czynnego  jako  funkcji  kąta. 

Dla  uproszczenia  przyjmijmy,  że  proces  jest  czysto 
elastyczny.  Korzystając  z faktu  ortogonalności  wie- 
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Rys.  23.  Procesy  skrzyżowane  dła  5 cząstek  (łącznie  początkowych  i końcowych) 


analiza  lomianów  Legendre’a  można  różniczkowy  przekrój 
fazowa  czynny  przedstawić  wówczas  w postaci 

4~  = l/p  = 2 PdcoseWp)  -L.  (27) 

alJ  l p~ 

Ponieważ  oddziaływania  silne  mają  skończony  zasięg, 
przeto  parametr  zderzenia  nie  może  być  zbyt  duży,  bo 
w przeciwnym  razie  nie  doszłoby  do  oddziaływania. 
Z kolei  rząd  orbitalnego  momentu  pędu  wynosi 
l x pb,  gdzie  b jest  parametrem  zderzenia.  Tak  więc 
można  oczekiwać,  że  przy  każdej  skończonej  war- 
tości energii  wkład  do  przekroju  czynnego  wnosić  bę- 
dzie tylko  pewna  ograniczona  (rosnąca  z energią) 
liczba  wartości  /.  W tym  przypadku  szereg  we  wzorze 
(27)  można  urwać  przy  pewnej  wartości  /max  — L. 
Występujące  w tym  wzorze  funkcje  Fi  zależą  od  prze- 
sunięć fazowych.  Gdyby  np.  przyjąć  L — 0,  to  F0  = 
=sin2<$0.  Gdyby  L było  równe  1,  to  oprócz  F0  poja- 
wiłaby się  jeszcze  funkcja  F1  = sin<50  sinóx  (cos  <50x 
xcos<$1-fsin<50  sinói).  Dalsze  wyrażenia  byłyby  oczy- 
wiście jeszcze  bardziej  skomplikowane.  Już  jednak 
z tego  prostego  przykładu  wynika,  że  badając  zależ- 
ność różniczkowego  przekroju  czynnego  od  kąta, 
można  wyznaczyć  przesunięcia  fazowe.  Oczywiście 
jest  to  problem  trudny  i pełen  niejednoznaczności 
m.in.  z powodu  zawsze  ograniczonej  dokładności 
pomiaru.  Gdy  zderzające  się  cząstki  mają  spin  różny 
od  zera  (co  zwykle  zachodzi),  i gdy  trzeba  jeszcze 
uwzględnić  konkurencyjne  procesy  nieelastyczne, 
a liczba  fal  cząstkowych  jest  znaczna,  zagadnień  tych 
nie  można  rozwiązywać  bez  pomocy  komputerów. 
Zasada  jednak  jest  ta  sama. 


Wartości  przesunięć  fazowych  są  ważną  informacją 
m.in.  ze  względu  na  możliwość  wykrycia  stanów  re- 
zonansowych. Ponadto  znak  przesunięć  fazowych 
określa,  czy  rozpraszanie  w danym  stanie  orbitalnym 
ma  charakter  odpychający  ( 6i  < 0)  czy  też  przycią- 
gający (Ói  > 0).  W obszarze  najniższych  energii 
przesunięcia  fazowe  często  parametryzuje  się  wpro- 
wadzając zasięg  efektywny  ri  i długość  rozpraszania 
Ai.  Można  wykazać,  że 

pU+'ctgdi  = - + -yr'Pt+  - (28) 

W obszarze  energii  niezbyt  odległym  od  energii  metody 
progowej  procesu  próbuje  się  często  stosować  metody  nśerelaty- 
nierelatywistyczne  oparte  na  równaniu  Schródingera  wisty czne 
z odpowiednio  dobranym  potencjałem.  Metody  te 
w wielu  wypadkach  wystarczają,  np.  do  opisu  naj- 
prostszych jąder  atomowych  i rozpraszania  przypro- 
gowego  dwu  nukleonów.  W innych  sytuacjach  można 
jednak  stosować  te  metody  nie  po  to,  aby  uzyskać 
dobrą  liczbową  zgodność  z doświadczeniem,  ale  po  to, 
by  odgadnąć  pewne  własności  macierzy  S , które  by 
można  było  (być  może)  zastosować  nawet  tam,  gdzie 
model  nierelatywistyczny  na  pewno  przestaje  być 
słuszny. 

Przykładem  takich  własności,  częściowo  potwier- 
dzonych przez  badania  teorii  relatywistycznych,  jest 
analityczność  macierzy  S.  Analityczność  może  ce- 
chować tylko  funkcje  zespolone  zmiennych  zespolo- 
nych. Rozważa  się  więc  amplitudę  rozpraszania  jako 
funkcję  zespolonych  argumentów,  czy  to  — nie- 
zmienników s9  /,  u czy  też  pędu,  energii,  kąta,  a na- 
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wet  liczby  /.  W tych  wypadkach,  w których  udało  się 
uzyskać  ścisłe  dowody  analityczności  macierzy  S , 
własność  ta  była  konsekwencją  warunku  przyczyno- 
wości.  W innych  wypadkach  analityczność  macierzy  S 
po  prostu  się  postuluje. 

Omówienie  choćby  drobnej  części  wiążących  się 
z tym  zagadnień  przekracza  ramy  tego  artykułu. 
Wnioski,  do  których  można  dojść,  są  następujące. 
Przypuśćmy,  że  istnieje  taki  stan  jednej  cząstki  trwa- 
łej, który  ma  te  same  liczby  kwantowe  zachowywane 
w oddziaływaniach  silnych,  co  i stan  dwu  cząstek 
zderzających  się.  (Oczywiście  przejście  dwu  tych 
stanów  w siebie  nie  jest  możliwe  ze  względu  na  prawo 
zachowania  energii  i pędu).  W takim  wypadku,  jeśli 
M jest  masą  tego  stanu  jednocząstkowego,  to  ampli- 
tuda rozpraszania  cząstek  zderzających  się  mieć  będzie 
biegun  pierwszego  rzędu  w punkcie  5 = M2  (M  — ma- 
sa stanu  jednocząstkowego).  W każdym  zaś  punkcie, 
w którym  istnieje  próg  procesu  dwu-  lub  więcej- 
cząstkowego  o właściwych  liczbach  kwantowych, 
amplituda  ma  punkt  rozgałęzienia. 

Postulat  maksymalnej  analityczności  głosi,  że  je- 
dynymi osobliwościami  amplitudy  są  te  właśnie  wy- 
żej wymienione  bieguny  i punkty  rozgałęzienia.  Aby 
procesy  ten  problem  przedstawić  nieco  dokładniej,  należy  je- 
skrzyżowane  szcze  wprowadzić  ważne  pojęcie  procesu  skrzyżowa- 
nego z danym  procesem.  Jeśli  dany  jest  proces  np. 

a+b  ->  c-\-d- \-e9 

to  procesem  doń  skrzyżowanym  nazywa  się  każdy 
z poniższych  procesów  (rys.  23): 

a+b+c  d-\~e9  b- 4-ć  ->  a+d+e, 

a+d  — > ó-f-c-f  e9 

i tak  dalej,  a także  każdy  z procesów  przebiegających 
w przeciwnym  kierunku  niż  powyższe,  albo  taki, 
w którym  każda  cząstka  została  zastąpiona  przez  od- 
powiednią antycząstkę.  Jak  widać,  proces  skrzyżo- 
wany różni  się  od  danego  procesu  tym,  że  jedna  lub 
więcej  cząstek  zostaje  przeniesiona  „na  drugą  stronę” 
z jednoczesną  zamianą  jej  na  jej  antycząstkę. 
reguła  Reguła  podstawień  mająca  podstawowe  znaczenie 
podstawień  w teorii  analityczności  macierzy  5,  głosi,  że  wszystkie 
procesy  skrzyżowane  ze  sobą  opisywane  są  funkcjami, 
które  można  otrzymać  z jednej  przez  przejście  gra- 
niczne z wielowymiarowego  obszaru  zmiennych  ze- 
spolonych s9  /,  w,...  do  obszaru,  w którym  te  zmienne 
przyjmują  odpowiadające  danemu  procesowi  wartości 
rzeczywiste.  Konsekwencje  tej  reguły  dla  analitycz- 
ności są  bardzo  istotne,  gdyż  automatycznie  wszyst- 
kie osobliwości  jednej  z amplitud  procesów  skrzyżo- 
wanych stają  się  osobliwościami  wszystkich  innych 
amplitud. 

Warto  tu  rozpatrzyć  pew-ien  konkretny  ważny  przy- 
kład, mianowicie  rozpraszanie  n+-\-p  -*  7 z++p.  Istnie- 
ją dw-a  procesy  (istotnie  różne)  skrzyżowane  z tym 
procesem,  a mianowicie  n~-\-p  ->  n~Ą-p  oraz  p~p  -> 
-*jr+H-jr  . Jeśli  zmienne  są  zdefiniowane  następu- 
jąco: s = {pa+PbY,  t=(pł>—  Pd)2  i wreszcie  u — 
= (pa  pa)-y  to  przejście  od  rozważanego  procesu 
do  pierwszego  procesu  skrzyżowanego  odpowiada 
zmiana  znaku  wszystkich  składowych  czteropędów 
p»  i pc.  Wówczas  zmienna  5 przybiera  postać  charakte- 
rystyczną dla  przekazu  czteropędu  ( pb—pa )2,  a zmien- 
na u — postać  typową  dla  kwadratu  energii  całkowi- 
tej. W procesie  pierwszym  istnieje  jeden  stan  jedno- 
cząstkowy  trwały,  a mianowicie  nukleon,  występu- 
je więc  biegun  w punkcie  5 = M2.  Podobnie  dla  proce- 
su drugiego  istnieje  biegun  w punkcie  u = M 2 odpo- 
wiadający nukleonowi.  Natomiast  w procesie  trzecim 
stan  jednej  cząstki  trwałej  się  nie  pojawia  (nie  ma  ta- 
kiego trwałego  hadronu,  który  by  miał  liczby  kwanto- 
we pary  mezonów-  n).  Tak  więc  amplitudy  rozpraszania 
wszystkich  trzech  procesów  skrzyżowanych  będą 
mieć  dwa  bieguny  w podanych  wyżej  punktach, 
z tym  jednak,  że  interpretacja  fizyczna  zmiennych 
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5,  /,  u jest  dla  wszystkich  tych  procesów  rozmaita.  Po- 
dobnie można  by  określić  punkty  rozgałęzienia 
amplitud  (rys.  24). 


a) 

Ims 


s-ł-f  + u = 2M2+2  (i2 


b) 
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ims 
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• x • 1 

u = (M  + m)2  $=m2  s=xm2  s = (m  +u)2 
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s = (M-m)2  s = (/W+a)2  s«(M+#l 

A * 

Rys.  24.  Struktura  osobliwości  dla:  a)  procesu  n p > 71*7?,  b)  pro- 
cesu K~p  ->  K~p,  w obu  wypadkach  dla  0^0  (czyli  t - 0). 

M oznacza  masę  nukleonu,  p.  masę  mezonu  rt,  MA  masę  hipe- 
ronu/!, A/r  masę  hiperonu  27,  m masę  mezonu  K.  Położenia  bie- 
gunów oznaczone  są  x , punkty  rozgałęzienia  •— 


Istnienie  osobliwości  macierzy  S i ich  znajomość 
pozwala  na  napisanie  dla  amplitudy  rozpraszania 
f(s,  1)  reprezentacji  całkowej  Cauchy'ego,  która  po 
pewnych  drobnych  przekształceniach  prowadzi  do 
tzw.  związku  dyspersyjnego.  Typową  postać  takiego 
związku  przedstawia  wzór 
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gdzie  całkowanie  po  każdej  zmiennej  przebiega  od 
najniższego  progu  do  nieskończoności,  a residua 
w punktach  biegunowych  są  równe  iloczynom  ładun- 
ków silnych  charakteryzujących  oddziaływanie  z od- 
powiednim stanem  jednocząstkowym  cząstek  po- 
czątkowych (gab)  oraz  cząstek  końcowych  (gra).  Jeśli 
stan  końcowy  i początkowy  są  identyczne,  to  resi- 
duum staje  się  rówme  stałej  sprzężenia  charaktery- 
zującej oddziaływanie  trzech  cząstek,  tj.  cząstek  a , 
b i cząstki  pośredniej.  Ponieważ  część  urojona  am- 
plitudy rozpraszania  ku  przodowi  może  być  wyra- 
żona przez  całkowity  przekrój  czynny  na  podstawie 
twierdzenia  optycznego,  a część  rzeczywistą  ampli- 
tudy także  się  mierzy,  przeto  z niepewnością  wyni- 
kającą z nieznajomości  danych  w obszarze  bardzo 
wysokich  energii  można  wzór  dyspersyjny  porów- 
nywać z doświadczeniem,  przy  czym  w idealnym 
wypadku  jedyną  nieznaną  w nim  wielkością  jest  właś- 
nie stała  sprzężenia.  Jest  to  niemalże  jedyna  meto- 
da wyznaczania  stałych  sprzężenia  oddziaływań  sil- 
nych. 

Analityczność  i inne  własności  macierzy  5 pozwa- 
lają na  ścisłe  w-yprow-adzenie  pewnych  twierdzeń, 
zwanych  twierdzeniami  asymptotycznymi,  które  odno- 
szą się  do  zachowania  niektórych  wielkości  fizycz- 
nych w obszarze  bardzo  wysokich  energii  (tj.  gdy 
s 00).  Do  najbardziej  znanych  twierdzeń  asymp-  _ 1 

totycznych  należy  ograniczenie  Froissarta,  nie  po-  ograniczenie 
zwalające  całkowitemu  przekrojowi  czynnemu  rosnąć  Froissarta  I 
zbyt  szybko  w nieskończoności, 

dcałk  ^ const  In2  s9  (29) 


twierdzenie  oraz  twierdzenie  Pomeranczuka,  zgodnie  z którym 
Pomeranczu-  całkowite  przekroje  czynne  na  zderzenie  cząstki  a 
ka  z tarczą  b i antycząstki  a z tą  samą  tarczą  powinny 
być  sobie  asymptotycznie  równe, 

Gcsikjab)  j (30) 

Gcaik(ob) 

Twierdzenia  asymptotyczne  odgrywają  ważną  rolę 
przy  testowaniu  modeli  teoretycznych. 


Teoria  biegunów  Reggego 

Tuliio  Regge,  badając  analityczność  nierelatywistycz- 
nych  amplitud  rozpraszania  jako  funkcji  zmiennej 
zespolonej  /,  przekonał  się,  że  amplitudy  te  są  me- 
romorficznymi  funkcjami  / w obszarze  Re  / ^ —*/*» 
dla  pewnej  klasy  potencjałów  obejmujących  m.in. 
potencjał  Yukawy  V(r)  = V0&~^lr.  Co  więcej,  wy- 
kazał on,  że  ewentualne  bieguny  amplitudy  mogą 
leżeć  jedynie  w obszarze  ograniczonym  dodatkowo 
warunkiem  Im/ ^ 0,  przy  czym  położenie  takiego 
bieguna  na  płaszczyźnie  zmiennej  zespolonej  / za- 
leży na  ogół  od  wartości  energii,  przy  której  zachodzi 
zderzenie.  Bieguny  te  nazywane  są  biegunami  Reg- 
gego. 

bieguny  Biegun  Reggego  ma  przejrzystą  interpretację  fi- 
Re-ggego  zyczną.  Z równania  Schrodingera  z pewnym  ustalo- 
nym potencjałem  przyciągającym  V(r),  wynika  na 
ogół  istnienie  stanów  związanych  i rezonansowych 
przy  wartościach  energii  zależnych  od  liczby  kwanto- 
wej orbitalnego  momentu  pędu  /.  Zależność  ta  po- 
jawia się  dlatego,  że  do  potencjału  V(r)  dochodzi 
jeszcze  potencjał  odpychający  związany  z siłą  odśrod- 
kową, równy 


i efektywny  potencjał  staje  się  funkcją  liczby  /.  Oczy- 
wiście fizyczne  wartości  / są  całkowite,  ale  można  trak- 
tować potencjał  ten  jako  funkcję  zmiennej  / o do- 
wolnych wartościach,  a nawet  nadawać  jej  wartości 


Rys.  25.  Zasada  konstrukcji  trajektorii  Reggego;  a)  położenie 
poziomu  związanego,  gdy  / = 0,  b)  gdy  / = 1,  c)  gdy  1 = 2 
(w  tym  wypadku  stan  przestaje  być  związany,  a staje  się  stanem 
rezonansowym);  potencjał  odśrodkowy  Vo<i  — 1(1+  l)/r*;  d)  wy- 
kres Chew-Frautschiego  na  płaszczyźnie  Re/,  KeE 


zespolone.  Można  się  przekonać  i w końcu  do  tego 
sprowadza  się  odkrycie  Reggego,  że  przy  ciągłych 
zmianach  liczby  / poziomy  energetyczne  w potencjale 
efektywnym,  odpowiadające  stanom  związanym 
i rezonansowym,  przesuwają  się  także  w sposób  ciągły. 

Jeśli  biegun  przy  pewnej  wartości  s występuje  dla  trajektoria 
wartości  (na  ogół  zespolonej)  liczby  l = a (s)t  to  bieguna 
fupkcję  a (s)  nazywa  się  trajektorią  bieguna  Reggego  Reggego 
(rys.  25).  Biegun  ten  jest  biegunem  amplitudy  roz- 
praszania w tym  kanale,  w którym  5 jest  kwadratem 
całkowitej  energii  zderzających  się  cząstek  w ich 
układzie  środka  masy.  Residuum  tego  bieguna  (danej 
amplitudy)  jest  opisane  także  pewną  funkcją  p(s),  zw. 
funkcją  residualną  bieguna  Reggego. 

Regge  wykazał,  że  całkowita  amplituda  rozpra- 
szania wyraża  się  w następujący  sposób  przez  wkłady 
pochodzące  od  poszczególnych  biegunów 


sin  7i  aj  (s) 


(31) 


gdzie  sumowanie  obejmuje  wszystkie  bieguny  Regge- 
go. iV,(*)(— cosfl)  jest  funkcją  Legendre’a,  która  prze- 
chodzi w dobrze  znany  wielomian  Legendrea,  gdy 
a(^)  jest  iiczbą  całkowitą  nieujemną. 

Z wyrażenia  na  całkowitą  amplitudę  rozpraszania 
danego  wzorem  (31)  można  przejść  do  wyrażeń  na  am- 
plitudy cząstkowe.  Okazuje  się  wtedy,  że  w otoczeniu 
punktu  o / całkowitym  wkład  pochodzący  od  bieguna 
Reggego  reprezentowany  jest  wyrażeniem  Breita-Wig- 
nera,  a więc  biegun  ów  w takim  punkcie  przedstawia 
rezonans,  jeżeli  tylko  Ima(s)  > 0.  Gdy  zaś  Ima(j)  = 

= 0,  mamy  do  czynienia  ze  stanem  związanym 
(szerokość  połówkowa  r jest  proporcjonalna  do 
Im  a (.ę),  a dla  stanów  związanych  r = 0). 

Ponieważ  trajektoria  bieguna  jest  funkcją  zmien- 
nej 5,  przeto  jeden  biegun  Reggego  zawiera  w sobie 
informacje  o wielu  rezonansach  odpowiadających 
różnym  fizycznym  wartościom  liczby  kwantowej  /. 

Rozpatrując  trajektorię  Reggego  w płaszczyźnie 
zmiennych  (Re/,  Re s)  otrzymuje  się  tzw.  wykres  wykres 
Chew-Frautschiego.  Okazuje  się,  że  trajektorie  ob-  Chew-Fraut- 
serwowanych  rezonansów  mają  na  takich  wykresach  schćego 
w przybliżeniu  to  samo  nachylenie, 

ol\ś)  = rf^g(5)-s  1 GeV-*.  (32) 

' 7 //Pac 


Wyniki  doświadczalne  zestawione  z odpowiednimi  tra- 
jektoriami Reggego  są  przedstawione  na  rys.  26. 

Pierwszą  zatem  korzyścią  z wprowadzenia  pojęcia 
bieguna  Reggego  jest  to,  że  na  jednej  trajektorii 
znajduje  się  wiele  stanów  związanych  i rezonansów, 
co  przyczynia  się  do  uporządkowania  widma  mas  had- 
ronów, a w połączeniu  z obserwowaną  uniwersalnoś- 
cią nachylenia  trajektorii  Reggego  na  wykresie  Chew- 
Frautschiego  — pozwala  na  snucie  przewidywań  do- 
tyczących mas  hadronów  dotychczas  nie  obserwo- 
wanych. Należy  jednak  zaznaczyć,  że  nie  istnieje  jak 
dotąd  żadna  metoda,  pozwalająca  na  obliczenia  czy 
to  trajektorii  Reggego  czy  to  funkcji  residualnych. 
Fakt  zaś  uniwersalności  nachylenia  i (przybliżonej) 
prostoliniowości  trajektorii  jest  na  razie  zupełnie 
niezrozumiały. 

Była  już  mowa  o tym,  że  zgodnie  z prawem  pod- 
stawień każdy  biegun  amplitudy  jednego  z procesów 
skrzyżowanych  jest  zarazem  biegunem  amplitudy  po- 
zostałych procesów  skrzyżowanych.  Dla  zilustrowa- 
nia zagadnienia  przytoczymy  proste  obliczenie  kine- 
matyczne. W wypadku,  gdy  masy  wszystkich  czterech 
cząstek  biorących  udział  w procesie  są  jednakowe, 
w jednym  z kanałów  skrzyżowanych  („kanale  s”) 


s = 4 (pf+m2),  t = — 2/?|(l-cos0*), 


a w drugim  („kanale  /”) 

5 = -2  p\  (1  — cos  0i),  / = 4(p{2+ro2), 

gdzie  wskaźniki  „5”  i przy  pędzie  i kącie  roz- 
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wykres  praszania  oznaczają,  że  dana  wielkość  jest  zdefi- 
Chew-  niowana  w układzie  środka  masy  odpowiedniego 
-Frautschie-  procesu,  a rn  jest  wartością  masy  cząstek  zderzają- 
go  cych  się. 


Rys.  26.  Rozmieszczenie  niektórych  cząstek  trwałych  i nietrwa- 
łych na  trajektoriach  Reggcgo  w płaszczyźnie  (Re/,  Res),  tzw. 
wykres  Chew-Frautschiego,  a)  trajektorie  B = 0,  S = 0,  b)  tra- 
jektorie B — 0,  5 ź 0,  c)  trajektorie  B ^ 0,  S — 0,  d)  trajek- 
torie B 5*  0,  S 0.  Spośród  trajektorii  mezonowych  tylko  na 
trajektoriach  mezonów  p i / można  umieścić  po  dwie  znane 
cząstki.  Nachylenia  pozostałych  trajektorii  mezonowych  do- 
brano podobnie  do  wyżej  wymienionych 


Z powyższych  wzorów  widać,  że  małe  ujemne  war- 
tości niezmiennika  t i duże  dodatnie  wartości  nie- 
zmiennika s odpowiadają  fizycznym  wartościom 
zmiennych  p8  i 08,  ale  na  pewno  niefizycznym  wartoś- 
ciom zmiennych  pt  i Ot.  Mianowicie,  w wymienionym 
obszarze  wartości  s i /,  p\  < 0,  zaś  cos  0t  — ©o. 
Jeśli  dana  jest  amplituda  reprezentująca  wkład  od 
pojedynczego  bieguna  Reggego  w kanale  t,  zgodnie 
ze  wzorem  (31)  równa 


(pominięte  tu  są  ważne  czynniki  odpowiadające  tzw. 
sygnaturze  trajektorii).  W rezultacie  można  uzyskać 
następujące  wyrażenia  na  całkowity  przekrój  czynny 
oraz  różniczkowy  przekrój  czynny  w kanale  s pocho- 
dzący od  tego  samego  bieguna  Reggego,  jktóry  w ka- 
nale t porządkował  stany  rezonansowe 


<7Calk  = COnSt-  s*^1 

(33) 

(34) 

Tak  więc  trajektorie  Reggego  nie  tylko  porządkują 
widmo  mas  hadronów,  ale  także  wyznaczają  zacho- 
wanie się  wysokoenergetyczne  amplitud  w kanale 
skrzyżowanym. 

Hadrony  usytuowane  na  tej  samej  trajektorii  mają 
te  same  wartości  liczby  barionowej  B , dziwności  S, 
izospinu  I itd.,  różnią  się  jedynie  masą  i spinem.  Te 
wszystkie  liczby  kwantowe  można  więc  przypisać 
samej  trajektorii.  Trajektoria,  rozważana  z punktu 
widzenia  kanałów  skrzyżowanych,  opisuje  zatem  wy- 
mianę odpowiednich  liczb  kwantowych  pomiędzy  zde- 
rzającymi się  cząstkami. 

Gdyby  dla  któregokolwiek  bieguna  Reggego  a(0) 
było  większe  od  1,  wzór  (33)  musiałby  doprowadzić 
do  pogwałcenia  ograniczenia  Froissarta.  Tak  więc 
najwyższą  możliwą  wartością  a(0)  jest  1 . Odpowiada 
to  zachowaniu  się  crcałk  w obszarze  wysokich  energii 
jak  const.  Takie  w przybliżeniu  zachowanie  się  jest 
istotnie  obserwowane,  z dokładnością  do  poprawek 
logarytmicznych.  Biegun  o a(0)  = 1 nazywa  się  bie- 
gunem Pomeranczuka.  Trajektoria  Pomeranczuka 
byłaby  scharakteryzowana  przez  liczby  kwantowe  trajektoria 
próżni.  Analizując  inne  trajektorie  Reggego  z punktu  Pomeran- 
widzenia  wymienianych  liczb  kwantowych,  można  czuka 


fa(t)Pg}(t)(-COS0t) 

sinrca^O 


i w obszarze/^2  > 0 i |cos0*l  < 1 zawierająca  wkłady 
rezonansowe,  to  ta  sama  amplituda  w innym  (nie- 
fizycznym) obszarze  wartości  zmiennym  p\  i 0*  zy- 
skuje interpretację  amplitudy  rozpraszania  w kanale 
skrzyżowanym,  tj.  w kanale  s.  W tym  właśnie  kanale 
da  ona  do  pełnej  amplitudy  rozpraszania  wkład  na- 
stępujący 

■p<‘> 


A(/)(-cos0()*><ł>=  m [-1- 


2/yJ 


gdyż  dla  bardzo  dużych  wartości  x funkcję  Pi(x) 
można  zastąpić  przez  najwyższą  potęgę  zmiennej  x, 
czyli  przez  xl.  Poprawne  uwzględnienie  wszystkich 
czynników  kinematycznych  prowadzi  do  następującej 
postaci  amplitudy,  wyrażającej  wkład:  pojedynczego 
bieguna  Reggego  w kanale  skrzyżowanym 


Rys.  27.  Porównanie  modelu  Reggego  z wynikami  doświad- 
czalnymi: a)  trajektoria  efektywna  dla  reakcji  wymiany  ładunku 
w zderzeniu  n-Nt  b)  i c)  opis  reggeowski  rozpraszania  it-N 
ku  tyłowi  przy  użyciu  efektywnych  trajektorii  nukleonowych  (b) — 
x~P>  (c)  — n+p 
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uzasadnić  zaobserwowane  regularności  w przebiegu 
zależności  rozmaitych  przekrojów  czynnych  od  energii . 
Warto  też  zauważyć,  że  dla  prostoliniowej  trajektorii 


a b 

a) 


Rys.  28.  Diagram 
odpowiadający  wy- 
mianie pojedyncze- 
go reggeonu  (rys. 
a);  najprostszy  dia- 
gram dający  wkład 
do  cięcia  Reggego 
(wymiana  dwu  reg- 
geonów,  rys.  b) 


reggeoncwa 
teoria  pola 


warunek 

dualności 


a(/)  = ao-fa'/, 

gdzie  a'  dane  jest  wzorem  (32),  można  prawą  stronę 
wzoru  (34)  przepisać  w postaci  następującej 

||(0l2e[2(^-1)1^e[2a'an5]. 

Tak  więc  wzór  ten  przewiduje  wykładniczy  spadek 
wartości  różniczkowego  przekroju  czynnego  ze  wzro- 
stem |f  | oraz  zwiększanie  się  nachylenia  krzywej  przed- 
stawiającej ten  przekrój  czynny  ze  wzrostem  energii 
(zmiennej  s).  Oba  te  wnioski  są  jakościowo,  a często 
i ilościowo  zgodne  z danymi  doświadczalnymi  (rys. 
27).  Badanie  zjawisk  wiążących  się  z nieznikającymi 
wartościami  spinu  cząstek,  różnicami  mas  oraz  tzw.  si- 
lami wymiany  wnosi  do  tego  obrazu  istotne  poprawki, 
które  jednak  mają  dobre  uzasadnienie  teoretyczne 
i znajdują  potwierdzenie  doświadczalne. 

Jak  była  mowa  powyżej,  w teorii  nierelatywistycznej 
jedynymi  osobliwościami  amplitud  rozpraszania  dla 
Re  / > — Va  są  bieguny.  Nie  jest  to  jednak  prawdą 
w teorii  relatywistycznej.  Różnica  pochodzi  stąd, 
że  w teorii  relatywistycznej  należy  uwzględnić  także 
możliwość  produkcji  nowych  cząstek,  a więc  sta- 
nów wielocząstkowych.  Odpowiada  to  w teorii  Reg- 
gego istnieniu  oprócz  biegunów  także  i cięć  w płasz- 
czyźnie zmiennej  zespolonej  / (tzw.  cięć  Reggego). 
Okazało  się,  że  cięcia  te  w pewnych  wypadkach 
odgrywają  istotną  rolę  w wyjaśnianiu  pewnych 
danych  eksperymentalnych,  jednakże  ich  występo- 
wanie niezwykle  komplikuje  teorię  Reggego  i zmniej- 
sza jej  siłę  przewidywania  (rys.  28). 

Jako  próba  konsekwentnego  przezwyciężenia  tych 
trudności,  powstała  w ciągu  ostatnich  lat  tzw.  regge- 
onowa  teoria  pola,  w której  operuje  się  wymianą 
trajektorii  Reggego  (tzw.  reggeonów),  a nie  zwykłych 
cząstek.  W teorii  tej  istnieje  możliwość  wprowadzenia, 
bez  pogwałcenia  ograniczenia  Froissarta,  także  tra- 
jektorii o liczbach  kwantowych  próżni,  a więc  trajek- 
torii Pomeranczuka  o a(0)  > 1. 

Bieguny  Reggego  znalazły  też  zastosowanie  w te- 
orii procesów  inkluzywnych.  Dzieje  się  to  w ten  spo- 
sób, że  od  procesu  a+b  -*■  c+x  przechodzi  się  na 
podstawie  prawa  podstawień  do  procesu  a+ b 4-  c -*  xt 
reprezentowanego  przez  część  urojoną  amplitudy 
procesu  elastycznego  a+b-\-c  -*  a+bĄ-c  (zgodnie 
z uogólnionym  twierdzeniem  optycznym);  tę  zaś 
amplitudę  można  wyrazić  z kolei  przez  wkłady 
reggeowskie.  To  postępowanie  doprowadziło  do  lep- 
szego zrozumienia  obszernej  klasy  zjawisk  z udziałem 
wielu  cząstek. 

Zaskakującym  spostrzeżeniem  było  to,  iż  ampli- 
tudy opisywane  wzorem  reggeowskim  w obszarze 
wysokich  energii  i przedłużone  do  obszaru  energii 
niższych,  gdzie  wzór  ten  nie  powinien  się  stosować, 
po  rozłożeniu  na  fale  cząstkowe  wytworzyły  na  wy- 
kresie Arganda  okręgi  odpowiadające  w wielu  wy- 
padkach cząstkom  obserwowanym  w tym  samym  pro- 
cesie. Było  to  dalsze  odkrycie,  ponieważ  do  tego  czasu 
bieguny  Reggego  korelowały  zachowanie  się  wielkoś- 
ci fizycznych  przy  wysokich  energiach  w jednym  pro- 
cesie z zachowaniem  się  rezonansowym  — w procesie 
skrzyżowanym.  Sformułowano  wówczas  hipotezę,  że 
amplituda  oddziaływania  silnego  musi  spełniać  jeszcze 
jeden  warunek  dotychczas  nieznany,  zwany  dual- 
nością. Amplituda  spełnia  warunek  dualności,  jeśli 
w tym  samym  procesie  może  być  przedstawiona  albo 
jako  suma  wszystkich  wkładów  rezonansowych,  albo 
jako  suma  wszystkich  wkładów  od  biegunów  Reggego 
(rys.  29).  Oczywiście,  praktycznemu  wykorzystaniu 
tej  zasady  stoi  na  przeszkodzie  brak  informacji 
o wszystkich  możliwych  rezonansach  i biegunach 
Reggego,  toteż  koncepcję  tę  można  sprawdzić  tylko 
z pewnym  przybliżeniem.  Jednak  wnioski  uzyskane 
na  jej  podstawie  niejednokrotnie  okazywały  się  trafne. 


Rys.  29.  Zasada  warunku  dualności 

Jednym  z kluczowych  problemów  teorii  opartej  na 
pojęciu  biegunów  Reggego  jest  status  bieguna  Pome- 
ranczuka. Jest  on  niewątpliwie  wyróżniony  fizycz- 
nie przez  swoje  położenie  w płaszczyźnie  zmiennej 
zespolonej  / i przez  liczby  kwantowe  próżni,  które  go 
charakteryzują.  Jednakże  również  analiza  fenomeno- 
logiczna danych  wskazuje  na  pewne  szczególne  cechy 
tej  osobliwości.  Po  pierwsze,  jest  to  jedyny  biegun,  biegun  Po- 
którego  trajektoria  wyłamuje  się  z ogólnej  regular-  meranozuka 
ności  wartości  stałego  nachylenia  (zob.  wzór  32). 

Nachylenie  trajektorii  bieguna  Pomeranczuka  jest 
znacznie  mniejsze;  szacuje  się  je  na  ok.  0,3  GeV“2. 

Po  drugie,  trudno  wskazać  rezonanse,  które  by  znaj- 
dowały się  na  tej  trajektorii.  Wprawdzie  istnieją 
takie  warianty  teorii,  w których  z trajektorią  Po- 
meranczuka wiąże  się  mezon  f o masie  ok.  1270 
MeV/c2,  ale  takie  przyporządkowanie  nie  jest  natu- 
ralne i wymaga  dość  skomplikowanej  argumentacji. 

Po  trzecie,  wzrost  crcałk  w obszarze  najwyższych  obec- 
nie dostępnych  energii  wskazuje  na  to,  iż  amplitudy 
rozpraszania  elastycznego  nie  mogą  być  opisywane 
wyłącznie  przez  biegun  Pomeranczuka,  bo  w tym 
wypadku  przekrój  czynny  oCałk  przybierałby  wartości 
stałe.  Być  może  zatem  to,  co  nosi  obecnie  nazwę  bie- 
guna Pomeranczuka,  jest  jakąś  inną  osobliwoś- 
cią (zespołem  cięć).  Te  trudności  w zrozumieniu 
istoty  bieguna  Pomeranczuka  uwidaczniają  się  także 
w próbach  włączenia  go  w schemat  teorii  dualnej. 

Niekiedy  wypowiada  się  pogląd,  że  jest  to  osobli- 
wość powiązana  przez  zasadę  dualności  nie  z rezonan- 
sami, lecz  właśnie  z nierezonansowym  tłem.  Za  taką 
koncepcją  mógłby  przemawiać  fakt,  że  przebieg  wy- 
sokoenergetyczny wszystkich  amplitud  (który  jest 
opisywany  wyłącznie  przez  osobliwość  Pomeranczuka) 
jest  taki  sam  dla  tych  procesów,  w których  obser- 
wuje się  rezonanse  (np.  rozpraszania  n+-N),  jak  i dla 
tych,  w których  rezonansów  nie  widać  (np.  K+-N). 

Powstaje  też  problem  genezy  osobliwości  Pomeran- 
czuka. Nie  wiadomo,  czy  osobliwość  ta  jest  tworem 
samodzielnym,  czy  też  wynikiem  jakiegoś  sumowa- 
nia się  wkładów  od  innych,  normalnych  trajektorii. 


Symetrie  oddziaływań  silnych 
i modele  kwarków 

Innym  podejściem  do  teorii  oddziaływań  silnych, 
częściowo  konkurencyjnym  w stosunku  do  ujęcia 
dynamicznego  i analitycznego,  przedstawionego  po- 
wyżej, a częściowo  je  uzupełniającym  jest  ujęcie  tej  teo- 
rii od  strony  symetrii  (— > Cząstki  elementarne  i ich 
oddziaływania).  Oddziaływania  silne  są  wyróżnione 
fizycznie  m.in.  przez  bogactwo  swych  własności 
symetrii  wyrażonych  w wielu  prawach  zachowania 
rozmaitych  wielkości  fizycznych.  Z symetrii  tych  wyni- 
ka nie  tylko  pewne  uporządkowanie  cząstek  w multi- 
plety (np.  izospinu),  ale  też  pewne  ważne  związki 
między  amplitudami. 

Biorąc  jako  przykład  zderzenia  mezonów  K z nu- 
kleonami, można  się  przekonać,  że  istnieje  pięć 
fizycznie  różnych  procesów,  a mianowicie:  rozpra- 
szanie elastyczne  K+-p,  K+-n,  K°-p , K°-n  oraz  pro- 
ces wymiany  ładunku  K+Jrn  — ► K°+p.  Jednakże 
warunek  niezmienniczości  izospinowej  wyklucza  niezmienni  - 
możliwość,  aby  amplitudy  oddziaływań  silnych  zależa-  czość  izo- 
ły  od  kierunku  wektora  izospinu  całkowitego  ukła-  spinowa 
du  obu  cząstek  w przestrzeni  izospinu,  zezwalając 
tylko  na  to,  aby  amplitudy  te  zależały  od  długości 
tego  wektora.  Innymi  słowy,  amplitudy  nie  mogą  za- 
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leżeć  od  liczby  kwantowej  /3,  a tylko  od  całkowitego 
izospinu  l.  Dla  dwu  cząstek  o izospinie  72  (jak  N i K ) 
całkow-ity  izospin  może  przybierać  (zgodnie  z zasada- 
mi składania  momentu  pędu)  tylko  dwie  wartości, 
a mianowicie  0 i 1 . Powinny  więc  istnieć  najwyżej  dwie 
niezależne  amplitudy  izospinowe,  przez  które  muszą 
się  wyrażać  amplitudy  wszystkich  pięciu  wymienio- 
nych wyżej  procesów.  Związki  takie  można  znaleźć 
i następnie  sprawdzić  doświadczalnie.  Jak  dotąd  ani 
w tym,  ani  w żadnym  innym  procesie  nie  napotkano 
wypadku  łamania  symetrii  izospinowej  przez  od- 
działywania silne  (jest  ona  łamana  przez  oddziaływa- 
nia elektromagnetyczne). 

niezmienni-  Podobnie,  choć  na  wyższym  poziomie,  przedstawia 
czość  wzglę-  się  zagadnienie  niezmienniczości  teorii  oddziały- 
dem  SU( 3)  wań  silnych  względem  przekształceń  grupy  SU( 3). 

Rozpatrzmy  przykład  zderzeń  binarnych  dowolnych 
dwu  cząstek  należących  jedna  do  oktetu  mezonów 
pseudoskalarnych,  a druga  — do  oktetu  barionów 
o spinie  7«  i parzystości  dodatniej.  Uwzględniając 
już  nawet  związki  wynikające  z niezmienniczości 
izospinowej,  wciąż  jeszcze  istnieje  tu  aż  36  a priori 
niezależnych  amplitud  (rozpraszanie  elastyczne  7T-N, 
K-Ny  K-N , f]-Ny  n-Ay_  K-Ay  Z A,  y-A,  n-Zy  K-,Z 
K-2J,  rj-Z,  n-Zy  K-Zy  K-Z,  r\-Z,  oraz  amplitudy  nie- 
elastycznych procesów  binarnych  nN  ->  r]Ny  xZ~-y 
->  r/ Z,  tiA  ->  rjZ,  nZ  ->  rjZy  KA  ->  KZ,  KA  ->  KZ, 
7i  A ->  nZ,  VA  -y  nZ , jtN  _ KA , tzN  ->  KZ,7jN  ->  KA, 
7]N  ->  KZ , tcA -y  KNy  tzA  -y  KZ , nA-y  KN , rjA  — 
->  AS,  7zZ  ->  KN,  nZ  ->  AS,  VZ  ->  AAT,  t/S  — KZ). 
Z drugiej  jednak  strony  z zasad  składania  reprezen- 
tacji grupy  SU (3)  wynika,  że  8®8  = 1©8©8©10© 
©10® 27.  Istnieje  więc  tylko  6 niezależnych  amplitud 
oddziaływań  silnych  przy  zderzeniu,  o którym  tu 
mowa,  jeśli  oddziaływania  te  są  niezmiennicze  wzglę- 
dem przekształceń  grupy  SU( 3).  I te  związki  mogą  być 
przedmiotem  analizy  doświadczalnej,  choć  nie  należy 
oczekiwać,  aby  były  one  tak  dobrze  potwierdzone 
przez  pomiar,  jak  w wypadku  izospinu.  Niestety, 
sprawdzanie  jest  tu  dodatkowo  utrudnione  przez  fakt, 
że  tylko  nieznaczna  część  spośród  wymienionych 
amplitud  dostępna  jest  pomiarom,  ze  względu  na 
ograniczenia  zarówno  co  do  tarcz  jak  i co  do  wiązek 
(tarcze  tylko  nukleonow-e,  wiązki  tylko  n,  K i K). 

Sprawdzanie  tych  relacji  może  nawet  nie  mieć,  co 
najmniej  w obszarze  obecnie  dostępnych  energii, 
większego  sensu  ze  względu  na  znany  fakt  łamania 
symetrii  SU( 3)  uwidaczniający  się  już  w widmie  mas. 
Gdyby  bowiem  symetria  SU( 3)  była  ścisła,  wszystkie 
masy  cząstek  należących  do  tego  samego  multipletu 
byłyby  jednakowe,  a tak  nie  jest.  Jednakże  Susumo 
Okubo  i Murray  Gell-Mann  podali  opis  teoretyczny 
takiego  łamania  symetrii  SU( 3),  które  prowadzi  do 
uzyskania  poprawnego  widma  mas.  Założyli  oni,  że 
operator  masy  składa  się  z kilku  części,  z których 
jedna  jest  skalarem  symetrii  5£/(3)  i daje  wszystkim 
cząstkom  tego  samego  multipletu  te  same  masy,  pod- 
czas gdy  pozostałe  dwie  części  są  pewnymi  składowy- 
mi oktetu,  tak  dobranymi,  aby  wszystkie  cząstki 
wzór  GeSI-  należące  do  tego  samego  izomultipletu  miały  tę  samą 
-Manna—  masę.  Uzyskany  wzór  na  widmo  mas  (wzór  Gell- 
-Okisbo  -Manna-Okubo)  ma  następującą  postać : 

w = a+bY+c{HI+Y)-'UY*\,  (35) 

gdzie  Y = B+S  jest  hiperładunkiem  cząstki,  I — jej 
izospinem,  zaś  a , by  c są  trzema  stałymi,  zależnymi  od 
multipletu  symetrii  5(7(3),  w którym  wzór  (35)  jest 
sprawdzany. 

W zastosowaniu  do  barionów  wzór  (35)  sprawdza 
się  bardzo  dobrze.  Na  przykład  w oktecie,  do  które- 
go należy  nukleon,  przyjmując  znane  z doświadczenia 
masy  N,  A i Z można  dostać  przewidywaną  masę 
hiperonu  Z równą  ok.  1328  MeV/c2,  podczas  gdy  masa 
rzeczywista,  znana  z doświadczenia,  wynosi  ok. 
1320  Me/y/c2.  Lepszą  zgodność  z doświadczeniem 
uzyskuje  się  dla  dekupletu  barionów  o spinie 


W zastosowaniu  do  mezonów  wzór  (35)  nieoczeki- 
wanie nie  przynosi  tak  dobrych  rezultatów.  W wyni- 
ku dalszych  badań  i poszukiwań  wyjaśniono  ostatecz- 
nie, że  nie  wszystkie  obserwowane  w przyrodzie  cząst- 
ki należą  do  jakiegoś  konkretnego  multipletu  5(7(3), 
lecz  że  są  też  takie  które  stanowią  „mieszaninę" 
dwu  różnych  multipletów.  Przykładów  tej  sytuacji 
jest  sporo.  Wszystkie  one  dotyczą  mieszania  oktetu 
z singletem  w rozmaitych  stanach  spinu  i parzys- 
tości. Okazało  się  np.,  że  mezony  <p  i co  nie  są  ani 
czystymi  stanami  singletowymi,  ani  też  oktetowymi, 
lecz  pewną  mieszaniną  obu  tych  multipletów. 

Zagadnienie  to  zostało  wyjaśnione  na  podstawie 
modelu  kwarkowego  cząstek  elementarnych.  Okazało 
się  mianowicie,  że  mezon  9?  jest  zbudowany  przede 
wszystkim  (niemal  dokładnie)  z pary  ss,  podczas 
gdy  mezon  co  z par  kwarków  niedziwnych,  co  dokład- 
nie odpowiada  obserwowanemu  mieszaniu  multiple- 
tów. 

Z modeli  kwarkowych  wynikają  także  relacje  mię- 
dzy amplitudami  zderzeń  hadronów,  przy  pewnych  za- 
łożeniach dynamicznych  dotyczących  oddziaływań  po- 
między kwarkami.  Taką  najbardziej  znaną  relacją 
jest  związek  między  całkowitymi  przekrojami  czynny- 
mi na  rozpraszanie  r.-N  i N-N,  który  ma  postać 

tfcalkOr  N)  = 73*całk(AW).  (36) 

Wynika  on  bezpośrednio  z liczenia  kwarków.  W mezo- 
nach 7i  występuje  para  kwarków  niedziwnych,  a w nu- 
kleonach — trójka  takich  samych  kwarków.  W oddzia- 
ływaniu n- N mamy  więc  2x3  oddziaływań  kwarko- 
wych, a w oddziaływaniu  N-N  3x3  takich  oddziały- 
wań. Prowadzi  to  wprost  do  wzoru  (36),  przy  założe- 
niu, że  amplitudy  zderzeń  indywidualnych  kwarków 
po  prostu  można  dodawać,  aby  dostać  amplitudę 
zderzenia  hadron-hadron.  Podobnie  z modelu  kwarko- 
wego można  wysnuć  wniosek,  iż 

tfcałkfrW)  — Ceałk(A7V),  (37) 

który  razem  z (36)  prowadzi  do  wzoru: 

2^całk(^)  = <rcMKM)+*U<rcaik(NN).  (38) 


Porównanie  tych  wzorów  z danymi  doświadczalnymi 
przedstawia  rys.  30. 
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Rys.  3(X  Porównanie  z doświadczeniem  wzorów  (36),  (37)  i (38) 


Powstanie  jednolitej  teorii  oddziaływań  słabych 
i elektromagnetycznych,  sukcesy  modelu  partonowego 
(->  Struktura  cząstek  elementarnych)  w wyjaśnianiu 
danych  dotyczących  zderzeń  głęboko  nieelastycznych 
hadronów  z leptonami  i wreszcie  wykrycie  nowych 
cząstek,  zawierających  kwarki  powabne,  jeszcze  bar- 
dziej zwiększyło  zainteresowanie  modelem  kwarko- 
wym budowy  hadronów.  Czyniono  próby  stworzenia 
teorii  dynamicznej  oddziaływań  kwarków  wewnątrz 
hadronu.  W pracach  tych  zwykle  rezygnuje  się  z na- 
dziei, że  kwarki  kiedykolwiek  będą  mogły  być  zaob- 
serwowane poza  hadronami,  a koncentruje  się  uwagę 
na  wyjaśnieniu  faktu  uwięzienia  kwarków  w hadro- 
nach. 


model 

kwarkowy 


kwarki 

uwięzione 
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chroKiodyrsa-  Jedną  z takich  koncepcji  teoretycznych,  powstałą 
mika  stosunkowo  niedawno,  co  do  której  istnieją  uza- 
kwantowa  sadnione  nadzieje,  że  może  się  ona  w przyszłości 
przerodzić  w poszukiwaną  od  tak  dawna  teorię  od- 
działywań silnych,  jest  chromodynamika  kwantowa. 
Jest  to  teoria  opisująca  oddziaływania  między  kwar- 
kami przez  wymianę  cząstek  podobnych  do  foto- 
nów— gluonów.  Zasadnicza  różnica  między  foto- 
nami a gluonami  polega  na  tym,  że  gluony  będąc  ska- 
1 arami  zwykłej  grupy  SU( 3),  czy  też  właściwie  *SŁ/(4) 
lub  może  nawet  SU( 6),  byłyby  zarazem  składowymi 
oktetu  innej  grupy  SU{ 3),  a mianowicie  grupy  koloru 
(stąd  nazwa  „chromodynamika'’).  Gluony  oddziały- 
wałyby silnie  nie  tylko  z kwarkami,  ale  też  ze  sobą 
nawzajem,  w odróżnieniu  od  fotonów.  Być  może  fakt 
ten  mógłby  wyjaśnić,  dlaczego  gluony  nie  są  emito- 
wane na  zewnątrz  hadronów  (bo  więżą  je  inne  gluony). 
W rezultacie  w przyrodzie  nie  obserwuje  się  cząstek 
kolorowych,  a tylko  „białe”  hadrony. 

Chromodynamika  kwantowa  jak  dotąd  jednak  nie 
jest  w stanie  tego  wniosku  uzasadnić  ilościowo.  W re- 
zultacie w praktycznych  obliczeniach  fakt  uwięzie- 
nia kwarków  traktuje  się  jako  dany  z góry.  Można 
to  zrobić  dwojako.  W wersji  bardziej  wyszukanej, 
zakłada  się,  że  oddziaływania  między  kwarkami  i gluo- 
nami powodują  powstanie  pewnego  pola  samouzgod- 
nionego,  które  trzyma  wszystkie  te  cząstki  wewnątrz 
hadronu  oraz  dają  pewne  słabe  oddziaływania  reszt- 
kowe, które  w pierwszym  przybliżeniu  można  nawet 
model  pominąć.  Pole  więżące  kwarki  nazywa  się  czasem 
worka  workiem.  W modelu  worka  zakłada  się  pewną  kon- 
kretną postać  pola.  Obliczone  wówczas  widmo  mas 
hadronów  zgadza  się  na  ogół  bardzo  dobrze  z do- 
świadczeniem z wyjątkiem  masy  mezonu  7 r,  której 
obliczona  wartość  jest  za  duża  oraz  poza  tym,  że 
z obliczeń  wynika  istnienie  również  takich  cząstek, 
których  — jak  dotąd  — nie  wykryto  w doświadczeniu. 
Poza  tym  model  worka  nie  pozwala  na  żadne  prze- 
widywania co  do  amplitud  procesów  między  hadro- 
nami. 

Mniej  ambitna  wersja  modelu  polega  na  założeniu, 
że  uwięzienie  kwarków  można  opisać  wprowadzając 
po  prostu  pewien  potencjał,  który  dla  dużych  odległoś- 
ci między  kwarkami  zmierza  do  nieskończoności,  nie 
pozwalając  im  opuścić  hadronu.  Typowym  przykła- 


dem takiego  potencjału  jest 


V(r)  = A/r+Br,  (39) 


gdzie  A i B są  pewnymi  stałymi.  Potencjał  taki  wsta- 
wia się  do  równania  Schrodingera  i bada  widmo 
stanów  związanych.  Wyniki  przedstawione  dla  układu 
kwarków  c-c  (układ  fizyczny  zwany  czarmonium, 
od  ang.  charm  ' powab’),  są  w bardzo  dobrej  zgod- 
ności z doświadczeniem.  Oczywiście  i w tym  wy- 
padku nie  można  badać  oddziaływań  między  hadro- 
nami, a tylko  widmo  mas,  oraz  inne  własności  poje- 
dynczych hadronów. 

Pomimo  wszystkich  tych  ograniczeń  wyniki  uzyska- 
ne w modelach  pochodzących  od  chromodynamiki 
kwantowej  pozwalają  mieć  nadzieję  na  to,  że  konsek- 
wentna teoria  oddziaływań  silnych  wreszcie  powstanie. 

Obraz,  który  się  być  może  wyłania  z obecnie  do- 
stępnych danych,  byłby  więc  taki,  że  oddziaływania 
silne,  podobnie  jak  słabe  i elektromagnetyczne  by- 
łyby przenoszone  przez  bozony  o spinie  1,  a liczba 
fundamentalnych  cząstek  obejmowałaby  oprócz  tych 
bozonów  jeszcze  tylko  stosunkowo  niewielką  liczbę 
fermionów  (być  może  6 leptonów  i 6 kwarków,  te  os- 
tatnie — każdy  w trzech  kolorach).  Chromodynamika 
kwantowa  (albo  inna  teoria  oparta  na  modelu  kwarko- 
wym) musi  przede  wszystkim  wyjaśnić  wszystkie  te 
regularności  dynamiczne,  które  są  opisane  w modelu 
biegunów  Reggego.  Sprawą  zaś  dalszej  przyszłości 
jest  zarysowująca  się  możliwość  unifikacji  także  od- 
działywań silnych  ze  słabymi  i elektromagnetycznymi. 

Istnieją  poglądy,  że  leptony  tworzą  czwarty  kolor, 
a więc  pełna  grupa  symetrii  koloru  byłaby  grupą 
,SŁ/(4),  a nie  Si/(3).  W tym  wypadku  kwarki  mogłyby 
samorzutnie  przechodzić  w leptony,  a dokładniej 
w układy  cząstek  zawierające  leptony.  Liczba  bano- 
nów  nie  byłaby  więc  zachowana  bezwzględnie,  a pro- 
ton byłby  cząstką  nietrwałą,  z bardzo  długim  czasem 
życia,  rzędu  co  najmniej  1022lat.  Sprawdzenie  doświad- 
czalne tych  hipotez  może  więc  być  bardzo  trudne. 

P.D.B.  Collins,  E.J.  Squires  Regge  Poles  in  Particie  Pkysics , 
Berlin  1968  (ros.  Moskwa  1971);  R-J-  Eden ^ High  Energy^  c°lIł~ 
sions  of  Elementary  Particles , Cambridge  1967  (ros.  Moskwa 
1970)*  D.H.  Perkins  Introduction  to  High  Energy  rhysics,  Lon- 
don 1972  (ros.  Moskwa  1975);  H.  Pilkuhn  The  Interachons  of 
Hadronu,  Amsterdam  1967;  Zob.  też  bibl.  do  Cząstki  elementarne 
i ich  oddziaływania. 
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Oddziaływania  elektromagnetyczne 


Michał  Święcki 

Oddziaływania  elektromagnetyczne  są  to  wszelkiego 
typu  reakcje  zachodzące  między  ładunkami  elektry- 
cznymi zarówno  nieruchomymi,  jak  i pozostającymi 
w ruchu.  W tym  drugim  przypadku  mamy  do  czynie- 
nia z prądami  elektrycznymi,  które  są  źródłem  od- 
działywań magnetycznych.  Wszystkie  oddziaływania 
elektromagnetyczne  zachodzą  za  pośrednictwem  pola 
elektromagnetycznego,  które  w każdym  punkcie  wy- 
pełnionej nim  przestrzeni  działa  siłą  elektryczną  na 
umieszczone  w tej  przestrzeni  ładunki  elektryczne, 
ładunki  a także  siłą  magnetyczną  — na  ładunki,  będące  w ru- 
elektry&zne  chu  (prądy,  magnesy).  Równocześnie  źródłem  pola 
a pole  elektromagnetycznego  są  ładunki  elektryczne.  Nje- 
elektro-  ruchome  ładunki  oraz  stałe  prądy  elektryczne  są  źród- 
magnetyczne  łami  nie  zmieniających  się  z upływem  czasu  pól 
statycznych,  na  przykład  pola  elektrostatycznego 
siły  Coulomba  bądź  pola  magnetostatycznego  nie- 
ruchomego magnesu.  Ruchome  pojedyncze  ładunki 
oraz  prądy  zmienne  wywołują  powstawanie  zmiennego 
pola  elektromagnetycznego.  Zmiana  (zaburzenie)  pola 
elektromagnetycznego  następuje  lokalnie,  w miej- 
scu, w którym  zaszła  zmiana  ładunku  — źródła  pola. 
Następnie  zaburzenie  to  rozchodzi  się  po  całej  prze- 
strzeni w postaci  fali  elektromagnetycznej.  Poza  miej- 
scem i chwilą  zajścia  zaburzenia  fala  ta  rozchodzi 


się  swobodnie,  aż  do  momentu  napotkania  innych 
ładunków,  na  które  również  lokalnie  działa  siłami 
elektrycznymi  i magnetycznymi.  Przekonamy  się  dalej, 
na  czym  polega  owo  rozchodzenie  się  pól  elektro- 
magnetycznych — nośników  wszystkich  oddziaływań 
elektromagnetycznych.  . . 

Oddziaływania  elektromagnetyczne  odgrywają  wy-  rola  ocldzsa- 
jątkową  rolę  w świecie  i w procesie  jego  poznawania,  iy  wara  eieic- 
Decydują  one  o budowie  atomów  i cząsteczek  chemi-  tromagne- 
cznych,  a także  o strukturze  wszelkich  ciał  makrosko-  tycznych 
powych  z wyjątkiem  planet  i gwiazd,  gdzie  istotne  są 
również  oddziaływania  grawitacyjne.  Nasze  zmysły 
działają  również  dzięki  oddziaływaniom  elektromag- 
netycznym. Na  nich  też  opiera  się  funkcjonowanie 
wszystkich  przyrządów  pomiarowych.  Także  tych, 
za  pomocą  których  przeprowadzamy  doświadczenia 
w świecie  cząstek  elementarnych.  Można  powiedzieć, 
że  cała  nasza  ścisła  wiedza  o świecie  była  i jest  zbierana 
za  pomocą  różnego  typu  oddziaływań  elektromagne- 
tycznych. Nic  więc  dziwnego,  że  oddziaływania  te 
zostały  najlepiej  poznane  i opisane  przez  fizykę. 

Istnieje  bardzo  elegancka  i doskonale  zgodna  z do- 
świadczeniem teoria  oddziaływań  elektromagnetycz- 
nych. Dla  zjawisk  makroskopowych  jest  to  znana 
teoria  Maxwella-Faradaya.  W przypadku  zjawisk 
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mikroskopowych,  z których  wynikają  oczywiście 
wszelkie  prawa  makroskopowe,  teorią  tą  jest  elektro- 
dynamika kwantowa  (->  Elektrodynamika,  Teoria 
pola).  W tym  artykule  opiszemy  zasady  elektrodyna- 
miki kwantowej  i jej  zastosowanie  do  opisu  oddziały- 
wań elektromagnetycznych  cząstek  elementarnych, 
własności  Nim  do  tego  przejdziemy,  zastanówmy  się,  dlaczego 
oddziaływań  to  w'łaśnie  oddziaływania  elektromagnetyczne  pełnią 
elektromag-  ową  wyjątkową  rolę  w przyrodzie.  Jest  to  związane 
netycznych  z dwiema  ich  własnościami.  Po  pierwsze  mają  one 
nieskończony  zasięg  działania  i łatwo  je  obserwować 
na  odległościach  makroskopowych.  Oddziaływania 
graw  itacyjne  mają  również  tę  własność,  ale  są  wyjątko- 
wo słabe  i zaczynają  odgrywać  zauważalną  rolę  do- 
piero dla  obiektów  astronomicznych.  Oddziaływania 
zaś  silne  i słabe  mają  zasięg  działania  niesłychanie 
mały  10“15  m),  znacznie  mniejszy  niż  zdolność  roz- 
dzielcza stosowanej  aparatury  pomiarowej.  Z drugiej 
strony  oddziaływania  elektromagnetyczne  cząstek 
elementarnych  są  na  tyle  słabe,  że  przy  ich  opisie 
stosować  można  pewne  metody  przybliżone  (diagra- 
my lub  inaczej  grafy  Feynmana),  które  opiszemy  dalej 
Oddziaływania  silne  ważne  przy  opisie  struktury  jądra 
atomowego  są  natomiast  zbyt  mocne  i dlatego  ich 
opis  teoretyczny  nie  jest  już  tak  prosty, 
elektro-  Elektrodynamika  kwantowa  traktuje  o oddziały  wa- 

dy na  mika  niach  elektromagnetycznych  cząstek  elementarnych, 
kwantowa  W oddziaływaniach  tych  biorą  udział  wszystkie  cząstki 
z wyjątkiem  neutrin.  Wszystkie  one  bowiem  albo  są 
obdarzone  ładunkiem,  albo  zbudowane  są  ze  składni- 
ków' naładowanych,  jakimi  są  np.  kwarki  w hadro- 
nach (-*  Cząstki  elementarne  i ich  oddziaływania. 
Struktura  cząstek  elementarnych).  Kluczową  rolę  we 
wszystkich  oddziaływaniach  elektromagnetycznych 
odgrywa  foton.  Nie  ma  on  ładunku,  a tylko  oddziałuje 
z ładunkami  innych  cząstek  przenosząc  między  nimi 
pęd  i energię.  Foton  więc  pełni  w świecie  cząstek  ele- 
mentarnych taką  samą  funkcję,  jak  pole  elektromag- 
netyczne w zjawiskach  makroskopowych.  Rozpatrzmy 
dokładniej,  na  czym  polega  przenoszenie  oddziaływań 
między  cząstkami  przez  inne  cząstki  (np.  przez  foton). 
W tym  celu  musimy  przypomnieć  prawa  kwantowe 
rządzące  mikroświatem. 

Zgodnie  z wynikami  dotychczas  przeprowadzonych 
doświadczeń  cząstki  elementarne  rozchodzą  się  jak 
wzory  fale,  których  częstość  i długość  wiążą  się  z energią 
de  Brog!ie'a  i pędem  cząstek  wzorami  de  Broglie’a: 

E — hv\  p — h/X. 

Fale  te  ulegają  dyfrakcji  i interferencji,  zjawiskom 
charakterystycznym  dla  procesów  rozchodzenia  się 
cząstek.  Natomiast  bez  względu  na  to,  czy  rozcho- 
dząca się  fala  elektronowa  bądź  fotonowa  jest  kulista 
czy  też  płaska  (zależy  to  od  własności  źródła  elektro- 
nów, czy  fotonów)  zawsze  przekazuje  ona  całą  swą 
energię,  pęd,  ładunek  i inne  mierzalne  swe  własności 
w'  postaci  zlokalizowanych,  bardzo  małych  przestrzen- 
nie porcji  — w postaci  cząstek.  Tak  więc  cząstki  ele- 
mentarne rozchodzą  się  jak  fale,  a we  wszystkich 
urządzeniach  pomiarowych  rejestrowane  są  jako  bar- 
fale  prawdo-  dzo  małe  obiekty.  Żeby  opisać  ten  paradoksalny  wynik 
podobień-  w'ielu  doświadczeń  wprowadzamy  pojęcie  fal  prawdo- 
stwa  podobieństwa.  Fale  te  opisują  wszystkie  możliwe 
drogi  i sposoby  rozchodzenia  się  cząstek.  Rozcho- 
dzenie się  to  ma  właśnie  charakter  fałowy.  Natężenie 
fal  prawdopodobieństwa,  czyli  kwadrat  ich  amplitudy 
jest  miarą  prawdopodobieństwa  określonego  zacho- 
wania się  cząstek.  Tak  więc  mówimy  jedynie  o praw- 
dopodobieństwie uzyskania  określonego  wyniku  po- 
miaru położenia  cząstki  i prawdopodobieństwo  to 
rozchodzi  się  jak  fala.  A jaki  jest  związek  fali,  na 
przykład  fotonowej,  z makroskopowym  polem  elek- 
tromagnetycznym? Otóż  przy  bardzo  dużej  mocy 
źródła  wysyłającego  fotony  liczba  możliwych  rozróż- 
nianych doświadczalnie  dróg,  po  których  mogą  się 
one  rozchodzić,  staje  się  znacznie  mniejsza  niż  liczba 
samych  fotonów.  Chociaż  więc  w dalszym  ciągu  losy 
pojedynczego  fotonu  mogą  być  określone  jedynie 


statystycznie,  to  jednak  prawdopodobieństwo  tego, 
że  duża  liczba  jakichkolwiek  fotonów  znajdzie  się  w 
dowolnym  miejscu  jest  bliskie  jedności.  1 tak  właśnie 
pojawia  się  makroskopowa  fala  elektromagnetyczna, 
która  składa  się  z ogromnej  liczby  mikroskopowych 
fal  fotonowych.  Zerowa  masa  spoczynkowa  fotonu 
jest  odpowiedzialna  za  fakt,  że  fale  elektromagne- 
tyczne rozchodzą  się  z maksymalną  możliwą  pręd- 
kością c 300  000  km/s.  Dwa  możliwe  ustawienia 
spinu  fotonu  odpowiadają  dwom  niezależnym  stanom 
polaryzacji  tych  fal.  Wysyłanie  i pochłanianie  fal  ele- 
ktromagnetycznych to  nic  innego,  jak  wysyłanie  i po- 
chłanianie fotonów  przez  ładunki  elektryczne. 

Z powyższych  rozważań  wynika,  że  elementarnym 
oddziaływaniem  elektromagnetycznym  jest  wysłanie 
bądź  pochłonięcie  fotonu  przez  cząstkę  naładowaną 
elektrycznie.  Proces  ten,  podobnie  jak  oddziaływania 
makroskopowe,  zachodzi  lokalnie,  czyli  w pewnym 
punkcie  przestrzeni  i pewnej  chwili  czasu.  Poza  tym 
punktem  i chwilą  zarówno  naładowana  cząstka,  jak 
i foton  rozchodzą  się  zupełnie  swobodnie,  bez  oddzia- 
ływań. Wynika  z tego,  że  jedynie  oddziaływania  elek- 
tromagnetyczne cząstek  elementarnych  nie  mających 
wewnętrznej  struktury  są  łatwe  do  opisania.  Takimi 
cząstkami  prócz  samego  fotonu  są  wszystkie  leptony. 
Natomiast  hadrony  mają  bogatą  strukturę  — złożone 
są  prawdopodobnie  z kwarków  i tylko  oddziaływania 
elektromagnetyczne  tych  ostatnich  są  proste.  Najpierw 
więc  opiszemy  oddziaływania  elektromagnetyczne 
leptonów,  przed  omówieniem  struktury  hadronów. 

Podstawowym  procesem  elektromagnetycznym  jest 
wysłanie  fotonu  przez  inną,  naładowaną  cząstkę. 
Jednak  proces  taki  wydaje  się  niemożliwy  z punktu 
widzenia  praw  zachowania  energii  i pędu.  Elektron 


Rys.  ] . Emisja  fotonu 
2 elektronu.  Masa  foto- 
nu nie  może  być  równa 
zeru 


o ściśle  określonej  (przez  pomiar)  energii  Ex  i pędzie 
Pi  (rys.  1)  może  po  wysłaniu  fotonu  pozostać  tym 

samym  elektronem  o energii  Ez  i pędzie p2  tylko  wtedy, 
gdy  kwadrat  masy  spoczynkowej  fotonu  wynosi 

</2  = ( 1 /c4)  [(£2 — £i)2 — (p2  ’ PiYc2]  < 0, 
zgodnie  z zasadami  zachowania  oraz  relatywistycz- 
nym związkiem  między  energią  i pędem.  Tymczasem 
wiemy,  że  masa  fotonu  wynósi  zero,  co  w powyższym 
wzorze  może  się  zdarzyć  tylko  wtedy,  gdy  Ex  = £2 

oraz  p±  = p2  (rozpraszanie  do  przodu).  A jednak 
mogą  istnieć,  choć  niezbyt  długo,  fotony  o dowolnych 
wartościach  masy.  Są  to  tzw.  fotony  wirtualne.  Ich 
pojawianie  się  wiąże  się  z zasadą  nieokreśloności 
energii  i czasu  powszechnie  obowiązującą  w teoriach 
kwantowych.  Zasada  ta  jest  bezpośrednią  konsekwen- 
cją związku  między  energią  cząstki  i liczbą  drgań  na 
sekundę  w fali  z nią  związanej,  E = hv.  Głosi  ona,  że 
minimalny  czas  At,  po  którym  jakikolwiek  obiekt 
fizyczny  (np.  przyrząd  pomiarowy)  może  zarejestro- 
wać zmianę  stanu  badanej  cząstki  (na  przykład  fakt 
wysłania  przez  nią  fotonu)  wiąże  się  z nieokreślono- 
ścią wartości  energii  tej  cząstki  AE  nierównością. 

AE  At  ^ V/;. 

Zasada  ta  obowiązuje  często  ze  znakiem  równości. 
Na  przykład  dla  cząstki  swobodnej  iloczyn  nieokreślo- 
ności czasu  i energii  dąży  do  lkfi,  gdy  nieokreśloność 
energii  dąży  do  zera,  tzn.  gdy  energię  cząstki  wyzna- 
czamy z dużą  dokładnością.  Nie  ma  jednak  żadnego 
powodu  formalnego  (poza,  być  może,  naszą  jakże 


oddziaływa* 
nie  elemen- 
tarne 


fotony 

wirtualne 
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masy  często  zawodną  intuicją),  żeby  masy  spoczynkowe 
spoczynkowe  cząstek  były  ściśle  określone.  W każdym  przypadku 
omawianej  reakcji  emisji  fotonu  energie  i pędy  cząstek 
są  określone  bardzo  dobrze  — dla  elektronów  przez 
pomiary,  dla  fotonu  wirtualnego  przez  zasady  za- 
chowania. Nie  ma  jednak  zasady  zachowania  masy 
spoczynkowej.  Obowiązuje  dla  niej  tylko  związek 

my  = Er-p-c * 

i stąd  właśnie  wyznaczamy  tę  masę.  Tak  więc  w każ- 
dym pojedynczym  akcie  emisji  masa  jest  określona 
przez  ten  związek,  chociaż  ani  nie  musi  być  ona  np. 
równa  zeru  dla  fotonu,  ani  być  taka  sama  we  wszyst- 
kich aktach  emisji.  W wielokrotnie  powtórzonym  do- 
świadczeniu z emisją  fotonu  energie  i pędy  elektronów 
końcowych  będą  za  każdym  razem  inne  dając  różne 
masy  spoczynkowe  fotonu  wirtualnego. 

Musimy  teraz  uwzględnić  relatywistyczną  nie- 
zraienniczość  teorii.  Wiemy  przecież,  że  wartości  za- 
równo energii  jak  i czasu  (podobnie  pędu  i położenia) 
zależą  od  układu  odniesienia  i musimy  dokonać  wy- 
boru odpowiedniego  układu,  uniwersalnie  dla  wszyst- 
kich przypadków  danej  reakcji.  Najwygodniej  jest 
związać  wybrany  układ  z własnościami  fotonu  wir- 
tualnego. I tak  na  przykład,  w opisanej  reakcji  emisji 
fotonu  mamy  cf  0 i można  wybrać  układ  odnie- 
sienia (tzw.  układ  Breita),  w którym  pt  = p£.  Wtedy 

Ex  = E>>  energia  fotonu  jest  równa  zeru,  a jego  pęd 
wiąże  się  z wartością  masy:  ps  = c ^ —cf-  W rozwa- 
żanej dalej  reakcji  anihilacji  pary  elektron-pozyton 
z wytworzeniem  fotonu  wirtualnego  kwadrat  masy 
fotonu  jest  dodatni,  q2  > 0,  i wygodny  jest  układ  od- 
niesienia (tzw.  układ  środka  masy),  w którym  również 

p[  = —p.Ł.  Kinematyka  jest  tu  jednak  inna  i mamy 
q2  = (l/c4)  • [(£i  + £2)2“(Pi-fi^)2c2]  0,  skąd  £>  = 

= c2  y/ą*  przy  pf  = 0.  W tym  ostatnim  przypadku 
wy  braliśmy  więc  po  prostu  układ  spoczynkowy  fotonu 
wirtualnego  (dla  (f  ^ 0 układ  taki  nie  istnieje)  i w tym 
układzie  nieokreśloność  energii  fotonu  równa  się  nie- 
określoności jego  masy  (AE  — c 2 -Am).  Ponieważ  masa 
fotonu  rzeczywistego  wynosi  zero,  więc  dla  pojedyn- 
czego aktu  emisji  z określoną  wartością  ą2  nieozna- 
czoność masy  równa  się  wartości  samej  masy.  Wtedy 
z zasady  nieokreśloności  wynika 

At  -'ftf  = ^/2c2, 

gdzie  At  jest  czasem  trwania  emisji,  czyli  czasem,  pod- 
czas którego  żaden  przyrząd  pomiarowy  nie  jest  w 
stanie  stwierdzić  pojawienia  się  fotonu  o niefizycznej 
wartości  masy.  Po  upływie  tego  czasu  foton  taki  może 
być  dostrzeżony  i przedtem  musi  być  z powrotem 
pochłonięty.  Zupełnie  podobne  rozważania  można 
przeprowadzić  w przypadku,  gdy  (f  0.  Wtedy  jed- 
nak należy  mówić  o nieoznaczoności  położenia  i pędu 
w układzie  Breita.  Mamy  podobnie  Ap  — c-Am,  a w 
pojedynczym  akcie  emisji  Am  = } f —cf  > Z zasady 
nieokreśloności  pędu  i położenia  mamy  teraz  Ax  • 
= ft/2c,  gdzie  Ax  oznacza  rozmiary  obszaru, 
w którym  zaszła  emisja.  Foton  wirtualny  nie  może  się 
pojawić  w odległości  większej  niż  Jx , gdyż  wtedy 
mógłby  zostać  zaobserwowany.  Wprow-adzając  umo- 
wnie i w tym  wypadku  charakterystyczny  czas  równy 
Axjc  można  stale  posługiwać  się  pojęciem  czasu  od- 
działywania, danego  uniwersalnie  przez  związek  At  = 
^ h\ 2 \ (f  c2.  Wszystko  to  obowiązuje  jedynie  dla 
cząstek  swobodnych,  dla  których  nie  występuje  nie- 
określoność energii  oddziaływania.  Wiemy  jednak, 
że  w teorii  lokalnej  swobodne  są  wszystkie  cząstki, 
w tym  również  wirtualne.  1 tak,  w pojedynczym  akcie 
emisji  wysłany  z elektronu  foton  o kwadracie  masy  q~ , 
nieoznaczo-  wyznaczonym  przez  pomiary  dla  elektronu,  może 
ność  czasu  zostać  zauważony  dopiero  po  czasie 
emisji  h 

fotonu  M ~ ' 


Tyle  właśnie  wynosi  nieoznaczoność  czasu  emisji 
fotonu,  choć  jak  wiemy  czas  ten  jest  tylko  chwilą 
(punktem  czasowym).  Po  upływie  czasu  At  wysłany 
foton  musi  zostać  pochłonięty  przez  inną  bądź  tę 
samą  cząstkę  (rys.  2 i 3).  W pierwszym  wypadku  na- 
stępuje przekazanie  pędu  i energii  drugiej  cząstce, 
czyli  jej  rozproszenie.  I na  tym  polega  przekazywa- 
nie oddziały wań  elektromagnetycznych  przez  fotony. 

Niedost rzężony  przez  czas  At  foton  wirtualny  może 
w tym  czasie  przebyć  drogę  równą  c At.  Ponieważ  dla 
rozpraszania  do  przodu  cf  — > 0,  więc  At  00  i w 
tych  warunkach  droga  przebyta  przez  foton  może  być 
dowolnie  duża.  Dlatego  właśnie  mówimy,  że  od- 
działywania elektromagnetyczne  mają  zasięg  nieskoń- 
czony. Odpowiada  temu  statyczny  potencjał  oddziały- 
wania V ~ 1/r.  Gdyby  cząstka  przenosząca  oddziały- 
wanie nie  miała-zerowej  masy,  m0  * 0 (m0  jest  tu  ma- 
są cząstki  rzeczywistej),  to  dla  cf  -v  0 nieokreśloność 
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Rys.  3.  Absorpcja  foto- 
nu wirtualnego  przez 
ten  sam  elektron 
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Rys.  2.  Rozprasza- 
nie. Foton  wirtual- 
ny został  pochło- 
nięty przez  inny 
elektron 
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masy  nie  dążyłaby  do  zera  ale  do  m0.  Wtedy  At  - 
— > hflłłtyC2  i zasięg  takiego  oddziaływania  wynosiłby 

At  = tit2m0c.  Sytuacja  tego  rodzaju  występuje  przy 
oddziaływaniach  silnych  oraz  słabych  i odpowiada 
jej  statyczny  potencjał  oddziaływania  zwany  poten- 
cjałem Yukawy  V — (1/r)  exp[  (him0c)r]. 

Przejdźmy  teraz  do  obliczenia  prawdopodobień- 
stwa zajścia  niektórych  procesów  elektromagnetycz- 
nych. Musimy  przedtem  ustalić,  w jaki  sposób  bę- 
dziemy opisywali  wyniki  doświadczeń  przeprowa- 
dzanych nad  cząstkami.  Przede  wszystkim  zauważmy, 
że  z zasady  nieokreśloności  energii  i czasu,  a także 
z podobnej  zasady  obowiązującej  dla  pędu  i położenia 
wynika,  że  reakcje  zachodzące  między  cząstkami  ele- 
mentarnymi mogą  być  opisywane  albo  za  pomocą 
położeń  i czasu,  albo  za  pomocą  energii  i pędów  czą- 
stek. Opis  przy  użyciu  obu  tych  zbiorów  zmiennych 
równocześnie  nie  jest  możliwy.  W doświadczeniach 
potrafimy  mierzyć  energie  i pędy  cząstek  z dokład- 
nością sięgającą  jednego  procenta,  podczas  gdy  do- 
kładność bezpośredniego  pomiaru  położenia  1 czasu 
jest  o wiele  rzędów  wielkości  gorsza  niż  rozmiary 
cząstek  i czasy  trwania  procesów  zachodzących 
między  nimi.  Nic  też  dziwnego,  że  przy  opisie  od- 
działywań między  cząstkami  posługujemy  się  poję- 
ciem prawdopodobieństwa  uzyskania  określonych 
wartości  energii  i pędów  cząstek,  nic  nie  mówiąc  o ich 
położeniach.  Podobnie  fale  opisujące  zachowanie  się 
cząstek  będą  zależały  od  pędów  i energii,  podczas 
gdy  ich  własności  czasoprzestrzenne  nie  będą  nas 
interesowały.  Zamiast  pojęcia  przestrzennych  fal 
prawdopodobieństwa  wprowadzimy  ogólniejsze  po- 
jęcie amplitudy  prawdopodobieństwa.  Amplituda  ta 
w wypadku  reakcji  zachodzących  między  cząstkami  amplitudy 
elementarnymi  zależy  od  pędów  i energii  cząstek,  prawdopo- 
Jej  kwadrat  daje  prawdopodobieństwo  uzyskania  dobieństwa 
określonego  wyniku  doświadczenia.  Amplitudami 
prawdopodobieństwa  posługujemy  się  tak,  jak  samym 
prawdopodobieństwem,  tzn.  mnożymy  amplitudy 
odpowiadające  procesom  niezależnym  bądź  warunko- 
wym oraz  dodajemy  amplitudy  odpowiadające  pro- 
cesom nierozróżnialnym  doświadczalnie.  W tym 
ostatnim  przypadku  mamy  właśnie  clo  czynienia  ze 
zjawiskami  interferencji  wszelkiego  rodzaju. 

Obliczymy  amplitudę  prawdopodobieństwa  zwią- 
zaną z opisanym  uprzednio  procesem  rozpraszania 
dwóch  cząstek  naładowanych,  zachodzącym  przez 
wymianę  fotonu  wirtualnego  o kwadracie  masy  rów- 
nym cf  - W rachunkach  pominiemy  spiny  cząstek,  tak 
że  uzyskane  wyniki  nie  będą  ścisłe.  Załóżmy  też,  że 
rozpraszane  cząstki  nie  są  identyczne.  Może  to  być 
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np.  rozpraszanie  mionu  pr  na  elektronie.  W przypad- 
ku cząstek  identycznych,  np.  elektronów,  pojawią  się 
dwa  nierozróżnialne  stany  końcowe,  w których  roz- 
proszone cząstki  mają  zamienione  pędy  i energie. 
Amplitudy  prawdopodobieństwa  zajścia  tych  dwóch 
zdarzeń  należy  dodać,  pojawia  się  interferencja,  która 
nieco  komplikuje  rachunki. 

Amplituda  prawdopodobieństwa  zajścia  procesu 
emisji  fotonu  nie  może  zależeć  bezpośrednio  od  pę- 
dów i energii  cząstek  uczestniczących  w tej  reakcji. 
Wtedy  bowiem  prawdopodobieństwo  emisji  zależa- 
łoby od  układu  odniesienia,  z którego  obserwujemy 
ten  proces.  Amplituda  może  więc  zależeć  jedynie  od 
takich  kombinacji  pędów  i energii  cząstek,  które  nie 
zmieniają  się  przy  zmianie  układu  odniesienia.  Takimi 
kombinacjami  są  masy  spoczynkowe  cząstek  — sta- 
łe— oraz  zmienna  masa  }/ — q2  charakteryzująca 
wysłany  foton  wirtualny.  Amplituda  prawdopodo- 
bieństwa wysłania  fotonu  wirtualnego  jest  więc  funk- 
cją ql  (pominęliśmy  spiny  cząstek).  Jaka  jest  ta  zależ- 
ność? Najprościej  przyjąć,  że  ąmplituda  jest  wprost 
proporcjonalna  do  czasu  trwania  procesu  emisji  At 
(oznacza  to,  że  każda  chwila  wysłania  jest  równie 
ładunek  prawdopodobna),  czyli  odwrotnie  proporcjonalna  do 
elektryczny  |/_^2  stałą  proporcjonalności  nazywamy  ładun- 
kiem elektrycznym  cząstki  wysyłającej.  Taka  definicja 
ładunku  jest  zgodna  z definicją  makroskopową  (po- 
przez prawo  Coulomba).  Tak  więc  elementarna  ampli- 
tuda prawdopodobieństwa  równa  się  ej\/—q2 , gdzie 
ex  jest  ładunkiem  cząstki  wysyłającej.  Podobnie  ampli- 
tuda prawdopodobieństwa  zajścia  procesu  absorpcji 
fotonu  wynosi  ej\/—q2 , gdzie  e2  jest  ładunkiem  cząst- 
ki pochłaniającej.  Wreszcie  amplituda  zajścia  procesu 
absorpcji  pod  warunkiem,. że  uprzednio  wystąpił  pro- 
ces emisji  jest  oczywiście  iloczynem  obu  powyższych 
amplitud: 

(Często  zamiast  zmiennej  q 2 wprowadza  się  zmienną 
/ = q2).  Prawdopodobieństwo  uzyskania  w wyniku 
rozpraszania  takiej  konfiguracji  pędów  i energii  koń- 
cowych, której  odpowiada  określona  wartość  q2,  jest 
dane  przez  kwadrat  tej  amplitudy.  Przekrój  czynny, 
który  jest  miarą  prawdopodobieństwa  rozpraszania, 
przy  odpowiednich  jednostkach  ładunku  wynosi 
da  (4 n)2e2ej  _1_ 

dq2  (ftc)2  q 4 ‘ 

We  wzorze  tym  nie  uwzględniono  normalizacji  prze- 
kroju czynnego  (prawdopodobieństwo  na  jednostkę 
strumienia)  i stąd  znak  proporcjonalności.  Uwzględ- 
nienie spinów  cząstek  komplikuje  znacznie  rachunki, 
gdyż  amplitudy  prawdopodobieństwa  mogą  być  także 
funkcją  takich  iloczynów  pędów  i spinów,  które  nie 
zależą  od  układu  odniesienia.  Jeżeli  jednak  badamy 
rozpraszanie  cząstek  nie  identycznych  i nie  interesu- 
jemy się  stanami  polaryzacji  (ustawienia  spinu)  czą- 
stek, to  powyższy  wzór  poprawnie  opisuje  wyniki  do- 
świadczalne. 

Zupełnie  podobnie  można  obliczyć  przekroje  czynne 
innych  procesów  elektromagnetycznych  związanych 
z wysyłaniem  lub  pochłanianiem  fotonów.  Nie  bę- 
dziemy przedstawiać  wyników  tych  obliczeń,  musimy 
jednak  zwrócić  uwagę  na  podstawową  własność 
amplitud  prawdopodobieństwa,  a mianowicie  na  ich 
uniwersalność. 

uniwersał-  Uniwersalność  amplitud  prawdopodobieństwa  po- 
rt ość  lega  na  tym,  że  jedna  amplituda  opisuje  wiele  proce- 
amplitud  sów.  Korzystaliśmy  już  z tej  własności,  przyjmując  że 
prawdopo-  amplitudy  wysłania  i pochłonięcia  fotonu  wirtualne- 
dobieństwa  go  są  dane  tym  samym  wzorem.  W tym  wypadku  było 
to  dosyć  oczywiste,  gdyż  procesy  wysyłania  i pochła- 
niania fotonu  różnią  się  formalnie  jedynie  kierunkiem 
biegu  czasu,  który  nie  występuje  w przyjętym  przez  nas 
opisie  rozpraszania  poprzez  pędy  i energie  cząstek. 
Pochłaniany  lub  wysyłany  foton  nie  niesie  żadnych 
wielkości  (liczb  kwantowych),  które  podlegają  pra- 


wom zachowania,  z wyjątkiem  pędu  i energii.  Foton 
ma  zerowe  wartości  ładunku  elektrycznego,  leptono- 
wego  oraz  barionowego,  nie  zmienia  więc  tych  ładun- 
ków u cząstek,  z którymi  oddziałuje.  Zmienia  tylko 
pęd  i energię;  a także  spin,  ale  ten  nie  wnosi  tu  nic 
istotnego.  Mówimy,  że  foton  jest  identyczny  ze  swoją 
antycząstką,  co  z definicji  znaczy,  że  ma  zerowe  war- 
tości wszystkich  zachowywanych  liczb  kwantowych 
typu  ładunkowego.  Dlatego  właśnie  procesy  pochła- 
niania i wysyłania  fotonu  są  opisywane  tą  samą  ampli- 
tudą. Wprawdzie  pęd  i energia  fotonu  w pierwszym 
wypadku  dodają  się,  a w drugim  — odejmują  od  pędu 
i energii  elektronu  padającego,  ale  amplituda  zależy 
jedynie  od  q2  = (l/ć*)  [E}—p}c2 1.  Znaki  Ef  oraz pf  nie 
mają  więc  znaczenia.  Zupełnie  inaczej  jest  w wypadku 
emisji  i absorpcji  cząstek,  które  mają  niezerową 
wartość  przynajmniej  jednej  spośród  zmiennych 
ładunkowych.  Wysłanie  na  przykład  elektronu  z pew- 
nego układu,  to  zwiększenie  ładunku  elektrycznego 
tego  układu  o jeden.  Pochłonięciu  elektronu  odpowia- 
da natomiast  zmniejszenie  ładunku  o jeden.  Podobnie 
jest  z innym  rodzajem  ładunków,  np.  ładunkiem  lep- 
tonowym  elektronu. 

Gdyby  jednak  istniała  cząstka,  która  miała  by  prze- 
ciwny niż  elektron  znak  ładunku  elektrycznego  oraz 
leptonowego,  a poza  tym  niczym  nie  różniła  się  od 
elektronu,  to  emisja  jej  mogłaby  być  bardzo  podobna 
do  absorpcji  elektronu.  Taką  cząstką  jest  pozyton, 
antycząstka  elektronu. 

Zwróciliśmy  poprzednio  uwagę  na  fakt,  że  amplitu- 
da prawdopodobieństwa  wysłania  (pochłonięcia)  fo- 
tonu wirtualnego  może  zależeć  jedynie  od  mas  czą- 
stek (spiny  stale  pomijamy)  — stałych  mas  spoczynko- 
wych elektronów  rzeczywistych  i zmiennej  masy  foto- 
nu wirtualnego.  Stałą  proporcjonalności  we  wzorze  na 
amplitudę  jest  ładunek  elektryczny.  Jest  więc  zupełnie 
oczywiste,  że  amplituda  prawdopodobieństwa  wysła- 
nia fotonu  wirtualnego  z pozytonu,  cząstki  o tej  samej 
masie  co  elektron,  ale  przeciwnym  ładunku,  różni  się 
od  odpowiedniej  amplitudy  dla  elektronu  jedynie 
pewnym  czynnikiem  fazowym  (np.  znakiem). 

Ta  równość  amplitud  reakcji  z udziałem  cząstek 
i antycząstek  nosi  nazwę  niezmienniczości  ze  względu 
na  operację  sprzężenia  ładunkowego.  Dodajmy  tu 
jeszcze,  że  oddziaływania  elektromagnetyczne  są  rów- 
nież niezmiennicze  ze  względu  na  operacje  inwersji 
przestrzennej  i zmiany  kierunku  czasu.  Te  dwie  ostat- 
nie ich  własności  znane  są  już  z fizyki  klasycznej. 

Zauważmy,  że  proces  wysłania  fotonu  z elektronu 
można  rozumieć  w następujący  sposób:  w pewnym 
punkcie  przestrzeni  oraz  w pewnej  chwili  następuje 
pochłonięcie  padającego  elektronu  i wysłanie  elektro- 
nu wraz  z fotonem.  Wtedy  podobny  proces  z udziałem 
pozytonu  powstaje  przez  zamianę  pochłanianego 
elektronu  na  wysyłany  pozyton,  a wysyłanego  elektro- 
nu na  pochłaniany  pozyton.  Odpowiednie  amplitudy 
różnią  się  jedynie  znakiem.  A co  będzie,  jeżeli  tylko 
jeden  z elektronów  zamienimy  na  pozyton  (rys.  4,  5)? 
Powstaną  wtedy  zupełnie  inne  reakcje  — kreacja  pary 
elektron-pozyton  przez  foton  wirtualny  oraz  anihila- 
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Rys.  5.  Kreacja  pa- 
ry elektron-pozyton 
przez  foton  wirtual- 
ny 


Rys.  4.  Anihilacja  pary 
elektron-pozyton  na  fo- 
ton wirtualny 


cja  pary  na  foton.  Ponieważ  założyliśmy  raz  na  za 
wsze,  że  amplituda  prawdopodobieństwa  jest  propor- 
cjonalna do  nieokreśloności  czasu  zajścia  oddziały- 
wania, a przez  stałą  proporcjonalności  zdefiniowaliś- 
my ładunek  elektryczny,  więc  nic  dziwnego,  że  te  no- 
we procesy  są  opisywane  znów  przez  amplitudę 
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e/]/—q2  z odpowiednią,  określoną  przez  prawa  za- 
chowania wartością  qK  Tak  więc  jedna  amplituda 
opisuje  wszystkie  omówione  poprzednio  procesy 
z udziałem  fotonu  wirtualnego. 

Spróbujmy  odwrócić  tok  powyższego  rozumowania. 
Pokazaliśmy,  że  amplituda  prawdopodobieństwa  po- 
chłonięcia fotonu  przez  elektron  przechodzi  w ampli- 
tudę kreacji  pary  elektron-pozyton  przez  foton,  jeżeli 
pęd  i energia  padającego  elektronu  zmienią  znaki  (po- 
przednio pęd  i energia  fotonu  były  różnicami  pędów 
i energii  leptonów,  teraz  są  ich  sumą)  i staną  się  od- 
powiednimi wielkościami  wysyłanego  pozytonu  (o 
przeciwnym  znaku  ładunku).  Korzystaliśmy  przy  tym 
z faktu  istnienia  pozytonu.  Nie  jest  to  jednak  zało- 
żenie konieczne,  bowiem  fakt  ten  wynika  już  z sa- 
mych zasad  przedstawianej  teorii.  Amplituda  praw- 
dopodobieństwa absorpcji  fotonu,  ety  —q2,  nie  zni- 
ka przecież,  jeżeli  pęd  i energia  elektronu  zmienią 
znak.  Tyle  tylko,  że  teraz  q 2 dane  jest  innym  niż  po- 
przednio wyrażeniem 

q2  = dr[(Ą+Ą)*-(ft+A)‘C*I  > 0. 
c * 

Poprzednio  q 2 < 0.  Funkcja  e/]/—q2  nie  znika  ani 
dla  dodatnich,  ani  ujemnych  wartości  q2.  Nie  znika 
więc  amplituda,  a z nią  i prawdopodobieństwo  zajścia 
odpowiednich  reakcji.  Jeżeli  prawdopodobieństwo 
zajścia  procesu  kreacji  pary  z fotonu  nie  znika,  to 
znaczy,  że  pary  takie  muszą  być  czasem  produkowa- 
ne. A zatem  musi  istnieć  antycząstka  elektronu 
o takiej  samej  co  elektron  masie,  lecz  o ładunku  elek- 
trycznym przeciwnego  znaku.  Jest  to  prawo  obowią- 
zujące ogólnie  w świecie  cząstek  elementarnych. 
Wszystkie  one  muszą  mieć  i rzeczywiście  mają  anty- 
cząstki  o takich  samych  masach  (i  spinach),  ale  prze- 
ciwnego znaku  ładunkach  wszystkich  rodzajów.  Nie- 
które cząstki,  jak  np.  foton,  czy  też  mezon  są 
tożsame  ze  swymi  antycząstkami. 
diagramy  Przedstawione  poprzednio  rysunki  obrazujące  wy- 
Feynmana  syłanie  i pochłanianie  fotonów  wirtualnych  przez  elek- 
trony i pozytony  (bądź  jakiekolwiek  inne  cząstki  na- 
ładowane) oraz  anihilację  i kreację  par  zwane  są  dia- 
gramami (grafami)  Feynmana.  Są  to  elementarne 
diagramy  Feynmana  opisywane  przez  tę  samą  ampli- 
tudę prawdopodobieństwa.  Jednak  w tych  elementar- 
nych procesach  nie  tylko  foton  może  być  wirtualny. 
Wiemy  przecież,  że  fotony,  podobnie  jak  i fale  elek- 
tromagnetyczne mogą  rozchodzić  się  swobodnie  na 
ogromne  odległości  i wtedy  ich  czas  życia  jest  nie- 
skończony, a masa  określona  i równa  zeru.  Jeżeli 
w elementarnym  procesie  produkcji  foton  jest  rzeczy- 
wisty, to  wirtualny  musi  być  jeden  z elektronów  lub 
pozytonów.  Wymagają  tego  prawa  zachowania 
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dukcji  wraz  ze  wszystkimi  jego  odmianami  jest  jedyną 
cegiełką,  z której  zbudowana  jest  elektrodynamika. 
Jest  wielkim  sukcesem  fizyki,  że  teoria  oparta  na  tak 
prostych  zasadach  bezbłędnie  opisuje  wszystkie  bez 
wyjątku  doświadczenia. 

Chcielibyśmy  zwrócić  jeszcze  uwagę  na  pewną  waż- 
ną cechę  cząstek  elementarnych.  Mają  one  miano- 
wicie jedynie  całkowite  wartości  wszystkich  swych 
ładunków.  Jeśli  chodzi  o interesujące  nas  tu  ładunki 
elektryczne,  to  okazuje  się,  że  wszystkie  znane  cząstki 
pozbawione  struktury  wewnętrznej  mają  ładunki  ± 1 
albo  0 (w  jednostkach  ładunku  elektronu).  Leptony 
(e~,  jlT)  mają  ładunki  — 1,  antyleptony  +1,  a neutrina 
i foton  są  elektrycznie  obojętne.  Obdarzone  strukturą 
hadrony  mogą  mieć  ładunki  większe,  ale  zawsze  cał- 
kowite. Dopiero  ich  nieobserwowane  jako  cząstki 
swobodne  składniki  — kwarki  — mają  ładunki  wy- 
noszące V*  bądź  2/3  ładunku  elementarnego.  Zarówno 
owo  skwantowanie  ładunków  elektrycznych  u cząstek 
obserwowanych  doświadczalnie,  jak  i określone  od- 
stępstwo od  niego  dla  uwięzionych  w hadronach 
kwarków  nie  zostały  dotychczas  wyjaśnione  przez 
teorię. 

W związku  z tą  ciekawą  własnością  cząstek  wygod- 
ną miarą  prawdopodobieństwa  wysłania  fotonu  z ja- 
kiejkolwiek cząstki  jest  kwadrat  ładunku  elementarne- 
go. Wprowadza  się  więc  nową  bezwymiarową  stałą 
uniwersalną, 

aei  = e*l4ne*hc  « Vw, 

zwaną  stałą  struktury  subtelnej  albo  stałą  sprzężenia 
oddziaływań  elektromagnetycznych.  Poza  zależnością 
od  q2  prawdopodobieństwo  emisji  jest  zawsze  dane 
przez  aei  razy  jeden  bądź  zero  (7#  lub  4/«  dla  kw  ar- 
ków). Zwróćmy  uwagę  na  stosunkowo  niewielką 
wartość  elektromagnetycznej  stałej  sprzężenia,  «ei  ~ 
~ Vi37  1*  Jest  to  bardzo  ważna  własność.  Dzięki 
temu  bowiem  mówiąc  o rozproszaniu  leptonów  mo- 
gliśmy ograniczyć  się  do  procesów  z wymianą  tylko 
jednego  fotonu  wirtualnego.  Prawdopodobieństwo 


elektron 

wirtualny 


ładunki 
cząstek  ele- 
mentarnych 


Rys.  6.  Emisja  fotonu 
rzeczywistego  z elektro- 
nu. Elektron  końcowy 
nie  może  mieć  masy 
równej  masie  elektronu 
rzeczywistego 


stała 

struktury 

subtelnej 


Rys.  7.  Wymiana  dwóch 
fotonów  wirtualnych 
przy  rozpraszaniu  elek- 
tronów jest  mało  istotna 
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energii  i pędu.  Tak  więc  możliwe  są  procesy,  w których 
np.  padający  elektron  wysyła  rzeczywisty  foton  prze- 
chodząc w elektron  wirtualny  o masie  określonej  przez 
prawa  zachowania  (rys.  6).  Amplituda  tego  procesu 
jest  inna,  gdyż  nieokreśloność  masy  wynosi  teraz  nie 
\Z-q2\ ale  \/ —q2+ml , gdzie  m0  jest  masą  spoczynko- 
wą elektronu  rzeczywistego.  W związku  z tym 
At  ~ 1/|/ — q2+ml,  ale,  wciąż  pomijając  spin,  jest  to 
jedyna  zmiana,  gdyż  stała  proporcjonalności  (ładu- 
nek) jest  znów  ta  sama,  co  poprzednio.  Moglibyśmy 
też  rozważać  procesy,  w których  nie  jedna,  ale  dwie 
albo  nawet  wszystkie  trzy  cząstki  są  wirtualne.  Ra- 
chunki nieco  się  wtedy  komplikują,  ale  zasada  pozo- 
staje ta  sama.  Tak  więc  elementarny  diagram  pro- 


wysłania  (i  następnie  pochłonięcia)  dwóch,  trzech 
i więcej  fotonów  nie  jest  równe  zeru  (rys.  7).  Jednak 
wymiana  każdego  fotonu  wiąże  się  zawsze  z pojawie- 
niem się  w amplitudzie  prawdopodobieństwa  czynnika 
otei  « V i37*  Wszystkie  procesy  wyższych  rzędów  są 
więc  bardzo  mało  prawdopodobne  i mogą  być  pomi- 
nięte. W dokładnych  rachunkach,  służących  do  opisu 
bardzo  precyzyjnych  pomiarów,  trzeba  oczywiście 
uwzględnić  również  te  nieznaczne  wkłady.  Jednak 
zawsze  wystarczy  ograniczyć  się  do  niewielkiej  stosun- 
kowo liczby  procesów  wielofotonowych.  Tak  więc 
jedynie  dzięki  małej  wartości  stałej  sprzężenia  możemy 
wykonywać  efektywne  obliczenia  dla  reakcji  pocho- 
dzenia elektromagnetycznego.  Zupełnie  inaczej  wy- 
gląda sprawa  z oddziaływaniami  silnymi,  których 
stała  sprzężenia  jest  duża,  ocsn  ~ 10.  Powoduję  to,  że 
kolejne  wyższe  rzędy  oddziaływania  są  coraz  większe 
i opis  teoretyczny  bardzo  się  komplikuje.  Dopiero 
oddziaływania  składników  hadronów  — kwarków  — 
mogą  być  w pewnych  warunkach  niezbyt  silne.  Nie  są 
też  oczywiście  silne  oddziaływania  elektromagnetycz- 
ne zarówno  hadronów,  jak  i kwarków. 

Opiszemy  teraz  krótko  różnego  rodzaju  reakcje 
pochodzenia  elektromagnetycznego.  Każdą  z nich 
będziemy  ilustrować  odpowiednim  diagramem  Feyn- 
mana, ograniczając  się  zawsze  do  diagramów  najniż- 
szego rzędu.  Zaczniemy  od  przedstawienia  oddziały- 
wań elektromagnetycznych  leptonów  — cząstek  bez 
struktury  wewnętrznej. 
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pozytonium 


Rozpraszanie  kulombowskie.  Stany  związane 


przekrój 
czynny  na 
rozpraszanie 
kulumbow- 
skie 
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Reakcję  tę  omawialiśmy  szczegółowo  poprzednio. 
Rozpraszać  się  mogą  różne  leptony  obdarzone  ładun- 
kiem. Ponieważ  ładunki  elektryczne  wszystkich  lep- 
tonów różnią  się  jedynie  znakiem,  więc  wszystkie  prze- 
kroje czynne  są  proporcjonalne  do  tej  samej  stałej 
a2e i.  Różnice  pojawiają  się  jedynie  w wypadku  dwóch 
cząstek  identycznych:  interferencja  dwóch  procesów 
prowadzących  do  nierozróżnialnych  sytuacji  jest 
wtedy  powodem  znikania  prawdopodobieństwa  zajś- 
cia rozpraszania  pod  kątem  n/2  (w  układzie  środka 
masy).  Pomijając  ten  wypadek  i pomijając  spiny  czą- 
stek dostajemy  zależność: 
da 
dqz 

Widzimy,  że  przy  rozpraszaniu  nie  ma  znaczenia,  czy 
rozpraszane  cząstki  mają  ładunki  jedno-  czy  różno- 
imienne.  Nie  ma  więc  znaczenia,  czy  przyciągają  się 
czy  też  odpychają  wzajemnie.  Sytuacja  ta  niczym  istot- 
nym nie  różni  się  od  rozpraszania  makroskopowych 
cząstek  klasycznych.  Klasyczna  cząstka  rozpraszana 
na  centrum  potencjału  kulombowskiego  porusza  się 
po  hiperboli  zagiętej  w kierunku  centrum  dla  poten- 
cjału przyciągającego  i odginającej  się  od  centrum  dla 
potencjału  odpychającego.  Wiązka  cząstek  przelatu- 
jących w różnych  odległościach  od  centrum  odchylana 
jest  po  różnych  hiperbolach,  co  daje  pewne  prawdo- 
podobieństwo (przekrój  czynny)  uzyskania  rozpra- 
szania pod  pewnym  kątem.  Rozkład  kierunków  nie 
będzie  oczywiście  zależał  od  tego,  czy  kierunki  te  po- 
chodzą z hiperbol  zagiętych  w jedną,  czy  też  w drugą 
stronę.  Warto  przy  okazji  zwrócić  uwagę  na  fakt,  że 
w przybliżeniu  nierelatywistycznym  (potencjalnym) 
klasyczny  wzór  na  przekrój  czynny  jest  identyczny 
z wzorem  kwantowym.  Dlatego  tylko  Rutherford 
mógł  wyciągnąć  ze  swych  doświadczeń  poprawne 
wnioski  o budowie  atomu,  choć  przecież  nie  znał  zu- 
pełnie mechaniki  kwantowej. 

Tak  więc  znaki  ładunków  elektrycznych  nie  mają 
wpływu  na  procesy  rozpraszania  cząstek,  decydują 
jedynie  o ewentualnym  pojawianiu  się  stanów  zwią- 
zanych cząstek.  W ujęciu  klasycznym  odpowiada  to 
pojawianiu  się  zamkniętych  eliptycznych  lub  kołowych 
orbit  w przypadku  potencjału  przyciągającego.  Nato- 
miast w ujęciu  kwantowym  zjawisko  to  jest  związane 
z pojawianiem  się  procesów  wymiany  wielu  fotonów 


Rys.  8.  Wymiana  dowolnej  liczby  fotonów  wirtualnych  nie  może 
być  pominięta  dla  stanu  związanego  elektronu  z pozytonem 


(rys.  8).  W reakcjach  rozpraszania  procesy  te  są  nie- 
istotne ze  względu  na  małą  wartość  stałej  sprzężenia, 
«ei  ~ Vi37-  Argument  ten  jest  jednak  oparty  na  za- 
łożeniu, że  czas  oddziaływania  jest  skończony.  W przy- 
padku rozpraszania  jest  to  prawda  — po  krótkim 
czasie  cząstki  rozlatują  się  swobodnie.  W zlokalizo- 
wanych przestrzennie  niewielkich  układach  związa- 
nych cząstek  czas  oddziaływania  jest  nieskończony, 
stany  Cząstki  stale  pozostają  w pobliżu  siebie  i bez  względu 
związane  na  Wartość  stałej  sprzężenia  prawdopodobieństwo 
cząstek  Wymjany  dowolnej  liczby  fotonów  jest  równe  jed- 
ności. Wtedy  wszystkie  przedstawione  na  rysunku 
diagramy  Feynmana  są  równie  ważne  i decyduje  ich 
suma.  Z formalnego  punktu  widzenia  szereg  perturba- 
cyjny nie  jest  więc  zbieżny  dla  stanu  związanego. 
Szereg  ten  w wypadku  dwóch  cząstek  o przeciwnych 
ładunkach  zawiera  wyrazy  o innej  sekwencji  znaków 
niż  dla  cząstek  o ładunkach  jednakowych.  Tylko 
w jednej  z tych  sytuacji  szereg  jest  rozbieżny  przy  pe- 
wnej wartości  energii  pary  cząstek  równej,  oczywiście, 

148 


masie  stanu  związanego.  Widać  więc  wyraźną  różnicę, 
chociaż  ścisły  dowód  na  to,  że  tylko  w jednym  z tych 
wypadków  otrzymujemy  trwały  stan  związany,  nie  jest 
prosty.  Warto  zwrócić  uwagę  na  fakt,  że  problem  sta- 
nów związanych  w elektrodynamice  kwantowej  nie 
został  jeszcze  w pełni  rozwiązany.  Nie  umiemy  bow  iem 
radzić  sobie  z problemami,  przy  których  rachunek 
zaburzeń  nie  jest  zbieżny. 

Prócz  atomu  wodoru  i innych  atomów  znane  są 
również  stany  związane  bardziej  egzotyczne:  pozy- 
tonium — stan  związany  elektronu  i pozytonu  oraz 
atomy  egzotyczne  (-*  Atomy  egzotyczne)  — stany 
związane  jlT  proton,  tT  proton,  K~  proton,  antypro- 
ton  proton  itp.  Te  ostatnie  nie  są  stanami  absolutnie 
trwałymi,  gdyż  nietrwałe  są  ich  składniki,  chociaż  ich 
czas  życia  jest  stosunkowo  długi  w porównaniu  z cza- 
sem charakterystycznym  dla  oddziaływań  elektromag- 
netycznych. Jeśli  chodzi  o pozytonium,  to  zdarza  się, 
jak  się  dalej  przekonamy,  że  elektron' i pozyton  ulega- 
ją anihilacji  na  dwa  lub  trzy  fotony  rzeczywiste.  Z tego 
powodu  pozytonium  też  nie  jest  absolutnie  trwałe, 
choć  żyje  stosunkowo  długo. 


Anihilacja  wraz  z kreacją  pary 

Diagram  Feynmana  takiego  właśnie  procesu  został 
przedstawiony  na  rysunku  9.  Jeśli  para  anihilująca 
i para  kreowana  są  takie  same  (np.  e+e~  ->  e+e~)y  to 
ten  sam  stan  końcowy  może  być  również  uzyskany 


Rys.  9.  Anihilacja  pary 
elektron-pozyton  wraz 
z następującą  po  niej 
kreacją  pary  mionów 


czas 


w wyniku  opisanego  poprzednio  procesu  rozpraszania 
cząstki  na  antycząstce.  Odpowiednie  amplitudy  trzeba 
wtedy  dodać  i dopiero  potem  obliczyć  prawdopodo- 
bieństwo przez  podniesienie  sumy  amplitud  do  kwa- 
dratu. Jeżeli  obie  pary  są  różne  (np.  e+e~  -*  /w+/T),  to 
rozpraszania  być  nie  może  i opis  jest  szczególnie 
prosty.  Jak  już  wiemy,  odpowiedni  przekrój  czynny 
jest  dany  przez  to  samo  wyrażenie,  co  dla  procesu 
rozpraszania  z cząstkami  zamienionymi  na  anty- 
cząstki  (w  tym  przypadku  e~/u~  ->  e~fx~): 


da 

W 


q 2 > 0. 


tyczne 


atomy 

egzotyczne 


przekrój 
czynny  na 
anihilację 
z kreacją 
pary 


Porównanie  tego  wyrażenia  z danymi  doświadczal- 
nymi przedstawiono  na  rys.  10.  Widać,  że  zgodność 
jest  doskonała. 


Rozpraszanie  Comptona 


Rozpraszanie  Comptona  polega  na  rozpraszaniu  fo- 
tonów na  cząstkach  naładowanych.  Odpowiednie  dia- 
gramy podano  na  rys.  11.  Zwr'ćmy  uwagę,  że  teraz 


Rys.  11.  Diagramy  Feynmana  opisujące  elastyczne  rozpraszanie 
fotonu  na  elektronie 


nie  foton,  a elektron  jest  wirtualny.  Poza  tym  akty 
wysyłania  i pochłaniania  fotonu  zachodzą  w czasie, 
którego  nieokreśloność  jest  równa  czasowi  trwania 
reakcji.  Nie  możemy  więc  stwierdzić,-  który  z tych 
procesów  zachodzi  wcześniej  i musimy  dodać  do  siebie 
obie  amplitudy  odpowiadające  diagramom  na  rysun- 
ku. Nie  będziemy  podawać  wzoru  na  przekrój  czynny, 
zwróćmy  tylko  uwagę,  że  jest  on  znów  rzędu  a*,. 
W wyniku  rozpraszania  foton  zmienia  pęd  i energię, 
a stąd  i długość  fali  ( p = h/X)y  co  nazwano  zjawiskiem 
Comptona.  Kinematyka  tego  zjawiska  jest  przedsta- 
wiona w każdym  podręczniku  elementarnym.  Obli- 
czenie jednak  przekroju  czynnego,  czyli  rozkładu  ką- 
tów fotonów  rozproszonych,  wymaga  posłużenia  się 
aparatem  elektrodynamiki  kwantowej.  Fotony  mogą 
rozpraszać  się  nie  tylko  na  leptonach,  ale  również  na 
hadronach,  np.  jądrach  atomowych. 


Anihiiacja  par  na  fotony  rzeczywiste 


He 


Rys.  12.  Anihiiacja 
pary  elektron-pozy- 
ton na  dwa  fotony 
rzeczywiste 


W przeciwieństwie  do  odpowiedniego  procesu  z udzia- 
łem pojedynczego  fotonu,  anihiiacja  pary  na  dwa 
i więcej  fotonów  może  zachodzić  także  dla  cząstek 
rzeczywistych.  Proces  taki  jest  obserwowany  do- 
świadczalnie. Odpowiedni  diagram  został  przedsta- 
wiony na  rys.  12.  Widzimy,  że  powstał  on  z diagramu 
rozpraszania  komptonowskiego  przez  zamianę  roz- 
proszonego elektronu  na  padający  pozyton  oraz  fo- 
tonu padającego  na  wysłany.  Obie  reakcje  są  więc 


Rys.  13.  Anihiiacja  pary 
elektron-pozyton  na  trzy 
fotony  rzeczywiste 


opisywane  przez  tę  samą  amplitudę,  a przekrój  czynny 
jest  znów  rzędu  a*r  Anihilować  mogą  nie  tylko  pary 
lepton-antylepton  ale  wszelkie  pary  cząstka-anty- 
cząstka.  Na  przykład  para  proton-antyproton  może 
anihilować  na  fotony,  jednak  w tym  przypadku  wy- 
stępuje też  bardziej  prawdopodobny  silny  proces  anihi- 
lacji  na  mezony  n.  Prócz  anihilacji  na  parę  fotonów 
obserwuje  się  też  anihilację  trójfotonową  (rys.  13). 
Przekrój  czynny  w tym  przypadku  jest  proporcjonalny 
do  a^j  i prawdopodobieństwo  zajścia  reakcji  jest  ok. 
sto  razy  mniejsze. 


Kreacja  par  w polu  kulombowskim 


W pewnych  warunkach  może  zachodzić  również  pro- 
ces kreacji  rzeczywistej  pary  elektron-pozyton  przez 


rzeczywisty,  pojedynczy  foton.  Reakcja  taka  zdarza  się 
w kulombowskim  polu  innej  cząstki  naładowanej, 
która  pełni  rolę  odbiorcy  nieskompensowanego 


Rys.  14.  Kreacja  pa- 
ry elektron-pozyton 
przez  foton  rzeczywi- 
sty zachodząca  po- 
przez dodatkowe  od- 
działywanie kulom- 
bowskie  z inną  czą- 
stką, którą  może  być 
atomowe  jądro 

w procesie  kreacji  pędu.  Z rys.  14  widzimy,  że  zarówno 
wewnętrzny  lepton,  jak  i foton  są  teraz  cząstkami 
wirtualnymi.  Proces  zawiera  trzy  elementarne  akty 
emisji  i jego  przekrój  czynny  jest  proporcjonalny  do 
alv  Kreacja  par  jest  szczególnie  istotna  w polu  kulom- 
bowskim  jąder  atomowych.  Wtedy  prawdopodobień- 
stwo zajścia  procesu  wzrasta  Zr  razy,  gdzie  Z jest 
ładunkiem  jądra.  Fotony  przechodzące  przez  materię 
dosyć  więc  często  kreują  pary.  I całe  szczęście  że 
często,  pojawienie  się  bowiem  pary  elektron-pozyton 
jest  jedynym  doświadczalnym  sygnałem  obecności 
fotonu.  Wszystkie  stosowane  metody  detekcji  foto- 
nów oparte  są  na  tym  zjawisku. 


Promieniowanie  hamowania 

Proces  ten  zachodzi  również  jedynie  w polu  kulom- 
bowskim  innej  cząstki.  Promieniowanie  hamowania 
polega  na  tym,  że  ruch  elektronu  zostaje  zwolniony 
w polu  np.  jądra  atomowego  w wyniku  czego  następu- 
je emisja  fotonu.  Z diagramów  przedstawionych  na 
rys.  15  wynika,  że  proces  ten  powstaje  z procesu 
kreacji  pary  (rys.  14)  przez  odpowiednią  zamianę 


Rys.  15.  Promieniowanie  hamowania.  Foton  rzeczywisty  jest  wy- 
syłany przez  elektron  poprzez  dodatkowe  oddziaływanie  kulom- 
bowskie  z inną  cząstką,  którą  może  być  jądro  atomowe 


cząstek.  Przekrój  czynny  jest  znów  rzędu  Z*o%v  Oka- 
zuje się  przy  tym,  że  fotony  promieniowane  są  przede 
wszystkim  wewnątrz  niewielkich  stożków  dokoła 
kierunków  lotu  elektronu  padającego  i rozproszone- 
go. Zauważmy,  że  część  amplitudy  prawdopodobień- 
stwa związana  z wymianą  elektronu  wirtualnego  jest 
proporcjonalna  do  [— <?2+Wo]“l  i staje  się  bardzo 
duża,  gdy  q 2 m\,  czyli  gdy  elektron  wirtualny  ma 

masę  niewiele  różną  od  masy  elektronu  rzeczywistego. 
Sytuacja  taka  występuje  wtedy,  gdy  foton  wynosi  nie- 
wiele pędu  i energii.  W procesie  promieniowania 
hamowania  wysyłane  są  więc  przede  wszystkim  fotony 
niskoenergetyczne,  tzw.  miękkie.  Często  też  trudno 
je  wykryć  doświadczalnie.  Klasycznym  odpowiedni- 
kiem promieniowania  hamowania  jest  promieniowa- 
nie elektromagnetyczne  wysyłane  przez  ładunki  elek- 
tryczne zmieniające  swą  prędkość  ruchu.  Tak  pro- 
mieniują przewodniki  z prądem  zmiennym,  których 
przykładem  jest  nadawcza  antena  radiowa. 

Opisane  procesy  elektromagnetyczne  należą  do 
najważniejszych.  Prócz  nich  występują  jeszcze  znacz- 
nie mniej  prawdopodobne  reakcje  z udziałem  większej 
liczby  cząstek.  Należą  tu : promieniowanie  hamowania 
wielu  fotonów,  produkcja  dodatkowych  fotonów  przy 
rozpraszaniu  Comptona,  produkcja  pary  elektron- 
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pozyton  z wy  promieniowanego  wirtualnego  fotonu 
hamowania  i wiele  innych.  W reakcjach  tych  nie  wy- 
stępują jednak  żadne  inne  jakościowo  zjawiska. 

Przejdziemy  teraz  do  opisu  oddziaływań  elektro- 
magnetycznych hadronów.  O niektórych  procesach 
tego  typu  mówiliśmy  już  przy  dyskusji  pewnych 
reakcji  z udziałem  leptonów.  Teraz  skoncentrujemy 
się  na  zagadnieniach  najważniejszych,  na  reakcjach 
będących  podstawowym  źródłem  wiedzy  o strukturze 
hadronów.  Zwróćmy  przedtem  uwagę  na  dwa  ważne 
fakty.  Po  pierwsze  hadrony  oddziałują  przede  wszyst- 
kim silnie  i oddziaływania  elektromagnetyczne  między 
nimi  są  przeważnie  zupełnie  nieistotne.  Dlatego  przy 
badaniu  oddziaływań  elektromagnetycznych  hadro- 
nów musimy  posłużyć  się  elektronem.  Elektron  nie 
bierze  udziału  w oddziaływaniach  silnych  i jego  roz- 
praszanie np.  na  protonie  może  zajść  jedynie  poprzez 
wymianę  fotonu  wirtualnego  (pomijamy  oddziały- 
wania słabe  elektronu).  Foton  ten  jest  pochłaniany 
przez  bogatą  strukturę  protonu  i występowanie  tej 
struktury  to  drugi  istotny  dla  hadronów  fakt.  Przed- 
stawiona poprzednio  teoria  była  sformułowana  jedy- 
nie dla  cząstek  pozbawionych  struktury.  Jak  zoba- 
czymy dalej  teoria  ta  okaże  się  płodna  również  dla 
hadronów  obdarzonych  strukturą.  Okazuje  się  bo- 
wiem, że  hadrony  są  zbudowane  z bardziej  elementar- 
nych składników,  kwarków,  które  już  nie  mają  struk- 
tury wewnętrznej.  Przejdźmy  więc  do  opisu  tych  do- 
świadczeń z udziałem  elektronów  i hadronów,  których 
wyniki  były  decydujące  dla  podtrzymania  hipotezy 
o istnieniu  kwarków. 


Rozpraszanie  elastyczne  elektronów 
na  hadronach 


Rozpraszanie  to  jest  podobne  do  rozpraszania  ku- 
lombowskiego  elektronów  ha  mionach  Tym  jed- 
nak razem  cząstki  rozpraszające  mają  wyraźną  struk- 
turę wewnętrzną.  Ładunek  elektryczny  wewnątrz 
hadronów  jest  rozłożony  w pewnym  obszarze  o roz- 
miarach rzędu  10" 15  m.  W związku  z tym  wyprowa- 
dzony poprzednio  wzór  na  przekrój  czynny  musi  zo- 
stać zmodyfikowany  o pewną  dodatkową  zależność 


od  q 2: 


da 


a|i  F^{q2) 


gdzie  funkcja  F(q 2)  jest  tzw.  elastycznym  czynnikiem 
postaci  hadronu.  Jej  obecność  oznacza,  że  przy  roz- 
praszaniu efektywny  ładunek  hadronu  wynosi 
±eF(q2)  i przez  taki  właśnie  ładunek  jest  pochłaniany 
foton  wirtualny  o kwadracie  masy  q2.  Przedyskutujmy 
własności  funkcji  F(q2)  z punktu  widzenia  nieokreślo- 
ności At  czasu  emisji  i absorpcji  fotonu.  Czas  At 
jest  przedziałem  czasowym,  w którym  fakt  zajścia 
emisji  czy  też  absorpcji  nie  mógł  zostać  zauważony. 
Jeżeli  czas  At  był  bardzo  mały,  to  foton  wirtualny 
wysłany  przez  elektron  przebył  niezauważony  przez 
hadron  niewielką  drogę  c At,  po  czym  został  zaabsor- 
bowany. Sytuacja  taka  mogła  się  zdarzyć  tylko  pod 
warunkiem,  że  elektron  przebywał  w chwili  oddziały- 
wania niedaleko  środka  hadronu,  mniej  więcej  w od- 
ległości c At.  Tak  więc  foton  jest  absorbowany  tylko 
przez  część  ładunku  hadronu,  co  w ujęciu  klasycznym 
odpowiada  temu,  że  ładunek  punktowy  przelatujący 
przez  obszar  naładowany  oddziałuje  kulombowsko 
głównie  z wewnętrzną  częścią  ładunku.  Oddziaływania 
warstw  zewnętrznych  mają  tendencję  do  znoszenia 
się,  a np.  dla  kuli  to  znoszenie  się  jest  całkowite.  Po- 
nieważ At  ~ 1/}/ — q2 , więc  dla  — q2  ->  oo  czas  At 
->  0 i część  ładunku  hadronu,  na  której  zachodzi  roz- 
praszanie, dąży  do  zera.  Wyciągamy  stąd  wniosek,  że 

lim  F(q2)  = 0. 

— ę2 — >00 

I na  odwrót,  dla  At  -+  oo,  czyli  q2  ->  0 elektron  znaj- 
duje się  bardzo  daleko  od  środka  hadronu  (zwróćmy 
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uwagę  na  fakt,  że  odległość  np.  10" 7 m może  być 
uważana  za  niemal  nieskończoną  w porównaniu  ze 
średnimi  rozmiarami  protonu,  10" 15  m)  i „widzi” 
cały  jego  ładunek.  W takich  warunkach  hadron  może 
być  traktowany  jako  punktowy.  Tak  więc 

F( 0)  = 1 dla  hadronu  o ładunku  ±e, 

F(0)  = 0 dla  hadronu  o ładunku  zero. 


Te  własności  czynnika  postaci  świetnie  zgadzają  się 
z doświadczeniem.  Na  rys.  16  przedstawiony  jest 
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Rys.  16.  Wyniki  pomiaru  elastycznego  elektrycznego  czynnika 
postaci  protonu  dla  różnych  wartości 


zmierzony  w doświadczeniu  elastyczny  czynnik  po-  elektryczny  i 
staci  protonu.  Jest  to  tzw.  czynnik  postaci  elektryczny,  magnetyczny 
Proton,  jak  i wszystkie  hadrony  obdarzone  spinem,  czynnik 
ma  bo.wiem  również  inny  czynnik  postaci  — magne-  postaci 
tyczny  — o podobnych  własnościach.  Występowanie 
dodatkowych  czynników  postaci  dla  hadronów  wiąże 
się  z tym,  że  dla  cząstek  mających  wewnętrzny  mo- 
ment pędu  (spin)  ładunki  wewnętrzne  składające  się 
na  strukturę  cząstki  wykonują  ruchy,  które  są  przy- 
czyną powstawania  prądów  elektrycznych.  Prądy  te 
biorą  udział  w oddziaływaniach  magnetycznych  z po- 
ruszającym się  elektronem  i rozkład  tych  właśnie  od- 
działywań wewnątrz  hadronu  odzwierciedlają  magne- 
tyczne czynniki  postaci.  Hadrony  obdarzone  spinem 
są  więc  małymi  magnesami  o pewnym  momencie 
magnetycznym,  którego  odpowiednią  część  (dążącą 
oczywiście  znów  do  zera,  gdy  ->  oo)  obserwuje 
w rozpraszaniu  elektron.  Zwróćmy  przy  okazji  uwagę 
na  fakt,  że  moment  magnetyczny  mają  również  lepto- 
ny (o  spinie  V2),  ale  tylko  naładowane.  W wypadku 
leptonów  moment  magnetyczny  nie  wykazuje  jednak 
struktury  i odpowiedni  czynnik  postaci,  jak  i wszystkie 
czynniki  postaci  leptonów,  wynosi  jeden  (albo  zero 
dla  neutrin)  przy  wszystkich  wartościach  q 2. 


nieelastyczne 

czynniki 

postaci 


proton 


Rozpraszanie  nieelastyczne  elektronów 
na  nukleonach 

Pomiar  elastycznych  czynników  postaci  nukleonów 
stał  się  najważniejszym  argumentem  na  rzecz  istnienia 
struktury  wewnętrznej  hadronów.  Struktura  ta  po- 
wstaje poprzez  oddziaływania  silne,  w których  uczest- 
niczą hadrony  i szczegółowa  jej  analiza,  np.  oblicze- 
nie funkcji  F(<?2),  jest  bardzo  złożona.  Niewiele  mo- 
żemy powiedzieć  o oddziaływaniach,  dla  opisu  któ- 
rych nie  możemy  stosować  rachunku  zaburzeń 
i diagramów  Feynmana.  Posługujemy  się  wtedy  opi- 
sem półfenomenologicznym,  wprowadzając  nielokalne 
fenomenologiczne  oddziaływanie  poprzez  wymianę 
np.  wirtualnych  mezonów  n obdarzonych  strukturą, 
czy  też  biegunów  Reggego  (-*  Oddziaływania  silne). 
Metody  te,  chociaż  zaczerpnięte  z lokalnej  kwantowej 
teorii  pola,  nie  noszą  już  tych  cech  ścisłości  i jedno- 
znaczności przewidywań,  które  charakteryzują  np. 
elektrodynamikę  kwantową.  Stąd  elastyczne  czynniki 
postaci  hadronów  możemy  obliczyć  posługując  się  jedy- 
nie pewnymi  modelami.  Lepiej  przedstawia  się  sprawa 
z tzw.  nieelastycznymi  czynnikami  postaci,  których 
pomiar  udowodnił,  że  struktura  hadronów  jest  zbu- 
dowana z cząstek  nie  mających  już  struktury,  a mia- 
nowicie z kwarków. 

Nieelastyczne  czynniki  postaci  wyznacza  się  bada- 
jąc nieelastyczne  rozpraszanie  elektronów  na  hadro- 
nach (nukleonach).  Reakcja  ta  polega  na  rozbiciu 
struktury  hadronu  przez  padający  elektron.  Wysłany 
z elektronu  wirtualny  foton  zostaje  pochłonięty  przez 
hadron,  w wyniku  czego  powstaje  wiele  dodatkowych 
hadronów,  głównie  mezonów  (rys.  17).  Wyobraźmy 
sobie  teraz,  że  np.  proton  składa  się  z pewnej  liczby 
składników  obdarzonych  ładunkami  elektrycznymi  Q% 
i że  przez  te  właśnie  składniki  jest  pochłaniany  foton. 
Reakcja  ma  więc  przebieg,  jak  na  rys.  18.  Rysunek 
ten  jest  jednak  bardzo  wyidealizowany.  Czas  oddziały- 
wania silnego  między  składnikami  protonu  jest  bo- 
wiem zupełnie  dowolny  i w trakcie  pochłaniania 
fotonu  składniki  mogą  wielokrotnie  oddziaływać 
między  sobą  zamazując  całkowicie  obserwowane 
zjawisko.  Jeżeli  jednak  elektrony  mają  bardzo  dużą 
energię,  to  z punktu  widzenia  elektronu  proton 
porusza  się  z bardzo  dużą  prędkością,  bliską  pręd- 
kości światła.  Zaczynają  wtedy  odgrywać  rolę  efekty 


relatywistyczne;  między  innymi  wszelkie  ruchy 
i zmiany  wewnątrz  protonu  będą  wydawały  się  na- 
szemu elektronowi  bardzo  powolne  — czas  ulega 
dylatacji.  Jeżeli  dodatkowo  będziemy  interesowali  się 
jedynie  rozproszeniami,  w których  ą 2 jest  duże,  to 
czas  trwania  procesu  pochłaniania  fotonu  będzie 
krótki.  W takich  właśnie  kontrolowanych  doświad-  duże 
czalnie  warunkach,  w czasie  pochłaniania  fotonu  energie,  duże 
przez  składnik  protonu  nie  zachodzą  prawie  żadne  q2 
oddziaływania  silne  między  składnikami  i reakcja 
przebiega  w idealny  sposób  przedstawiony  poprzed- 
nio na  rysunku.  Oczywiście  amplituda  całego  rozpra- 
szania jest  sumą  amplitud  prawdopodobieństwa  zajś- 
cia rozpraszania  na  każdym  ze  składników.  Korzy- 
stając ze  związku  de  Broglie’a  między  długością  fali 
i pędem  (A  = h/p)  można  się  przekonać,  że  dla  du- 
żych q2  (a  więc  i dużych  pędów  fotonu)  warunek  spój- 
ności między  poszczególnymi  amplitudami  zostaje 
silnie  naruszony.  Nie  ma  więc  interferencji  i całkowity 
przekrój  czynny  jest  po  prostu  sumą  przekrojów  czyn- 
nych dla  poszczególnych  rozproszeń: 


Znamy  wzór  na  każdy  ze  składników  tej  sumy: 


doi 

dq2 


«Ł  0? 

4* 


gdzie  Qi  — ładunek  (w  jednostkach  ładunku  elemen- 
tarnego), Fi(g2)  — elastyczny  teraz  czynnik  postaci 
/-tego  składnika  protonu.  Tak  więc 


da 

~dq* 


<r  i 


Zatem  badając  zależność  całkowitego  przekroju  czyn- 
nego od  qz  możemy  dowiedzieć  się  czegoś  o struktu- 
rze samych  składników.  Wyniki  takiego  pomiaru 
zostały  przedstawione  na  rys.  19.  Widać  wyraźnie,  że 
w opisanych  wyżej  warunkach  (duże  energie,  duże  qz) 

wyrażenie / — nie  zależy  od  q2.  Elastyczne  czyn- 

ię?2 / q* 

niki  postaci  składników  protonu  (a  także  neutronu, 
bo  i dla  niego  przeprowadzono  pomiary)  nie  zależą 


Rys.  17.  Rozbicie  protonu  zachodzące  w wyniku  pochłonięcia 
fotonu  wirtualnego 


czas 

Rys.  18.  Dwustopniowy  charakter  nieelastycznego  rozpraszania 
elektronu  na  protonie.  Najpierw  foton  wirtualny  jest  pochła- 
niany przez  jeden  ze  składników  protonu,  a potem  zachodzi  od- 
działywanie wszystkich  składników  prowadzące  do  powstania 
pewnej  liczby  hadronów 


Rys.  19.  Wyniki  pomiaru  przekroju  czynnego  reakcji  nieelastycz- 
nego rozpraszania  elektronów  na  protonach  dla  różnych  war- 
tości q 2.  Przedstawione  dane  odpowiadają  różnym  energiom 
elektronów  większym  od  wartości  5 GeV 


więc  od  qz.  Oznacza  to,  jak  wiemy,  że  Fdą2)  s 1. 
Składniki  nukleonów  nie  mają  więc  struktury. 

Mogłoby  się  wydawać,  że  w tym  samym  doświad- 
czeniu mierzymy  również  sumę  kwadratów  ładunków 
składników,  Z Ql  gdyż  wszystkie  F?(qz)  = 1.  Tak 

i 

jednak  nie  jest,  bowiem  w powyższym  rozumowaniu 
zrobiliśmy  pewne  istotne  uproszczenie.  Nie  uwzględ- 
niliśmy wcale  faktu,  że  składniki  mogą  mieć  wewnątrz 
protonu  pewne  niezerowe  wartości  pędu,  podobnie 
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jak  elektron  wewnątrz  atomu  wodoru.  Od  rozkładu 
tych  pędów  zależy  również  całkowity  przekrój  czyn- 
ny. Oznaczając  przez/i(p2)  prawdopodobieństwo  tego, 
że  wewnątrz  protonu  i-ty  składnik  naładowany  (ten, 
z którym  oddziałuje  elektron)  ma  pęd  pz  (przy  bardzo 
dużych  prędkościach  składnika  względem  elektronu 
istotna  jest  tylko  jedna  składowa  pędu  — w kierunku 
ruchu  elektronu  oznaczyliśmy  ją  przez  pz\  otrzy- 
mujemy poprawny  już  wzór  na  przekrój  czynny: 


<J°(q2,Pz) 

dq2 


i 


gdzie  uwzględniliśmy  doświadczalnie  odkryty  fakt 
braku  struktury  składników,  Fi{q2)  ==  1.  Okazuje  się, 
że  nie  tylko  wartości  energii  i q2  mogą  być  kontrolo- 
wane w doświadczeniu.  Mierząc  całkowitą  energię 
(masę)  hadronów  powstałych  z rozbicia  protonu 
możemy  wyznaczyć  również  wartość  pz.  Nie  będziemy 
tego  bardzo  ważnego  faktu  bliżej  dowodzić.  W każ- 
dym razie  możemy  zsumować  wyznaczone  doświad- 
czalnie przekroje  czynne  odpowiadające  reakcjom 
ze  wszystkimi  możliwymi  wartościami pz.  Przyjmując, 
że  rozkład  kwarków  u{d)  w protonie  jest  taki  sam,  jak 
kwarków  d(u)  w neutronie  (— * Struktura  cząstek  ele- 
mentarnych), można  obliczyć  średni  przekrój  czynny 
rozpraszania  elektronów  na  protonach  i neutronach 
— otrzymuje  się  wówczas  wyrażenie,  w którym  wystę- 
puje pewna  średnia,  niezależna  od  rodzaju  składnika, 
funkcja  rozkładu  f(pz).  Oznaczając 


/= Zf(Pt) 

Pz 

otrzymamy  wtedy 

doeN  (<?2)  a|i  1 y* 
dq2  4* 


Q 


2 

i » 


gdzie  stała  / oznacza  prawdopodobieństwo  tego,  że 
całkowity  pęd  protonu  (z  punktu  widzenia  elektronu) 
jest  w całości  niesiony  przez  jego  naładowane  skład- 
niki. 

Suma  kwadratów  ładunków  składników  nukleonów 
może  zostać  wyznaczona,  jeżeli  zrobimy  założenie, 
że  w oddziaływaniach  słabych  hadronów  biorą  udział 
dokładnie  te  same  składniki,  co  w oddziaływaniach 
elektromagnetycznych.  Możemy  wtedy  posłużyć  się 
procesem  nieelastycznego  rozpraszania  neutrin  na 
jądrach  atomowych,  które  są  na  tyle  duże,  że  odpo- 
wiednie przekroje  czynne  mogą  być  zmierzone.  Reak- 
cję Vfi~hN  ->  (x~  -f  hadrony  badamy  znów  przy  du- 
żych energiach  neutrin  i dla  dużego  q2  (rys.  20).  Ko- 
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siała  sprzężenia  G 


p Bk  i 

jF  * 1 
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Rys.  20.  Dwustopniowy  charakter  nieelastycznego  rozpraszania 
neutrin  mionowych  na  nukleonach.  Najpierw  zachodzi  słaby  pro- 
ces rozpraszania  neutrina  na  jednym  z kwarków  (zasięg  tego 
oddziaływania  jest  niemaJ  równy  zeru),  a potem  wszystkie  kwarki 
oddziałują  silnie  w wyniku  czego  powstaje  pewna  liczba  hadronów 


rzystając  z faktu,  że  stała  sprzężenia  oddziaływań 
słabych  G (— * Oddziaływania  słabe,  badany  obszar 
q2  jest  stale  taki,  że  \q2\  < mw9  gdzie  mw  jest  masą 
bozonu  pośredniczącego  w oddziaływaniach  słabych) 
jest  uniwersalna  dla  wszystkich  cząstek  biorących 
udział  w tych  oddziaływaniach,  możemy  wyprowadzić 
odpowiedni  wzór  na  przekrój  czynny: 


dOvN 

~dq2~ 


G2f. 


Znając  stałą  G możemy  z obu  pomiarów  wyelimino- 
wać nieznaną  poprzednio  stałą  f Okazuje  się,  że 
/V  1,  co  świadczy  o tym,  że  w nukleonach  znajdują 
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się  nie  tylko  składniki  oddziałujące  elektromagnetycz- 
nie i słabo.  Możemy  w ten  sposób  wyznaczyć  jedynie 
sumę  kwadratów  ładunków  uśrednioną  po  protonach 
i neutronach.  Otrzymamy  wynik 

-T2Ql=  0,27  ±0,03 


doskonale  zgadza  się  z hipotezą  kwarków.  Jeżeli  bo- 
wiem właśnie  kwarki  są  składnikami  hadronów  biorą- 
cymi udział  w oddziaływaniach  elektromagnetycznych 
i słabych,  to  w protonie  znajdują  się  dwa  kwarki 
o ładunku  2/s  i jeden  o ładunku  — V3  (-*  Struktura 
cząstek  elementarnych),  a w neutronie  na  odwrót. 
Mamy  zatem 


5 

18 


0,27! 


W ten  sposób  wyniki  eksperymentów  nieelastycznego  dowód  ist- 
rozpraszania  elektronów  (i  neutrin)  na  nukleonach  niema  kwar* 
dowiodły,  że  składnikami  hadronów  są  kwarki  poz-  ków 
bawione  struktury  wewnętrznej. 

Można  zadać  pytanie,  skąd  w takim  składnikowym 
modelu  bierze  się  obserwowana  silna  zależność  od 
qz  elastycznego  czynnika  postaci  samych  hadronów. 

Pochodzi  ona  stąd,  że  przy  dużych  ą 2 kwark,  który  po- 
chłonął foton,  nabiera  dużego  pędu  względem  pozo- 
stałych kwarków  i zostaje  silnie  wybity  z całej  struk- 
tury. Niechętnie  więc  zlepia  się  z resztą  kwarków 
w wyjściowy  hadron.  Im  większe  q2,  tym  mniejsze 
prawdopodobieństwo  utworzenia  na  końcu  stanu  po- 
jedynczego hadronu.  Dlatego  właśnie  prawdopodo- 
bieństwo (przekrój  czynny)  zajścia  reakcji  elastycznej 
silnie  maleje  ze  wzrostem  q2.  Dlatego  też  w opisanych 
wyżej  doświadczeniach  badano  nie  tylko  reakcje  nie- 
elastyczne, ale  dodatkowo  nie  nakładano  żadnych 
ograniczeń  doświadczalnych  na  rodzaj  nieelastycz- 
ności.  Badano  więc  np.  rozpraszanie  elektronów  na 
protonach  nie  interesując  się  zupełnie,  ile  i jakie  ha- 
drony powstały  w procesie.  Wtedy  i tylko  wtedy  eli- 
minujemy z opisu  wpływ  oddziaływania  kwarków  po 
rozproszeniu,  które  to  oddziaływanie  prowadzi  do 
powstania  końcowego  stanu  wielohadronowego. 


Anihilacja  pary  elektron-pozyton 
na  hadrony 

Reakcja  e+e~  ->  hadrony  zachodzi,  podobnie  jak 
opisana  poprzednio  reakcja  e+e~  — > fi+p~,  przez  ani- 
hilację  pary  na  foton  z ą2  > 0 i następnie  kreację 
z tego  fotonu  różnych  hadronów,  głównie  mezonów. 
Dla  dużych  wartości  q 2 (w  tej  reakcji  q2  w układzie 
środka  masy  e+e~  równa  się  kwadratowi  całkowitej 
energii  pary)  czas  oddziaływania  jest  znów  niewielki 
i kreacja  hadronów  zachodzi  zapewne  przez  kreację 
wszystkich  możliwych  par  składników  (kwarków) 
i dopiero  potem  oddziaływanie  tych  par  prowadzące 
do  powstania  różnych  stanów  wielohadronowych. 
W tym  wypadku  jednak  argumenty  nie  są  tak  ścisłe 
jak  w wypadku  reakcji  nieelastycznego  rozpraszania 
elektronów,  gdyż  nie  mamy  żadnej  metody  na  kon- 
trolowanie doświadczalne  czasu  trwania  oddziaływań 


y hadrony 


Rys.  21.  Proces  anihilacji  pary  elektron-pozyton  ma  przy  odpo- 
wiednio wysokich  energiach  pary  przebieg  w pewnym  przybli- 
żeniu dwustopniowy.  Najpierw  foton  wirtualny  kreuje  lokalnie 
jedną  z par  kwarków  bez  struktury,  a potem  para  ta  oddziałuje 
silnie  przechodząc  w pewną  liczbę  hadronów 


stosunek 


wewnątrzhadronowych  i czas  ten  w zasadzie  jest  zu- 
pełnie dowolny.  Jeżeli  jednak  wyprodukowana  para 
składników  ma  dużą  energię,  to  rozlatują  się  one  bar- 
dzo szybko  i prawdopodobnie  oddziaływanie  przebie- 
ga przez  dwa  kolejne  stadia,  jak  na  rys.  21.  Jeżeli  więc 
nie  interesujemy  się,  jakie  i ile  hadronów  powstało 
z wyprodukowanych  par,  oraz  jeżeli  | / g2  jest  dużo 
większe  od  wszystkich  dostępnych  energetycznie  pro- 
gów produkcji  tych  par,  to  całkowity  przekrój  czynny 
dany  jest  wzorem  analogicznym  do  wzoru  na  przekrój 
czynny  reakcji  e+e~  -*  : 


— — (e+e~  hadrony) 

ag2 


i 


gdzie  sumowanie  przebiega  po  ładunkach  wszystkich 
możliwych  par  składników  hadronów.  Przy  pisaniu 
tego  wzoru  zrobiliśmy  założenie,  że  składniki  hadro- 
nów nie  mają  struktury,  Fi(g2)  = 1,  co  tutaj  znów 
zostało  potwierdzone  doświadczalnie  w bardzo  du- 
żym przedziale  wartości  g2.  Odpowiedni  przekrój 
czynny  został  zmierzony  przy  użyciu  akceleratorów 
ze  zderzającymi  się  przeciwbieżnymi  wiązkami  elek- 
tronów i pozytonów.  Dzieląc  ten.  przekrój  czynny 
przez  odpowiedni  przekrój  czynny  na  produkcję  pary 
P+ffialJg*)  otrzymujemy  tzw.  stosunek  R,  którego 


chowanie  się  stosunku  /?,  a mianowicie  jego  wartość 
R x 2 poniżej  progu  produkcji  kwarków  powabnych 
i R x 4 powyżej  tego  progu  jest  zgodne  z przewidy- 
waniami modelu  kwarków.  Należy  tylko  pamiętać, 
że  każdy  rodzaj  kwarku  ma  trzy  odmiany  (tzw. 
kolory),  które  nie  różnią  się  między  sobą  masami  ani 
ładunkami  elektrycznymi.  W hadronach  znajduje  się 
zawsze  określona  kombinacja  tych  odmian  i np.  pro- 
ton składa  się  zawsze  z trzech  kwarków : dwóch  kwar- 
ków jednego  rodzaju  (ładunek  2/3)  i jednego  kwarku 
innego  rodzaju  (ładunek  — Vs),  z których  każdy  jest 
innej  odmiany  (koloru).  Całkowita  liczba  wszystkich 
możliwych  kwarków  zwiększa  się  w ten  sposób  trzy- 
krotnie. Poniżej  progu  produkcji  kwarków  powab- 
nych mamy  więc 

Kil- 

zaś  powyżej  progu 

* = 3[(t)  +(_i)+(""3)+(t)]=33 

w dość  dobrej  zgodności  z danymi  doświadczalnymi. 

Warto  jeszcze  zwrócić  uwagę  na  ostre  maksima 
pojawiające  się  w stosunku  R w obszarach  nieregu- 


Rys.  22.  Wyniki  pomiaru  stosunku  R całkowitego  przekroju  czynnego  anihilacji  par  elektron-pozyton  na  hadrony  do  przekroju  czynnego 
przejścia  tych  par  na  pary  mionów  jn~  fz+  dla  różnych  wartości  q *.  W rogu  zamieszczono  dane  z obszaru  powyżej  9 GeY/c*  nie  unormo- 
wane do  przekroju  czynnego  na  produkcję  mionów 


wartości  doświadczalne  przedstawiono  na  rys.  22. 
Teoretycznie  (choć  jedynie  w przybliżeniu)  stosunek 
R jest  oczywiście  dany  przez  sumę  kwadratów  ładun- 
ków wszystkich  możliwych  składników  wszelkich 
hadronów : 

i 

Z rysunku  widać,  że  po  początkowych  nieregularnoś- 
ciach  występujących  w obszarze  wartości  g2  bliskich 
progom  produkcji  trzech  najlżejszych  par  kwark-anty- 
kwark  o ładunku  2/3,  -ł/»  i -l/8  (-*  Struktura  cząstek 
elementarnych)  stosunek  R ustala  się  — przyjmuje 
wartość  R x 2 — po  czym  znowu  przy  progu  pro- 
dukcji pary  kwarków  powabnych  o ładunku  2/3  wy- 
stępują nieregularności.  Dla  jeszcze  większych  war- 

tości g2  stosunek  R ustala  się  na  poziomie  R x 5, 
po  czym  jeszcze  raz,  przy  kolejnym  progu  produkcji 
jeszcze  jednej,  piątej  pary  kwarków,  pojawiają  się 
nieregularności.  W okolicach  progu  produkcji  kwar- 
ków powabnych  pojawia  się  również  kreacja  pary 
ciężkich  leptonów  r (— ► Oddziaływania  słabe),  które 
nie  zostały  wydzielone  z danych  doświadczalnych. 
Powyżej  tego  progu  proces  produkcji  ciężkich  lepto- 
nów (o  ładunku  jeden)  daje  do  stosunku  R wkład  rów- 
ny jedności  i jedynie  R zs  4 powinno  pochodzić 
z wkładu  od  kreacji  par  kwarkowych.  Powyższe  za- 


larności.  Są  one  wynikiem  produkcji  krótkożyjących 
stanów  hadronowych,  tzw.  rezonansów,  które  szybko 
rozpadają  się  na  hadrony. 

Inne  oddziaływania  hadronów  z fotonami 

Przedstawimy  teraz  krótko  niektóre  inne,  mniej  waż- 
ne reakcje  elektromagnetyczne  hadronów'.  Ich  analiza 
jest  oparta  na  znajomości  kwarkowego  składu  hadro- 
nów. Dla  dalszych  rozważań  będzie  tylko  istotna  in- 
formacja, że  wszystkie  bariony  składają  się  z trzech 
kwarków,  natomiast  mezony  z pary  kwark-anty kwark. 
Wysłanie  fotonu  wirtualnego  z kwarku  nie  prowadzi 
do  jakiejkolwiek  jego  zmiany,  podobnie  jak  dla 
wszystkich  cząstek  pozbawionych  struktury.  Stąd 
w oddziaływaniach  elektromagnetycznych  hadronów 
jest  zachowana  trzecia  składowa  izospinu  /3,  hiper- 
ładunek  Y (lub  dziwność  5)  oraz  powab  C.  Wartości 
bowiem  tych  liczb  kwantowych  służą  w modelu  kwar- 
ków jedynie  do  ponumerowania  różnych  rodzajów 
kwarków.  Również  odmiana  kwarku  (kolor)  nie 
zmienia  się  przy  wysyłaniu  fotonu.  Wszystkie  te 
prawa  zachowania  zostały  sprawdzone  w wielu  do- 
świadczeniach. Nie  ma  jednak  żadnego  powodu,  by 
w oddziaływaniach  elektromagnetycznych  zachowy- 


liczby  kwan- 
towe zacho- 
wywane 
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rozpraszanie 
fotonów  na 
hadronach 


Rys.  23.  Anihilacja 
wirtualnej  pary 
kwark-antykwark 
na  foton  rzeczywi- 
sty 


model 

dominacji 

wektorowej 


rozpady 

elektromag- 

netyczne 

hadronów 


wał  się  izospin  całkowity  hadronów.  I rzeczywiście 
nie  jest. 

Oddziaływania  elektromagnetyczne  hadronów  dzie- 
lą się  na  reakcje  rozpraszania  fotonów  oraz  rozpady 
cząstek.  Typowymi  reakcjami  rozpraszania  są  procesy 
fotoprodukcji  (np.  y+p  n+p)  oraz  rozpraszania 
komptonowskiego  (np.  y+p  ->  y+p).  Końcowe  stany 
hadronowe  mogą  być  i często  są  wielocząstkowe 
(np.  y+p  ->  2 n+p).  Procesy  rozpraszania  fotonów 
zachodzą  przez  kreację  (lub  anihilację)  par  kwark- 
antykwark  przez  foton  rzeczywisty  (rys.  23).  Pary  te 
uczestniczą  dalej  w oddziaływaniach  silnych  z ha- 
dronem bombardowanym.  Powstała  z fotonu  (lub 
przechodząca  w foton)  wirtualna  para  kwark-anty- 
kwark ma  liczby  kwantowe  mezonu,  i to  mezonu 
o spinie  jeden  — równym  spinowi  fotonu,  gdyż  obo- 
wiązuje zasada  zachowania  momentu  pędu.  Stąd 
np.  reakcja  fotoprodukcji  (rys.  24)  zachodzi  w ten 


Rys.  24.  Proces  fotoprodukcji  hadronów  na  hadronach  zachodzi 
za  pomocą  pośrednictwa  pewnego  wirtualnego  mezonu  wekto- 
rowego, w który  przechodzi  padający  foton  rzeczywisty 


sposób,  że  foton  przechodzi  w jeden  z mezonów  wek- 
torowych o spinie  1 (q,cd,  q>f ...),  po  czym  mezony  te 
rozpraszają  się  na  hadronie  bombardowanym.  Takie 
pośredniczące  działanie  mezonów  wektorowych  na- 
zwano modelem  dominacji  wektorowej.  Model  ten 
może  być  również  stosowany  w przypadku  elastycz- 
nego pochłaniania  fotonu  przez  składniki  hadronu 
(dostarczając  dość  dobrej  parametryzacji  elastycznego 
czynnika  postaci).  Oczywiście  proces  rozpraszania 
mezonów  wektorowych  na  hadronach  bombardowa- 
nych należy  do  zjawisk  wywoływanych  oddziaływa- 
niami silnymi  i jako  taki  może  być  opisany  jedynie 
półfenomenologicznie  (->  Oddziaływania  silne). 
Typowymi  rozpadami  elektromagnetycznymi  hadro- 
nów są  rozpady  mezonu  7r°(7r°  ->  2 y)  oraz  hipero- 
nu 27°  (27°  -v  A + y).  Pierwszy  z nich  to  anihilacja  me- 
zonowej pary  kwark-antykwark  na  dwa  fotony,  a dru- 
gi to  promieniowanie  hamowania  kwarku  hiperono- 
wego  zachodzące  w polu  oddziaływania  z innymi 
kwarkami  (hiperony  27°  i A mają  ten  sam  skład  kwar- 
kowy). Oba  te  procesy  zostały  przedstawione  na 


Rys.  25.  Rozpad  mezonu  n °zachodzi  poprzez  anihilację  mezono- 
we jpary  kwarków  na  dwa  fotony  rzeczywiste 


Rys.  26.  Rozpad  hiperonu  Z°  zachodzi  poprzez  promieniowanie 
hamowania  jednego  z kwarków  znajdującego  się  w-  polu  oddzia- 
ływań silnych  kwarków  pozostałych.  Rozpad  ten  jest  możliwy 
tylko  dlatego,  że  hiperony  2T°  i A składają  się  z takich  samych 
trzech  kwarków,  choć  stany  kwantowe  kwarków  są  różne  w obu 
przypadkach 
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rys.  25  i 26.  Jak  mówiliśmy,  prawdopodobieństwo 
zajścia  pierwszej  z tych  reakcji  jest  rzędu  a^,  zaś 
drugiej  rzędu  aei-  W tym  drugim  jednak  przypadku, 
podobnie  jak  dla  rozpadu  ($  neutronu  (— ► Oddziały- 
wania słabe),  prawdopodobieństwo  rozpadu  jest  silnie 
stłumione,  gdyż  różnica  mas  hiperonów  27°  i A jest 
niewielka.  W rezultacie  czasy  życia  zarówno  mezonu 
7T°,  jak  i hiperonu  27°  są  zbliżone  i wynoszą  ok.  I0~16- 
10-17  s.  Zauważmy,  że  czas  życia  cząstki  jest  odwrotnie 
proporcjonalny  do  prawdopodobieństwa  jej  rozpadu. 
Im  więc  większa  stała  sprzężenia  oddziaływania  wy- 
wołującego rozpad,  tym  krótszy  czas  życia. 

Można  by  spytać,  dlaczego  cząstki  n°  i 27°  nie  roz- 
padają się  przede  wszystkim  za  pomocą  oddziaływań 
silnych,  skoro  odpowiednie  prawdopodobieństwo 
rozpadu  powinno  być  większe,  a czas  życia  krótszy. 
Brak  rozpadów  silnych  w tym  wypadku  bierze  się 
stąd,  że  nie  istnieją  odpowiednie  cząstki  lżejsze  od  n° 
i 27°,  na  które  oba  te  hadrony  mogłyby  się  rozpadać 
bez  pogwałcenia  wszystkich  obowiązujących  w oddzia- 
ływaniach silnych  praw  zachowania  (/,  /3,  Y itd.). 
W przypadku  innych  hadronów,  np.  rezonansów, 
obserwujemy  także  rozpady  elektromagnetyczne 
(np.  q -*  7i+y)y  ale  mają  one  jedynie  znaczenie  mar- 
ginesowe i nie  decydują  o czasie  życia.  Natomiast 
wyłącznie  elektromagnetycznego  pochodzenia  są 
rozpady  mezonu  t?  zachodzące  czasem  z udziałem  je- 
dynie fotonów  wirtualnych  (np.  rj  ->  3 n,  rys.  27). 


Rys.  27.  Elektromagnetyczny  rozpad  mezonu  tj.  Rozpad  silny 
jest  wzbroniony  przez  zasadę  zachowania  całkowitego  izospinu. 
Wymiana  fotonu  wirtualnego  między  pewną  parą  kwarków  zmie- 
nia izospin  całkowity  umożliwiając  zachodzenie  reakcji 


Przedstawiliśmy  już  wszystkie  zasadnicze  własności 
oddziaływań  elektromagnetycznych  cząstek  elemen- 
tarnych, a także  schemat  teoretyczny  pozwalający 
w sposób  jednoznaczny  i ścisły  analizować,  opisywać 
i przewidywać  te  własności.  Elektrodynamika  kwan- 
towa jest  teorią  tak  elegancką,  a jej  przewidywania 
tak  świetnie  zgadzają  się  z doświadczeniem  (np.  po- 
miar momentu  magnetycznego  elektronu  daje  wy- 
nik 1,0011 596577 ± 0,0000000035^/2/72e,  a wartość 
teoretyczna  wynosi  1 ,001 1 596554±  0,0000000033  x 
x eh/2me;  podobna  zgodność  zachodzi  dla  mionu  pr), 
że  na  wzór  tej  teorii  buduje  się  ostatnio  modele 
wszystkich  rodzajów  oddziaływań.  W ten  sposób  po- 
wstała teoria  kwarkowo-gluonowa  oddziaływań  sil- 
nych (— ► Struktura  cząstek  elementarnych)  oraz  jed- 
nolita teoria  oddziaływań  elektromagnetycznych 
i słabych  (-*  Oddziaływania  słabe).  Należy  jednak 
zaznaczyć,  że  współczesna  struktura  elektrodynamiki 
kwantowej  nie  może  być  uważana  za  ostateczną. 
Teoria  ta  bowiem  zawiera  pewne  luki  formalne.  Jedną 
z nich  jest  zasadnicza  niemożność  obliczenia  mas 
podstawowych  cząstek,  np.  leptonów.  Wiąże  się  to 
z faktem,  że  np.  elektron  w swym  ruchu  swobodnym 


Rys.  28.  Reabsorpcja  fotonu  wirtualnego  przez  elektron.  Pęd  k 
i energia  co  fotonu  są  dowolne  i należy  wykonać  sumowanie 
(całkowanie)  po  wszystkich  wartościach  tych  zmiennych 


czas  życia 
a stała 
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moment 

magnetyczny 

elektronu 


może  wysyłać  i reabsorbować  fotony  wirtualne /rys. 
28).  Odpowiedni  diagram  Feynmana  wydaje  się  mały 
(rzędu  aei),  ale  obliczenie  jego  wkładu  wymaga  wy- 
konania sumowania  (całkowania)  po  wszystkich  po- 
działach pędu  padającego  elektronu  na  pędy  pośred- 
niego elektronu  wirtualnego  i również  wirtualnego 
fotonu.  Suma  okazuje  się  nieskończona  (rozbieżna). 
Logiczną  zwartość  teorii  można  wprawdzie  uratować 
za  pomocą  pewnego  dobrze  określonego  przepisu 


(zwanego  procedurą  renormalizacji),  ale  pojawiają  się 
w-tedy  dodatkowe  dowolne  parametry.  W ten  sposób 
np.  masa  elektronu  okazuje  się  dowolna.  Choć  więc 
wydawałoby  się,  że  istnieje  bardzo  dobra  teoria,  wciąż 
pewne  ciemne  jej  obszary  nie  pozwalają  fizykom  na 
bezczynność. 

G.  Białkowski,  R.  Sosnowski  Cząstki  elementarne , War- 
szawa 1971;  W.B.  Bierestecki,  E.M.  Lipszic,  L.P.  Pitajewski 
Relatywistyczna  teoria  kwantów , cz.  I,  Warszawa  1972;  L.N. 
Cooper  Istota  i struktura  fizyki^  Warszawa  1975. 


Oddziaływania  słabe 

Andrzej  Szymacha 


Oddziaływania  słabe  na  tle  innych 
oddziaływań 

Oddziaływania  słabe  są  jednym  z trzech  typów  od- 
działywań mających  znaczenie  w fizyce  cząstek  ele- 
mentarnych (-*  Cząstki  elementarne  i ich  oddziały- 
wania). W zbadanym  dotychczas  zakresie  energii 
cząstek  są  one  najsłabsze.  Silniejsze  od  nich  są  oddzia- 
ływania elektromagnetyczne  oraz  jądrowe  zwane  też 
oddziaływaniami  silnymi. 

oddziaływa-  W mechanice  klasycznej  termin  „oddziaływanie” 
nie  w teorii  był  synonimem  siły  działającej  między  rozpatrywany- 
klasycznej  mi  ciałami.  Ujęcie  klasyczne  zawodzi  jednak  w za- 
i kwantowej  stosowaniu  do  mikroobiektów,  szczególnie  przy 
opisie  zjawisk  zachodzących  z udziałem  niewielkiej 
liczby  cząstek  elementarnych.  W tym  wypadku 
poprawny  opis  teoretyczny  musi  być  sformułowany 
za  pomocą  pojęć  stosowanych  w teorii  kwantowej 
i to  w dodatku  w najbardziej  zaawansowanej  jej 
wersji  — kwantowej  teorii  pola.  W teorii  tej  potocz- 
nemu pojęciu  oddziaływania  odpowiada  hamiltonian 
oddziaływania,  którego  znajomość  pozwala  (przy- 
najmniej w zasadzie  — praktycznie  jest  to  często 
bardzo  trudne)  obliczać  (przepowiadać)  wyniki 
najrozmaitszych  doświadczeń  przeprowadzanych  z 
udziałem  cząstek  elementarnych.  Kwantowa  teoria 
pola  nie  daje  się  jednak  wyłożyć  w sposób  krótki 
i prosty.  Z drugiej  zaś  strony  oddziaływania  słabe  — 
w przeciwieństwie  do  elektromagnetycznych  — są 
niezwykle  krótkozasięgowe  i nie  mają  żadnego 
odpowiednika  w makroświecie.  Dlatego  opisując  je, 
będziemy  przedstawiać  konkretne  skutki  tego  od- 
działywania, które  są  znacznie  prostsze  i pojęciowo 
uchwytniejsze  od  abstrakcyjnego  hamiltonianu  od- 
działywania. 

skutki  od-  W kręgu  zjawisk  z udziałem  niewielkiej  liczby 
działywań  cząstek  elementarnych  wszelkie  oddziaływania  mogą 
się  przejawiać  w postaci  następujących  skutków : 

a)  Wpływu  na  statyczne  parametry  cząstek  ele- 
mentarnych i na  powstawanie  układów  związanych. 
Należą  tu  takie  własności  jak:  masa  cząstek  ele- 
mentarnych, moment  magnetyczny,  energia  wiązania 
jądra  itp. 

b)  Rozpadów  cząstek  nietrwałych  i układów  nie- 
trwałych charakteryzowanych  liczbowo  przez  czas 
rozpadu  (dokładniej  średni  czas  rozpadu  bądź 
czas  połowicznego  zaniku)  i prawdopodobieństwa 
rozpadów  danego  obiektu  na  różne  możliwe  pro- 
dukty końcowe. 

c)  Zachodzenia  procesów  rozpraszania  elastycznego 
lub  nieelastycznego.  Pierwszym  doświadczeniem 
tego  rodzaju  było  doświadczenie  E.  Rutherforda 
uwieńczone  odkryciem  jądra  atomowego.  Wszystkie 
akceleratory  buduje  się  właśnie  po  to,  by  zderzać 
jedne  cząstki  z drugimi.  Poza  tym,  zderzenie  wysoko- 
energetycznych cząstek  jest  jedynym  sposobem 
wytwarzania  wszelkich  nietrwałych  cząstek,  których 
rozpady  następnie  się  bada. 

Rola  oddziaływań  słabych  nie  jest  jednakowo  waż- 
na we  wszystkich  wyżej  wymienionych  punktach. 
Są  one  za  słabe,  by  mogły  prowadzić  do  utworzenia 


układu  związanego.  Wszystkie  znane  układy  złożone 
są  utrzymywane  bądź  przez  oddziaływania  silne 
(jądra  atomowe),  bądź  przez  elektromagnetyczne 
(molekuły,  atomy,  atomy  egzotyczne).  Wpływ  od- 
działywań słabych  na  własności  układów  złożonych 
(których  istnienie  jest  uwarunkowane  silniejszymi 
oddziaływaniami)  jest  znikomo  mały.  Jedynie  w nie- 
licznych przypadkach  daje  się  go  zaobserwować 
przez  efekty  niezachowania  parzystości  w stanach 
wzbudzonych  jąder.  Interpretacja  tych  efektów  za- 
leży jednak  silnie  od  bardzo  złożonych  efektów 
jądrowych  i dlatego  w ten  sposób  nie  udało  się  uzyskać 
niemal  żadnych  informacji  o oddziaływaniach  sła- 
bych. W ostatnim  czasie  wielkie  zainteresowanie 
wzbudzają  doświadczenia,  w których  podobnego 
efektu  poszukuje  się  w zjawisku  przejść  optycznych 
w gazach  jednoatomowych  (wodór  atomowy,  pary 
metali  ciężkich).  Praktycznie  efekt  taki  powinien 
przejawiać  się  jako  aktywność  optyczna  niektórych 
gazów  jednoatomowych  bądź  jako  szczątkowa  polary- 
zacja kołowa  światła  wysyłanego  przez  rozgrzane  gazy. 

Żaden  z tych  efektów  nie  wystąpiłby,  gdyby  między 
elektronami  i jądrem  atomowym  działały  tylko  zwykłe 
siły  elektromagnetyczne.  W związku,  z postępem 
techniki  laserowej  i elektroniki  osiągnięto  już  do- 
kładność rzędu  spodziewanego  efektu.  W niedalekiej 
przyszłości  będzie  to  zapewne  bardzo  cenna  metoda 
badania  oddziaływań  słabych. 

Procesy  rozproszeniowe  wywołane  oddziaływa- 
niami słabymi  są  również  trudne  do  obserwacji. 

Wyjątkiem  są  procesy  rozpraszania  neutrin.  Są  one  rczp raszanie 
wprawdzie  niesłychanie  mało  prawdopodobne,  wy-  neutrin 
magające  zatem  olbrzymich  detektorów,  dużych  na- 
tężeń wiązki  neutrin  i długiego  czasu  obserwacji,  ale 
ich  wielką  zaletą  jest  niewystępowanie  „tła”  procesów 
wywołanych  innymi  oddziaływaniami.  Neutrina  są 
jedynymi  znanymi  cząstkami  elementarnymi  nie 
uczestniczącymi  ani  w oddziaływaniach  silnych,  ani 
elektromagnetycznych.  Przejawia  się  to  w ich  ogrom- 
nej przenikliwości  przez  materię.  Neutrino  ma  realną 
szansę  przejścia  nawet  na  wskroś  gwiazdy  bez  żadnego 
aktu  oddziaływania,  a więc  bez  zmiany  swej  energii 
i kierunku  lotu!  (-►  Reakcje  jądrowe  w gwiazdach). 
Prawdopodobieństwo  tego,  że  elektron  wejdzie  w sła- 
be oddziaływanie  z materią,  przez  którą  przelatuje, 
jest  tego  samego  rzędu  wielkości  co  dla  neutrina,  ale 
nie  sposób  wyłowić  tych  rzadkich  przypadków  z 
ogromnej  liczby  innych  procesów  wywołanych  od- 
działywaniami elektromagnetycznymi  elektronów  z 
materią  (kreacja  par,  promieniowanie  hamowania, 
rozbijanie  jąder  i inne). 

Najwięcej  informacji  o oddziaływaniach  słabych  rozpady 
uzyskano  obserwując  rozpady  cząstek  elementarnych  słabe 
(i  jąder  atomowych).  Ponieważ  badanie  reakcji  neu- 
trinowych  stało  się  technicznie  możliwe  stosunkowo 
późno,  oddziaływania  słabe  przez  wiele  lat  utożsa- 
miano właściwie  z rozpadami  słabymi,  zwanymi  też 
rozpadami  powolnymi.  Łatwo  zrozumieć,  dlaczego 
obserwacja  słabych  rozpadów  nie  nastręcza  większych 
trudności.  Otóż,  jeśli  jakaś  cząstka  może  sie  rozpaść 
jedynie  wskutek  oddziaływań  słabych,  to  niezależnie 
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od  ich  słabości  proces  taki  wcześniej  czy  później 
musi  nastąpić.  Prawdopodobieństwo  tego  zdarzenia 
wynosi  dokładnie  1,  podczas  gdy  prawdopodobień- 
stwo zajścia  reakcji  rozpraszania  przy  przechodzeniu 
neutrina  przez  określoną  warstwę  substancji  może 
wynosić  np.  10— 30 ! Ewentualna  słabość  odddziaływa- 
nia  wywołującego  rozpad  przejawi  się  jedynie  w dłu- 
gości czasu  życia  rozpadającego  się  obiektu.  Intuicyj- 
nie powinno  być  zrozumiałe,  że  im  słabsze  oddziały- 
wanie, tym  dłużej  trzeba  taką  cząstkę  obserwować 
zanim  się  ona  rozpadnie,  czyli  tym  dłuższy  będzie  jej 
czas  życia. 

Typowe  czasy  życia  cząstek  elementarnych  rozpa- 
dających się  wskutek  oddziaływań  słabych  wynoszą 
ok.  10-10  s lub  więcej.  Czy  to  dużo  czy  mało?  Odpo- 
wiedź będzie  oczywiście  zależeć  od  tego,  z czym  ten 
czas  porównujemy. 

Jest  ogólną  regułą  w fizyce,  że  o wielkości  miano- 
wanej nie  można  powiedzieć  czy  jest  duża,  czy  mała 
w oderwaniu  od  innych  okoliczności.  Małe  lub  duże 
mogą  być  tylko  wielkości  niemianowane,  a więc  np. 
stosunki  dwóch  wielkości  o tym  samym  wymiarze, 
charakterys-  w kręgu  spokrewnionych  zjawisk  występują  zawsze 
tyczne  pewne  charakterystyczne  wielkości  wymiarowe.  Na 
wielkości  przykład,  w teorii  względności  charakterystyczną 
wymiarowe  prędkością  jest  prędkość  światła  c,  w fizyce  atomowej 
charakterystyczną  wielkością  o wymiarze  momentu 
pędu  — stała  Plancka,  a także  charakterystyczną 
jednostką  energii  — energia  jonizacji  atomu  wodoru 
itd.  Mówiąc,  że  jakaś  wielkość  jest  bardzo  mała 
(bądź  bardzo  duża)  mamy  zawsze  na  myśli  jej  stosu- 
nek do  charakterystycznej  dla  danego  kręgu  zjawisk 
wielkości  o tym  samym  wymiarze.  Musimy  zatem 
ustalić  charakterystyczne  wielkości  o różnych  wymia- 
rach (w  tym  także  czasu)  mające  znaczenie  dla  od- 
działywań cząstek  elementarnych  o wysokich  ener- 
giach. Niewątpliwie  charakterystyczną  prędkością 
jest  c,  a charakterystyczną  długością  — średnica 
cząstki  elementarnej.  Charakterystycznym  momen- 
tem pędu  jest  oczywiście  h.  Z tych  trzech  wielkości 
można  już  utworzyć  wszystkie  inne  mechaniczne 
wielkości  o różnych  wymiarach.  Kłopot  polega  jedy- 
nie na  tym,  że  w przeciwieństwie  do  stałych  h i c , 
które  mają  uniwersalny  sens  nie  związany  z tą  czy 
inną  cząstką,  „średnica  cząstki”  nie  jest  dobrze  okreś- 
lona, choćby  dlatego,  że  istnieją  różne  cząstki  i nie  ma 
powodu,  by  któraś  z nich  była  najważniejsza.  Jed- 
nakże, nie  popełnimy  wielkiego  błędu,  jeśli  przyjmie- 
my wartość  charakterystycznej  długości  równą  10“ 13 
cm.  Teraz  można  stwierdzić,  że  czas  charakterys- 
tyczny dla  cząstek  elementarnych  ma  wielkość  10"13 
cm/c  3 \10-24  s.  Wielkością  tego  rzędu  są  również 
niektóre  czasy  życia  cząstek  rozpadających  się  wskutek 
oddziaływań  silnych.  Gdyby  ten  czas  przyjąć  za  jed- 
nostkę, to  typowy  czas  życia  cząstek  rozpadających 
się  wskutek  oddziaływań  słabych  równy  10“ 10  s 
byłby  w tych  jednostkach  rzędu  3 *1013.  Jest  to  liczba 
powolność  ogromna  i dlatego  rozpady  słabe  można  nazwać 
frozpadów  rozpadami  powolnymi.  Przypomnijmy,  że  typowe 
słabych  czasy  życia  cząstek  rozpadających  się  silnie  zawierają 
się  z grubsza  biorąc  w zakresie  10“24-10“21  s,  a roz- 
padających się  elektromagnetycznie  — w zakresie 
10“19-10“16  s. 

Liczby  te  nie  tylko  pokazują  różnicę  między  po- 
szczególnymi rodzajami  oddziaływań,  ale  mogą  być 
podstawą  określenia  oddziaływań  słabych.  Właśnie 
owa  powolność  procesu  jest  jedyną  elementarną  i za- 
razem bezpośrednio  widoczną  cechą  charakterystycz- 
ną oddziaływań  słabych.  Są  też  i inne  cechy,  bardziej 
fundamentalne,  ale  zarazem  bardziej  abstrakcyjne. 
Jednej  z nich  (łamaniu  symetrii  zwierciadlanej) 
poświęcimy  dalej  nieco  uwagi. 


Rozpady  fi  neutronu  i jąder  atomowych 

Pierwszym  rozpadem  słabym  obserwowanym  wiele 
lat  przed  pojawieniem  się  pojęcia  oddziaływań 
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słabych  był  rozpad  fi  jąder  atomowych  (-*  Rozpady  rozpad  fi- 
jąder  atomowych).  Istnieją  rozpady  fi+  i fi~.  Naj prost-  neutronu 
szym  jądrem  ulegającym  rozpadowi  fi~  jest  swobodny 
neutron.  Jest  zupełnie  naturalne  wyobrazić  sobie, 
że  rozpad  fi~  jakiegoś  bardziej  złożonego  jądra  za- 
chodzi w wyniku  rozpadu  jednego  z neutronów 
wchodzących  w skład  jądra.  Jak  wiadomo,  swobodny 
neutron  rozpada  się  (lepiej  by  było  mówić:  samorzut- 
nie się  przekształca  — słowo  rozpad,  przyjęte  ze 
względów  historycznych,  sugeruje,  że  neutron  jest 
zbudowany  z cząstek  będących  produktami  jego 
rozpadu,  a to  jest  nieprawda)  na  proton,  elektron 
i antyneutrino  elektronowe.  Reakcję  tę  zapisujemy 
w sposób  następujący : 

n~*p+e+ve+Qo,  (1) 

gdzie  Go  — energia  kinetyczna  cząstek  końcowych 
(produktów  rozpada)-  Zgodnie  ze  słynnym  wzorem 
Einsteina,  energia  ta  dana  jest  wzorem 

Go  = (tnn—mv—me)c2.  (2) 

Wielkości  mn , mv  i me  oznaczają  masy  spoczynkowe 
odpowiednich  cząstek.  Pominęliśmy  masę  neutrina, 
gdyż  zgodnie  z doświadczeniem  jest  ona  w granicy 
dokładności  pomiaru  równa  zeru. 

Kiedy  neutron  rozpada  się  wewnątrz  jądra,  to  rozpado- 
wy tworzony  proton  zajmuje  jego  miejsce  w jądrze,  jądra 
co  można  zapisać  tak: 

AZX z*X+e+V'+Q(A,  Z), 

gdzie  ZX — jądro  promieniotwórcze  złożone  z Z 
protonów  i A— Z neutronów. 

Energia  wyzwolona  w tym  procesie  wynosi 

Q(A,  Z)  =-  < m7 -mz+l-me)c2,  (3) 

gdzie  mz  i mz+1 — masy  jąder  AZX  i zAxX.  Ale  różnica 

mas  jąder  nie  jest  bynajmniej  równa  różnicy  mas 
spoczynkowych  ich  składników.  W rzeczywistości 

mz  = Zmp+(A -Z)mn - Z) , (4) 

gdzie  B — energia  wiązania  jądra.  Energia  wiązania 
uwarunkowana  jest  oddziaływaniami  silnymi  i elektro-., 
magnetycznymi  nukleonów  w jądrze  i zależy  od  A i Z 
w sposób  bardzo  złożony.  Korzystając  z wzorów 
(2-4)  mamy 

Q(A,  Z)  = Q0+B(A9  Z+l)-B(A,  Z). 

Ze  względu  na  złożony  charakter  zależności  B(A,  Z) 
wielkość  Q(A,  Z)  może  być  zarówno  większa  od  Go>  jak 
też  znacznie  mniejsza.  Najważniejsze  jest  to,  że  dla 
wielu  wartości  A i Z wielkość  Q(A>  Z)  jest  po  prostu 
ujemna  i że  jądro  takie  jest  trwałe  ze  względu  na 
rozpad  fi~.  Gdyby  było  inaczej,  to  poza  wodorem  nie 
istniałyby  we  Wszechświecie  żadne  inne  pierwiastki 
trwałe. 

W procesie  rozpadu  jest  zachowana  nie  tylko  ener-  zasady  za- 
gia  ale  i pęd.  Gdy  w stanie  końcowym  po  rozpadzie  chowania  w 
mamy  tylko  dwa  ciała  o określonych  masach  (spo-  rozpadzie  I 
czynkowych),  to  łatwo  sprawdzić,  że  dwa  prawa 
zachowania  wyznaczają  jednoznacznie  sposób  po- 
działu energii  Q między  produkty  rozpadu.  Rozpad 
fi  jest  jednak  rozpadem  z trzema  cząstkami  w stanie 
końcowym.  Uwzględnienie  trzeciego  ciała  nie  zwięk- 
sza liczby  równań,  wyrażających  prawa  zachowania, 
a jedynie  liczbę  niewiadomych  (energia  i pęd  trzeciej 
cząstki,  a ponadto  rozmaite  kąty  między  kierunkami 
lotu).  Dlatego  właśnie  prawo  zachowania  energii 
i pędu  nie  wyznacza  jednoznacznie  sposobu  podziału 
energii  Q między  cząstki  końcowe.  Istnieje  nieskoń- 
czenie wiele  możliwości  zgodnych  z prawami  zacho- 
wania i przyroda  w każdym  akcie  rozpadu  wybiera 
w sposób  statystyczny  ów  sposób  rozdziału.  Specy- 
fika rozpadu  fi  polega  na  tym,  że  jeden  z produktów, 
neutrino,  jest  cząstką  niezwykle  przenikliwą,  a zatem 


widmo  fi 


umykającą  obserwacji.  W praktyce  możemy  obser- 
wować i mierzyć  jedynie  energię  elektronu  i jądra 
końcowego  (bardzo  zresztą  małą  w porównaniu 
z energią  elektronu).  Suma  tych  dwóch  energii 
jest  w każdym  akcie  rozpadu  inna  i na  ogół  mniejsza 
od  wartości  Q wyznaczonej  z wzoru  Einsteina 
(w  skrajnym  wypadku  może  być  równa).  Ponieważ 
pomijamy  w praktyce  znikomo  małą  energię  jądra 
końcowego,  więc  energia  elektronów  powstających 
w wielu  aktach  rozpadu  jest  rozrzucona  w sposób 
statystyczny  od  zera  do  wartości  niemal  równej  Q, 
co  oznacza,  że  elektrony  z rozpadu  fi  mają  widmo 
ciągłe  (rys.  1 i 2).  Kształt  tego  widma  był  i jest  przed- 
miotem analizy  teoretycznej  i pomiarów  doświad- 
czalnych, gdyż  można  z niego  wiele  odczytać.  Na 
przykład  jasne  jest,  że  gdyby  masa  spoczynkowa 
neutrina  była  większa  od  zera,  to  maksymalna  energia 
elektronów  (kraniec  widma)  powinna  być  mniejsza 
od  obliczonej  z wzoru  (2).  Przy  założeniu,  że  neutrino 
istnieje  i jest  emitowane  w procesie  rozpadu  fi, 
ciągłe  widmo  energii  elektronów  nie  jest  niczym 


a) 


energia  E 1 02  keV 


Rys.  1 . Typowe  widma  fi.  Na  osi  odciętych  odłożona  jest  energia 
kinetyczna  elektronu  E w keV,  na  osi  rzędnych  względna  liczba 
elektronów  w jednostkowym  przedziale  energii  N(E ) = ANjAE 


Rys.  2.  Porównanie  widma  fi  rozpadu  trytu  z przewidywaniami 
teoretycznymi  przy  różnych  założonych  wartościach  masy  neu- 
trina. Najlepszą  zgodność  uzyskuje  się  przy  mv  = 0.  E energia 
kinetyczna  elektronu,  W całkowita  energia  elektronu  (E-fmc2), 
p pęd  elektronu,  JF(Z,  W)  znany  czynnik  uwzględniający  m.in. 
wpływ  elektrostatycznego  przyciągania  jądra  końcowego  i elek- 
tronu fi  na  kształt  widma 


zagadkowym.  Jednakże  w czasie,  gdy  odkryto  widmo 
ciągłe  w rozpadzie  fi  nikt  nawet  nie  podejrzewał 
istnienia  neutrina.  Przy  założeniu  zaś,  że  jądro  rozpada 
się  tylko  na  dwa  ciała,  widmo  ciągłe  energii  przeczy 
w oczywisty  sposób  prawu  zachowania  energii. 
Kiedy  zmierzono  energię  i kierunek  lotu  jądra  koń- 
cowego, to  przekonano  się,  że  również  prawo  za- 
chowania pędu  musiałoby  być  naruszone.  Z kolei 
analiza  spinów  cząstek  uczestniczących  w rozpadzie 
fi  (oczywiście  przy  pominięciu  neutrina)  wykazała 
załamanie  prawa  zachowania  momentu  pędu.  Aczkol- 
wiek niektórzy  fizycy  traktowali  poważnie  możliwość 
naruszenia  wszystkich  tych  praw  zachowania,  to 
jednak  znaleźli  się  inni,  którzy  raczej  uwierzyli 
w hipotezę  W.  Pauliego  postawioną  w 1930  r., 
według  której  w rozpadzie  fi  musi  być  emitowana 
jeszcze  jedna  cząstka.  Wkrótce  nawet  nadano  jej 
nazwę  — neutrino. 

Jednym  z fizyków  doceniającym  znaczenie  hipotezy 
Pauliego  był  E.  Fermi,  który  w 1932  r.  stworzył  pier- 
wszą konsekwentną,  acz  nie  ostateczną  teorię  oddzia- 
ływań słabych,  uwzględniającą  istnienie  neutrina. 
Przez  długie  lata  była  to  cząstka  hipotetyczna.  Dopiero 
w latach  pięćdziesiątych  F.  Reines  i C.  Cowan 
udowodnili  bezpośrednio,  że  neutrino  rzeczywiście 
istnieje,  gdyż  może  (choć  niezmiernie  rzadko)  wy- 
wołać nową  reakcję  w dowolnej  odległości  od  miejsca 
ego  wytworzenia. 

Oprócz  jąder  wykazujących  promieniotwórczość  Za- 
znane są  także  jądra  wykazujące  promieniotwórczość 
/?+.  Ogólne  równanie  procesu  fi+  ma  postać: 

AZX  (5) 

Jasne,  że  przy  Z — 1 i A — 1 proces  (5)  byłby  roz- 
padem protonu.  Ale  dla  swobodnego  protonu  wiel- 
kość Q występująca  w równaniu  (5)  jest  ujemna 
(ponieważ  proton  jest  lżejszy  od  neutronu),  zatem 
swobodny  proton  jest  cząstką  trwałą.  Mimo  to, 
wygodnie  jest  wyobrażać  sobie,  że  rozpad  fi+  jądra 
jest  rezultatem  rozpadu  protonu  wewnątrz  tego 
jądra.  Niezbędną  energię  „pożycza”  proton  od  całego 
jądra.  Podobny  efekt  występował  także  przy  roz- 
padzie fi~  wówczas,  gdy  wyzwolona  energia  Q(A,  Z) 
była  większa  od  Q0 . Chociaż  rozpad  swobodnego 
protonu  jest  wzbroniony,  można  rozpad  fi~  związane- 
go neutronu  i rozpad  fi*  związanego  protonu  trakto- 
wać na  zupełnie  równych  prawach.  W tym  miejscu 
ujawnia  się  nonsensowność  rozpatrywania  neutronu 
jako  zbudowanego  z protonu,  elektronu  i antyneutri- 
na.  Gdyby  tak  było,  to  powinniśmy  z kolei  proton 
uważać  za  zbudowany  z neutronu,  pozytonu  i neutri- 
na. Inaczej  mówiąc,  neutron  byłby  zbudowany  z sa- 
mego siebie,  a ponadto  z elektronu,  pozytonu,  neu- 
trina i antyneutrina,  co  jest  — przynajmniej  w do- 
słownym rozumieniu  słowa  „zbudowany  z” — jaw- 
nym bezsensem. 

Proces  rozpadu  czyli  przekształcania  się  cząstek 
jest  czymś  fundamentalnie  nowym,  zjawiskiem  niezna- 
nym fizyce  klasycznej,  w której  wszelkie  procesy 
sprowadzały  się  do  przegrupowywania  składników. 
Należy  wyobrazić  sobie,  że  w momencie  rozpadu  zni- 
ka po  prostu  cząstka  pierwotna,  na  jej  miejsce  zaś 
pojawiają  się  nowe,  których  przedtem  nie  było.  W 
takim  ujęciu  procesy  rozpadu  są  podobne  do  proce- 
sów zderzeń  nieelastycznych.  Te  ostatnie  należy  rozu- 
mieć jako  znikanie  cząstek  początkowych  i powsta- 
wanie na  ich  miejsce  cząstek  końcowych,  których  nie 
było  przed  aktem  oddziaływania. 

W tym  ujęciu  termin  „oddziaływanie”  oznacza  moż- 
liwość znikania  jednych  cząstek  i pojawiania  się 
na  ich  miejsce  innych. 


Zasada  krzyżowania 

Zajmijmy  się  teraz  dokładniej  owym  „traktowaniem 
na  równych  prawach”  procesu  rozpadu  neutronu 
(fi~)  i rozpadu  protonu  (/?+).  Aby  móc  sformułować 
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dokładniej  co  to  znaczy,  musimy  najpierw  rozpatrzyć 
jaki  jest  związek  między  wielkościami  charakteryzu- 
jącymi rozpad  neutronu  swobodnego,  a charaktery- 
stykami rozpadu  jądra.  Nie  jest  to  związek  będący 
równością  odpowiednich  parametrów.  Na  przykład, 
energia  maksymalna  elektronu  Q(A,  Z)  jest  inna  niż 
analogiczna  wielkość  £>0,  na  pewno  różne  są  też  czasy 
życia.  Przecież  dla  wielu  wartości  A i Z jądro  jest 
trwałe,  co  odpowiada  nieskończonemu  czasowi 
życia  tegoż  jądra.  Porównując  odpowiednie  dane 
można  się  przekonać,  że  kształty  widma  elektronów 
bywają  bardzo  różne  dla  różnych  jąder  (rys.  1).  Czyż 
nie  jest  to  w sprzeczności  ze  sformułowaniem,  że 
rozpad  jądra  należy  rozumieć  jako  wynik  rozpadu 
jednego  z jego  neutronów?  Okazuje  się,  że  nie.  Rzecz 
uniwersał-  w tym,  że  wszystkie  te  procesy  są  dokładnie  opisane 
ność  hamil-  identycznym  hamiltonianem  oddziaływania  i jeśli 
tonianu  od-  zostanie  on  poprawnie  dobrany  do  opisu  jednego 
działywania  tylko  procesu  (1),  to  automatycznie,  przez  stosowanie 
uniwersalnych  metod  teorii  kwantowej,  ten  sam  ha- 
miltonian pozwala  doskonale  opisać  wszystko  co  się 
da  zmierzyć,  dla  rozpadów  rozmaitych  jąder.  Róż- 
norodność rozpadów  p odzwierciedla  bogactwo 
struktury  różnych  jąder,  ale  nie  wnosi  już  nic  istot- 
nego do  poznania  własności  oddziaływań  słabych. 
Jest  to  niewątpliwie  dużym  sukcesem  kwantowej 
teorii  pola  i dowodem  jej  wielkiej  przydatności  do 
opisu  oddziaływań.  Pod  tym  względem  teoria  ta  jest 
podobna  do  teorii  grawitacji  Newtona,  dzięki  której 
wystarczy  z jednego  doświadczenia  wyznaczyć 
stałą  grawitacyjną,  aby  na  podstawie  tej  teorii  móc 
opisywać  ruchy  wszelkich  planet,  komet,  gwiazd 
podwójnych,  statków  kosmicznych  itp. 

Kwantowa  teoria  pola  oprócz  tego,  że  pozwala  ze 
znajomości  rozpadu  swobodnego  neutronu  przepo- 
wiedzieć dokładnie  jak  będzie  się  on  zachowywał 
w jądrze  atomowym;  przewiduje  też,  że  ten  sam 
hamiltonian  opisujący  rozpad  (1)  musi  opisać  pro- 
cesy, w których  dowolną  cząstkę  przeniesiemy  „na 
drugą  stronę  reakcji”  z jednoczesną  zamianą  na 
antycząstkę  (zasada  krzyżowania),  jak  też  procesy, 
w których  odwrócimy  kierunek  przebiegu  reakcj i. 

Jest  oczywiste,  że  reakcję  p -*■  n+e++ve  można 
otrzymać  z reakcji  n — ► p+e~+ve  przez  przeniesienie 
elektronu  i antyneutrina  na  drugą  stronę  i zmianę 
znaku  strzałki.  Tym  samym  widzimy,  że  wszelkie 
procesy  /?“  i /?+  są  przejawem  dokładnie  jednego 
i tego  samego  oddziaływania.  Cała  informacja  o tym 
oddziaływaniu  jest  zawarta  w fakcie  zachodzenia 
reakcji  (1)  oraz  w kwantowych  regułach  obliczeń. 
Oczywiście  przenosząc  na  drugą  stronę  dwie  cząstki 
w reakcji  rozpadu,  dostajemy  znów  proces  rozpadu. 
Teoria  kwantowa  wiąże  ponadto  te  rozpady  z proce- 
sami, w których  przenosi  się  na  drugą  stronę  tylko 
edną  cząstkę.  Są  to  już  procesy  rozpraszania,  np. 

Ve+P  n+e+9  (6) 

e+p  -*  «+v«.  (7) 

dowody  na  Dowód  Reinesa  i Cowana  na  istnienie  neutrina 

istnienie  polegał  właśnie  na  zaobserwowaniu  reakcji  (6)  za- 
neutrina  inicjowanej  przez  antyneutrina  wydobywające  się 

w ogromnych  ilościach  z pracującego  reaktora  ją- 
drowego. Słabość  oddziaływania  polega  na  tym,  że 
z miliardów  antyneutrin  przelatujących  przez  detek- 
tor jedynie  kilkadziesiąt  wywołało  reakcję  (6),  a reszta 
przeleciała  bez  jakichkolwiek  oddziaływań.  Wspomi- 
naliśmy już  o tym,  że  jest  zupełnie  nierealne  próbować 
obserwować  reakcję  (7)  tymi  samymi  metodami  co 
reakcję  (6),  Mimo  to  proces  (7)  występuje  dość 
często  i jest  nieźle  zbadany,  jednak  nie  jako  proces 
rozproszeniowy,  lecz  jako  tzw.  wychwyt  elektronu 
atomowego,  przeważnie  z powłoki  K.  Można  się 
przekonać,  że  dla  pojedynczego  protonu  i elektronu 
o prawie  zerowej  energii  zasada  zachowania  energii 
zabrania  reakcji  (7).  Wynika  to  stąd,  że 

me+mp  < mn-  (8) 


Ale  dla  odpowiednio  dobranego  jądra  (podobnie  jak 
w przypadku  rozpadów  /?+)  można  poprawić  bilans 
energetyczny  i odwrócić  znak  nierówności  (8). 
Reakcja 

e+*X-+z*X+Ve  (9) 

może  zachodzić,  jeżeli 

me+mz  > wz_1. 

Nierówność  ta  jest  słabsza  od  nierówności 
mz  > mz_1Jrn7e, 

będącej  warunkiem  koniecznym  rozpadu  j$+.  A zatem 
jeśli  jądro  ulega  rozpadowi  fi+,  to  również  może 
następować  wychwyt  elektronu,  ale  nie  na  odwrót. 
Znane  są  jądra,  dla  których  nie  wystarcza  energii  na 
rozpad  /?+,  a wystarcza  na  wychwyt  elektronu. 

Zwróćmy  uwagę  na  to,  że  z punktu  widzenia  atomu 
jako  całości,  wychwyt  elektronu  jest  procesem 
rozpadu.  Ponieważ  w wyniku  reakcji  wychwytu 
powstają  dwa  ciała:  neutrino  i atom  końcowy,  koń- 
cowa energia  atomu  (w  praktyce  jądra)  jest  ściśle 
określona.  Doświadczalne  wykazanie  tego  faktu 
pięknie  potwierdziło  hipotezę  o istnieniu  neutrina 
i o spełnieniu  prawa  zachowania  energii  w oddziały- 
waniach słabych.  Należy  przy  tym  podkreślić,  że 
czasy  życia  atomu  ze  względu  na  wychwyt  elektronu, 
obliczone  na  podstawie  zasady  krzyżowania,  są 
zgodne  z doświadczeniem,  co  przekonuje  nas,  że 
wychwyt  elektronu  jest  wywołany  tym  samym  do- 
kładnie oddziaływaniem,  co  reakcja  (1). 


Skrętność  neutrina  i łamanie  symetrii 
zwierciadlanej 


Zastanowimy  się  teraz  dlaczego  w reakcjach  raz  wy- 
stępuje neutrino,  a raz  antyneutrino  i czym  te  cząstki 
się  różnią.  W tym  celu  załóżmy  najpierw,  że  neutrino 
i antyneutrino  są  identyczne  (podobnie  jak  foton 
jest  swą  antycząstką):  ve  = ve.  Przepiszemy  reakcję 
(6)  z uwzględnieniem  powyższego  fałszywego  zało- 
żenia 

ve+p  -*  n+e+  (10) 


oraz  reakcję  jaką  dostajemy  z (1)  po  przeniesieniu  ve 
na  lewą  stronę 

ve+n-*p+e~.  (11) 


Ze  wzorów  (10)  i (11)  wynika,  że  bombardując 
„neutrinami”  z reaktora,  materię  złożoną  z równej 
(z  grubsza)  liczby  neutronów  i protonów  powinniśmy 
obserwować  jednakową  liczbę  reakcji,  w których 
powstają  elektrony  i reakcji  z utworzeniem  pozytonu. 
Jest  to  w jawnej  sprzeczności  z doświadczeniem  — 
obserwujemy  w takim  wypadku  tylko  proces  (10), 
a nigdy  (11).  Innymi  słowy,  cząstki  z reaktora  są 
antyneutrinami,  a w reakcji  (10)  nie  wolno  opuścić 
kreski  nad  symbolem  ve.  Można  więc  uznać,  że 
antyneutrina  to  te  cząstki,  które  oddziałując  z nukleo- 
nami przekształcają  się  w pozytony  (antyelektrony), 
a neutrina  to  te,  które  przekształcają  się  w elektrony. 

Zgodnie  z zasadą  krzyżowania,  jeśli  ani  elektro- 
nów, ani  neutrin  nie  było  na  początku  (jak  w rozpa- 
dach /?*),  to  wraz  z elektronem  zostanie  wytworzone 
antyneutrino,  a wraz  z antyelektronem  (pozytonem) 
— neutrino.  Fakty  te  pozwalają  wprowadzić  pojęcie 
liczby  leptonowej  i zasadę  zachowania  tej  liczby. 
Przypisując  elektronowi  i neutrinu  liczbę  leptonową  1, 
a ich  antycząstkom  liczbę  — 1,  widzimy,  że  we  wszy- 
stkich procesach  dotychczas  omawianych  suma 
tych  liczb  nie  ulega  zmianie  w wyniku  reakcji.  Korzy- 
stając z prawa  zachowania  liczby  leptonowej,  zawsze 
możemy  ustalić  czy  dana  cząstka  jest  neutrinem  czy 
antyneutrinem  (wystarczy  znać  jej  pochodzenie 
bądź  zaobserwować  wywołaną  przezeń  reakcję). 
Oczywiście  można  zapytać,  czy  poza  liczbą  leptono- 
wą neutrino  i antyneutrino  różnią  się  jeszcze  jakąś 
inną,  mierzalną  cechą.  Odpowiedź  na  to  jest  twier- 
dząca. Neutrina,  podobnie  jak  elektrony  i nukleony. 


różnice 
między  neu 
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mają  własny  moment  pędu  (spin)  z tym,  że  elektron 
(lub  nukleon)  może  mieć  rzut  spinu  na  kierunek  lotu 
równy  bądź  bądź  a neutrino  ma  zaw- 

sze rzut  spinu  na  kierunek  pędu  równy  — V2#. 
skrętność  Neutrino  jest  pod  tym  względem  zupełnie  wyjątkowe, 
neutrina  Jak  mówimy  obrazowo,  neutrino  zawsze  „wiruje” 
w lewo.  Natomiast  antyneutrino  zawsze  „wiruje” 
w prawo.  Zauważmy,  że  aby  stwierdzenia  te  miały 
sens,  neutrino  musi  być  cząstką  o masie  dokładnie 
równej  zeru,  a zatem  musi  zawsze  poruszać  się  z pręd- 
kością światła.  W przeciwnym  wypadku  łatwo  popaść 
w sprzeczność.  Rozpatrzmy  dwóch  obserwatorów 
O i O ' (rys.  3).  Niech  w układzie  odniesienia  O neu- 


Rys.  3.  Neutrino  obserwowane  przez  dwóch  obserwatorów: 
obserwatora  O,  względem  którego  porusza  się  w dodatnim  kie- 
runku osi  x i obserwatora  O'  poruszającego  się  względem  O 
szybciej  niż  neutrino  (foo7  > vó).  Obserwator  O'  widzi,  że  neutri- 
no porusza  się  w ujemnym  kierunku  osi  x'  i że  wiruje  w prawo  w 

stosunku  do  swej  prędkości  vo' 


trino  leci  w dodatnim  kierunku  osi  x i wiruje  w lewo 
w stosunku  do  kierunku  swego  lotu.  Jeśli  prędkość 
neutrina  vo  jest  mniejsza  od  c,  to  przy  prędkości 
vo'o  obserwatora  O ' względem  układu  O większej  od 
vo  zaobserwuje  on  w układzie  O'  ten  sam  kierunek 
wirowania  względem  osi  x\  ale  tym  razem  kierunek 
lotu  neutrina  będzie  przeciwny  (obserwator  O'  wy- 
przedza neutrino).  Zatem  obserwator  O'  powie,  że 
neutrino  wiruje  w prawo  w stosunku  do  kierunku 
swego  lotu. 

Fakt  określonej,  zawsze  jednakowej  skrętności 
neutrin  ma  ważne  konsekwencje.  Fizyka  klasyczna, 
jak  również  fizyka  kwantowa,  ale  w zakresie  zjawisk 
wywoływanych  oddziaływaniami  silnymi  i elektro- 
symetria  magnetycznymi,  wykazywała  pewną  symetrię  zwaną 
zwierciadła-  symetrią  zwierciadlaną.  Przedstawiając  poglądowo, 
symetria  zwierciadlana  polega  na  tym,  że  jeśli  jakiś 
proces  jest  możliwy  (to  znaczy  zgodny  z prawami 
fizyki),  to  również  zgodny  z prawami  fizyki,  a więc 
możliwy  do  realizacji,  jest  proces  podobny  do  rozpa- 
trywanego, ale  w którym  wszelkie  ruchy  i konfigura- 
cje są  takie,  jakie  by  widział  obserwator  obserwujący 
odbicie  tego  pierwszego  procesu  w zwierciadle. 
Na  przykład,  śruba  prawoskrętna  z odpowiednią 
nakrętką  działa  zgodnie  ze  swym  przeznaczeniem. 
Gdybyśmy  popatrzyli  na  śrubę  z nakrętką  (oraz  na 
proces  ich  skręcania)  w zwierciadle,  to  by  się  nam 
wydawało,  że  jest  to  śruba  lewoskrętna.  Ale  taką 


z 


zwierciadło 

Rys.  4.  Rozpad  /?  neutronu  i jego  obraz  w zwierciadle  Z.  Obraz 
antyneutrina  w zwierciadle  wiruje  w lewo.  W rzeczywistości  pro- 
cesu takiego  nigdy  nie  obserwujemy 


lewoskrętną  śrubę  można  skonstruować  naprawdę 
i będzie  ona  równie  użyteczna  w zastosowaniach. 
Podobnie,  przywykliśmy  do  zasad  ruchu  prawostron- 
nego na  drogach.  Jeśli  jednak  wszystkie  pojazdy 
zmienią  ruch  na  lewostronny,  to  nadal  będzie  to  kon- 
sekwentna metoda  unikania  kolizji. 

Przykłady  takie  można  mnożyć  w nieskończo- 
ność. Tymczasem  spójrzmy  na  obraz  w zwierciadle 
jakiegokolwiek  procesu  z udziałem  neutrin,  np.  na 
obraz  procesu  (1)  (rys.  4).  Ujrzymy  neutron  rozpada- 
jący się  na  proton,  elektron  i pewną  cząstkę  wirującą 
w lewo,  a więc  nie  tak  jak  antyneutrino  w rzeczywi- 
stym procesie,  lecz  jak  neutrino.  Taki  proces  jest 
jednak  niemożliwy.  Przyroda  nigdy  go  naprawdę  nie 
realizuje.  (Nie  wiemy  dlaczego,  ale  tak  po  prostu  jest!) 
Można  więc  stwierdzić,  że  przy  oddziaływaniach 
słabych  nie  jest  spełniona  zasada  symetrii  zwierciadla- 
nej. Ten  sam  fakt  określa  się  też  jako  niezachowanie 
parzystości  w oddziaływaniach  słabych.  Naruszenie 
symetrii  zwierciadlanej  prowadzi  do  zaskakujących 
asymetrii,  sprzecznych  całkowicie  z intuicją  ukształto- 
waną przez  fizykę  klasyczną.  Pierwszym  doświadcze- 
niem, w którym  taką  asymetrię  wykryto,  było  do- 
świadczenie wykonane  przez  panią  C.S.  Wu  i współ- 
pracowników, a zaproponowane  przez  T.D.  Lee  i N. 
C.  Yanga.  Doświadczenie  polegało  na  badaniu  rozpa- 
dów jąder  kobaltu  e0Co.  Decydujące  o zaobserwo- 
waniu asymetrii  było  oziębienie  próbki  kobaltu  do 
bardzo  niskiej  temperatury  i umieszczenie  jej  w silnym 
polu  magnetycznym.  Jądra  kobaltu  mają  spin  i zwią- 
zany z nim  moment  magnetyczny.  W normalnych 


łamanie  sy- 
metrii zwier- 
ciadlanej 


doświadcze- 
nie Włi 


sytuacja  niemożliwa,  bo 
antyneutrino  nie  unosi 
spinu  + -^-7),lecz  ~/); 
zmiana  zwrotu  wirowa- 
nia elektronu  jeszcze 
pogorszyłaby  sprawę 


sytuacja  zgodna  z 
zasadą  zachowania 
momentu  pędu 


Rys.  5.  Asymetria  „góra-dół”  w rozpadzie  /?“  jądra  ,0  Co.  Strzałka 
na  jądrze  kobaltu  nie  symbolizuje  całego  spinu  jądra  lecz  jedynie 
różnicę  (równą  4-1  łt)  między  spinem  60  Co  i *°Ni.  Różnica  ta 
uniesiona  musi  być  przez  v + e.  Lecące  w dół  antyneutrino  nie 
może  jednak  unieść  tego  momentu  pędu, bo  musi  wirować  tak  jak 
na  rysunku  (w  prawo  do  kierunku  swego  lotu).  Na  dolnym  rysun- 
ku sytuacja  jest  już  zgodna  z prawami  zachowania  i ustaloną 
skrętnością  antyneutrina 

warunkach  kierunki  owych  momentów  (czyli  „płasz- 
czyzny wirowania”  jąder)  są  ustawione  chaotycznie. 
W silnym  polu  magnetycznym  wszystkie  momenty 
magnetyczne  ustawiają  się  równolegle  do  pola  magne- 
tycznego. Można  też  powiedzieć,  że  wszystkie  jądra 
wirują  w płaszczyznach  równoległych  i w tę  samą 
stronę.  Załóżmy,  że  płaszczyzna  jest  pozioma  a jądra 
wirują  np.  w lewo  jeśli  patrzymy  na  próbkę  „z  góry” 
(rys.  5)  Wiadomo,  że  jądra  60Co  wykazują  promienio- 
twórczość /K  W wyniku  rozpadu  powstaje  jądro  60Ni, 
elektron  i antyneutrino.  Jądro  60Ni  ma  spin  mniejszy 
o 1 h od  jądra  60Co.  Zgodnie  z zasadą  zachowania 
momentu  pędu  ów  jednostkowy  spin  musi  być  unie- 
siony przez  elektron  i antyneutrino.  Ponieważ  każda 
z tych  cząstek  może  mieć  rzut  spinu  na  oś  pionową 
równy  to  aby  z rzutów  tych  złożyć  -j-ltf,  za- 

równo spin  elektronu  jak  i spin  antyneutrina  muszą 
wynosić  -f1^-  Gdyby  antyneutrino,  które  musi 
kręcić  się  w prawo  w stosunku  do  swego  pędu,  leciało 
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„w  dół”,  to  rzut  jego  spinu  na  oś  pionową  byłby 
— V2 h i prawo  zachowania  momentu  pędu  nie  mo- 
głoby być  spełnione.  W efekcie  kierunek  „w  górę” 
jest  dla  antyneutrin  uprzywilejowany.  Z tego,  że  suma 
wszystkich  pędów  musi  być  równa  zeru,  wynika,  że 
dla  elektronów  uprzywilejowany  jest  kierunek  „w 
dół”  — tam  leci  faktycznie  większość  elektronów. 


h 

V 


sytuacja  rzeczywista 


e 


Z 


e 


zwierciadlany  obraz  tej 
sytuacji  sprzeczny  z tym, 
co  w przyrodzie  napraw- 
dę zachodzi 


Rys.  6.  Dozwolona  konfiguracja  po  rozpadzie  "Co  i jej  obraz 
w zwierciadle  poziomym.  Na  obrazie  tym  antyneutrina  lecą  w dół „ 
a więc  tak  jak  im  faktycznie  nie  wolno 


Spoglądając  na  odbicie  tej  sytuacji  w zwierciadle  płas- 
kim równoległym  do  płaszczyzny  „wirowania”  (rys. 
6),  ujrzymy  sytuację  sprzeczną  z prawem  przyrody. 
W odbiciu  tym  kierunek  „wirowania”  jąder  nie  uleg- 
nie zmianie,  a elektron  zamiast  głównie  „w  dół” 
lecieć  będzie  głównie  ,,do  góry”,  czyli  na  odwrót  niż 
w rzeczywistym  doświadczeniu. 

Za  postawienie  hipotezy,  że  oddziaływania  słabe 
naruszają  symetrię  prawo-lewo,  fizycy  N.C.  Yang 
i T.D.  Lee  dostali  nagrodę  Nobla  w tym  samym 
roku,  w którym  doświadczenie  pani  Wu  hipotezę  tę 
potwierdziło  (1957  r.). 


Oddziaływania  słabe  mionów 

pary  w przyrodzie  oprócz  pary  leptonów  ( e , v<?)  występuje 
leptonów  inna  para  leptonów : mion  i neutrino  mionowe  Cu,  v„) 
oraz  ich  antycząstki.  Przekonano  się,  że  oddziaływa- 
nie tych  cząstek  z nukleonami  jest  identyczne  jak 
pary  (e,  ve).  Dokładniej  mówiąc,  identyczny  co  do 
postaci  jest  hamiltonian  oddziaływania,  jeżeli  zastą- 
pimy w nim  symbole  elektronu  i neutrina  elektrono- 
wego odpowiednimi  symbolami  mionu  i neutrina 
mionowego.  Nie  trzeba  zmieniać  nawet  stałej  sprzę- 
żenia, jest  ona  taka  sama  („uniwersalna”).  Oczy- 
wiście, obliczając  dalej  prawdopodobieństwa  proce- 
sów z udziałem  mionów,  wszędzie  w odpowiednich 
miejscach  wstawiamy  masę  mionu  a nie  elektronu 
i to  prowadzi  do  oczywistych  różnic  całkowicie 
jednoznacznie  uwzględnianych  przez  teorię.  3 tak  np. 
masa  mionu  jest  większa  od  różnicy  mas  dowolnych 
dwóch  jąder  o tej  samej  liczbie  masowej  A — nie 
obserwujemy  więc  w ogóle  procesów  analogicznych 
do  rozpadu  /?,  ale  z udziałem  mionów.  Na  odwrót, 
proces  analogiczny  do  wychwytu  elektronu  jest 
energetycznie  zawsze  możliwy,  bo 

mu+mv  > win,  mu+mz  > mZ- 1, 


gdyż  masa  mionu  jest  równa  106  MeY/c2,  a różnice  : 
mas  izobarów  (jąder  o tym  samym  A)  nie  przekraczają  , 

10  MeY/c2.  Dodatkowym  czynnikiem  faworyzują- 
cym wychwyt  mionu  jest  fakt,  że  mion  w mezoatomie 
(atomie,  w którym  jeden  z elektronów  zastąpiony  jest 
mionem)  jest  średnio  znacznie  bliżej  jądra  niż  elek- 
trony z najgłębszych  nawet  powłok.  Powoduje  to,  że 
czas  życia  mezoatomu  ze  względu  na  wychwyt  mionu 
jest  o wiele  rzędów  wielkości  krótszy  od  analogicznego 
czasu  dla  wychwytu  elektronu.  Warto  podkreślić 
jeszcze  raz,  że  i w tym  wypadku  czas  życia  można 
jednoznacznie  obliczyć  (zgodnie  z doświadczeniem) 
przy  założeniu  dla  mionów  tej  samej  postaci  i „inten- 
sywności” oddziaływania,  którą  wyznaczono  z pro- . 
cesu  (1). 

Podobnie  reakcja 

vfi+p  -+  p++n  (12) 

w pełni  analogiczna  do  reakcji  (6)  była  obserwowana. 
Porównując  reakcje  (6)  i (12)  można  szczególnie  do- 
bitnie wykazać  sens  uniwersalności  oddziaływań  sła- 
bych mionów  i elektronów.  Otóż  dla  tych  reakcji 
przeprowadzonych  przy  bardzo  dużych  energiach 
antyneutrin  (dużo  większych  od  energii  spoczynko- 
wej mionu)  można  oczekiwać,  że  wpływ  masy  mionu 
na  przekrój  czynny  powinien  być  pomijalny.  Ale  jeśli 
tak,  to  w tych  warunkach  reakcje  (6)  i (12)  powinny 
zachodzić  jednakowo  często  (przy  tej  samej  energii  ve 
i Vu ) — już  bez  potrzeby  uwzględniania  jakichkolwiek 
poprawek.  Po  prostu  przy  tych  samych  natężeniach 
antyneutrin  w dwóch  analogicznych  doświadczeniach 
i tym  samym  czasie  naświetlania  powinno  być  tyle 
samo  reakcji  (6)  w jednym  doświadczeniu,  co  reakcji 
(12)  w drugim.  Wniosek  ten  jest  zgodny  z doświad- 
czeniem. 

Nasuwa  się  więc  pytanie,  co  różni  ve  od  v„.  Otóż  różnice 
jedyna  znana  różnica  polega  na  tym,  że  neutrina  między  ve 
pierwszego  typu  wywołują  reakcje  z elektronami  a 
w stanie  końcowym,  a neutrina  drugiego  typu  — 
zawsze  z mionami.  Konkretnie,  antyneutrina  pow- 
stające wraz  z mionem  w rozpadzie  pionu 


n~  fi~- f-vM 


wywołują  reakcję  (12),  a nigdy  reakcję  (6).  Fakt 
ten  pozwala  na  zdefiniowanie,  oprócz  wprowadzonej 
już  elektronowej  liczby  leptonowej  Le , nowej  liczby 
leptonowej  Lu  równej  +1  dla  pr  i vU9  —1  dla  p+  i vu 
oraz  0 dla  pozostałych  cząstek.  Obie  liczby  leptono- 
we  — z dokładnością  na  jaką  pozwala  obecna  tech- 
nika doświadczalna  — spełniają  niezależne  prawa 
zachowania. 

Znamy  już  dwie  reakcje  (1)  i (12),  z których  przez 
krzyżowanie  można  uzyskać  wszelkie  możliwe  procesy 
z udziałem  nukleonów  i leptonów  określonego  typu. 
Skoro  jednak  para  (n,  p)  oddziałuje  z parą  ( e , vc) 
i parą  (/*,  v„)  i to  w ten  sam  sposób,  to  powstaje 
pytanie,  czy  pary  ( e , ve ) i (p,  v*i)  mogą  oddziaływać 
ze  sobą.  Okazuje  się,  że  tak.  Prototypem  jest  tu  reakcja 
rozpadu  mionu  na  neutrino  mionowe,  elektron 
i antyneutrino  elektronowe: 

pr  ->  vliJre~  -rve.  (13) 

Jest  ona  bardzo  podobna  do  rozpadu  swobodnego 
neutronu  na  proton,  elektron  i antyneutrino  elektro- 
nowe. (Reakcja  (1)  przechodzi  dokładnie  w (13)  jeśli 
zastąpimy  n -»  p~, p -*  vv).  Czas  życia  mionu  wynosi 
10“6  s.  Okazuje  się,  że  jeśli  do  obliczenia  tego  czasu 
użyć  hamiltonianu  oddziaływania  o takiej  samej  po- 
staci jak  hamiltonian  opisujący  rozpad  (1)  i z tą  samą 
stałą  sprzężenia,  to  dostanie  się  wynik  zaledwie  o 5% 
mniejszy  od  zmierzonej  wartości.  Owa  rozbieżność 
jest  większa  od  dokładności  pomiaru  — powrócimy 
jeszcze  do  tego  problemu. 


Rys.  7.  Trzy  prototypowe  oddziaływania : a)  pary  ( n , p)  z parą 
(<?,  ve)\  b)  pary  0*,  v»)  z parą  (e,  ve)  i pary  («,  p ) z parą  (^,  v<t).  Prze- 
nosząc linię  którejkolwiek  cząstki  na  drugą  stronę  linii  przery- 
wanej z jednoczesną  zamianą  na  antycząstkę  możemy  dostać 
diagramy  wielu  innych  możliwych  procesów 
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Podsumujmy  nasze  wiadomości  o oddziaływaniach 
słabych  omówionych  dotychczas.  Sześć  cząstek, 
które  rozpatrywaliśmy  («,  p , e , v€,  /«,  v*)  grupują  się 
w trzy  pary  («,  p)>  (e,  ve)  i G“>  vv)-  Istnieją  trzy  „ele- 
mentarne” procesy,  w których  uczestniczą  dwie 
kompletne  pary,  a więc  cztery  cząstki.  Można  je 
symbolicznie  przedstawić  w postaci  diagramów 
(rys.  7). 

Powyższe  diagramy  można  interpretować  jako  śla- 
dy torów  cząstek  uczestniczących  w procesie.  Po 
lewej  stronie  linii  przerywanej  narysowano  cząstki 
początkowe,  po  prawej  — produkty  reakcji.  Zgodnie 
z zasadą  krzyżowania,  z każdego  diagramu  można 
otrzymać  wiele  innych  diagramów  przez  odchylenie 
jednej*  (lub  więcej)  linii  tak,  by  znalazły  się  one  po 
przeciwnej  stronie  linii  przerywanej  z jednoczesną 
zmianą  cząstki  na  antycząstkę. 


Oddziaływania  słabe  innych  cząstek. 

Model  kwarkowy 

Powyżej  zostało  przedstawione  oddziaływanie  słabe 
sześciu  cząstek.  Zadziwiające  jest,  że  cała  różnorod- 
ność procesów  opisana  jest  jedną  formułą  matema- 
tyczną (hamiltonian  oddziaływania)  i jedną  stałą 
sprzężenia  (jeśli  pominąć  5%  rozbieżność).  Wiemy 
jednak,  że  liczba  cząstek  jest  bardzo  duża  i wszys- 
tkie one  uczestniczą  w słabych  oddziaływaniach.  Nie 
obserwujemy  wprawdzie  rozpadów  słabych  wszyst- 
kich znanych  cząstek  nietrwałych,  ale  to  tylko  dlatego, 
że  niektóre  cząstki  są  nietrwałe  ze  względu  na  inne  od- 
działywania i żyją  zbyt  krótko,  by  powstała  realna 
szansa  zauważenia  ich  słabego  rozpadu,  który  jednak 
w zasadzie  jest  możliwy.  O tym,  że  cząstki  takie 
uczestniczą  w słabych  oddziaływaniach  może  nas 
przekonać  np.  fakt  zachodzenia  reakcji 

Vn+p  -*  /u~-M+  + 

(cząstka  J++  Cząstki  elementarne  i ich  oddziaływa- 
nia). 

Ale  nawet  ograniczając  się  do  rozpadów  tylko 
tych  cząstek,  które  nie  mogą  rozpadać  się  wskutek 
oddziaływań  innych  niż  słabe,  napotykamy  na  ogrom- 
ną różnorodność  procesów.  Na  przykład,  mezon  K~ 
(i  podobnie  X+)  rozpada  się  na  co  najmniej  26  znanych 
różnych  sposobów  (tabela  cząstek  w -►  Cząstki  ele- 
mentarne i ich  oddziaływania).  Wydaje  się  zrazu, 
że  idea  uniwersalności  postaci  oddziaływań  słabych 
musi  się  załamać.  Przemawia  za  tym  występowanie 
procesów  powolnych,  w których  nie  uczestniczą  bynaj- 
mniej cztery  cząstki  o spinie  ł/2,  lecz  np.  trzy  lub  pięć, 
z tego  część  cząstek  o spinie  0,  np. 

7Z~  ->  p-  +P(X>  K~  -*  TL~  +n+  +e~  +Ve. 

W teorii  pola,  hamiltonian  opisujący  oddziaływanie 
czterech  cząstek  o spinie1^  nie  może  opisywać 
innych  oddziaływań  niż  czterech  cząstek  o spinie  */*• 
Do  opisu  powyższych  procesów  należałoby  użyć 
dwu  nowych  hamiltonianów.  Oczywiście  nic  nie 
zabrania  Przyrodzie  być  tak  skomplikowaną.  Szo- 
kujące jest  natomiast  to,  że  na  przekór  pozorom,  ideę 
uniwersalności  oddziaływań  słabych  można  utrzymać 
(uzyskując  doskonały  opis  rzeczywistości),  i że  w 
gruncie  rzeczy  nieznaczne  uogólnienie  poznanych  już 
oddziaływań  pozwala  na  opisanie  różnorodnych  roz- 
padów cząstek  elementarnych.  Rzecz  w tym,  że  to  co 
nazywamy  cząstkami  elementarnymi  stanowi  w więk- 
szości struktury  złożone.  Ogromnym  postępem  w kie- 
runku uzyskania  zwartego  opisu  oddziaływań  słabych 
jest  przyjęcie,  że  wszystkie  hadrony  są  zbudowane 
model  z niewielkiej  liczby  kwarków.  Jest  to  przeniesienie 
kwarkowy  modelu  z poziomu  jądra,  według  którego  wszystkie 
hadronów  jądra  są  złożone  z dwóch  rodzajów  nukleonów,  a roz- 
pady jąder  są  odzwierciedleniem  jednego  procesu 
elementarnego,  co  bardzo  upraszcza  sytuację.  Gdy- 
byśmy ignorowali  fakt  złożoności  jąder,  to  do  opisu 
rozpadu  fi  każdego  jądra  musielibyśmy  używać  innego 


hamiltonianu  i innej  stałej  sprzężenia.  W tej  sytuacji 
wydawałoby  się,  że  z własności  rozpadu  jednego  jądra 
nie  można  wywnioskować  nic,  co  dotyczyłoby  rozpa- 
du innego  jądra. 

Hadrony  (znane  do  1974  r.)  można  było  zbudować 
w określony  sposób  z kwarków  trzech  rodzajów:  d9 
w,  5,  w tym  nukleony  tylko  z kwarków  d i u o ładun- 
kach -xUe  i +2jze  ( e — ładunek  elementarny).  W 
modelu  tym  pfoton  i neutron  to  układy  złożone  z 
kwarków  w sposób  następujący : 

n = (d  d u),  a p = (w  u d). 

Przyjmijmy,  że  rozpad  nukleonu  jest  spowodowany 
rozpadem  jednego  z jego  kwarków  składowych.  Proces  waricAW 

(1)  zastępujemy  przez 

d -►  K+e”+Ve.  (14) 

Mimo  ułamkowych  ładunków  kwarków  widać,  że 
reakcja  ta  zachowuje  ładunek  całkowity.  Fakt,  że 
kwark  rozpada  się  wewnątrz  hadronu,  nie  stanowi 
żadnej  przeszkody  — ten  sam  problem  występował 
w poprzedniej  wersji  rozpadu  jądra  — teoria  kwanto- 
wa dobrze  sobie  z tym  radzi. 

Spójrzmy  pod  tym  kątem  na  reakcję  rozpadu 

n~  -+•  7r°  +e~ -f- iv.  (15) 

W modelu  kwarkowym -r  to  układ  związany  an- 
tykwarku  u i kwarku  d,  a ir°  to  superpozycja  układu 
(u  u)  i ( dd ).  Rozpad  (15)  możemy  traktować  dokład- 
nie tak,  jak  rozpad  fi~  jądra.  Zakładamy  więc,  że  d 
rozpada  się  na  «,  e~  i v«: 
fir 

l l 

(i u d)  -►  {u  u)+e~+ve. 


Możliwy  jest  też  rozpad  antykwarku  u: 

u -*■  d+e~+ve  (zasada  krzyżowania) 
prowadzący  do  procesu 


fi- 

! I 

(u  d)-+(d  J)+e-+ve. 

W wyniku  równoległego  zachodzenia  tych  procesów 
dostajemy  na  końcu  dokładnie  tę  suprepozycję  (u  u) 
i C i d),  która  jest  mezonem  n°.  Prawdopodobieństwo 
tego  rozpadu  można  obliczyć  dokładnie  tak  samo, 
jak  rozpadu  fi~  jądra  i wtedy  uzyska  się  — bez  żadnych 
nowych  parametrów  czy  założeń  — wynik  zgodny 
z doświadczeniem.  Umawiamy  się,  że  zamiast  pary 
(«,  p)  uważamy  odtąd  za  elementarną  parę  ( d , u). 

W celu  opisania  oddziaływań  słabych  cząstek  dziw- 
nych trzeba  ustalić,  w jaki  sposób  kwark  s (kwark 
dziwny)  uczestniczy  w słabych  oddziaływaniach. 
Informacji  tych  dostarczyć  może  rozpad 

K-  ->  7T°  + *-  + Ve.  (16) 


opis  rozpadu 

cząstek 

dziwnych 


W modelu  kwarkowym  K~  jest  układem  (w  s\  n° 
zaś  nie  zawiera  kwarku  s.  Zatem  kwark  ten  musi  roz- 
padać się  w trakcie  procesu  (16)  na  p9  e~  i ve: 

s -*  u- fe“4-ve.  (17) 

Jest  to  proces  bardzo  podobny  do  (14),  którym  za- 
stąpiliśmy „złożony”  proces  (1) — jedyna  różnica, 
to  zamiana  d na  s . Stosując  standardową  teorię  do 
procesu  (16)  (z  tą  samą  stałą  sprzężenia)  dostalibyśmy 
czas  życia  zbyt  krótki  o czynnik  ok.  20.  Klucz  do  roz- 
wiązania zagadki  może  stanowić  fakt,  że  po  raz 
pierwszy  napotykamy  parę  cząstek  (j,  w),  w której 
składnik  u wystąpił  już  w innej  parze  ( dy  u).  W rezul- 
tacie para  (d9  u)  sprzęga  się  nieco  słabiej  niż  para 
(py  v„)  a para  (sy  u)  sprzęga  się  najsłabiej.  kgt  Cabibbo 

Wprowadzając  jedną  parę  z kombinacją  kwarków 
d i s 

(d  cosfl+Asinfl,  u) 

sprzężoną  równie  silnie  jak  para  ( e , ve)  bądź  (/*,  vv) 
można  uzyskać  doskonały  opis  wszystkich  znanych 
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Rys.  8.  Wzajemne 
oddziaływanie  słabe 
kwarków  d i u 


Rys.  9.  Oddziały- 
wanie elastyczne 

V«  + £ — ► Va  + e 


Rys.  10.  Przejście 
od  obrazu  oddzia- 
ływania czterofer- 
mionowego  do  od- 
działywania z udzia- 
łem bozonu  pośred- 
niego 


procesów,  jeżeli  tylko  kąt  0 (kąt  abibbo)  przyjmiemy 
równy  0,22; 

sinfl  = 0,22  (sin20  » 1/20  = 5/100). 

Dlaczego  wartość  tego  kąta  wynosi  właśnie  tyle  — nie 
wiemy.  Jest  to  jeden  z dwóch  parametrów  charaktery- 
zujących słabe  oddziaływania  (obok  stałej  Fermie- 
go G),  który  na  obecnym  etapie  wiedzy  brać  musimy 
z doświadczenia. 

Nasuwa  się  pytanie,  czy  oprócz  procesów  z udzia- 
łem 2 różnych  par  („dubletów”)  występują  słabe  pro- 
cesy, w których  dublet  oddziałuje  z samym  sobą,  np. 

d+u  -*  u+d,  (18) 

co  symbolizuje  rys.  8.  Okazuje  się,  że  tak.  Nie  jest  to 
łatwo  potwierdzić.  Rzecz  w tym,  że  proces  d-\-  u -> 
■"*  u+d  zachodzi  też  wskutek  oddziaływań  silnych. 
Jednakże  oddziaływania  słabe  naruszają  parzystość. 
Chociaż  więc  są  odpowiedzialne  za  znikomy  ułamek 
potencjału  oddziaływania  d u (lub/z-p  — rzeczywisty 
neutron  — rzećzy  wisty  proton),  to  jedynie  ten  ułamek 
może  prowadzić  do  naruszenia  symetrii  lewo-prawo 
i w efekcie  do  tego,  że  jądra  atomowe  wysyłają  czasa- 
mi promieniowanie  y o nieznacznej  przewadze  jedne- 
go rodzaju  polaryzacji  kołowej  nad  drugą. 

Zaobserwowano  również  (z  ogromnym  trudem) 
rozpraszanie  elastyczne  antyneutrin  na  elektronach, 
a więc  reakcję 

Ve+e  -►  Ve+e, 

którą  przedstawia  rys.  9 (diagram). 

Najprostszy  sposób  naturalnego  uwzględnienia 
tych  wszystkich  procesów  polega  na  przypuszczeniu, 
że  istnieją  dwie  cząstki  o dużej  masie,  spinie  1 i ła- 
dunkach ± le9  tzw.  bozony  pośrednie  W+  i W~9  które 
sprzęgają  się  (jednakowo  silnie!)  do  każdego  z trzech 
dubletów.  Diagram  procesu  czterofermionowego  np. 
(14)  przyjmie  więc  nową  postać.  Można  go  interpre- 
tować  jako  rozpad  dna  u i W~9  który  dalej  może  za- 
mienić się  na  parę  e i ve  (rys..  10).  Istnienie  rozpraszania 
elastycznego  (np.  18)  jest  w tym  obrazie  zupełnie  na- 
turalne (rys.  11). 

W ten  sposób  podaliśmy  niezbędne  informacje  po- 
trzebne do  opisu  oddziaływań  słabych  znanych  do 
1973  r.  Rok  ten  przyniósł  odkrycie  nowego  rodzaju 
sprzężenia,  a rok  następny  odkrycie  cząstek,  do  któ- 
rych opisu  stało  się  niezbędne  wprowadzenie  czwartego 
kwarku  c (powabnego). 

Oba  te  fakty  zostały  przewidziane  przez  słynną 
teorię  Weinberga-Salama  oddziaływań  słabych  (roz- 
winiętą w pracy  Glashowa,  Iliopoulosa  i Maianiego). 
Analizując  problem  rozbieżności  w wyższych  rzędach 
rachunku  zaburzeń  kwantowej  teorii  pola,  doszli  oni 
do  wniosku,  że  przedstawioną  tu  teorię  można  i trzeba 
ulepszyć  (zmodyfikować).  Niezbędna  modyfikacja 
polega  na  wprowadzeniu  czwartego  kwarku  c,  a ra- 
czej czwartego  dubletu 

(— ^sin0-f-scos0,  c)  (19) 


Rys.  1 1 . Sprzęże- 
nie dubletu  (d  u) 
do  bozonu  pośred- 
niego prowadzi  w o- 
czywisty  sposób  do 
możJiwości  oddzia- 
ływań elastycznych 


opisującego  w pełni  słabe  rozpady  cząstek,  w których 
skład  wchodzi  ów  czwarty  kwark  c,  oraz  jeszcze 
jednego  bozonu  Z (nienaładowanego)  sprzęgającego 
się  w określony  sposób  z linią,  w której  nie  nastę- 
puje zmiana  tożsamości  cząstki  (czy  będzie  to  lep- 
ton, czy  kwark). 

Wiele  przewidywań  tej  teorii  zostało  już  potwier- 
dzonych. Tak  więc  odkryto  w 1977  r.  już  wszystkie 
sześć  cząstek  powabnych  o spinie  0 (spokrewnio- 
nych z mezonami  n \ K)  i stwierdzono,  że  rozpadają 
się  one  w sposób,  który  przewiduje  teoria.  Pomijając 
sin20  jako  wielkość  małą,  moglibyśmy  w zerowym 
przybliżeniu  dwa  dublety  kwarków  przedstawić  w po- 
staci {d,  u)  i ( s , c ).  W tym  przybliżeniu  kwark  c 
musi  rozpadać  się  na  kwark  s i bozon  W+.  Ten  ostatni 
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może  się  z kolei  przekształcać  np.  na  parę  i ve,  co 
prowadzi  do  procesu 

Z>+  ^ AT°+e+-fve 

lub 

X°+;r+, 

jeżeli  W+  rozpadnie  się  akurat  na  parę  (u,  d)  (rys.  12). 
Jest  tutaj  istotne,  że  w stanie  końcowym  wystąpi 
(prawie  zawsze)  cząstka  dziwna.  Dokładniej,  nastąpi 
to  w 95%,  bo  tyle  wynosi  cos^. 


Rys.  12.  Dwa  spośród  wielu  możliwych  rozpadów  słabych  czą- 
stki D+,  w skład  której  wchodzi  kwark  c rozpadający  się  głównie 
na  kwark  s i bozon  W+.  Kwark  s na  rysunku  można  zastąpić 
kwarkiem  d,  ale  według  teorii  prawdopodobieństwo  tych  no- 
wych procesów  byłoby  mniejsze  o czynnik  tg2&  % l/20 


Rys.  13.  Niektóre  procesy  z wymianą  bozonu  neutralnego.  Pro- 
cesy a),  b)  i c)  są  zupełnie  nieoczekiwane  w klasycznej  wersji 
teorii  słabych  oddziaływań.  Proces  c)  powinien  prowadzić  do 
łamania  symetrii  zwierciadlanej  w procesach  związanych  z ab- 
sorpcją i emisją  światła  przez  atomy.  Proces  d)  wnosi  istotny 
wkład  do  procesu  przedstawionego  na  rys.  1 1 modyfikując  prze-  — ^ 
widywanie  starej  teorii  dotyczące  łamania  symetrii  zwierciadlanej 
w fizyce  jądrowej 


Natomiast  założenie  istnienia  bozonu  Z0  prowadzi 
do  przewidywania  procesów  niemożliwych  w poprzed- 
niej wersji  teorii,  a mianowicie:  v+d  v-f -d,  v#4- 

-*■  vu+e  itp.  przedstawionych  na  rys.  13. 

Oba  te  procesy  zostały  doświadczalnie  potwier- 
dzone. Określa  się  je  jako  oddziaływania  „poprzez 
prądy  neutralne”,  co  oznacza  po  prostu,  że  przy 
przechodzeniu  cząstki  przez  punkt  oddziaływania  nie 
następuje  zmiana  jej  ładunku. 

Najciekawszy  i najbardziej  kontrowersyjny  jest 
proces  e+p  (lub  n ) -*  e+p  (lub  n)  przedstawiony  na 
rys.  13c.  Jest  to  proces  elastycznego  rozpraszania  elek- 
tronu na  nukleonie.  Proces  ten  jest  maskowany  oczy- 
wiście normalnymi  oddziaływaniami  elektromagne- 
tycznymi, ale  podobnie  jak  przy  oddziaływaniach 
nukleonów  prowadzi  on  do  efektywnego  potencjału 
elektron-nukleon  (a  więc  i elekt ron-jądro)  naruszają- 
cego parzystość  (o  efekcie  tym  wspominaliśmy  już  we 
wstępie).  Powoduje  to  m.in.  bardzo  nieznaczne  skrę- 
cenie płaszczyzny  polaryzacji  światła  przechodzącego 
przez  jednoatomowe  pary  metali  ciężkich.  W pierw- 
szych doświadczeniach  (niedokładnie  jeszcze  spraw- 
dzonych) efektu  nie  stwierdzono,  a w każdym  razie 
nie  jest  on  większy  niż  ok.  1J6  tego  co  przewiduje  teoria 
Weinberga-Salama.  Do  roku  1979  potwierdzono 
istnienietego  oddziaływania  tak  jak  przewiduje  teoria, 
czego  konsekwencją  było  przyznanie  Weinbergowi, 
Salamowi  i Glashowowi  nagrody  Nobla  z fizyki"  Czy 
jest  to  nowe  wyzwanie,  które  zmusi  do  modyfikacji  tej 
pięknej  teorii,  czy  tylko  błąd  w analizie  danych  — 
jeszcze  nie  wiadomo.  Przypuszczalnie  problem  zo- 
stanie rozstrzygnięty,  zanim  ten  artykuł  dotrze  do 
Czytelników. 

L.A.  Okuń  Słabe  oddziaływania  cząstek  elementarnych , War- 
szawa 1966;  R.  Sosnowski,  G.  Białkowski  Cząstki  elementarne. 
Warszawa  1971. 
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Jądra  atomowe  i ich  wzbudzenia  • Siły  jądrowe  • Modele  jądro- 
we Rozpady  jąder  atomowych  Reakcje  jądrowe  Jądra  ato- 
mowe w stanach  ekstremalnych  • Fizyka  ciężkich  jonów  • Spek- 
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dra  Energia  jądrowa  Energia  termojądrowa  Radioizotopy 


Jądra  atomowe  i ich  wzbudzenia 


Piotr  Decowski 

Jądro  atomowe  składa  się  z dodatnio  naładowanych 
elektrycznie  protonów  i obojętnych  elektrycznie  neu- 
tronów, nazywanych  wspólnie  nukleonami.  Liczba 
protonów  Z w jądrze  nosi  nazwę  liczby  atomowej  lub 
liczby  porządkowej  jądra,  a liczba  wszystkich  nu- 
kleonów A = Z+Nt  gdzie  N jest  liczbą  neutronów, 
nosi  nazwę  liczby  masowej  jądra.  Jądro  o liczbach 
Z,  N i A oznacza  się  krótko  gdzie  za  X wpisuje 
się  symbol  chemiczny  odpowiadający  liczbie  atomowej 
Z.  Na  przykład  jądro  berylu  (Z  = 4)  o liczbie  masowej 
A = 9 oznacza  się  JBe6.  Często  w tym  oznaczeniu 
pomija  się  liczbę  neutronów  N==A—Z. 
izotopy.  Jądra  o tym  samym  Z,  a różnych  A>  nazywamy 
izotony,  izotopami.  Na  przykład  ^Oe  i ^Oio  są  dwoma  izo- 
izobary  topami  tlenu.  Jądra  o tym  samym  N,  a różnych  Ay 
nazywamy  izotonami,  np.  x|Oio  i ioNe10.  Jądra 
o tym  samym  A , a różnych  Z,  nazywamy  izobarami, 
np.  *{JAr22  i JgCa^.  [Ponieważ  w normalnych  warun- 
kach jądra  występują  nie  same,  ale  z powłokami  ele- 
ktronowymi, często  nazywamy  izotopami,  izotonami 
czy  izobarami  nie  grupy  jąder  o omówionych  włas- 
nościach, lecz  odpowiadające  im  grupy  atomów.] 
Liczby  Z i N lub  Z i A określające  skład  jądra  nie 
charakteryzują  go  jeszcze  w pełni.  Może  ono  bowiem 
znajdować  się  w różnych  stanach.  Każdy  stan  okre- 
ślony jest  przez  pewien  zespół  cech,  do  którego  na- 
leżą: energia  Z,  całkowity  moment  pędu  (spin,  kręt) 
energia  / j parzystość  P.  Parzystość  jest  cechą  czysto  kwanto- 
wzbudzenia  Wą  (jest  własnością  funkcji  falowej  opisującej  stan 
jądra);  może  być  dodatnia  (+)  lub  ujemna  (-). 
Wśród  wszystkich  stanów  jądra  wyróżniony  jest  stan 
o najmniejszej  energii  E0.  Nazywamy  go  stanem  pod- 
stawowym. Wszystkie  stany  pozostałe  są  stanami 
wzbudzonymi.  Energia  wzbudzenia  jest  różnicą  ener- 
gii stanu  wzbudzonego  i stanu  podstawowego  jądra. 


Własności  jąder  w stanie  podstawowym 

siły  Jądro  istnieje  dzięki  działaniu  jądrowych  sił  wzajem- 
jądrowe  nego  przyciągania  nukleonów  (-*  Siły  jądrowe). 

W porównaniu  z siłami,  z jakimi  spotykamy  się  w 
świecie  makroskopowym,  są  to  siły  olbrzymie.  Dwa 
nukleony,  mikroskopijne  obiekty  o rozmiarach  rzędu 
10“ 13  cm,  mogą  się  przyciągać  z siłą  równą  ciężarowi 
masy  około  10  ton ! Siły  te  jednak  działają  tylko  wtedy, 
gdy  odległość  między  nukleonami  jest  bardzo  mała 
— rzędu  10“ 13  cm,  a już  w odległości  paru  femtome- 
trów  zanikają.  Zatem  „efektywna”  siła  działająca 
między  nukleonami  w jądrze  jest  kilkadziesiąt  razy 
mniejsza,  ale  w porównaniu  z naszymi  wyobrażeniami 


jeszcze  olbrzymia.  Krótki  zasięg  sił  jądrowych  powo- 
duje, że  nukleon  w jądrze  „czuje”  obecność  tylko  ota- 
czających go  najbliższych  paru  sąsiadów,  niezależnie 
od  liczby  pozostałych  nukleonów.  Dlatego  też  gę- 
stość materii  jądrowej  jest  stała,  nie  zależy  od  liczby 
nukleonów  w jądrze  i wynosi  około  1,7  -1 038  nukle- 
onów/cm3. Nasuwa  się  analogia  do  kropli  nieściśli- 
wej cieczy,  w której  siły  van  der  Waalsa  działają  tylko 
między  najbliższymi  cząsteczkami.  Z tych  względów 
objętość  jądra  jest  proporcjonalna  do  liczby  nukle- 
onów (a  więc  do  liczby  masowej  A danego  izotopu). 

Wyznaczenie  rozmiarów  tak  małego  obiektu  jak  rozkład 
jądro  atomowe  nie  jest  łatwe.  Większość  metod  opie-  ładunku 
ra  się  na  badaniu  przestrzennego  rozkładu  ładunku 
jądra.  Informacji  o rozkładzie  ładunku  dostarcza  na 
przykład  obserwacja  strumienia  elektronów  mają- 
cych bardzo  dużą  energię,  rozpraszanych  w różnych 
kierunkach  przez  badaną  próbkę.  Długość  fali  elek- 
tronów o energii  rzędu  kilkuset  MeV  jest  bliska  roz- 
miarom jądra  i obraz  rozpraszania  ma  charakter 
dyfrakcyjny,  podobnie  jak  obraz  dawany  przez  wiąz- 
kę światła  napotykającą  na  swej  drodze  przeszkodę 
o rozmiarach  porównywalnych  z długością  fali  świe- 
tlnej (rys.  1).  Analizując  elektronowy  obraz  dyfrak- 
cyjny można  odtworzyć  kształt  rozkładu  ładunku, 
a więc  i rozkładu  protonów  w jądrze.  Z innych  waż- 
niejszych sposobów  pomiaru  rozkładu  ładunku  moż- 
na wymienić  pomiar  mas  jąder  o tej  samej  liczbie 
masowej  A , lecz  różniących  się  liczbą  neutronów  i pro- 
tonów o 1:  azXn  i z^Yn.x  (są  to  tzw.  jądra  zwier- 
ciadlane). Główną  przyczyną  występowania  różnicy 
mas  jest  energia  kulombowska  dodatkowego  protonu 
w polu  elektrostatycznym  pozostałych  protonów  za- 
leżna od  ich  rozkładu  przestrzennego.  O rozkładzie 
ładunku  można  również  wnioskować  z badania  wid- 
ma promieniowania  towarzyszącego  wychwytowi 
na  orbitę  atomową  „ciężkiego  elektronu1 , — mionu. 

Orbita  mionu,  dzięki  jego  dużej  masie,  może  znajdo- 
wać się  w bezpośrednim  sąsiedztwie  jądra,  w związku  . „ 

z czym  rozkład  ładunku  może  mieć  istotny  wpływ-  na  promień 
jej  parametry.  Zgodnie  z przewidywaniami  gęstość  ładunkowy 
ładunku  w dużym  obszarze  jądra  jest  prawie  stała, 
zaś  w pobliżu  powierzchni  jądra  szybko  spada  do  ze- 
ra. Zależność  gęstości  od  odległości  od  środka  masy 
opisuje  tzw.  rozkład  Fermiego  (rys.  2): 

z \ Qo 

W*  1 ’ 

w którym  promień  jądra,  zwany  promieniem  ładun- 
kowym, wynosi  R = 1,07  /4^3fm,  natomiast  a (tzw. 
rozmycie  powierzchni  jądra)  równa  się  0,55  fm. 
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logaryłm  względnego  natężenia, Ig  / 


Użycie  elektronów  do  sondowania  jądra  ma  pewną 
istotną  zaletę.  Oddziałują  one  ze  składnikami  jądra 
tylko  poprzez  siły  elektromagnetyczne  — nie  „czują” 
> sił  jądrowych.  Dlatego  też  opisują  rzeczywisty  rozkład 

ładunku.  Inaczej  jest,  gdy  do  badania  rozmiarów  jąder 
stosuje  się  rozpraszanie  wiązek  nukleonów,  cząstek 
a czy  też  innych  cząstek  oddziałujących  z nukleonami 
również  siłami  jądrowymi.  Uzyskany  wówczas  roz- 
kład gęstości  materii  jądrowej  jest  podobny  do  roz- 
promień kładu  gęstości  ładunku,  z tym,  że  wyznaczony  pro- 
potencjałowy  mień  jądra,  noszący  nazwę  promienia  potencjałowe- 
go, jest  większy:  R=  1,21  Jest  to  zrozumiałe, 

gdyż  pojawienie  się  sił  jądrowych  powoduje,  że  cząstka 
bombardująca  zaczyna  „odczuwać”  jądro  już  w pew- 
nej odległości  od  jego  powierzchni. 

Masa  jądra  (wyraża  się  ją  ze  względu  na  małą  war- 
tość, w jednostkach  masy  atomowej  u,  lu  jest  równa 
V 12  masy  jądra  izotopu  węgla  12C,  czyli  1,660531- 
•10" 27  kg)  jest  mniejsza  od  sumy  mas  tworzących  je 
nukleonów.  Spowodowane  to  jest  oddziaływaniem 
nukleonów  w jądrze.  Gdyby  zgrupować  swobodne 
nukleony,  to  na  skutek  ich  wzajemnego  przyciągania 
energia  się  wydzieliłaby  się,  kosztem  ich  łącznej  masy,  pewna 
wiązania  energia,  zwana  energią  wiązania  jądra ; taka  energia 
potrzebna  jest  do  rozbicia  jądra  na  pojedyncze  skład- 
niki. Energię  wiązania  można  obliczyć  ze  wzoru: 

B(A , Z)  = ZmIl+(A-Z)mn-M(A9Z), 
w którym  A i Z oznaczają  odpowiednio  liczbę  maso- 
wą i porządkową  jądra,  M(A,  Z)  — masę  atomu  pier- 
wiastka (tzn.  masę  jądra  wraz  z Z elektronami), 
/nH  — masę  atomu  wodoru,  mn  — masę  neutronu. 

Zgodnie  z zastosowaniem  do  jądra  analogii  kropli 
cieczy,  średnia  energia  wiązania  przypadająca  na  je- 
den nukleon,  B(Ay  Z)/A , winna  być  w przybliżeniu 
stała  dla  wszystkich  jąder.  Warunkować  ją  powinna 
liczba  nukleonów  otaczających  dany  nukleon,  zależ- 
na jedynie  od  gęstości  materii  jądrowej.  W jądrze 
nie  można  jednak  pominąć  wpływu  dodatkowych 
czynników,  z których  najważniejszy  jest  wpływ  nukleo- 
nów znajdujących  się  na  powierzchni  jądra.  Są  one 
słabiej  związane,  podobnie  jak  cząsteczki  znajdujące 
się  na  powierzchni  cieczy  (co  prowadzi  do  powstania 
efektu  napięcia  powierzchniowego),  z tym  że  w ją- 
drze, w związku  z małą  liczbą  nukleonów,  efekty 
powierzchniowe  są  znacznie  bardziej  istotne. 
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Wpływ  różnych  czynników  na  energię  wiązania  wzór 
można  ująć  ogólnie  (->  Modele  jądrowe)  za  pomocą  Weizsacken  I 
tzw.  wzoru  Weizsackera: 

B(A , Z)=axA -a2AW-a3 {A-lZyiA-a,Z2{A^Ą-6. 

Człon  drugi  we  wzorze,  proporcjonalny  do  powierz- 
chni jądra  (R2  ~ A2!3),  uwzględnia  zmniejszanie  energii 
wiązania  przez  efekty  powierzchniowe.  Człon  trzeci, 
proporcjonalny  do  kwadratu  różnicy  liczby  neutro- 
nów i protonów,  mówi  o tendencji  do  utrzymania 
równej  ilości  neutronów  i protonów  w jądrze  (jest  to 
tzw  człon  symetrii  wynikający  z braku  wyróżnienia 
jakiegokolwiek  z dwu  rodzajów  nukleonów  — nad- 
miar protonów  lub  neutronów  zakłóca  tę  symetrię 
i jest  energetycznie  niekorzystny).  Człon  czwarty 
uwzględnia  fakt  istnienia  odpychania  elektrostatycz- 
nego protonów  (energia  potencjalna  naładowanej  kuli 
jest  proporcjonalna  do  Z^/R).  Wreszcie  człon  piąty 
uwzględnia  wynikające  z natury  sił  jądrowych  zjawis- 
ko dążenia  nukleonów  do  łączenia  się  w pary  — jądra 

0 parzystej  liczbie  neutronów  i protonów  są  bardziej 
trwałe  (jest  to  efekt  podobny  do  efektu  nadprzewod- 
nictwa gazu  elektronowego  niektórych  związków  w 
niskich  temperaturach).  Współczynniki  au  a2,  a3,  ax 
oraz  człon  <5  wyznaczone  doświadczalnie  na  podsta- 
wie zmierzonych  mas  jąder  (głównie  metodami  spek- 
trografii masowej,  przez  obserwację  torów  jonów  po- 
ruszających się  ze  znaną  prędkością  w polu  magne- 
tycznym o znanym  natężeniu)  opisują  z dużą  dokład- 
nością energię  wiązania  i masy  jąder  o dowolnym  A 

1 Z.  Wpływ  poszczególnych  członów  na  energię  wią- 
zania ilustruje  rys.  3. 
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Rys.  3.  Wkład  do  średniej  energii  wiązania  nukleonu  różnych 
członów  wzoru  Weizsackera  w zależności  od  liczby  masowej 
jądra.  Od  energii  objętościowej  odejmuje  się  energia  powierzch- 
niowa, kulombowska  i energia  symetrii  (człon  związany  z łącze- 
niem się  nukleonów  w pary  pominięto)  dając  w rezultacie  war- 
tość wynoszącą  dla  większości  jąder  około  8 MeV 


Wzór  Weizsackera  mówi,  że  energia  wiązania,  parabola 
a więc  i masa  jąder  o tym  samym  A (izobarów),  zależy  mas 
parabolicznie  od  liczby  porządkowej  Z (rys.  4). 
Najbardziej  związanymi,  a tym  samym  trwałymi  izo- 
barami,  są  jądra  o liczbie  porządkowej  w pobliżu 
minimum  paraboli  mas.  We  współrzędnych  N=A—Z 
(liczba  neutronów)  i Z układają  się  one  wzdłuż  tzw.  ścieżka 
ścieżki  trwałości  (rys.  5).  Jądra  poza  nią  są  nietrwałe  trwałości 
i ulegają  przemianom  promieniotwórczym  prowa- 
dzącym do  tworzenia  jąder  bardziej  trwałych. 

Spin  jądra  mierzony  w jednostkach  h(fi=hj2n , h 
— stała  Plancka)  jest  zawsze  liczbą  całkowitą  dla 


spin  jądra 


moment 

magnetyczny 


Rys.  4.  Para- 
bola mas 


Rys.  5.  Ścieżka  trwałości 


wartości.  Moment  magnetyczny  wyraża  się  za  pomocą 
jednostki  zwanej  magnetonem  jądrowym: 

» = KI—  = 0,50509-  lO-^erg-Gs”1  = 0,50509  x 
2Mvc 

x 10”**  J T“l 

(Mp  — masa  protonu,  c — prędkość  światła).  Maksy- 
malna wartość  rzutu  momentu  magnet ycznego  na 
wybrany  kierunek  w przestrzeni  wiąże  się  z maksy- 
malną wartością  / rzutu  spinu  na  ten  kierunek: 

Mi  = Igr  Mn  — yikl- 

Wprowadzone  we  wzorze  wielkości  gi  i yi  noszą  naz- 
wę jądrowego  czynnika  g oraz  stosunku  geomagne- 
tycznego. Moment  magnetyczny  wyznacza  się  do- 
świadczalnie, badając  rozszczepienie  linii  w widmach 
atomowych  spowodowane  jego  oddziaływaniem  z po- 
lem magnetycznym  powłok  elektronowych  atomu. 

Wyznaczone  eksperymentalnie  wielkości  g lub  y są 
czułym  sprawdzianem  poprawności  różnych  teore- 
tycznych modeli  budowy  jądra  atomowego. 

Pole  elektryczne  wokół  jądra,  będącego  rozciągłym 
naładowanym  obiektem,  zależy  od  jego  kształtu.  Za- 
leżność tę  opisuje  się  rozkładając  potencjał  elektro- 
statyczny na  szereg  mułtipolowy,  w którym  o wiel- 
kości kolejnych  członów,  zależnych  od  (1/r)  w coraz 
wyższych  potęgach,  decydują  momenty  elektryczne,  mocnfint 
Elektryczny  moment  monopolowy  równa  się  ładun-  elektryczny 
kowi  jądra.  Elektryczny  moment  dipolowy  jest  równy 
zeru  ze  względu  na  równomierne  rozłożenie  ładunku 
w jądrze.  Moment  kwadrupolowy  pojawia  się  wtedy, 
gdy  kształt  jądra  odbiega  od  kształtu  kulistego.  Wyż- 
sze momenty  są  z reguły  bardzo  małe  i zwykle  można 
je  pominąć.  . , . . _ 

Pomiar  momentu  kwadrupolowego  jądra  (np.  kszt alty 
przez  obserwację  wpływu  pola  elektrycznego  jądra  jąder 
na  ruch  elektronów  poruszających  się  po  orbitach 


Rys.  6.  Znak  i wartość  elektrycznego  momentu  kwadrupolowego 
dostarczają  informacji  o kształcie  jądra 


jąder  o parzystej  liczbie  nukleonów  i liczbą  połówko- 
wą dla  jąder  o A nieparzystym.  Pochodzi  on  od  wek- 
torowego złożenia  się  momentów  pędu  ruchu  nukleo- 
nów w jądrze  oraz  ich  własnych  spinów  równych 
1IJt.  Wszystkie  niewzbudzone  jądra  o parzystej  licz- 
bie zarówno  protonów,  jak  i neutronów  mają  spin 
równy  zeru.  Jest  to  konsekwencją  wspomnianej  już 
tendencji  do  łączenia  się  nukleonów  jednego  rodzaju 
w pary.  Całkowity  moment  pędu  takiej  pary  znika, 
gdyż  najchętniej  łączą  się  w nią  nukleony  o przeciwnie 
skierowanych  momentach  pędu.  Wartości  spinów 
wszystkich  jąder  w stanie  podstawowym,  o nieparzy- 
stej liczbie  nukleonów  jednego  lub  obu  rodzajów, 
wyjaśniono  na  podstawie  obecnych  danych  o budo- 
wie jądra.  Jest  to  istotny  sukces  teorii  jądra  atomo- 
wego. 

Jądro  atomowe  ma,  obok  ładunku  elektrycznego 
Ze,  pewne  własności  magnetyczne,  opisywane  przez 
dipolowy  moment  magnetyczny.  Wiąże  się  on  ze  spi- 
nem jądra,  lecz  w odróżnieniu  od  niego  nie  jest  wiel- 
kością skwantowaną  — może  przyjmować  dowolne 


atomowych  — moment  kwadrupolowy  wpływa  na 
nadsubtelną  strukturę  widm  optycznych)  najczęściej 
jest  źródłem  informacji  o kształcie  jądra  (rys.  6).  Oka- 
zuje się,  że  istnieje  wiele  jąder  silnie  zdeformowanych 
w stanie  podstawowym,  o dużej  wartości  momentu 
kwadrupolowego,  których  kształt  przypomina  w więk- 
szości wypadków  wydłużone  cygaro.  Skupiają  się 
one  w pewnych  obszarach  tablicy  pierwiastków 
(np.  zdeformowane  są  jądra  z obszaru  pierwiastków 
ziem  rzadkich  oraz  z obszaru  aktynowców),  poprze- 
dzielanych obszarami  silniej  związanych  jąder  sfe- 
rycznych skupionych  wokół  jąder  magicznych  (tj. 
jąder  o tzw.  magicznych  liczbach  protonów  i neutro- 
nów równych  jednej  z liczb  2,  8,  20,  50,  82,  126 
cechują  się  one  szczególnie  silnym  wiązaniem  i trwa- 
łością). Kształt  jądra  wpływa  na  widmo  jego  wzbu- 
dzeń. Jądra  zdeformowane  mogą  np.  szczególnie  łat- 
wo rotować  wokół  osi  prostopadłej  do  osi  ich  sy- 
metrii. Prowadzi  to  do  pojawienia  się  w ich  energiach 
wzbudzenia  regularnych  sekwencji  zwanych  pasmami 
rotacyjnymi. 
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Wzbudzenia  jąder  atomowych 

Zgodnie  z prawami  mechaniki  kwantowej  jądro  ato- 
mowe może  znajdować  się  tylko  w pewnych  stanach 
o określonych  cechach  kwantowych,  m.in.  spinie, 
parzystości,  energii.  Stwierdzenie  powyższe  jest  ścisłe 
tylko  dla  energii  wzbudzenia  jądra,  która  jest  za  ma- 
ła, aby  mogła  nastąpić  emisja  jakiegokolwiek  nu- 
kleonu z jądra,  czyli  dla  energii  mniejszych  od  energii 
wiązania  najsłabiej  związanego  nukleonu  (zwanej 
energią  wiązania  ostatniego  nukleonu).  Dla  energii 
większych  każda  energia,  spin  i parzystość  są  do- 
puszczalne. Jest  to  zrozumiałe,  gdyż  każdy  stan,  z któ- 
rego może  nastąpić  emisja  cząstki  o pewnej  energii 
kinetycznej,  można  utworzyć  przez  wprowadzenie 
cząstki  o takiej  samej  energii  do  jądra.  Cząstce  mo- 
żemy jednak  nadać  dowolną  energię  kinetyczną. 
W ten  sposób  możemy  tworzyć  stany  jądra  o dowol- 
nej energii.  Okazuje  się  jednak,  że  tylko  przy  niektó- 
rych wyróżnionych  wartościach  energii  jądro  tworzy 
układ  trwający  pewien,  odpowiednio  długi  czas 
(rozumie  się  przez  to  czas  co  najmniej  kilkakrotnie 
dłuższy  od  tzw.  charakterystycznego  czasu  jądrowego 
potrzebnego  na  przejście  najszybszego  nukleonu 
w jądrze  przez  odcinek  równy  średnicy  jądra,  wynosi 
on  w zależności  od  jądra  i jego  energii  wzbudzenia 
10“22-10-23  s).  W odróżnieniu  od  stanów  leżących  po- 
niżej progu  na  emisję  nukleonów,  zwanych  stanami 
związanymi,  wzbudzone  stany  leżące  w obszarze 
stany  continuum  energii  noszą  nazwę  stanów  rezonanso- 
związane  i wych.  Istnienie  bariery  kulombowskiej  na  powierz- 
rezonansowe  chni  jądra  może  być  przyczyną  znacznego  utrudnienia 
emisji  cząstek  naładowanych  ze  stanów  niezwiąza- 
nych  o małej  energii.  Gdy  emisja  neutronów  będą- 
cych cząstkami  obojętnymi  jest  niemożliwa  (gdy  np 
energia  wiązania  neutronu  jest  większa  niż  energia 
wzbudzenia),  stany  takie  wykazują  cechy  stanów 
związanych  i dlatego  nazwano  je  „kwazizwiązanymi”. 

Wszystkie  stany  wzbudzone  jąder,  zarówno  zwią- 
zane jak  i rezonansowe,  istnieją  tylko  przez  pewien 
czas  życia  określony  czas,  którego  średnia  wartość  zwana  jest 
stanu  czasem  życia  stanu.  Stany  związane  rozpadają  się 
przez  wysłanie  promieniowania  y lub  niekiedy  ulega- 
ją rozpadowi  fi  (->  Rozpady  jąder  atomowych).  Stany 
rezonansowe  rozpadają  się  najczęściej  przez  emisję 
nukleonu  lub  grupy  nukleonów. 


Rys.  7.  Krzywa  względnego  prawdopodobieństwa  wzbudzenia 
stanu  o szerokości  r przy  różnych  wartościach  energii 


Prawdopodobieństwo  wzbudzenia  stanu  rezonanso- 
wego jest  funkcją  energii  wzbudzenia  E wyrażoną 
wzorem  (rys.  7)  ^ 

~ <E-£i)*+rJ/4' 

Występująca  we  wzorze  wielkość  r,  równa  zakresowi 
energii,  dla  którego  gęstość  prawdopodobieństwa 
wzbudzenia  stanu  jest  większa  od  połowy  wartości 
maksymalnej  (przy  E = E0\  nazywa  się  szerokością 
energetyczną  stanu.  Stanowi  wzbudzonemu  nie  od- 


powiada więc  dokładnie  jedna  wartość  energii.  Pod 
pojęciem  „energia  stanu”  rozumie  się  odpowiadającą 
mu  wartość  E0.  Szerokość  energetyczna  r wiąże  się 
z jego  czasem  życia  t przez  zasadę  nieoznaczoności 
Heisenberga : 

A x h. 

Stany  rezonansowe  mają  z reguły  znacznie  większą 
szerokość  energetyczną  od  stanów  związanych  (kró- 
cej żyją;  rys.  8 i 9).  Jest  to  konsekwencją  faktu,  że  na 
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Rys.  8.  Szerokość  sta- 
nów niezwiązanych 
jest  znacznie  większa 
niż  związanych  ze 
względu  na  możliwość 
rozpadu  stanów  nie- 
związanych przez  emi- 
sję nukleonów  (rysu- 
nek schematyczny) 


energia  wzbudzenia 

Rys.  9.  Zależność  od  energii  wzbudzenia  szerokości  F poziomów 
o spinie  0 w jądrze  **Sc.  Linie  przerywane  oznaczają  szerokości 
poziomów  w przypadku  gdyby  by2  możliwy  ich  rozpad  tylko 
przez  emisję  kwantów  y (/%)  lub  nukleonów  (f p).  Poniżej  energii 
wiązania  ostatniego  neutronu  emisja  nukleonów  jest  niemożliwa. 
Powyżej  energii  wiązania  jTp  decyduje  o szerokości  stanu 


ogół  emisja  nukleonów  następująca  pod  wpływem 
niezwykle  silnych  oddziaływań  jądrowych  jest  znacz- 
nie bardziej  prawdopodobna  niż  emisja  promienio- 
wania elektromagnetycznego  lub  emisja  elektronu 
i neutrina  w rozpadzie  fi  powodowane  znacznie  słab- 
szymi oddziaływaniami.  Im  wyższa  jest  energia  sta- 
nu, tym  większa  jest  jego  szerokość,  gdyż  rośnie  liczba 
możliwych  sposobów  emisji  nukleonów  (np.  mogą 


szerokość 

energetyczna 

st&srau 


energia  potencjalna 


być  wysyłane  z coraz  bardziej  różnymi  wartościami 
energii),  co  zwiększa  prawdopodobieństwo  rozpadu 
stanu. 

wzbudzenie  Aby  zrozumieć  proces  wzbudzenia  jądra,  wyobraź- 
jądra  my  je  sobie  jako  twór  składający  się  z nukleonów  bę- 
dących w ciągłym  ruchu.  Każdy  nukleon,  podobnie 
jak  elektrony  na  orbitach  atomowych,  porusza  się 
z pewną  określoną  energią  kinetyczną  po  swej  or- 
bicie. Nukleony  są  fermionami,  czyli  cząstkami  o spi- 
nie połówkowym,  muszą  więc  podporządkowywać 
się  zakazowi  Pauliego  mówiącemu,  że  dwie  identycz- 
ne cząstki  nie  mogą  przebywać  w identycznych  sta- 
nach. Dlatego  też,  mimo  że  w jądrze  niewzbudzonym 
nukleony  dążą  do  przebywania  na  orbitach  o jak  naj- 
mniejszej energii,  zakaz  Pauliego  zmusza  je  do  zaj- 
mowania kolejnych,  nie  obsadzonych  orbit  o coraz 
wyższych  energiach  (rys.  lOa). 


Rys.  10.  Schematyczny  rysunek  przedstawiający  różne  rodzaje 
wzbudzeń  jądra  atomowego:  a)  stan  podstawowy  — nukleony 
zajmują  orbity  położone  najniżej  w skali  energetycznej,  b)  wzbu- 
dzenie jednocząstkowe — jeden  z nukleonów  jest  przeniesiony 
na  orbitę  o większej  energii,  c)  wzbudzenie  wieloeząstkowe  — 
wiele  nukleonów  jest  przeniesionych  na  orbity  o wyższych 
energiach 


Rys  11.  Przykłady  wbudzeń  kolektywnych:  a)  przykład  wibracji 
powierzchni  jądrowej  (tzw.  wibracje/?)  wokół  kształtu  sferycznego 
(linia  przerywana),  b)  rotacja  jądra  o spinie  /;  1)  można  ją  opi- 
sać poprzez  ruch  wielu  nukleonów,  2)  znacznie  wygodniej  jest  je 
opisać  za  pomocą  obrotu  jądra  zdeformowanego,  o kształcie 
cygara  (lub  dysku),  wokół  osi  prostopadłej  do  osi  swojej  symetrii* 
Nukleony  w zacieniowanych  obszarach  jądra  me  biorą  udziału 
we  wzbudzeniu 


Wzbudzenie  jądra  atomowego  polega  na  zmianie  wzbudzenia 
ruchu  pewnej  liczby  nukleonów.  Na  przykład  gdy  ca-  jednocząst- 
ła  energia  wzbudzenia  jest  skupiona  na  jednym  nu-  kowe 
kleonie  — tylko  on  jest  przeniesiony  na  orbitę  o więk-  i kolektywne 
szej  energii  — mówimy,  że  wzbudzenie  ma  charakter 
jednocząstkowy  (rys.  lOb).  Jest  to  najprostsza  kon- 
figuracja stanu  wzbudzonego.  We  wzbudzeniu  może 
brać  również  udział  wiele  nukleonów  (rys.  lOc).  Jeśli 
wzbudzenie  przenosi  się  w sposób  skorelowany  z jed- 
nych nukleonów  na  inne,  możemy  mieć  do  czynienia 


Rys.  12.  Gigantyczny  elektryczny  rezonans  dipolowy.  Protony 
i neutrony  drgają  wokół  środka  masy  jądra 

z wzbudzeniem  kolektywnym,  które  objawia  się  np.  rezonans 
w postaci  wibracji  powierzchni  jądrowej  lub  rotacji  gigantyczny 
całego  jądra  (rys.  11).  We  wzbudzeniach  mogą  brać 
udział  w sposób  spójny  niemal  wszystkie  nukleony 
jądra  — prowadzi  to  do  wzbudzeń  typu  rezonansów 
gigantycznych  (rys.  12). 


Modele  i własności  jąder 

Do  opsiu  stanów  stosuje  się  różne  metody  zależnie 
od  typu  wzbudzenia.  Wzbudzenia  o prostej  konfigu- 
racji najłatwiej  przedstawić  opisując  indywidualne 
stany  biorących  w nim  udział  nukleonów.  Dla  wzbu- 
dzeń kolektywnych  taki  opis  jest  już  zbyt  skompliko- 
wany, wymaga  uwzględnienia  dużej  liczby  stopni 
swobody  układu  wielu  nukleonów  biorących  udział 
we  wzbudzeniu.  Sytuacja  znacznie  się  upraszcza  po  współrzędne 
wprowadzeniu  współrzędnych  kolektywnych  zwią-  kolektywne 
zanych  z kształtem  i orientacją  w przestrzeni  jądra 
jako  całości  i rozpatrywaniu  wzbudzeń  niewielu  stop- 
ni swobody  związanych  z tymi  współrzędnymi.  Przy- 
kładem mogą  tu  być  wzbudzenia  rotacyjne  opisywane 
bardzo  prosto  przez  wprowadzenie  obrotu  odpowied- 
nio zdeformowanego  jądra,  natomiast  bardzo  skom- 
plikowane w opisie  wielocząstkowym. 

Aby  opisać  własności  stanów  wzbudzonych  należy 
przyjąć  pewne  założenia  dotyczące  oddziaływań,  ja- 
kim ulegają  nukleony,  czy  też  jakie  wpływają  na  ko- 
lektywne stopnie  swobody.  W tym  celu  stosuje  się 
modele  budowy  jądra  atomowego  (-*Modele  jądro- 
we). Proste  konfiguracje  opisuje  się  za  pomocą  mo- 
delu powłokowego,  operującego  wzbudzeniami  i od- 
działywaniami poszczególnych  nukleonów.  Bardziej 
skomplikowane  konfiguracje  opisuje  się  za  pomocą 
odpowiednich  modeli  kolektywnych. 

Na  ogół  konfiguracja  stanu  wzbudzonego  opisy- 
wana za  pomocą  danego  modelu  nie  jest  konfiguracją 
„czystą”,  tzn.  będącą  określonym  wzbudzeniem  nu- 
kleonu czy  grupy  nukleonów,  czy  też  związaną  ze 
wzbudzeniem  określonego  kolektywnego  stopnia 
swobody.  Wszystkie  stany  różniące  się  tylko  magne-  jądrowy 
tyczną  liczbą  kwantową  — rzutem  spinu  na  wybraną  poziom 
oś  kwantyzacji  określa  się  pojęciem  „jądrowego  po-  energetyczny 
ziomu  energetycznego”.  (Gdy  na  jądro  nie  działają 
czynniki  zewnętrzne,  np.  pole  magnetyczne,  energia 
stanu  nie  zależy  od  kierunku  ustawienia  spinu  w prze- 
strzeni — wszystkie  stany  należące  do  danego  po- 
ziomu mają  wówczas  tę  samą  energię).  Sąsiedztwo 
dwu  poziomów  o innej  konfiguracji  a tym  samym  spi- 
nie i parzystości  powoduje,  że  następuje  „zmiesza-  mieszanie 
nie”  konfiguracji,  tzn.  jeden  i drugi  stan  stają  się  mie-  konfiguracji 
szaniną  obu  konfiguracji  różniących  się  np.  liczbą 
wzbudzonych  nukleonów  (rys.  13;  mieszające  się 
stany  muszą  mieć  ten  sam  spin  i parzystość,  gdyż  od- 
działywania jądrowe  zachowują  te  wielkości).  Jest  to 
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znowu  jedna  z charakterystycznych  kwantowych  cech 
mikroświata:  stany  o identycznych  cechach  kwanto- 
wych są  w zasadzie  nierozróżnialne.  Stany  o nieco 


Przy  dalszym  dodawaniu  nukleonów  do  jądra  po- 
dwójnie magicznego  wzbudzenia  stają  się  coraz  bar- 
dziej kolektywne.  Oddziaływania  między  nukleonami 


Rys.  13.  Mieszanie  konfiguracji . Pod  wpływem  oddziaływań  międzynukleonowych  konfiguracje  blisko  położonych  poziomów  o tym 
samym  spinie  f i parzystości  P ulegają  zmieszaniu 


różnych  cechach  kwantowych,  np.  różnej  energii 
a tym  samym  spinie  i parzystości  starają  się  jak  naj- 
bardziej upodobnić  do  siebie.  Im  mniejsza  jest  róż- 
nica energii  między  nimi,  tym  większy  jest  stopień 
zmieszania.  Mieszanie  się  konfiguracji  można  inter- 
pretować w ten  sposób,  że  jądro  wzbudzone  do  dane- 
go stanu  pod  wpływem  oddziaływań  międzynukleo- 
nowych wielokrotnie  przechodzi  od  jednej  konfigu- 
racji do  drugiej.  Zmieszanie  zmienia  energię  stanów 
— poziomy  odsuwają  się  od  siebie.  Oczywiście,  może 
nastąpić  wzajemne  mieszanie  wielu  sąsiadujących 
poziomów  mających  podobne  liczby  kwantowe. 
W takiej  sytuacji  funkcja  falowa  danego  poziomu  ma 
wiele  składowych  odpowiadających  różnym  kon- 
figuracjom. Poziomy  jądrowe  o niewielkich  energiach 
wzbudzenia  są  stanami  stosunkowo  „czystymi” — w ra- 
mach odpowiednio  dobranego  modelu  dają  się  opisać 
za  pomocą  funkcji  falowej  zawierającej  niewielką  licz- 
bę składowych  o łatwej  interpretacji  fizycznej.  Wynika 
to  stąd,  że  przy  małych  energiach  wzbudzenia  po- 
ziomy o podobnych  liczbach  kwantowych  pojawiają 
się  rzadko. 

Jądra,  w których  liczba  protonów  i neutronów 
równa  jest  jednej  z liczb  magicznych : 2,  8,  20,  50,  82, 
jądra  126,  są  szczególnie  trwałe  (np.  ^O,  JjJCa,  ^Pb) 
magiczne  i nazywane  są  jądrami  magicznymi.  Ze  względu  na 
dużą  trwałość  jąder  magicznych  do  ich  wzbudzenia 
potrzebna  jest  znacznie  większa  energia  niż  do  wzbu- 
dzenia jąder  sąsiednich  (np.  energia  pierwszych  sta- 
nów wzbudzonych  w jądrach  'JO  i Ł|0  wynoszą  od- 
powiednio: ok.  6 MeV  i ok.  2 MeV,  w jądrach 
*g£Pb  i 2gfPb  — odpowiednio  1 MeV  i 2,6  MeV). 
Dlatego  też  najniżej  leżące  poziomy  wzbudzone  ją- 
wzbudzenia  der  bliskich  jądrom  podwójnie  magicznym  są  wzbu- 
jąder  dzeniami  stosunkowo  prostymi.  Bierze  w nich  udział 
bliskich  niewielka  liczba  nukleonów  znajdujących  się  poza 
magicznym  rdzeniem  — jądrem  podwójnie  magicznym.  Na  przy- 
kład wzbudzenia  jądra  różniącego  się  od  jądra  po- 
dwójnie magicznego  liczbą  nukleonów  o jeden  od- 
zwierciedlają sekwencję  kolejnych  poziomów  jedno- 
cząstkowych  w danym  obszarze  liczb  masowych.  W se- 
kwencji tej  nie  widać  jakiejkolwiek  regularności  tak 
w energii,  jak  i w spinach  kolejnych  poziomów  wzbu- 
dzonych. Stąd  też  widma  wzbudzeń  jąder  bliskich 
jądrom  magicznym  również  nie  wykazują  specjalnych 
cech  regularności.  Mogą  one  być  zasadniczo  różne 
w sąsiadujących  jądrach,  gdyż  przy  niewielkiej  liczbie 
wzbudzonych  nukleonów  dodanie  jednego  nukleonu 
zmienia  w sposób  istotny  sytuację.  Przy  wyższych 
energiach  wzbudzenia  konfiguracje  przestają  być  tak 
proste,  ponieważ  możliwe  stają  się  również  wzbudze- 
nia rdzenia,  których  konfiguracje  mogą  się  mieszać 
z konfiguracjami  pozostałych  nukleonów. 
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znajdującymi  się  poza  rdzeniem  prowadzą  do  powsta- 
nia między  nimi  korelacji  (również  przestrzennych, 
np.  może  powstać  trwała  deformacja  jądra).  Wzbudze- 
nia są  teraz  wzbudzeniami  całych  zespołów  nukleo- 
nów. Ich  cechami  charakterystycznymi  są  małe  war- 
tości energii,  występowanie  regularności  w sekwencji 
energii  i spinów  oraz  podobieństwo  u wielu  jąder 
(rys.  14).  Wzbudzenia  mają  charakter  najbardziej 
kolektywny  w jądrach,  w których  liczby  protonów 
i neutronów  Z i N leżą  w przybliżeniu  w połowie  mię- 
dzy dwoma  kolejnymi  liczbami  magicznymi  (np. 
w jądrach  izotopów  pierwiastków  ziem  rzadkich  lub 
aktynowców).  Najbardziej  wyróżniającą  się  cechą  pasma 
wzbudzeń  tych  jąder  są  pasma  rotacyjne  wynikające  rotacyjne 
z istnienia  obrotów  zdeformowanych  jąder  wokół 
osi  prostopadłej  do  osi  ich  symetrii.  Dalsze  zwiększa- 
nie liczby  nukleonów  prowadzi  do  tworzenia  jąder 
coraz  bliższych  następnemu  jądru  magicznemu. 
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Rys.  14.  Widma  wzbudzeń  poziomów  rotacyjnych  jąder  zdefor- 
mowanych. Liczby  podają  energię  wzbudzenia  poziomu  (w  MeV) 
oraz  jego  spin,  znak  (+)  dotyczy  parzystości.  Dla  różnych  jąder 
widma  te  wyglądają  bardzo  podobnie 


Wzbudzenia  tych  jąder  stopniowo  tracą  charakter 
kolektywny. 

duże  energie  Przy  dużych  energiach  wzbudzenia  (od  20  MeV 
wzbudzenia  dla  jąder  lekkich,  od  10  MeV  dla  jąder  ciężkich)  gę- 
stość poziomów  staje  się  bardzo  wielka,  bowiem  po- 
dobną energię  wzbudzenia  można  osiągnąć  różnymi 
sposobami,  np.  przez  wzbudzenie  bardzo  różnej  licz- 
by nukleonów.  Rośnie  szerokość  energetyczna  po- 
ziomów. W rezultacie  poziomy  zaczynają  się  pokry- 
wać. Duża  gęstość  poziomów  powoduje,  że  wszystkie 
stany  w danym  obszarze  energii  wzbudzenia  są  bar- 
dzo silnie  zmieszane  — ich  funkcje  falowe  mogą 
zawierać  nawet  miliony  składowych!  W tej  sytuacji 
do  opisu  własności  poziomów  stosuje  się  na  ogół  me- 
tody statystyczne.  Między  innymi  zakłada  się,  że 
pojawienie  się  każdej  z tych  wielu  konfiguracji  jest 
równie  prawdopodobne.  Obliczone  przy  tych  zało- 
żeniach prawdopodobieństwo  rozpadu  stanu,  np. 
przez  emisję  nukleonu,  jest  uwarunkowane  wyłącznie 
prawdopodobieństwem  przejścia  nukleonu  przez  skok 
potencjału  na  powierzchni  jądra  i nie  wymaga  znajo- 
mości struktury  stanu  rozpadającego  się  i stanu,  w ja- 
kim jądro  pozostaje  po  rozpadzie  (tzn.  nie  trzeba 
rozpatrywać  możliwości  tworzenia  takiej  konfiguracji 
stanu  wzbudzonego,  w której  nukleon  jest  wzbudzony 
do  energii  odpowiadającej  energii  jego  ‘emisji).  W wię- 
kszości wypadków  konfrontacja  z eks 
potwierdza  słuszność  przyjętych  założeń. 


niu  od  gazu  klasycznego,  zależność  całkowitej  energii 
od  temperatury  nie  jest  liniowa  lecz  kwadratowa. 

Gwałtowny  wzrost  gęstości  poziomów  w zależności 
od  energii  wzbudzenia  jest  wynikiem  nie  tylko  zwięk- 
szenia się  ilości  możliwych  sposobów  rozkładu  energii 
wśród  nukleonów  biorących  udział  we  wzbudzeniu, 
lecz  również  wynikiem  wzrostu  średniej  liczby  wzbu- 
dzonych nukleonów. 

Przy  ustalonej  energii  wzbudzenia  gęstość  pozio- 
mów zależy  od  ich  spinów.  Jest  to  zrozumiałe,  gdy  się 
weźmie  pod  uwagę  fakt,  że  aby  utworzyć  stan  o wyso- 
kim spinie,  nukleony  muszą  obsadzać  poziomy  w taki  gęstość 
sposób,  by  spiny  możliwie  licznej  grupy  nukleonów  poziomów 
układały  się  w tym  samym  kierunku  dając  odpowied-  a spin 
ni  o dużą  wypadkową  wartość.  Ogranicza  to  swobodę 
rozdziału  energii  na  poszczególne  nukleony  (a  więc 
swobodę  obsadzania  różnych  orbit)  i obniża  gęstość 
stanów.  Dla  każdej  energii  wzbudzenia  istnieje  pewna 
optymalna  wartość  spinu,  przy  której  gęstość  jest 
maksymalna,  oraz  pewna  maksymalna  wartość  spinu. 

Osiąga  się  ją  tylko  przy  szczególnej,  jedynej  konfigu- 
racji, w której  spiny  nukleonów  ułożone  są  w sposób 
najbardziej  równoległy.  Nie  ma  sensu  wówczas  mówić 
o temperaturze  związanej  ze  wzbudzeniem  — mimo 
dużej  energii  wzbudzenia  jądro  jest  „zamrożone!’,  po- 
dobnie jak  we  wzbudzeniach  bliskich  stanowi  podsta- 
wowemu. Innymi  słowy,  cała  energia  wzbudzenia  jest 
skupiona  w określonym  przez  spin  obrocie  jądra,  nic 


energia  wzbudzenia 

Rys.  15.  Zależność  gęstości  poziomów  od  energii  wzbudzenia  dla 
dwóch  różnych  jąder 

gęstość  Gęstość  poziomów  bardzo  silnie  zależy  od  energii 
poziomów  wzbudzenia.  Zależność  ta  jest  w przybliżeniu  wykład- 
a enargia  nicza  — zwiększenie  energii  wzbudzenia  o 2-3  MeV 
wzbudzenia  powoduje  już  ok.  10-krotny  wzrost  gęstości ! (rys.  15). 

Do  szacowania  gęstości  poziomów  stosuje  się  metody 
statystyczne  z termodynamiki.  Jądro  traktuje  się  wów- 
czas jako  gaz  fermionów  w równowadze  termodyna- 
micznej o pewnej  temperaturze  odpowiadającej  ener- 
gii wzbudzenia,  istnienie  skwantowanych,  stosunko- 
wo rzadko  rozmieszczonych  stanów  energetycznych 
nukleonów  oraz  zakazu  Pauliego  powoduje,  że  spo- 
śród wszystkich  nukleonów  tylko  te  mogą  brać  udział 
we  wzbudzeniach,  które  są  najbliżej  nie  obsadzonych 
stanów  nukleonowych  (najbliżej  tzw.  powierzchni 
Fermiego).  Średnia  liczba  wzbudzonych  nukleonów 
jest  liniową  funkcją  temperatury.  Zatem,  w odróżnie- 


Rys.  16.  Przykłady  teoretycznie  oszacowanych  linii  „yrast” 


nie  pozostaje  na  jego  wzbudzenie  wewnętrzne.  Za-  Sinia  yrast 
leżność  maksymalnej  wartości  spinu  od  energii  wzbu- 
dzenia (rys.  16)  nosi  nazwę  linii  „yrast”  (szwedz.  „naj- 
bardziej zakręcony”).  Istnienie  linii  yrast  ma  poważny 
wpływ  na  rozpad  stanów  wysokospinowych,  m.in. 
utrudnia  emisję  nukleonów,  które  unosząc  z jądra 
znaczną  energię  wzbudzenia  (równą  ich  energii  kine- 
tycznej zwiększonej  o energię  wiązania),  muszą  rów- 
nież wynieść  duży  spin,  gdyż  maksymalny  spin  jądra 
po  emisji  jest  znacznie  mniejszy  od  spinu  wyjściowego. 

Ze  względu  na  ma^  gęstość  poziomów  o dużym 
spinie  stopień  ich  zmieszania  jest  stosunkowo  mały. 

Mimo  znacznej  energii  wzbudzenia  poziomy  o dużym 
spinie  są  więc,  podobnie  jak  poziomy  w pobliżu  stanu 
podstawowego,  stosunkowo  „czyste”.  Utworzenie  stany  wyso- 
jądra  w stanie  o wysokim  spinie  nie  jest  łatwe,  gdyż  kospinowe 
wnikająca  do  jądra  cząstka,  niosąca  duży  moment  pę- 
du, ma  energię  na  tyle  wysoką,  że  mało  prawdopo- 
dobne jest  jej  pozostanie  w jądrze.  Nie  dotyczy  to 
ciężkich  jonów,  które  z powodu  dużej  masy  nawet 
przy  małych  prędkościach  mają  w zderzeniu  z jądrem 
duże  momenty  pędu.  Właśnie  dzięki  reakcjom  przez 
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nie  wywoływanym  stany  wysokospinowe  są  obecnie 
intensywnie  badane. 

Wspomniane  uprzednio  założenie  o równopraw- 
ności każdej  konfiguracji  w obszarze  gęsto  leżących 
stanów  nie  jest  jednakże  zawsze  spełnione.  Okazuje 
się,  że  przy  pewnych  energiach  wzbudzanie  niektórych 
konfiguracji  jest  szczególnie  łatwe,  występują  one  w 
stanach  wzbudzonych  z wyjątkowo  dużą  amplitudą. 
Przykładem  mogą  być  tu  wszelkie  rezonanse  gigan- 

elektryczny  tyczne,  które  zawsze  występują  przy  stosunkowo  du- 
dipolowy  żych  energiach.  Na  przykład  maksimum  elektrycznego 
rezonans  dipolowego  rezonansu  gigantycznego,  polegającego 
gigantyczny  na  oscylacjach  protonów  i neutronów  względem  środ- 
ka masy  jądra,  występuje  przy  energiach  wzbudzenia 
wynoszących  kilkanaście  MeV.  Rezonans  ten  ma  spin 
różniący  się  od  spinu  stanu  podstawowego  o dodaną 
wektorowo  wartość  równą  l/z  i ma  przeciwną  parzy- 
stość. We  wszystkich  stanach  w tym  obszarze  energii 
wzbudzenia,  mających  spiny  utworzone  z wektoro- 
wego dodania  do  spinu  stanu  podstawowego  wartości 
1 h i mających  przeciwną  parzystość  niż  stan  podsta- 
wowy, prawdopodobieństwo  wystąpienia  konfigura- 
cji rezonansu  dipolowego  jest  znacznie  zwiększone, 
co  objawia  się  przez  uprzywilejowanie  emisji  z tych 
stanów  dipolowych  kwantów  y. 

analogowy  Podobną  sytuację  mamy  w wypadku  analogowych 
rezonans  rezonansów  izobarycznych.  Znacznie  upraszczając 
izobaryczny  zagadnienie,  naturę  tych  rezonansów  można  wyjaśnić 
następująco.  Z niezależności  ładunkowej  sił  jądrowych 
wynika,  że  stany  jądrowe  nie  powinny  zależeć  od 
zamiany  neutronu  na  proton  znajdujący  się  na  takiej 
samej  orbicie  (i  odwrotnie  — protonu  na  neutron; 
nie  dotyczy  to  jąder  ciężkich,  w których  istnieje  nad- 
miar neutronów,  więc  wszystkie  orbity  neutronowe 
odpowiadające  protonom  są  już  zajęte),  lecz  powinny 
być  prawie  identyczne.  Jednakże  naładowany  proton 
ma  w polu  kulombowskim  jądra  energię  potencjalną 
wynoszącą  od  kilku  do  kilkunastu  MeV  (w  zależności 
od  ładunku  Ze  jądra),  energia  stanu  musi  być  więc 
o taką  wartość  zwiększona.  Zatem  stan  znajduje  się 
teraz  w obszarze  gęsto  położonych  poziomów  wzbu- 
dzonych jądra  powstałego  po  zamianie  neutronu  na 
proton.  Jest  on  zwany  analogiem  odpowiedniego 
niskoleżącego  stanu  w jądrze  o tym  samym  A (a  więc 
w izobarze),  lecz  o Z protonach  i N neutronach,  nazy- 
wanego stanem  macierzystym.  We  wszystkich  stanach 
wzbudzonych  jądra  (Z+l,  N—  1)  o spinie  i parzysto- 
ści takiej  samej  jak  spin  i parzystość  stanu  macierzy- 
stego, a znajdujących  się  w bezpośrednim  sąsiedztwie 
miejsca,  w którym  powinien  wystąpić  stan  analogowy, 
znacznie  wzmocniona  jest  konfiguracja  taka,  jaką  ma 
stan  macierzysty  (szczególnie  jeśli  jest  to  konfiguracja 
prosta).  Uśrednienie  widma  stanów  w pewnym  prze- 
dziale energii  uwidocznia  pozornie  istniejący  w tym 
obszarze  energii  oddzielny  stan  rezonansowy  o dużym 
wkładzie  struktury  stanu  macierzystego  zwany  ana- 
logowym rezonansem  izobarycznym  (rys.  17).  Do 
opisu  własności  tych  stanów  wprowadza  się  formalizm 
izospinu  (zwanego  również  spinem  izotopowym  — 


Siły  Jądrowe 

Adam  Sobiczewski 

Siłami  jądrowymi  nazywamy  specyficzne  siły,  które 
działają  między  nukleonami  (neutronami  i protona- 
mi), tj.  składnikami  jądra  atomowego  i powodują 
ich  wiązanie.  Stanowią  one  szczególny  i najlepiej  zba- 
©dd ziafywa-  dany  przypadek  oddziaływań  silnych  występujących 
ma  silne  pomiędzy  hadronami  (barionami  i mezonami,  -* 
Cząstki  elementarne  i ich  oddziaływania).  Oddzia- 
ływania silne  tworzą  odrębną  klasę  wśród  czterech 
znanych  w fizyce  oddziaływań  (silne,  elektroma- 
gnetyczne, słabe  i grawitacyjne)  i są  najsilniejszymi 
z nich. 


Rys.  17.  Przekrój  czynny  reakcji  rozpraszania  elastycznego  pro- 
tonów przez  jądra  argonu:  40A(p,  p)*°A.  W obszarze,  w którym 
powinien  wystąpić  stan  analogowy  (dla  wzbudzeń  odpowiadają- 
cych energii  wychwytywanych  protonów  ok.  1 ,87  MeV)  szczegól- 
nie łatwo  wzbudzają  się  poziomy  o liczbach  kwantowych  takich 
samych  jak  stan  analogowy  — duży  jest  w nich  udział  konfigu- 
racji stanu  analogowego.  Uśredniony  przekrój  czynny  (linia  prze- 
rywana) zachowuje  się  w tym  obszarze  energii  protonów  tak,  jak 
gdyby  istniał  rezonans  w wychwycie  protonów 

w formalizmie  tym  zakłada  się,  że  proton  i neutron 
są  dwoma  stanami  tej  samej  cząstki  różniącymi  się 
ustawieniem  izospinu  w wyimaginowanej  izoprze- 
strzeni).  metody 

Jądra  można  wzbudzać  różnymi  metodami.  Wnik-  wzbudzania 
nięcie  nukleonu  lub  złożonej  cząstki  do  jądra  prowa-  jąder 
dzi  na  ogół  do  powstania  stanów  wysokowzbudzo- 
nych,  gdyż  poza  energią  kinetyczną  wniesioną  do  ją- 
dra wydziela  się  energia  wiązania  nukleonu  czy  też 
grupy  nukleonów.  Tworzenie  stanów  o niższej  energii 
w wyniku  rozpadu  stanów  wysokowzbudzanych  jest 
na  ogół  niezależne  od  ich  struktury,  która  przy  ma- 
łych energiach  wzbudzenia  może  być  bardzo  różno- 
rodna (jest  to  wynikiem  zmieszania  różnych  konfigu- 
racji w stanie  wysokowzbudzonym).  Reakcje  przekazu 
nukleonu  lub  grupy  nukleonów  między  jądrem  a czą- 
stką przelatującą  w bezpośrednim  sąsiedztwie  jego 
powierzchni  preferują  tworzenie  stanów  o konfigu- 
racjach prostych,  odpowiadających  pojawieniu  się 
nukleonów  na  określonych  orbitach  wokół  niewzbu- 
dzonego  jądra  tarczy  (lub  wyrwaniu  nukleonów 
z określonych  jego  orbit).  W reakcjach  rozpraszania 
nieelastycznego  preferowane  są  wzbudzenia  kolektyw- 
ne (np.  pobudzenie  jądra  do  oscylacji  lub  rotacji  przez 
pole  jądrowe  lub  kulombowskie  przelatującej  w jego 
pobliżu  cząstki). 

Badania  wzbudzeń  jądrowych,  ich  konfiguracji 
(najczęściej  za  pomocą  reakcji  jądrowych)  oraz  roz- 
padów dostarczają  podstawowych  danych  do  pozna- 
nia budowy  jądra  i natury  sił  jądrowych.  Mimo  ol- 
brzymiego postępu  w ostatnich  latach,  w dziedzinie 
tej  jest  jeszcze  wiele  zagadnień  niedokładnie  pozna- 
nych i nie  rozwiązanych. 

A.  Bohr,  B.R.  Mottelson  Struktura  jądra  atomowego,  t.  1. 

Warszawa  1975;  B.L.  Cohen  Concepts  of  Nuclear  Physics,  New 
York  1971;  P.  Marmier,  E.  Sheldon  Physics  of  Nuclei  and 
Particłes,  vol.  1,  New  York  1971;  E.  Segrć  Nuclei  and  Particles, 

New  York  1964. 


W powyższym,  tradycyjnym  określeniu  sił  jądro- 
wych, które  tu  przyjmujemy,  ograniczamy  się  do  od- 
działywań występujących  w jądrach  zwykłych.  W hi- 
perjądrach  występuje  jeszcze  dodatkowo  oddziały- 
wanie między  nukleonami  a cząstką  A (-*  Hiperjądra). 

Chociaż  często  używa  się  intuicyjnego  pojęcia  siły, 
to  jednak  przy  ilościowym  opisie  oddziaływania  po- 
między nukleonami  stosuje  się  pojęcia  energii  oddzia- 
ływania lub  potencjału,  tj.  te  pojęcia,  których  się  uży- 
wa w mechanice  kwantowej  opisującej  mikroobiekty, 
jakimi  są  nukleony. 
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W porównaniu  z oddziaływaniami  elektromagne- 
tycznymi i grawitacyjnymi,  wiedza  nasza  o oddziały- 
waniach jądrowych  jest  bardzo  niepełna.  Jednym  z po- 
wodów tego  jest  ich  bardzo  mały  zasięg  (promień 
działania).  Objawiają  się  one  dopiero  przy  bardzo 
dużych  zbliżeniach  nukleonów  (jak  w jądrze  atomo- 
wym lub  przy  zderzeniu  jąder),  a więc  w sytuacjach, 
których  wytwarzanie  i badanie  można  było  rozpocząć 
stosunkowo  niedawno  (w  obecnym  wieku,  a inten- 
sywniej — dopiero  od  lat  trzydziestych,  gdy  zbudowa- 
no pierwsze  akceleratory).  W oddziaływaniach  między 
dużymi  obiektami  siły  jądrowe  nie  odgrywają  żadnej 
roli  i dlatego  nie  można  było  wynieść  o nich  żadnej 
wiedzy  z fizyki  klasycznej  opisującej  takie  obiekty. 
W klasycznej  fizyce  ważne  są  tylko  oddziaływania  da- 
lekiego zasięgu,  jak  grawitacyjne  i elektromagnetycz- 
ne. Drugim  powodem  niepełnej  znajomości  oddzia- 
ływań jądrowych  jest  skomplikowany  ich  charakter. 

Głównym  źródłem  wiedzy  o siłach  jądrowych  jest 
badanie  najprostszych  układów  nukleonowych : neu- 
tron-proton  ( n-p ) i proton-proton  {p-p).  Jest  to  bada- 
nie rozpraszania  dwu  nukleonów  na  sobie.  Najdo- 
godniejszy do  analizy  teoretycznej  jest  układ  n-p , 
ponieważ  nie  zaburza  go  odpychanie  elektryczne  (ku- 
lombowskie).  W odróżnieniu  od  układów  n-n  i p-py 
układ  n-p  ma  stan  związany,  który  również  dostarcza 
informacji  o siłach  jądrowych.  Czystego  układu  n-n 
nie  można  badać,  gdyż  nie  ma  tarcz  neutronowych. 

Ważnym  źródłem  wiedzy  są  również  własności  ją- 
der, np.  zależność  objętości  (lub  promienia)  jądra 
od  liczby  masowej  Ay  czy  też  średnia  energia  wiązania 
przypadająca  na  jeden  nukleon  w jądrze  (-*  Jądra 
atomowe  i ich  wzbudzenia) 

Dodatkowym  źródłem  jest  badanie  oddziaływania 
mezonów  (głównie  mezonów  n)  z nukleonami.  Przyj- 
muje się  bowiem,  że  oddziaływanie  jądrowe  jest  wy- 
nikiem wymiany  mezonów  pomiędzy  nukleonami, 
podobnie  jak  oddziaływanie  elektromagnetyczne  jest 
wynikiem  wymiany  fotonów  między  cząstkami  nała- 
dowanymi. 

Własności  sil  jądrowych 

Omówimy  kilka  charakterystycznych  własności  sił 
jądrowych.  Jak  pokazują  wyniki  rozpraszania  nukleo- 
nów na  sobie,  a także  własności  jąder,  zasięg  sił  ją- 
drowych jest  bardzo  krótki;  wynosi  ok.  1-2  fm.  Jest 
krótki  zasięg  więc  niewiele  większy  od  promienia  samego  nukleonu 
i jednocześnie  dosyć  bliski  średniej  odległości  między 
nukleonami  w jądrze.  Oznacza  to  z jednej  strony,  że 
nukleony  w jądrze  są  dosyć  ściśle  „upakowane”,  a z 
drugiej,  że  każdy  nukleon  w jądrze  oddziałuje  tylko 
z nukleonami  znajdującymi  się  najbliżej  niego, 
charakter  Siły  jądrowe  są  na  ogół  przyciągające.  Inaczej  nie 
przyciągający  mogłyby  istnieć  układy  związane  nukleonów,  czyli 
jądra  atomowe.  Szczegółowy  charakter  tych  sił  jest 
jednak  skomplikowany.  Na  bardzo  małych  odległo- 
ściach, do  ok.  0,4-0, 5 fm,  są  one  odpychające  (tzw. 
rdzeń  odpychający).  Na  dalszych  odległościach  mogą 
być  zarówno  przyciągające  jak  i odpychające,  zależ- 
nie od  stanu,  w jakim  znajduje  się  układ  dwu  nukle- 
onów. Przeważa  jednak  charakter  przyciągający. 

Badanie  własności  jąder  oraz  rozpraszania  nukleo- 
nów wskazuje,  że  siły  jądrowe  między  dwoma  neu- 
tronami {n-n)9  neutronem  i protonem  {n-p)  oraz 
dwoma  protonami  (p-p)  są  w przybliżeniu  takie  same, 
jeśli  tylko  te  pary  cząstek  znajdują  się  w identycznych 
niezależność  stanach.  Własność  ta  nazywa  się  ładunkową  niezależ- 
ład  u rakowa  nością  sił  jądrowych.  Naturalnie,  aby  to  stwierdzić, 
w badaniu  oddziaływania  p-p  należy  uwzględnić 
(odjąć)  efekt  odpychania  kulombowskiego. 

Jedną  z dróg  sprawdzania  ładunkowej  niezależ- 
ności jest  porównanie  energii  wiązania  dwóch  jąder 
zwierciadlanych,  tj.  pary  jąder,  których  liczba  pro- 
tonów różni  się  o jeden,  a liczba  masowa  jest  taka 
sama:  np.  pary  3H-3He  (rys.  1)  lub  nB-nC.  Jądra 
takie  przechodzą  w siebie  nawzajem  przy  zamianie 


wszystkich  neutronów  na  protony  i odwrotnie.  Oka- 
zuje się,  że  z dużą  dokładnością  różnica  między  ener- 
giami wiązania  tych  jąder  równa  jest  różnicy  między 
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Rys.  1.  Przykład  jąder  ® 
zwierciadlanych 
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ich  energiami  kulombowskimi,  wywołanej  różną 
liczbą  zawartych  w nich  protonów.  Nie  pojawienie 
się  żadnej  innej  różnicy  świadczy  o tym,  że  siły  jądro- 
we n-n  i p-p  są  takie  same.  Własność  ta,  zwana 
symetrią  ładunkową  sił  jądrowych,  jest  węższa  od 
własności  niezależności  ładunkowej.  Aby  stwierdzić 
niezależność  ładunkową,  należy  jeszcze  wykazać,  że 
siły  n-p  są  identyczne  z n-n  i p-p.  Do  tego  celu 
nie  wystarcza  porównywanie  jąder  zwierciadlanych, 
bowiem  liczba  wiązań  n-p  jest  w nich  taka  sama. 
Należy  rozważyć  szersze  układy,  np.  trójki  jąder 
jak:  6He-eLi-*Be  czy  8Li-8Be-8B.  Porównanie  ich 
energii  wiązania,  a także  widm  poziomów  wzbudzo- 
nych, wskazuje  na  ładunkową  niezależność  sił.  Na 
własność  tę  wskazuje  także  porównanie  wyników  roz- 
praszać n-p  i p-p.  Gdyby  siły  jądrowe  były  tylko  przy- 
ciągające, to  gęstość  jądra  rosłaby  szybko  ze  wzro- 
stem liczby  masowej  A.  Każdy  nukleon  dążyłby  bo- 
wiem do  pozostawania  w zasięgu  oddziaływania 
wszystkich  pozostałych  i promień  jądra  nie  przekra- 
czałby tego  zasięgu.  Energia  wiązania  byłaby  wtedy 
proporcjonalna  do  liczby  wszystkich  możliwych  wią- 
zań, tj.  liczby  oddziałujących  par,  tzn.  doA(A  — 1)/2, 
czyli  w przybliżeniu  do  A2.  Tymczasem  z doświad- 
czenia wiadomo,  że  tak  nie  jest;  gęstość  jądra  jest 
w przybliżeniu  stała,  a energia  wiązania  — proporcjo- 
nalna do  A.  Fakty  te  świadczą  o własności  tzw.  wy- 
sycania (nasycania  się)  sił  jądrowych.  Mianowicie, 
siły  te  muszą  być  silnie  odpychające  przy  małych 
odległościach  (rdzeń  odpychający),  by  zapobiec  wzro- 
stowi gęstości  przy  wzroście  A,  oraz  muszą  mieć  taki 
zasięg,  by  każdy  nukleon  oddziaływał  tylko  z naj- 
bliższymi sąsiadami,  a nie  ze  wszystkimi  nukleonami 
w jądrze.  Ten  ostatni  warunek  jest  po  to,  by  energia 
wiązania  była  proporcjonalna  do  A , a nie  A2.  Sytu- 
acja jest  podobna  do  tej,  jaka  istnieje  w cieczy  i w ciele 
stałym.  Na  przykład  siły  występujące  między  mole- 
kułami w cieczy  są  odpychające  na  małych  odległo- 
ściach, a przyciągające  na  większych,  przy  czym  zasięg 
sił  jest  krótki,  tak  że  cząstka  może  oddziaływać  tylko 
z cząstkami  najbjiższymi.  Wykres  potencjału  takich 
sił  podany  jest  na  rys.  2. 
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Rys.  2.  Prrykład  poten- 
cjału sił  o własności  wy- 
sycania 

Oprócz  rdzenia  odpychającego,  do  własności  wy- 
sycania sił  wnosi  także  swój  wkład  składowa  wymien- 
na tych  sił  (patrz  niżej).  Składowa  ta  jest  bowiem  za- 
leżna od  stanu  i powoduje,  że  w pewnych  stanach 
siły  jądrowe  są  odpychające  na  każdej  odległości. 

Siły  jądrowe  zależą  od  względnego  ustawienia  spi- 
nów oddziałujących  nukleonów.  O zależności  tej 
świadczy  np.  fakt,  że  stan  1 s (tj.  najniższy  energetycz- 
nie stan  o orbitalnym  momencie  pędu  L = 0)  układu 
n-p  jest  związany,  gdy  spiny  neutronu  i protonu 
ustawione  są  równolegle  (stan  trypletowy  o całkowi- 
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zależność 
od  spinu 


tym  spinie  S = 1),  a nie  jest  związany,  gdy  spiny  są 
ustawione  antyrównolegle  (stan  singletowy  o całko- 
witym spinie  S = 0). 

charakter  Siła  między  dwoma  ciałami  (punktowymi)  dzia- 
niecentrałny  łająca  w kierunku  linii  łączącej  te  ciała  nazywa  się 
siłą  centralną.  Przykładem  jest  siła  przyciągania  lub 
odpychania  elektrostatycznego  (kulombowskiego) 
pomiędzy  elektrycznymi  ładunkami  punktowymi. 
Wartość  bezwzględna  siły  centralnej  (a  także  jej  po- 
tencjał) zależy  tylko  od  odległości  między  ciałami. 
Oprócz  odległości,  siła  może  zależeć  także  od  orien- 
tacji wektora  wzajemnego  położenia  względem  kie- 
runku wyróżnionego  w przestrzeni.  W przypadku 
nukleonów  może  to  być  kierunek  ich  spinów.  Siła 
taka  nie  jest  już  centralna  i nazywa  się  siłą  tensorową. 
Na  przykład  przy  ustawieniu  nukleonów  takim,  jak 
na  rys.  3a  (wektor  wzajemnego  położenia  współiinio- 


a) 


b) 
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Rys.  3.  Przykład  różnych  ustawień  wektora  wzajemnego  poło- 
żenia dwu  nukleonów  względem  kierunku  ich  spinów.  Porówna- 
nie z różnymi  ustawieniami  dwu  magnesów 


wy  ze  spinami)  siła  tensorowa  jest  inna  niż  przy  usta- 
wieniu jak  na  rys.  3b  (wektor  położenia  prostopadły 
do  spinów).  Przypomina  to  sytuację,  jaką  mamy  przy 
znanym,  klasycznym  oddziaływaniu  dwu  magnesów. 
Przy  ustawieniu  A przyciągają  się  one,  a przy  usta- 
wieniu B — - odpychają.  Dla  ilustracji  wzięliśmy  tu 
tylko  ustawienia  skrajne;  przy  ustawieniach  pośred- 
nich siła  przyjmuje  również  wartości  i kierunki  po- 
średnie. 

Jednym  z argumentów,  który  świadczy  o niecen- 
tralnym  charakterze  sil  jądrowych,  jest  niezerowy 
moment  kwadrupolowy  (elektryczny)  Q deuteronu. 
Z pomiarów  wynika,  że  moment  ten  jest  dodatni. 
Rysunek  4 ilustruje,  że  dodatniemu  momentowi  Q 
odpowiada  kształt  wydłużony  jądra,  typu  cygara 
(rys.  4a),  a ujemnemu  — kształt  spłaszczony,  typu 


Rys.  4.  Przykład  wydłużonego  (a)  i spłaszczonego  (b)  kształtu 

jądra.  / jest  momentem  pędu,  a Q momentem  kwadrupolowym 
jądra 


dysku  (rys.  4b).  Porównanie  rysunków  4 i 3 sugeruje, 
że  wydłużony  kształt  deuteronu  przemawia  za  uprzy- 
wilejowaniem ustawienia  (a)  z rys.  3,  tj.  za  przycią- 
gającym charakterem  sił  jądrowych  przy  tym  usta- 
wieniu. Analogia  z siłami  między  dwoma  magnesami 
jest  więc  bardzo  duża.  Jednakże  natura  tych  dwu  ro- 
dzajów sił  jest  inna.  Oddziaływanie  jądrowe  jest 
silniejsze  i ma  inną  zależność  od  odległości,  identyczna 
jest  tylko  zależność  kątowa. 


Część  oddziaływania  jądrowego  stanowią  siły  wy- 
mienne, które  są  efektem  czysto  kwantowym,  nie 
mającym  żadnej  analogii  klasycznej.  Działanie  ich 


charakter 

wymienny 


Rys.  5.  Procesy  wymiany  układu  neutron-proton.  Neutron  ozna- 
czony jest  kółkiem  wypełnionym,  proton  — pustym,  a spin  — 
strzałką 


polega  na  wymianie  między  nukleonami  niektórych 
lub  wszystkich  wielkości  opisujących  te  nukleony,  np. : 
położenia  (tzw.  siły  Majorany),  spinu  (siły  Bartletta) 
oraz  zarówno  położenia  jak  i spinu  (siły  Heisenberga). 
Dla  pełności  terminologii  dodajmy,  że  zwykłe  siły 
jądrowe,  które  nie  prowadzą  do  wymiany  żadnej 
wielkości,  nazywają  się  siłami  Wignera.  Różne  możli- 
wości wymiany  dla  układu  n-p  są  zilustrowane  na 
rys.  5.  Biorąc  stan  a za  wyjściowy,  stan  b otrzymuje 
się  z niego  przez  wymianę  położenia,  stan  c — przez 
wymianę  spinu,  a stan  d — przez  wymianę  obu  tych 
wielkości.  To  znaczy  stan  b otrzymywany  jest  ze  sta- 
nu a (i  odwrotnie),  jeśli  działają  tylko  siły  Majorany, 
stan  c — jeśli  tylko  siły  Bartletta,  a d— jeśli  tylko  siły 
Heisenberga.  Siły  Wignera  pozostawiają  stan  a (jak 
również  pozostałe  stany  b , c,  d)  bez  zmiany. 

Siły  wymiany  znajdują  wyjaśnienie  w mezonowej 
teorii  sił  jądrowych  (patrz  niżej).  Na  przykład  pro- 
cesy prowadzące  od  stanu  a do  b lub  d z rys.  5 mogą 
być  zrealizowane  drogą  wymiany  między  neutronem 
i protonem  mezonu  naładowanego  tC  lub  7 r+  (rys.  6). 

Najbardziej  bezpośredniego  dowodu  doświadczal- 
nego występowania  sił  wymiany  dostarcza  badanie 
rozpraszania  neutronów  na  protonach.  Jeśli  energia 
neutronu  padającego  na  tarczę  protonową  jest  duża, 
znacznie  większa  od  energii  oddziaływania  (przycią- 
gania czy  odpychania)  między  nim  a protonem,  to 
neutron  zdoła  przekazać  protonowi  w trakcie  od- 
działywania („zderzenia”)  tylko  małą  część  swojego 
pędu.  Po  zderzeniu  będzie  więc  nadal  poruszał  się 
z dużą  prędkością  i w kierunku  mało  zmienionym 
w stosunku  do  początkowego  (rys.  7c  i d).  Rozkład 
kątowy  takich  neutronów  po  zderzeniu  będzie  miał 
zatem  silne  maksimum  przy  małych  kątach  (rys.  7e). 
Maksimum  przy  dużych  kątach  (tzw.  rozpraszanie 
do  tyłu)  możemy  otrzymać  jedynie  w przypadku  wy- 
miany neutronu  na  proton  i odwrotnie  (rys.  7h).  Fakt, 
że  w doświadczeniu  otrzymujemy  maksimum  zarów- 
no przy  małych,  jak  i przy  dużych  kątach  (rys.  7i), 
świadczy  o obecności  zarówno  zwykłej  jak  i wymiennej 
składowej  w oddziaływaniu  jądrowym.  Na  rys.  7 
proces  rozpraszania  zilustrowany  został  w układzie 
laboratoryjnym  (a,  c,  f),  w którym  proton  tarczy 
spoczywa  przed  zderzeniem,  oraz  w układzie  środka 
masy  (b,  d,  g),  w którym  sumaryczny  pęd  obu  nu- 
kleonów jest  równy  zeru. 

Siły  jądrowa  zależą  nie  tylko  od  wzajemnego  usta- 
wienia spinów  oddziałujących  nukleonów,  ale  i od 
ustawienia  ich  względem  wektora  orbitalnego  mo- 
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Rys.  6.  Wymiana 
mezonu  7z~  między 
neutronem  a pro- 
tonem 


siły 

spin-orbita 


mentu  pędu  L.  Część  sił  powodującą  tę  zależność 
nazywamy  siłami  spin-orbita.  O istnieniu  ich  świad- 
czą bezpośrednio  doświadczenia  polaryzacyjne,  tzn. 
takie,  w których  bądź  tarcza,  bądź  wiązka  padająca, 
bądź  też  produkty  rozpraszania  są  spolaryzowane, 
czyli  mają  więcej  cząstek  ze  spinem  skierowanym  do 
góry,  niż  w dół  lub  na  odwrót. 

Rozważmy  dla  ilustracji  (rys.  8)  rozpraszanie  spo- 
laryzowanej wiązki  protonów  ze  spinami  ustawi  o- 
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nymi  do  góry  na  jądrach  o spinie  równym  zeru.  Od-  tego  zasada  zachowania  energii.  Cząstka  wirtualna 
działywanie  protonu  wiązki  z jądrem  jest  naturalnie  może  być  jednak  wyemitowana  bez  spełnienia  tej  za- 
sumą  oddziaływań  ze  wszystkimi  nukleonami  jądra,  sady,  byle  na  dostatecznie  krótki  czas,  na  jaki  pozwala 


rozpraszanie  rozpraszanie 

bez  wymiany  tylko  z wymianą 
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Rys.  7.  Rozpraszanie  neutronu  o dużej  energii  na  protonie  w układzie  laboratoryjnym  i układzie  środka  masy.  U dołu  pokazane  są 
trzy  rozkłady  kątowe  rozproszonych  neutronów:  (e)  — rozkład  jaki  otrzymalibyśmy  gdyby  me  było  w ogolę  wymiany.,  (h)  — gdyby 
była  wyłącznie  wymiana  oraz  (i)  — rozkład  jaki  otrzymuje  się  w doświadczeniu 


Rys.  8.  Rozpraszanie  spolaryzowanych  protonów  na  jądrze  bez- 
spinowym.  Obok  zilustrowano  orientację  spinu  protonów  wzglę- 
dem ich  orbitalnego  momentu  pędu 


Załóżmy  dla  uproszczenia,  że  działają  tylko  siły  spin- 
orbita  i że  są  one  przyciągające,  gdy  spin  a jest  skie- 
rowany zgodnie  z momentem  orbitalnym  L oraz  od- 
pychające w przypadku  przeciwnym.  Widać  z rys.  8, 
że  protony  będą  wówczas  rozpraszane  tylko  w lewo. 

Ponieważ  w rzeczywistości  siły  spin-orbita  są  jedną 
z kilku  a nie  jedyną  składową  sił  jądrowych,  roz- 
praszanie występuje  w obie  strony.  Obserwowana 
jednak  różnica  ilości  cząstek  rozproszonych  w lewo 
i w prawo  (tzw.  asymetria  lewo-prawo)  świadczy  o 
istnieniu  tych  sił 


Mezonowa  teoria  sił  jądrowych 

Oddziaływanie  między  obiektami  fizycznymi  reali- 
zowane jest  za  pośrednictwem  pola.  W opisie  kwan- 
towym (-*  Teoria  pola)  oznacza  to  wymianę  kwantów 
— cząstek  tego  pola.  Wymiana  ta  prowadzi  do  prze- 
kazania pędu  od  jednego  obiektu  do  drugiego,  a więc 
do  występowania  sił  między  nimi.  Na  przykład  od- 
działywanie elektromagnetyczne  polega  na  wymianie 
kwantów  pola  elektromagnetycznego,  czyli  fotonów. 

Cząstki  przenoszące  oddziaływanie  są  cząstkami 
wirtualnymi,  tj.  cząstkami  nieobserwowalnymi  bez- 
pośrednio w procesie  oddziaływania.  Możliwość  ich 
obserwacji  oznaczałaby  bowiem  zwykłą  ich  emisję, 
dla  której  trzeba  by  dostarczyć  emitującemu  je  obiek- 
cząstki  towi  energię  potrzebną  do  ich  wytworzenia,  a więc 
wirtualne  równą  co  najmniej  ich  energii  spoczynkowej.  Wymaga 


zasada  nieokreśloności  Heisenberga,  czyli  co  naj 
wyżej  na  czas: 

At  = h/AE  hfmyyC 2, 


gdzie  AE  — energia  cząstki,  m0  — jej  masa  spoczyn- 
kowa, c — prędkość  światła.  W czasie  tym  cząstka 
wirtualna  może  się  oddalić  co  najwyżej  na  odległość: 


Odłegłość : 


r = cAt  < ftc{m0c 2. 
rz  ~ ficfm0c- 


(1) 


jest  zatem  zasięgiem  sił,  jaki  otrzymuje  się  za  po- 
średnictwem pola,  którego  kwanty  mają  masę  spo- 
czynkową m0.  Widać  stąd,  że  siły  elektromagnetyczne 
mają  zasięg  nieskończony  (siły  długiego  zasięgu), 
ponieważ  dla  fotonu  m0  = 0.  Zasięg  zaś  sił  jądrowych 

jeSK  rz  x *c/(  140  MeV)  « 1,4  fm, 

ponieważ  masa  spoczynkowa  mezonu  n (pionu), 
przenoszącego  oddziaływanie  jądrowe,  wynosi  ok. 
140  MeV/c2. 

Zasięg  sił  jądrowych  obliczyliśmy  tutaj  mając  zmie- 
rzoną masę  dobrze  obecnie  znanego  mezonu  n.  Histo- 
rycznie było  jednak  odwrotnie.  Dla  objaśnienia  sił 
jądrowych  wysunięto,  śmiałą  na  owe  czasy,  hipotezę 
istnienia  cząstek  silnie  oddziałujących  z nukleonami 
i przenoszącymi  oddziaływanie  jądrowe.  Znając  z 
doświadczenia  zasięg  (krótki)  tego  oddziaływania 
można  było  oszacować  na  podstawie  wzoru  (1)  ich 
masę  m0.  Dokonał  tego  fizyk  japoński  H.  Yukawa 
w 1934  r.,  na  długo  przed  doświadczalnym  odkryciem 
samych  cząstek  (mezonów  n),  które  nastąpiło  dopiero 
w 1947  r.  Historia  ta  jest  jednym  z ładniejszych  przy- 
kładów, jak  teoria  może  dać  objaśnienie  zjawiska  na 
długo  przed  odkryciem  jego  podstaw  doświadczal- 
nych i w efekcie  odkrycie  to  przyśpieszyć. 

Ze  wzoru  (1)  wynika,  że  zasięg  sił  jest  tym  mniej- 
szy, im  większa  jest  masa  spoczynkowa  przenoszą- 
cych je  cząstek.  Na  przykład  wymiana  dwu  pionów 
na  raz  prowadzić  będzie  do  sił  o dwukrotnie  mniej 
szym  zasięgu  niż  wymiana  pojedynczego  pionu. 

W bardziej  ilościowym  ujęciu  wymiana  jednej  cząst- 
ki prowadzi  do  oddziaływania  opisanego  potencjałem 
Yukawy : 

V{r)  =»  -g2e~,,r/rf 


zasięg  sił 
jądrowych 


potencjał 

Yukawy 
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gdzie  g — stała,  p = m0c2fftc,  przy  czym  jest  masą 
spoczynkową  tej  cząstki.  Krótki  zasięg  opisany  wzo- 
rem (1)  przy  m0  ¥*  0 znajduje  tu  swoje  odbicie  w 
szybkim,  wykładniczym  spadku  oddziaływania  z od- 
ległością. 

Mówiąc  dokładniej,  potencjał  Yukawy  odpowiada 
wymianie  cząstki  skalarnej,  tj.  cząstki  o spinie  zero 
i parzystości  dodatniej.  Wymiana  cząstki  pseudo- 
skalamej  (spin  zero  i parzystość  ujemna),  jaką  jest 
pion,  prowadzi  do  potencjału  tensorowego.  Wreszcie, 
wymiana  cząstki  wektorowej  (spin  równy  jeden) 
pozwala  odtworzyć  rdzeń  odpychający  oraz  oddziały- 
wanie spin-orbita.  Ponieważ  obecnie  znamy  mezony 
wymiana  o wszystkich  wymienionych  cechach,  można  oczeki- 
mezonów  wać,  że  wymiana  ich  pozwoli  odtworzyć  wszystkie 
omówione  własności  oddziaływania  jądrowego.  Rze- 
czywiście, z pomocą  wymiany  jednomezonowej  zna- 
nych mezonów  o masie  do  1 GeV/c2  możemy  obecnie 
zadowalająco  odtworzyć  znane  z doświadczenia 
i omówione  w poprzednim  paragrafie  oddziaływanie 
między  nukleonami.  Nie  oznacza  to  jednak  jeszcze, 
że  stan  mezonowej  teorii  sił  jądrowych  jest  już  obecnie 
zadowalający. 


Zapis  sił  jądrowych 


Dodajmy  jeszcze  kilka  uwag  o sposobie  zapisu  róż- 
nych składowych  sił  jądrowych. 

Siły  zależne  tylko  od  odległości  (siły  centralne) 
możemy  opisać  potencjałem : 

Kc(r), 

gdzie  r — odległość  między  nukleonami. 

Siły  zależne  od  wzajemnego  ustawienia  spinów 
dają  się  opisać  wyrażeniem : 


Vs(r)ov<r29 

gdzie  i at  — wektory  spinu  cząstek  1 i 2.  Siły  te  są 
różne  przy  dwu  możliwych  ustawieniach  spinów: 
równoległym  (stan  trypletowy)  i antyrównoległym 
(stan  singletowy),  gdyż: 

^ ^ = f 1 dla  stanu  trypletowego,  ,y. 

1 2 \—  3 dla  stanu  singletowego.  ^ 

Siły  tensorowe  można  opisać  potencjałem : 


gdzie : 


Vr(r)S129 


c _ * (<vó(<vO  rr 

Oi2  — 2 ^1*^2* 


a siły  spin-orbita  wyrażeniem : 

v2vLS(r)  r.fo+s. 


potencjał 
oddziaływa- 
nia 2 nu- 
kleonów 


We  wzorach  powyższych  r = rx—rt  jest  wektorem 

względnego  położenia  nukleonów,  a L — ryp  jest 
wektorem  względnego  orbitalnego  momentu  pędu. 


przy  czym  p jest  pędem  względnym. 

Zatem  całkowity  potencjał  oddziaływania  między 
dwoma  nukleonami  ma  postać: 


Vnn  = Vc(r)+  Vs(7)av7z+  Vi(r)Sxt+'UVLS{r)L- 
• (tfi-fffjs).  (3) 

Jest  on  zbudowany  tak,  aby  był  skalarem  (niezmien- 
niczość  względem  obrotu  w przestrzeni  zwykłej), 
a także  aby  zapewniał  zachowanie  parzystości  (nie- 
zmienniczość  względem  odbicia  w początku  układu 
współrzędnych)  obowiązujące  w oddziaływaniach 
silnych.  Aby  zapewnić  niezależność  ładunkową  (nie- 
zmienniczość  względem  obrotu  w przestrzeni  izospi- 
nowej),  każda  z czterech  funkcji  Vc(r),  Vs(r),  Vr(r) 
i VLS(r)  powinna  być  postaci  : 


V(r)=  Vx(r )+  Vz(r)  rx  • r2, 


gdzie  r — wektor  izospinu  nukleonu. 


174 


Można  wykazać,  że  wzór  (3)  jest  najogólniejszą 
postacią  potencjału  nukleon-nukleon,  jeśli  uwzględnić 

zależność  jego  od  prędkości  (czy  pędu  p , czy  też  mo- 
mentu pędu  L)  tylko  w pierwszej  potędze.  Między 
innymi  opisuje  on  wszystkie  siły  wymienne.  Na  przy- 
kład wymianę  spinu  otrzymuje  się  działając  na  funk- 
cję falową  wyrażeniem : 

A-V.(l+^  (4) 

które  zgodnie  z (2)  daje: 


!1  dla  stanu  trypletowego, 
— 1 dla  stanu  singletowego. 


tzn.  nie  zmienia  znaku  funkcji  falowej  w stanie  try- 
płetowym,  a zmienia  znak  w stanie  singletowym; 
prowadzi  więc  dokładnie  do  tego  samego,  co  ope- 
racja zamiany  spinów  między  cząstkami  1 i 2.  Obec- 
ność wyrażenia  w potencjale  (3)  oznacza  zatem, 
zgodnie  ze  wzorem  (4),  obecność  operatora  wymiany 
spinu  Pa,  opisującego  spinowe  siły  wymienne. 

Potencjał  (3)  zawiera  ostatecznie  osiem  funkcji 
odległości  Vi(r),  które  należy  wyznaczyć  z analizy 
wyników  rozpraszania  N-N  (tzn.  nukleonu  na  nukleo- 
nie). Wykonano  wiele  takich  analiz;  wyniki  ich  nie 
są  jednoznaczne.  Wszystkie  one  prowadzą  jednak  do 
kilku  wspólnych  wniosków,  z których  ważniejsze  to: 

1)  wszystkie  człony  w oddziaływaniu  (3)  są  potrzebne, 

2)  na  małych  odległościach,  mniejszych  od  ok. 
0,5  fm,  oddziaływanie  jest  odpychające  (rdzeń  od- 
pychający), 3)  oprócz  zależności  od  pełnego  spinu, 
oddziaływanie  zależy  także  od  parzystości  stanu, 
w którym  zachodzi;  w stanach  o dodatniej  parzy- 
stości (L  — parzyste)  jest  ono  silniejsze  niż  w stanach 
o parzystości  ujemnej  (L  — nieparzyste)  i jest  przy- 
ciągające, 4)  na  dużych  odległościach  oddziaływanie 
jest  dobrze  opisywane  przez  potencjał  Yukawy  odpo- 
wiadający wymianie  jednego  pionu. 


Siły  wiefociałowe 


Dotychczas  zakładaliśmy,  że  siły  jądrowe  mają  na- 
turę dwuciałową.  Oznacza  to,  że  jeśli  mamy  np.  trzy 
znajdujące  się  blisko  siebie  nukleony  A,  B i C(rys.  9), 
to  siła  działająca  np.  na  nukleon  A jest:  Fab+Fac, 
gdzie  Fab  jest  siłą,  która  działa  między  nukleonami 
A i B w nieobecności  nukleonu  C,  a Fac  — siłą  dzia- 
łającą między  A i C w nieobecności  B.  Inaczej  mówiąc, 
siły  dwuciałowe  działają  tylko  pomiędzy  parą  cząstek 
i nie  są  modyfikowane  przez  obecność  innych  czą- 
stek. Na  przykład,  w bardzo  dobrym  przybliżeniu 
siły  elektromagnetyczne  i grawitacyjne  mają  taki 
właśnie  charakter. 

Istnieje  jednakże  możliwość  występowania  także 
trój-  i więcejciałowych  sił  jądrowych.  Możemy  to 
przedstawić  następująco.  Przy  opisie  sił  jądrowych 
za  pomocą  wymiany  mezonów  wymiana  jednego 
mezonu  odpowiada  siłom  dwuciałowym,  bo  tylko 
między  dwoma  nukleonami  wymiana  taka  może  za- 
chodzić i nie  jest  ona  przy  tym  zależna  od  obecności 
trzeciego  nukleonu.  Natomiast  przy  wymianie  dwu 
mezonów  na  raz  jest  już  i inna  możliwość  niż  wymia- 
na obu  między  dwoma  nukleonami.  Mianowicie 
jeden  z mezonów  wyemitowanych  przez  nukleon  A 
może  być  pochłonięty  przez  nukleon  B,  a drugi  — 
przez  C.  Odpowiada  to  już  siłom  trójciałowym.  Ana- 
logicznie można  przedstawić  sobie  cztero-,  pięcio- 
i ogólnie  wielociałowe  siły.  Widać,  że  przy  takiej  na- 
turze tych  sił,  siły  trójciałowe  będą  miały  zasięg  dwa 
razy  mniejszy  niż  dwuciałowe,  a czterociałowe  — 
trzy  razy  mniejszy  itd.  Wynika  to  ze  wzoru  (1),  gdyż 
Wp  jest  w tym  wypadku  masą  dwu,  trzech  i odpo- 
wiednio więcej  mezonów.  Skoro  zasięg  sił  dwuciało- 
wych  wynosi  ok.  1,4  fm,  to  trójciałowych  wyniesie 
ok.  0,7  fm,  a czterociałowych  — ok.  0,47  fm.  Ponie- 
waż średnia  odległość  między  nukleonami  w jądrach 
wynosi  ok.  2,1  fm  — widać,  że  rola  sił  maleje  ze  wzro- 
stem stopnia  ich  wielociałowości.  Ponadto,  ponieważ 
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siły  dwuciałowe  wykazują  silne  odpychanie  na  odle- 
głościach mniejszych  od  ok.  0,5  fm  i praktycznie  nie 
dopuszczają  do  zbliżenia  dwu  nukleonów  większego 
niż  na  tę  odległość  — należy  oczekiwać,  że  rola  sił 
cztero-  i więcejciałowych  jest  już  do  pominięcia. 
Warto  zatem  badać  jedynie  siły  trójciałowe,  w uzupeł- 
nieniu do  dwuciałowych.  Poświęcono  już  wiele  uwagi 
różnym  efektom  sił  trójciałowych.  Nadal  jednak 


Modele  jądrowe 

Adam  Sob tczewski 

Jądra  poznanych  dotychczas  pierwiastków  są  ukła- 
dami od  jednego  do  ok.  260  nukleonów;  poza  pier- 
wiastkami najlżejszymi  są  więc  one  układami  wielu 
ciał.  Opis  takiego  układu  (czyli  rozwiązanie  zagad- 
nienia wielu  ciał)  polegałby  na  pełnym  określeniu 
ruchu  wszystkich  nukleonów  powstającym  pod  wpły- 
wem ich  wzajemnego  oddziaływania.  Wiemy  jednak, 
że  w ogólnym  wypadku  zagadnienia  takiego  nie  po- 
trafimy rozwiązać  ściśle  już  dla  trzech  ciał,  ani  w me- 
chanice kwantowej  ani  klasycznej,  nawet  przy  stosun- 
kowo prostym  oddziaływaniu.  Tymczasem  oddziały- 
wanie między  nukleonami  jest  skomplikowane  i nie 
w pełni  jeszcze  poznane  (->  Siły  jądrowe). 

Wyjątkowo  trudne  zadanie,  jakie  mamy  przy  opi- 
sie układu  wielu  nukleonów  (jądro  atomowe),  można 
zilustrować  porównując  je  z opisem  powłoki  elektro- 
nowej atomu  (tzn.  uldadu  wielu  elektronów),  który 
to  opis  jest  już  bardzo  złożony.  Przede  wszystkim, 
elektrony  oddziałują  ze  sobą  za  pomocą  dobrze  zna- 
nych i stosunkowo  prostych  sił  elektromagnetycznych, 
których  główną  składową  jest  odpychanie  kulom- 
bowskie.  Oddziaływanie  między  nukleonami  zaś,  jak 
wspomnieliśmy,  jest  skomplikowane  i nie  w pełni  zna- 
ne. Poza  tym,  elektrony  są  w polu  silnie  naładowanego 
jądra  (o  ładunku  równym  sumie  ładunków  wszyst- 
kich elektronów  — w atomie  obojętnym),  którego 
masa  jest  znacznie  (ok.  1840  razy)  większa  od  masy 
elektronu  i które  zatem  prawie  spoczywa  w układzie 
środka  masy.  W tych  warunkach  oddziaływanie  mię- 
dzy elektronami  jest  tylko  poprawką  (sprowadzającą 
się  w dużej  mierze  do  częściowego  ekranowania  od 
pola  jądra  elektronów  zewnętrznych  przez  we- 
wnętrzne, a więc  do  zmniejszania  ładunku  jądra 
„widzianego’*  przez  elektrony  zewnętrzne)  do  oddzia- 
ływania ich  z niemal  nieruchomym  centrum  pola, 
jakim  jest  jądro.  W jądrze  zaś  nie  ma  takiego  cen- 
trum; wszystkie  nukleony  poruszają  się  „równo- 
prawnie” w polu  jedynie  wzajemnego  oddziaływania. 
Pokazuje  to,  że  opis  ruchu  nukleonów  jest  znacznie 
jeszcze  trudniejszy  od  i tak  trudnego  zadania,  jakim 
jest  opis  ruchu  elektronów  w atomie. 

Wszystko  to  powoduje,  że  w opisie  jąder  musimy 
uciekać  się  do  znacznych  uproszczeń,  przybliżeń. 
Modele  jądrowe  są  takimi  właśnie  uproszczeniami. 
Stosuje  się  je  zarówno  przy  opisie  struktury  jądra, 
jak  i reakcji  jądrowych.  W tym  ostatnim  wypadku, 
zamiast  o modelu,  mówi  się  często  o mechanizmie 
reakcji  (-►Reakcje  jądrowe).  W artykule  niniejszym 
omówimy  modele  struktury  jądra. 

Model  powinna  cechować  przede  wszystkim  pro- 
stota oraz  łatwość  przewidywania  na  jego  podstawie 
własności  jądra.  Prostota  ta  jednak  przyczynia  się 
do  organiczenia  modelu  oraz  sprawia,  że  za  jego  po- 
mocą można  opisać  tylko  niektóre  własności  jądra. 
Do  opisu  innych  własności  jądra  trzeba  użyć  innego 
modelu,  który  często  różni  się  znacznie  od  poprzed- 
niego, a czasem  wydaje  się  wręcz  z nim  sprzeczny. 
Zachęcające  do  używania  modeli  jest  jednak  to,  że 
niektóre  z nich  mają  bardzo  szeroki  zakres  stosowal- 
ności, co  świadczy  o trafności  zastosowanych  przy- 
bliżeń. Prostota  modelu  łączy  się  na  ogół  z jego  po- 
glądowością,  która  jest  pomocna  w wyrobieniu  pew- 


wnioski z tych  badań,  co  do  roli  sił  trójciałowych 
w jądrach,  nie  są  zdecydowane  i rozstrzygające. 
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helmi  Fizyka  reakcji  jądrowych , Warszawa  1976. 


nej  intuicji  ułatwiającej  jego  stosowanie.  Cechę  tę 
mają  zwłaszcza  modele  oparte  na  analogiach  kla- 
sycznych (np.  model  kroplowy  jądra). 

Obecnie  stosuje  się  ok.  dziesięciu  modeli  struktury 
jądra,  które  są  pewną  odmianą  lub  połączeniem  dwu 
zasadniczych  modeli:  modelu  cząstek  niezależnych 
oraz  modelu  cząstek  silnie  skorelowanych.  W pierw- 
szym z nich  nukleony  lub  ich  grupy  poruszają  się  we 
wspólnym  potencjale  niezależnie  lub  prawie  nieza- 
leżnie od  siebie.  W drugim  — nukleony  oddziałują 
ze  sobą  tak  silnie,  że  ruch  jednego  jest  ściśle  skorelo- 
wany z ruchem  innych.  Różne  odmiany  i połączenia 
tych  dwu  bardzo  odbiegających  od  siebie  wyobrażeń 
o ruchu  nukleonów  w jądrze  pozwalają  opisać  bardzo 
różne  własności  jąder:  od  własności,  w których  kore- 
lacje między  nukleonami  są  nieważne  (efekty  jedno- 
cząstkowe)  do  takich,  w których  są  one  podstawowe 
(efekty  kolektywne). 


Modele  podstawowe 

Omówimy  kilka  podstawowych  modeli  struktury 
jądra,  które  są  najczęściej  stosowane,  bądź  bezpo- 
średnio do  opisu  własności  jądra,  bądź  do  konstrukcji 
bardziej  złożonych  modeli. 


Model  kroplowy 

Model  kroplowy,  który  wykorzystuje  analogię  między 
jądrem  a kroplą  cieczy,  jest  najprostszą  wersją  mo- 
delu silnych  korelacji.  Podstawą  tej  analogii  są  dwa 
fakty  doświadczalne:  a)  stała  gęstość  materii  w jądrze, 
niezależna  od  jego  wielkości.  Wynosi  ona 

q x 0,17  nukleonu/fm3,  (1) 

b)  niemal  stała  wartość  energii  wiązania  jądra  w prze- 


liczba  masowa  A 


Rys.  1.  Zależność  doświadczalnej  wartości  energii  wiązania  jądra 
na  jeden  nukleon  BfA  od  liczby  masowej  A.  Aby  lepiej  zilustrować 
strukturę  tej  zależności  dla  jąder  1 ekkich,  rozciągnięto  dla  nich 
skalę  A 


cząstki  nie- 
zależne lub 
silnie  skore- 
lowane 


energia 

wiązania 
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liczeniu  na  jeden  nukleon  BI  A (rys.  1);  wynosi  ona 
ok.  8 MeV.  Fakt,  że  BfA  jest  prawie  stałe,  oznacza, 
że  energia  wiązania  B jest  prawie  proporcjonalna  do 
A,  lub  inaczej,  że  część  B , która  jest  proporcjonalna 
do  A (energia  objętościowa)  czyli 


energia 

objętościo- 

wa 


Bv  — ctv  A , 


(2) 


przy  czym  av  — współczynnik  proporcjonalności,  jest 
jej  częścią  główną. 

Obie  podane  własności  jądra  są  charakterystyczne 
dla  cieczy;  gęstość  jej  jest  stała,  niezależnie  od  obję- 
tości (a  nawet,  w dużej  mierze  od  ciśnienia  zewnętrz- 
nego)- Także  ciepło  parowania  — które  jest  odpowied- 
nikiem energii  wiązania  — w przeliczeniu  na  jednostkę 
objętości,  a zatem  i na  jedną  cząstkę,  jest  stałe.  Wy- 
parowanie jednej  cząstki  (molekuły),  a więc  oswobo- 
dzenie jej  z więzów  łączących  ją  z innymi  cząstkami, 
wymaga  stałej  energii  określonej  dla  danej  cieczy. 
Obie  własności  są  wyrazem  wysycania  sił  działających 
między  molekułami  cieczy,  czy  nukleonami  w jądrze; 
siły  takie  działają  tylko  między  najbliższymi  sąsiadami. 

Analogię  z cieczą  można  rozszerzyć  i przyjąć,  że 
nukleony  znajdujące  się  na  powierzchni  jądra  są  wią- 
zane słabiej  od  tych,  które  są  wewnątrz.  Mają  one 
bowiem  ok.  dwa  razy  mniej  nukleonów  w swoim  naj- 
bliżs2ym  sąsiedztwie.  Powoduje  to  zmniejszenie  ener- 
gii wiązania  o wielkość  proporcjonalną  do  liczby  nu- 
energia  kleonów  powierzchniowych,  a zatem  do  pola  po- 
powie-  w^erzc^ini  Jądra,  a więc  do  A213.  W.rezultacie  zmniej- 
rzchniowa  szenietojest 

Bg  = ~as  A2'3. 
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kropelkowy 


(3) 

Idąc  jeszcze  dalej,  można  uwzględnić  wpływ  za- 
krzywienia powierzchni  jądra  i dodać  wyrażenie 
—aic  A113.  Dokonuje  się  tego  w modelu  kropelkowym 
jądra  będącym  ulepszeniem  modelu  kroplowego. 

Przy  obliczaniu  energii  wiązania  jest  niezbędne 
uwzględnienie  faktu,  że  „ciecz”  jądrowa  jest  nałado- 
wana dodatnio.  Trzeba  więc  dodać  (ujemną)  energię 
odpychania  kulombowskiego 


energia  3 

kulom-  -fikui  = — 
bowska 


(Ze)2 


5 R 


3 (Ze)2 
5 rA1/3 


Z2 

aknl~4m’(4) 


gdzie  R = rA1/3  — promień  jądra,  e — ładunek  pro- 
tonu, a Z — liczba  protonów  w jądrze  (liczba  ato- 
mowa). 

Jest  to  już  wszystko,  co  można  osiągnąć  stosując 
model  kroplowy  do  opisu  energii  wiązania.  Dalszy 
istotny  fakt,  że  w niezbyt  lekkich  jądrach  jest  więcej 
neutronów  niż  protonów,  uwzględnia  się  już  za  po- 
mocą modelu  gazu  Fermiego  (patrz  niżej).  Daje  on 
poprawkę  postaci 


energia 

symetrii 


-^sym  — • — ( 


tfsym 


(N-Z)2 


(5) 


która  mówi,  że  wiązanie  jądra  jest  najsilniejsze,  gdy 
jest  ono  symetryczne  względem  zamiany  neutronów 
na  protony  i odwrotnie,  czyli  gdy  liczba  neutronów 
N równa  jest  liczbie  protonów  Z.  Energia  (5)  nazywa 
się  energią  symetrii. 

Udział  poszczególnych  członów:  energii  objętościo- 
wej By,  powierzchniowej  Bs,  kulombowskiej  Bku i oraz 
energii  symetrii  B3ym  w energii  wiązania  B jest  zilu- 
strowany na  rys.  2.  Widać  z niego,  że  rola  członu  po- 
wierzchniowego Bs  jest  największa  dla  jąder  lekkich 
(bo  dla  nich  największy  jest  stosunek  pola  po- 
wierzchni do  objętości)  i maleje  ze  wzrostem  A. 
Rola  członu  kulombowskiego  zaś  szybko  rośnie  z Ay 
bo  razem  z A wzrasta  ładunek  jądra  Ze.  Także  rola 
członu  symetrii  Bsym  rośnie  z A,  gdyż  razem  z A 
wzrasta  nadmiar  neutronów  w jądrze  N—Z. 

Model  kroplowy,  oprócz  energii  symetrii,  nie  opi- 
suje także  dwu  mniejszych  efektów  wpływających  na 
energię  wiązania.  Jeden  — to  różnica  między  energią 
wiązania  jąder  parzysto-parzystych  (N  i Z parzyste), 
nieparzystych  (nieparzyste  A)  i meparzysto-niepa- 
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rzystych  (N  i Z nieparzyste).  Wkład  tego  efektu  do 
energii  wiązania  można  zapisać : 

parzysto-parzystych, 
nieparzystych,  (6) 

nieparzysto-niepa  rzystych . 

A jest  tutaj  połową  energii  rozerwania  pary  neutro- 
nów lub  protonów. 


( A dla  jąder  pa 
= { 0 — ni 
l —A  — ni 


0 30  60  90  120  150  180  210  240  270 

liczba  masowa  A 

WWad  e°erg»  objętościowej,  powierzchniowej,  kułom- 
bowslacj  i symetrii  do  całkowitej  (doświadczalnej)  energii  wiąza- 
nia na  jeden  nukleon:  BfA 

Drugi  efekt  — to  efekt  struktury  powłokowej,  któ- 
rego przejawem  jest  fakt,  że  niektóre  jądra  (o  zam- 
kniętych powłokach)  są  szczególnie  silnie  związane. 
(Na  rys.  1 jest  to  dobrze  widoczne  jedynie  dla  naj- 
lżejszego jądra  o podwójnie  zamkniętych  powłokach: 
4He  (cząstka  a),  które  jest  znacznie  silniej  związane 
od  jąder  sąsiednich  — lokalne  maksimum  na  krzywej 
B/A.  Dalsze,  słabsze  maksima  przy  A — 8,  12,  16, ... 
świadczą  o tendencji  jąder  do  „struktury  alfowej”, 
tzn.  do  tego,  by  nukleony  ich  wiązały  się  w szczególnie 
trwałe  grupy cząstki  a).  Opisu  struktury  powłoko- 
wej jądra  dostarcza  oddzielny  model  — model  po- 
włokowy (patrz  niżej). 

Dopiero  suma  wszystkich  wymienionych  efektów 

(7) 

^ BvJrBs  -f-I?kui  4"  J?sym+I?pa  + efekty  powłokowe 

dobrze  odtwarza  doświadczalną  energię  wiązania  B. 

Rysunek  1,  choć  uproszczony,  pozwala  jednak 
zrozumieć  podstawę  energetyki  jądrowej.  Zarówno 
reakcja  rozszczepienia  jądra  ciężkiego,  jak  i reakcja 
syntezy  jąder  lekkich  powodują  wyzwolenie  energii. 
Obie  prowadzą  bowiem  od  jąder  słabiej  związanych  — 
do  silniej.  Najsilniej  związane  są  jądra  o A x 60. 

Model  kroplowy  jest  także  pomocny  przy  opisie 
kolektywnych  drgań  jąder  (model  kolektywny  — patrz 
niżej)  oraz  przy  opisie  samorzutnego  rozszczepiania 
(“*  Rozpady  jąder  atomowych). 


Model  gazu  Fermiego 

Model  gazu  Fermiego  jest  najprostszą  wersją  modelu 
cząstek  niezależnych.  Przyjmuje  się  w nim,  że  nukleo- 
ny poruszają  się  niezależnie  od  siebie  i w nieogram- 
czenie  dużym  obszarze  (materia  jądrowa  — brak 
efektów  powierzchniowych).  Jedyna  relacja  między 
nimi  jest  narzucona  przez  zakaz  Pauliego,  który  mó- 
wi, że  cząstki  identyczne  nie  mogą  zajmować  tego 
samego  stanu.  Ponieważ  stan  w modelu  gazu  Fer- 
miego jest  określony  przez  pęd  lub  energię  kinetyczną 
cząstki  e (poziom  energetyczny)  i wartość  rzutu  jej 
spinu  na  wybraną  oś,  to  każdy  poziom  energetyczny 
może  być  zajmowany  przez  dwa  protony  (o  prze- 
ciwnych wartościach  rzutu  spinu)  i dwa  neutrony. 


całkowita 

energia 

wiązania 


energia 

Fermiego 


Energia  poziomu  przebiega  ciągłe  widmo  wartości. 
W stanie  podstawowym  cząstki  zapełniają  poziomy 
najniższe,  od  energii  e = 0 do  energii  maksymalnej 
e =ep  (jest  to  tzw.  energia  Fermiego,  a odpowiadające 
jej  poziom  i pęd  są  odpowiednio  poziomem  i pędem 
Fermiego).  Wartość  energii  Fermiego  zalezy  wy- 
łącznie od  gęstości  cząstek  w materii  jądrowej,  przy 
czym  neutrony  i protony  traktuje  się  jako  oddzielne 
gazy  Fermiego.  Przy  równej  liczbie  neutronów  N 
i protonów  Z w jądrze  (jądra  lekkie),  ich  gęstości  są 
identyczne,  a więc  i energie  Fermiego  są  takie  same 
i wynoszą 

4n>  =ef  = e,  = W 

gdzie  m — masa  nukleonu,  ę — gęstość  materii  ją- 
drowej. Podstawiając  wartość  doświadczalną  q = 
= 0,17  fm"3  dostajemy  eF  ~ 39  MeV. 

Zatem  największa  energia  kinetyczna  nukleonu 
w jądrze  eF  jest  znacznie  mniejsza  od  jego  energii 
spoczynkowej  (ok.  940  MeV).  Oznacza  to,  że  po- 
prawki relatywistyczne  związane  z ruchem  są  małe 
i nierelatywistyczna  fizyka  jądrowa  jest  dobrym 
przybliżeniem  (z  wyjątkiem  reakcji  jądrowych  wyso- 
kich energii).  Wartość  energii  Fermiego  eF  pozwala 
nam  tąkże  ocenić  głębokość  potencjału  jądrowego 
(rys.  3).  Ponieważ  wartość  doświadczalna  energii  S 


potrzebnej  do  oderwania  jednego  nukleonu  od  jądra 
(energia  separacji)  wynosi  ok.  8 MeV,  to  głębokość 
powinna  wynosić: 

V0  = eF+S  X 47  MeV. 

Rzeczywiście,  potencjał  o takiej  mniej  więcej  głębo- 
kości pozwala  na  odtworzenie  wielu  wyników  do- 
świadczalnych. 

W ogólnym  wypadku,  gdy  N ^ Z,  energie  Fer- 
miego neutronów  i protonów  są  różne  i wynoszą: 


Wówczas  w całkowitej  energii  kinetycznej  gazu  Fer- 
miego 

£kln  = 'UlNe^+Ze™ } a »UeFAx 


pojawia  się  człon  symetrii  (5)  zwiększający  energię 
kinetyczną,  a więc  zmniejszający  energię  wiązania 
jądra  B przy  wzroście  nadmiaru  neutronów  (N— Z). 
Członu  tego  nie  można  było  otrzymać  z modelu  krop- 
lowego. 


Model  powłokowy 

Model  kroplowy  oraz  model  gazu  Fermiego  opisują 
tylko  pewne  wartości  uśrednione,  które  zmieniają 
się  w sposób  gładki  przy  zmianie  takich  parametrów 
jądra  jak  liczba  nukleonów  czy  deformacja.  Model 
kroplowy  opisuje  np.  gładką  zależność  energii  wią- 
zania od  liczby  protonów  i neutronów  oraz  od  defor- 
macji. Wszystkie  jednak  wielkości  jądrowe  wykazują 
pewną  mikrostrukturę  — mniej  lub  bardziej  wyraźne 
fluktuacje  nałożone  na  te  gładkie  zależności.  Świad- 


czą one  o powłokowej  strukturze  jądra,  podobnej  do 
struktury  powłok  elektronowych.  Model  powłokowy 
ma  na  celu  opis  tej  struktury. 

Jednym  z pierwszych  i ważniejszych  argumentów 
przemawiających  za  strukturą  powłokową  jąder  było 
istnienie  tzw.  liczb  magicznych.  Stwierdzono  miano- 
wicie, że  jądra  o liczbie  protonów  lub  neutronów 
równej  2,  8,  20,  28,  50  i 82  oraz  liczbie  neutronów  126 
są  szczególnie  silnie  związane  i trwałe.  Trudno  jest 
spowodować  ich  rozpad,  a nawet  wzbudzenie.  Mó- 
wimy, że  mają  one  zamkniętą  powłokę  protonową 
albo  neutronową  (lub  obie),  podobnie  jak  atomy  ga- 
zów szlachetnych  mają  zamkniętą  powłokę  elektro- 
nową. 

Model  powłokowy  jest  modelem  jednocząstkowym. 
Zakłada  on,  że  nukleony  poruszają  się  niezależnie 
od  siebie  w potencjale  będącym  wynikiem  oddziały- 
wania jednego  nukleonu  ze  wszystkimi  pozostałymi. 
Wobec  krótkiego  zasięgu  sił  jądrowych,  przebieg  tego 
potencjału  V powinien  być  bardzo  zbliżony  do  prze- 
biegu gęstości  materii  q (i  jednocześnie  ładunku,  gdyż 
rozkład  protonów  i neutronów  w jądrze  jest  w przy- 
bliżeniu taki  sam). 

Z danych  doświadczalnych  wynika,  że  zależność 
gęstości  q od  odległości  od  środka  jądra  r ma  w przy- 
bliżeniu przebieg  przedstawiony  na  rys.  4,  tzn 
wewnątrz  jądra  gęstość  jest  stała  i szybko  spada  w re- 


Rys.  4.  Zależność  gęs- 
tości materii  p oraz  po- 
tencjału V od  odległości 
od  środka  jądra  r 


jonie  jego  powierzchni.  Zatem  potencjał  V(r)  powi- 
nien mieć  przebieg  taki  jak  przedstawiony  na  tym  sa- 
mym rysunku  u dołu,  tzn.  być  proporcjonalny  do 
g(r),  tylko  z przeciwnym  znakiem  (potencjał  przycią 
gający)  i mieć  jedynie  promień  R nieco  większy  (mnie 
więcej  o zasięg  sił  jądrowych)  niż  g(r). 

Rozpatrzymy  oddzielnie  jądra  kuliste  i zdeformo- 
wane. 

Potencjałem,  którego  zależność  od  odległości  r 
jest  podobna  do  przedstawionej  na  rys.  4 jest  potencjał 
Woodsa-Saxona.  Ma  on  postać 


K(r)« 


- Vo 

l-{ -e(r-R)la  * 


OD 


gdzie  R — promień  potencjału,  a — parametr  roz- 
mycia (grubości)  powierzchni  potencjału. 

Stan  własny  nukleonu  umieszczonego  w tym  poten- 
cjale jest  scharakteryzowany  przez  cztery  liczby 
kwantowe:  — radialną  liczbę  kwantową  n (n  — 1, 
2,  3, ...),  która  opisuje  liczbę  oscylacji  funkcji  falo- 
wej w funkcji  r (im  większa  jest  ta  liczba,  przy  tych 
samych  wartościach  pozostałych  liczb  kwantowych, 
tym  większa  jest  energia  nukleonu),  — orbitalny 
moment  pędu  / (/  = 0,  1,  2,  ...),—  jego  rzut  na  oś 
kwantyzacji  mi  oraz  — rzut  spinu  na  tę  oś  m8.  Ponie- 
waż potencjał  jest  sferyczny  i żaden  kierunek  kwan- 
tyzacji nie  jest  wyróżniony,  to  energia  stanu  nie  zależy 
od  mi.  Nie  zależy  ona  także  od  gdyż  potencjał 
jest  niezależny  od  kierunku  rzutu  spinu.  Każdy  po- 
ziom energetyczny  jest  zatem  2(2/+l)-krotnie  zdege- 
nerowany  (ponieważ  są  dwie  możliwe  wartości  ms  = 
= — 7a,  llt  i 2/+1  możliwych  wartości  mi  ==  — /, 
-/-fi, ...  +/)  i wystarcza  oznaczać  go  liczbami  n i /. 
Dla  stanów  o / = 0,  1,  2,  3,  4,  5,  6,  7,  ...  używa  się 
powszechnie  symboli  literowych  s,p,  dyf  \ g , h>  i,j , ... 

Układ  poziomów  otrzymany  w potencjale  Wood- 
sa-Saxona  jest  przedstawiony  na  rys.  5b.  Są  to  po- 
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ziomy  neutronowe.  Układ  poziomów  protonowych, 
przy  którego  obliczaniu  należy  uwzględnić  oddziały- 
wanie kulombowskie,  różni  się  od  niego  znacznie  tylko 
w górnej  części  (poziomy  odpowiadające  ciężkim 
jądrom  — oddziaływanie  kulombowskie  większe). 
Sumując  liczby  cząstek,  które  obsadzają  kolejne  po- 
ziomy, łatwo  możemy  się  przekonać,  że  potencjał 
Woodsa-Saxona,  podobnie  jak  i prostsze  od  niego 
potencjały  potencjały:  — oscylatora  harmonicznego  (którego 
oscylatora  szczególnie  prosty  układ  poziomów  jest  podany  dla 
harmonicz-  porównania  na  rys.  5a) 
nego  i jamy 

rostokątnej  v(r)  = xltnrntr%9  (12) 

gdzie  m — masa  nukleonu,  a co  — parametr  „sztyw- 
ności’* potencjału  oraz — jamy  prostokątnej 


dla  r ś R, 
dla ?r  > R , 


(13) 


gdzie  R — promień  jamy,  odtwarzają  jedynie  trzy 
pierwsze  liczby  magiczne:  2,  8 i 20.  Żaden  z nich 
Oak  i inne  jeszcze  potencjały)  nie  pozwala  na  odtwo- 
rzenie liczb  dalszych.  Aby  je  odtworzyć  należy  włą- 
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Rys.  5.  Układ  poziomów  neutronowych  otrzymanych  w poten- 
cjale: oscylatora  harmonicznego  (a),  Woodsa-Saxona  bez  sprzę- 
żenia spin-orbita  (b)  oraz  ze  sprzężeniem  spin-orbita  (c).  Liczby 
z lewej  strony  oznaczają  numer  powłoki  oscylatorowej  N.  Na- 
wiasy klamrowe  pokazują,  które  poziomy  potencjału  Woodsa- 
Saxona  powstają  przez  rozszczepienie  poziomu  oscylatora  har- 
monicznego. W nawiasach  lub  w kółkach  podane  są  liczby  wszy- 
stkich cząstek  zapełniających  poziomy  położone  poniżej 


czyć  do  potencjału  oddziaływanie  spin-orbita,  tj. 
przyjąć  potencjał  w postaci 

K(r)+Ks0(r)f.^  (14) 

gdzie  / — wektor  orbitalnego  momentu  pędu  nukleo- 
nu, s — wektor  jego  spinu.  Spinowo-orbitalna  część 
potencjału  Vso  pochodzi  ze  spinowo-orbitalnej  skła- 
dowej sił  jądrowych  i jest  największa  w obszarze  po- 
wierzchni jądra,  w którym  zachodzi  najszybsza  zmia- 
na gęstości  materii  q.  Gdy  przyjmie  się  taki  potencjał, 
liczby  nu  i ms  nie  są  już  dobrymi  liczbami  kwanto- 
wymi; liczbami  takimi  pozostają  jednak:  pełny  mo- 
ment pędu  nukleonu  j = /±Va  oraz  jego  rzut  na  oś 
kwantyzacji  m — mi+m8.  Wymienienie  tych  liczb, 
obok  liczb  n i /,  w pełni  określa  stan.  Sama  energia 
stanu  nie  zależy  od  m (m  = — /,  — j+ 1, ... ,/)  i wobec 
tego  degeneracja  każdego  poziomu  energetycznego 
wynosi  (2/+1).  Układ  poziomów  jest  podany  na  rys. 
5c:  Widać  z niego,  że  każdy  poziom  (z  wyjątkiem  po- 
ziomów o / = 0)  zostaje  rozszczepiony  na  dwa: 
j = 1+1/ 2 * j — /— V*«  Dane  doświadczalne  wyka- 
zują, że  poziom  o większym  j leży  niżej,  co  oznacza, 
że  oddziaływanie  spin-orbita  ma  charakter  przycią- 
gający. Z rys.  5c  wynika  także,  że  wzięcie  pod  uwagę 
tego  oddziaływania  pozwala  na  odtworzenie  wszyst- 
kich znanych  doświadczalnie  liczb  magicznych. 

Stosując  model  powłokowy  możemy  odtworzyć 
własności  jąder  w stanie  podstawowym  oraz  w sta- 
nach niskowzbudzonych.  Odtworzenie  to  jest  naj- 
bardziej bezpośrednie  dla  jąder  nieparzystych,  któ- 
rych wiele  własności  (spin,  parzystość,  moment  ma- 
gnetyczny, energia  wzbudzenia)  jest  z reguły  wła- 
snościami stanu  zajętego  przez  nieparzysty  nukleon. 
Opis  tych  własności  jest  najlepszy  dla  jądra  podwójnie 
magicznego  plus  lub  minus  jeden  nukleon.  Jądro  po- 
dwójnie magiczne  może  być  uważane  wtedy  za  szcze- 
gólnie sztywny,  niełatwo  ulegający  wzbudzeniu  rdzeń 
i o własności  jądra  nieparzystego  decyduje  nukleon 
„nadwyżkowy”  lub  brakujący  (tzw.  „dziura”) 
w zamkniętej  powłoce.  Na  przykład,  w jądrze  209Pb 
rdzeń  stanowią  82  protony  oraz  126  neutronów  i os- 
tatni 127.  neutron  decyduje  o własnościach  jądra. 
Zgodnie  z rys.  5c,  stan  podstawowy  tego  jądra  powi- 
nien mieć  spin  B/a  i parzystość  dodatnią  (+),  gdyż 
wówczas  ostatni  neutron  obsadza  najniższy  dostępny 
poziom  (/  = 4,  tzn.  parzyste).  Najniższe  zaś  stany 
wzbudzone  powinny  być:  u/a+»  1&l*— , 7a+'  Z doś- 
wiadczenia rzeczywiście  otrzymuje  się  zarówno  stan 
podstawowy,  jak  i najniższe  wzbudzone  zgodne  z tymi 
przewidywaniami. 

Oprócz  jąder  kulistych  istnieją  jądra  zdeformo- 
wane. Wykazują  one  trwałą,  statyczną  deformację, 
a kształt  ich  jest  zbliżony  do  kształtu  wydłużonej 
elipsoidy  obrotowej  (kształt  cygara  — por.  rys.  7). 
Oczekuje  się  ponadto,  że  niektóre  jądra  nietrwałe 
mogą  mieć  kształt  elipsoidy  spłaszczonej  (kształt 
dysku). 

Do  opisu  ruchu  nukleonów  w jądrze  zdeformowa- 
nym, jest  potrzebny  potencjał  zdeformowany.  Może 
to  być  np.  potencjał  Woodsa-Saxona,  ale  o po- 
wierzchniach ekwipotencjalnych  odpowiednio  zde- 
formowanych. Potencjał  taki  jest  często  stosowany 
w obliczeniach.  Znacznie  prostsze  jednak  są  oblicze- 
nia za  pomocą  potencjału  Nilssona,  który  jest  nieco 
zmodyfikowanym  potencjałem  oscylatora  harmo- 
nicznego, zawierającym  oddziaływanie  spin-orbita. 
Modyfikacja  jest  na  tyle  zręczna,  że  mimo  uproszcze- 
nia potencjał  jest  realistyczny.  Model  powłokowy 
oparty  na  potencjale  Nilssona  nazywa  się  modelem 
Nilssona  i jest  szczególnym,  wciąż  bardzo  powszech- 
nie stosowanym  modelem  powłokowym  dla  jąder 
zdeformowanych. 

Przy  potencjale  zdeformowanym,  całkowity  mo- 
ment pędu  nukleonu  j nie  jest  już  dobrą  liczbą  kwan- 
tową. Liczbami  takimi  pozostają  jedynie  parzystość 
oraz  rzut  całkowitego  momentu  pędu  na  oś  symetrii 
jądra.  Energia  stanu  zależy  teraz  od  deformacji  jądra. 


potencjał 
oddziaływa- 
nia spin- 
orbita 


jądra 

zdeformo- 

wane 


model 

Nilssona 


178 


Rys.  6.  Przykład  zależności  energii  jednocząstkowej  do  defor- 
macji jądra  <5  dla  kilkunastu  poziomów  (fragment  wykresu  Nils- 
sona).  Przy  każdym  poziomie  podany  jest  rzut  pełnego  momentu 
pędu  tego  poziomu  na  oś  symetrii  jądra  oraz  jego  parzystość 


Przykład  takiej  zależności  jest  podany  na  rys.  6,  na 
którym  wartościom  dodatnim  parametru  deformacji 
odpowiada  wydłużony  kształt  jądra,  a ujemnym  — 
spłaszczony.  Widać,  że  poziomy  przecinają  się.  Ich 
układ,  kolejność  zmieniają  się  wraz  z deformacją. 
Jeśli  znamy  zatem  deformację  jądra,  to  za  pomocą 
wykres  wykresu  poziomów  (zwanego  wykresem  lub  diagra- 
Nilssona  mem  Nilssona)  i — ogólnie  — za  pomocą  modelu 
Nilssona  możemy  odtworzyć  lub  przewidzieć  wła- 
sności jądra  w jego  stanie  podstawowym  i stanach 
niskowzbudzonych,  podobnie  jak  dla  jąder  sferycz- 
nych. Jeśli  nie  wiemy  jaka  jest  deformacja,  ale  znamy 
inne  własności  jądra,  to  możemy  postąpić  odwrotnie: 
z własności  tych  wnosić  o jego  deformacji. 

Przy  kształcie  kulistym  (deformacja  <$  = 0)  po- 
ziomy wykresu  z rys.  6 pokrywają  się  z poziomami 
z rys.  5c.  Deformacja  usuwa  częściowo  degenerację 
poziomów,  pozostaje  jeszcze  tylko  dwukrotna  dege- 
neracja każdego  poziomu. 
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może  przybierać  wartości:  / = 0,  2,  4,  6,  ...;  widmo 
(15)  (zwane  widmem  rotacyjnym)  jest  pokazane  na 
rys.  8.  Takie  charakterystyczne  widma  zaobserwo- 
wano u parzysto-parzystych  jąder  zdeformowanych. 

Model  rotacyjny  został  właśnie  wynaleziony  do  ich 
wyjaśnienia. 

Wśród  różnych  wzbudzeń  jąder  obserwujemy  takie, 
które  możemy  powiązać  z ich  drganiami.  Szczególnie 
prosty  obraz  dostajemy  przyjmując,  że  jądro  jest  kroplą 
nieściśliwej  cieczy,  której  drgania  możemy  opisać  drga-  Rys  g widmo  ro_ 
niami  jej  powierzchni.  Rysunek  9 podaje  kształty  po-  tacyjne  jądra  zde- 
wierzchni  jądra  sferycznego  przy  dwóch  rodzajach  formowanego 
drgań:  kwadrupolowym  (kształty  elipsoidalne)  i ok- 
tu polowym  (kształty  typu  gruszki),  prowadzących  do 
najniższych  energii  wzbudzenia. 

W modelu  kroplowym  widmo  wzbudzeń  odpowia- 
dające drganiom  ma  postać  jak  na  rys.  10.  Przy  drga- 
niach kwadrupolowych  najniżej  położony  jest  po- 
ziom 2+  ; na  wysokości  dwukrotnie  wyższej  znajdują 
się  trzy  poziomy  (tryplet)  — 0-f-,  2-f-,  4-f ; na  po- 
trójnej wysokości  — pięć  poziomów,  a wyżej  — 
układy  coraz  bardziej  złożone.  Na  wysokości  tych 
pięciu  poziomów  znajduje  się  dopiero  pierwszy  po- 
ziom wzbudzony  oktupolowy  3 — , a poziom  następ- 
ny — dopiero  na  wysokości  podwójnej.  Rzeczywiste 
widma  niektórych  jąder  sferycznych  wykazują  pewne 
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Rys.  9.  Kształty  po- 
wierzchni jądra  wy- 
konującego drgania 
kwadrupolowe 
(multipolowość  A== 
= 2)  i oktupolowc 
(A  = 3)  wokół  kształ- 
tu kulistego  odpo- 
wiadającego stano- 
wi równowagi 


Rys.  10.  Widmo  wibracyjne  najniższych  wzbudzeń  kwadrupolo- 
wych (A  = 2)  i oktupolowych  (A  = 3),  otrzymane  w modelu 
kroplowym 


cechy  widm  z rys.  10.  Na  ogół  jednak  obraz  jest  bar- 
dziej złożony. 

Podobnie  można  opisywać  wzbudzenia  wibracyjne 
ąder  zdeformowanych. 


Model  uogólniony 


Model  kolektywny 

W jądrze  atomowym  poza  zjawiskami  jednocząstko- 
wymi  - występują  zjawiska  kolektywne,  w których 
bierze  udział,  w sposób  skorelowany,  wiele  cząstek. 
Model  kolektywny  ma  za  zadanie  opisanie  tych  zja- 
wisk ; jest  on  modelem  cząstek  silnie  skorelowanych. 
Przykładami  zjawisk  kolektywnych  są:  ruch  obroto- 
wy (rotacja)  i drgania  (wibracje)  jądra.  Modele  opi- 
sujące oddzielnie  rotację  i wibracje  nazywane  są  od- 
powiednio rotacyjnym  i wibracyjnym, 
model  jak  wspomniano  wyżej,  niektóre  jądra  atomowe 
rotacyjny  Są  trwale  zdeformowane.  Przykładem  są  jądra  pier- 
wiastków ziem  rzadkich  oraz  aktynowców.  Kształt 
ich  jest  (w  dobrym,  przybliżeniu)  elipsoidą  wydłużoną, 
osiowo  symetryczną  (rys.  7). 

Obrót  tak  zdeformowanego  jądra  względem  osi 
prostopadłej  (np.  osi  (be)  do  osi  symetrii  (Oz  na 
rys.  7)  prowadzi  w mechanice  kwantowej  do  nastę- 
pującego widma  energii : 

E = ^jl{I+\),  (15) 

Rys  7 Jądro  zdc-  ^dzie  / — moment  pędu  jądra,  a J — jego  moment 
formowane  bezwładności  względem  osi  obrotu.  Moment  pędu  I 


Model  uogólniony  (zwany  też  połączonym,  scalonym 
lub  zunifikowanym)  jest  połączeniem  modelu  jedno- 
cząstkowego  (powłokowego)  z modelem  kolektyw- 
nym. Dopiero  w ramach  tego  modelu  można  opisać 
w sposób  stosunkowo  pełny  i konsekwentny  wła- 
sności jąder. 

Za  najprostszy  model  uogólniony  można  uważać 
omówiony  wcześniej  model  Nilssona.  By  opisać  bo- 
wiem strukturę  jednocząstkową  jądra  zdeformowane- 
go musi  on  zawierać  deformację  jądra,  która  jest 
wielkością  kolektywną.  Z tego  punktu  widzenia,  opis 
tego  modelu  można  by  umieścić  na  początku  niniej- 
szego rozdziału,  a nie  w rozdziale  poświęconym  mode- 
lowi powłokowemu.  Jednak  w modelu  Nilssona  rola 
parametru  kolektywnego  — deformacji  — jest  na  tyle 
tylko  pomocnicza,  że  bardziej  naturalne  wydaje  się 
traktowanie  go  jako  modelu  powłokowego  niż  uogól- 
nionego. Od  typowego  modelu  uogólnionego  wyma- 
gamy bowiem  więcej,  mianowicie  — by  opisywał  on 
zarówno  własności  jednocząstkowe,  jak  i kolektywne 
lub  też  by  opisywał  własności  kolektywne  w sposób 
pełny  (mikroskopowy —jak  często  się  mówi),  tj. 
oparty  o wewnętrzną,  jednocząstkową,  mikroskopo- 
wą strukturę  jądra. 

Możliwości  i rolę  modelu  uogólnionego  zilustru- 
jemy trzema  przykładami.  Jako  pierwszy  weźmiemy 
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jądro  nieparzyste,  które  jest  zwykle  traktowane  jako 
układ  jednej  cząstki  dodanej  do  parzysto-parzystego 
rdzenia.  Najniższe  wzbudzenia  takiego  układu  są 
pewną  superpozycją  wzbudzeń  kolektywnych  rdzenia 
i wzbudzeń  cząstkowych  cząstki  nieparzystej  umiesz- 
czonej w polu  rdzenia.  Widma  tych  wzbudzeń  są 
więc  pewną  kombinacją  widma  kolektywnego  (typu 
przedstawionego  na  rys.  8 lub  10)  i jednocząstkowego 
(typu  przedstawionego  na  rys.  5 lub  6) ; mogą  zatem 
być  opisane  w pełni  dopiero  przez  model  uogólniony. 

Drugiego  przykładu  może  dostarczyć  model  rota- 
cyjny, który  jest  szczególnym  przypadkiem  modelu 
kolektywnego.  We  wzorze  (15),  który  opisuje  energie 
ruchu  obrotowego  jądra  zdeformowanego  występuje 
parametr  J — moment  bezwładności  jądra.  Dopóki 
pozostajemy  w ramach  samego  modelu  rotacyjnego, 
parametr  ten  jest  czysto  fenomenologiczny.  Możemy 
wyznaczyć  jego  wartość  z doświadczenia  porównując 
zmierzoną  energię  stanu  rotacyjnego  o danym  mo- 
mencie pędu  i z energią  obliczoną  ze  wzoru  (15).  Nie 
możemy  jednak  powiązać  tej  wartości  z wewnętrzną 
strukturą  jądra,  o której  w czystym  modelu  rotacyj- 
nym nic  nie  wiemy.  Powiązanie  takie  jest  jednakże 
bardzo  ważne,  gdyż  pozwala  wykorzystać  wiedzę 
doświadczalną  o widmach  jąder  obracających  się 
(w  szczególności,  zdobywaną  ostatnio  wiedzę  o wid- 
mach jąder  szybko  obracających  się  ->  Jądra  atomowe 
w stanach  ekstremalnych)  do  sprawdzenia  i wzboga- 
cenia wiedzy  o strukturze  jądra.  Dokonać  tego  może- 
my dopiero  w modelu  uogólnionym,  który  obejmuje 
wewnętrzną  strukturę  jądra.  Korzystając  z tego  mo- 
delu możemy  wykonać  mikroskopowe  obliczenia  mo- 
mentu bezwładności,  który  w sposób  istotny  zależy 
od  szczegółów  tej  struktury. 

Trzecią  ilustracją  potrzeby  i możliwości  modelu 
uogólnionego  jest  stosowany  najczęściej  sposób  ob- 
liczania energii  całkowitej  jądra,  a zwłaszcza  jej  za- 
leżności od  deformacji.  Znajomość  tej  zależności  po- 
zwala wyznaczyć  statyczną  deformację  (deformację 
równowagi)  jądra,  obliczyć  barierę  potencjału  na  roz- 
szczepienie, energię  wzbudzeń  kolektywnych  itd. 
Obecnie  energię  jądra  oblicza  się  najczęściej  jako  su- 
mę energii  kropli  cieczy  (model  kroplowy  jądra, 
a więc  jedna  z najprostszych  wersji  modelu  kolek- 
tywnego) oraz  poprawki  powłokowej.  Poprawka  ta 
uwzględnia  niejednorodny,  powłokowy  charakter 
wewnętrznej  struktury.  Do  jej  wyznaczenia  jest  po- 
trzebny jednocząstkowy,  powłokowy  model  tej  struk- 
tury (np.  model  Nilssona),  przy  interesującej  nas  de- 
formacji jądra.  Widzimy  więc,  że  obliczenie  energii 
jest  dopiero  możliwe  w pełnym  modelu  uogólnio- 
nym. 

Przyjrzyjmy  się  nieco  wynikom  takich  obliczeń. 
Są  one  pokazane  na  rys.  11,  który  przedstawia  orien- 
tacyjnie zależność  energii  kroplowej,  poprawki  po- 
włokowej oraz  energii  całkowitej  od  deformacji  kwa- 
drupolowej  <5,  opisującej  elipsoidalny  kształt  jądra 
(tej  samej  co  na  rys.  6).  Rozważone  są  trzy  wypadki : 
jądra  o zamkniętych  powłokach  (a),  jądra  o niewielu 


nukleonach  poza  zamkniętymi  powłokami  (b)  oraz 
jądra  o dużej  liczbie  nukleonów  poza  zamkniętymi 
powłokami  — równej  w przybliżeniu  połowie  liczby 
wszystkich  nukleonów  w powłokach  (neutronowej 
i protonowej)  niezapełnionych  (c).  Widoczne  jest,  że 
w wypadku  a)  poprawka  powłokowa  ma  głębokie  mi- 
nimum przy  kształcie  kulistym  (<5  = 0),  co  powoduje, 
że  całkowita  energia  ma  także  minimum  przy  ń = 0 
i szybko  rośnie  ze  wzrostem  deformacji  (wydłużaniem 
lub  spłaszczaniem  kształtu  elipsoidalnego).  Oznacza 
to,  że  w stanie  równowagi  jądro  takie  jest  kuliste  i trud- 
no jest  je  zdeformować ; jest  ono  mało  podatne  („sztyw- 
ne”) na  deformację.  W wypadku  b)  jądro  jest  nadal 
kuliste  w stanie  równowagi,  ale  jest  już  bardziej  po- 
datne („miękkie”)  na  deformację,  jest  mu  łatwo  oscy- 
lować wokół  kształtu  kulistego.  W wypadku  c)  jądro 
jest  zdeformowane  w stanie  równowagi  i znowu  sto- 
sunkowo mało  podatne  na  odkształcanie  od  kształtu 
równowagi. 

Wynika  stąd,  gdzie  na  mapie  nuklidów  możemy 
oczekiwać  jąder  zdeformowanych.  Jądra  te  będą 
grupowały  się  wokół  środków  prostokątów  utworzo- 
nych przez  linie  Z = Zmag  i N = Nmag,  odpowiadają- 
ce protonowym  i neutronowym  liczbom  magicznym 
(rys.  12).  Obszary  jąder  zdeformowanych  będą  tym 
większe,  im  większe  są  powłoki ; przy  matfych  powło- 
kach mogą  wcale  nie  wystąpić.  Na  rys.  12  cztery  naj- 
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Rys.  12.  Położenie  znanych  i przewidywanych  obszarów  jąder 
zdeformowanych  na  mapie  nuklidów.  Przez  obszary  1 (ziemie 
rzadkie  — ZR)  i 2(aktynowce — Ak)  przechodzi  ścieżka  trwałości^. 
Na  skraj  obszaru  3 (jądra. neutronodeficytowe)  prowadzą  reakcje 
z ciężkimi  jonami  (obszar  ciemnoniebieski)  a do  obszaru  4 (jądra 
neutrononadmiarowe)  — reakcje  rozszczepienia  jąder  ciężkich. 
Jądra  położone  poza  liniami  zerowej  energii  wiązania  neutronu 
(Bn  = 0)  lub  protonu  (Bp  = 0)  nie  mogą  istnieć;  rozpadałyby  się 
natychmiast  lub  prawie  natychmiast  po  ich  utworzeniu.  Zazna- 
czone jest  także  położenie  hipotetycznej  wyspy  (kulistych)  jąder 
superciężkich  (SC),  usytuowanej  na  przecięciu  linii  przewidywa- 
nych liczb  magicznych  Zm&g  = 114  i Nmug  = 184 


Rys.  11.  Zależność  gładkiej  (kroplowej)  części  energii,  poprawki 
powłokowej  oraz  energii  całkowitej  od  deformacji  kwadrupolo- 
w ej  S dla  jądra  o zamkniętych  powłokach  (a),  niewielkiej  liczbie 
nukleonów  poza  zamkniętymi  powłokami  (b)  oraz  znacznej  ich 
liczbie  (c) 


większe  obszary  jąder  zdeformowanych  są  oznaczone 
numerami  1-4.  Tylko  dwa  z nich  są  tak  usytuowane, 
że  niemal  przez  środek  ich  przechodzi  ścieżka  trwa- 
łości fi.  Są  to : obszar  ziem  rzadkich  1 i aktynowców  2. 
W tych  obszarach  występują  zatem  jądra  zdeformo- 
wane trwałe  (ziemie  rzadkie)  lub  długożyciowe 
(część  aktynowców)  i one  właśnie  zostały  zbadane 
jako  pierwsze  spośród  jąder  zdeformowanych. 


Rozwój  modeli  jądrowych 


Modele  podstawowe  rzadko  są  stosowane  oddzielnie. 
Widzieliśmy  np.,  że  już  do  bardzo  przybliżonego  opi- 
su energii  wiązania  jąder,  oprócz  modelu  kroplowego 
był  także  potrzebny  model  gazu  Fermiego.  W celu 


dokładniejszego  zaś  opisu  trzeba  było  jeszcze  dodać 
(por.  wzór  7)  model  przedstawiający  nukleony  w ją- 
drze jako  powiązane  w pary  oraz  model  powłokowy. 
Drugim  przykładem  potrzeby  kojarzenia  modeli  jest 
przedstawiony  powyżej  i często  stosowany  model 
uogólniony,  który  jest  połączeniem  modelu  kolektyw- 
nego i powłokowego.  Ogólnie,  im  więcej  chcemy 
objąć  faktów  lub  dokładniej  je  opisać,  tym  bardziej 
złożonego  modelu  musimy  używać. 

Już  same  modele  podstawowe,  opisane  w rozdziale 
pierwszym,  z reguły  nie  mają  obecnie  tak  prostej  po- 
staci, w jakiej  je  przedstawiliśmy  wcześniej.  Na  przy- 
kład, przy  stosowaniu  modelu  powłokowego  musimy 
na  ogół  uwzględnić  oddziaływanie  resztkowe  (szcząt- 
kowe). Jest  to  część  oddziaływania  między  nukleo- 
nami, która  nie  została  włączona  do  potencjału  mo- 
delu powłokowego.  W oddziaływaniu  resztkowym 
występuje  m.in.  składowa  o stosunkowo  krótkim  za- 
sięgu działania,  która  łączy  nukleony  w pary. 
Uwzględnienie  jej  pozwala  objąć  modelem  powłoko- 
wym wspomniany  już  model  przedstawiający  nukleo- 
ny w jądrze  jako  powiązane  parami.  Taki  model 
nukleonów  (połączonych  w pary)  jest  stosowany  za- 
równo do  dokładniejszego  opisu  energii  wiązania 
(por.  wzór  6),  jak  też  do  ulepszenia  opisu  wielu  in- 
nych wielkości  jądrowych,  np.  momentu  bezwład- 
ności. 

Nawet  jeśli  nie  uwzględnia  się  oddziaływań  reszt- 
kowych, to  jednak  takiemu  „czystemu”  modelowi 
powłokowemu  stawia  się  obecnie  często  wyższe  wy- 
magania niż  dawniej.  Wymaga  się  mianowicie,  by 
potencjał  potencjał  stosowany  w tym  modelu  był  samozgodny, 
samozgodny  tj.  zgodny  z rozkładem  gęstości  nukleonów,  które  go 
wytwarzają.  Wyjaśnimy  to  dokładniej.  Jeśli  weźmie- 
my np.  potencjał  Woodsa-Saxona,  to  rozwiązując 
równanie  Schródingera  opisujące  ruch  nukleonów 
w tym  potencjale,  możemy  znaleźć  rozkład  gęstości 
umieszczonych  w nim  nukleonów.  Następnie,  znając 
już  tę  gęstość  i znając  oddziaływanie  między  nukleo- 
nami, możemy  wyznaczyć  potencjał,  który  one  wy- 
twarzają. Przekonamy  się,  że  potencjał  ten  różni  się 
trochę  od  wyjściowego  potencjału  Woodsa-Saxona. 
Po  poprawieniu  go  o tę  różnicę  możemy  znaleźć  nowy 
rozkład  gęstości,  a z niego  nowy  potencjał  itd.  Dopiero 
po  kilku  lub  kilkunastu  takich  krokach  (zależnie  od 
tego,  jak  dobrze  był  odgadnięty  potencjał  wyjścio- 
wy) rozkład  gęstości  obliczony  w danym  potencjale 


będzie  odtwarzał  go  na  powrót;  oznacza  to  właśnie, 
że  znaleziony  został  potencjał  samozgodny.  Postępo- 
wanie według  takiego  schematu  nazywa  się  metodą 
Hartree’ego-Focka. 

Powyższy  przykład  pokazuje,  jak  ulepszenie  mo- 
delu, nie  naruszając  podstawowych  jego  założeń 
(w  tym  wypadku  — niezależność  ruchu  nukleonów), 
czyni  go  bardziej  złożonym.  W pierwszym  modelu 
powłokowym,  potencjał  przyjmowało  się  (odgady- 
wało) w możliwie  prostej  i poglądowej  postaci. 
W metodzie  zaś  Hartree’ego-Focka  odnajduje  się  go 
za  pomocą  dosyć  złożonej  procedury  obliczeniowej. 
Obecnie  coraz  częściej  prosty  dawniej  model  zostaje 
zastąpiony  dość  złożonym  postępowaniem  oblicze- 
niowym. Model  traci  wtedy  swoją  poglądowość  na 
tyle,  że  przestaje  być  nazywany  modelem.  Niektórzy 
fizycy  nie  mówią  już  np.  o modelu  powłokowym, 
a tylko  o strukturze  powłokowej  jądra,  o opisie  lub 

0 teorii  tej  struktury. 

Ważnym  etapem  rozwoju  każdego  modelu  było 
uzasadnienie  jego  sukcesu,  szczególnie,  gdy  sukces 
ten  był  nieoczekiwany.  Przykładem  tego  jest  znowu 
model  powłokowy.  Ponieważ  siły  jądrow  e mają  krótki 
zasięg  (niewiele  przekraczający  rozmiary  nukleonu), 

1 wobec  tego  jądro  może  zostać  związane  tylko  przy 
dość  ścisłym  „upakowaniu”  nukleonów,  sukces  mo- 
delu powłokowego  wydał  się  dziwny.  Model  ten  przyj- 
muje bowiem  swobodny  ruch  nukleonów  w jądrze; 
wymaga  zatem,  by  średnia  droga  swobodna  nukleonu 
była  równa  lub  większa  od  rozmiarów  jądra,  a więc 
większa  niż  średnia  odległość  między  nukleonami. 
Zagadkę  jego  sukcesu  rozwiązało  wykrycie  wpływu 
zakazu  Pauliego  na  ruch  nukleonów.  Otóż  zakaz  ten 
wzbraniając  nukleonom  zajmowania  poziomów  za- 
jętych już  przez  inne,  sprawia,  że  nukleony  w jądrze 
„odczuwają”  tylko  niektóre  ze  zderzeń  między  sobą; 
mianowicie  tylko  zderzenia  silne,  które  mogą  „wybić” 
je  ponad  „morze”  stanów  zajętych.  Inne,  słabsze 
zderzenia  nie  mogą  zmienić  stanu  nukleonów  i nie  są 
zatem  przez  nie  odczuwalne.  Jest  to  równoważne 
efektowi  wydłużenia  drogi  swobodnej. 

Encyklopedia  fizyki,  t.  1,  str.  843,  Warszawa  1972;  B.L.  Cohen 
Concepts  of  nuclear  physics,  New  Delhi  1975;  H.  Frauenfelder, 
E.M.  Henley  Subatomic  physics , Englewood  Cliffs  1974;  A.  Sobi- 
czewski  Potencjał  jednocząstkowy  dla  jąder  zdeformowanych , Post. 
Fiz.  20,  649  (1969);  A.  Strzałkowski  Wstęp  do  fizyki  jądra  ato- 
mowego, Warszawa  1978;  Sz.  Szczeniowski  Fizyka  doświad- 
czalna, cz.  6,  Warszawa  1974;  Z.  Wilhelmi  Fizyka  reakcji  ją- 
drowych, Warszawa  1976. 
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Rozpady  jąder  atomowych 

Adam  Sobiczewski 


Jądro  atomowe  może  znajdować  się  w stanie  podsta- 
wowym, tj.  w stanie,  w którym  ma  najniższą  energię 
całkowitą  (a  więc  i najmniejszą  masę),  lub  w stanie 
wzbudzonym. 

jądro  Jądro  w stanie  wzbudzonym  ulega  rozpadowi, 
wzbudzone  Może  to  być  rozpad,  który  zmienia  skład  jąora  (np. 

rozpad  p,  a,  rozszczepienie),  jak  i rozpad,  który  skła- 
du tego  nie  zmienia  (rozpad  y,  konwersja  wewnętrzna). 
W ostatnim  przypadku  jądro  przechodzi  ze  stanu 
o wyższej  energii  wzbudzenia  do  stanu  o energii  niż- 
szej (deekscytacja),  w szczególności  do  stanu  podsta- 
wowego. W stanie  podstawowym  jądro  bądź  w ogóle 
nie  rozpada  się  (jądra  trwałe),  bądź  ulega  rozpadowi 
zmieniającemu  jego  skład,  czyli  prowadzącemu  do 
innego  już  jądra. 

izomery  Niektóre  stany  wzbudzone  są  szczególnie  wolno 
jądrowe  rozpadające  się  (stany  długożyciowe,  metatrwałe). 

Nazywamy  je  stanami  izomerycznymi  jądra,  a samo 
jądro  znajdujące  się  w tym  stanie  — izomerem.  Izo- 
mer jądrowy  różni  się  zatem  od  jądra  w zwykłym  sta- 
nie nie  składem  jądra,  lecz  jego  strukturą  (podobnie 
jak  w przypadku  izomeru  chemicznego),  co  oznacza- 
my przez  dodanie  litery  m (od  metatrwały)  przy  liczbie 


masowej.  Na  przykład  116mIn  oznacza  izomer  jądra 
116In. 

Warunkiem  koniecznym  każdego  rozpadu  jest,  by  egzoener- 
wydzielona  w nim  była  pewna  ilość  energii  (proces  gotycznoić 
egzoenergetyczny),  tzn.,  by  masa  wszystkich  produk-  rozpadu 
tów  rozpadu  była  mniejsza  od  masy  układu  wyjścio- 
wego. Wśród  rozpadów  jądrowych  najważniejsze  są: 
rozpady  P i a,  rozszczepienie  oraz  rozpad  y i kon- 
wersja wewnętrzna.  Rozpad  p zachodzi  wskutek  od- 
działywań słabych,  rozpad  y i konwersja  wewnętrzna 
wskutek  oddziaływań  elektromagnetycznych,  a w roz- 
padzie a i rozszczepieniu  istotną  rolę  odgrywają  od- 
działywania silne  (-*  Oddziaływania  słabe.  Oddzia- 
ływania elektromagnetyczne.  Oddziaływania  silne). 

Obecnie  znamy  około  2000  różnych  jąder.  Poło- 
żenie ich  na  mapie  jąder,  tj.  na  wykresie,  na  którym 
na  jednej  osi  odłożona  jest  liczba  protonów  Z,  a na 
drugiej — liczba  neutronów  N jądra,  ilustruje  rys.  1. 

Są  to  w większości  jądra  nietrwałe,  rozpadające  się 
(promieniotwórcze),  wytworzone  sztucznie  w różnego 
rodzaju  reakcjach  jądrowych.  Na  przykład  w drodze 
reakcji  rozszczepienia  jąder  powstaje  wiele  izotopów 
bogatych  w neutrony  (neutrono-nadmiarowych). 
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Rys.  1.  Mapa  jąder.  Dla  jądfer  promieniotwórczych  różnymi  kolorami  wyróżniono  główne  typy  rozpadu.  Jeśli  jądro  może  rozpadać  się 
na  różne  sposoby,  np.  na  drodze  rozpadu  a,  0+,  konwersji  wewnętrznej  i rozszczepienia  samorzutnego , ale  rozpad  a występuje  najczęś- 
ciej, tc  oznaczone  jest  ono  na  mapie  jako  jądro  a-promieniotwórcze.  Widoczne  jest , że  dla  większości  jąder  ciężkich  dominuje  rozpad  a r 
chociaż  rozszczepienie  odgrywa  dla  tych  jąder  także  ważną  rolę  (wg  Delta  nr  5,  1975) 
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a w drodze  reakcji  z ciężkimi  jonami  (— ► Fizyka  cięż- 
kich jonów)  — wiele  izotopów  ubogich  w neutrony 
(neutrono-deficytowych).  Wraz  z postępem  technicz- 
nym ciągle  wzrasta  możliwość  przeprowadzania  róż- 
nych reakcji,  a tym  samym  możliwość  poznania  no- 
jądra  trwałe  wych  jąder  nietrwałych.  Trwałych  jąder  jest  jedynie 
i promienie-  264.  W przyrodzie  oprócz  tych  264  jąder  trwałych 
twórcze  występuje  pewna  liczba  jąder  promieniotwórczych 
(promieniotwórczość  naturalna).  Przykładami  natu- 
ralnych jąder  promieniotwórczych  są  jądra;  izotop 
toru  232Th  i izotopy  uranu  238U  i 235U.  Mają  one  długie 
okresy  rozpadu,  porównywalne  z wiekiem  Ziemi  (do- 
kładniej, z wiekiem  najstarszych  skał  skorupy  ziem- 
skiej, ocenianym  na  ok.  5 miliardów  lat)  i dlatego 
mogły  przetrwać  w skorupie  ziemskiej  w ilościach 
obserwowalnych.  Rozpadając  się,  dają  początek  całym 
szeregom  (rodzinom,  rys.  1,  str.  245)  promieniotwór- 
czym. Każdy  szereg  składa  się  z jąder  promienio- 
twórczych, które  powstają  w drodze  kolejnych  rozpa- 
dów a lub  fi  jednego  z wymienionych  jąder  wyjścio- 
wych, i kończy  się  na  jądrze  trwałym.  Szeregi  powsta- 
jące z jąder:  232Th,  238U  i 235U  nazywają  się  szeregami: 
torowym,  uranowym  i aktynowo-uranowym  i kończą 
się  odpowiednio  na  jądrach  trwałych:  izotopach  oło- 
wiu 208Pb,  208Pb  i 207Pb. 


Ogólne  własności  rozpadu  jąder 

Wytwarzamy  obecnie  bardzo  wiele  jąder  i w bardzo 
różnych  stanach.  Dobierając  odpowiednio  rodzaj 
i parametry  reakcji  jądrowej  możemy  wytwarzać  jądra 
w określonym  stanie.  Z chwilą  jednak,  gdy  jądro  jest 
już  utworzone,  nie  mamy  praktycznie  wpływu  na  jego 


rozpad.  Rozpad  odbywa  się  samorzutnie,  spontanicz- 
nie. Istnieje  określone  prawdopodobieństwo  2,  właś- 
ciwe dla  danego  jądra  i stanu,  w którym  się  ono  znaj- 
duje, że  rozpadnie  się  ono  w jednostce  czasu.  Ilość 
wszystkich  rozpadów  w tej  jednostce  czasu  równa  jest 
zatem  liczbie  wszystkich  jąder  pomnożonej  przez  to 
prawdopodobieństwo : 

dN/dt  = —XN.  (1) 


prawe 

rozpadu 

promienio- 

twórczego 


Znak  minus  we  wzorze  (1)  oznacza,  że  wskutek  roz- 
padu liczba  jąder  maleje.  Wzór  (1)  nazywa  się  pra- 
wem rozpadu  promieniotwórczego.  Prawo  to  określa 
zależność  liczby  jąder  N od  czasu  /;  ma  ona  postać 
wykładniczą : 

N(t)  = N(0)Q~xt.  (2) 


N( 0)  oznacza  liczbę  jąder  w chwili  początkowej 
/ = 0,  w której  zaczynamy  obserwację.  Prawo  roz- 
padu (1)  jest  równaniem  różniczkowym,  którego  roz- 
wiązaniem jest  funkcja  N(t)  podana  wzorem  (2). 

Prawo  (1)  opisuje  rozpad  nie  tylko  jąder,  ale 
wszelkich  obiektów,  których  prawdopodobieństwo 
rozpadu  na  jednostkę  czasu  jest  stałe,  niezależne  ani 
od  chwili,  w której  zachodzi,  ani  od  liczby  obiektów. 

Podlega  mu  np.  także  rozpad  nietrwałych  cząstek 
elementarnych. 

Prawdopodobieństwo  A,  zwane  także  stałą  rozpadu, 
określa  szybkość  rozpadu.  Szybkość  tę  często  cha- 
rakteryzuje się  także  czasem  (okresem)  połowicznego 
zaniku  (połowicznego  rozpadu)  TV2,  (j-  czasem, 
w którym  liczba  jąder  maleje,  wskutek  rozpadu,  do 
połowy.  Wyraża  się  on  przez  2 następująco : czas 

- _ In  2 połowiczne- 

w go  zaniku 
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Rysunek  2 ilustruje  zależność  (2)  liczby  jąder  N(t) 
od  czasu.  Zaznaczony  jest  także  na  nim  czas  poło- 
wicznego zaniku  r1/2. 


zaniku  7\/a 


wynoszącej  ok.  7 MeV,  odpowiada  ogromna  różnica 
czasów  Ttt  sięgająca  ok.  29  rzędów  wielkości. 

Rozpad  a jest  efektem  czysto  kwantowym.  Polega  bariera  po- 
on  na  przeniknięciu  cząstki  a przez  barierę  poten-  tencjału  dla 
cjału  (efekt  tunelowy),  które  nie  jest  możliwe  w fizyce  cząstki  a 
klasycznej.  Bariera  potencjału  pojawia  się  jako  rezul- 
tat nałożenia  się  dwu  oddziaływań  pomiędzy  cząstką 
a i pozostałą  częścią  jądra : oddziaływania  jądrowego, 
które  ma  charakter  krótkozasięgowy  i jest  przyciąga- 
jące, oraz  oddziaływania  kulombowskiego,  które  ma 
charakter  długozasięgowy  i jest  odpychające.  Zilu- 
strowane jest  to  na  rys.  3.  Rysunek  3a  pokazuje  sche- 
matyczny przebieg  potencjału  jądrowego  Uj(r)  i po- 
tencjału kulombowskiego  £/kui(r)  w funkcji  odległości 
r cząstki  a od  środka  jądra.  Z rys.  3b  widać,  że  super- 
pozycja tych  oddziaływań  daje  potencjał  z barierą, 
którą  cząstka  a o energii  Ea  musi  przeniknąć  na  od- 
ległości od  R (promień  jądra)  do  b (punkt  wyjścia 
z bariery).  Im  energia  Ea  jest  większa,  tym  grubość 
(i  jednocześnie  względna  wysokość)  bariery  do  poko- 
nania jest  mniejsza,  a zatem  większe  prawdopodo- 
bieństwo przeniknięcia  przez  nią. 


Liczbę  rozpadających  się  jąder  w danej  próbce 
promieniotwórczej  w jednostce  czasu  nazywa  się  jej 
aktywność  aktywnością.  Zgodnie  z (1)  liczba  ta  jest  równa  XN. 
próbki  Zatem  aktywność  każdej  próbki  spada,  zgodnie  z (2), 
wykładniczo  z czasem. 

Jeśli  jądro  będące  w danym  stanie  ulega  kilku  róż- 
nym rozpadom,  np.  rozpadowi  /?,  a i in.,  to  całkowite 
prawdopodobieństwo  A równe  jest  sumie  prawdopo- 
dobieństw Ai  poszczególnych  rozpadów,  tzn. 

A — JT1  A*,  (4) 

i- 1 

gdzie  n jest  liczbą  możliwych  rozpadów.  Wobec  re- 
lacji (3)  wzór  ten  możemy  przepisać  jako  związek  po- 
między całkowitym  czasem  połowicznego  zaniku 
(zapisanym  krótko  jako  T,  zamiast  a czasami 

połowicznego  zaniku  Ti  ze  względu  na  poszczególne 
rozpady: 


i-l 


Ze  wzoru  (5)  wynika,  że  najważniejszy  jest  rozpad 
o najmniejszym  Tiy  który  decyduje  o całkowitym 
czasie  T.  Zgodnie  z (4)  aktywność  XN  jest  sumą  ak- 
tywności odpowiadających  poszczególnym  rodzajom 
rozpadu : 

XN  = JT  XiN.  (6) 

i-i 


Rozpad  ol 


Rozpad  ol  polega  na  wyrzuceniu  z jądra  cząstki  a,  tj. 
jądra  JHe,  które  wśród  jąder  lekkich  jest  jądrem 
szczególnie  silnie  związanym.  Rozpad  a możemy  za- 
pisać symbolicznie  jako 


A 

Z 


A-i 
Z- 2 


>v. 


+«. 


Obecnie  znamy  ok.  370  jąder  ulegających  rozpadowi 
ol  ze  stanu  podstawowego,  w tym  dla  ok.  260  z nich 
jest  to  rozpad  główny,  tzn.  rozpad,  którego  prawdo- 
podobieństwo A*  jest  większe  od  prawdopodobieństw 
rozpadu  innego  rodzaju. 

prawdopo-  Prawdopodobieństwo  rozpadu  a bardzo  silnie  za- 
dobieństwo  leży  od  energii  tego  rozpadu  Qa  — jest  tym  większe, 
rozpadu  ol  im  większa  jest  energia  Qa.  Energia  rozpadu  (równa 
praktycznie  energii  kinetycznej  emitowanej  cząstki  a, 
E<z ) mierzona  we  wszystkich  obserwowanych  rozpa- 
dach mieści  się  w granicach  ok.  2-9  MeV.  Odpowia- 
dający tej  energii  czas  połowicznego  zaniku  Ta  jest 
w granicach  od  ok.  8- 1015  lat  CJ|Sm)  do  ok.  3 • 10“7  s 
(28^Po).  Oznacza  to,  że  różnicy  energii  rozpadu  Qa, 


Rys.  3.  Mechanizm  powstawania  bariery  potencjału  dla  rozpadu 
a.  a)  Schematyczny  przebieg  potencjału  jądrowego  Uj(r)  i poten- 
cjału kulombowskiego  l/kui(r)dla  cząstki  a w funkcji  jej  odległości 
r od  środka  jądra,  b)  Superpozycja  tych  dwu  potencjałów  dająca 
barierę  potencjału,  którą  cząstka  a o energii  E%  musi  pokonać 
na  odległości  od  /?  do  b 

prawdopo- 

Prawdopodobieństwo  emisji  cząstki  a można  dobioństwo 
w przybliżeniu  zapisać  jako:  emisji  a 

i.  * ^ P . = v*p*>  (7) 

gdzie  va  jest  prędkością  cząstki  a w jądrze,  a R — 
promieniem  jądra.  Wielkość  v « = vxj2R  jest  częstością 
„uderzeń”  cząstki  a o barierę  potencjału  (tj.  liczbą 
przebiegnięć  cząstki  od  jednego  do  drugiego  brzegu 
jądra  w jednostce  czasu),  zatem  całkowite  prawdo- 
podobieństwo emisji  a w jednostce  czasu  jest  iloczy- 
nem liczby  uderzeń  o barierę  w tym  czasie  i prawdo- 
podobieństwa P * przeniknięcia  przez  nią  przy  każdym 
uderzeniu. 

Rola  rozpadu  a jest  tym  większa,  im  większa  jest 
liczba  atomowa  Z jądra.  Tym  większe  bowiem  jest 
wtedy  prawdopodobieństwo  rozpadu  A«,  czyli  tym 
mniejszy  czas  połowicznego  zaniku  7®.  Najmniejsze 
czasy  Ta  mają  więc  jądra  najcięższych  pierwiastków 
lub  pierwiastków  bogatych  w protony  (lub,  co  na 
jedno  wychodzi,  ubogich  w neutrony).  Czasy  Ta  jąder 
pierwiastków  ziem  rzadkich  są  ogromne  (np.  ok. 

8 -1015  lat  wynosi  Ta  izotopu  samaru  ^Sm,  jak  po- 
daliśmy wyżej).  Dla  najcięższych  zaś  znanych  obecnie 
pierwiastków  (Z  = 104,  105,  106) — już  tylko  rzędu 
sekund.  Na  przykład  dla  odkrytego  w 1974  roku  izo- 
topu 283106  wynosi  on  0,9  s. 
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struktura  Przy  precyzyjnych  badaniach  rozpadu  a określonego 
subtelna  jądra  można  na  ogół  zaobserwować  cząstki  a o kilku 
widma  a różnych  energiach  (tzw.  struktura  subtelna  widma  a). 

Jest  to  wynikiem  tego,  że  jądro  początkowe  może  się 
rozpadać  nie  tylko  do  stanu  podstawowego  jądra 
końcowego,  lecz  także  do  jego  stanów  wzbudzonych 
(-►  Jądra  atomowe  i ich  wzbudzenia) ; ilustruje  to 
rys.  4a.  Natężenia  jednak  rozpadów  do  stanów  wzbu- 


Rozpad  fł~  polega  na  przemianie  jednego  neutronu  rozpad  ftr 
w jądrze  na  proton,  której  towarzyszy  emisja  nega- 
tonu  (elektronu  ujemnego)  i anty  neutrina  v.  Sym- 

bolicznie możemy  to  zapisać : 

z^n  z-¥i^N-\Jre  W 

Rozpad  p+  jest  przemianą  jednego  protonu  w ją-  rozpad  p+ 
drze  na  neutron,  której  towarzyszy  emisja  pozytonu 
(elektronu  dodatniego)  e+  i neutrina.  Symboliczny 
zapis: 

ZXN  —■ ► z-\  ^+i  +v-  W 

Wychwyt  elektronowy  polega  na  pochwyceniu  wychwyt 
przez  jądro  negatonu  z jednej  z powłok  atomowych,  elektronowy 
czemu  towarzyszy  emisja  neutrina.  Symboliczny  za- 
pis: 

Azxs+'-^z- CO) 


wysokoenergetyczne 
cząstki  a 

\ 


\ 


E2 

v 

B, \ \ 

^ \ 


Rys.  4.  Ilustracja  pochodzenia  nisko-  i wysokoenergetycznych 
cząstek  a : a)  Rozpad  a ze  stanu  podstawowego  jądra  wyjściowego 
do  stanu  podstawowego  oraz  do  stanów  wzbudzonych  (nisko- 
energetyczne  cząstki  a)  jądra  końcowego,  b)  Rozpad  a ze  stanu 
podstawowego  oraz  ze  stanów  wzbudzonych  (wysokoenergetycz- 
ne cząstki  a)  jądra  wyjściowego  do  stanu  podstawowego  jądra 
końcowego 


nisko-  i wy-  dzonych  (rozpady  alt  a2,  ...)  są  z reguły  bardzo  małe 
sokoenerge-  w stosunku  do  natężenia  rozpadu  do  stanu  podsta- 
tyczne  wowego  (rozpad  a0),  gdyż  energie  2£x,  E*z  ...  są  mniej- 
cząstki  a sze  od  Ea0.  Można  obserwować  także  rozpady  ze 
stanów  wzbudzonych  jądra  początkowego  do  stanu 
podstawowego  jądra  końcowego  (rys.  4b).  Tutaj,  ze 
względu  na  wysokie  energie  cząstek  a,  £«;,  Ea't  .. , 
można  by  oczekiwać  dużych  natężeń  linii  a[,  •••>• 

W rzeczywistości  jednak  natężenia  te  są  bardzo  małe, 
gdyż  stany  wzbudzone  „chętniej”  ulegają  rozpadowi 
y niż  a i tylko  w bardzo  niewielu  przypadkach  jądro 
wzbudzone  zdąży  wyemitować  cząstkę  a przed  emisją 
kwantu  y. 

Przy  dokładnym  opisie  rozpadu  oc  należy  brać  pod 
uwagę  kilka  dodatkowych  czynników.  Należą  tu: 

— stopień  różnicy  w strukturze  jądra  początkowego 
i końcowego.  Znaczne  różnice  w tej  strukturze,  jak 
różnice  w spinie,  parzystości,  w strukturze  powłoko- 
wej, deformacji,  powodują  dodatkowe  spowolnienia 

tzw.  wzbronienia)  w rozpadzie  a ; 

— unoszenie  przez  niektóre  cząstki  a z jądra  pewnej 
ilości  momentu  pędu.  Daje  to  spowolnienie  w emisji 
tych  cząstek,  ponieważ  bariera  potencjału  dla  nich 
jest  wyższa  (efekt  sił  odśrodkowych); 

— wzór  (7)  jest  słuszny  przy  założeniu,  że  cząstki  a 
są  już  gotowe  w jądrze,  przed  ich  emisją.  W rzeczy- 
wistości w jądrze  są  protony  i neutrony  i istnieje  tylko 
określone,  znacznie  mniejsze  od  jedności  prawdopo- 
dobieństwo tworzenia  się  z nich  struktur  złożonych, 
takich  jak  cząstki  cc. 


Rozpad  p 

Pod  nazwą  rozpadu  lub  przemiany  p rozumiemy  trzy 
procesy:  rozpad  /?“,  rozpad  fi+  i wychwyt  elektronu 
orbitalnego. 


Najbardziej  prawdopodobny  jest  wychwyt  z powłoki 
K (wychwyt  K ),  znajdującej  się  najbliżej  jądra. 

Widmo  energetyczne  elektronu  (negatonu  e~  lub  widmo 
pozytonu  e+)  obserwowanego  w rozpadzie  fi  jest  rozpadu  p 
ciągłe.  Ilustruje  to  rys.  5 podający  zależność  ilości 


Rys.  5.  Zależność  ilości  elektronów  N«  obserwowanych  w roz- 
padzie fi  od  ich  energii  E 


obserwowanych  elektronów  Ne  od  ich  energii  E.  Fakt 
ten  odpowiada  różnemu  możliwemu  podziałowi  ener- 
gii rozpadu  pomiędzy  elektron  i neutrino  (czy  anty- 
neutrino)  i był  jednym  z głównych  powodów  wpro- 
wadzenia (przez  Pauliego)  hipotezy  istnienia  neutri- 
na. Neutrino  bowiem,  jako  cząstka  oddziałująca 
słabo  z materią,  nie  jest  bezpośrednio  obserwowane 
w rozpadzie  p.  Jedynie  maksymalna  energia  widma, 
odpowiadająca  wypadkowi,  gdy  elektron  unosi  całą 
dostępną  energię,  równa  jest  energii  przejścia  fi : 

Em  ax  = Ex — Ey. 

W wypadku  wychwytu  elektronu  emitowana  jest 
tylko  jedna  cząstka  (neutrino).  Ma  więc  ona  określo- 
ną energię,  równą  energii  przejścia. 

Ze  wzorów  (8-10)  widać,  że  rozpad  p nie  zmienia 
liczby  masowej  jądra  A.  Jest  więc  przemianą,  w której 
jądro  wyjściowe  i końcowe  są  izobarami.  Rozpad 
P~  zwiększa  ładunek  jądra  o 1,  a rozpad  p+  i wychwyt 
elektronowy  — zmniejszają. 

Wśród  wszystkich  izobarów  o danym  A istnieją 
tylko  jeden,  dwa  lub  trzy  stabilne  (trwałe)  względem 
rozpadu  fi.  Dokładniej,  wśród  izobarów  o nieparzy- 
stym A istnieje  tylko  jeden  trwały,  a wśród  izobarów 
o parzystym  A mogą  istnieć  jeden,  dwa  lub  trzy  izo-  izobary 
bary  trwałe.  Stanowią  one  jądra  najsilniej  związane  trwałe 
wśród  tych  izobarów.  Dla  parzystego  A są  to  jądra  względem 
o parzystej  liczbie  zarówno  protonów  Z,  jak  i neutro-  rozpadu  p 
nów  N (tzw.  jądra  parzysto-parzysle).  Natomiast 
jądra  o nieparzystych  Z i N (jądra  nieparzysto-nie- 
parzyste)  nie  są  trwałe  względem  rozpadu  p (z  wyjąt- 
kiem kilku  jąder  najlżejszych,  nie  wychodzących  poza 
™N).  Szczególna  trwałość  jąder  parzysto-parzystych 
pochodzi  stąd,  że  oddziaływania  jądrowe  uprzy- 
wilejowują wiązanie  się  identycznych  nukleonów 
w pary. 

Zilustrowane  to  jest  na  rys.  6.  Na  rys.  6a  podana  izobary 
jest  zależność  masy  izobaru  o nieparzystym  A od  jego  trwałe 
ładunku  Z.  Zależność  tę  dobrze  opisuje  model  krop-  o A nie- 
lowy  jądra  (— ► Modele  jądrowe).  Wykresem  jej  jest  parzystym 
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parabola.  Poszczególne  izotopy  odpowiadają  na  tej 
paraboli  punktom,  których  współrzędna  Z ma  war- 
tości całkowite.  Gdyby  nie  było  sił  kulombowskich 
pomiędzy  protonami,  najniższy  punkt  (najmniejsza 
masa,  najsilniej  związane  jądro)  byłby  przy  Z = A/2. 
Wobec  odpychania  kulombowskiego  dogodniejsza 
energetycznie  jest  mniejsza  liczba  protonów  w jądrze, 
zatem  minimum  występuje  przy  Z < A/2.  Widoczne 
jest,  że  parabola  ma  zawsze  dokładnie  jeden  punkt 
najniższy,  a więc  istnieje  dokładnie  jeden  izobar  trwa- 
ły, odpowiadający  ZTr. 

izobary  W przypadku  parzystego  A (rys.  6b)  mamy  dwie 
trwałe  parabole,  oddalone  od  siebie  o masę  2 ó/c2  równoważ- 
eń parzystym  ną  energii  rozerwania  dwu  par:  jednej  protonowej 
i jednej  neutronowej.  Przemiana  fi,  zmieniając  jądro 
z parzysto-parzystego  na  nieparzysto-nieparzyste 
(lub  odwrotnie),  prowadzi  od  punktu  na  paraboli  dol- 
nej do  punktu  na  paraboli  górnej  (lub  odwrotnie). 
Dla  dowolnego  punktu  na  paraboli  górnej  zawsze 
istnieje  punkt  sąsiedni,  niższy,  na  paraboli  dolnej 
i wobec  tego  jądro  nieparzysto-nieparzyste  zawsze 
(z  wyjątkiem  wspomnianych  wyżej  kilku  jąder  lek- 
kich) może  przejść  do  jądra  parzysto-parzystego.  Na 
dolnej  paraboli  jednak  może  być  kilka  punktów,  dla 
których  nie  ma  sąsiednich  punktów  na  paraboli  gór- 
nej, które  leżałyby  niżej.  Może  więc  być  kilka  parzy- 
sto-parzystych  izobarów  trwałych  względem  rozpadu 
fi.  Na  rys.  6b  izobarami  takimi  są  izobary  o Z4  i Z*. 
Na  rysunku  tym  izobary  o Zly  Z3,  Z5  i Z7  są  niepa- 


Rys.  6.  Zależność  masy  izobaru  od  jego  liczby  atomowej  Z’. 
a)  Izobary  o nieparzystej  liczbie  masowej  A.  Widoczne  jest,  że 
wśród  wszystkich  izobarów  o nieparzystym  A istnieje  tylko  jeden 
(Z  =»  Ztr)  trwały  względem  rozpadu  fi.  Pozostałe  rozpadają  się 
bądź  poprzez  rozpad  fi~  (gdy  Z < Ztr),  bądź  fi+  lub  wychwyt 
elektronu  (gdy  Z > Ztr)  i to  tym  szybciej,  im  dalej  położony  jest 
dany  izobar  od  izobaru  trwałego,  b)  Izobary  o parzystym  A. 
Dolna  parabola  odpowiada  jądrom  parzysto-parzystym,  a gór- 
na — nieparzysto-nieparzystym.  Widać,  że  w przypadku  parzy- 
stego A mogą  istnieć  dwa  (a  nawet  trzy)  izobary  trwałe  względem 
rozpadu  fi.  Na  rysunku  są  to  izobary  oZ  = Z4iZ^Z, 


rzysto-nieparzyste,  a izobary  o Z2,  Z4  i Z6  są  parzysto- 
parzyste.  Interesujący  jest  przypadek  izobaru  niepa- 
rzysto-nieparzystego  o liczbie  atomowej  Z6.  Widać,  że 
może  on  ulegać  rozpadowi  zarówno  fi~  y jak  i /?+. 

Przykładem  takiego  izobaru  jest  izotop  miedzi  84Cu, 
który  ulega  wszystkim  trzem  rodzajom  rozpadu 
fi  : fi~  (31%  wszystkich  rozpadów),  fi+  (15%)  i wych- 
wytowi elektronu  (54%). 

Szybkość  rozpadu  fi  rośnie  na  ogół  ze  wzrostem  szybkość 
energii  rozpadu.  Rysunek  6 ilustruje  więc,  że  przy  rozpadu  fi 
oddalaniu  się  od  izobaru  trwałego,  a więc  od  ścieżki 
trwałości  (-►  Jądra  atomowe  i ich  wzbudzenia),  ener- 
gia a zatem  i szybkość  rozpadu  rośnie,  tzn.  czasy 
połowicznego  zaniku  7>  maleją.  Przy  tym,  jeśli  odda- 
lamy się  w kierunku  jąder  ubogich  w neutrony  (np. 
produkty  reakcji  z ciężkimi  jonami),  to  jest  to  wy- 
chwyt elektronu  lub  rozpad  fi+y  jeśli  zaś  w kierunku 
jąder  bogatych  w neutrony  (np.  produkty  naświetla- 
nia strumieniem  neutronów  lub  produkty  rozszcze- 
pienia jąder  ciężkich),  to  jest  to  rozpad  fi~. 

Para  elektron  plus  neutrino  (czy  antyneutrino)  przejścia 
może  być  emitowana  z jądra  w stanach  o różnym  or-  dozwolone 
bitalnym  momencie  pędu  / = 0,  1,  2,  ...  (wyrażonym  i wzbronione 
w jednostkach  h).  Najbardziej  prawdopodobna  jest 
emisja  z / = 0.  Są  to  tzw.  przejścia  „dozwolone”. 

Przejścia  z wyższymi  momentami  orbitalnymi  nazy- 
wają się,  ze  względów  historycznych,  „wzbroniony- 
mi”, a samo  / — stopniem  wzbronienia.  Każdy  sto- 
pień wzbronienia  powoduje  spowolnienie  rozpadu 
o ok.  dwa  rzędy  wielkości  (tzn.  o ok.  100  razy). 

Wśród  przejść  dozwolonych  wyróżnia  się  tzw.  przej- 
ścia uprzywilejowane,  które  zachodzą  między  stana- 
mi jądrowymi  o podobnej  strukturze  wewnętrznej. 


Rozpad  y 

Przez  rozpad  czy  przejście  y rozumiemy  przejście 
jądra  ze  stanu  wzbudzonego  do  stanu  o energii  niż- 
szej, podczas  którego  energia  przejścia  unoszona  jest 
przez  promieniowanie  elektromagnetyczne.  Ze  wzglę- 
du na  duże  energie  przejść  jądrowych,  długości  fal 
tego  promieniowania  są  małe  (z  reguły  mniejsze  od 
1 A, tzn.  od  0,1  nm)  i ważny  jest  cząstkowy  (korpusku- 
larny)  aspekt  tego  promieniowania. 

Kwant  promieniowania  y emitowany  z jądra  cha- 
rakteryzuje się : 

— energią,  jaką  unosi  on  z jądra.  Jest  to  energia  reguły 

przejścia  jądrowego  (deekscytacji)  wyboru  dla 

przejść  y 

Ey  = E'-Ey  (11) 

gdzie  E jest  energią  stanu  początkowego,  a E'  — 
energią  stanu  końcowego  jądra, 

— momentem  pędu  (spinem,  krętem)  l (mierzonym 
w jednostkach  h)y  jaki  unosi  on  z jądra.  Może  on 
przyjmować  wartości  / = 1,  2,  3, ...  Mówi  się,  że  pro- 
mieniowanie (i  odpowiadające  mu  przejście)  unoszące 
spin  / jest  2Z- połowę  lub  multipolowe  rzędu  lub  stop- 
nia /.  Przy  1=1  jest  to  promieniowanie  dipolowe, 
przy  1 = 2 — kwadrupolowe,  1 = 3 — oktupolowe. 
Promieniowanie  określonej  multipolowości  / może  być 
elektryczne  (E)  lub  magnetyczne  (M).  Z zasady  za- 
chowania momentu  pędu  wynika,  że  spin  unoszony 
przez  kwant  y jest  różnicą  (wektorową,  gdyż  moment 
pędu  jest  wielkością  wektorową)  między  spinami 
stanów:  początkowego  I i końcowego  I'  jądra.  Daje 
to  warunek  na  / 

U-n  < / < /+/',  (12) 

zilustrowany  schematycznie  na  rys.  7, 

— parzystością  Py  która  może  być  dodatnia  (+)  lub 
ujemna  (— ).  Promieniowanie  elektryczne  o multipo- 
lowości / ma  parzystość  (— l)z,  a magnetyczne  — 

Zasada  zachowania  parzystości  w oddziały- 
waniach elektromagnetycznych  daje  dla  przejścia 
y o multipolowości  / warunek 

PPi  = P\ 


(13) 
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prawdopodo- 
bieństwo 
przejścia  y 


tzn.,  e między  stanami  jądrowymi  o tej  samej  pa- 
rzystości ( P ' = P)  mogą  zachodzić  tylko  przejścia 
o parzystości  dodatniej  (np.  przejście  elektryczne 


Rys.  7.  Ilustracja  fak- 
tu, że  spin  stanu  po- 
czątkowego / jest  su- 
mą (wektorową)  spinu 

stanu  końcowego  /' 
— ► 

oraz  spinu  / unoszo- 
nego przez  kwant  y. 
Liniami  kreskowany- 
mi zaznaczone  są  róż- 
ne możliwe  orientacje 

spinu  / 


Interesujące  są  przypadki,  gdy  pomiędzy  stanami 
o znacznie  różniących  się  spinach  nie  występują  stany 
o spinach  pośrednich.  Przykładem  są  jądra,  w których 
spiny  pierwszego  stanu  wzbudzonego  i stanu  podsta- 
wowego różnią  się  znacznie.  Wtedy  prawdopodo- 
bieństwo przejścia  y ze  stanu  wzbudzonego  jest  małe, 
bo  multipolowość  przejścia  jest  duża  i czas  połowicz- 
nego zaniku  Ty  jest  duży.  Może  on  być  rzędu  nawet 
godzin,  podczas  gdy  dla  przeciętnych  stanów  jądro- 
wych Ty  jest,  orientacyjnie,  w granicach  od  mikro- 
sekund (10-6  s)  do  pikosekund  (10" 12  s).  Takie  dłu- 
gożyciowe  (metatrwałe)  stany  nazywają  się  izome- 
rycznymi, a jądra  w tych  stanach  — izomerami  jądro- 
wymi. Przykładem  izomeru  jądrowego  jest  jądro  izo- 
topu indu  115In  w stanie  o energii  335  keV.  Stan  ten 
jest  stanem  o najniższej  energii  wzbudzenia;  jego  spin 
wynosi  1/2i  a parzystość  (— ).  Przejście  do  stanu  pod- 
stawowego, który  ma  spin  */2  i parzystość  (+),  może 
więc,  zgodnie  ze  wzorem  (12),  mieć  multipolowość 
tylko  4 lub  5.  Uwzględniając  także  wzór  (13)  może  to 
być  przejście  typu  M4  lub  E5.  W związku  z wysoką 
multipolowością  i małą  energią  przejścia  czas  poło- 
wicznego zaniku  izomeru  jest  duży  i wynosi  4,5  h. 


kwadrupolowe  lub  magnetyczne  dipolowe),  a między 
stanami  o parzystości  przeciwnej  (P'  = — P)  — 
przejścia  o parzystości  ujemnej  (np.  elektryczne  dipo- 
lowe). 

Wzory  (11-13)  nazywają  się  regułami  wyboru  dla 
przejść  y.  Ponieważ  są  one  konsekwencją  zasad  za- 
chowania energii,  momentu  pędu  i parzystości,  sta- 
nowią warunki,  które  muszą  być  spełnione  przy  tych 
przejściach.  Reguły  wyboru  pozwalają  na  wyznacza- 
nie energii,  spinów  i parzystości  stanów  jądrowych 
(— ► Spektroskopia  jądrowa)  za  pomocą  pomiaru 
energii  i multipolowości  przejść  y. 

Prawdopodobieństwo  przejścia  y,  Xy  silnie  zależy 
od  energii  przejścia  Ey  i multipolowości  /.  Rośnie  ono 
silnie  ze  wzrostem  Ev,  a bardzo  silnie  maleje  ze  wzro- 
stem /.  Ten  ostatni  fakt  oznacza,  że  najczęściej  obser- 
wuje się  przejścia  tylko  najniższej  multipolowości: 
/ = 1 (dipolowe)  i / = 2 (kwadrupolowe),  a spośród 
wszystkich  możliwych  przejść  między  stanami  o spi- 
nach /'  i /,  podanych  przez  regułę  (12),  obserwuje  się 
na  ogół  tylko  przejście  o najniższym  /,  tj.  o / = 

Jeszcze  innym  wyrazem  tej  zależności  jest  fakt,  że 
pomiędzy  stanami  o znacznie  różniących  się  spinach 
jądro  dokonuje  najchętniej  przejścia  y nie  bezpo- 
średnio (potrzebna  duża  multipolowość  przejścia), 
lecz  przez  stany  o spinach  pośrednich.  Przykład  ta- 
kich przejść  podany  jest  na  rys.  8,  który  pokazuje 
widmo  rotacyjne  jądra  parzysto-parzystego  zdefor- 
mowanego. Spiny  kolejnych  stanów  są:  0,  2,  4,  6, 
8,  ...  Obserwuje  się  tu  kaskadę  przejść  o najniższej 
możliwej  multipolowości  (/  = 2),  a więc  przejścia 
pomiędzy  stanami  o najmniejszej  różnicy  spinów. 

8+ 


E 2 

Rys.  8.  Przykład  typowego  widma  ro- 
tacyjnego jądra  parzysto-parzystego 
zdeformowanego.  Jądro  zdeformo- 
’ q wane  może  obracać  się  i energie  od- 

powiadające różnym  stanom  tego  ob- 
rotu (rotacji)  tworzą  właśnie  widmo 
rotacyjne.  Poziomy  tego  widma  leżą 
E 2 stosunkowo  nisko  i dobrze  się  sepa- 

rują od  pozostałych  poziomów  wzbu- 
dzonych jądra.  Teoretyczny  opis  tych 
1 f poziomów  podany  jest  przez  model 

kolekty wny  jądra  (—>  Modele  jądro- 
’ 4<+  we).  Kolejne  stany  mają  spiny:  0,  2, 

4,  6,  8,  ...  oraz  parzystość  dodatnią 
£2  ( + ).  Doświadczalnie  obserwuje  się 

w tutaj  kaskadę  przejść  */  typu  £2  (ele- 

ktryczne kwadrupolowe)  pomiędzy 

łr  2 + sąsiednimi  stanami.  Przejścia  pomię- 
E2  dzy  stanami  dalszymi  niż  sąsiednie 

i 0+  są  natomiast  bardzo  słabe 


Konwersja  wewnętrzna 

Procesem  konkurencyjnym  do  przejścia  y jest  przej- 
ście, w którym  energia  deekscytacji  jądra  przekazy- 
wana jest  bezpośrednio  jednemu  z elektronów  powło- 
ki atomowej.  Przejście  takie  nazywa  się  konwersją 
wewnętrzną.  Elektron  unosi  tu  energię,  moment  pędu 
i parzystość  przejścia  jądrowego,  analogicznie,  jak 
czyni  to  emitowany  z jądra  kwant  y . Przejście  ma 
więc  określoną  energię,  multipolowość  i parzystość. 
Obowiązują  te  same,  co  dla  przejścia  y,  reguły  wybo- 
ru (11-13).  Ponieważ  całą  energię  przejścia  unosi 
jeden  elektron,  to  widmo  elektronów  konwersji  we- 
wnętrznej jest  liniowe  (prążkowe,  dyskretne),  w od- 
różnieniu od  widma  elektronów  pochodzących  z roz- 
padu p,  które  jest  ciągłe. 

Stosunek  prawdopodobieństwa  deekscytacji  jądra 
w drodze  konwersji  wewnętrznej  Xe  do  prawdopodo- 
bieństwa deekscytacji  w drodze  przejścia  y,  Av,  na- 
zywa się  współczynnikiem  konwersji  wewnętrznej  a, 
tzn.  a = Xe/X v.  Współczynnik  a silnie  zależy  od  energii 
przejścia  i jego  multipolowości  oraz  od  ładunku 
jądra  Z.  Maleje  on  szybko  ze  wzrostem  energii  przej- 
ścia, co  oznacza,  że  konwersja  wewnętrzna  odgrywa 
najważniejszą  rolę  przy  stosunkowo  niskich  ener- 
giach. Rośnie  natomiast  szybko  ze  wzrostem  stopnia 
multipolowości  przejścia  /.  Fakt  ten  dostarcza  ważnej 
metody  określania  stopnia  multipolowości  przejścia 
przez  pomiar  współczynnika  a (->  Spektroskopia 
jądrowa).  Współczynnik  a silnie  rośnie  ze  wzrostem 
liczby  atomowej  jądra  Z,  co  oznacza,  że  rola  kon- 
wersji wewnętrznej  rośnie  przy  przejściu  do  pier- 
wiastków najcięższych. 


Rozszczepienie 

Rozszczepieniem  nazywamy  proces,  w którym  jądro 
rozpada  się  na  dwie  lub  więcej  porównywalnych,  co 
do  wielkości,  części  (fragmentów).  Występuje  ono  dla 
jąder  ciężkich  i zachodzi  z większym  prawdopodo- 
bieństwem w stanie  wzbudzonym  jądra  niż  w stanie 
podstawowym  (tzw.  rozszczepienie  samorzutne). 

Prawdopodobieństwo  rozszczepienia  na  dwa  frag- 
menty (rozszczepienie  podwójne)  jest  największe. 
Stosunkowo  jeszcze  znaczne  jest  prawdopodobień- 
stwo rozszczepienia,  w którym  obok  dwu  ciężkich* 
fragmentów  powstaje  także  cząstka  a (tzw.  try par- 
tycja). Rozszczepienie  takie  zachodzi  z częstością  ok. 
1 przypadku  na  400  przypadków  rozszczepienia  po- 
dwójnego. Prawdopodobieństwo  rozszczepienia  na  3 
lub  4 porównywalne  fragmenty  jest  już  znikome. 

Ponieważ  rozszczepiające  się  jądra  ciężkie  są  znacz- 
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nie  bogatsze  w neutrony  ( NfZ  X 1,6)  niż  jądra 
średnie  {NfZ  & 1,3),  to  i fragmenty  rozszczepienia 
są  bogate  w neutrony.  Fragmenty  te,  powstające 
w silnie  wzbudzonych  stanach,  emitują  neutrony 
bezpośrednio  po  utworzeniu  się  (neutrony  natych- 
miastowe) w liczbie  średnio  ok.  2,5  na  jeden  akt  roz- 
szczepienia, a także  po  rozpadzie  p (neutrony  opóź- 
nione). Emisja  neutronów,  które  mogą  z kolei  po- 
wodować rozszczepienie  innych  jąder,  stwarza  możli- 
wość zajścia  reakcji  łańcuchowej  (-*  Energia  jądrowa). 
W każdym  akcie  rozszczepienia  wyzwala  się  duża, 
rzędu  200  MeV,  energia  (energia  jądrowa). 

Rozszczepienie  jąder  ciężkich  możliwe  jest  dzięki 
temu,  że  są  one  słabiej  związane  niż  jądra  o średniej 
masie,  na  które  się  rozpadają.  Wiąże  się  to  z odpy- 
chaniem kulombowskim  między  protonami.  Energia 
tego  odpychania  rośnie  ze  wzrostem  liczby  atomowej 
Z jak  Z2,  co  powoduje  silne  obniżenie  energii  wiąza- 
nia jąder  ciężkich  w stosunku  do  jąder  lżejszych.  Moż- 
liwie energetycznie  rozszczepienie  nie  zachodzi  jednak 
natychmiast,  lecz  z pewnym,  dla  niektórych  jąder 
bardzo  dużym,  opóźnieniem,  co  spowodowane  jest 
obecnością  bariery  potencjału. 

Orientacyjnie  proces  rozszczepienia  można  opisać 
za  pomocą  modelu  kroplowego  jądra  (-*  Modele 
jądrowe.  Proces  ten  polega  na  deformowaniu  się  jądra 
od  kształtu  kulistego  lub  prawie  kulistego  poprzez 
coraz  bardziej  wydłużony,  wydłużony  z przewęże- 
niem w środku,  aż  do  uformowania  się  i rozdzielenia 
dwu  fragmentów.  Zgodnie  z modelem  kroplowym 
energia  potencjalna  jądra  może  być  przedstawiona 
jako  suma  energii  powierzchniowej  i energii  kulom- 
bowśkiej.  Energia  powierzchniowa  jest  proporcjonal- 
na do  pola  powierzchni  jądra.  Poniew-aż  pole  to  rośnie 
ze  wzrostem  deformacji  jądra,  to  i energia  powierz- 
chniowa rośnie.  Energia  kulombowska  zaś  maleje, 
ponieważ  deformowanie  jądra  (a  dokładniej,  wydłu- 
żanie się  jego)  sprzyja  oddalaniu  się  od  siebie  odpy- 
chających się  elektrycznie  protonów.  Dla  małych  de- 
formacji przyrost  energii  powierzchniowej  jest  większy 
od  ubytku  energii  kulombowskiej,  dla  dużych  zaś  — 
odwrotnie.  Całkowita  energia  zatem,  jako  suma  ich 
obu,  początkowo  wzrasta,  następnie  przechodzi 
przez  maksimum  i wreszcie  maleje  ze  wzrostem  de- 
formacji jądra.  Powstaje  więc  bariera  potencjału.  Ilu- 
struje to  rys.  9,  na  którym  energia  jądra  U(d)  przed- 
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Rys.  9.  Zależność  energii  potencjalnej  jądra  U od  jego  deformacji 
dy  jaką  otrzymuje  się  w ramach  modelu  kroplowego.  Dla  wszy- 
stkich jąder  minimum  energii  (stan  podstawowy  jądra)  otrzy- 
mywane jest  przy  deformacji  zerowej  (kształt  kulisty).  Na  dole 
rysunku  zobrazowane  są  kształty  odpowiadające  kilku  warto- 
ściom parametru  deformacj  i d 

stawiona  jest  w funkcji  deformacji  d.  Jądro  w stanie 
o energii  £sr,  aby  ulec  rozszczepieniu,  musi  przeniknąć 
barierę  (efekt  tunelowy)  od  deformacji  d1  do  defor- 
macji d2.  Kształty  jądra  odpowiadające  różnym  de- 
formacjom d ukazuje  rysunek. 

Proces  rozszczepienia  jest  zatem  podobny  do  pro- 
cesu rozpadu  a.  Oba  procesy  polegają  na  tunelowym 
przeniknięciu  przez  barierę  potencjału,  utworzoną 
przez  nałożenie  się  oddziały wania  jądrowego,  dążą- 
cego do  zapobiegnięcia  rozpadowi,  i odpychania  ku- 


lombowskiego,  dążącego  do  rozpadu.  W rozpadzie  a 
jest  to  bariera  ze  względu  na  oddalanie  się  cząstki  a 
od  jądra,  przy  rozszczepieniu  zaś  jest  to  bariera  ze 
względu  na  deformację  jądra. 

Wysokość  bariery,  a więc  i prawdopodobieństwo  parametr 
rozszczepienia,  a tym  samym  i czas  połowicznego  rozszczepiał  - 
zaniku  ze  względu  na  ten  proces,  zależą  bardzo  silnie  ności 
od  stosunku  energii  odpychania  kulombowskiego  do 
energii  powierzchniowej  zwanego  parametrem  roz- 
szczepialności,  który  wynosi  w przybliżeniu 

1 Z2 
50 ~A  * 

Na  przykład  dla  jądra  izotopu  uranu  238U  parametr 
rozszczepialności  wynosi:  x ~ 0,71,  a czas  połowicz- 
nego zaniku  ze  względu  na  samorzutne  rozszczepie- 
nie: Tsr  X 6 1015  lat.  Dla  cięższego  jądra  izotopu 
fermu  254Fm:  * « 0,79,  a TSr  » 220  dni,  tzn.  jest 
o ok.  16  rzędów  krótszy.  Dla  jeszcze  cięższego  jądra 
2 58 104:  x x 0,83,  a (zmierzony  ostatnio)  Tsr  ~ 0,01  s, 
tzn.  jest  o ok.  dalsze  9 rzędów  krótszy. 

Według  modelu  kroplowego  jądra  mające  x > 1, 
tj.  dla  których  Z2/ A > 50,  nie  mogą  istnieć.  Rozszcze- 
piałyby się  one  natychmiast.  Model  kroplowy  nie 
uwzględnia  jednak  ważnych  dla  jądra  efektów  powło- 
kowych (efektów  struktury  powłokowej  jądra),  które 
istotnie  modyfikują  przewidywania  tego  -modelu. 

M.in.  efekty  te  dopuszczają  istnienie  jąder  bardzo 
ciężkich  z Z2/ A > 50  (hipoteza  jąder  superciężkich 
— ► Jądra  atomowe  w stanach  ekstremalnych).  Powo-  hipoteza 
dują  one  także,  że  dla  wielu  jąder  w barierze  na  roz-  jąder 
szczepienie  pojawia  się  znaczne  wgłębienie,  lokalne  super- 
minimum  (tzw.  drugie  minimum),  do  którego,  jeśli  ciężkich 
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Rys.  10.  Zależność  energii  potencjalnej  jądra  U od  jego  defor- 
macji d po  uwzględnieniu  efektów  powłokowych.  Efekty  te  po- 
wodują, że  dla  wielu  jąder  pierwsze,  głębokie  minimum  energii 
potencjalnej,  odpowiadające  stanowi  podstawowemu  jądra, 
występuje  przy  kształcie  zdeformowanym  (jądra  zdeformowane), 
a nie  kulistym,  jak  przewiduje  model  kroplowy.  Efekty  powło- 
kowe powodują  także,  że  dla  niektórych  jąder  występuje  również 
drugie,  płytsze  minimum  energii  potencjalnej,  odpowiadające 
stanowi  izomerycznemu.  Ze  względu  na  mniejszą  barierę,  roz- 
szczepienie ze  stanu  izomerycznego  następuje  znacznie  szybciej 
niż  ze  stanu  podstawowego.  Deformacja  jądra  w stanie  podsta- 
wowym oznaczona  jest  przez  dP,  a w izomerycznym  — przez  di 

jądro  zostanie  „schwytane”,  to  trwa  w nim  stosunko- 
wo długo,  zanim  się  rozszczepi.  Ilustruje  to  rys.  10, 
który  przedstawia  przebieg  energii  potencjalnej  w 
funkcji  deformacji  dla  niektórych  jąder.  Na  rysunku 
widać,  że  jądro  o deformacji  di  musi  pokonać  barierę 
zarówno  po  to,  by  się  rozszczepić,  jak  też  by  przejść 
do  stanu  podstawowego.  Stan  jądra  o tej  deformacji 
jest  więc  metatrwały,  a zatem  jądro  znajdujące  się 
w tym  stanie  jest  izomerem.  Natura  tego  izomeru  jest 
jednak  inna  niż  izomerów  dotąd  omawianych.  Po- 
przednio mówiliśmy  o izomerach,  których  długi  czas 
życia  związany  był  z dużą  różnicą  między  spinem  stanu 
izomerycznego  a spinami  stanów  osiąganych  przez 
rozpad  w drodze  przejścia  elektromagnetycznego. 
W omawianym  wypadku  zaś  długi  czas  życia  izo- 
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izomery  meru  związany  jest  z istnieniem  bariery  potencjału, 
rozszczepia-  Izomery  tego  typu  nazywane  są  izomerami  rozszcze- 
jące  się  piającymi  się  lub,  czasami,  izomerami  kształtu.  Pierw- 
szy taki  izomer  zaobserwowany  został  w 1962  r. 
w jądrze  a42Am.  Obecnie  znamy  ok.  30  takich  izome- 
rów. Występują  one  w jądrach  uranu,  plutonu,  ame- 
ryku,  kiuru  i berkelu. 

Ze  względu  na  znacznie  mniejszą  barierę  na  roz- 
szczepienie niż  bariera  jaką  ma  jądro  w stanie  pod- 
stawowym (por.  rys.  10),  prawdopodobieństwo  roz- 
szczepienia izomerów  jest  bardzo  duże  (stąd  ich  na- 
zwa— izomery  rozszczepiające  się),  czyli  czasy  ich 
życia  ze  względu  na  ten  proces  — bardzo  małe.  Czasy 


te  zawierają  się  w przedziale  od  nanosekund  (10~9  s 
do  milisekund  (10~3  s),  są  one  o 21  do  31  rzędów  krót- 
sze niż  odpowiednie  czasy  życia  stanów  podstawo- 
wych tych  samych  jąder.  Na  przykład  czas  życia  ze 
względu  na  samorzutne  rozszczepienie  dla  stanu  pod- 
stawowego jądra  238U  wynosi  ok.  6 1015  lat,  a dla 
rozszczepiającego  się  izomeru  tego  samego  jądra  — 
195  ns,  czyli  jest  o ok.  30  rzędów  krótszy. 

L.  Groszew,  I.  Szapiro  Spektroskopia  jąder  atomowych , War- 
szawa 1956;  D.  Hall  id  ay  Wstęp  do  fizyki  jądrowej , Warszawa 
1957;  A.  Strzałkowski  Wstęp  do  fizyki  jądra  atomowego. 
Warszawa  1978;  Sz.  Szczeniowski  Fizyka  doświadczalna , cz.  6, 
Warszawa  1974;  E.  Szpolski  Fizyka  atomowa , t.  2,  cz.  2,  War- 
szawa 1954. 
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Reakcją  jądrową  nazywamy  proces  wynikający  z od- 
działywania cząstki  jądrowej  (może  nią  być  cząstka 
elementarna,  jak  np.  nukleon,  mezon,  foton  lub 
cząstka  złożona,  np.  deuteron,  cząstka  a czy  też  każde 
inne  jądro  atomowe,  tzw.  ciężki  jon)  z jądrem  ato- 
mowym. W wyniku  zajścia  reakcji  jądrowej  bombar- 
dowane jądro  tarczy  może  pozostać  bez  zmiany, 
może  zostać  wzbudzone  lub  też  może  powstać  inne 
jądro  atomowe  w stanie  podstawowym  czy  też  wzbu- 
dzonym (rys.  1).  Procesowi  temu  towarzyszy  zwykle 


a 

O — ► 


o — ► 


Rys.  1.  Przykłady  różnych  reakcji  jądrowych:  1.  Rozpraszanie 
elastyczne:  cząstka  a rozprasza  się  sprężyście  w oddziaływaniu 
z jądrem  A.  Jądro  A uzyskuje  pewną  energię  kinetyczną,  lecz  jego 
stan  wewnętrzny  nie  ulega  zmianie.  2.  Rozpraszanie  nieelastyczne. 
W oddziaływaniu  część  energii  kinetycznej  cząstki  a zostaje 
zużyta  na  wzbudzenie  jądra  A (jądro  wzbudzone  oznaczamy 
jako  A*).  3.  Reakcja  jądrowa  sensu  stricto:  w wyniku  oddziały- 
wania powstaje  cząstka  b i jądro  B* 

emisja  jednej  lub  wielu  cząstek  elementarnych  lub 
złożonych.  Reakcje  jądrowe  zachodzą  stosunkowo 
szybko  — w czasie  od  10-23  s do  10~15  s.  Stosują  się 
do  nich  wszystkie  klasyczne  prawa  zachowania  obo- 
wiązujące powszechnie  w fizyce  (prawo  zachowania 
energii,  pędu,  momentu  pędu,  ładunku),  ponadto 
kwantowy  charakter  procesu,  wynikający  z małych 
rozmiarów  oddziałujących  obiektów  oraz  małych 
wartości  wymienianej  energii,  narzuca  dodatkowe 
prawa  zachowania  (np.  parzystości  funkcji  falo- 
wej). 

Z zasady  zachowania  energii  wynika,  że  ubytek  lub 
zysk  całkowitej  energii  kinetycznej  cząstek  biorących 
udział  w reakcji  może  mieć  źródło  tylko  w zysku  lub 
ubytku  łącznej  masy  cząstek.  Różnica  łącznej  masy 
cząstek  wchodzących  w reakcję  i łącznej  masy  pro- 
ciepło  reakcji  duktów  reakcji  zwana  jest  ciepłem  reakcji.  Znajo- 


mość ciepła  reakcji  (np.  obliczonego  na  podstawie 
dokładnych  tablic  mas  jąder  atomowych)  pozwala 
przewidzieć  kinetyczną  energię  produktów  przy  zada- 
nej energii  kinetycznej  cząstki  wywołującej  reakcję. 

Do  opisu  reakcji  jądrowych  wprowadza  się  pojęcie  kanał 
„kanału  reakcji”.  Jest  on  scharakteryzowany  przez  reakcji 
rodzaj  cząstek  oddziałujących  lub  emitowanych 
w reakcji  jądrowej,  ich  energię,  moment  pędu  w ruchu 
względnym,  przestrzenne  ustawienie  spinów.  Tak 
więc  mamy  „kanał  wejściowy”  opisujący  cząstkę  wy- 
wołującą reakcję  i jądro  bombardowane  oraz  szereg 
„kanałów  wyjściowych”  opisujących  wszystkie  mo- 
żliwe cząstki  i jądra  końcowe  po  zajściu  reakcji. 

Miarą  prawdopodobieństwa  zajścia  określonej  przekrój 
reakcji  jądrowej  jest  wielkość  zwana  przekrojem  czynny 
czynnym.  Przekrój  czynny  jest  liczbowo  równy  pra- 
wdopodobieństwu zajścia  reakcji  w czasie  jednej  se- 
kundy dla  jednostkowego  strumienia  cząstek  wywo- 
łujących reakcję  (1  cząstka/cm2  s)  podzielonemu 
przez  liczbę  jąder  w bombardowanej  próbce  (rys.  2). 

Przekrój  czynny  przedstawia  jakby  efektywną  po- 
wierzchnię przekroju  jądra  atomowego  w badanym 
procesie.  Przemnożony  przez  liczbę  jąder  w próbce 
daje  powierzchnię  stanowiącą  efektywną  przegrodę 
dla  wiązki  cząstek  bombardujących  (przy  założeniu, 
że  próbka  jest  na  tyle  cienka,  że  wzajemne  „przesła- 
nianie” jąder  można  pominąć). 

Przekroje  czynne  na  oddziaływanie  cząstek  bom- 
bardujących z jądrami  są  na  ogół  rzędu  rozmiarów 
jąder:  10“24  cm2  (choć  np.  dla  powolnych  neutronów 

próbka  o powierzchni  S 

przekroju  prostopadłego 
do  kierunku  wiązki 


Rys.  2.  Przekrój  czynny  w reakcji  jądrowej.  Przez  próbkę  prze- 
nika <PS  cząstek  na  sekundę.  W próbce  znajduje  się  N jąder, 
z których  każde  reprezentuje  przekrój  <r.  Łączna  powierzchnia 
czynna  zajmowana  przez  jądra  wynosi  No  i stanowi  No/S  cał- 
kowitej powierzchni  próbki.  Liczba  cząstek  zderzających  się 
w ciągu  sekundy  z jądrami  wynosi: 

(NoJS)0S  = No<P 
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rozkład 
kątowy 
i energe- 
tyczny 


widmo 

energetyczne 


mogą  osiągać  wartości  nawet  kilkadziesiąt  tysięcy 
razy  większe).  Ze  względu  na  małe  wartości  wprowa- 
dzono dla  nich  miary  specjalne,  jednostki  zwane  bar- 
nami (1  b = 10~24  cm2). 

Prawdopodobieństwo  procesu,  w którym  cząstki  są 
wysyłane  w określonym  kierunku,  wyraża  się  przez 
kątowy  różniczkowy  przekrój  czynny:  dajdQ.  Jest  on 


Rys.  3.  Przekrój  czynny  Aa  dla  procesu  emisji  cząstki  w wąskim 
stożku  obejmującym  kąt  bryłowy  AQ  o osi  skierowanej  w kie- 
runku wyznaczonym  przez  kąty  & i <p  jest  określany  przez  ką- 
towy różniczkowy  przekrój  czynny  da/dQ: 

Aa  - {da\dO)AQ 

graniczną  wartością  stosunku  przekroju  czynnego 
Aa  procesu  emisji  cząstki  w stożku  o osi  skierowanej 
w zadanym  kierunku  do  dążącej  do  zera  wartości 
obejmowanego  przez  stożek  kąta  bryłowego  A& 
(rys.  3).  Zależność  przekroju  dojd&  od  kątów  wyzna- 
czających kierunek  emisji  nosi  nazwę  rozkładu  kąto- 
wego reakcji.  Podobnie  tzw.  energetyczny  różniczko- 
wy przekrój  czynny  dajdE  mówi  o prawdopodobień- 
stwie emisji  cząstek  o określonej  energii.  Wyznacza 
on  przekrój  czynny  Aa  na  emisję  cząstek  o energiach 
mieszczących  się  w wąskim  przedziale  (E,  E+AE) : 
: Aa  = (dajdE)  AE.  Zależność  energetycznego  różnicz- 
kowego przekroju  czynnego  od  energii  emitowanej 
cząstki  przy  ustalonej  energii  cząstki  padającej,  na- 
zywa się  rozkładem  energetycznym  lub  widmem  emi- 
towanych cząstek. 

Jądro  powstające  w wyniku  reakcji  jądrowej  może 
być  utworzone  w różnych,  ale  na  ogół  ściśle  określo- 
nych stanach  energetycznych  (jest  to  konsekwencją 


praw  kwantowych  rządzących  mikroświatem,  w myśl 
których  dopuszczalne  są  tylko  pewne  wartości  energii 
stanów  układu).  W związku  z tym  w widmie  energe- 
tycznym cząstek  towarzyszących  tworzeniu  jąder  wy- 
stępują oddzielne  linie  odpowiadające  poziomom 
energetycznym  „jądra  końcowego'’.  Intensywność 
tych  linii  wyznacza  prawdopodobieństwo  wzbudzania 
różnych  poziomów  energetycznych  (rys.  4). 


Badanie  reakcji  jądrowych 

Badanie  reakcji  jądrowych  zmierza  do  dwóch  celów: 
poznania  mechanizmu  reakcji  oraz  poznania  budowy 
jądra  atomowego  i struktury  jego  stanów  wzbudzo- 
nych przez  wpływ  tych  czynników  na  przebieg  reak- 
cji. Z reguły  cząstki  oddziałujące  z jądrem  siłami  ją- 
drowymi i wywołujące  reakcje  są,  poza  jednym  wy- 
jątkiem — neutronem,  naładowane  dodatnio  (pomi- 
jamy tu  mezony  i hiperony,  cząstki  tworzone  w od- 
działywaniach o znacznej  energii,  ulegające  bardzo 
szybko  rozpadowi).  Aby  cząstka  taka  mogła  znaleźć 
się  w bezpośrednim  sąsiedztwie  jądra  atomowego  na 
tyle  blisko,  by  krótkozasięgowe  siły  jądrowe  mogły 
doprowadzić  do  oddziaływania,  trzeba  jej  nadać  od- 
powiednio dużą  energię.  Energia  musi  być  wystar- 
czająca do  pokonania  elektrostatycznego  odpychania 
pochodzącego  od  dodatnio  naładowanego  jądra. 
Energia  odpychania,  zw.  barierą  kulombowską  (rys. 
5),  wynosi  np.  dla  protonów  bombardujących  od  2 
MeV  dla  jąder  najlżejszych  do  kilkunastu  MeV  dla 
jąder  ciężkich  (1  MeV  = 1,6  10-13  J jest  energią,  jaką 
nabywa  ładunek  elementarny  po  przebyciu  różnicy 
potencjałów  1 miliona  woltów). 


Rys.  5.  Energia  potrzebna  na  pokonanie  przez  protony  i czystki 
a odpychania  elektrostatycznego  różnych  jąder  o liczbie  ato- 
mowej Z.  Cząstki  a — mające  dwa  razy  większy  ładunek  niż 
proton  — mają  barierę  w przybliżeniu  dwa  razy  większą 


energia  protonów  Ep 

Rys.  4.  Widmo  energetyczne  protonów  emitowanych  pod  kątem  30°  podczas  bombardowania  tarczy  aluminiowej  deuteronami  o energii 
7 MeV.  Część  deuteronów  ulega  reakcji  zdarcia  — neutron  zostaje  włączony  do  jądra  ”A1  tworząc  jądro  28 AJ,  a proton  wylatuje  z próbki 
unosząc  energię  zwiększoną  o energię  wyzwoloną  w reakcji  (jest  to  reakcja  egzotermiczna,  ciepło  reakcji  wynosi  w tym  przypadku  5,5 
Me V)-  Największa  energia  protonu  — trnia  1 — odpowiada  powstaniu  jądra  MA1  w stanie  podstawowym  dalsze  bn»e  odpowiadają 
kolejnym  stanom  wzbudzonym  (wg  J.  B.  A.  England  Metody  doświadczalne  fizyki  jądrowej , Warszawa  1981; 


bariera 

kulombo- 

wska 


189 


190 


Formalny  opis  reakcji  jądrowych 

paczka  Do  procesów  jądrowych  stosuje  się  opis  kwantowy, 
falowa  Poruszająca  się  cząstka  jest  reprezentowana  przez 
tzw.  paczkę  falową  (rys.  9).  Kwadrat  amplitudy  takiej 


Rys.  9.  Paczka  falowa  poruszająca  się  z prędkością  » 


fali  określa  prawdopodobieństwo  znalezienia  się 
cząstki  w danym  punkcie  przestrzeni.  Przykładem 
paczki  falowej  w skali  makroskopowej  jest  kulista 
fala  rozchodząca  się  po  powierzchni  wody  po  wrzu- 
ceniu do  niej  kamienia. 

Paczka  falowa  powstaje  przez  dodanie  się  do  siebie 
wielu  fal  o nieco  różnych  długościach.  Jej  rozmiary 
przestrzenne  (Ax  na  rys.  9)  zależą  od  przedziału  dłu- 
gości fal  tworzących  ją  — im  przedział  Ja  jest  większy, 
tym  mniejsze  jest  rozmycie  paczki  Ax.  Fala  o długości 
JL  przedstawia  cząstkę  o pędzie  p — h/k  ( h — stała 
Plancka).  Jeżeli  długość  fali  X nie  jest  ściśle  określona 
(rozmyta),  to  to  samo  dotyczy  pędu.  Ogólnie,  ilościo- 
wo ujmuje  tę  zależność  zasada  nieokreśloności  Hei- 
senberga 

AxAp  'Z*  h. 

Paczka  falowa  przesuwająca  się  z prędkością  o równą 
prędkości  poruszania  się  cząstki  mija  jakiś  punkt 
w przestrzeni  w czasie 

At  = Ax/v  ^ fij(v  Ap), 

przy  tym 

vAp  — AE 

(£  = p2l2m,  gdyż  zakładamy,  że  cząstka  porusza  się 
tak  wolno,  że  można  pominąć  efekty  relatywistyczne; 
stąd  — różniczkując  — AE  = pApjm  = v Ap). 

Zatem  z pędowo-położeniową  relacją  nieokreślo- 
ności wiąże  się  ściśle  relacja  czasowo-energetyczna: 

AEAt  h. 

cząstka  W opisie  teoretycznym  reakcji  jądrowych  wygodnie 
o określonym  jest  rozpatrywać  cząstkę  o dokładnie  określonym 
pędzie  wektorze  pędu  {Ap  = 0),  a tym  samym  — o ściśle 
określonej  energii  (AE  = 0).  Jak  wynika  z zasady 
Heisenberga  cząstka  taka  jest  reprezentowana  przez 
paczkę  rozmytą  na  nieskończenie  duży  obszar  — jest 
to  po  prostu  fala  płaska,  biegnąca  w kierunku  wektora 
pędu  cząstki.  Innymi  słowy,  ponieważ  wartość  pędu 
cząstki  jest  dobrze  określona,  jej  położenie  jest  zu- 
pełnie nieokreślone.  Gęstość  prawdopodobieństwa 
znalezienia  cząstki  w dowolnym  punkcie  jest  stała 
i nie  zależy  od  współrzędnych  punktu.  Umownie 
przyjmuje  się,  że  odpowiada  ona  jednej  cząstce 
w 1 cm3.  Cząstki  poruszają  się  z prędkością  v,  więc 
taka  fala  płaska  reprezentuje  strumień  v cząstek/ 
/cm2-s.  Ze  względu  na  dobrze  określoną  energię  czą- 
stki również  czas  zajścia  reakcji  jest  zupełnie  nie- 
określony. Nie  ma  sensu  mówić  o sytuacji  przed  zde- 
rzeniem lub  po  zderzeniu  — opis  powinien  zawierać 
wszystkie  sytuacje  naraz.  Strumieniowi  cząstek  pada- 
jących na  centrum  rozpraszające  stale  towarzyszy 
strumień  cząstek  rozproszonych.  Naturalnie,  można 


wprowadzić  rozmycie  pędu  cząstki  i przez  to  zlokali- 
zować ją  w przestrzeni.  Wówczas  jest  możliwe  opi- 
sanie ewolucji  procesu  w czasie  — zbliżanie  się  czą- 
stek do  jądra,  a po  oddziaływaniu  — oddalanie  się 
cząstki  rozproszonej.  Opis  taki  jest  jednak  bardziej 
skomplikowany  matematycznie  i przez  to  mniej 
wygodny. 

Można  wykazać,  że  każdą  falę  płaską  da  się  przed- 
stawić w postaci  superpozycji  nieskończonego  szeregu 
fal  kulistych  o odpowiednio  zmodulowanych  ampli- 
tudach zbiegających  się  do  pewnego  punktu  w przes- 
trzeni (np.  może  nim  być  centrum  rozpraszające)  oraz 
fal  rozchodzących  się  z tego  punktu.  Łatwo  to  wyjaś- 
nić stosując  zasadę  Huygensa,  która  mówi,  że  każdy 
punkt  powierzchni  falowej  jest  źródłem  fali  kulistej 


fala  płaska 
jako  super- 
pozycja fal 
kulistych 


Rys.  tO.  Falę  płaską  można  rozłożyć  na  szereg  fal  zbiegających 
się  do  pewnego  punktu  i rozbiegających  się  z lego  punktu.  Wy- 
nika to  z zasady  Huyghensa 


fala  rozchodząca  się 


obszar  oddziaływania 
I i I 


fala  zbiegająca  się 


obszar  oddziaływania 


fala  rozchodząca  się 


I I I 
I i 


fala  zbiegająca  się 


Rys.  H.  Superpozycja  fal:  a)  Nie  ma  przesunięcia  w fazie  między 
falą  zbiegającą  się  i falą  rozchodzącą  się.  Powstała  w wyniku 
interferencji  między  nimi  fala  stojąca  ma  węzeł  w centrum  roz- 
praszania. b)  Fala  rozchodząca  się  jest  przesunięta  w fazie  o 
& = ±7t  względem  fali  zbiegającej  się.  Powstała  fala  stojąca 
przesunięta  w fazie  o S = ±*/2  posiada  strzałkę  w centrum  roz- 
praszania. Duże  jest  prawdopodobieństwo  przebywania  cząstki 
w obszarze  oddziaływania 
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(rys.  10).  Rozkład  na  fale  kuliste  jest  o tyle  pomocny, 
że,  zgodnie  z tym  co  podpowiada  intuicja,  pojawienie 
się  w wyniku  oddziaływania  strumienia  cząstek  roz- 
proszonych prowadzi  do  modyfikacji  wyłącznie  fal 
rozchodzących  się  z centrum  rozpraszającego,  a nie 
ma  wpływu  na  fale  zbiegające  się. 
opis  Przyjmijmy,  że  obszar  działania  sił  rozpraszających 
za  pomocą  ma  kształt  kuli  o promieniu  R,  której  środek  znajduje 
fal  kulistych  się  w początku  układu  współrzędnych.  Fala  kulista 
wchodząca  do  tego  obszaru  ulega  oddziaływaniu, 
w wyniku  czego  opóźnia  się  i rozchodzi  się  dalej 
z pewnym  przesunięciem  w fazie  &.  Interferując 
z napotkaną  falą  zbiegającą  się,  tworzy  falę  stojącą, 
przesłoniętą  w fazie  o b = S/2  w porównaniu  z sy- 
tuacją bez  oddziaływania  (rys.  11). 

Gdy  nie  ma  rozpraszania  ( S = 0),  w punkcie 
r = 0 znajduje  się  węzeł  funkcji  falowej.  Dla  oddzia- 
ływania, któremu  odpowiada  strzałka  drgań  w punk- 
cie r = 0 (czyli  dla  którego  <5  = ±Jt/2),  funkcja  fa- 
łowa ma  dużą  amplitudę  w obszarze  oddziaływania  — 
duże  jest  prawdopodobieństwo  przebywania  bom- 
bardującej cząstki  w obszarze  działania  sił  rozprasza- 
jących, a więc  wniknięcia  jej  do  jądra.  Mówimy,  że 
mamy  wówczas  do  czynienia  z rezonansem  jądro- 
rezonans  wym.  Przesunięcie  fazowe  <5  zależy  od  energii  padają- 
jądrowy  cych  cząstek  (a  więc  od  długości  odpowiadających 
im  fal).  Okazuje  się,  że  zależność  ta  jest  szczególnie 
silna  w obszarze  rezonansu  (rys.  12). 


Rys.  12.  Zależność  od  energii  przesunięcia  fazowego  fal  odpo- 
wiadających rozpraszanym  cząstkom  o orbitalnym  momencie 
pędu  / = 2 i całkowitym  spinie  / = */a  w reakcji  łeO  (n,  n ) ,łO. 
Przy  energiach  ok.  1 MeV  i ok.  3,3  MeV  występują  rezonanse 
w rozpraszaniu  neutronów 


Weźmy  pod  uwagę  falę  rozchodzącą  się  od  punktu 
r — 0,  której  faza  w wyniku  istnienia  oddziaływania 
w obszarze  r < R ulega  przesunięciu  o $ = 2<5.  Tę 
falę  kulistą  można  zapisać  w postaci: 

~exp[i(kr+2ó(E)—Et/h)]  przy  r ^ R, 

gdzie  E — hzk2/2m  i k = p/h  — energia  i liczba  falo- 
wa cząstki  o masie  m i pędzie  p.  Z takich  fal,  o nieco 
różnych  energiach,  tworzy  się  paczka  falowa,  której 
maksimum  jest  w chwili  t = 0 umiejscowione  w punk- 
cie r — 0.  Maksimum  paczki  falowej  znajdzie  się 
w odległości  r — R wtedy,  gdy  w miejscu  tym  nastąpi 


konstruktywna  interferencja  fal  tworzących  paczkę. 

Odpowiada  to  warunkowi,  że  różnica  faz  fal  o nieco 
różnych  wektorach  falowych  k i k'  jest  w tym  miejscu 
minimalna: 

(k-k')R+2d(E)-2d(E')-(i/fi)(E-E')t  = 0, 
stąd  dla  E'  -►  E 

t = fiRdk/dE+2fi  db/dE , 

czyli 

/ = Rfr+Ui  db/dE , 

gdyż 

dk/dE  = m/ffik  = mjhp  = \jhv 
(v  — prędkość  cząstki). 

Podobnie  paczka  falowa  utworzona  z fal  zbiegają- 
cych się  do  punktu  r — 0 o postaci 

■i-  exp[/(— kr— Et/ft)]  przy  r ^ Rt 

reprezentująca  cząstki  padające,  przebiega  odcinek 
odr  = Rdor  = 0w  czasie  / = R/v.  Tak  więc  czas  t 
potrzebny  na  przejście  cząstki  przez  całą  sferę  oddzia- 
ływania o średnicy  2 R wynosi : 

T = t0+2j*  db/dE, 

gdzie  r0  = 2 R/v  jest  czasem  przejścia  w nieobecności  opóźnienie 
oddziaływania.  Oddziaływanie  wprowadza  opóźnię-  cząstki 
nie  w ruchu  cząstki.  Jest  ono  największe  wtedy,  gdy 
pochodna  db/dE  ma  największą  wartość,  a więc  np. 
w maksimum  rezonansu  (por.  rys.  12).  Zatem  przy 
energiach  cząstki  odpowiadających  rezonansowi 
w oddziaływaniu  z potencjałem  rozpraszającym,  jej 
wyjście  z obszaru  oddziaływania  (emisja)  następuje 
z pewnym  opóźnieniem  i to  tym  większym,  im  wartość 
jej  energii  jest  bliższa  maksimum  rezonansu.  Im  rap- 
towniejsze  są  zmiany  przesunięć  fazowych  przy  zmia- 
nie energii  (rezonans  ma  mniejszą  szerokość  energe- 
tyczną r — jest  węższy  w skali  energii),  tym  większe 
jest  opóźnienie. 

Wartości  przesunięcia  fazowego  wiążą  się  ściśle 
z przekrojem  czynnym  na  rozpraszanie  elastyczne. 

Znając  je  znamy  również  postać  funkcji  falowej  poza 
obszarem  oddziaływania:  v(<5).  Przez  odjęcie  fali 
płaskiej  y©,  opisującej  strumień  cząstek  padających, 
można  z niej  wyodrębnić  falę  rozchodzącą  się,  odpo- 
wiadającą cząstkom  rozproszonym : 

W = V>(b)  — V©- 


500  600  700  800  900  1 000  1100  1 200  keV  1 300 

energia  protonów  Ep 

Rys.  13.  Krzywa  wzbudzenia  reakcji  wychwytu  protonów  przez 
jądra  *’A1  w wyniku  czego  zostaje  wysłane  promieniowanie 
elektromagnetyczne.  Występowanie  wąskich  rezonansów  ozna- 
cza, że  przy  pewnych  energiach  emisja  promieniowania  jest 
znacznie  opóźniona  (tworzą  się  dhigożyjące  stany  wzbudzone 
jądra) 
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Znajomość  w -Ikości  amplitudy  fali  rozproszonej 
pozwala  ooliczyć  strumień  cząstek  rozproszonych, 
a więc  i przekrój  czynny  dla  elastycznego  rozprasza- 
nia. Tak  więc  przesunięcia  fazowe,  które  możemy 
określić  zakładając  postać  potencjału  oddziaływania 
i rozwiązując  odpowiednie  równanie  falowe  (równa- 
nie Schródingera),  zdają  sprawę  z prawdopodobień- 
stwa rozpraszania  cząstki. 

Reakcje  jądrowe  mogą  przebiegać  w bardzo  różny 
sposób.  Są  reakcje  szybkie  — zachodzące  w czasie 
bliskim  czasowi  przejścia  cząstki  przez  jądro  (10~22- 
10-21  s),  w innych  reakcjach  może  się  tworzyć  stan 
pośredni,  trwający  stosunkowo  długo  (10^17- 
10-,fl  s),  i dopiero  w trakcie  jego  rozpadu  emitowana 
jest  cząstka  — produkt  reakcji. 

W świetle  tego,  co  powiedziano  poprzednio,  cechą 
charakterystyczną  reakcji  szybkich,  o małych  opóź- 
nieniach emisji,  jest  gładka  zależność  przekroju  czyn- 
nego od  energii  wynikająca  ze  słabej  zależności  ener- 
getycznej przesunięć  fazowych.  W przypadku  two- 
rzenia się  długożyjących  stanów  pośrednich  sytu- 
acja jest  odwrotna  — w krzywej  wzbudzenia  muszą 
występować  silne  zmiany,  wąskie  rezonanse,  zdające 
sprawę  z dużych  opóźnień  (rys.  13). 


Mechanizmy  reakcji  jądrowych 

Przykładem  reakcji  zachodzącej  w krótkim  czasie 
może  być  rozpraszanie  elastyczne.  Ruch  cząstki  pa- 
dającej zostaje  zakłócony  przez  pole  sił  działających 
wokół  i wewnątrz  jądra,  jednakże  nie  wpływa  na  stan 
wewnętrzny  jądra.  Jądro  można  zastąpić  po  prostu 
pewnym  obszarem  działania  sił.  Pole  sił  opisuje  się 
potencjałem  jądrowym  oraz,  gdy  cząstka  ma  ładunek 
dodatni,  potencjałem  odpychania  elektrostatycznego. 
Wystarcza  znajomość  potencjału,  aby  w pełni  opisać 
zjawisko  przez  rozwiązanie  równania  Schródingera  — 
różniczkowego  równania  na  funkcję  falową  układu. 
Opisane  zjawisko  nie  jest  jednak  jedynym  możliwym 
sposobem  przebiegu  rozpraszania  elastycznego.  Czą- 
stka, po  wniknięciu  do  jądra,  może  oddziaływać 
z nukleonami  powodując  ich  przegrupowanie.  Jej 
energia  rozdziela  się  między  wiele  nukleonów.  Taki 
stan  wzbudzenia  trwa  stosunkowo  długo,  aż  przypad- 
kowo energia  skupi  się  ponownie  na  nukleonie  lub 
grupie  nukleonów  tworzących  cząstkę  umożliwiając 
jej  emisję.  Jeśli  energia  emitowanej  cząstki  będzie  taka 
sama  (w  układzie  środka  masy),  jak  energia  cząstki 
padającej,  będziemy  znowu  mieć  do  czynienia  z roz- 
praszaniem elastycznym,  z tym  że  teraz  emisja  nastąpi 
ze  znacznym  opóźnieniem. 

Aby  wyodrębnić  procesy  szybkie,  związane  z ma- 
łymi przedziałami  czasowymi,  należy  je  dobrze  zlo- 
kalizować w czasie.  Zlokalizowana  w czasie  paczka 
falowa  odznacza  się  dużym  rozmyciem  wektorów  fa- 
lowych, czyli  dużym  rozmyciem  energii.  Innymi  sło- 
wy, aby  śledzić  zachowanie  się  wielkości  związanych 
z procesami  szybkimi  (np.  przekrojów  czynnych  na 
te  procesy),  należy  dokonać  ich  uśrednienia'1  po 
dość  znacznym  przedziale  energii  (^|1  MeV).  Fale, 
odpowiadające  emisji  z jądra  wzbudzonego,  są  tak 
bardzo  opóźnione,  że  nie  dają  już  wkładu  do  paczki 
falowej  odpowiadającej  szybko  zachodzącemu  roz- 
praszaniu bezpośrednio  przez  potencjał  jądrowy.  Tak 
więc  opóźnione  cząstki,  tracone  z punktu  widzenia 
rozpraszania  potencjałowego,  są  pochłaniane  przez 
jądro.  Pochłanianie  padających  cząstek  można 
uwzględnić  dołączając  do  potencjału  reprezentującego 
jądro  człon  urojony.  Rozwiązanie  równania  Schró- 
dingera z takim  potencjałem  prowadzi  do  odpowied- 
niego zmniejszenia  amplitudy  funkcji  falowych  cząstek 
rozpraszanych,  a więc  też  ich  strumienia.  Jest  to  pełna 
analogia  do  opisu  za  pomocą  zespolonego  współ- 
czynnika załamania  przechodzenia  światła  przez 
mętną,  absorbującą  i rozpraszającą  kulę.  Ze  względu 
na  tę  analogię  modelowi  rozpraszania  elastycznego 
pod  działaniem  zespolonego  potencjału  nadano  na- 

13  - Encyklopedia  fizyki  współczesnej 


zwę  modelu  optycznego.  Wprowadzenie  części  uro-  model 
jonej  potencjału  odpowiedzialnej  za  pochłanianie  jest  optyczny 
konieczne  tym  bardziej,  że  w trakcie  bombardowania 
jądra  może  zachodzić  wiele  innych  procesów,  różnych 
od  rozpraszania  elastycznego.  W tych  procesach 
cząstki  mogą  być  zarówno  wysyłane  z jądra  wzbu- 
dzonego, jak  też  mogą  być  wybijane  bezpośrednio 
z jądra  przez  padającą  cząstkę.  Prowadzi  to  do  usu- 
wania cząstek  z wiązki  rozpraszanej  elastycznie. 

Stosując  model  optyczny  można  przewidywać 
przekroje  czynne  na  rozpraszanie  elastyczne  oraz  na 
absorpcję  cząstek.  Model  ten  jest  również  przydatny 
przy  obliczaniu  wielu  innych  wielkości  stosowanych 
do  opisu  rozpraszania  i pochłaniania,  jak  np.  współ- 
czynników transmisji  określających  prawdopodo- 
bieństwo wniknięcia  do  wnętrza  jądra  cząstki  o ok- 
reślonej wartości  momentu  pędu  czy  też  przesunięć 
fazowych.  Warunkiem  uzyskania  właściwych  rezul- 
tatów jest  zastosowanie  w obliczeniach  odpowiednio 


Rys.  14.  Kształt  części  rzeczywistej  potencjału  jądrowego:  a)  dla 
neutronów,  b)  dla  protonów.  R jest  bliskie  średniej  wartości 
promienia  rozkładu  nukleonów  w jądrze.  Re  jest  promieniem 
kulombowskim  jądra 


180° 


Rys.  1 5.  Porównanie  przewidywań  modelu  optycznego  z odpo- 
wiednio dobranymi  potencjałami  (linie  ciągłe)  ze  zmierzonymi 
rozkładami  kątowymi  neutronów  elastycznie  rozpraszanych  na 
różnych  jądrach  (punkty) 
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dobrze  dobranego  kształtu  potencjału.  Z reguły  przyj- 
muje się  potencjał  jądrowy  w kształcie  prostokątnej 
jamy  z zaokrąglonymi  brzegami  o rozmiarach  odpo- 
wiadających rozmiarom  jądra  (rys.  14).  Parametry 
opisujące  kształt  potencjału  dobiera  się  przez  porów- 
nanie obliczeń  z doświadczalnymi  rozkładami  kąto- 
wymi rozpraszania  elastycznego  zmierzonymi  dla 
wielu  jąder  i energii  padających  cząstek  (rys.  15). 

Spodziewamy  się,  że  każda  reakcja,  w której  bierze 
udział  niewielka  liczba  nukleonów,  a tym  samym  nie- 
wielka liczba  stopni  swobody  (mogą  to  być  również 
kolektywne  stopnie  swobody,  np.  oscylacje  powierzch- 
ni jądrowej  lub  rotacje  całego  jądra),  powinna  być 
procesem  szybkim  (tzn.  niewiele  dłuższym  od  czasu 
przelotu  cząstki  przez  jądro  r0).  Emisja  cząstek  na- 
stępuje bezpośrednio  po  zderzeniu  się  cząstki  bom- 
reakcje  bardującej  z jądrem.  Stąd  też  pochodzi  ogólna  nazwa 
bezpośrednie  nadana  takim  reakcjom  — reakcje  bezpośrednie.  Ce- 
chą charakterystyczną  reakcji  bezpośrednich  jest  to, 
że  ze  względu  na  udział  niewielu  stopni  swobody, 
stan  jądra  utworzonego  w wyniku  reakcji  ma  wiele 
cech  upodabniających  go  do  stanu  jądra  bombardo- 
wanego. Jak  się  przekonamy  później,  fakt  ten  ma 
istotne  znaczenie,  gdy  wykorzystuje  się  reakcje  jądro- 
we do  badania  struktury  jądra.  Cząstki  emitowane 
zachowują  również  w pewnej  mierze  kierunek  pada- 
nia wiązki  — wyróżnione  są  kąty  odpowiadające 
emisji  do  przodu.  Cząstka  padająca,  oddziałując 
z niewidoma  stopniami  swobody  jądra,  traci  na  ogół 
stosunkowo  niewiele  energii.  Stąd  też  wśród  produk- 
tów reakcji  przeważają  cząstki  o energii  zbliżonej  do 
maksymalnej. 

reakcje  Do  najbardziej  typowych  reakcji  bezpośrednich, 
zdarcia  obok  rozpraszania  elastycznego  i nieelastycznego, 
i wychwytu  można  zaliczyć  reakcję  jedno-  i wielonukleonowego 
zdarcia  (reakcja  „strippingu”),  w której  bombardu- 
jąca cząstka  złożona,  oddziałując  z jądrem,  oddaje 
mu  w czasie  ruchu  jeden  lub  kilka  nukleonów,  oraz 
reakcję  jedno-  lub  wielonukleonowego  wychwytu 
(reakcja  „pick-up”)  polegającą  na  przechwyceniu 
przez  cząstkę  nukleonów  z jądra  (rys.  16).  Do  opisu 


Rys.  16.  Przykłady  reakcji  bezpośrednich:  a)  Reakcja  zdarcia: 
deuteron  składający  się  z protonu  i neutronu  oddaje  neutron 
jądru  bombardowanemu.  Proton  kontynuuje  lot.  b)  Reakcja 
wychwytu:  proton  wyrywa  neutron  z jądra  bombardowanego, 
powstały  deuteron  kontynuuje  lot 


tych  procesów  nie  wystarcza  potencjał  optyczny,  bę- 
dący przybliżeniem  pomijającym  istnienie  nukleonów 
w jądrze  czy  też  jakąkolwiek  możliwość  wzbudzenia 
oddziały-  jądra.  Oddziaływanie  trzeba  uściślić  przez  dodanie 
wanio  do  potencjału  dodatkowego  członu,  tzw.  oddziały- 
resztkowe  wania  resztkowego.  W obliczeniach  teoretycznych  za- 
kłada się  na  ogół,  że  potencjał  optyczny  wpływa  tylko 
na  tory  i pochłanianie  cząstek  padających  i emitowa- 
nych, natomiast  za  samo  przechwycenie  nukleonów 
przez  cząstkę  lub  jądro  odpowiedzialne  jest  oddzia- 


ływanie resztkowe.  Najczęściej  przyjmuje  się  je  w bar- 
dzo uproszczonej  postaci  ułatwiającej  obliczenia  (np. 
funkcja  6 Diraca  we  współrzędnych  przestrzennych 
będąca  funkcją  różną  od  zera  tylko  wtedy,  gdy 
współrzędne  cząstki  padającej  i emitowanej  są  iden- 
tyczne). Mimo  przybliżeń  rezultaty  obliczeń  są  w 
większości  wypadków  zgodne  z doświadczeniem. 

Rozpatrzmy  bardziej  szczegółowo  przebieg  reakcji 
jądrowej  (rys.  17).  Cząstka,  np.  nukleon  po  wniknię- 
ciu do  jądra  może  zderzyć  się  z innym  nukleonem 


Rys.  17.  Schematyczny  obraz  przebiegu  oddziaływania  cząstki 
bombardującej  z nukleonami  jądra  bombardowanego.  Cząstka 
zderzając  się  z jednym  z nukleonów  może  przenieść  go  w stan 

0 wyższej  energii  tracąc  swą  energię  kinetyczną  E.  W wyniku 
kolejnych  zderzeń  coraz  więcej  jest  wzbudzonych  nukleonów 

1 coraz  mniejsza  jest  średnia  energia  wzbudzenia  przypadająca 
na  jeden  nukleon.  Emisja  nukleonów  jest  coraz  bardziej  utrud- 
niona 


przekazując  mu  część  swej  energii  i następnie  może 
opuścić  wzbudzone  jądro.  Przekazana  energia  może 
być  na  tyle  duża,  że  cząstka  nie  będzie  mogła  pokonać 
sił  jądrowych  i opuścić  jądra  — zamiast  niej  może  być 
wysłany  uderzony  nukleon,  który  zyskał  sporą  porcję 
energii.  Istnieje  jednak  taka  możliwość,  że  zderzenie 
nastąpi  z jednym  z „głębiej”  położonych,  silniej  zwią- 
zanych nukleonów.  Wówczas  może  się  zdarzyć,  że 
żaden  z obu  nukleonów  nie  będzie  miał  energii  wy- 
starczającej do  opuszczenia  jądra.  Powstaje  jak  gdyby 
„związany”  stan  wzbudzony,  nie  mogący  się  rozpaść 
przez  emisję  cząstki  (choć  całkowita  energia  stanu 
jest  większa  niż  energia  wiązania  przez  jądro  jednego 
nukleonu).  Stan  ten  charakteryzuje  się  istnieniem 
dwóch  wzbudzonych  nukleonów  oraz  luki,  „dziury”,  stadium 
w miejscu  poprzednio  zajmowanym  przez  jeden  „dwie 
z nukleonów.  Dopiero  w wyniku  dalszego  oddziały-  cząstki  - 
wania  między  wzbudzonymi  nukleonami  jeden  z nich  jedna 
może  uzyskać  energię  dostateczną  do  pokonania  dziura" 
przyciągających  sił  jądrowych.  Jednak  znacznie  bar- 
dziej prawdopodobne  będzie  zderzenie  wzbudzonego 
nukleonu  z jednym  z wielu  pozostałych  nukleonów 
jądra.  W ten  sposób  powstanie  stan,  w którym  ist- 
nieją trzy  wzbudzone  nukleony  i dwie  dziury.  Pra- 
wdopodobieństwo emisji  nukleonu  jest  teraz  mniej- 
sze, gdyż  energia  jest  rozłożona  na  większą  liczbę 
cząstek.  W wyniku  dalszych  oddziaływań  coraz  więcej 
nukleonów  zostaje  wzbudzonych  i w końcu  ustala  się 
pewna  równowaga,  podobna  do  równowagi  termo- 
dynamicznej. Jest  to  stan  jądra  złożonego,  który  może  jądro 
trwać  bardzo  długo  w skali  oddziaływań  jądrowych,  złożone 
Najbardziej  dogodne  rozłożenie  energii  między  wzbu- 
dzone nukleony  zachodzi  przy  pewnych  określonych 
jej  wartościach.  Na  krzywej  wzbudzenia  reakcji, 
w której  tworzone  jest  jądro  złożone,  występuje  szereg 
wąskich  rezonansów  odpowiadających  długożycio- 
wym  stanom  jądra  złożonego. 

Z przytoczonego  opisu  wynika,  że  z powodu  dwu- 
ciałowego  charakteru  oddziaływania  jądrowego  (jest 
to  ogólnie  przyjęte  założenie)  tworzenie  jądra  złożo- 
nego musi  zawsze  przejść  przez  stadium  „dwie 
cząstki — jedna  dziura”.  Stany  takie  są  jakby  po- 
czątkiem bardziej  skomplikowanych  konfiguracj  i, 
dlatego  też  noszą  nazwę  „stanów  wejściowych”. 

W niektórych  przedziałach  energii  cząstki  wywołującej 
reakcję  tworzenie  pewnych  stanów  wejściowych  mo- 
że być  szczególnie  prawdopodobne.  Spodziew-amy  się 
wówczas,  że  również  prawdopodobieństwo  tworzenia 
jądra  złożonego  będzie  odpowiednio  większe. 

Zasadniczo  emisja  cząstki  może  nastąpić  w każdym 
stadium  rozwoju  kaskady  jądrowej  prowadzącej  do 
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powstania  jądra  złożonego.  Najbardziej  jest  prawdo- 
podobna w początkowej  fazie  rozwoju  kaskady,  gdy 
energia  rozkłada  się  jeszcze  na  niewiele  nukleonów. 

Z tego  też  powodu  widmo  cząstek  emitowanych 
przed  osiągnięciem  przez  jądro  równowagi  termody- 
namicznej jest  widmem  stosunkowo  „twardym”, 
rozpad  jądra  o dużym  udziale  cząstek  o większej  energii.  Wkład 
złożonego  tego  procesu  do  reakcji  może  być  znaczny,  szczególnie 
w przypadku  cząstek  naładowanych,  gdy  ich  emisję 
z jądra  złożonego  dodatkowo  utrudnia  bariera  ku- 
lombowska. 

Prawdopodobieństwo  emisji  z jądra  złożonego 
cząstki  o określonej  energii  zależy  praktycznie  tylko 
od  łatwości  przechodzenia  jej  przez  barierę  potencjału 
w pobliżu  powierzchni  jądra.  Jądro  złożone  żyje  bo- 
wiem na  tyle  długo,  że  każda  możliwa  ze  względów 
energetycznych  konfiguracja  wzbudzonych  nukleo- 
nów' pojawia  się  wielokrotnie.  Informację  o prawdo- 
podobieństwie przejścia  cząstki  przez  barierę  daje 
model  optyczny.  Kierunek  emisji  cząstki  jest  w zasa- 
dzie dowolny,  z tym  że  musi  być  zachowany  całko- 
wity moment  pędu  układu.  Dlatego  rozkład  kątowy 
produktów  reakcji  niekoniecznie  musi  być  izotropo- 
wy, ale  zawsze  musi  być  symetryczny  względem  kąta 
emisji  90°. 

W miarę  wzrostu  energii  wzbudzenia  jądra  złożo- 
nego rośnie  liczba  możliwych  sposobów  jego  rozpa- 
du. Zwiększa  się  prawdopodobieństwo  rozpadu,  ma- 
leje czas  życia,  a zatem  zwiększa  się  energetyczna  sze- 
rokość stanu  jądra  złożonego.  Z drugiej  strony  szybko 
wzrasta  liczba  sposobów  rozdzielenia  energii  wzbu- 
dzenia między  nukleony  — gwałtownie  rośnie  liczba 
poziomów  jądra  złożonego  przypadająca  na  jednost- 
kowy przedział  energii  wzbudzenia.  W rezultacie  po- 
ziomy jądra  złożonego  zaczynają  się  pokrywać.  Po- 
jawia się  możliwość  trudnej  do  przewidzenia  i opisu 
interferencji  między  nimi,  istotnie  modyfikującej 
prawdopodobieństwo  emisji.  Przy  dalszym  wzroście 
energii  wzbudzenia  liczba  pokrywających  się  pozio- 
mów staje  się  na  tyle  duża,  że  obserwowane  efekty 
interferencyjne  łatwo  się  uśredniają.  Emisję  cząstek 
model  można  teraz  opisać  w sposób  statystyczny  (stąd  na- 
statv  styczny  zwa  — model  statystyczny)  zakładając,  że  jej  prawdo- 
podobieństwo zależy  tylko  od  przemkalnosci  przez 
barierę  potencjału  oraz  gęstości  osiąganych  po  emisji 
stanów  jądra  końcowego.  Im  większa  jest  gęstość 
stanów,  czyli  im  większa  jest  energia  wzbudzenia  jądra 
końcowego,  tym  większe  powinno  być  prawdopodo- 
bieństwo emisji.  Z drugiej  strony  mniejsza  jest  wów- 
czas energia  emitowanej  cząstki,  co  utrudnia  przejście 
tej  cząstki  przez  skok  potencjału  na  powierzchni  jądra. 
W rezultacie  w widmie  emitowanych  cząstek,  które 
w obszarze  dużej  gęstości  stanów  jądra  końcowego 
jest  widmem  ciągłym,  pojawia  się  dla  niezbyt  dużych 


Powodzenie  obliczeń  prowadzonych  na  podstawie 
modelu  statystycznego  jest  w dużej  mierze  uwarun- 
kowane dobrą  znajomością  gęstości  stanów,  funkcji 
bardzo  szybko  rosnącej  wraz  ze  wzrostem  energii 
wzbudzenia.  Do  wyznaczenia  tej  funkcji  stosuje  się 
również  metody  statystyczne,  traktując  nukleony 
jako  cząstki  poruszające  się  niezależnie  w polu  sił 
jądrowych  (model  gazu  Fermiego)  lub  też  włączając 
do  rozważań  pewne  możliwości  oddziaływania  mię- 
dzy nukleonami  (np.  tendencję  do  łączenia  się  w pa- 
ry tych  nukleonów,  których  rozkłady  przestrzenne 
w polu  sił  jądrowych  w dużym  stopniu  się  pokry- 

W Jeśli  w obszarze  pokrywających  się  poziomów  jądra 
złożonego  dokładnie  prześledzić  zależność  przekroju 
czynnego  od  energii  dla  ściśle  określonego  kanału 
wyjściowego  reakcji,  to  można  zauważyć  fluktuacje 
będące  wynikiem  interferencji  emisji  z różnych  pozio- 
mów. Fluktuacje  te,  zw.  fluktuacjami  eriksonowskimi 
(od  nazwiska  T.  Ericsona,  fizyka,  który  je  zinterpre- 
tował), są  przypadkowe  i szybko  nikną  przy  uśred- 
nieniu po  pewnym  niewielkim  przedziale  energii. 
Jednakże  w przedziałach  energii  rzędu  szerokości 
poziomu  fluktuacje  nie  są  zupełnie  niezależne,  gdyż 
w proces  emisji  są  zaangażowane  w przybliżeniu  te 
same  poziomy  jądra  złożonego  interferujące  w okre- 
ślony sposób.  Można  zbudować  „funkcję  autokore- 
lacji” przekrojów  czynnych  w postaci: 

F(e)  ~ <*(£)*(£+ e)>  - <*(£)>  <<xCE4-£)>. 

Nawiasy  < > oznaczają  uśrednienie  w odpowiednio 
dużym  przedziale  energetycznym  AEy  a s — pewne 
małe  przesunięcie  energii.  Zbudowanie  tej  funkcji  na 
podstawie  danych  doświadczalnych  pozwała  osza- 
cować średnią  w przedziale  AE  szerokość  poziomu  T, 
gdyż  F(e)  # 0 tylko  przy  s </\  Jest  to  możliwość 
atrakcyjna,  gdyż  inne  metody  zawodzą  z powodu 
wzajemnego  pokrywania  się  wielu  poziomów. 

Statystyczne  metody  opisu  reakcji  jądrowych  pró- 
buje się  również  zastosować  do  emisji  cząstek  w trak- 
cie tworzenia  jądra  złożonego,  przed  osiągnięciem 
przez  nie  pełnej  równowagi  termodynamicznej.  Pod- 
stawą stosowanych  modeli  jest  założenie,  że  jest  moż- 
liwych tak  wiele  konfiguracji  utworzonych  z dwóch 
nukleonów  i jednej  dziury,  trzech  nukleonów  i dwóch 
dziur  itd.,  że  można  w każdym  stadium  rozwoju  kaska- 
dy jądrowej  traktować  sytuację  w sposób  uśredniony, 
statystyczny.  Prawdopodobieństwo  emisji  cząstki  jest 
uwarunkowane  przenikalnością  przez  barierę  poten- 
cjału na  powierzchni  jądra  oraz  stosunkiem  liczby 
możliwych  konfiguracji  wzbudzonych  nukleonów 
i dziur  (nadaje  im  się  wspólną  nazwę  — ekscy tony) 
pozostałych  po  emisji  cząstki  do  liczby  możliwych 
konfiguracji  ekscytonów  przed  emisją. 
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Rys.  18.  Widmo  parowania  cząstek  z jądra  złożonego;  JE1  energia 
wyparowanych  cząstek,  N ich  liczba 

energii  maksimum  odpowiadające  optymalnej  energii 
emisji  (rys.  18).  Można  się  tu  doszukać  daleko  idą- 
cej analogii  z parowaniem  cząsteczek  z powierzchni 
nagrzanej  kropli  cieczy.  Dlatego  też  widmo  energe- 
widmo  tyczne  emitowanych  cząstek  często  nazywa  się  wid- 
parowania  mem  parowania. 


Informacje  o budowie  jądra  uzyskiwane 
z badania  reakcji  jądrowych 

Strukturę  jądra  w wielu  sytuacjach  dobrze  oddaje 
model  powłokowy,  wg  którego  średni  efekt  wzajem- 
nych oddziaływań  nukleonów  w jądrze  jest  taki,  że 
ich  ruch  odbywa  się  wzdłuż  pewnych  orbit  scharakte-  orbity  w 
ryzowanych  zorientowaniem  w przestrzeni,  kierun-  modelu  po- 
kiem  ruchu  nukleonu,  jego  energią,  momentem  pędu  włokowym 
oraz  wzajemnym  położeniem  spinu  i momentu  pędu. 

Wzdłuż  takiej  orbity  może  się  poruszać  tylko  jeden 
nukleon  (jest  to  konsekwencja  zakazu  Pauliego  odno- 
szącego się  do  cząstek  o spinach  połówkowych ; zakaz 
ten  głosi,  że  w określonym  stanic  kwantowym  może 
znajdować  się  tylko  jedna  cząstka).  Przeniesienie  nu- 
kleonu z orbity  na  orbitę  wymaga  dostarczenia  energii 
(lub  energia  wydziela  się,  gdy  przejście  następuje 
z orbity  położonej  wyżej  w skali  energetycznej  na  or- 
bitę niższą).  Jądro  atomowe,  będące  zespołem  silnie 
wpływających  na  siebie  nukleonów,  może  ulegać 
różnego  typu  wzbudzeniom.  Dostarczona  do  wnętrza 
jądra  energia  może  być  skupiona  na  jednym  nukleonie 
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wzbudzenia  (wzbudzenia  jednocząstkowe)  lub  na  kilku,  może  też 
jednocząst-  powodować  zmianę  stanu  wielu  nukleonów.  We  wzbu- 
kowe  dzeniach  o niedużej  energii  może  brać  udział  tylko 
kolektywne  niewielka  liczba  nukleonów.  Zdarza  się,  że  wzbudze- 
nie przenosi  się  w określony  sposób  z jednej  grupy 
nukleonów  na  drugą.  W rezultacie  we  wzbudzeniu 
bierze  udział  wiele  nukleonów.  Takie  kolektywne 
wzbudzenia,  których  przykładem  mogą  być  drgania 
powierzchni  lub  obrót  jądra,  wygodnie  jest  opisywać 
wprowadzając  stopnie  swobody  związane  z ich  kolek- 
tywnym ruchem. 

badanie  Do  badania  wzbudzeń  jednocząstkowych  szczegól- 
reakcji  nie  przydatna  jest  obserwacja  reakcji  zdarcia  z prze- 
zdarcia  kazaniem  jednego  nukleonu.  Przekazany  nukleon  lo- 
kuje się  na  jednej  z orbit  bombardowanego  jądra.  Zi- 
dentyfikowanie tej  orbity  daje  informację  o stanie 
jądra  utworzonego  w reakcji.  Identyfikacji  orbity  do- 
konuje się  określając  orbitalny  moment  pędu  prze- 
chwyconego nukleonu.  W tym  celu  wystarczy  zmie- 
rzyć rozkład  kątowy  cząstek  emitowanych  w reakcji. 
Kątowi  emisji  odpowiada  pewna  wartość  pędu  prze- 
kazana wraz  z nukleonem  do  jądra  bombardowanego 
(rys.  19).  Okazuje  się,  że  największy  wkład  do  prze- 


Rys.  19.  Schemat  obrazujący  relacje  między  pędami  cząstek  bio- 
rących udział  w reakcji  zdarcia.  Wraz  z nukleonem  zostaje  do 

jądra  przekazany  pęd  q(0)  = k\—kf.  Przekrój  czynny  jest  maksy- 
malny, gdy  reakcja  zachodzi  na  powierzchni  jądra  w pobliżu 

płaszczyzny  równikowej  prostopadłej  do  ą.  Wówczas  moment 
pędu  wniesiony  do  jądra  wynosi  qR 


rozkłady 

kątowo 


kroju  czynnego  dają  przyczynki  pochodzące  od  reakcji 
zachodzącej  na  powierzchni  jądra  w pobliżu  „równi- 
ka” wyznaczonego  przez  płaszczyznę  prostopadłą  do 
kierunku  przekazanego  pędu.  Fale  reprezentujące 
emitowaną  cząstkę,  wysyłane  z różnych  punktów 
„równika”,  interferują  wówczas  konstruktywnie  da- 
jąc wzmocnienie  efektu.  Zatem  najbardziej  korzy- 
stnym kątem  emisji  jest  kąt  0,  przy  którym  jest 
spełniony  warunek: 

łh  = q(0)  • R 


Rys.  20.  Typowe  kształty  rozkładów  kątowych  dla  różnych  mo- 
mentów pędu  wniesionych  przez  nukleon  do  jądra  (znormalizo- 
wane w maksimum) 
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(Ift  — moment  pędu  przekazanego  nukleonu,  h = 
= fijln,  h — stała  Plancka,  ą — przekazany  pęd, 
R — promień  jądra).  Każdej  wartości  orbitalnego 
momentu  pędu  odpowiada  pewien  charakterystyczny 
kąt,  przy  którym  przekrój  czynny  powinien  być  mak- 
symalny (rys.  20). 

Mierzone  rozkłady  kątowe  można  stosunkowo  do- 
kładnie odtwarzać  w obliczeniach  teoretycznych. 
Zakłada  się,  że  stan  wytworzony  w wyniku  reakcji 
jest  czystym  stanem  jednocząstkowym  — jądro  bom- 
bardowane -f  nukleon.  Przeważnie  jednak  każdy 
stan  jest  mieszaniną  różnych  konfiguracji  wzbudzeń 
nukleonów.  Konfiguracja:  „jądro  bombardowane  + 
nukleon”  jest  tylko  jedną  z kilku  składowych,  z któ- 
rych skonstruowany  jest  dany  stan.  Można  powiedzieć, 
że  jądro  spędza  tylko  pewną  część  czasu  w konfiguracji 
jednocząstkowej.  W związku  z tym  przekrój  czynny 
reakcji  jest  odpowiednio  mniejszy.  Porównanie  zmie- 
rzonego przekroju  czynnego  z obliczeniem  pozwala 
wyznaczyć  tzw.  czynnik  spektroskopowy,  mówiący 

0 wielkości  wkładu  konfiguracji  jednocząstkowej  do 
całkowitej  funkcji  falowej  danego  stanu.  Z pomiaru 
kątowego  różniczkowego  przekroju  czynnego  na 
reakcję  zdarcia  dowiadujemy  się  więc  o rodzaju 

1 wkładzie  konfiguracji  jednocząstkowej  „jądro  bom- 
bardowane + nukleon”  do  budowy  badanego  stanu 
jądra  utworzonego  w reakcji.  Te  same  wnioski  tyczą 
się  innych  reakcji  zdarcia  i wychwytu  nukleonów: 
wychwyt  nukleonu  daje  informację  o konfiguracji 
„jednodziurowej”,  przekazanie  dwóch  nukleonów  — 
informację  o konfiguracjach  par  cząstek  czy  dziur 
i tak  dalej. 

Reakcje  bezpośrednie  dostarczają  również  innych 
cennych  informacji.  Na  przykład  z wielkości  prze- 
kroju czynnego  na  tworzenie  stanów  wzbudzonych 
w reakcjach  rozpraszania  nieelastycznego  można 
otrzymać  informację  o obrocie  jąder  zdeformowanych 
i wielkości  ich  deformacji.  Przekroje  czynne  reakcji 
wzbudzenia  kulombowskiego  (wzbudzenie  jądra 
przez  pole  elektromagnetyczne  przebiegającej  w po- 
bliżu jądra  naładowanej  cząstki)  pozwalają  wysnuć 
wnioski  na  temat  rozkładu  ładunku  jądra  wzbudzo- 
nego. Tego  typu  przykłady  można  mnożyć.  Wspólną 
cechą  reakcji  bezpośrednich  jest  dostarczanie  infor- 
macji o wzbudzeniach  związanych  z niewielką  liczbą 
stopni  swobody. 

Reakcje,  w których  tworzone  jest  jądro  złożone, 
mogą  być  źródłem  informacji  o wysoko  wzbudzonych 
stanach  jądra  (np.  o ich  szerokości)  oraz  o własno- 
ściach statystycznych  jąder  (np.  o gęstości  poziomów 
jądrowych).  Pomiary  parametrów  oddzielnych  rezo- 
nansów jądra  złożonego  w różnych  kanałach  wej- 
ściowych i wyjściowych  umożliwiają  wyciągnięcie 
wniosków  o najbardziej  istotnych  w nich  konfigura- 
cjach nukleonów. 


Reakcje  wywołane  przez  ciężkie  jony 

Na  specjalną  uwagę  zasługują  reakcje  wywołane  przez 
jądra  atomowe,  tzw.  ciężkie  jony,  przyspieszone  do 
znacznej  energii  (od  kilku  do  kilkunastu  MeV/nu- 
kleon).  Cechą  charakterystyczną  tych  reakcji  jest 
to,  że  dzięki  dużej  masie  cząstek  długość  odpowiada- 
jących im  fal  jest  na  tyle  mała,  że  ruch  cząstek  można 
traktować  niemal  klasycznie. 

Zjawiska  towarzyszące  bombardowaniu  jąder  przez 
ciężkie  jony  można  bardzo  ogólnie  podzielić  na  trzy 
grupy  (rys.  21). 

1 . Przy  małych  energiach  lub  przy  dużych  parame- 
trach zderzenia,  gdy  cząstka  nie  wchodzi  w bezpo- 
średni kontakt  z powierzchnią  jądra,  głównym  pro- 
cesem, poza  rozpraszaniem  elastycznym,  jest  wzbudze- 
nie kulombowskie  zarówno  jądra  bombardowanego, 
jak  i ciężkiego  jonu.  Ze  względu  na  duże  ładunki 
oddziałujących  obiektów  prawdopodobieństwo  tego 
procesu  jest  znaczne.  Możliwy,  choć  mało  prawdo- 
podobny jest  również  proces  przekazania  jednego  lub 
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kilku  nukleonów,  zachodzący  mimo  braku  kontaktu 
obu  jąder  dzięki  istnieniu  kwantowego  efektu  tune- 
lowego. 


Rys.  21.  Reakcje  wywołane  przez  ciężkie  jony:  / rozpraszanie 
elastyczne.  2 otarcie  się  obu  jąder  z wymianą  nukleonów,  3 zde- 
rzenie prawie  centralne  prowadzące  do  połączenia  się  obu  jąder. 
bi  > bt  > b3  — parametry  zderzenia 

2.  Przy  energiach  przekraczających  barierę  kulom- 
bowską  i przy  odpowiednich  parametrach  zderzenia 
jon  „ociera  się”  o powierzchnię  jądra.  Towarzyszy 
temu  wymiana  pewnej,  czasami  dość  znacznej  liczby 
zderzenia  nukleonów.  Można  rozróżnić  dwa  mechanizmy:  zde- 
„kwazi-  rżenia  „kwazielastyczne”,  gdy  energia  rozproszonego 
elastyczne"  jonu  zmienia  się  bardzo  mało  w porównaniu  z energią 


Jądra  atomowe  w 

Zdzisław  Szymański 

Substancja,  z której  zbudowane  jest  jądro  atomu,  nie 
jest  podobna  do  stanów  skupienia  materii  znanych 
nam  z codziennego  doświadczenia.  Małe  rozmiary 
jądra  oraz  duża  gęstość  i spoistość  uniemożliwiają 
wniknięcie  w jego  strukturę  za  pomocą  prostych  i bez- 
pośrednich eksperymentów.  Wiedza  nasza  o siłach 
działających  pomiędzy  nukleonami  — podstawowymi 
składnikami  jądra  — jest  bardzo  niepełna.  Brak  też 
teorii  obejmującej  całokształt  zjawisk  jądrowych. 
Kwantowa  natura  praw  fizyki  opisujących  jądro  atomu 
obca  jest  naszej  intuicji,  będącej  sumą  doświadczeń 
z makroskopowego  świata  fizyki  klasycznej.  Wszystko 
to  sprawia,  że  własności  jądra  atomowego  są  trudne 
do  badania  i nie  w pełni  jeszcze  znane. 

Otaczająca  nas  na  Ziemi  materia  zawiera  jądra 
w stosunkowo  bardzo  dobrze  określonych  stanach 
fizycznych.  Jądra  te  na  ogół  znajdują  się  w stanach 
podstawowych.  Badanie  ich  było  pierwszym  etapem 
poznania  budowy  jądra.  Jednakże,  obok  doświad- 
czeń zaburzających  tylko  w minimalnym  stopniu 
stan  podstawowy,  niezwykle  cennym  źródłem  infor- 
macji o strukturze  jądra  i jego  własnościach  jest  wpro- 
ekstremalne  wadzenie  (lub  próba  sztucznej  produkcji)  jądra 
a normalne  w stany  ekstremalne,  różniące  się  w istotny  sposób 
stany  od  tych,  które  umownie  potraktowaliśmy  jako  stany 
jąder  normalne. 

Chcąc  mówić  o stanach  ekstremalnych  jąder  ato- 
mowych należy  najpierw  poznać  własności  jądra 
w stanie  normalnym  (-►  Jądra  atomowe  i ich  wzbudze- 
nia). Możemy  przyjąć,  że  jądro  atomowe  to  układ 
kwantowy  wielu  nukleonów  oddziałujących  silnie  (-► 
Oddziaływania  silne).  Istnieje  pogląd,  że  punktem  wyj- 
ściowym teorii  jądra  atomowego  powinno  być  roz- 
wiązanie równania  Schrodingera  dla  wielu  nukleo- 
nów. Obecnie  podejście  takie  napotyka  duże  trudności, 
związane  z rozwiązywaniem  równania  Schrodingera 


początkową,  oraz  zderzenia  „silnie  tłumione”,  któ-  zderzenia 
rym  towarzyszy  przekazanie  jądru  bombardowanemu  „silnie 
dużej  energii.  Przypuszcza  się,  że  w drugim  wypadku  tłumione" 
dzięki  siłom  jądrowym  jądro  bombardujące  wiąże  się 
na  pewien  czas  z jądrem  bombardowanym  w układ, 
który  szybko  ulega  rozerwaniu.  Przekazanie  dużej 
energii  można  interpretować  jako  efekt  podobny  do 
klasycznego  efektu  działania  sił  tarcia  między  dwoma 
ciałami. 

3.  Przy  energiach  przekraczających  barierę  kulom-  fuzja  jąder 
bowską  i przy  małych  parametrach  zderzenia  na- 
stępuje połączenie  się  obu  jąder  (fuzja).  Dzięki  swej 
dużej  masie  ciężki  jon  może  wnieść  do  utworzonego 
jądra  złożonego  bardzo  duży  moment  pędu  (ok. 

100 /i)  nie  spotykany  w innego  typu  reakcjach  jądro- 
wych. W ten  sposób  można  wytwarzać  i badać  jądra 
w bardzo  nietypowych  stanach.  Moment  pędu  wno- 
szony do  jądra  jest  ograniczony  z góry  przez  waru- 
nek, aby  siła  odśrodkowa  działająca  na  środki  mas 
obu  cząstek  w układzie  „jon  stykający  się  z jądrem” 
była  co  najmniej  skompensowana  przez  siły  napięcia 
powierzchniowego  stykających  się  kropli  materii 
jądrowej.  Z tego  też  względu,  ze  wzrostem  masy 
bombardującego  jonu  maleje  prawdopodobieństwo 
połączenia  się  obu  jąder. 

Najbardziej  atrakcyjną  stroną  reakcji  wywoływa- 
nych przez  ciężkie  jony  jest  możliwość  uzyskiwania 
jąder  położonych  daleko  od  ścieżki  trwałości  oraz 
jąder  w ekstremalnych  stanach,  o dużych  wartościach 
spinów.  Od  reakcji  tego  typu  oczekuje  się  również 
odpowiedzi  na  temat  ewentualnego  istnienia  tzw. 
jąder  superciężkich. 

W.E.  Burcham  Nuclear  Physics , London  1967;  J.B. A.  Eng- 
land  Metody  doświadczalne  fizyki  jądrowej.  Warszawa  1981; 

Z.  W ilhelmi  Fizyka  reakcji  jądrowych.  Warszawa  1976. 


stanach  ekstremalnych 


oraz  niedostateczną  znajomością  oddziaływań  sil- 
nych. Poza  tym  zgromadzony  został  bardzo  bogaty 
materiał  doświadczalny  dotyczący  jąder  atomowych. 

Wobec  tego  jest  rzeczą  naturalną  ograniczenie  się  parametry 
do  bardziej  fenomenologicznego  podejścia,  poprzez  charaktery- 
opis  jądra  za  pomocą  wielu  parametrów  charaktery-  żujące  jądro 
żujących  jego  własności.  Tak  więc  obok  liczby  proto- 
nów Z,  liczby  neutronów  N oraz  momentu  pędu  / 
jądra  (w  jednostkach  h)  istotną  rolę  odgrywają  pa- 
rametry charakteryzujące  zmianę  kształtu  jądra 
w stosunku  do  kształtu  kulistego,  takie  jak:  wydłu- 
żenie e2  (osiowo  symetryczne),  parametr  e4  — opi- 
sujący przewężenie  tworzące  się  w powierzchni  jądra 
rozszczepiającego  się,  asymetria  ez  względem  płasz- 
czyzny prostopadłej  do  osi  symetrii  jądra,  odstęp- 
stwo od  kształtu  osiowo  symetrycznego  y i inne  pa- 
rametry kształtu,  a ponadto  parametry  opisujące 
radialny  rozkład  materii  w jądrze,  wreszcie  parametry 
charakteryzujące  stopień  struktury  nadciekłej  pow- 
stającej w jądrze  (w  wielu  jądrach  atomowych  wy- 
twarzają się  korelacje  podobne  do  tych,  które  wywo- 
łują nadciekłość  helu  w niskich  temperaturach). 

Rysunek  1 charakteryzuje  schematycznie  parametry 
odgrywające  istotną  rolę  w opisie  jądra. 

Jądro  atomowe  w stanie  nieekstremalnym  odznacza 
się  pewnym  stosunkiem  liczby  neutronów  N do  liczby 
protonów  Z odpowiadającym  tzw.  ścieżce  jąder 
trwałych  (ścieżka  trwałości  — ► Jądra  atomowe  i ich 
wzbudzenia,  rys.  2),  niewielkim  momentem  pędu  (po- 
wolny obrót  niezaburzający  struktury  wewnętrznej 
jądra,  np.  JK  10),  niewysokimi  energiami  wzbudze- 
nia, kulistym  kształtem  (e2  = £3  — et  = y = 0)  lub 
rozkładem  masy  odpowiadającym  niewielkiej  defor- 
macji kuli,  polegającym  głównie  na  wydłużeniu,  oraz 
występowaniem  słabych  korelacji  typu  nadciekłego 
(u  znacznej  większości  jąder). 
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Stany  ekstremalne  jąder  atomowych  odznaczają 
się  znacznymi  odstępstwami  od  prawidłowości  omó- 
wionych powyżej.  Do  jąder  w stanach  ekstremalnych 

Z -liczba  protonów 
N-liczba  neutronów 
/-moment  pędu 


A~  Z + N 


elipsoida  osiowo - 
- symetryczna 


przewężenie  £4 


przewężenie 
i „stępienie 
końców" 


Rys.  1.  Najważniejsze  parametry  charakteryzujące  jądro 


Rys.  2.  Ścieżka  jąder  trwałych.  Linia  łamana  oraz  kropki  okre- 
ślają położenie  jąder  trwałych.  Obszary  zacieniowane  opisują 
przebieg  procesu  r (proces  szybkiego  wychwytu  neutronów). 
Obszar  zaznaczony  napisem  SC  odpowiada  hipotetycznym 
nuklidom  superciężkim 

występowa-  można  zaliczyć  jądra  o nadmiarze  neutronów,  które 
nie  jąder  mogą  powstawać  np.  jako  produkty  rozszczepienia 
w stanach  jądrowego,  bądź  też  w niezwykle  silnych  strumieniach 
ekstremal-  neutronów,  np.  w gwiazdach  supernowych,  jądra 
nych  o znacznym  niedomiarze  neutronów,  powstałe  w wy- 
niku reakcji  syntezy  ciężkich  jonów,  oraz  jądra  o szcze- 
gólnie dużych  liczbach  protonów  i neutronów,  więk- 
szych od  znanych  obecnie  na  Ziemi  (pierwiastki 
transuranowe  łub  hipotetyczne  pierwiastki  supercięż- 
kie). Najcięższymi  znanymi  w przyrodzie  pierwiastka- 
mi są  tor  (Th)  i uran  (U)  o liczbach  atomowych  od- 
powiednio Z = 90  oraz  Z — 92;  występują  one  na 
Ziemi.  Przed  paru  laty  wykryto  również  na  Ziemi 
śladowe  ilości  cięższego  pierwiastka  — plutonu  (izo- 
top 244Pu).  Następny  pierwiastek  o liczbie  atomowej 
Z — 93,  nazwany  neptunem  (Np),  był  wytworzony 
sztucznie.  Izotop  239Np  uzyskano  w procesie  wychwytu 
neutronów  przez  jądro  uranu  238  U.  Powstaje  wówczas 
cięższy  izotop  uranu,  “9U,  który  ulega  rozpadowi  /? 
(zamiana  jednego  z neutronów  na  proton)  z okresem 
połowicznego  zaniku  Tin  — 23  min,  jak  również 


nuklid  ^Np,  który  też  nie  jest  trwały.  Kolejny  rozpad 
fi  z okresem  połowicznego  zaniku  7\/2  = 2,3  dnia 
prowadzi  do  powstania  nowego  pierwiastka,  plutonu 
(izotop  239Pu).  Opisane  powyżej  procesy  można 
przedstawić  za  pomocą  następującego  schematu: 

238U  + „ _>  238|J  _£  239Np  239pu> 

Próby  tworzenia  nowych,  coraz  cięższych  pierwia-  wytwarzanie 
stków,  tzw.  transuranowców,  są  prowadzone  nadal,  trans- 
Wy tworzono  i zbadano  do  chwili  obecnej  własności  uranowców 
wielu  izotopów  nowych  pierwiastków  od  neptunu 
(Np.  Z — 93)  aż  do  pierwiastka  Z = 102  (nobel. 

No)  oraz  Z — 103  (lorens,  Lr).  W ostatnich  latach 
badane  są  reakcje  jądrowe  (na  ogół  polegające  na 
bombardowaniu  ciężkich  jąder  innymi  ciężkimi  ją- 
drami przyspieszanymi  w akceleratorach  ciężkich 
jonów)  prowadzące  do  pierwiastków  o liczbach  ato- 
mowych Z — 104,  105,  106  oraz  107.  Nuklidem 
o największej  znanej  liczbie  neutronów  (N  = 159) 
jest  obecnie  259Fm  (ferm).  W chwili  obecnej  udaje 
się  jednak  wytwarzać  zaledwie  nieznaczne  ilości  tych 
pierwiastków,  co  utrudnia  badanie  ich  własności 
fizycznych  i chemicznych. 

Inną  grupę  jąder  ekstremalnych  tworzą  jądra  o du- 
żym momencie  pędu.  Oddziaływania  typu  siły  Corio- 
lisa,  występujące  w bardzo  szybko  obracającym  się 
jądrze  (np.  / ^ 10)  prowadzą  do  zniszczenia  w nim 
struktury  nadciekłej  analogicznie  do  zjawiska  Meiss- 
nera (— ► Nadprzewodnictwo)  występującego  w nad- 
przewodzącym metalu.  Przy  jeszcze  szybszym  obro- 
cie (np.  / 50  łub  nawet  / 100)  następuje  znaczna 

modyfikacja  lub  całkowite  przeobrażenie  potencjału 
jądra  i ruchu  nukleonów  w tym  potencjale.  Mogą 
również  wystąpić  silne  deformacje  jądra,  polegające 
np.  na  znacznym  odstępstwie  od  symetrii  osiowej. 

Jeszcze  inny  typ  jądrowych  stanów  ekstremalnych 
związany  jest  z gwałtownymi  zmianami  kształtu  jądra. 

Na  przykład  procesowi  rozszczepienia  jądra,  towa- 
rzyszy bardzo  znaczne  wydłużenie  jądra  e2  związane 
z wyraźnym  występowaniem  przewężenia  # 0), 
w wielu  wypadkach  także  asymetrii  (e3  # 0),  a być 
może  również  odstępstw  od  osiowej  symetrii  (y  ^ 

^ 0).  Innym  przykładem,  związanym  zresztą  najczę- 
ściej z procesem  rozszczepienia,  są  tzw.  izomery 
kształtu,  będące  krótkożyciowymi  stanami  jądra 
o znacznej  deformacji  prowadzącej  do  rozpadu  przez 
rozszczepienie. 

Szukając  możliwości  występowania  stanów  ekstre- 
malnych skorzystamy  ze  znanego  powszechnie  faktu, 
że  jądro  atomowe,  podobnie  jak  każdy  zamknięty 
układ  fizyczny,  dąży  do  przyjęcia  konfiguracji  odpo- 
wiadającej możliwie  najniższej  energii.  Przedstawiając 
zależność  energii  jądra  od  parametrów  opisujących  powierzchnia 
jego  stan  jako  powierzchnię  energetyczną  (na  ogół  energetyczna 
wielowymiarową)  możemy  przypuszczać,  że  stanowi 
podstawowemu  jądra  odpowiada  absolutne  minimum 
na  powierzchni  energetycznej,  podczas  gdy  innym 
obserwowanym  stanom,  a więc  odznaczającym  się 
dostatecznie  długim  czasem  życia,  odpowiadają  lo- 
kalne minima  tej  powierzchni.  Stąd  badanie  własności 
powierzchni  energetycznej,  jej  właściwa  parametry- 
zacja, poszukiwanie  minimów  itp.  jest  podstawową 
metodą  teorii  jądra  atomowego. 

Pojęcie  o przebiegu  powierzchni  energetycznej 
można  sobie  wyrobić  na  podstawie  znajomości  włas- 
ności materii  jądrowej  rozpatrywanej  jako  całość 
bez  wnikania  w szczegóły,  które  zależą  np.  od  kon- 
kretnych konfiguracji  nukleonów.  W tym  wypadku 
do  opisu  powierzchni  jądrowej  wystarczają  na  ogół 
prawa  fizyki  klasycznej  (niekwantowej)  oraz  użycie 
takich  wielkości  charakteryzujących  środowisko 
jądrowe,  jak:  energia  wiązania  przypadająca  na  jeden 
nukleon,  energia  napięcia  powierzchniowego  na  po- 
wierzchni ograniczającej  „kroplę”  cieczy  jądrowej, 
energia  symetrii,  która  decyduje  o ustaleniu  się  od- 
powiedniego stosunku  ilości  neutronów  i protonów, 
energia  elektrostatycznego  odpychania  protonów  itp. 

W wyniku  takiego  opisu  otrzymujemy  ogólny  prze- 
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bieg  powierzchni  energetycznej  w postaci  wolno- 
zmiennej  i na  ogół  gładkiej  funkcji  parametrów  (np. 
dla  modelu  kroplowego  jądra  -*■  Modele  jądrowe). 

Na  tę  gładką  i regularną  powierzchnię  nakładają 
się  fluktuacje  wynikające  z kwantowej  struktury  jądra 
atomowego  — układu  wielu  nukleonów.  Fluktuacje 
te  nazwane  ogólnie  poprawkami  powłokowymi  „żło- 
bią” w gładkiej  powierzchni  energetycznej,  a zwłasz- 
cza w tych  jej  okolicach,  gdzie  zależność  energii  od 
parametrów  jest  stosunkowo  najmniejsza,  wiele  lo- 
kalnych minimów  i maksimów,  decydując  ostatecznie 
o możliwości  przybierania  przez  jądro  atomowe  okre- 
ślonych stanów.  Poprawki  powłokowe,  jakkolwiek 
znacznie  mniejsze  od  energii  wyznaczonej  przez  ogólne 
własności  materii  jądrowej,  mogą  więc  w sposób 
istotny  wpływać  na  własności  jąder.  Znak  poprawki 
powłokowej  (jest  ona  umownie  uznana  za  ujemną 
wówczas,  gdy  „żłobi”  minimum  na  powierzchni 
energetycznej)  oraz  jej  wielkość  związane  są  ściśle 
ze  strukturą  widma  kwantowych  poziomów  energe- 
tycznych układu.  Jeśli  poziomy  energetyczne  rozło- 
żone są  mniej  więcej  w jednakowych  odległościach 
(widmo  jednorodne),  to  poprawka  powłokowa  jest 
bardzo  bliska  zeru  i o losach  układu  decyduje  średni 
przebieg  powierzchni  energetycznej,  wynikający  np. 
z modelu  kroplowego  jądra.  Natomiast  w stanach, 
w których  widmo  poziomów  energetycznych  jest 
niejednorodne,  a więc  poziomy  grupują  się  w wyraźne 
powłoki,  poprawka  powłokowa  jest  duża  co  do  war- 
tości bezwzględnej  i ujemna,  o ile  liczba  nukleonów  od- 
powiada wypełnionym  powłokom,  oraz  duża  i do- 
datnia dla  jąder  o liczbie  nukleonów  odpowiadającej 
powłoce  wypełnionej  do  połowy.  Tak  więc  jądro 
atomowe,  które  dąży  do  przyjęcia  stanu  o najniższej 
energii,  faworyzuje  takie  wartości  parametrów  (licz- 
by neutronów  N,  protonów  Z,  momentu  pędu,  pa- 
rametrów kształtu  itp.),  którym  odpowiadają  silnie 
niejednorodne  widma  energetyczne  o zamkniętych 
powłokach. 

Dlatego  też  poznanie  kwantowych  widm  energe- 
tycznych jądra  atomowego  ma  zasadnicze  znaczenie 
w poszukiwaniu  stanów  ekstremalnych.  Widmo  po- 
ziomów energetycznych  jądra  można  na  ogół  z do- 
brym przybliżeniem  traktować  jako  widmo  poziomów 
energetycznych  niezależnych  nukleonów  poruszają- 
cych się  w średnim  potencjale  jądra.  Fizycy  duńscy, 
A.  Bohr  i B.R.  Mottelson,  zaproponowali  badanie 
widm  jąder,  a więc  i ocenę  poprawki  powłokowej  przez 
uwzględnienie  zależności  energii  e niezależnego  nu- 
kleonu od  liczb  kwantowych  charakteryzujących  stan 
nukleonu  w jądrze.  Okazuje  się,  że  struktura  powło- 
kowa w widmie  energetycznym  może  występować 
wówczas,  gdy  pochodne  energii  e względem  liczb 
kwantowych  nl9  n2,  ...  mają  się  do  siebie  tak,  jak  nie- 
wielkie liczby  całkowite: 


de  de 
cnx  ’ dnz  ' 


= a:b : ... 
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Pochodna  energii  e względem  liczby  kwantowej  m 
(/  = 1,  2 ...)  ma  prosty  sens  fizyczny  — jest  wielkością 
proporcjonalną  do  częstości  podstawowej  ccn  odpo- 
wiadającej /-temu  stopniowi  swobody  nukleonu. 
Relację  (1)  można  więc  traktować  jako  warunek 
współmierności  częstości  cot  (/  = 1,  2,  ...),  który  w ję- 
zyku fizyki  klasycznej  oznacza  warunek  tworzenia 
się  orbit  zamkniętych.  Na  przykład  gdy  ruch  składa 
się  z dwóch  drgań  harmonicznych  w dwóch  wzajem- 
nie prostopadłych  kierunkach  „1”  i „2”,  otrzymujemy 
ruch  po  orbicie  zamkniętej  tylko  wówczas,  gdy  czę- 
stości (Di  oraz  co2  są  współmierne;  orbity  mają  naj- 
prostszy charakter  przy  stosunku  co^co*  równym  np. 
1:1,  2:1,  3:2,  3:1  itp.  Podobna  sytuacja  znana  jest 
w teorii  muzyki,  gdzie  interwały  konsonansowe  od- 
znaczają się  prostymi  stosunkami  częstości:  1:1  (pry- 
ma), 2:l(oktawa),  3 :2  (kwinta),  3:1  (duodecima)  itp. 

Każdemu  układowi  liczb  całkowitych  a , b , ... 
w (1),  a więc  i każdemu  stosunkowi  częstości  odpo- 
wiada inna  struktura  kwantowego  widma  poziomów 


energetycznych,  a więc  także  i orbit  jednocząstkowych. 

Liczby  cząstek  odpowiadające  zamkniętym  powło- 
kom (zwyrodniałym  lub  prawie  zwyrodniałym  pozio- 
mom kwantowym)  określają  układy  o stosunkowo  liczby 
większej  trwałości.  Nazywa  się  je  liczbami  magiczny-  magiczn© 
mi.  W fizyce  atomu  odpowiadają  one  konfiguracjom 
gazów  szlachetnych.  Stopień  zwyrodnienia  powłoki 
(tj.  ilość  blisko  leżących  poziomów  energetycznych) 
określa  więc  liczby  magiczne.  Jeśli  liczba  neutronów 
lub  protonów  w jądrze  w danym  stanie  kwantowym 
jest  równa  liczbie  magicznej,  to  stan  taki  będzie  fa- 
woryzowany przez  jądro,  a w wypadku  szczególnie 
dużej  (ujemnej)  poprawki  powłokowej  może  to  pro- 
wadzić do  stanu  trwałego  lub  dostatecznie  długo- 
życiowego.  Poniżej  podane  są  przykłady  ilustrujące 
znane  bądź  też  hipotetyczne  stany  ekstremalne  jąder. 

Między  innymi  uwzględniono  związek  tych  stanów 
z występowaniem  odpowiednich  liczb  magicznych, 
charakterystycznych  dla  danej  konfiguracji. 

Rysunek  2 przedstawia  — jak  już  wspomnieliśmy  — 
ścieżkę  jąder  trwałych,  określającą  typowe  stosunki 
liczb  neutronów  i protonów.  Nuklidy  leżące  z dala  od 
tej  ścieżki  odznaczają  się  bardzo  krótkimi  czasami 
życia  względem  rozpadu  beta  (/?“,  p+  lub  wy- 
chwytu elektronu)  i wobec  tego  są  na  ogół  bardzo 
trudne  do  obserwacji.  Jądra  o znacznym  niedomiarze 
neutronów  można  wytwarzać  doprowadzając  do 
reakcji  syntezy  jąder  lżejszych,  np.  przyspieszając  cięż- 
kie jony.  Tak  wytworzone  jądra  mogą  się  ponadto 
odznaczać  bardzo  dużym,  przekazanym  w'  reakcji, 
momentem  pędu  wynoszącym  np.  / = 50  lub  więcej 
jednostek  h.  Szczegółowe  badanie  takich  nuklidów 
możliwe  będzie  tylko  wówczas,  jeżeli  okaże  się,  że 
przy  pewnych  wartościach  Z,  N oraz  / jądro  może 
trwać  dostatecznie  długo,  tzn.  wtedy,  gdy  struktura 
widma  energetycznego  ma  charakter  wyraźnych 
powłok.  Liczby  magiczne  Z,  N oraz  moment  pędu 
/ dla  takich  hipotetycznych  stanów  jądrowych,  okre-  stan 
ślanych  angielskim  terminem  „superdizzy”  (wirujące  „superdizzy 
z zawrotną  szybkością),  nie  są  jeszcze  znane,  można 
jednak  przypuszczać,  że  w najbliższych  latach  będą 
przeprowadzane  poszukiwania  eksperymentalne  i teo- 
retyczne tych  stanów. 

Omówimy  teraz  jądra  charakteryzujące  się  nadmia- 
rem neutronów,  a więc  takie,  które  leżą  poniżej  ścieżki 
trwałości  na  rys.  2.  Nuklidy  tego  typu  mogą  pow- 
stawać w wyniku  rozszczepienia  ciężkich  jąder.  Cie- 
kawym przykładem  jest  podwójnie  magiczny  izotop 
cyny  132Sn  o magicznych  liczbach  protonów  i neutro- 
nów Z = 50,  N = 82,  badany  obecnie  w niektórych 
laboratoriach  (magiczne  liczby  protonów  i neutronów 
w jądrach  o kształcie  kulistym  są  Z,  N = 2,  8,  20, 

28,  50,  82  a także  N = 126).  Każdy  inny  nuklid 
o niemagicznych  liczbach  Z,  N położony  w tak  dużej 
odległości  od  ścieżki  trwałości  byłby  nieobserwowalny 
z powodu  zbyt  krótkiego  czasu  życia  ze  względu  na 
rozpad  fi.  Innym  przykładem  nuklidów  o dużym 
nadmiarze  neutronów  są  jądra  występujące  w tzw. 
procesie  r,  zachodzącym  prawdopodobnie  podczas  proces  r 
gwałtownych  ewolucji  gwiazd  (supernowych)  produ- 
kujących niezwykle  intensywne  strumienie  neutro- 
nów (-*•  Reakcje  jądrowe  w gwiazdach).  Powstają 
wówczas  nowe  izotopy  w wyniku  wychwytu  licznych 
neutronów.  Czas  życia  ze  względu  na  rozpad  /?  dla 
tych  izotopów  jest  porównywalny  z odstępem  czasu 
upływającym  między  dwoma  kolejnymi  przyłącze- 
niami neutronów.  Proces  ten,  którego  przebieg  jest 
zaznaczony  na  rys.  2,  stanowi  jedyne  wytłumaczenie 
istnienia  na  Ziemi  pierwiastków  cięższych  od  ołowiu, 
takich  jak  uran  (U)  i tor  (Th). 

W ciągu  ostatnich  kilku  lat  bardzo  żywo  dyskuto- 
wana jest  przez  fizyków  możliwość  wytworzenia  no- 
wych pierwiastków  o liczbach  protonów  Z i neutro- 
nów Ny  większych  od  znanych  obecnie,  tzw.  pier- 
wiastków superciężkich.  Prosta  ekstrapolacja  znanych 
liczb  magicznych  prowadzi  do  wniosku,  że  układ  _ 
złożony  z N = 126  protonów  mógłby  tworzyć  pierwiastki 
jądro  o dużej  (ujemnej)  poprawce  powłokowej.  Jed-  superciężkie 
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nakże  bardziej  prawdopodobny  wydaje  się  obecnie 
wybór  pierwiastka  o liczbie  Z — 114.  Aby  zrozu- 
mieć, skąd  się  bierze  nowa  liczba  magiczna  114, 
rozważmy,  jak  mechanika  kwantowa  tłumaczy  przy- 
toczone powyżej  liczby  magiczne  jąder  kulistych. 
Energia  pojedynczego  nukleonu  poruszającego  się 
w potencjale  trójwymiarowego  oscylatora  harmonicz- 
nego dana  jest  wzorem: 

£(«,  /)  = hco[2(n- D+/+3/2J  (2) 


(/i,  / — odpowiednio  radialna  liczba  kwantowa  oraz 
orbitalny  moment  pędu).  Zgodnie  ze  wzorem  (1) 
otrzymujemy  stosunek 


de  de 

11  :1T  ~ 2:1 


(3) 


odpowiadający  oktawie  w terminologii  muzycznej. 
Uwzględniając  2(2/+l)-krotne  zwyrodnienie  pozio- 
mów jądrowych  w jądrze  kulistym  związane  z kwan- 
towaniem przestrzennym  i istnieniem  spinu,  otrzy- 
mujemy (przez  sumowanie  tej  krotności  dla  każdej 
pary  liczb  n,  /,  prowadzących  do  tej  samej  energii 
£(«,  i)  danej  wzorem  2)  liczby  magiczne  dla  kulistego 
jądra  o potencjale  oscylatora  harmonicznego  w postaci 
ciągu:  2,  8,  20,  40,  70,  112,...  Silne  sprzężenie  typu 
spin-orbita  w jądrze  zmienia  ten  ciąg  prowadząc  do 
liczb  magicznych  2,  8,  20,  28,  50,  82,  126,  184,  obser- 
wowanych w rzeczywistości  z wyjątkiem  ostatniej. 
Jednakże  rzeczywisty  potencjał  działający  na  nukleony 
w jądrze  różni  się  od  potencjału  oscylatora  harmo- 
nicznego, zwłaszcza  dla  jąder  cięższych.  Odstępstwa 
te  są  bardziej  wyraźne  dla  protonów,  co  jest  zapewne 
częściowo  związane  z istnieniem  elektrostatycznego 
odpychania.  Okazuje  się,  że  w jądrach  ciężkich  sto- 
sunek (de/ dn):  (dej dl)  jest  bliski  wielkości  3:1,  co 
odpowiada  bardziej  interwałowi  duodecimy  niż  okta- 
wie (2:1).  W tej  sytuacji  grupy  stanów  protonowych 
typu  (lj)  (2^);  (1  i)  (2 /)  oraz  (1  h)  {Id)  są  bliskie  zwy- 
rodnienia (wielkość  w nawiasie  oznacza  wartość 
liczby  kwantowej  n,  litera  zaś  — wielkość  liczby 
kwantowej  / zgodnie  ze  standardową  notacją  spektro- 
skopii; / = 0,  1,  2,  3,  4,  5,  6,  7, ...  oznaczane  jest  od- 
powiednio przez  sy  p , d,  /,  g , h,  /,  /, ...).  Odnosi  się 
to  szczególnie  do  tej  części  widma,  która  odpowiada 
całkowitemu  momentowi  pędu  nukleonu  j,  równemu 
/+1/2  (zgodna  równoległość  momentu  orbitalnego 
i spinu  protonu).  Wynikający  stąd  układ  poziomów 
energetycznych  protonu  przedstawiony  jest  na  rys.  3. 


protony 


i •i-i  /-1+5 


<lh- 


Rys.  3.  Schemat  poziomów  protonowych  jąder  superciężkich 
Symbolami  A * O oznaczono  te  poziomy,  które  byłyby  zwyrod" 
niałe  w przypadku  spełnienia  wzoru  (1)  dla  stosunku  odpowitTd 
nio  3:1,  2:1. W kółkach  podane  są  liczby  magiczne 


Widać  tu  wyraźnie  zamkniętą  powłokę  dla  Z = 114. 
Hipotetyczne  pierwiastki  superciężkie  występowałyby 
więc  zgodnie  z przywidywaniami  teorii  w okolicy 
Z = 114  oraz  N = 184  (rys.  2).  Trwałość  tych  jąder 


ograniczona  jest  przez  możliwość  rozszczepienia  lub 
przez  rozpad  a i /?.  Rysunek  4 podaje  teoretyczne 
oszacowania  czasów  życia  hipotetycznych  jąder  su- 


Rys.  4.  Teoretyczne  oszacowania  czasów  życia  nuklidów  super- 
ciężkich. Kropki  i kółka  oznaczają  jądra  trwałe  względem  roz- 
padu beta,  zaś  liczby  przy  konturach  — czas  życia  w latach 
względem  rozszczepienia  i rozpadu  alfa 


perciężkich.  Jak  widać,  czasy  te  są  dostatecznie  dłu- 
gie na  to,  by  raz  wytworzone  (lub  odkryte  w naturze) 
nuklidy  superciężkie  mogły  być  poddane  różnym  ba- 
daniom. W ciągu  ostatnich  kilku  lat  wiele  szczegóło- 
wych badań  poświęcono  próbom  znalezienia  w na- 
turze tych  interesujących  pierwiastków  lub  też  pró- 
bom sztucznego  ich  wytworzenia.  Jak  na  razie  próby 
te  nie  powiodły  się.  Jest  to  zrozumiałe,  jeśli  uwzględni 
się  fakt,  że  np.  na  Ziemi,  której  wiek  szacuje  się  na 
około  10®  lat,  nie  mogłyby  pozostać  nawet  niewielkie 
ilości  pierwiastków  o czasach  życia  wyraźnie  krót- 
szych od  jej  wieku.  Poza  tym  wytworzenie  nuklidu  problem 
o Z = 114  oraz  N — 184,  w drodze  syntezy  dwóch  wytworzenia 
jąder  lżejszych,  jest  obecnie  niemal  niewykonalne  ze  jąder  super- 
względu  na  fakt,  że  złożenie  fragmentu  o Z = 114  ciężkich 
z dwóch  ciężkich  jonów  dostępnych  obecnie  w labo- 
ratoriach prowadzi  z reguły  do  nuklidu  o N znacznie 
mniejszej  od  184.  Być  może  przyśpieszenie  cięższych 
jonów,  takich  jak  ksenon  lub  uran  pozwoli  na  roz- 
wiązanie tej  trudności.  Wytworzenie  pierwiastków 
superciężkich  byłoby  doniosłym  wydarzeniem  nie 
tylko  dla  fizyki  jądra  atomowego.  Mogłoby  się  ono 
przyczynić  do  lepszego  zrozumienia  lub  nawet  roz- 
wiązania wielu  problemów  astrofizyki,  związanych  ze 
wzajemnym  przeobrażaniem  się  pierwiastków  w 
gwiazdach.  Byłoby  krokiem  milowym  w fizyce  ato- 
mowej i chemii,  gdzie  otworzyłyby  się  możliwości 
badania  nowych  powłok  atomowych  i ich  wpływu  na 
własności  chemiczne  ciał.  Stworzyłoby  także  fascy- 
nujące możliwości  sprawdzenia  praw  elektrodynamiki 
w warunkach  ekstremalnych  w związku  z występo- 
waniem bardzo  dużych  ładunków  elektrycznych 
w stosunkowo  niewielkim  obszarze. 

Innym  przykładem  ekstremalnego  stanu  jądra  jest  proces  roz- 
stań jądra  występujący  w procesie  rozszczepienia,  szczepienia 
W stanie,  w którym  zaczyna  się  ten  proces  (punkt 
siodłowy  na  powierzchni  energetycznej)  jądro  atomo- 
we charakteryzuje  się  znacznym  wydłużeniem,  od- 
powiadającym stosunkowi  osi  równym  w przybliżeniu 
2:1.  Ponadto  istotną  rolę  odgrywa  parametr  eu 
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określający  tworzenie  się  przewężenia  prowadzącego 
do  podziału  jądra  na  dwa  fragmenty.  Wreszcie  fakt, 
że  wiele  jąder  ulega  podziałowi  na  dwie  nierówne 
części,  wiąże  się  z przypuszczeniem  naruszenia  symetrii 
względem  płaszczyzny  prostopadłej  do  osi  symetrii 


Rys . 7.  Kształt  dwugarbnej  bariery  potencjału  (energia  w MeV) 
w rozszczepiających  się  jądrach,  które  mają  izomery  kształtu. 
Nad  krzywą  oraz  pod  zobrazowane  są  schematyczne  kształty  od- 
powiadające kolejno:  jądru  sferycznemu,  stanowi  równowagi, 
konfiguracji  siodłowej  pierwszego  garbu,  stanowi  izomerycznemu, 
konfiguracji  siodłowej  drugiego  garbu  i wreszcie  konfiguracji  ro- 
zerwania jądra 
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Rys.  8.  Poziomy  energetyczne  niezależnego  nukleonu  poruszają- 
cego się  w potencjale  oscylatora  harmonicznego  w funkcji  wy- 
dłużenia ea.  Podane  są  liczby  magiczne  odpowiadające  stosunkom 
częstości  1 :1  (pryma)  oraz  2:1  (oktawa) 


Rys.  6.  Rzut  powierzchni  energetycznej  na  płaszczyznę  para- 
metrów e,  oraz  z4.  Kontury  (warstwice)  odpowiadają  określo- 
nym wartościom  energii.  Obliczenia  odnoszą  się  do  jądra  ‘“Fm 
bez  uwzględnienia  poprawki  powłokowej.  Literami  O i S ozna- 
czono odpowiednie  położenia  konfiguracji  stanu  podstawowego 
oraz  punktu  siodłowego  1 


Rys.  9.  Poziomy  energetyczne  niezależnego  nukleonu  w poten- 
cjale jądrowym  dla  stosunku  częstości  2:1.  Z lewej  strony  wy- 
kreślone są  poziomy  w potencjale  oscylatora  harmonicznego, 
z prawej  zaś  — dla  bardziej  realistycznego  potencjału  jądrowego. 
W kółkach  podane  są  odpowiednie  liczby  magiczne  określające 
zamknięte  powłoki  w zdeformowanym  potencjale 
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jądra  (e3  ^ 0).  Tak  rozszczepiające  się  jądro  przybiera 
w punkcie  siodłowym  kształt  zbliżony  do  gruszki 
(rys.  5).  Konfiguracja  odpowiadająca  punktowi  siod- 
łowemu odznacza  się  wyższą  energią  potencjalną 
w porównaniu  z konfiguracją  stanu  podstawowego. 
Proces  rozszczepienia  przebiega  więc  albo  przez  kwan- 
towy efekt  tunelowy  albo  wskutek  dostarczenia  do 
jądra  energii  w ilości  wystarczającej  do  pokonania 
bariery  potencjału  na  rozszczepienie  (-*  Rozpady 
jąder  atomowych),  tj.  różnicy  energii  w obu  wspom- 
nianych konfiguracjach.  Powierzchnia  energetyczna, 
jako  funkcja  parametru  wydłużenia  e2  oraz  parametru 
przewężenia  £4,  zilustrowana  jest  na  przykładzie  po- 
danym na  rys.  6,  który  jest  mapą  powierzchni  ener- 
getycznej (linie  ciągłe  są  warstwicami,  tj.  odpowiadają 
stałej  energii).  Na  rys.  6 zaznaczone  są  również  po- 
łożenia konfiguracji  stanu  podstawowego  i punktu 
siodłowego  (oznaczone  odpowiednio  literami  O,  S ). 

Okazuje  się  jednak,  że  wiele  spośród  jąder  ciężkich 
ulegających  rozszczepieniu  wykazuje  znacznie  bardziej 
skomplikowaną  strukturę  powierzchni  energetycznej 
w okolicy  punktu  siodłowego.  Obok  minimum  w sta- 
nie podstawowym  występuje  w tych  jądrach  drugie 
minimum,  odpowiadające  bardziej  dużemu  wydłu- 
żeniu o stosunku  osi  rzędu  2:1.  Jądra  w takiej  kon- 
figuracji żyją  bardzo  krótko  i rozpadają  się  przez 
rozszczepienie  z czasem  życia  o kilka  lub  kilkanaście 
rzędów  wielkości  krótszym  niż  w wypadku  rozszcze- 
pienia zaczynającego  się  w stanie  podstawowym, 
izomery  Takie  stany  ekstremalne  zwane  są  izomerami  kształtu, 
kształtu  Były  one  obserwowane  u wielu  jąder  grupy  akty- 
nowców. Istnienie  tego  typu  stanów  możliwe  jest 
jedynie  wówczas,  gdy  w barierze  na  rozszczepienie 
„wyżłobione”  jest  dodatkowe  minimum,  tak  jak  to 
przedstawia  rys.  7. 

Wyjaśnienie  występowania  izomerów  kształtu  na 


gruncie  badania  struktury  widm  energetycznych  jest 
ciekawym  przykładem  zastosowania  warunku  (1) 
Bohra  i Mottelsona.  Energia  pojedynczego  nukleonu 
poruszającego  się  w potencjale  anizotropowego  oscy- 
latora harmonicznego  dana  jest  wzorem 

e = hcoJ/ix  -f  1 ) -\-hco3(n3Jr1/<2) , (4) 

gdzie  co±  oraz  co3  oznaczają  dwie  różne  częstości  cha- 
rakteryzujące kształt  potencjału,  zaś  n±  i nz  — od- 
powiednie liczby  kwantowe.  Rysunek  8 przedstawia 
wykres  poziomów  energetycznych  w funkcji  wydłu- 
żenia e2.  Widać,  że  oprócz  struktury  powłokowej, 
odpowiadającej  kształtowi  kulistemu  (1  : 1),  istnieje 
wyraźna  struktura  powłokowa  dla  co± : co3  = 2:1 
(oktawa),  czyli  stosunku  osi  równego  1 : 2.  Liczby 
magiczne  2,  4,  10,  16,  28,  40,  60,  80,  110,  140,  182  ... 
odpowiadają  w tym  wypadku  potencjałowi  czystego 
oscylatora  harmonicznego.  Istnienie  odstępstw  od 
potencjału  oscylatora  harmonicznego  prowadzi  do 
modyfikacji  tego  prostego  schematu  (rys.  9).  Wskutek 
tego  w rzeczywistych  jądrach  należy  oczekiwać  istnie- 
nia liczb  magicznych ...  86,  116,  148...  Właśnie 
w pobliżu  liczby  neutronów  N = 148  wykryto  szereg 
izomerów  kształtu. 

Omówione  powyżej  przykłady  hipotetycznych  lub 
obserwowanych  jądrowych  stanów  ekstremalnych  nie 
wyczerpują  wszystkich  możliwości.  Można  oczekiwać, 
że  w przyszłości  wysunięte  zostaną  nowe  hipotezy 
i odkryte  będą  nowe  ekstremalne  stany  jąder  atomo- 
wych. Będą  one  niewątpliwie  cennym  źródłem  dal- 
szych informacji  o strukturze  i własnościach  jąder  ato- 
mowych. 

A Bohr,  B.R  Mottelson  Nuclear  Structure , VoI  2,  Massa- 
chusetts (London-Amsterdam-Don  Mills,  Ontario-Sydney, 
Tokyo)  1975;  E.K  Hyde  i in.  The  Nuclear  Properties  of  The 
Heavy  Elements,  Englewood  Cliffs,  New  Jersey  1967;  S.G.  Nils- 
son  Shapes  and  Shells  w Scuola  Internationale  „Enrico  FertnC * 
1974,  Amsterdam  1956. 


Fizyka  ciężkich  Jonów 

Adam  Sob tczewski 


ciężkie  jony  Ciężkimi  jonami  nazywamy,  dosyć  umownie,  jony  (tzn. 

zjonizowane  atomy)  pierwiastków  cięższych  od  helu, 
tj.  pierwiastków  o liczbie  atomowej  Z > 2.  Przyspie- 
szane w akceleratorach  do  różnych  energii,  znajdują 
one  zastosowanie  w wielu  dziedzinach  nauki  (głównie 
fizyka  jądrowa,  ale  także  atomowa,  ciało  stałe,  me- 
dycyna i in.)  oraz  techniki.  Jądra  ciężkich  jonów  roz- 
pędzane do  energii  o bardzo  szerokim  zakresie  — od 
niskich  do  bardzo  wysokich  — mogą  wywoływać 
w jądrach  tarczy  różnorodne  procesy,  trudne  lub  nie- 
możliwe do  osiągnięcia  za  pomocą  cząstek  lżejszych, 
jak  elektrony,  miony  czy  mezony,  a nawet  protony, 
deuterony  czy  jądra  helu.  Badanie  tych  procesów  do- 
starcza jedynej  w swoim  rodzaju  wiedzy  o jądrach, 
ich  strukturze  i przemianach. 

Konieczność  przyspieszania  jonów  sprawia,  że 
rozwój  fizyki  ciężkich  jonów  jest  ściśle  związany 
z rozwojem  akceleratorów.  Pierwszą  wiązkę  jonów 
ciężkich  (węgla  12C)  — o natężeniu  jeszcze  bardzo 
małym,  ale  wystarczającym  już  do  badania  niektó- 
rych reakcji  jądrowych  — otrzymano  w 1950  r. 
w USA  (Berkeley).  Był  to  początek  zrazu  powolnego, 
a ostatnio  bardzo  burzliwego  rozwoju  fizyki  ciężkich 
jonów.  Obecnie  potrafimy  już  przyspieszać  jony 
wszystkich  pierwiastków,  a budowa  coraz  większych 
akceleratorów  umożliwia  przyspieszanie  ich  do  coraz 
wyższych  energii  i z coraz  większym  natężeniem 
wiązki  (->  Akceleratory). 

Szybki  i bardzo  wszechstronny  rozwój  fizyki  cięż- 
kich jonów  sprawia,  że  z pomocniczej  uprzednio  tech- 
niki zaczyna  ona  wyrastać  na  samodzielny  i ważny 
dział  fizyki  jądrowej.  Wydaje  się,  że  w najbliższych 
latach  będzie  to  jeden  z działów  najbardziej  dyna- 
micznych i bogatych  w wyniki. 


Do  tych  kilku  uwag  dodajmy  następującą  uwagę 
terminologiczną.  Ponieważ  w reakcjach  jądrowych 
powłoka  elektronowa  jonu  nie  odgrywa  prawie 
żadnej  roli,  przeto  gdy  w fizyce  jądrowej  mówimy 
o ciężkim  jonie  czy  reakcji  z nim,  mamy  z reguły  na  my- 
śli samo  jego  jądro  czy  odpowiednio  reakcję  z tym 
jądrem.  Skrótu  tego  nie  używa  się  w innych  działach 
fizyki,  gdzie  powłoka  elektronowa  jonu  jest  istotna. 

Reakcje  wywołane  przez  ciężkie  jony  mają  kilka  cech 
szczególnych,  wyróżniających  je  spośród  innych  reakcji 
jądrowych.  Cechy  te  decydują  w dużej  mierze  o zna- 
czeniu reakcji.  Wymienimy  główne  z nich: 

1)  Duży  ładunek  elektryczny  jądra  jonu.  Daje  to 
możliwość  oddziaływania  na  jądro  tarczy  silnym  po- 
lem elektrycznym  (wzbudzenie  kulombowskie  — 
patrz  niżej).  Pozwala  także  na  utworzenie,  choćby 
na  krótko  (mianowicie  na  okres  czasu,  w którym 
jądra  ciężkiego  jonu  i tarczy  przebywają  w bezpo- 
średnim sąsiedztwie),  układu  o bardzo  dużym  ładunku. 
Dostarcza  to  szansy  zbadania  powłoki  elektronowej 
odpowiadającej  jądru  o ładunku,  którego  nie  można 
otrzymać  w inny  sposób  (atomy  superciężkie). 

2)  Duża  masa  jonu.  Zderzenia  jąder  o dużej  masie 
umożliwiają  przekazanie  z jednego  jądra  do  drugiego 
wielu  nukleonów,  lub  wymianę  ich  między  jądrami. 
Oznacza  to  możność  wytwarzania  nuklidów  znacznie 
różniących  się  od  naturalnych  lub  wytwarzanych 
w reakcjach  z lekkimi  cząstkami  (nuklidy  o dużym  nie- 
domiarze lub  nadmiarze  neutronów,  nuklidy  bardzo 
ciężkie  lub  nawet  superciężkie). 

3)  Duży  pęd  jonu.  Wskutek  tego  duży  jest  także 
pęd  przekazany  produktom  reakcji,  co  z kolei  sprawia, 
że  produkty  te  „wybijane”  są  z tarczy  i mogą  być 
niemal  natychmiast  poddane  badaniom.  Jest  to 
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szczególnie  ważne  przy  badaniu  produktów  krótko- 
życiowych.  Duża  prędkość  produktów  umożliwia 
także  stosowanie  wielu  specjalnych  technik  detekcyj- 
nych i identyfikacyjnych  (np.  wykorzystujących  ana- 
lizatory magnetyczne  z selektorem  prędkości,  które 
pozwalają  na  określenie  zarówno  masy,  jak  i ładunku 
produktu,  czy  też-  detektorów  śladowych). 

4)  Duży  moment  pędu  jonu  względem  jądra  tarczy. 
Pozwala  on  na  wytwarzanie  jąder  złożonych  w stanach 
o dużym  momencie  pędu  (spinie).  Badanie  jądra 
w takim  stanie  umożliwia  poznanie  wpływu  szybkości 
obrotu  jądra  na  jego  strukturę  i własności. 

Duże  pędy  i momenty  pędu  występujące  w reak- 
cjach z ciężkimi  jonami  pozwalają  przy  tym  na  korzy- 
stanie w dużej  mierze  z klasycznego  i półklasycznego 
ich  opisu. 


Rodzaje  reakcji  z ciężkimi  jonami 
i ich  mechanizm 


O przebiegu  procesu  zderzenia  ciężkiego  jonu  1 z jąd- 
rem tarczy  2 decyduje  kilka  wielkości.  Są  to  (rys.  1): 
liczby  atomowe  Zu  Z2  obu  jąder  (a  więc  i ładunki 


Zi,  /4i 


przedłużeniem  wektora  pędu  czy  prędkości  począt- 
kowej padającego  jonu.  Na  przykład  b = 0 oznacza, 
że  jon  pada  wprost  na  jądro  tarczy  (tzw.  zderzenie 

czołowe).  Łącznie  z wektorem  p parametr  zderzenia 
określa  moment  pędu  jonu  względem  jądra  tarczy, 

r=  FxK  który  jest  zachowany  w czasie  całego  pro- 
cesu zderzenia. 

Liczby  Z,  i Z2  razem  z liczbami  masowymi  Ax  i A2y  bariera 
które  określają  wymiary  jąder  (->  Jądra  atomowe  kuSombo- 
i ich  wzbudzenia),  wyznaczają  wartość  bariery  po-  wska 
tencjału  między  jonem  i jądrem  tarczy.  Pochodzenie 
bariery  wyjaśnia  schematycznie  rys.  2.  Z rys.  2a 
widać,  że  potencjał  składa  się  z dwu  części : długoza- 
sięgowej,  dodatniej  Ł/kui(r),  opisującej  odpychanie 
elektrostatyczne  (kulombowskie)  między  jądrami, 
oraz  krótkozasięgowej,  ujemnej  Uj(r)y  opisującej 
przyciąganie  czysto  jądrowe  (— ► Siły  jądrowe).  Wobec 
krótkiego  zasięgu  sił  jądrowych  przyciąganie  wystę- 
puje dopiero  przy  bardzo  małej  odległości  między 
jądrami,  niemal  wtedy,  gdy  „stykają  się”  one  swoimi 
powierzchniami.  Jest  jednak  silniejsze  od  odpychania 
kulombowskiego,  toteż  nałożenie  obu  oddziaływań 
daje  barierę  potencjału  (barierę  kulombowską)  przed- 
stawioną na  rys.  2b.  Jest  to  ta  sama  bariera,  którą 
musi  pokonać  cząstka  naładowana  w procesie  od- 
wrotnym do  opisywanego  tutaj  (tzn.  w procesie  wy- 
dostania się  z jądra),  np.  cząstka  a przy  rozpadzie  a 
(-*  Rozpady  jąder  atomowych).  Jeśli  przynajmniej 
jedna  ze  zderzających  się  cząstek  nie  jest  naładowana 
elektrycznie  (np.  neutron),  bariera  taka  nie  istnieje. 

Wysokość  bariery  kulombowskiej  można  łatwo 
obliczyć.  Zgodnie  z rys.  2 


z2l  A 2 

Rys.  1.  Wielkości  charakteryzujące  zderzenie  ciężkiego  jonu  1 
z jądrem  tarczy  2 

Zxe  i Z«ey  gdzie  e — ładunek  protonu),  ich  liczby 
masowe  Aly  A2y  pęd  p lub  energia  Z padającego  jonu 
(jądro  tarczy  na  początku  procesu  zderzenia  spoczy- 
wa) oraz  parametr  zderzenia  b.  Parametr  ten  jest 
odległością  środka  jądra  tarczy  od  prostej  będącej 


Zkui  = U(R)  = 


(Z1e)(Z2e) 

R 


(1) 


gdzie  R jest  (w  przybliżeniu)  odległością  między 
środkami  jąder  przy  ich  „zetknięciu”,  a więc  sumą 
ich  promieni 

R x Ri+Ri  = ra(A{l*+All*).  (2) 

We  wzorze  (2)  r„=  1,3-1 ,5  fm.  Ponieważ  energię 


\ 


a) 


Rys.  2.  Objaśnienie  pochodzenia  bariery  kulombowskiej  (a)  oraz 
wykres  bariery  (b) 


padającego  jonu  podaje  się  zwykle  w przeliczeniu  na  energia  aa 
jeden  jego  nukleon,  tzn.  E/Al9  wygodnie  jest  barierę  pokonanie 
kulombowską  podawać  również  w takim  przeliczę-  bariery 
niu,  tzn.  Eku\/Aly  a zamiast  podawać  samą  barierę 
kulombowską  ZkuiMi  lepiej  podać  energię  E^JAU 
jaką  ciężki  jon  musi  mieć  w układzie  laboratoryjnym, 
by  mógł  pokonać  barierę  kulombowską  jąder  tarczy. 

Energia  E]£§  jest  barierą  kulombowską  Ekui  powięk- 
szoną o energię  ruchu  środka  masy.  Na  rys.  3 podane 
są  dwie  krzywe  przedstawiające  E\^JA1  w funkcji  Ax: 
gdy  Z2  = Z*  oraz  gdy  Z2  = 92.  W drugim  wypadku 
tarcza  wykonana  jest  z najcięższego  pierwiastka 
występującego  w naturze,  tzn.  z uranu.  Wartości 
E&iJA1  zawarte  między  obiema  krzywymi  wyczer- 
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pują  zatem  niemal  wszystkie  kombinacje  2X  i Z2, 
jakie  mogą  występować  (ze  względu  na  symetrię 
wzoru  (1)  przy  zamianie  Zx  i Z2  można  rozważać  tylko 
wypadek,  gdy  Z2  > Zx).  Z rys.  3 wynika  np.,  że  przy 
zderzeniu  C + C (węgiel  z węglem)  wystarczy  energia 
ok.  1 MeV/nukIeon,  by  jony  węgla  mogły  pokonać 
barierę  kulombowską,  podczas  gdy  w reakcji  C+U 
(węgiel  z uranem)  trzeba  już  ponad  5 MeV/nukleon. 
Energia  zaś  E{AX  = 6-7  MeV/nukleon  wystarcza 
w zasadzie  do  pokonania  każdej  bariery  kulombow- 
skiej. 

Obecność  bariery  kulombowskiej  w zderzeniach 
ciężkiego  jonu  z jądrami  narzuca  podział  tych  zderzeń 
na  dwie  zasadnicze  klasy:  zderzeń  podbarierowych, 
zderzenia  gdy  E < JSkui,  i nadbarierowych,  gdy  E > Zkui. 
podbarie-  W pierwszym  wypadku  jon  o energii  E może  się  zbli- 
rowe  żyć  do  jądra  najwyżej  (przy  zderzeniu  czołowym)  na 
odległość  d>  R (rys.  2b),  może  więc  spowodować 
tylko  proces,  w którym  występuje  oddziaływanie 
kulombowskie  (elastyczne  rozpraszanie  kulom bowskie 
zderzenia  i wzbudzenie  kulombowskie),  a nie  jądrowe.  W wy- 
nadbarie-  padku  drugim  jon  może  pokonać  barierę  kulombow- 
rowe  ską,  dostaje  się  wtedy  do  obszaru  oddziaływania 
jądrowego  i powoduje  różnorodne  reakcje  jądrowe. 

Ze  względu  na  dużą  rozpiętość  energii  ciężkich 
jonów  dogodnie  jest  wydzielić  przynajmniej  trzy  za- 
kresy: energii  niskich,  pośrednich  i wysokich.  Od- 
powiadające tym  zakresom  procesy  są  bardzo  różne. 

Niskie,  to  energie  do  ok.  10  MeV/nukleon,  a więc 
energie  zarówno  podbarierowe,  jak  i nadbarierowe, 
ale  niezbyt  odległe  od  wartości  bariery  kulombows- 
kiej. Ten  zakres  energii  jest  najlepiej  zbadany,  ponie- 
waż większość  obecnych  akceleratorów  przyspiesza 
jony  do  takich  właśnie  energii.  Wysokie,  to  energie 
od  kilkuset  do  kilku  tysięcy  MeV/nukleon.  W tym 
zakresie  jest  na  razie  stosunkowo  mało  wyników 
doświadczalnych.  Wreszcie  w zakresie  energii  po- 
średnich brak,  jak  dotąd,  wyników  doświadczalnych. 
Jedynie  pod  względem  teoretycznym  jest  on  w pew- 
nym stopniu  opracowany. 

Zgodnie  z tym  stanem  rzeczy  najbardziej  szczegó- 
łowo omówimy  zakres  energii  niskich. 


Energie  niskie 

Przy  energii  nadbarierowej  rodzaj  procesu  wywoła- 
nego ciężkim  jonem  zależy  w istotny  sposób  od  war- 
tości parametru  zderzenia  b.  Przy  niskiej  energii 
mogą  zajść  następujące  procesy  (rys.  4): 

a)  Przy  dużych  wartościach  b,  mianowicie  gdy 
zderzenia  b > bm  (zderzenia  odległe),  jon  nie  dostaje  się  do 

odlegle  strefy  oddziaływania  jądrowego  i może  oddziaływać 
z jądrem  tylko  kulombowsko.  Przez  to  oddziaływanie 
może  on  doznać  jedynie  rozproszenia  elastycznego 
(w  którym  ani  jądro  tarczy,  ani  jon  nie  zostają  wzbu- 
dzone) lub  nieelastycznego  (w  którym  bądź  jądro 
tarczy,  bądź  jon,  bądź  też  jedno  i drugie  zostaje 
wzbudzone  — wzbudzenie  kulombowskie). 

b)  Przy  wartości  b x bm  jon  dostaje  się  zaledwie 
*,mu£nięoie"  na  granicę  oddziaływania  jądrowego;  zachodzi  wów- 


Rys.  4.  Różne  rodzaje  zderzeń  ciężkiego  jonu  J z jądrem  tarczy  T, 
w zależności  od  wartości  parametru  zderzenia  b : a)  elastyczne 
rozpraszanie  kulombowskie  (ERK)  i wzbudzenie  kulombowskie 
( WK ),  b)  reakcja  wprost  (R  fV),  c)  reakcja  głęboko  nieelastyczna 
{ROŃ),  d)  reakcja  przez  jądro  złożone  ( RJZ ) 
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czas  oddziaływanie  tylko  między  kilkoma  nukleonami 
na  powierzchni  obu  jąder.  Takie  zderzenie  „muśnię- 
cia” prowadzi  do  tzw.  reakcji  wprost,  lub  inaczej  — 
reakcji  bezpośrednich. 

c)  Przy  mniejszych  b zderzenie  ma  charakter  głęb- 
szy, więcej  nukleonów  jest  w nim  zaangażowanych. 
Następuje  przekazanie  znacznej  ilości  energii  i mo- 
mentu pędu  od  ruchu  względnego  do  wewnętrznych 
stopni  swobody  obu  jąder,  a także  wymiana  pewnej 
liczby  nukleonów  między  jądrami.  Takie  zderzenie 
nazywa  się  głęboko  nieelastycznym.  Jądra  po  zderze- 
niu (jądra  końcowe)  różnią  się  od  jąder  przed  zde- 
rzeniem (jądra  początkowe)  bardziej  niż  w reakcjach 
wprost. 

d)  Dopiero  przy  dostatecznie  małych  b energia 
i moment  pędu  ruchu  względnego  mogą  w pełni 
zostać  przekazane  wewnętrznym  stopniom  swobody. 
Powstaje  wówczas  układ  silnie  wzbudzony,  w którym 
energia  rozłożona  jest  między  wszystkie  nukleony. 
Mówimy,  że  zachodzi  synteza  (lub  fuzja)  zderzają- 
cych się  jąder  lub  że  zostaje  utworzone  jądro  złożone. 
Jądro  to  „zapomina”  niejako  o swojej  historii,  sposób 
jego  późniejszego  rozpadu  nie  zależy  od  sposobu  jego 
powstania. 

Omówimy  główne  cechy  i mechanizm  poszczegól- 
nych procesów. 

Elastyczne  rozpraszanie  kulombowskie,  zwane  tak- 
że rozpraszaniem  rutherfordowskim,  jest  najprost- 
szym z wymienionych  procesów.  Nie  następuje  tu 
żadna  zmiana  energii  ruchu  względnego  na  energię 
wewnętrzną  jąder.  Pod  wpływem  odpychania  kulom- 
bowskiego  jon  zostaje  odchylony  o kąt,  który  jest 
prostą  funkcją  energii  padania  E i parametru  zderze- 
nia b.  Wzór  na  różniczkowy  przekrój  czynny  rozpra- 
szania otrzymać  można  zarówno  na  gruncie  mecha- 
niki klasycznej,  jak  i kwantowej.  Jest  to  jeden  z nie- 
licznych wzorów,  które  w obu  wypadkach  są  iden- 
tyczne. Proces  rozpraszania  rutherfordowskiego  nie 
daje  jednak  prawie  żadnej  (oprócz  ładunku)  informacji 
o jądrach  tarczy. 

Wzbudzenie  kulombowskie  jest  nadal  stosunkowo 
jeszcze  prostym  i dobrze  zrozumianym  procesem; 
nie  występuje  w nim  bowiem  oddziaływanie  jądrowe. 
Jest  przy  tym  stosunkowo  łatwe  do  zrealizowania 
w praktyce  — stąd  szerokie  jego  stosowanie.  Przelot 
ciężkiego  jonu  w pobliżu  jądra  tarczy  poddaje  jądro 
silnemu  zmiennemu  polu  elektrycznemu  (siła  oddzia- 
ływania dochodzi  do  kilkudziesięciu  kG!);  pole  po- 
woduje dynamiczną  deformację  jądra  lub  (jeśli  ma 
ono  kształt  trwale  zdeformowany,  jak  np.  jądra 
obszaru  ziem  rzadkich  lub  aktynowców)  jego  obrót. 
Prowadzi  to  do  wzbudzeń  kolektywnych  typu  wibra- 
cyjnego (drgania)  lub  rotacyjnego  (obrót;  ->  Modele 
jądrowe).  Najłatwiej  zachodzą  wzbudzenia  kolek- 
tywne o niskiej  energii  i małej  multipolowości  (tzn. 
o małym  spinie),  głównie  kwadrupolowe  (spin  2). 
Łatwość  i jednocześnie  „czystość”  wzbudzeń  była 
powodem,  że  z zastosowaniem  ciężkich  jonów  zo- 
stały zbadane  stany  kolektywne  niemal  wszystkich 
dostępnych  jąder.  Wyznaczono  energie  stanów, 
prawdopodobieństwa  ich  wzbudzenia  (elektromagne- 
tycznego), spiny  i parzystości,  a więc  podstawowe 
wielkości  charakteryzujące  stan  wzbudzony  i jego 
relację  ze  stanem  podstawowym. 

Prawdopodobieństwo  wzbudzenia  kulombowskie- 
go  rośnie  ze  wzrostem  energii  padającej  cząstki, 
rośnie  też  szybko  ze  wzrostem  jej  masy.  Jeśli  np.  przy 
jakiejś  energii  prawdopodobieństwo  wzbudzenia  za 
pomocą  elektronów  jest  bardzo  małe,  to  za  pomocą 
protonów  o tej  samej  energii  jest  znaczne,  a za  pomo- 
cą ciężkiego  jonu  — duże.  Prawdopodobieństwo 
wzbudzenia  stanu  kolektywnego  przeciętnego  jądra 
z obszaru  ziem  rzadkich  jonem  16Ojest  kilka  tys.  razy 
większe  niż  protonem  — przy  takiej  samej  energii 
jonu  na  jeden  jego  nukleon  jak  energia  protonu.  Fakt 
ten  zdecydował  o powszechności  stosowania  ciężkich 
jonów  do  wzbudzania  kulombowskiego.  Pozwolił  on 
także  na  realizowanie  za  pomocą  ciężkich  jonów 
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wielokrotnego  (lub  wielostopniowego)  wzbudzenia 
kulombowskiego.  W procesie  tym  w czasie  prze- 
lotu jonu  w pobliżu  jądra  tarczy  jądro  doznaje  kilku 
kolejnych  wzbudzeń.  Rys.  5 podaje  przykład,  w któ- 
rym jądro  170Hf  doznaje  ośmiu  wzbudzeń,  a każde 
z nich  podwyższa  kolejno  jego  spin  o 2 i o pewną 
wartość  energii.  Stosując  odpowiednio  ciężkie  jony 
można  drogą  wielokrotnego  wzbudzenia  kulombow- 
skiego osiągać  bardzo  wysokie  spiny.  Należy  przy 
tym  zwrócić  uwagę,  że  prawdopodobieństwo  osiąg- 
nięcia stanu  4+  bezpośrednio  ze  stanu  04-  (wzbu- 
dzenie jednokrotne)  jest  znacznie  mniejsze  niż  po- 
średnio, przez  stan  2+  (wzbudzenie  dwukrotne).  Od- 
nosi się  to  tym  bardziej  do  stanów  o wyższym  spinie: 
można  je  osiągnąć  niemal  jedynie  drogą  wielokrot- 
nego („drabinkowego”)  wzbudzenia  kulombowskiego. 

Reakcje  wprost  są  procesami  szybkimi.  Czas  ich 
trwania  jest  rzędu  czasu  swobodnego  przelotu  jonu 
przez  obszar  silnego  (jądrowego)  oddziaływania 
z jądrem  tarczy,  a więc  ok.  10" 22  s.  Oddziaływanie 
następuje  między  kilkoma  tylko  nukleonami  na  po- 
wierzchni jąder;  reszta  nukleonów  nie  bierze  udziału 
w zderzeniu,  pozostają  one  tylko  jego  „obserwa- 
torami”. W konsekwencji  przekaz  energii  i momentu 
pędu  jest  nieduży.  Nieduża  jest  także  liczba  nukleo- 
nów, które  zostają  przekazane  z jednego  jądra  do 
drugiego. 

Reakcje  głęboko  nieelastyczne  obejmują  cały  za- 
kres między  reakcjami  wprost  a reakcjami  przez  jądro 
złożone.  Przekrój  czynny,  czyli  prawdopodobieństwo 
takich  reakcji,  rośnie  ze  wzrostem  energii  zderzenia 
oraz  ze  wzrostem  mas  zderzających  się  jąder.  Dość 
duże  wartości  przekroju  czynnego  otrzymuje  się, 
gdy  energia  jonu  przewyższa  barierę  kulombowską 
przynajmniej  o 1-2  MeV/nukleon,  a masy  jąder  są 
znaczne. 

Czas  trwania  reakcji  głęboko  nieelastycznej  mieści 
się  w szerokim  przedziale  10-22-10”18  s,  średnio  jest 
więc  rzędu  10”20  s.  W tym  czasie  zderzające  się  jądra 
zdążą  przejąć  dużą  część  energii  kinetycznej  i momentu 
pędu  ruchu  względnego  (dyssypacja  energii  i momen- 
tu pędu),  co  spowoduje  silne  ich  wzbudzenie  we- 
wnętrzne. 

Wyniki  doświadczalnych  badań  nad  reakcjami  głę- 
boko nieelastycznymi  sugerują  następujący  ich  prze- 
bieg (rys.  6).  Zderzające  się  jądra  wchodzą  w kontakt 

# 

Rys.  6.  Przebieg  reakcji  głęboko  nieelastycznej  (w  układzie  środka 
masy) : od  momentu  nalatywania  na  siebie  jąder,  przez  zlepienie 
się  i wirowanie  aż  do  rozerwania 


ze  sobą,  „zlepiają  się”  na  pewien  czas  (rzędu  10" 20  s), 
tworząc  wspólny  układ.  Połączenie  to  ma  jednak 
charakter  tylko  dynamiczny.  Czas  jego  trwania 
wystarcza  z reguły  do  pełnej  dyssypacji  energii  kine- 
tycznej radialnego  ruchu  względnego,  nie  wystarcza 
jednak  do  pełnej  dyssypacji  względnego  momentu 
pędu.  W rezulatacie  — po  wykonaniu  obrotu  o pe- 
wien kąt  siła  odśrodkowa  pochodząca  od  tej  części 
względnego  momentu  pędu,  która  nie  uległa  dyssy- 
pacji, rozrywa  zlepione  jądro  na  dwie  części.  Podczas 
połączenia  między  zlepionymi  jądrami  może  nastą- 
pić wymiana  znacznej  liczby  nukleonów. 

Z przedstawionego  mechanizmu  reakcji  głęboko 
nieelastycznych  widać,  że  badanie  ich  może  być  waż- 
nym źródłem  wiedzy  o wielkości  i naturze  efektów 
dyssypacyjnych  w jądrach. 

Przy  odpowiednio  małym  parametrze  zderzenia  b 
wartość  względnego  momentu  pędu  / jest  dostatecznie 
mała,  by  siła  odpychająca  (siła  odśrodkowa  plus 
siła  kulombowską),  działająca  na  jądra  w czasie  ich 
zetknięcia,  była  mniejsza  od  siły  jądrowej  przyciąga- 
jącej je  do  siebie.  Powstają  wtedy  warunki  do  utwo- 
rzenia przez  zderzające  się  jądra  układu  względnie 


trwałego.  Przy  utworzeni  i jego  zarówno  energia  ki- 
netyczna jak  i moment  pędu  ruchu  względnego  ule- 
gają całkowitej  dyssypacji  i zostają  rozłożone  między 
wszystkie  nukleony.  Mówi  się,  że  układ  jest  w rów- 
nowadze (termodynamicznej)  i nazywa  się  go  jądrem 
złożonym.  W jądrze  tym  zatarte  zostają  ślady  sposo- 
bu, w jaki  ono  powstało.  Ogólne  charakteryzujące  je 
wielkości,  jak  liczba  masowa  Ay  atomowa  Z,  energia 
wzbudzenia  i spin  nie  są  jednoznacznie  związane 
z tym  sposobem,  można  je  otrzymać  przy  zderzeniu 
wielu  różnych  par  jąder.  Tylko  te  wielkości,  a nie 
„zapomniany”  sposób  powstania,  mają  pewien,  sta- 
tystyczny w swoim  charakterze  wpływ  na  sposób 
rozpadu  jądra  złożonego.  Może  to  być  rozpad  przez 
emisję  lekkich  cząstek,  rozpad  y lub  rozszczepienie. 
Czas  tworzenia  się  jądra  złożonego  jest  rzędu  10" 17  s. 
W skali  czasu  procesów  jądrowych  jest  to  bardzo 
dużo,  ok.  stu  tysięcy  razy  dłużej,  niż  trwa  reakcja 
wprost. 

Badanie  warunków,  w jakich  może  powstać  jądro 
złożone,  ważne  jest  m.in.  dla  poznania  możliwości 
syntezy  jąder  bardzo  ciężkich. 

Granica  między  omówionymi  rodzajami  reakcji 
niskich  energii  nie  jest  ostra.  Przy  płynnej  zmianie 
takich  parametrów  reakcji  jak  parametr  zderzenia 
b czy  względny  moment  pędu  / Jeden  rodzaj  przechodzi 
pyłnnie  w drugi.  Tak  np.  na  rys.  7 podany  jest  wy- 


Rys.  7.  Wykres  prawdopodobieństwa  ai  zajścia  procesu  o danym 
względnym  momencie  pędu  /,  w zależności  od  / (por.  rys.  4). 


kres  przekroju  czynnego,  czyli  wykres  prawdopodo-  należność  a 
bieństwa  zajścia  różnego  rodzaju  procesów  w za-  momentu 
leżności  od  /.  Przy  dużym  / zachodzi  elastyczne  roz-  pędu 
praszanie  kulom bowskie  ( ERK ) i wzbudzenie  kulom- 
bowskie  ( WK),  przy  mniejszym  — reakcje  wprost 
(RW)y  jeszcze  mniejszym  — reakcje  głęboko  nie- 
elastyczne (RGN),  a dopiero  przy  * wartościach  / 
mniejszych  od  pewnej  wartości  krytycznej  /kr  tworzy 
się  jądro  złożone  ( RJZ ).  Przy  przejściu  od  jednego 
obszaru  do  drugiego  prawdopodobieństwo  odpowied- 
niego procesu  zmienia  się  stopniowo,  płynnie  (na 
rysunku  linie  ciągłe).  Rysunek  7 przedstawia  w inny 
trochę  sposób  to  samo  w zasadzie  co  poglądowy 
rys.  4.  Moment  pędu  im  — pbm  (gdzie  p — pęd  pa- 
dającego jonu)  odpowiada  zderzeniom,  w których 
jądra  zaledwie  się  muskają  powierzchniami.  Rozdzie- 
la on  wszystkie  możliwe  zderzenia  na  dwie  klasy: 
zderzeń  bliskich  i zderzeń  odległych. 


Energie  pośrednie 

Przy  wzroście  energii  jonu  rośnie  rola  procesu  bez-  proces 
pośredniego  wybijania  ze  zderzających  się  jąder  duszenia 
małych  lub  większych  ich  fragmentów  (proces  kru- 
szenia lub  fragmentacji). 

Oczekuje  się,  że  w pewnym  zakresie  energii,  właści- 
wym już  dla  obszaru  procesów  kruszenia,  wystąpi 
bardzo  charakterystyczny  proces,  inny  niż  omówione 
dotychczas.  Mianowicie,  przy  energii  większej  od  ok. 

20  MeV/nukleon  ciężki  jon  może  wywołać  w jądrze 
tarczy  falę  uderzeniową.  Byłaby  to  fala  zgęszczenia 
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materii  jądrowej,  analogiczna  do  fali  uderzeniowej 
w cieczy  lub  gazie.  Jeden  z możliwych  obrazów  roz- 
chodzenia się  takiej  fali  w jądrze  238U  uderzonym 


Rys.  8.  Rozchodzenie  się  fali 
uderzeniowej  w jądrze  ,,8U 
uderzonym  jonem  lłO 


jonem  ieO  przedstawia  rys.  8.  Czoło  fali,  biegnące 
z prędkością  większą  od  szybkości  „dźwięku”  w ma- 
terii jądrowej  jądra  238U  (określonej  przez  jej  ściśli- 
wość), oddziela  „chłodną”  część  jądra  od  silnie  „na- 
grzanej” (wzbudzonej).  Z geometrii  procesu  widać, 
że  emitowane  z „gorącego”  obszaru  cząstki  (nukleo- 
ny, deuterony,  3He,  4He  i cięższe)  wylatywałyby 
głównie  na  boki,  co  by  świadczyło  o obecności  fali. 
jądra  Zagadnienie  występowania  fali  uderzeniowej  w jąd- 
superg'ęsta  rach  związane  jest  z problemem  jąder  supergęstych, 
przewidywanych  przez  teorię.  Oczekuje  się  miano- 
wicie, że  oprócz  znanych  jąder  o normalnej  gęstości 
mogą  występować  jądra  o gęstości  znacznie  większej 
(ok.  dwóch  razy).  Wytworzenie  fal  uderzeniowych 
w materii  jądrowej  mogłoby  być  pomocne  w otrzy- 
maniu takich  jąder.  Dotychczas  jednak  nie  stwier- 
dzono istnienia  tych  fal  i nie  wiadomo,  czy  można 
je  wytworzyć  w jądrze  ani  też,  czy  można  by  za  ich 
pomocą  otrzymać  jądra  supergęste. 


Energie  wysokie  (relatywistyczne) 

Obecnie  wytwarza  się  już  wiązki  ciężkich  jonów  (20Ne) 
o energii  w zakresie  ok.  250-2000  MeV/nukleon. 
Taka  energia  kinetyczna  jest  zbliżona  lub  nawet 
znacznie  większa  od  energii  spoczynkowej  jonu  (wy- 
noszącej ok.  940  MeV/nukleon),  przeto  do  opisu 
ruchu  należy  stosować  mechanikę  relatywistyczną; 
stąd  nazwa  „energie  relatywistyczne”. 

Przeprowadzone  dotychczas  badania  reakcji  jonu 
20Ne  z jądrami  tarczy  uranowej  sugerują  następujący 
przebieg  procesu  (rys.  9).  Padający  jon  wybija  w jąd- 


Rys.  9.  Przebieg  zderzenia  jonu  *°Ne  o relatywistycznej  energii 
z jądrem  uranu.  Padający  jon  wybija  w jądrze  tarczy  rów.  Części 
jąder  z obszaru  zderzenia  poruszają  się  po  zderzeniu  jako  silnie 
wzbudzony,  „ognisty”  kawałek  materii  jądrowej,  którego  frag- 
menty rozlatują  się  na  wszystkie  strony.  Pozostałe  części  jąder 
są  „chłodnymi”  obserwatorami  zderzenia 

wybijanie  rze  uranu  „rów”  lub  „tunel”.  Ta  część  jądra,  która 
„ognistych"  nie  leżała  na  drodze  jonu,  pozostaje  „chłodnym” 
kawałków  obserwatorem  zderzenia.  Podobnie  część  jonu,  która 
nie  napotkała  jądra  tarczy,  pozostaje  „chłodna”,  mało 
wzbudzona  i kontynuuje  swój  ruch  z nie  zmienioną 
prędkością  początkową.  Tylko  ta  część  materii, 
która  się  znalazła  dokładnie  w obszarze  zderzenia, 
biegnie  z odpowiednio  mniejszą  prędkością  jako 
„gorący”,  bardzo  silnie  wzbudzony,  „ognisty”  — 
jak  się  często  mówi  — kawałek  pokruszonej  materii 
jądrowej.  Rozlatują  się  z niego  na  wszystkie  strony 
nie  powiązane  już  ze  sobą  jego  fragmenty  — głównie 


nukleony,  lecz  także  deuterony,  jądra  3He,  4He  oraz 
jądra  cięższe. 

Z obrazu  tego,  zgodnego  z wynikami  doświadczenia, 
widać,  jak  bardzo  różny  jest  ten  proces  od  procesu 
wzbudzenia  kulombowskiego,  od  reakcji  wprost  czy 
nawet  reakcji  głęboko  nieelastycznych,  które  zacho- 
dzą przy  energiach  niskich  i które  są  reakcjami  dwu- 
ciałowymi  albo  dokładnie  (wzbudzenie  kulombow- 
skie),  albo  w dobrym  przybliżeniu  (reakcje  wprost 
i reakcje  głęboko  nieelastyczne).  Dwa  silnie  wzbudzo- 
ne w tych  reakcjach  jądra  końcowe  mogą  się  rozpadać 
dopiero  po  pewnym  czasie  od  momentu  zderzenia 
emitując  na  ogół  niewiele  lekkich  cząstek  lub  kwan- 
tów y,  lub  rozszczepiając  się.  W omówionej  zaś  reakcji 
wysokiej  energii  sam  pierwotny  proces  jest  od  razu 
wielociałowy. 


Zastosowanie  w fizyce  jądrowej 


Jedno  z pierwszych  ważnych  rodzajów  zastosowania 
ciężkich  jonów  w fizyce  jądrowej  — wzbudzenie  ku- 
lombowskie  — omówione  zostało  w poprzednim  pa- 
ragrafie. Tutaj  opiszemy  kilka  dalszych,  które  wraz 
z nim  zdecydowały  i nadal  decydują  o rozwoju  fizyki 
ciężkich  jonów. 


Otrzymywanie  i badanie  jąder  dalekich 
od  ścieżki  trwałości  [S 

Reakcje  z ciężkimi  jonami  są  bardzo  skuteczną  me- 
todą otrzymywania  jąder  dalekich  od  ścieżki  trwałości 
P (-*  Jądra  atomowe  i ich  wzbudzenia).  Jądra  te  otrzy- 
mywane są  zarówno  w reakcjach  przez  jądro  złożone, 
jak  i w procesie  przekazu  (transferu)  nukleonów  w re- 
akcji wprost  czy  reakcji  głęboko  nieelastycznej.  W obu 
tych  procesach  lekkie  jony  nie  pozwalają  odejść  dale- 
ko od  ścieżki  trwałości  i dopiero  jony  ciężkie  dają 
taką  możliwość.  Na  przykład  w reakcjach  przez  jądro 
złożone  z cząstkami  a,  T( a,  xri),  liczba  emitowanych 
neutronów  jest  mała  i możemy  się  oddalić  od  ścieżki 
tylko  o parę  jednostek  masy.  Zapis  T( a,  xn ) oznacza 
tutaj,  że  jądro  złożone  utworzone  jest  przez  naświetla- 
nie tarczy  T cząstkami  a i,  silnie  wzbudzone,  emituje 
następnie  x neutronów  n. 

Rozpatrzymy  najpierw  proces  przez  jądro  złożone. 
W wytwarzaniu  jąder  dalekich  od  ścieżki  trwałości 
wykorzystujemy  fakt,  że  im  cięższe  jest  jądro  na  ścież- 
ce, tym  większy  ma  stosunek  liczby  neutronów  N do 
protonów  Z.  Tak  np.  w jądrach  łJO,  4JCa  i 2S§Pb 
stosunek  ten  wynosi  odpowiednio  8/8  = 1,00, 
24/20=  1,20  i 126/82  ^ 1,54.  Oznacza  to,  że  na 
mapie  nuklidów,  tzn.  we  współrzędnych  (N,  Z),  ścież- 
ka trwałości  odchyla  się  od  przekątnej  coraz  silniej 
w kierunku  osi  N.  Fakt  ten  ilustruje  (nieco  przesad- 
nie) rys.  10,  z którego  widać,  że  synteza  jonu  J 
z jądrem  tarczy  T zawsze  prowadzi  do  jąder  neutro- 
nodeficytowych,  tzn.  mających  za  mało  neutronów 
w stosunku  do  odpowiadającego  im  izotopu  trwałego. 
Deficyt  neutronów  jest  tym  większy,  im  cięższy  jest 


jądro 

złożone 
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jon  J i jądro  tarczy  T.  Pogłębia  go  jeszcze  fakt,  że 
silnie  wzbudzone  jądro  złożone  JZ  emituje  kilka 
neutronów  (a  nie  protonów,  którym  utrudnia  taką 
emisję  bariera  kulombowska)  przed  przejściem  do 
stanu  podstawowego.  W rezultacie,  w procesie  przez 
jądro  złożone  można  osiągnąć  nuklidy  o deficycie 
kilkunastu  (do  ok.  20)  neutronów,  zbliżając  się  w ten 
sposób  do  linii  zerowej  energii  wiązania  protonu 
(— ► Jądra  atomowe  w stanach  ekstremalnych). 

Z rys.  10  widać  także,  że  w procesie  rozszczepienia, 
który  jest  pod  wieloma  względami  odwrotny  do  syn- 
tezy, rzecz  przedstawia  się  odwrotnie.  Dwa  np. 
równe  produkty  (fragmenty)/7  rozszczepienia  jądra  R 
są  neutrononadmiarowe.  Nadmiar  neutronów  może 
wynosić  kilkanaście,  do  ok.  20,  podobnie  jak  niedo- 
miar przy  syntezie.  Samorzutnie  rozszczepiają  się 
jedynie  jądra  ciężkie  o A « 240,  dając  produkty 
głównie  w obszarze  mas  A « 100  i A « 140.  Pobu- 
dzone jednak  ciężkimi  jonami,  mogą  się  także  roz- 
szczepiać jądra  znacznie  lżejsze,  dając  odpowiednio 
znacznie  lżejsze  produkty  rozszczepienia  F.  Dzięki 
ciężkim  jonom  możemy  więc  wytwarzać  jądra  neutro- 
nonadmiarowe F niemal  wzdłuż  (poniżej)  całej  ścieżki 
trwałości  /i. 

proces  Za  pomocą  procesu  transferu  nukleonów  osiągnię- 
transferu  to  również  wiele  nuklidów  dalekich  od  ścieżki  trwa- 
łości ; przede  wszystkim  wśród  lekkich  jąder  neutro- 
nonadmiarowych.  Przykładem  są  reakcje: 

*UTh+1fN  -*  *JSPu+lłLi, 

22§Th-f  “Ne  - 2*>Th-f-5SNe, 

2|2Th+JJNe  - 25?U+240. 

Pierwsza  z nich  — to  reakcja  zdarcia  4 protonów 
z jądra  l?N,  druga  — przechwytu  4 neutronów  przez 
jądro  2JNe,  trzecia  — zdarcia  2 protonów  i prze- 
chwytu 4 neutronów  przez  to  jądro. 

W taki  właśnie  sposób  osiągnięto  granicę  trwałości 
jąder  względem  emisji  neutronu  (czyli  linię  zerowej 
energii  wiązania  neutronu)  dla  kilku  najlżejszych 
pierwiastków:  H,  He,  Li,  Be  i B.  Przyczyniło  się  to 
do  poprawienia  wzorów  masowych  dla  lekkich  jąder. 
Uprzednio  wzory  te  przewidywały,  że  jądra  lJLi, 
14Be,  *|B  i 2JC  są  nietrwałe  ze  względu  na  emisję 
neutronu.  Po  doświadczalnym  otrzymaniu  ich  jednak 
w reakcjach  transferu  przekonano  się,  że  tak  nie  jest. 

Niełatwym  technicznie  problemem  jest  badanie 
własności  jąder  położonych  z dala  od  ścieżki  trwa- 
łości f$.  Jądra  te  mają  bowiem  bardzo  krótkie  czasy 
życia  i pomiary  należy  wykonywać  możliwie  jedno- 
cześnie z ich  wytwarzaniem.  Rozwiązuje  się  to  przez 
ustawienie  seperatora  izotopów  oraz  detektorów 
bezpośrednio  lub  prawie  bezpośrednio  „na  wiązce” 
cząstek  wywołujących  reakcję. 


Synteza  ciężkich  pierwiastków 

Wszystkie  pierwiastki  transuranowe,  tzn.  pierwiastki 
leżące  w tablicy  Mendelejewa  za  uranem  (Z  > 92), 
otrzymano  sztucznie.  W naturze  one  nie  występują, 
gdyż  czas  ich  życia  (czas  połowicznego  rozpadu) 
jest  znacznie  mniejszy  od  wieku  Ziemi.  Większość 
synteza  z nich  otrzymano  po  raz  pierwszy  w reakcjach  z jo- 
trarcs-  nami.  Mianowicie  pluton  (Z  = 94)  otrzymano  w reak- 
uranowców  cjachzdeuteronami,akiur  (Z  = 96),  berkel(Z  = 97), 
kaliforn  (Z  = 98)  i mendelew  (Z  = 101)  — w reak- 
cjach z cząstkami  a (tzn.  jądrami  4He).  Dalszych 
pierwiastków  nie  można  było  już  otrzymać  za  pomocą 
lekkich  jonów,  gdyż  nie  dysponowano  i nadal  się  nie 
dysponuje  dostatecznymi  ilościami  pierwiastków 
cięższych  niż  einstein  do  sporządzenia  tarczy.  Ko- 
nieczne zatem  było  i jest  stosowanie  ciężkich  jonów. 
Tak  np.  nobel  otrzymano  w reakcjach 

•{{Cm+^C  -*  ip}No-f4Jrt, 

291U-ł-2|Ne-,2S5No  + 6J«, 


a pierwiastek  o liczbie  atomowej  Z = 106,  ostatni 
z otrzymanych  dotychczas  — w reakcjach 

2iiCf+1880  ^fS|X+4i«, 

28°SPb+ltCr  - ?5SX+3  In 

(symbolem  X oznaczyliśmy  pierwiastki  nie  mające 
jeszcze  uzgodnionej  nazwy  lub  w ogóle  jeszcze  nie 
znane). 

Obecnie  trwają  próby  nad  syntezą  pierwiastków 
107  i 108  oraz  tzw.  pierwiastków  superciężkich.  Wed-  synteza 
ług  przewidywań  teoretycznych  pierwiastki  super-  paerwiast- 
ciężkie  powinny  tworzyć  wyspę  nuklidów  o podwyż-  ków  super- 
szonej  trwałości  wokół  nuklidu  2JSX,  miałyby  więc  ciężkich 
o ok.  40  nukleonów  więcej  niż  najcięższe  znane  do- 
tychczas jądro  (tj.  jądro  HIX;  o czasie  życia  0,9  s).  A 
zatem  i własnościami  prawdopodobnie  bardzo  by  się 
różniły  od  znanych  jąder,  wobec  czego  stanowią  nie- 
zwykle interesujący  obiekt  badań. 

Obecnie  próbuje  się  otrzymać  te  jądra  za  pomocą 
wiązki  jonów  48Ca,  np.  w reakcji 

25§Cm+2oCa  ->  8JX+2ł*. 

Duża  użyteczność  jonów  48Ca  polega  głównie  na 
dwóch  ich  własnościach.  Pierwsza  — to  że  są  one 
bogate  w neutrony,  co  pozwala  dostać  się  za  ich 
pomocą  stosunkowo  blisko  środka  wyspy  jąder  su- 
perciężkich, a więc  do  jąder  najtrwalszych.  Druga  — 
to  że  są  one  szczególnie  silnie  związane  (są  to  bowiem 
jądra  podwójnie  magiczne),  co  sprzyja  stosunkowo 
niskiej  energii  wzbudzenia  wytworzonego  za  ich  po- 
mocą jądra  superciężkiego.  Daje  to  większe  szanse 
przejścia  tego  jądra  do  stanu  podstawowego,  w któ- 
rym jest  najtrwalsze,  i uniknięcia  tym  samym  szyb- 
kiego rozpadu  ze  stanu  wzbudzonego. 


Wzbudzanie  stanów  o wysokim  spinie 

Duża  masa,  pęd,  a także  spore  rozmiary  ciężkiego 
jonu  sprawiają,  że  może  on  tworzyć  z jądrem  tarczy 
układ  o bardzo  dużym  momencie  pędu,  nieosiągalnym 
w reakcjach  z lżejszymi  cząstkami.  Na  przykład  jon 
20 Ne  o energii  10  MeV/nukleon  może  z jądrem  tar- 
czy197  Au  utworzyć  układ  o momencie  pędu  do  ok. 

110  jednostek  h . Dla  porównania — jon  deuteronu 
o tej  samej  energii  na  nukleon,  z takim  samym  jąd- 
rem 197 Au  może  utworzyć  układ  o spinie  tylko  do  ok. 

8 h. 

Interesujące  są  tu  dwa  zagadnienia.  Jedno  — to 
wyjaśnienie,  co  się  dzieje  z dużym  momentem  pędu 
ruchu  względnego,  jaka  jego  część  jest  przekazywana 
ruchowi  wewnętrznemu  zderzających  się  jąder  i jak 
szybko.  Jest  to  więc  zagadnienie  dyssypacji  momentu  dyssypacja 
pędu  ruchu  względnego  — zagadnienie  mechanizmu  momentu 
przekazywania  go  wewnętrznym  stopniom  swobody  pędu 
jąder. 

Z omówionego  wyżej  faktu  istnienia  spinu  krytycz- 
nego wynika,  że  przy  bardzo  dużym  momencie  pędu 
część  momentu  pędu,  która  nie  zdąży  ulec  dyssypacji 
w czasie  reakcji,  może  (wskutek  sił  odśrodkowych, 
które  wywołuje)  me  dopuścić  do  utworzenia  się  jądra 
złożonego.  Drugie  zagadnienie  dotyczy  własności  sa- 
mego jądra  złożonego.  Interesujący  jest  mianowicie 
wpływ  wysokiego  spinu  na  te  własności  i na  strukturę 
jądra.  Stwierdzono  np.,  że  już  przy  stosunkowo  nis- 
kich spinach  (12-16 h)  zachodzi  gwałtowna  zmiana 
momentu  bezwładności  jąder  zdeformowanych.  Zja- 
wisko to  wiąże  się  z rozrywaniem  par  nukleonów 
przez  szybki  obrót  jądra.  Niszczenie  korelacji  par  niszczeni© 
zwiększa  znacznie  moment  bezwładności  i spowalnia  korełacji 
przejścia  elektromagnetyczne  między  odpowiednimi  par 
stanami  rotacyjnymi.  Duży  spin  jądra  ma  także  istot- 
ny wpływ  na  sposób  jego  rozpadu.  Podwyższa  np. 
prawdopodobieństwo  emisji  cząstki  a w stosunku  do 
prawdopodobieństwa  emisji  pojedynczego  nukleonu, 
zwiększa  także  prawdopodobieństwo  rozszczepienia 
jądra. 
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Inne  zastosowania 


Omówimy  tu  tylko  kilka  spośród  wielu  zastosowań 
ciężkich  jonów  poza  fizyką  jądrową.  Będą  to  zasto- 
sowania ich  w dziedzinie  ciała  stałego,  techniki,  bio- 
logii i medycyny.  We  wszystkich  ważne  jest  oddzia- 
ływanie powłoki  elektronowej  jonu  z materią. 

Implantacja  ciężkich  jonów 

Naświetlanie  dowolnego  materiału  wiązką  ciężkich 
jonów  jest  bardzo  dogodnym  sposobem  wprowadza- 
nia („wbijania”,  implantacji)  atomów  dowolnego 
pierwiastka  do  materiału.  Takie  wprowadzanie  in- 
nych, domieszkowych  atomów  pozwala  zmienić  w 
bardzo  szerokim  zakresie  własności  fizyczne  materia- 
łu, szczególnie  elektryczne  i mechaniczne, 
prostota  b Dogodność  implantacji  polega  na  jej  prostocie 
uniwersał-  i uniwersalności.  W procesie  tym  nie  odgrywają  roli 
ność  metody  relacje  chemiczne  między  pierwiastkami  materiału 
naświetlanego  i implantowanego.  Możliwość  bardzo 
dobrego  ogniskowania  wiązki  ciężkich  jonów  (bar- 
dzo małe  jej  rozmiary  poprzeczne,  rzędu  1 mm, 
a niekiedy  nawet  1 jim)  oraz  dokładnego  doboru 
energii  jonów  (a  więc  dokładnego  doboru  głębokości 
ich  implantacji)  pozwala  na  precyzyjne  sterowanie 
geometrią  wprowadzanych  domieszek.  Dzięki  temu 
można  w naświetlanej  próbce  — nawet  przy  minia- 
turowych jej  rozmiarach  — wytwarzać  dosyć  złożone 
i jednocześnie  precyzyjne  struktury  geometryczne 
o kompleksowych  własnościach  elektrofizycznych. 
Ponadto,  implantację  można  przeprowadzać  przy 
stosunkowo  niskich  temperaturach,  a niepożądane 
uszkodzenia  struktury  naświetlanej  próbki  moż!na 
usunąć  przez  podgrzanie  do  niezbyt  wysokiej  tempe- 
ratury. Pozwala  to,  dzięki  uniknięciu  silnych  pod- 
grzewań,  wpływać  na  własności  próbki  w sposób 
dobrze  kontrolowany. 

zastosowanie  Jeśli  chodzi  o zastosowanie  implantacji  na  skalę 
na  skalę  przemysłową*  istotny  jest  fakt,  że  proces  ten  można 
przemysłową  całkowicie  zautomatyzować  i osiągać  prawie  dokładną 
powtarzalność  własności  wytwarzanych  materiałów. 
Stosując  implantację  uzyskuje  się  istotne  polepszenie 
własności  tranzystorów  i innych  układów  półprze- 
wodnikowych. Np.  naświetlanie  jonami  boru,  fosforu, 
tantalu  i in.  pierwiastków  znacznie  poprawia  własno- 
ści krzemowych  i germanowych  detektorów  półprze- 
wodnikowych, stosowanych  w fizyce  jądrowej, 
wytwarzanie  Implantacja  pozwala  także  na  wytworzenie  stopów 
nowych  0 niezwykłych  własnościach  mechanicznych  i ter- 
materiałów  micznych,  trudnych  lub  niemożliwych  do  wytworze- 
nia innymi  metodami.  Wymagane  własności  stopu 
Otrzymuje  się  najczęściej  już  przy  bardzo  nieznacz- 
nych dodatkach  odpowiednio  dobranych  domieszek. 
Zachęcające  są  wstępne  wyniki  stosowania  implan- 
tacji w badaniach  nad  zagadnieniem  wytwarzania 
nadprzewodników  wysokotemperaturowych.  Inte- 
resująca jest  też  możliwość  zastosowania  tej  metody 
do  wytwarzania  światłowodów  w układach  optyki 
zintegrowanej.  Światłowód  może  być  wykorzystywa- 
ny do  szybkiego  przekazywania  dużej  ilości  infor- 
macji. 

Modelowanie  uszkodzeń  radiacyjnych 
w materiałach  reaktorowych 

Szybkie  neutrony  emitowane  przy  rozszczepieniu 
jądrowym  w reaktorze  powodują  uszkodzenia  radia- 
cyjne w materiałach  konstrukcyjnych  reaktora. 
Wybijają  one  mianowicie  jądra  z zajmowanych  po- 
łożeń, wprowadzając  zmiany  w strukturze  materiału. 
Zmiany  takie  należy  uwzględnić  przy  projektowaniu 
reaktorów. 

Ponieważ  ciężki  jon  oddziałuje  z całym  atomem, 
a nie  tylko — jak  neutron  — z jądrem,  jest  on  setki 
tysięcy  lub  nawet  miliony  razy  efektywniejszy  w wy- 
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woływaniu  uszkodzeń  radiacyjnych.  Uszkodzenia 
powstające  w materiałach  reaktora  dużej  mocy  w cią- 
gu kilku  lat  jego  pracy  można  odtworzyć  w ciągu 
kilku  godzin  przez  naświetlanie  próbki  materiału 
wiązką  ciężkich  jonów.  Próbka  staje  się  przy  tym 
mniej  promieniotwórcza,  co  upraszcza  badanie.  Także 
łatwiejsza  i dokładniejsza  jest  kontrola  dawki  promie- 
niowania, temperatury  i innych  parametrów. 

Filtry  jądrowe 

Ciężkie  jony  mogą  być  wykorzystane  jako  „mikro- 
igły  przekłuwające”  cienką  folię  z materiału  plastycz- 
nego, szkła  czy  miki.  „Przekłucie”  jest  po  prostu 
uszkodzeniem  radiacyjnym,  które  po  odpowiedniej 
obróbce  chemicznej  staje  się  wąskim  kanalikiem, 
a cała  naświetlana  folia  — subtelnym  i precyzyjnym 
filtrem  (tzw.  filtr  jądrowy).  Średnica  kanaliku  zależy 
od  rodzaju  i energii  jonu,  materiału  folii  oraz  od 
warunków  obróbki  chemicznej.  Obecnie  uzyskuje 
się  filtry  jądrowe  o średnicy  porów  od  4 nm  do 
kilkudziesięciu  pm  (tj.  rzędu  10*  nm).  Rysunek  11 
pozwala  porównać  filtr  chemiczny  wysokiej  jakości 
z filtrem  jądrowym.  Widać,  że  pierwszy  ma  otwory 
o różnych  średnicach  i nieregularnych  kształtach, 
wskutek  czego  rozmiary  przepuszczanych  cząstek 
mają  duży  rozrzut.  Filtr  jądrowy  natomiast  ma  otwo- 
ry o jednakowej  niemal  średnicy  i o regularnym, 
kołowym  kształcie.  Ponadto  istnieje  możliwość  pra- 
wie ciągłej  zmiany  średnicy  w bardzo  szerokich,  jak 
podano  wyżej,  granicach. 


Rys.  1 1 . Zdjęcie  zwykłego  filtru  chemicznego  o średniej  efektyw- 
nej średnicy  pora  0,45  pm  (rys.  a)  oraz  filtru  jądrowego  o śred- 
nicy pora  0,40  pm  (rys.  b),  uzyskane  za  pomocą  mikroskopu 
elektronowego 


Filtry  jądrowe  mogą  być  wykorzystywane  np.  do 
zimnej  sterylizacji.  Ponieważ  bakterie  mają  roz- 
miary powyżej  0,5  pm,  można  je  łatwo  zatrzymać  już 
za  pomocą  filtrów  o średnicy  kanalików  0,45  pm. 


Zastosowanie  w medycynie 

radioterapia  Podstawowym  zastosowaniem  wiązki  ciężkich  jonów 
w medycynie  może  być  radioterapia,  przede  wszystkim 
niszczenie  komórek  nowotworowych.  Wielką  zaletą  tej 
wiązki  jest  to,  że  pozwala  ona  na  bardzo  dobrą  loka- 
lizację naświetlanego  obszaru  zarówno  w kierunku 
poprzecznym  (możliwość  bardzo  małych  rozmiarów 
wiązki),  jak  i podłużnym  (możliwość  naświetlania 
tkanki  niemal  wyłącznie  na  żądanej  głębokości). 
Można  więc  uniknąć  niszczenia  sąsiedniej,  zdrowej 
tkanki  w czasie  naświetlania.  Ani  stosowane  najczę- 
ściej w praktyce  promieniowanie  X i y , ani  strumienie 
elektronów  i neutronów  nie  dają  możliwości  dobrej 
lokalizacji  podłużnej.  Ilustruje  to  rys.  12,  na  którym 
porównane  są  rozkłady  dawki  (tj.  wydzielonej  e- 
nergii)  promieniowania  w wodzie  w funkcji  głębokości 
d przy  różnych  rodzajach  naświetlania:  promieniami 
y z 60Co,  neutronami  o energii  14,6  MeV,  mezonami 
7T"  o energii  65  MeV  i jonami  14N  o energii  278  MeV/ 
/nukleon.  Widać,  że  promieniowanie,  y i neutronowe 
nie  dają  w ogóle  możliwości  lokalizacji  podłużnej, 
wiązka  mezonów  n~  (i  podobnie  protonów)  daje  już 
niezłą  lokalizację,  ale  dopiero  wiązka  ciężkich  jonów 
pozwala  na  lokalizację  bardzo  dobrą. 
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stytucie Fizyki  Doświadczalnej  Uniwersytetu  Warszawskiego 
(sprawozdanie  z sympozjum),  Jabłonna  1972;  G.N.  Flerow, 
W.S.  Baraszenkow  Zastosowanie  wiązek  ciężkich  jonów.  Post. 
Fiz.  27,  53  (1976);  J.  Grabowski  Aktualny  stan  teorii  reakcji 
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Rys.  12.  Zależność  dawki  promieniowania  w wodzie  od  głębo- 
kości d,  na  której  jest  ona  pochłonięta,  przy  różnych  rodzajach 
promieniowania 


Spektroskopia  jądrowa 

Andrzej  Hrynkiewicz 


Wszystkie  dane  eksperymentalne  dotyczące  własności 
poziomów  jądrowych  oraz  charakteru  oddziaływań 
jądrowych  są  podstawą,  na  której  opierają  się  kon- 
cepcje struktury  jąder  atomowych.  Dane  te  można 
dane  podzielić  na  dwie  kategorie:  1)  parametry  statyczne 
statyczne  i stanów  jądrowych,  takie  jak  energie  wzbudzenia,  spi- 
dynamiczne  ny  i izospiny,  parzystości  i momenty  elektromagne- 
tyczne oraz  masy  i rozmiary  jąder,  2)  wielkości  cha- 
rakteryzujące dynamikę  procesów  jądrowych,  jak  cza- 
sy życia  i typy  rozpadu  oraz  przekroje  czynne  na  od- 
działy wanie  jąder  z cząstkami  naładowanymi,  neutro- 
nami i promieniowaniem  elektromagnetycznym. 

Każda  metoda  umożliwiająca  wyznaczanie  wielko- 
ści charakteryzujących  jądra  atomowe  jest  więc  meto- 
dą badania  ich  struktury.  Tutaj  omówimy  tylko  me- 
tody spektroskopii  jądrowej,  tj.  metody,  które  po- 
zwalają wyznaczyć  własności  jąder  promieniotwór- 
czych na  podstawie  emitowanego  promieniowania. 

W ciągu  wielu  lat  przedmiotem  badań  spektrosko- 
pii jądrowej  były  długożyjące  nuklidy  promienio- 
twórcze naturalne  lub  wytwarzane  sztucznie.  Długi 
czas  życia  nuklidów  pozwalał  transportować  te 
źródła  promieniotwórcze  z miejsca  ich  wytworzenia 
do  odległych  nieraz  laboratoriów  wyposażonych 
w urządzenia  spektroskopowe. 

Obecnie  większość  badań  spektroskopowych  wyko- 
nuje się  przy  użyciu  aparatury  pomiarowej  ustawio- 
nej przy  akceleratorach  lub  reaktorach  jądrowych 
(->  Akceleratory  cząstek  naładowanych,  Energia 
jądrowa),  co  pozwala  dokonywać  pomiary  bezpośred- 
nio „na  wiązce”,  tj.  badać  krótkożyjące  produkty 


reakcji  jądrowych.  Obiektami  badanymi  są  w tym  pomiary 
wypadku  jądra,  których  rozpad  następuje  przeważnie  „na  wiąże©" 
w czasie  krótszym  niż  1 ns  (10" 9 s). 

Spektroskopia  jądrowa  „na  wiązce”  rozszerzyła 
również  w sensie  jakościowym  zakres  badanych  sta- 
nów jądrowych.  Można  badać  stany  o bardzo  wyso- 
kiej energii  wzbudzenia  (niedostępne  w rozpadach 
promieniotwórczych)  oraz  jądra  mające  znaczny  nad- 
miar lub  niedobór  neutronów  (w  stosunku  do  nukli- 
dów występujących  w przyrodzie).  W pewnych 
eksperymentach  wykorzystywane  są  prędkości  od- 
rzutu produktów  reakcji  oraz  orientacja  ich  spinów 
względem  kierunku  lotu  bombardujących  cząstek. 

W pracach  spektroskopowych  „na  wiązce”  szcze- 
gólne znaczenie  ma  również  detekcja  i spektrometria 
cząstek  naładowanych  i neutronów  emitowanych 
w procesie  reakcji  jądrowej  prowadzącej  do  wytwo- 
rzenia interesującego  nas  nuklidu. 


Spektroskopia  elektronów 

Jądra  atomowe  emitują  elektrony  ujemne  lub  do- 
datnie w rozpadach  i (->  Rozpady  jąder  ato- 
mowych). Niezależnie  od  tego  elektrony  są  emitowa- 
ne z powłoki  elektronowej  atomu  albo  w wyniku  bez- 
pośredniego przekazania  im  energii  wzbudzenia  jądra, 
czyli  w procesie  konwersji  wewnętrznej  (elektrony 
konwersji)  lub  też  jako  tzw.  elektrony  Augera,  któ- 
rych emisja  towarzyszy  procesom  wytwarzającym 
dziury  w powłoce  elektronowej. 


14  - Encyklopedia  fizyki  współczesnej 
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widma  Podstawowym  zadaniem  spektroskopii  elektrono- 
Gfa&rg&tyczrse  wej  jest  wyznaczanie  widm  energetycznych  emitowa- 
elescSronów  nych  elektronów,  tj.  liczby  elektronów  w funkcji  ich 


a) 


Na  rys.  2 pokazany  jest  przekrój  nowoczesnego  spektrometr 
spektrometru  fi  — urządzenia  pozwalającego  rejestro- 
wać widma  energetyczne  elektronów.  Odpowiednie 
pole  magnetyczne  ogniskuje  na  detektorze  elektrony 
wylatujące  ze  źródła  (którym  może  być  tarcza  bom- 
bardowana przez  wiązkę  cząstek  z akceleratora).  Za- 
leżnie od  natężenia  pola  magnetycznego  do  detek- 
tora trafiają  elektrony  o różnej  energii.  Zmieniając 
natężenie  pola  magnetycznego  (przez  zmianę  na- 
tężenia prądu  zasilającego  elektromagnes)  możemy 
wyznaczyć  liczbę  elektronów  o różnych  określonych 
wartoścach  energii  czyli,  jak  mówimy,  „zdjąć”  ich 
widmo  energetyczne 

Typy  spektrometrów  fi  różnią  się  między  sobą  transmisja 
transmisją  i energetyczną  zdolnością  rozdzielczą,  i zdolno&ć 
Transmisją  nazywamy  stosunek  liczby  elektronów  rozdzielcza 
o danej  energii  docierających  do  detektora  do  liczby 
elektronów  o tej  energii  emitowanych  przez  źródło. 

W przypadku  spektrometrów  toroidalnych  transmisja 
może  przekroczyć  nawet  20%.  Zdolność  rozdzielcza 
dana  jest  przez  szerokość  (w  połowie  wysokości) 


energia  elektronów 

Rys.  1.  Przykłady  widm  energetycznych  elektronów,  a)  Widmo  ciągłe  elektronów  rozpadu  fi~  RaE,  b)  Widmo  liniowe  elektronów 
konwersji  wewnętrznej  izotopów  złota  wytworzonych  w reakcji  Pt(p,  xn)Au 


widmo  energii.  Na  rys.  1 pokazane  są  przykłady  widma  ciągłe- 
rozpadu  fi  B°  elektronów  rozpadu  fi  i widma  liniowego  elektro- 
nów konwersji  wewnętrznej.  W pierwszym  przypadku 
widmo  elektronów  jest  ciągłe,  gdyż  w rozpadzie  fi  e- 
misji  elektronu  towarzyszy  emisja  neutrina,  które  nie 
jest  rejestrowane,  a które  unosi  część  energii  rozpadu. 
Kraniec  widma  elektronów  fi  określa  energię  rozpadu, 
a z kształtu  widma  można  wyciągnąć  wnioski  dotyczą- 
ce typu  rozpadu,  np.  określić  tzw.  stopień  wzbronie- 
nia rozpadu  fi  i uzyskać  informację  o zmianie  spinu 
i parzystości  jądra  ulegającego  rozpadowi, 
widmo  Widmo  elektronów  konwersji  (rys.  Ib)  wygląda 
elektronów  zupełnie  inaczej  — jest  to  widmo  liniowe.  Poszczegól- 
kon wersji  ne  „piki”  w widmie  odpowiadają  dyskretnym  warto- 
ściom energii  emitowanych  elektronów.  Energia  elek- 
tronu konwersji  jest  dana  przez  wzór 

E = E0—Ewy 

gdzie  E0  — energia  przejścia  jądra  z wyższego  na 
niższy  poziom  energetyczny,  Ew  — energia  wiązania 
elektronu  na  danej  powłoce  w atomie.  Pomiar  ener- 
gii elektronów  konwersji  pozwala  znaleźć  energię 
przejścia  jądrowego  2?0,  a z natężenia  linii  konwersji 
(z  liczby  elektronów  w danym  piku)  można  wniosko- 
wać o konkurencji  między  konwersją  wewnętrzną 
a emisją  fotonu  promieniowania  y,  czyli  wyznaczyć 
tzw.  wyspółczynnik  konwersji  wewnętrznej.  Jego 
wartość  jak  również  stosunki  natężeń  elektronów 
konwersji  pochodzących  z różnych  powłok  elek- 
tronowych atomu  są  źródłem  informacji  o charakterze 
danego  przejścia  jądrowego  E0,  co  z kolei  także  do- 
starcza danych  o spinach  i parzystości  stanów  jądro- 
wych. 


Rys.  2.  Schemat  spektrometru  fi  z podłużnym  polem  magnetycz- 
nym. Oznaczenia:  Ci-C5  cewki  zasilające  elektromagnes,  /, 
i N s żelazne  jarzmo  i nabiegunniki,  L osłona  ołowiana,  S źró- 
dło promieniotwórcze  emitujące  elektrony,  G-M  licznik  elek- 
tronów Geigera-Mullera.  Liniami  przerywanymi  niebieskimi 
oznaczone  są  tory  elektronów  poruszających  się  po  spiralach 
wokół  osi  spektrometru 

piku  obserwowanego  w widmie,  odpowiadającego 
monocnergetycznym  elektronom  emitowanym  przez 
źródło.  Im  lepsza  jest  zdolność  rozdzielcza  spektrome- 
tru (tzn.  im  węższe  są  piki  w widmie),  tym  łatwiej  mo- 
żemy rozróżnić  dwie  linie  leżące  blisko  siebie.  Zdol- 
ność rozdzielcza  najbardziej  precyzyjnych  spektro- 
metrów osiąga  0,01%  mierzonej  energii  elektronów. 
Na  ogół  spektrometry  o dużej  energetycznej  zdol- 
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ności  rozdzielczej  mają  małą  transmisję  i odwrotnie  — 
dużej  transmisji  towarzyszy  niska  zdolność  roz- 
dzielcza, toteż  typ  przyrządu  pomiarowego  powinien 
być  dobierany  odpowiednio  do  problemu,  który  należy 
rozwiązać.  Obecnie  w wielu  eksperymentach  spektro- 
metry magnetyczne  są  zastępowane  półprzewodniko- 
wymi detektorami  elektronów,  które  szczególnie 
w obszarze  niskich  energii  elektronów  mają  zdolność 
rozdzielczą  porównywalną  ze  zdolnością  rozdzielczą 
spektrometrów  magnetycznych. 


Spektroskopia  promieniowania  y 

Widmo  promieniowania  y emitowanego  przez  jądra 
atomowe  jest  widmem  liniowym  (rys.  3),  gdyż  przej- 
ściu jądra  ze  stanu  wzbudzonego  na  niższy  odpowia- 
da emisja  fotonów  o określonej  energii.  Liniowe  jest 
również  widmo  promieniowania  rentgenowskiego, 
którego  emisja  towarzyszy  takim  procesom  jądrowym, 
jak  wychwyt  elektronu  lub  konwersja  wewnętrzna. 


Metoda  koincydencji  w spektroskopii 
jądrowej 

Przy  rozwiązywaniu  wielu  problemów  spektroskopii 
jądrowej  istotne  znaczenie  ma  informacja  o czaso- 
wych zależnościach  emisji  przez  jądro  różnego  rodzaju 
promieniowania.  Dobrym  tego  przykładem  może  być 
problem  wyboru  między  dwoma  wariantami  rozpadu 
jądra  przedstawionymi  schematycznie  na  rys.  4.  W obu 
wypadkach  w widmie  energetycznym  zaobserwujemy 
piki  odpowiadające  fotonom  y o energiach  Ex  i Ez 
i dopiero  stwierdzenie,  czy  emisja  fotonów  Ex  i E2  jest 
skorelowana  w czasie  (schemat  4a),  czy  też  nie  (sche- 
mat 4b),  umożliwia  rozstrzygnięcie,  według  którego 
schematu  przebiegał  rozpad.  Aby  stwierdzić,  czy  emisji 
fotonu  Ex  towarzyszy  (w  granicach  krótkiego  prze- 
działu czasowego)  emisja  fotonu  E2,  należy  wykonać 
pomiar  koincydencyjny.  Stosujemy  w tym  celu  dwa 
detektory  promieniowania  y,  z których  jeden  rejestruje 
fotony  o energii  Ex>  a drugi  — fotony  o energii  E2t 
następnie  impulsy  z obu  detektorów  kierujemy  do 


numer  kanału  analizatora 

Rys.  3.  Przykład  widma  energetycznego  promieniowania  y emitowanego  z tarczy  strontu  bombardowanej  jonami  *Li.  Liczby  nad  pikami 
podają  energię  przejść  y w keV 


Jednak  pod  pikami  w widmie  obserwuje  się  ciągłe  tło, 
którego  głównym  źródłem  jest  rozproszenie  promie- 
niowania na  elektronach  (przede  wszystkim  w zjawis- 
ku Comptona)  zachodzące  w detektorze  lub  w otacza- 
jących go  materiałach. 

W spektrometrach  y stosowane  są  detektory  reje- 
strujące poszczególne  fotony  i wytwarzające  impulsy 
elektryczne,  których  amplituda  jest  proporcjonalna 
do  energii  pochłoniętego  fotonu.  Widmo  energe- 
tyczne promieniowania  y,  takie  jak  pokazane  przykła- 
dowo na  rys.  3,  otrzymuje  się  za  pomocą  analizatora 
wielokanałowego,  który  sortuje  impulsy  zależnie  od 
ich  amplitudy. 

Najpowszechniej  stosowanymi  detektorami  pro- 
mieniowania y są  detektory  półprzewodnikowe,  prze- 
de wszystkim  germanowe,  które  w porównaniu  ze 
stosowanymi  poprzednio  licznikami  scyntylacyjnymi 
mają  znacznie  lepszą  (ponad  20-krotnie)  energetyczną 
zdolność  rozdzielczą.  Szerokość  piku  uzyskiwanego 
za  pomocą  dobrego,  dużego  detektora  germanowego 
wynosi  2-3  keV,  co  daje  w obszarze  mierzonych  ener- 
gii kilku  MeV  względną  zdolność  rozdzielczą  rzędu 
0,1%.  Wydajność  dużych  detektorów  germanowo- 
litowych  (zależna  od  rozmiarów  kryształu  germanu) 
jest  porównywalna  z wydajnością  liczników  scyntyla- 
cyjnych. 


układu  elektronicznego,  zwanego  układem  koincyden- 
cyjnym. Zadaniem  tego  układu  jest  wysłanie  impulsu 
wyjściowego  tylko  wówczas,  gdy  impulsy  z detek- 
torów pojawiają  się  w momentach  różniących  się 
mniej  w czasie  niż  tzw.  czas  rozdzielczy  układu  koin- 
cydencyjnego (może  on  wynosić  np.  1 ps).  W oma- 
wianym przykładzie  pojawienie  się  wyjściowych 
impulsów  koincydencji  świadczy,  że  mamy  do  czynie- 
nia ze  schematem  rozpadu  przedstawionym  na  rys.  4a. 

Stosując  układ  koincydencyjny  o dostatecznie 
krótkim  czasie  rozdzielczym  możemy  wykonać  po- 
miar średniego  czasu  życia  r stanu  pośredniego  w roz- 
padzie 4a.  W tym  celu,  między  detektorem  rejestru- 
jącym fotony  E2  i układem  koincydencyjnym  umiesz- 
czamy linię  opóźniającą,  która  pozwala  opóźniać 
dojście  impulsu  o określony  odstęp  czasu.  Mierząc 
szybkość  zliczeń  koincydencji  N w zależności  od  wpro- 
wadzonego opóźnienia  T otrzymamy  krzywą  pokaza- 
ną na  rys.  5,  której  nachylenie  w skali  logarytmicznej 
jest  związane  ze  średnim  czasem  życia  stanu  jądrowe- 
go t wzorem 

d(\nN) 

dT  r ' 

Sporządzając  więc  wykres  liczby  zliczeń  w skali  loga- 
rytmicznej możemy  bezpośrednio  wyznaczyć  czas 


*2 

a) 


*2 


b) 

Rys.  4.  Ilustracja 
zastosowania  meto- 
dy koincydencji ; 

dwa  warianty  sche- 
matu rozpadu : a) 
emisja  dwóch  foto- 
nów y w kaskadzie, 
b)  emisja  dwóch  nic- 
skorelowanych  fo- 
tonów y 


uk§ad 

koincyden- 

cyjny 


metoda 

opóźnionych 

koincydencji 
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życia  r wzbudzonego  stanu  jądrowego.  Przedstawiona 
metoda  opóźnionych  koincydencji,  przy  zastosowaniu 
odpowiednio  szybko  reagujących  detektorów  i no- 


Rys.  5.  Przykład  krzywej  otrzymywanej  w pom  i arze  śred- 
niego czasu  życia  stanu  jądrowego  metodą  opóźnionych 
koincydencji 


pomiary  woczesnych  układów  koincydencyjnych,  pozwala  do- 
czasÓw  konywać  pomiarów  czasów  życia  krótszych  nawet  niż 
życia  ^ * s-,w  pomiarach,  które  wymagają  dużej  czasowej 
zdolności  rozdzielczej,  stosowane  są  nadal  liczniki 
scyntylacyjne,  gdyż  wytwarzane  w nich  impulsy  są 
znacznie  krótsze  od  impulsów  z detektorów  pół- 
przewodnikowych. 


Metoda  korelacji  kierunkowych 
promieniowania  y 

wyznaczanie  Pomiar  koincydencji  między  fotonami  Ex  i Ą (rys.  4a) 
korelacji  może  być  rozszerzony  na  pomiar  kierunkowej  za- 
kierunko-  leżności  emisji  obu  fotonów  kaskady.  Możemy  ją 
wych  wyznaczyć  zmieniając  kąt,  jaki  tworzą  kierunki  od 
źródła  promieniotwórczego  do  detektorów,  tzn.  o- 
bracając  jeden  z detektorów  wokół  źródła  i wyzna- 


k Korelacja  kierunkowa  promieniowania  y emitowanego 


czając  dla  każdego  kąta  szybkość  zliczeń  koincy- 
dencji (£■,,  E2)  (rys.  6).  Prawdopodobieństwo  tego, 
że  dwa  fotony  kaskady  wylecą  w kierunkach  tworzą- 
cych kąt  6 , czyli  funkcja  korelacji  kierunkowej  W(d) 
może  być  zapisana  w postaci: 

Wiff)  = l-f-ó2cos20+ó4cos40, 

przy  czym  współczynniki  b2  i bA  zależą  od  spinów 
poziomów,  między  którymi  zachodzi  przejście,  oraz  od 
rodzaju  (elektryczne  czy  magnetyczne)  i multipo- 
lowości  przejścia.  Pomiar  współczynników  b2  i bi 
pozwala  więc  uzyskać  informacje  o tych  parametrach 
jądrowych.  Typowy  wykres  funkcji  korelacji  kierun- 
kowej dla  dwóch  przejść  elektrycznych  kwadrupolo- 
wych  między  poziomami  o spinach  kolejno  4-2-0 
jest  przedstawiony  na  rys.  6 (linia  czarna). 

Metoda  korelacji  kierunkowych  może  być  wykorzy- 
stana do  wyznaczania  momentów  elektromagnetycz- 
nych wzbudzonych  stanów  jądrowych.  Przypuśćmy,  że 
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źródło  promieniotwórcze  znajduje  się  w polu  magne- 
tycznym skierowanym  prostopadle  do  płaszczyzny, 
w której  umieszczone  są  detektory,  a jądro  we  wzbu- 
dzonym stanie  pośrednim  o czasie  życia  r ma  moment 
magnetyczny  ft.  Wskutek  oddziaływania  momentu 
magnetycznego  jądra  z polem  magnetycznym  wystąpi 
precesja  spinu  jądra  wokół  kierunku  pola,  co  spowo- 
duje obrót  jądra  w czasie  życia  r o kąt  wynoszący 
średnio  Ad.  Wywoła  to  przesunięcie  wykresu  funkcji 
korelacji  kierunkowej  (linia  niebieska  na  rys.  6). 

Wyznaczenie  tego  przesunięcia  pozwala  obliczyć 
wartość  oddziaływania  jądra  z polem  magnetycznym,  wyznaczanie 
a stąd  moment  magnetyczny  stanu  jądrowego.  W wy-  momentu 
padku,  gdy  w funkcji  korelacji  można  pominąć  wyraz  magnetycz- 
zawierający  b4 , krzywa  przesunięta  jest  opisana  wzo-  nego 
rem 

fV(0,  H)  «■  1 + cos2(e-zffl), 

\/\+{2wry 

gdzie  Ad  — V2  arctg(2ctfT),  a co  jest  częstością  precesji 
momentu  magnetycznego  jądra  ^ w polu  magnetycz- 
nym o natężeniu  H: 

co  = fiHJIh . 

Jak  widać  pomiar  przesunięcia  kątowego  Ad  pozwala 
wyznaczyć  moment  magnetyczny  /jc  pod  warunkiem, 
że  znane  jest  natężenie  pola  magnetycznego  //,  średni 
czas  życia  r danego  stanu  jądrowego  i jego  spin  /. 


Metoda  pomiaru  czasu  życia  stanów 
jądrowych  oparta  na  efekcie 
Dopplera 

Metodą  opóźnionych  koincydencji,  o której  była 
mowa  wyżej,  nie  można  zmierzyć  czasów  życia  sta- 
nów jądrowych  żyjących  krócej  niż  lCr9-10-10  s. 
W obszarze  krótszych  czasów  życia  może  być  wy- 
korzystana metoda  oparta  na  zjawisku  Dopplera,  któ- 
ra jest  z pewnością  dobrze  znana  Czytelnikowi  z dzie- 
dziny akustyki.  Również  w optyce  częstość  odbieranej 
fali  elektromagnetycznej  zależy  od  prędkości  ruchu 
źródła  względem  obserwatora.  Zmiana  rejestrowanej 
przez  obserwatora  częstości  Av  dana  jest  wyrażeniem 

Av  = ±v0v/c9 

gdzie  v0  — częstość  fali  emitowanej  przez  źródło 
spoczywające  względem  obserwatora,  v — prędkość 
ruchu  względnego,  c — prędkość  światła.  Zmiana 
częstości  jest  dodatnia,  gdy  źródło  i obserwator 
zbliżają  się  do  siebie,  a ujemna  — gdy  się  oddalają. 
Ponieważ  energia  fotonu  jest  związana  z częstością 
drgań : E — hv,  to  zmianie  częstości  odpowiada 
zmiana  energii  rejestrowanego  fotonu 

AE  = ±E0v/c. 

Opisany  efekt  może  być  wykorzystany  do  pomiaru 
czasu  życia  jądra,  które  w wyniku  reakcji  jądrowej 
doznało  odrzutu  i porusza  się  z prędkością  wyno- 
szącą na  ogół  kilka  procent  prędkości  światła.  Ry- 
sunek 7 przedstawia  zasadę  takiego  pomiaru.  Jądra 
wytworzone  w cienkiej  tarczy  wylatują  z niej  do 
próżni  i po  przebyciu  drogi  d są  zatrzymane  w folii 
hamującej.  Detektor  rejestruje  fotony  y emitowane 


wiązka 

cząstek 

jądra  wzbudzone 

— ***"**{' 

foton  y emitowany  przez 
spoczywające  jądro 

bombardu- 

jących 

. 

—•  w 

— 

foton  y emitowany 

U >- 

przez  jądro  w locie 

tarcza  folia  hamująca 

Rys.  7.  Zasada  pomiaru  średniego  czasu  życia  stanu  wzbudzo- 
nego jądra  metodą  przesunięcia  dopplerowskiego.  Przykład 
przejścia  0,891  MeV  w **Na 


ci  od  odległości  d pozwala  obliczyć  średni  czas  życia 
stanu  jądrowego  r ze  wzoru 

A = 

h 

Metoda  ta  umożliwia  pomiary  czasu  życia  rzędu 
10"11,  a nawet  10“ 12  s. 


inne  metody  spektroskopii  jądrowej 

W tak  krótkim  opisie  nie  sposób  przedstawić  całego 
bogactwa  metod  spektroskopii  jądrowej.  Oprócz 
pomiarów  energii,  natężeń  i rozkładów  kątowych  pro- 
mieniowania jądrowego  oraz  czasów  życia  wzbudzo- 
nych stanów  jądrowych  można  wymienić  pomiary 
liniowej  i kołowej  polaryzacji  promieniowania  y, 
a także  pomiary  podłużnej  polaryzacji  elektronów 
rozpadu  fi,  tj.  stopnia  orientacji  ich  spinów  w stosunku 
do  kierunku  lotu.  Na  wzmiankę  zasługuje  również  wy- 
korzystanie zalet  detekcji  promieniowania  jądrowego 
w pomiarach  prowadzonych  innymi  metodami,  jak 
np.  metodą  magnetycznego  rezonansu  jądrowego  lub 
metodą  rezonansu  w strumieniu  atomowym.  Zastoso- 
wanie w tych  metodach  detekcji  promieniowania  ją- 
drowego umożliwia  rejestrację  pojedynczych  jąder 
promieniotwórczych,  a więc  pracę  z bardzo  małymi 
ilościami  badanych  substancji.  Korzystne  okazało 
się  również  połączenie  metod  spektroskopii  jądrowej 
z metodą  orientacji  jąder  w bardzo  niskich  temperatu- 
rach. 

Należy  także  zwrócić  uwagę,  że  metody  spektro- 
skopii jądrowej  znajdują  dziś  szerokie  zastosowanie 
w badaniach  własności  materii  skondensowanej  (tzn. 
ciał  stałych  i cieczy),  przy  czym  jądro  atomowe 
w kryształach  lub  w cząsteczkach  związków  chemicz- 
nych odgrywa  rolę  mikroskopowego  próbnika  czułe- 
go na  własności  bezpośredniego  otoczenia. 

K.  Siegbahn  P~t  y-Ray  Spectroscopy , Amsterdam  1966; 
A.  Strzałkowski  Wstęp  do  fizyki  jądra  atomowego , Warszawa 
1978;  Sz.  Szczeniowski  Fizyka  doświadczalna , cz.  6,  Warszawa 
1974. 


Fizyka  jądrowa  wielkich  energii 

Przemysław  Zieliński 

Fizyka  jądrowa  wielkich  energii  jest  dziedziną  z po- 
granicza fizyki  cząstek  elementarnych  i fizyki  jądro- 
wej. Zakres  wielkich  energii  nie  jest  sprecyzowany,  ale 
orientacyjnie  przyjmuje  się,  że  chodzi  o oddziaływania 
z jądrami  cząstek  mających  energię  kinetyczną  po- 
wyżej 1 GeV(l  gigaelektronowolt  = 1 TO9  elektrono- 
woltów).  Jest  to  energia,  która  przekazana  np.  jądru 
o liczbie  masowej  A ok.  100,  spowodowałaby,  że 
wszystkie  nukleony  oddaliłyby  się  od  siebie  (odpowia- 
da to  całkowitej  energii  wiązania  tego  jądra).  Pierwot- 
nie w zakres  fizyki  jądrowej  wchodziła  również 
fizyka  cząstek  elementarnych,  która  w ostatnich  dzie- 
sięcioleciach rozwinęła  się  w dyscyplinę  samodzielną. 


Rodzaje  oddziaływań 

Wymieniony  powyżej  przykład  oddziaływania  jest 
bardzo  rzadki.  Na  ogół  oddziaływanie  powoduje  ro- 
zerwanie tylko  części  wiązań  nukleonów  w jądrze. 

Występują  rozmaite  rodzaje  oddziaływań.  Najbar- 
dziej charakterystyczne  z nich  ilustruje  schematycznie 
rys.  1. 

rozpraszanie  Rozpraszanie  elastyczne  (rys.  la)  jest  procesem 
elastyczne  wyjątkowo  prostym.  Obie  cząstki,  zarówno  cząstka 
padająca,  jak  i jądro-tarcza,  pozostają  w stanie 
podstawowym.  Proces  ten  bardzo  dobrze  opisuje  te- 
oria wielokrotnego  rozpraszania  Glaubera,  którą 
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rozwinęli  m.in.  fizycy  polscy,  a szczególnie  prof.  Wie- 
sław Czyż.  Jeżeli  cząstka  padająca  nieznacznie  zmieni 
swój  pęd  (przypadek  najczęstszy),  to  przeważa  oddzia- 
ływanie z pojedynczym  nukleonem,  przy  większych 
zmianach  pędu  należy  uwzględnić  kolejne  rozprasza- 
nie na  dwóch,  trzech  itd.  nukleonach  (stąd  nazwa 
teorii).  Rozkład  prawdopodobieństwa  rozproszenia 
cząstki  pod  różnymi  kątami  przypomina  obraz  dyf- 
rakcyjny promieni  świetlnych  na  kuli  i,  w przypad- 
ku jąder  ciężkich,  teoria  wielokrotnego  rozpraszania 
wyjaśnia  przewidywania  modelu  optycznego  stosowa- 
nego do  opisu  reakcji  jądrowych  dla  małych  i po- 
średnich energii  (-►  Reakcje  jądrowe). 

Spójna  produkcja  cząstek  (rys.  Ib)  jest  charaktery- 
stycznym procesem  występującym  wyłącznie  w obsza- 
rze wielkich  energii.  Cząstka  padająca  „dysocjuje” 
w polu  jądra  (np.  proton  „dysocjuje”  na  proton  i dwa 
mezony  n),  przy  czym  jądro  bombardowane  pozostaje 
w stanie  podstawowym.  Ten  ciekawy  proces,  mało 
jeszcze  zbadany,  jest  obecnie  przedmiotem  wielu 
prac  eksperymentalnych  i teoretycznych. 

Procesy  nieelastyczne  są  bardzo  rozmaite.  Na  rys. 
lc  przedstawiono  schematycznie  prosty  proces, 
w wyniku  którego  z jądra  bombardowanego  emitowa- 
ny jest  jeden  fragment  jądrowy  (np.  proton  lub  deu- 
teron).  Reakcje  tego  typu  badane  są  intensywnie 
szczególnie  przy  energiach  rzędu  100  MeV,  łatwiej 
dostępnych  ze  względu  na  dużą  liczbę  akceleratorów 


przez  jądra  wytworzone  w stanie  wzbudzonym.  Jeżeli 
czas  przelotu  odcinka  d jest  znacznie  dłuższy  od  śred- 
niego czasu  życia  danego  stanu  jądrowego,  to  niemal 
wszystkie  fotony  są  wysyłane  przez  poruszające  się 
jądra  i mają  wobec  tego  energię  wyższą  od  E0  o AE. 
Jeżeli  natomiast  czas  przelotu  jest  znacznie  krótszy  od 
czasu  życia  r,  to  większość  fotonów  wysyłana  jest  już 
przez  jądra  spoczywające,  zahamowane  w folii,  a wo- 
bec tego  ma  energię  E0 . Zmieniając  odstęp  d między 
tarczą  a folią  hamującą  obserwujemy  w widmie 
energetycznym  y zmianę  natężenia  dwóch  pików  prze- 
suniętych względem  siebie  o AE.  Pierwszy  z nich  od- 
powiada fotonom  y emitowanym  przez  jądra  zaha- 


Rys.  8.  Przykład  widm  promieniowania  y dla  różnych  odleg- 
łości d między  tarczą  a folią  hamującą 


mowane  w folii  (natężenie  70),  drugi  — fotonom  emi- 
towanym przez  jądra  w locie  (natężenie  /»)  (rys.  8). 
Pomiar  stosunku  natężeń  obu  pików  Iv/Iq  w zależnoś- 


wyznaczanie 
czasu  życia 


spójna 

produkcja 

cząstek 


procesy 

nieelastyczne 


cząstek  pośrednich  energii.  Badanie  tych  reakcji  przy 
wielkich  energiach  dostarcza  nowych  informacji 

0 strukturze  jądra,  ilustruje  to  rys.  2.  Cząstka  o wielkiej 
energii  związana  jest  ze  znacznie  krótszą  falą  de  Brog- 
lieła  zgodnie  z relacją  p = ń/A,  gdzie  p jest  pędem 
cząstki,  h — stalą  Plancka,  a A — długością  fali 

1 „widzi”  — w przeciwieństwie  do  cząstki  o małej 
energii  — tylko  małą  część  jądra  bombardowanego 
(podobnie  krótkie  fale  rentgenowskie  służą  do  bada- 
nia szczegółów  struktury  sieci  krystalicznej,  które 
trudno  zbadać  za  pomocą  światła  widzialnego,  mają- 
cego znacznie  większą  długość  fali). 

fragmentacja  Oddziaływania  nieelastyczne  mogą  mieć  jeszcze 
jądra  bardziej  skomplikowany  charakter.  Jeżeli  np.  jądro 
bombardowane  w wyniku  zderzenia  z cząstką  padają- 
cą ulegnie  rozbiciu  na  wiele  części,  to  proces  taki  na- 


a) 


c) 


d) 


Rys.  1.  Przykłady  oddziaływań  cząstki  wielkiej  energii  z jądrem 
atomowym;  a)  rozpraszanie  elastyczne,  b)  spójna  produkcja  czą- 
stek („dysocjacja”  cząstki  padającej),  c)  rozbicie  jądra  z emisją 
fragmentu  jądra,  d)  rozbicie  („fragmentacja”)  jądra  na  wiele 
części,  której  na  ogół  towarzyszy  wielorodna  produkcja  nowych 
cząstek  (mezonów  n , K itd.) 


a)  cząstka  padająca  o wielkiej  energii  E*  = 1 GeV 


fragment  jądra 
bombardowanego 


jądro  bom- 


bardowane 


b)  cząstka  padająca  o małęj  energii  Ek  = 1 MeV 

Rys.  2.  Schemat  ilustrujący  różnicę  pomiędzy  sposobem  oddzia- 
ływania z jądrem  cząstki  o:  a)  małej,  b)  wielkiej  energii 
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zywamy  fragmentacją  jądra  (rys.  Id).  Procesy  frag- 
mentacji  jądra,  mimo  swojej  złożoności,  wykazują 
wiele  regularności  empirycznych  (np.  zbliżony  do 
maxwel!owskiego  rozkład  energii  fragmentów),  które 
jeszcze  nie  są  wytłumaczone. 

Innym,  bardzo  złożonym  procesem  nieelastycz-  wieSorodna 
nym,  który  często  występuje  w zderzeniach  cząstki  produkcja 
o wielkiej  energii  z jądrem,  jest  wielorodna  produkcja  cząstek 
cząstek.  W wyniku  tego  procesu  nie  tylko  zmienia  się 
stan  jądra  bombardowanego,  z którego  wyemitowane 
mogą  być  zwykłe  (składające  się  z nukleonów)  frag- 
menty jądrowe,  ale  wyprodukowane  są  nowe  cząstki 
(np.  mezony  n).  Ogólny  opis  tego  procesu  jest  bardzo 
złożony,  ale  i tu  stwierdzono  proste  empiryczne  re- 
gularności. Na  przykład  stwierdzono,  że  krotność 
cząstek  wyprodukowanych  w zderzeniu  z jądrem, 
szczególnie  kiedy  ograniczymy  się  do  małych  kątów 
emisji,  nieoczekiwanie  mało  różni  się  od  krotności 
cząstek  wyprodukowanych  w zderzeniu  proton-pro- 
ton.  Analiza  tych  regularności  przyczyni  się  do  głęb- 
szego teoretycznego  opisu  zjawiska,  badanego  ostatnio 
niezwykle  intensywnie. 


Znaczenie  poznawcze 


Badanie  typów  oddziaływań  cząstek  wielkiej  energii 
z jądrami  jest  źródłem  informacji  o cząstkach  ele- 
mentarnych oraz  jądrach  atomowych.  Wiele  ważnych 
odkryć  w fizyce  cząstek  elementarnych  dokonano 
badając  oddziaływania  cząstek  wielkich  energii 
z jądrami  (np.  odkrycie  mezonów  n i K>  hiperonów, 
hiperjąder  i in.).  Własności  samych  cząstek  elementar- 
nych poznajemy  jednak  głównie  badając  wzajemne 
ich  oddziaływania,  chociaż  wiele  tych  własności  można 
zbadać  również  w oddziaływaniach  jądrowych.  Na 
przykład  w ostatnich  latach  wielkie  zainteresowanie 
fizyków  wzbudziły  obserwacje  wielorodnej  produkcji 
mezonów  w oddziaływaniach  proton-jądro.  Wspom- 
niana już  mała  krotność  produkcji  mezonów  inter- 
pretowana jest  jako  przejaw  długiego  okresu  trwania 
oddziaływania,  prowadzącego  do  powstania  mezonów 
(cząstki  te  „nie  zdążą  się”  wytworzyć  wewnątrz  jądra). 
Obecność  innych  nukleonów  w jądrze  może  stać  się 
w tym  wypadku  swoistym  analizatorem  niezwykle 
krótkich  czasów  (rzędu  10" 23  s)  oddziaływań,  które  nie 
są  dostępne  w badaniach  bezpośrednich.  W ten  sposób 
można  np.  dowiedzieć  się  o pewnych  własnościach 
krótkotrwałych  stanów  rezonansowych  cząstek. 

Powyżej  wspomniano  o badaniu  struktury  i włas- 
ności jąder  za  pomocą  cząstek  o wielkich  energiach. 
Jest  to  dodatkowe  źródło  informacji  w stosunku  do 
tej,  której  dostarcza  nam  badanie  reakcji  jądrowych 
o małych  energiach.  Niektóre  jednak  własności  mate- 
rii jądrowej  mogą  być  badane  w warunkach  ziemskich 
jedynie  w oddziaływaniach  o wielkich  energiach.  Na 
przykład  w zjawisku  fragmentacji  jąder  cząstka  pada- 
jąca przekazuje  jądru  energię  porównywalną  z całko- 
witą energią  wiązania.  W ten  sposób  materia  jądro- 
wa w czasie  zderzenia  zostaje  doprowadzona  do  stanu, 
w którym  w warunkach  ziemskich  nie  występuje 
(z  wyjątkiem  bardzo  rzadkich  oddziaływań  cząstek 
promieniowania  kosmicznego  z jądrami).  Tego  ro- 
dzaju ekstremalne  stany  materii  jądrowej  mogą  istnieć 
jedynie  we  wnętrzu  niektórych  osobliwych  ciał  nie- 
bieskich (np.  w gwiazdach  neutronowych).  A zatem 
w laboratorium  na  Ziemi  za  pomocą  akceleratorów 
cząstek  wielkich  energii  możemy  wytworzyć  i zbadać 
nowe,  dotychczas  niedostępne  stany  i własności 
materii  jądrowej.  Ostatnio  niektórzy  wybitni  teoretycy, 
m.in.  A.  Migdał  i T.D.  Lee,  wysunęli  hipotezę,  że 
w pewnych  ekstremalnych  warunkach  wskutek  zgęsz- 
czenia  powstałego  w wyniku  zderzenia  z cząstką 
o wielkiej  energii  materia  jądrowa  może  przejść 
w zupełnie  inny  jakościowo  stan  (sięgając  do  analo- 
gii można  posłużyć  się  przykładem  lodu,  który  w od- 
powiednim zakresie  temperatury  i ciśnienia  może  wy- 
stąpić w odmianach  allotropowych). 
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Badania  oddziaływań  jądrowych  wielkich  energii  często  jądra  żelaza,  a nawet  jądra  znacznie  cięższe),  informacje 
są  pośrednim  źródłem  dalszych  informacji  o własno-  Ich  badanie  umożliwia  poznanie  struktury  ciał  nie-  z dziedziny 
ściach  jąder.  Mianowicie  w zderzeniach  jądrowych  bieskich  i własności  przestrzeni  kosmicznej.  kosmoiogis 


numer  kanału 

Rys.  3.  Częstość  występowania  fragmentów  jądrowych,  emitowanych  w oddziaływaniach  protonów  o energii  5 GeV  z jądrami  uranu. 
Na  osi  odciętej  podany  jest  numer  kanału  analizatora  mierzącego  straty  energii  w detektorach  półprzewodnikowych,  użytych  dla  iden- 
tyfikacji cząstek  (wg  A.M.  Poskanzer  i in.  Physical  Review  Letters  17,  1271,  1966) 


o wielkiej  energii  powstają  anomalne  jądra  ekstre- 
malne. Kiedy  cząstka  o małej  energii  pada  na  jądro, 
to  w wyniku  reakcji  jądrowej  powstać  może  niewielka 
ilość  różnych  produktów  końcowych.  Jeżeli  zwiększa- 
my energię  cząstki  padającej,  to  mogą  zostać  wypro- 
dukowane rzadkie  lub  zupełnie  nowe  jądra,  które  są 
dalekie  od  „ścieżki  trwałości”  (określonej  stosunkiem 
ilości  protonów  do  neutronów  dla  ustalonej  liczby 
masowej  jąder).  Sytuację  tę  ilustruje  rys.  3,  na  którym 
podane  są  wyniki  identyfikacji  niektórych  produktów 
reakcji  oddziaływania  protonów  o energii  5 GeV  z ją- 
drami uranu.  W doświadczeniu  tym  odkryto  nowe  jąd- 
ra nLi,  14B,  15B.  Wyprodukowane  i zarejestrowane  w 
tym  doświadczeniu  jądro  nLi  składa  się  z trzech  proto- 
nów i aż  ośmiu  neutronów,  podczas  gdy  trwałe  izotopy 
litu  mają  tylko  trzy,  cztery  neutrony!  Te  anomalne 
jądra  są  źródłem  nowych  informacji  o własnościach 
sił  jądrowych. 

Źródłem  interesującej  informacji  z dziedziny  ko- 
smologii są  oddziaływania  jąder  padających  na 
Ziemię  w postaci  promieni  kosmicznych.  W promie- 
niowaniu kosmicznym  występują  oprócz  protonów 
również  cięższe  jądra  (wśród  nich  np.  stosunkowo 


Wymienione  przykłady  ilustrują  niektóre  tylko 
wyniki  badań  w tej  szybko  rozwijającej  się  dziedzi- 
nie. W najbliższym  czasie  zasięg  badań  rozszerzy  się 
w związku  z tym,  że  kilka  akceleratorów  protono- 
wych (Dubna,  Saclay,  Berkeley)  przyspiesza  obecnie 
cięższe  jądra  do  bardzo  wielkiej  energii.  Na  przykład  reSaty  wisty* 
w Berkeley  w Stanach  Zjednoczonych  akcelerator  czna  fizyka 
„Bevatron”  przyspiesza  obecnie  jądra  lekkie  (do  jądrowa 
neonu)  do  energii  3 gigaelektronowoltów  na  nukleon, 
a synchrofazotron  ZIBJ  w Dubnej  aż  do  energii 
5 GeV  na  nukleon.  W ten  sposób  powstała  nowa 
dziedzina  fizyki  — relatywistyczna  fizyka  jądrowa. 

J.  Bartke  Eksperymenty  z jądrami  cięższymi  od  wodoru  przy- 
spieszanymi do  bardzo  wysokiej  energii.  Post.  Fiz.  24,423  (1973); 

W.  Czyż  Rozpraszanie  cząstek  wysokich  energii  na  jądrach  ato- 
mowych w:  Cząstki  elementarne , Jądro  atomowe , Promieniotwór- 
czość, W Hołdzie  Marii  Skłodowskiej-Curie , Warszawa  1967; 

A.  JaCHOŁKOWSKI  Zastosowania  modelu  Glaubera  do  opisu  roz- 
praszania cząstek  elementarnych  i jąder  atomowych  w zakresie 
wielkich  energii , Post.  Fiz.  26,  167  (1975);  M.  Mięsowicz  Fireball 
Model  of  Meson  Production  w Progress  in  Elementary  Particie 
and  Cosmic  Ray  Physics,  ed  J.G.  Wilson,  S.A.  Wouthuysen, 
vol.  10,  103  (1971);  M.  Mięsowicz,  R.  Sosnowski  Cluster  pro- 
duction in  high  energy  reactions , Nukleonika  20,  24  (1975); 

Nukłotron  i relatiwistskaja  jadiernaja  fizika , Sbomik  statiej, 

O.I.J.I-,  Dubna  1974 


Hiperjądra 

Jerzy  Pniewski 


W latach  trzydziestych  sądzono,  że  protony  i neutro- 
ny, nazywane  nukleonami,  są  jedynymi  składnikami 
jąder  atomowych.  Wraz  z rozwojem  fizyki  cząstek 
elementarnych  wykryto  trzeci  składnik,  który  daje 
się  związać  siłami  jądrowymi  z nukleonami  w jedną 
strukturę  stanowiącą  nowy  rodzaj  materii  jądro- 
wej. Jest  nim  hiperon  A (lambda),  a nowa  struktura 
jądrowa,  zawierająca  poza  nukleonami  przynajmniej 
jeden  hiperon  A,  zwana  jest  hiperjądrem.  Hiper- 
jądra z powłokami  odpowiednio  obsadzonymi  przez 


elektrony  tworzą  nowe  izotopy  znanych  atomów.  Hi- 
perjądra zostały  odkryte  w 1952  roku  przez  M.  Da- 
nysza  i J.  Pniewskiego. 


Własności  hiperjąder 

Neutron  i hiperon  A są  cząstkami  elektrycznie  obo- 
jętnymi, zatem,  tak  jak  w przypadku  zwykłego  ją- 
dra, o liczbie  atomowej  hiperjądra  decyduje  liczba 
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nomenklatu-  jego  protonów.  Najprostsze  hiperjądro,  zawierające 
ra  mperjąaer  wszystkie  trzy  składniki  (p , n , A)  występujące  poje- 
dynczo, jest  hiperjądrem  wodoru  3.  Nazwy  hiper- 
jąder wywodzą  się  od  nazw  odpowiednich  pierwiast- 
ków chemicznych,  mówimy  więc  o hiperwodorze  3 
lub  hipertrycie.  Jeśli  do  jądra  helu  4,  czyli  cząstki  a, 
dołączyć  hiperon  A,  powstanie  najczęściej  spotykane 
hiperjądro  — hiperhel  5.  Przy  zapisie  hiperjąder 
korzysta  się  z oznaczeń  typowych  dla  zwykłych  jąder, 
zaopatrzonych  dodatkowo  w symbol  hiperonu  A.  Na 
przykład : hipertryt  ~^H,  hiperhel  5 - * He.  Dotychczas 
zidentyfikowano  22  hiperjądra,  czyli  jednoznacznie 
wyznaczono  ich  liczby  masowe  i atomowe,  od  hiper- 
wodoru  do  hiperazotu  (tabela).  Stwierdzono  istnienie 


Znane  hipernuklidy 


wać  na  podstawie  danych  jądrowych  (hipernuklidy  zidentyfiko- 
wane za  pomocą  emulsji  jądrowych  w laboratoriach  Europejskiej 
Współpracy  K~\ 

Systematyczne,  wieloletnie  badania  własności  hiperjąder  prowa- 
dzone były  przez  międzynarodowy  zespół  laboratoriów  zwany 
Europejską  Współpracą  K~.  Współpraca  ta  ostatecznie  skoncen- 
trowała się  w laboratoriach  w Belgradzie,  Berlinie,  Brukseli,  Du- 
blinie, Londynie  i Warszawie.  Prace  tego  zespołu  objęły  całą  te- 
matykę hiperjądrową  dostępną  techniką  emulsji  jądrowych. 
W poszczególnych  ośrodkach  brał  i w niej  udział  m.in. : D.  H.  Da- 
vis  (Londyn),  A.  Montwill  (Dublin),  U.  Krecker  (Berlin),  J.  Sa- 
cton  (Bruksela),  J.  Zakrzewski  (Warszawa).  Ogółem  opubliko- 
wano blisko  100  prac,  wiele  z nich  dotyczyło  BA. 


ciężkich  hiperjąder  o masach  zbliżonych  do  masy  ato- 
mu srebra,  a nawet  większych.  Nie  udało  się  jednak 
ustalić  ani  dokładnych  wartości  ich  liczb  masowych, 
ani  atomowych  (J.  Zakrzewski  i inni  — prace  zespo- 
łowe od  1961). 

Z ogólnej  liczby  ponad  200  000  hiperjąder,  indy- 
widualnie zaobserwowanych  w emulsjach  jądro- 
wych, zidentyfikowano  kilkanaście  tysięcy.  Znane  są 
dwa  przypadki  tzw.  hiperjąder  podwójnych,  zawiera- 
jących po  dwa  hiperony  A;  są  nimi  hiperberyl  10  i hi- 
perhel 6 : 

(8Be  -t-  A + A)  — ► ^Be ; (a + A + A)  -+  AAHe. 

m rozpady  Hiperon  A jest  cząstką  nietrwałą,  rozpadającą  się 
hiperjąder  w wyniku  słabych  oddziaływań,  ze  średnim  czasem 
życia  2,63  *10" 10  s.  W rozpadzie  tym  traci  dziwność, 
opisywaną  przez  liczbę  kwantową  S,  której  ujemne 
wartości  stanowią  charakterystyczną  cechę  wszyst- 
kich hiperonów.  (Liczba  kwantowa  S cząstek  nie- 
dziwnych,  np.:  nukleonów  i pionów,  jest  równa  0. 
We  wszystkich  procesach  wywołanych  oddziaływania- 
mi silnymi  bądź  elektromagnetycznymi  liczba  S jest 
zachowana).  Ponieważ  różnica  mas  hiperonu  A i nu- 
kleonu jest  większa  od  masy  mezonu  n,  istnieją  dwa 
główne  kanały  rozpadu  swobodnych  cząstek  A zwane 
mezonowymi:  A p-\-7C  +37,75  MeV  oraz  A 
->  n-f  7r°+41,06  MeV.  Inne  rozpady  hiperonu  A są 
niezwykle  mało  prawdopodobne  i mogą  tu  nie  być 
brane  pod  uwagę.  Związanie  hiperonu  A w hiper- 
jądrze,  mimo  wydzielonej  energii  wiązania,  nie  za- 
hamowuje procesu  jego  rozpadu.  Przeciwnie,  słabe 
oddziaływania  z nukleonami  otwierają  nowe  kanały 
rozpadów  niemezonowych,  w których  cząstka  A tra- 
cąc dziwność  zamienia  się  bezpośrednio  w neutron: 
np:  A+N  176,0  MeV.  W ten  sposób  wszys- 

tkie hiperjądra  są  nietrwałe  — są  one  w pewnym  sen- 
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sie  promieniotwórcze,  ich  średni  czas  życia  jest  po- 
równywalny z czasem  życia  swobodnej  cząstki  A. 

Przykłady  najczęściej  spotykanych  rozpadów  hiper- 
helu  5: 


*He 

‘He- 

‘He 

,‘He 


■ir+p+a+34,63  MeV,  ’ 

* 3He+ 16,28  MeV,  mezonowe 

■ *®+ «+a+37,94  MeV, 

«+ a + 172,91  MeV  — niemezonowy. 


Charakterystycznym  przykładem  rozpadu  hiper- 
jądra jest  hiperjądro  zidentyfikowane  w emulsji  jądro- 
wej, znalezione  i rozpoznane  po  raz  pierwszy  w 1952  r. 


Rys.  1.  Mikroskopowy  obraz  produkcji  i rozpadu  pierwszego 
hiperjądra  zidentyfikowanego  w fotograficznej  emulsji  jądrowej 
naświetlonej  promieniowaniem  kosmicznym  (M.  Danysz 
i J.  Pniewski,  1952).  Oznaczenia:  p tor  cząstki  pierwotnej  pro- 
mieniowania kosmicznego,  A miejsce  oddziaływania  z jądrem 
bromu  (lub  srebra)  napotkanym  w emulsji  fotograficznej,  s pęk 
torów  szybkich  cząstek  wtórnych,  / tory  fragmentów  rozbitego 
jądra,  h tor  fragmentu  hiperjądrowego,  B miejsce  rozpadu  hiper- 
jądra 


w Warszawie  (rys.  1).  Jądrowe  emulsje  fotograficzne, 
ze  względu  na  dużą  przestrzenną  zdolność  rozdzielczą, 
umożliwiają  analizę  indywidualnych  przypadków 
hiperjąder.  Analiza  kinematyczna  rozpadów  mezo- 
nowych z emisją  mezonu  n~  stanowi  główną  podstawę 
identyfikacji  hiperjąder. 

W celu  otrzymania  hiperjądra  należy  stworzyć 
warunki  do  wyprodukowania  hiperonu  A,  a następnie 
związania  go  w jądrze  atomowym.  Początkowo  obser- 
wowano jedynie  hiperjądra  wytwarzane  w zderzeniach 
cząstek  promieniowania  kosmicznego  albo  protonów 
i pionów  wysokich  energii  uzyskiwanych  z akcelera- 
torów protonowych  wielkich  energii.  Jądra  atomów 
wchodzących  w skład  emulsji  fotograficznej  stanowiły 
tarczę  do  produkcji  hiperonów  i materiał  wyjściowy 
do  uzyskania  hiperjąder  w formie  hiperfragmentów 
jądrowych.  Wydajność  tego  procesu  w emulsji  jądro- 
wej wynosiła  około  0,1%  wszystkich  oddziaływań 
wielkich  energii.  Następnie  zaczęto  stosować  znacznie 
bardziej  wydajną  metodę  produkcji  hiperjąder,  jaką 
jest  wychwyt  zatrzymujących  się  mezonów  K~  po- 
siadających tę  samą  dziwność  S — —1  co  hiperony  A. 
Wydajność  produkcji  hiperjąder  tą  metodą  w tarczy 
węglowej  sięga  10%,  w srebrze  zaś  przekracza  50% 
chwytanych  mezonów  K~ . 


pierwsze 

hiperjądro 


produkcja 

hiperjąder 


dziwność  Hiperjądrom  należy  przypisać  tę  samą  dziwność 
hiperjąder  S = — 1 co  hiperonom  A i mezonom  K~,  natomiast 
hiperjądrom  podwójnym  (rys.  2)  dziwność  S = —2. 


szawie  przez  zespól:  M.  Danysz,  K.  Garbowska,  J.  Pniewski 
T.  Pniewski,  J.  Zakrzewski,  1962). 

Autorzy  nie  wykluczali  możliwości  interpretacji  tego  przypadku 
jako  przykładu  podwójnego  hiperberylu  11,  uważając  ją  jednak 
za  mniej  prawdopodobną. 

Oznaczenia:  A miejsce  oddziaływania  mezonu  K~  (1,5  GeV/c) 
i produkcji  hiperonu  3~,  B miejsce  wychwytu  hiperonu  S~  przez 
lekkie  jądro  emulsji  (C,  N,  O)  i produkcji  hiperjądra  ^Be,  BC 
tor  AABe,  C miejsce  rozpadu  jf^Be,  CD  tor  hiperjądra  jjBe,  D 
miejsce  rozpadu  J^Be,  linie  przerywane  są  torami  mezonów 
K~  i n- 

Hiperjądra  podwójne  mogą  się  tworzyć  w reakcji 
wychwytu  hiperonów  E~  o dziwności  S = —2  (np.: 
£’“±12C  = ^Be-frf-f «+12,6  MeV).  Inne  cząstki  o 
dziwności  ujemnej  pod  wpływem  silnych  oddziaływań 
z nukleonami  w szybkim  procesie  przekazują  swą 
dziwność  tworzącej  się  cząstce  A,  najlżejszemu  z hi- 
peronów. W ten  sposób  poza  nukleonami  hiperony  A 
mogą  być  jedynymi  cząstkami  wchodzącymi  w skład 
materii  typu  jądrowego.  Możliwość  wiązania  hipe- 
ronu A w materii  jądrowej,  powolny  rozpad  hipero- 
nów i mezonów  K na  cząstki  oddziaływające  silnie, 
mimo  że  produkowane  były  w szybkim  akcie  zderzenia 
takich  cząstek,  wreszcie  stwierdzenie  skojarzonej  pro- 
dukcji hiperonów  i mezonów  K — stały  się  podstawą 
do  wprowadzenia  i ugruntowania  pojęcia  dziwności. 

Fizyka  hiperjąder  zajmuje  się  badaniem  własności 
hiperjąder,  oddziaływań  hiperonów  A z nukleonami 
oraz  dostarcza  pewnych  informacji  o nietrwałych 
zwykłych  strukturach  jądrowych.  Najcenniejszą  infor- 
macją uzyskiwaną  z analizy  kinematycznej  rozpadów 
energia  mezonowych  hiperjąder  jest  energia  wiązania  hipero- 
wiązania  nu  A (Ba),  zdefiniowana  jako  energia  potrzebna 
hiperonu  A do  usunięcia  go  z hiperjądra.  Wartości  Ba  rosną 
wraz  z liczbą  masową  hiperjądra  od  (0,1 3 ±0,5)  MeV 
dla  iH  do  (13,59  ±0,1 5)  MeV  dla  “N  sięgając  23  MeV 
dla  znacznie  cięższych  hiperjąder  (tabela). 


Energia  wiązania  hiperonu  A w różnych  hiperjądrach 


Hiper- 

jądro 

Ba,  MeV 

Hiper- 

jądro 

Ba , MeV 

Hiper- 

jądro 

Ba,  MeV 

3 

0,1 3 ±0,05 

7 

aBc 

5,16±0,08 

10 

^iB 

8,89±0,12 

aH 

2,04±0,04 

aU 

6,80±0,03 

“B 

10,24±0,05 

2, 39  ±0,03 

.4  Be 

6,84±0,05 

“b 

11,37±0,06 

^Hc 

3,12±0,02 

8,53  ±0,1 5 

13y— 

A'-' 

11,69±0,12 

«Hc 

4,25±0,10 

> 

6,71  ±0,04 

aC 

12,17±0,33 

5,58±0,03 

> 

7,88±0,15 

13,59±0,15 

Ciężkie  hiperjądra  obserwowane  w emulsji  fotograficznej: 
Ba^; 23  MeV  (wg  danych  uzyskanych  przez  laboratoria  Europej- 
skiej Współpracy  K~.  Energie  BA  wyznaczone  wg  programu  opra- 
cowanego przez  W.  Gajewskiego). 


W przypadku  rozpadów  niemezonowych  emisja 
nierejestrowanych  w emulsji  neutronów  czyni  te 
rozpady  na  ogół  mało  przydatnymi  do  identyfikacji 
i badania  własności  hiperjąder.  Hipertryt  rozpada  się 
mezonowo  niemal  w 100%,  w tym  w 2/3  z emisją 
mezonu  naładowanego.  W przypadku  bardzo  cięż- 
kich hiperjąder  dominują  rozpady  niemezonowe 


(>  99%).  Wartości  Ba  wyznaczone  dla  różnych 
hiperjąder  są  podstawą  do  badania  ich  struktury 
i trwałości  oraz  poznania  oddziaływań  cząstki  A 
z nukleonami. 


Analiza  oddziaływania  hiperonu  A 
z nukleonami  oraz  hiperonów  A między  sobą 

Hiperjądra  o liczbie  masowej  A < 5 nazywane  są  hiperjądra 
^-powłokowymi,  co  zgodnie  z powłokowym  modelem  s-  i p-powło- 
jądra  atomowego  odpowiada  założeniu,  że  wszystkie  kowe 
ich  nukleony  wraz  z hiperonem  A znajdują  się  w pow- 
łoce s.  Pozostałe  znane  hiperjądra  noszą  nazwę 
/7-powłokowych.  Mają  one  zamknięte  powłoki  s dla 
nukleonów  oraz  pewną  ich  liczbę  w powłoce  p 
(P3/2  lub  pi/2).  Zakaz  Pauliego  nie  wzbrania  hiperono- 
wi A,  jako  cząstce  różnej  od  protonu  i neutronu, 
lokować  się  w powłoce  zamkniętej  dla  nukleonów. 

Dopiero  w podwójnym  hiperjądrze  A*He  powłoka  .y 
jest  zamknięta  dla  wszystkich  trzech  składników  hi- 
perjądrowych.  Cząstka  A , wiązana  kolejno  z coraz 
cięższym  rdzeniem  jądrowym,  może  stale  być  loko- 
wana w najgłębszej  powłoce  s , co  uzasadnia  wzrost 
jej  energii  wiązania  wraz  z liczbą  masową  A aż  do  war- 
tości 23  MeV  dla  ciężkich  hiperjąder  obserwowanych 
w emulsji  fotograficznej.  W zwykłym  jądrze  związanie 
nowego  nukleonu  możliwe  jest  jedynie  w jego  ze- 
wnętrznej powłoce  i nie  prowadzi  do  wzrostu  energii 
wiązania  wraz  ze  wzrostem  liczby  A.  Przedstawiając 
oddziaływanie  hiperonu  A z rdzeniem  za  pomocą 
uproszczonego  średniego  potencjału,  mającego  po- 
stać prostokątnej  studni  o szerokości  zależnej  od 
rozmiarów  hiperjądra,  można  uzyskać  w przybliżeniu 
właściwy  związek  Ba  z liczbą  A. 

Dla  kilku  hiperjąder  udało  się  wyznaczyć  ich  spiny 
na  podstawie  danych  o względnej  częstości  wystę- 
wania  różnych  rozpadów  mezonowych.  Fakt,  że 
spiny  trzech  najprostszych  hiperjąder  (^H,  *H,  *He) 
równe  są  różnicy  spinów  ich  rdzeni  jądrowych  i spinu 
cząstki  A (odpowiednio:  1/2=1— V«,  0 = */*— 1U, 

0 = V2— V2)  wskazuje,  że  oddziaływanie  hiperonu  A 
z nukleonem  w stanie  singletowym  (wypadkowy  spin 
równy  0)  dominuje  nad  oddziaływaniem  trypletowym 
(wypadkowy  spin  równy  1 ). 

Energie  wiązania  hiperonu  A w hiperjądrach  zwier- 
ciadlanych: JJH  (=  p,  2w,  A)  i jjHc  (=  2 /?,  /?,  A)  są 
nieco  różne  i wynoszą  odpowiednio  (2,04 ±0,04) 

MeV  i (2,39  ±0,03)  MeV.  Poprawka  na  oddziaływanie 
kulombowskie  dwóch  protonów  w *He  powiększa 
jeszcze  tę  różnicę.  Wytłumaczenia  należy  szukać  w ła- 
maniu tzw.  symetrii  ładunkowej  w oddziaływaniu 
hiperonu  A z nukleonem,  tzn.  występowaniu  pewnej 
różnicy  między  oddziaływaniami  An  i Ap. 

Energia  Ba  wyznaczona  z rozpadu  pierwszej 
cząstki  A podwójnego  hiperjądra  ^®Be  jest  o (4,3  ±0,4) 

MeV  większa  od  wartości  Ba  uzyskanej  w drugim 
rozpadzie  zwykłego  już  hiperjądra  ®Be.  Można  stąd 
wnioskować,  że  oddziaływanie  między  hiperonami  A 
w stanie,  w jakim  są  związane  w podwójnym  hiper- 
jądrze, jest  przyciągające.  Zebrane  dane  o energii  Ba  oddziały  wa- 
umożliwily  ilościową  charakterystykę  oddziaływań  nie  An,  Ap 
hiperonu  A z nukleonami  (m.in.  zajmowali  się  tym:  i AA 
R.H.  Dalitz  — od  1958  r.,  B.W.Downs,  A.R.  Bod- 
mer,  R.C.  Herndon,  Y.C.  Tang,  A.  Gal,  J.  Dąbrow- 
ski, A.  Deloff).  Ustalono  w ten  sposób,  że  w struktu- 
rach hiperjądrowych  dominują  przyciągające  siły 
dwuciałowe  ANy  oraz  że  zasięg  tych  sił  jest  mniejszy 
od  zasięgu  sił  występujących  między  nukleonami. 

Zakłada  się,  że  w pierwszym  przybliżeniu  zasięgi  te 
odpowiadają  wymianie  dwóch  mezonów  ny  w od- 
różnieniu od  wymiany  jednego  mezonu  uważanej  za 
dominującą  w opisie  oddziaływań  między  nukleona- 
mi. Dokładniejsza  analiza  wskazuje  na  bardziej 
złożony  charakter  badanych  oddziaływań,  m.in. 
zakłada  się  obecnie  pewien  udział  sił  niecentralnych 
oraz  sił  trzyciałowych  typu  ANN.  Oczekuje  się,  że 
energia  wiązania  hiperonów  A w przypadku  stanów 
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wzbudzonych  najlżejszych  hiperjąder  lub  równoważna 
tej  informacji  znajomość  energii  wzbudzenia  winny 
stanowić  cenny  element  w analizie  oddziaływań 
hiperonu  A z nukleonami. 


Spektroskopia  hiperjądrowa 

Duże  intensywności  wiązek  mezonów  jakie  od 
1969  r.  zaczęto  uzyskiwać  przy  użyciu  wielkich 
akceleratorów,  umożliwiły  zastosowanie  do  badań 
hiperjądrowych  techniki  licznikowej.  W ten  sposób 
udało  się  wykryć  emisję  fotonów  y ze  stanów  wzbu- 
dzonych hiperjąder  o liczbie  masowej  4,  co  zapo- 
czątkowało badania  hiperjądrowej  spektroskopii  y. 
Również  metodami  licznikowymi  zaczęto  identyfiko- 
wać i wyznaczać  energie  mezonów  i zr  towarzyszących 
produkowanym  hiperjądrom,  co  z kolei  stworzyło 
podstawy  dla  spektroskopii  hiperjądrowej  innego 
typu,  opartej  na  analizie  energii  mezonów  tT  . 
stany  Podział  fenomenologiczny  stanów  wzbudzonych 
wzbudzone  hiperjąder  na  trzy  grupy  jest  następujący: 
hiperjąder  1)  stany  rezonansowe  o krótkim  czasie  życia  roz- 


padające się  w wyniku  emisji  cząstki  ciężkiej,  np.  nu- 
kleonu; 


Rys.  3.  Widmo  energii  kinetycznej  mezonu  n~  z wyraźnie  widocz- 
nym maksimum  rezonansowym  odpowiadającym  stanowi  rezo- 
nansowemu ąC*:  K-+11  C = 7T"+“C*,  “C*  (wg  da- 

nych Europejskiej  Współpracy  K~,  1969) 


Rys.  4.  Widmo  mezonów  n~  uzyskane  przy  użyciu  techniki  licz- 
nikowej dla  dwuciałowej  reakcji:  Af~-f1#0  = n“-f  JJO*.  Maksima 
reprezentują  widmo  energetyczne  “O : a dwa  stany  wysokowzbu- 
dzonc  (uznawane  za  rezonanse),  b stan  wzbudzony  nicrezonan- 
sowy,  c stan  podstawowy.  Obszar  BA  ^ 0 odpowiada  możliwo- 
ści emisji  hiperonu  (wg  B.  Povh  i inni,  1978) 


2)  stany  wzbudzone  zanikające  wraz  z emisją  fo- 
tonu; 

3)  stany  izomeryczne  o najdłuższym  czasie  życia, 
obserwowane  gdy  rozpad  hiperonu  konkuruje  z emisją 
fotonu  y lub  nawet  staje  się  od  niej  bardziej  prawdo- 
podobny. 

Istnieją  dane  eksperymentalne  wskazujące  na  moż-  pierwszy 
liwość  tworzenia  się  stanów  wzbudzonych  hiperjąder  zaobserwo- 
wszystkich  trzech  rodzajów.  Pierwszym  niewątpliwym  wany  stan 
przykładem  stanu  rezonansowego  hiperjądra  był  rezo  nar, sowy 
stan  wzbudzony  xjC,  powstający  w dwuciałowej 
reakcji  wychwytu  mezonu  K~  przez  jądro  węgla  12 : 

K~+12C  = 4 -”C*,  “C*  -> - w+“C. 

Produkcja  stanu  rezonansowego 12 C*  (rys.  3)  w proce- 
sie dwuciałowym  zaznacza  się  wyraźnie  w widmie  to- 
warzyszących mezonów  tC  . Efekt  ten  zaobserwowano 
najpierw  w emulsji  jądrowej,  a następnie  wykryto 
przy  użyciu  licznikowego  spektrometru  pionów. 

Dalszy  postęp  prac  prowadzonych  techniką  liczniko- 
wą doprowadził  do  odkrycia  kilku  nowych  wysoko- 
wzbudzonych  stanów  i poznania  na  tej  drodze  nowych 
przedstawicieli  struktur  hiperjądrowych:  hipertlenu 
16,  hipersiarki  32,  hiperwapnia  40  (B.  Povh  i inni, 

1975).  Analiza  reakcji  dwuciałowych  prowadzona 
za  pomocą  układu  elektronicznego  umożliwiła  wy- 
krycie wielu  stanów  wzbudzonych  (rys.  4),  jednak  w ten 
sposób,  w odróżnieniu  od  techniki  emulsyjnej, 
ustalony  został  jedynie  fakt  ich  produkcji,  natomiast 
nie  śledzono  ich  rozpadów.  Mimo  to  stany  te  uważa 
się  za  rezonansowe,  zanikające  w wyniku  emisji  hipe- 
ronu A czy  nukleonu. 

W przypadku  hipertlenu  “O  zaobserwowano  dwa 
stany  wysoko  wzbudzone,  jak  również  stan  podsta- 
wowy tego  hiperjądra  oraz  jeden  ze  stanów  najpraw- 
dopodobniej zanikający  w wyniku  emisji  fotonu  yt 
mimo  że  tego  fotonu  również  nie  obserwowano. 

Wszystkie  stany  badane  na  tej  drodze  znalazły  dobre 
uzasadnienie  w powłokowym  modelu  jądra  atomo- 
wego. Według  tego  modelu  cząstka  A powstająca 
z neutronu  lokuje  się  w jednej  z powłok  jądrowych, 


0,5  1,0  1,5  2,0  MeV 

energia 


Rys.  5.  Hiperjądrowa  linia  1,09  MeV  w widmie  y uzyskanym 
z tarczy  7Li  naświetlonej  zatrzymującymi  się  mezonami  K~. 
Widoczna  dodatkowo  linia  anihilacji  pozytonów  odpowiadająca 
energii  0,51  MeV  (wyniki  zespołu  CERN-Heidelberg-Warszawa . 
A.  Bamberger,  M.A.  Faessler,  U.  Lynen,  H.  Piekarz,  J.  Piekarz, 
J.  Pniewski.B.  Povh,H.G.  Ritter,  V.  Soergel,  1971).  W następnym 
eksperymencie  wykonanym  przez  zespół  CERN-Lyon-Warszawa 
linia  ta  została  rozszczepiona  na  dwie  przypisane  j*Hi  *He  (1979) 


218 


a po  usuniętym  neutronie  powstaje  luka  w zajmowanej 
przez  niego  powłoce.  Wyniki  te  dostarczyły  informacji 
o wielkości  sprzężenia  spinu  hiperonu  A z jego  mo- 
mentem orbitalnym. 

pierwsza  Pierwszą  hiperjądrową  linię  (rys.  5),  wyraźnie 
hiperjądrową  występującą  w widmie  y,  przypisano  jednemu  lub 
linia  widma  y jednocześnie  obu  hiperjądrom  JJH  i J}He,  tworzonym 
jako  wzbudzone  hiperfragmenty  w następstwie  wy- 
chwytu mezonów  K~  w tarczach  łLi  i 7Li.  Wzbudze- 
nie tych  hipeijąder  daje  się  tłumaczyć  modelowo  jako 
wynik  odwrócenia  spinu  cząstki  A związanej  z rdze- 
niem jądrowym  3H  lub  3He.  Ponieważ  stwierdzono, 
że  spiny  J}H  i ;}He  w stanie  podstawowym  są  równe  0, 
należy  sądzić,  że  stanom  wzbudzonym  odpowiadają 
wartości  spinów  równe  1.  Wyznaczenie  energii  wzbu- 
dzenia obu  hiperjąder  o masie  4 stanie  się  szczególnie 
ważnym  ogniwem  w analizie  oddziaływań  hiperonu  A 
z nukleonami.  Obecnie  wydaje  się,  że  obserwowana 
poprzednio  linia  1,09  MeV  powstała  w wyniku  na- 
łożenia się  dwóch  linii  niezbyt  od  siebie  odległych 
dających  się  przypisać  obu  hiperjądrom  o masie  4. 
Może  to  stanowić  przesłankę  wskazującą  na  zbliżone 
wielkości  sprzężenia  spinu  hiperonu  A ze  spinami 
protonu  i neutronu. 

izomeria  Hiperjądro  ^He  jest  przykładem  hiperjądra,  które  — 

hiperjądrową  jak  się  wydaje  — ma  izomeryczne  stany  wzbudzone. 

Wraz  z rozpadem  zachodzącym  w stanie  wzbudzo- 
nym wyzwolona  jest  energia  wzbudzenia,  o którą 


zmniejsza  się  wyznaczana  energia  wiązania  hiperonu  wzbudzenie 
A.  Technika  emulsyjna  wydaje  się  z kolei  być  naj-  izomeryczne 
lepsza  do  detekcji  tych  stanów.  W przypadku  jHe  ^He 
o istnieniu  takiego  stanu  można  wnioskować  na  pod- 
stawie występowania  odpowiedniego  stanu  wzbu- 
dzonego rdzenia  hiperjądrowego  będącego  jądrem  6He 
(M.  Danysz,  J.  Pniewski,  1962). 

Dobra  zdolność  rozdzielcza  widm  y powinna  umo- 
żliwić wykrycie  nisko  położonych  stanów  wzbudzo- 
nych hiperjąder,  natomiast  widma  energetyczne  to- 
warzyszących pionów  wydają  się  być  najbardziej 
przydatne  do  badania  wyżej  położonych  stanów, 
przede  wszystkim  stanów  rezonansowych,  które  po 
emisji  nukleonu  mogą  prowadzić  do  powstania  hiper- 
jąder lżejszych  przez  analogię  do  procesów  jądrowych. 

Można  oczekiwać,  że  dalszy  rozwój  fizyki  hiperjąder 
będzie  głównie  oparty  na  badaniach  spektroskopo- 
wych obu  typów.  Mimo  podjętych  bezpośrednich 
badań  nad  rozpraszaniem  swobodnych  cząstek  A 
na  protonach,  fizyka  hiperjądrową  jest  nadal  głów- 
nym źródłem  informacji  o oddziaływaniach  tych 
cząstek  z nukleonami  w obrębie  małych  energii. 

M.  Danysz,  J.  Pniewski  Delayed  disintegration  of  a heavy 
nuclear  fragment , Philos.  Mag.  44,  348  (1953);  D.H.  Davis, 

J.  Sacton  Hypernuclear  Physics , High  Energy  Physics,  vol.  2, 
p.  365,  New  York  1967;  J.  Pniewski,  J.  Zakrzewski  Hypernuclear 
spectroscopy:  A new  trend  in  hypernuclear  physics,  Nukleonika 
20,  43  (1975);  J.  Pniewski,  D.  Ziemińska  Present  status  of  exper- 
imental  research  of  hypernuclei,  Nukleonika  23,  797  (1978); 

J.  Pniewski  Początki  fizyki  hiperjąder.  Post.  Fiz.  30.  517  (1979). 


Energia  jądrowa 

Janusz  Mika 

W 1905  r.  Albert  Einstein  sformułował  szczególną 
teorię  względności,  która  obaliła  wiele  niewzruszo- 
nych, jak  się  wydawało  wówczas,  poglądów  w fizyce. 
Jednym  z najbardziej  rewelacyjnych  wniosków  wypły- 
wających z nowej  teorii  była  równoważność  masy 
i energii.  Równoważność  tę  wyraża  słynny  wzór 
E = mc2  Einsteina  E = mc2.  Masę  należy  więc  traktować  jako 
jedną  z form  energii,  która  może  przechodzić  w inne 
formy  energii. 

Masa  spoczynkowa  układu  związanego  (jak  krysz- 
tał, cząsteczka,  atom,  jądro  atomowe)  jest  mniejsza 
od  sumy  mas  spoczynkowych  składników  o wartość 
równoważną  energii  wiązania  układu,  czyli  energii 
potrzebnej  na  całkowite  rozdzielenie  składników. 
Dlatego  procesom  tworzenia  układów  związanych 
towarzyszy  wydzielanie  się  energii  (np.  energii  che- 
micznej podczas  spalania  lub  energii  jądrowej  podczas 
syntezy  lekkich  jąder).  Energia  wydziela  się  również 
przy  przejściu  układu  ze  stanu  słabo  związanego, 
tzn.  o mniejszej  energii  wiązania  na  jeden  składnik, 
w stan  związany  silniej  (np.  przy  rozszczepieniu  cięż- 
kich jąder).  Ponieważ  siły  wiązania  nukleonów  w ją- 
drze są  znacznie  potężniejsze  niż  siły  wiązania  elek- 
tronów w atomie  — energie  wydzielające  się  w reak- 
cjach jądrowych  są  ok.  milion  razy  większe  od  energii 
wydzielanych  w reakcjach  chemicznych  (np.  spalenie 
1 g węgla  najwyższej  wartości  opałowej  daje  zaledwie 
ok.  36  kJ,  a „spalenie”  1 g uranu  — 86  GJ). 
energia  O praktycznym  wykorzystaniu  energii  zawartej 
jądrowa  w postaci  masy  w jądrze  atomowym,  czyli  o energii 
jądrowej  można  było  mówić  dopiero  po  przeprowa- 
dzeniu pierwszej  reakcji  jądrowej  w skali  makrosko- 
powej. 

Zjawisko  rozszczepienia  jąder  uranu  pod  wpływem 
neutronów  zostało  odkryte  w 1938  r.  Stwierdzono, 
że  w reakcji  rozszczepienia  jądro  prawie  zawsze  dzieli 
się  na  dwa  fragmenty  i neutrony  swobodne,  przy  czym 
średnio  na  jeden  akt  rozszczepienia  przypada  ich  po- 
nad dwa.  Dzięki  temu  pojawiła  się  możliwość  uzy- 
skania łańcuchowej  reakcji  rozszczepienia  w skali 
makroskopowej.  Istotnie,  już  po  czterech  latach 
w Chicago  zbudowany  został  pierwszy  reaktor  jądro- 


wy (atomowy),  a wkrótce  potem  bomba  jądrowa  (ato- 
mowa). Po  czterdziestu  latach  od  odkrycia  reakcji 
rozszczepienia  znaczna  część  produkowanej  w świecie 
energii  elektrycznej  pochodzi  z reaktorów  jądrowych. 

Z energią  termojądrową  pochodzącą  z reakcji 
syntezy  lekkich  jąder  mamy  do  czynienia  na  co  dzień 
w postaci  energii  słonecznej.  Na  razie  nie  udało  się 
jednak,  mimo  ogromnych  wysiłków,  zbudować 
reaktora  termojądrowego,  w którym  reakcja  syntezy 
zachodziłaby  w sposób  kontrolowany,  chociaż  skon- 
struowano bombę  termojądrową  o mocy  tysiąc  razy 
przewyższającej  moc  bomby  atomowej  (-*  Energia 
termojądrowa). 


Reakcje  jądrowe  zachodzące 
w reaktorze 


Neutron,  jako  cząstka  obojętna,  odgrywa  szczególną 
rolę  w reakcjach  jądrowych,  ponieważ  w przeciwień- 
stwie np.  do  cząstek  a lub  protonów  wnikając  do  jądra 
nie  musi  pokonywać  sił  odpychania  elektrostatyczne- 
go; neutrony  o bardzo  nawet  małej  energii  kinetycznej 
mogą  więc  łatwo  wywoływać  reakcje  jądrowe.  Do 
najważniejszych  reakcji  jądrowych  z neutronami  za- 
chodzących w reaktorze  należą:  rozpraszanie  spręży- 
ste, rozpraszanie  niesprężyste,  wychwyt  radiacyjny 
i rozszczepienie  (-*  Reakcje  jądrowe). 

Reakcja  rozpraszania  sprężystego  nie  przechodzi 
przez  etap  jądra  złożonego  i polega  na  zderzeniu  neu- 
tronu z jądrem  przy  spełnieniu  zasad  zachowania 
energii  kinetycznej  i pędu.  Rozpraszanie  sprężyste 
zachodzi  głównie  na  lekkich  jądrach. 

W pozostałych  trzech  reakcjach  pierwszy  etap  jest 
taki  sam  i polega  na  utworzeniu  jądra  złożonego. 
Rozpraszanie  niesprężyste  zachodzi  w wypadku  roz- 
praszania neutronów  o dużych  energiach  (powyżej 
kilkuset  keV)  na  ciężkich  jądrach.  Energia  wzbudze- 
nia jądra  złożonego  jest  wówczas  na  tyle  duża,  że  na- 
stępuje powtórna  emisja  neutronu  o energii  niższej 


rozpraszanie 

sprężyste 

neutronu 


rozpraszanie 

niesprężyste 

neutronu 
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niż  energia  neutronu  padającego,  a nadwyżka  energii 
jest  wypromieniowana  w postaci  kwantu  y.  W tej 
sytuacji  nie  jest  zachowana  energia  kinetyczna, 
wychwyt  Jeśli  energia  wzbudzenia  jest  za  mała,  aby  spowodo- 

radiacyjny  wać  wyrzucenie  neutronu  z jądra,  w drugim  etapie 
neutronu  reakcji  jądro  przechodzi  do  stanu  podstawowego  wy- 
promieniowując  kwant  y,  a w wyniku  powstaje  jądro 
o liczbie  masowej  o jeden  większej.  Jest  to  reakcja 
wychwytu  radiacyjnego. 

reakcja  Jeśli  chodzi  o reakcję  rozszczepienia,  to  jak  wynika 
rozszczepie-  z kształtu  krzywej  na  rys.  1 , wszystkie  jądra  o liczbie 
nia  masowej  większej  niż  100  powinny,  zgodnie  z zasadą 

MeV 


Rys.  1.  Zależność  wiązania  nukleonu  w jądrze  od  liczby  masowej 
jądra  (zob.  też  rys.  1 str.  175) 


ABC  D E 


Rys.  2.  Deformacje  kropli  materii  jądrowej  w procesie  rozszcze- 
pienia 


zachowania  energii,  ulegać  spontanicznemu  roz- 
szczepieniu. Dlaczego  jądra  takie  występują  jednak 
w przyrodzie,  wyjaśnia  model  kroplowy  (-►  Modele 
jądrowe).  Rysunek  2 przedstawia  deformacje  kropli 
materii  jądrowej  w procesie  rozszczepienia,  a rys.  3 — 
zależność  energii  potencjalnej  jądra  od  kształtu  kropli. 


Rys.  3.  Zmiana  energii  potencjalnej  jądra  w procesie  rozszcze- 
pienia; punkty  A C E odpowiadają  stanom  kropli  z rys.  2, 
R,  i R,  oznaczają  promienie  fragmentów 


energia  2 rysunków  widać,  że  aby  wywołać  rozszczepienie, 
krytyczna  trzeba  jądru  dostarczyć  energię  równą  co  najmniej 
energii  krytycznej  (energii  aktywacji),  potrzebną  na 
pokonanie  krótkozasięgowych  sił  jądrowych.  Energia 
krytyczna  maleje  wraz  z liczbą  masową  jądra  i osiąga 
zero  przy  liczbie  równej  ok.  260.  Tak  więc  dopiero 
jądra  o liczbach  masowych  większych  niż  260  są  rze- 
czywiście niestabilne  ze  względu  na  spontaniczne  roz- 
szczepienie. 

Jądro  pochłaniające  neutron  uzyskuje  energię  równą 
różnicy  energii  wiązania  jądra  złożonego  i jądra  poch- 
łaniającego neutron  (energia  ta  jest  w przybliżeniu  rów- 
na energii  wiązania  na  1 nukleon  w powstałym  jądrze 
złożonym)  powiększoną  o energię  kinetyczną  padają- 
cego neutronu.  Jeśli  energia  krytyczna  jądra  złożone- 
go jest  mniejsza  niż  energia  wiązania  na  1 nukleon, 
wówczas  rozszczepienie  można  wywołać  za  pomocą 
neutronów  o dowolnie  niskich  energiach.  Taka  sytua- 
cja zachodzi  w wypadku  jądra  **5U,  które  ulega  roz- 
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szczepieniu  zgodnie  ze  schematem:  235U+1/i->  rozszczepie- 
-►  _fozszczepicnie_^  jeżeli  energia  kinetyczna  po-  236^ 
chłoniętego  neutronu  jest  równa  zeru,  to  energia 
wzbudzenia  jądra  złożonego  “‘U  jest  równa  różnicy 
energii  wiązania  jąder  “•U  i tj.  ok.  6,8  MeV, 
podczas  gdy  energia  krytyczna  236U  wynosi  jedynie 
6,6  MeV. 

Obok  “5U  drugim  izotopem  uranu  występującym 
w przyrodzie  jest  238U,  który  stanowi  99,3%  uranu 
naturalnego.  Energia  krytyczna  238 U wynosi  7,0  MeV, 
natomiast  różnica  energii  wiązania  jąder  239U  i 238U  próg  roz- 
tylko  5,5  MeV.  Tak  więc  minimalna  energia  kinetycz-  szczepienia 
na  neutronu  potrzebna  do  rozszczepienia  jądra  238U, 
czyli  tzw.  próg  rozszczepienia,  powinna  być  równa 
1,5  MeV.  Ze  względu  na  przybliżony  charakter  przy- 
toczonego rachunku  liczba  ta  nie  jest  dokładna, 
a w istocie,  jak  stwierdzono  doświadczalnie,  próg 
rozszczepienia  238U  wynosi  ok.  1,1  MeV,  tzn.  roz- 
szczepienie M8U  mogą  wywołać  neutrony,  których 
energia  kinetyczna  jest  co  najmniej  równa  1,1  MeV. 

Obok  dwóch  izotopów  uranu  występujących  w sta- 
nie naturalnym  istnieje  wiele  nuklidów  rozszczepial- 
nych wytwarzanych  sztucznie.  Do  najważniejszych 
z praktycznego  punktu  widzenia  należy  izotop  plu- 
tonu M9Pu,  którego  właściwości  ze  względu  na  roz- 
szczepienie są  podobne  do  właściwości  mU. 

Reakcja  rozszczepienia  jądra  uranu  czy  też  innego 
pierwiastka  rozszczepialnego  prowadzi  prawie  zawsze 
do  podziału  jądra  na  dwa  fragmenty  o mniej  więcej 
równych  masach.  Rozkład  mas  fragmentów  rozszcze- 
pienia przedstawia  rys.  4.  Jak  widać,  liczby  masowe 
większości  jąder  powstających  z rozszczepienia  są 


zawarte  pomiędzy  80  a 110  i pomiędzy  125  a 155. 
Obserwuje  się  również  tzw.  rozszczepienia  potrójne, 
ale  ich  udział  jest  niewielki,  tak  że  nie  mają  one 
istotnego  znaczenia  w łańcuchowej  reakcji  rozszcze- 
pienia. Jak  wynika  z rys.  5,  w miarę  zwiększania  się 
liczby  masowej  rośnie  stosunek  liczby  neutronów  do 
liczby  protonów  w jądrach  trwałych,  tak  że  podział 
jądra  na  dwa  fragmenty  prowadzi  do  nadmiaru 
neutronów  i emisji  swobodnych  neutronów  w liczbie 
od  1 do  6 na  jeden  akt  rozszczepienia.  Średnia  liczba 
neutronów  rozszczepieniowych  dla  235U  wynosi  2,44, 
jeśli  neutrony,  które  wywołały  rozszczepienie,  miały 
energie  0,025  eV.  Wraz  ze  wzrostem  energii  neutro- 
nów liczba  ta  rośnie  i osiąga  wartość  2,50  przy  energii 
neutronów  1 MeV.  Rozkład  energii  neutronów  roz- 
szczepieniowych dla  235U  pokazuje  rys.  6.  Maksymalna 
energia  neutronu  równa  się  ok.  10  MeV,  natomiast 
obliczona  na  podstawie  tego  rozkładu  średnia  energia 
wynosi  ok.  2 MeV.  Dla  neutronów  wtórnych  pocho- 


liczba  neutronów 


Rys.  5.  Zależność  między  liczbą  neutronów  i liczbą  atomową 
nuklidów  trwałych  (ścieżka  trwałości  nuklidów) 


Rys.  6.  Rozkład  energetyczny  neutronów  pochodzących  z roz- 
szczepienia 22*U 


z jakim  pojawiają  się  one  w reakcji  łańcuchowej, 
równe  jest  ok.  12,5  s.  W skali  procesów  zachodzących 
w reaktorze  jest  to  czas  bardzo  długi  i neutrony  opóź- 
nione odgrywają  zasadniczą  rolę  w praktycznej  reali- 
zacji łańcuchowej  reakcji  rozszczepienia. 

W reakcji  rozszczepienia  mU  ok.  0,1%  masy  jądra 
zamienia  się  w energię  dając  ok.  200  MeV.  Największa 
część  tej  energii  przypada  na  energię  kinetyczną  frag- 
mentów rozszczepienia,  reszta  zaś  na  energię  promie- 
niowania p i y.  Podobne  relacje  liczbowe  występują 
w odniesieniu  do  rozszczepienia  innych  jąder  roz- 
szczepialnych. 

Bardzo  ważną  z praktycznego  punktu  widzenia  rolę 
odgrywa  zależność  przekrojów  czynnych  od  energii 
padającego  neutronu.  Dla  większości  nuklidów  (wy- 
jątek stanowi  wodór)  przekrój  czynny  na  rozprasza- 
nie sprężyste  słabo  zależy  od  energii  i można  go  w 
praktyce  uważać  za  stały.  Natomiast  przekrój  czynny 


przekrój 
czynny 
na  pochła- 
nianie 


energia  neutronów 


Rys.  7.  Zależność  od  energii  neutronu  przekroju  czynnego  kadmu 
i indu  na  pochłanianie  neutronów 


Rys.  8.  Przekrój  czynny  na  pochłanianie  neutronów 


dzących  od  innych  jąder  rozszczepialnych  wartości 
parametrów  są  podobne. 

Emisja  neutronów  swobodnych  w procesie  roz- 
szczepienia nie  wyczerpuje  ich  nadmiaru,  tak  że 
fragmenty  rozszczepienia  również  zawierają  zbyt 
wielką  w stosunku  do  liczby  protonów  liczbę  neutro- 
nów, w związku  z tym  są  z reguły  /^-promieniotwórcze, 
tzn.  emitują  elektrony.  Poza  tym  niektóre  fragmenty 
neutrony  lub  nuklidy  powstające  z fragmentów  rozszczepienia 
opóźnione  emitują  neutrony.  Ze  względu  na  to,  że  neutrony  te 
nie  są  wydzielane  w momencie  rozszczepienia  jądra, 
nazywają  się  neutronami  opóźnionymi  w przeciwień- 
stwie do  pozostałych  neutronów  rozszczepieniowych, 
zwanych  neutronami  natychmiastowymi.  Udział 
neutronów  opóźnionych  jest  bardzo  mały  i w wypadku 
M5U  wynosi  ok.  0,7%,  natomiast  średnie  opóźnienie, 


na  rozpraszanie  niesprężyste  (rys.  7)  spada  bardzo 
silnie  wraz  z energią  i dochodzi  do  zera  przy  kilkuset 
keV;  zależność  od  energii  przekrojów  czynnych  na 
wychwyt  radiacyjny  i rozszczepienie  jest  podobna. 

Z tego  względu  wystarczy  rozpatrywać  sumę  tych 
przekrojów,  którą  przyjęto  nazywać  przekrojem 
czynnym  na  pochłanianie. 

W zakresie  od  zera  do  ok.  0,1  eV  energii  neutronów 
przekrój  czynny  na  pochłanianie  neutronów  maleje 
wraz  z energią  odwrotnie  proporcjonalnie  do  pier- 
wiastka kwadratowego  z energii.  Od  0,1  eV  do  ok. 

1 keV  rozciąga  się  zakres  energii  rezonansowych, 
w którym  występują  ostre  maksima  i minima.  Szcze- 
gólnie silne  pochłanianie  rezonansowe  neutronów  pochłanianie 
obserwuje  się  na  jądrach  nuklidów  rozszczepialnych,  rezonansowe 
np.  rys.  8 ukazuje  przebieg  całkowitego  przekroju  neutronów 
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czynnego  238U.  Wzrost  przekroju  czynnego  na  po- 
chłanianie neutronów  o małych  energiach  i efekt 
rezonansowy  mają  poważne  konsekwencje  praktyczne 
w reaktorze  jądrowym. 


Warunki  pracy  reaktora 
jądrowego 


Spowalnianie  neutronów 

Przekrój  czynny  na  rozszczepienie  oy  dla  nuklidów 
rozszczepialnych  rośnie  bardzo  szybko  wraz  ze 
zmniejszaniem  się  energii  padającego  neutronu.  W wy- 
padku mU  (rys.  9)  przy  energii  neutronów  10  keV 


Rys.  9.  Przekrój  czynny  2||U  i 2||U  na  rozszczepienie 


wynosi  on  4 b,  natomiast  przy  energii  0,025  eV  — 
579  b (1  b = 10"28  m2).  Tak  więc  zmniejszając  ener- 
gię neutronów  wywołujących  rozszczepienie  można 
zwiększyć  efektywność  reakcji  łańcuchowej.  W związ- 
moderator  ku  z tym  do  reaktora  wprowadza  się  moderator, 
którego  zadaniem  jest  spowalnianie  neutronów 
w reakcji  rozpraszania  sprężystego.  Reakcja  ta  prze- 
biega podobnie  jak  zderzenie  dwóch  kul  doskonale 
sprężystych.  Przy  zderzeniu  sprężystym  kula  poru- 
szająca się  (neutron)  przekazuje  część  swej  energii 
kinetycznej  kuli  nieruchomej  (jądro).  Ilość  przekaza- 
nej energii  zależy  od  kąta  padania  i średnio  jest  tym 
większa,  im  mniejsza  jest  masa  kuli  nieruchomej 
w stosunku  do  masy  kuli  ruchomej.  Widać  więc,  że 
najefektywniej  spowalnianie  neutronów  zachodzić 
będzie  na  lekkich  jądrach.  Dobry  moderator  musi 
spełniać  poza  tym  dwa  dodatkowe  warunki.  Po 
pierwsze,  jego  gęstość  musi  być  dostatecznie  duża  (nie 
może  on  być  np.  w stanie  gazowym),  a po  drugie,  jego 
przekrój  czynny  na  wychwyt  neutronów  musi  być 
stosunkowo  niewielki. 

W obecności  moderatora  proces  spowalniania  trwa 
dopóty,  dopóki  neutrony  nie  osiągną  energii  porów- 
nywalnych z energią  ruchu  cieplnego  i nie  znajdą 
się  w równowadze  termicznej  z otoczeniem.  O takich 


Rys.  10.  Rozkład  Maxwella  prędkości  neutronów;  vp  — pręd- 
kość najbardziej  prawdopodobna,  va  — prędkość  średnia 


neutronach  mówi  się,  że  mają  energię  termiczną  lub 
neutrony  że  są  neutronami  termicznymi.  Rozkład  energii  neu- 
termiozne  tronów  termicznych  możr  a z dość  dużą  dokładnością 
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opisać  za  pomocą  rozkładu  Maxwella  (rys.  10).  W 
temperaturze  300  K średnia  prędkość  neutronów 
wynosi  2200  m/s,  a średnia  energia  0,025  eV. 


Bilans  neutronów 


Warunki,  w których  może  zachodzić  w sposób  sta- 
cjonarny łańcuchowa  reakcja  rozszczepienia  z udzia- 
łem neutronów  termicznych,  przeanalizujemy  na  przy- 
kładzie nieskończonego  układu  materialnego,  zawie- 
rającego jednorodną  mieszaninę  paliwa  (np.  uran  na- 
turalny) i moderatora.  Przyjmijmy,  że  w pewnej 
chwili  w układzie  znajduje  się  S swobodnych  neutro- 
nów termicznych.  Wprawdzie  neutrony  ulegają  roz- 
padowi, jednak  ich  czas  życia  (rzędu  12  min)  jest  bar- 
dzo duży  w porównaniu  z czasem  charakteryzującym 
łańcuchową  reakcję  rozszczepienia.  Tak  więc  można 
uważać  wszystkie  neutrony  termiczne  w reaktorze  za 
cząstki  trwałe,  które  zostaną  w rozpatrywanym 
układzie  nieskończonym  pochłonięte. 

Ponieważ  pochłanianie  w moderatorze  prowadzi 
jedynie  do  wychwytu  radiacyjnego,  tylko  fS  neutro- 
nów liczy  się  w dalszym  bilansie,  gdzie/oznacza  praw- 
dopodobieństwo pochłonięcia  neutronu  termicznego 
w paliwie,  czyli  tzw.  współczynnik  wykorzystania 
cieplnego.  Zgodnie  z definicją /jest  zawsze  mniejsze 
od  jedności.  Pochłonięcie  neutronu  w paliwie  nie 
oznacza  jeszcze,  że  wywoła  on  rozszczepienie.  Jeśli 
a wyraża  stosunek  liczby  neutronów  powodujących 
rozszczepienie  do  liczby  neutronów  pochłoniętych 
w reakcji  wychwytu  radiacyjnego  w paliwie,  to  osta- 
tecznie liczba  rozszczepień  wywołanych  przez  S 
neutronów  termicznych  będzie  równa  a fS.  Ponieważ 
w 1 akcie  rozszczepienia  powstaje  średnio  v neutro- 
nów rozszczcpieniowych,  to  liczba  neutronów  wtór- 
nych przypadająca  na  S neutronów  termicznych  rów- 
nać się  będzie  v<xfS  albo  r)fSy  gdzie  *?  = v a oznacza 
średnią  liczbę  neutronów  wtórnych  na  1 akt  pochło- 
nięcia w paliwie. 

Neutrony  prędkie  o energii  większej  niż  1,1  MeV 
mogą  wywołać  rozszczepienie  23BU  (zob.  rys.  8).  Pro- 
wadzi to  do  zwiększenia  liczby  neutronów  prędkich 

0 tzw.  współczynnik  efektu  prędkiego  s , który  z de- 
finicji jest  większy  lub  co  najmniej  równy  jedności. 
Tak  więc  całkowita  liczba  neutronów  prędkich  po- 
chodzących od  S neutronów  termicznych  jest  równa 
erj/S, 

Neutrony  prędkie  są  spowalniane  w moderatorze 

1 mogą  zostać  pochłonięte  w 238U  w zakresie  energii 
rezonansowych.  Jeśli  przez  p oznaczyć  prawdopodo- 
bieństwo uniknięcia  wychwytu  rezonansowego  przez 
neutrony  o energiach  wyższych  niż  energia  termiczna, 
to  ostatecznie  całkowita  liczba  neutronów  w pokole- 
niu następnym,  pochodząca  od  S neutronów  w poko- 
leniu poprzednim,  równać  się  będzie  perjfS. 

Iloczyn  czterech  czynników  k = ptnf  nazywa  się 
współczynnikiem  mnożenia  w układzie  nieskończo- 
nym. Warunkiem  tego,  aby  reakcja  łańcuchowa  prze- 
biegała w sposób  stacjonarny,  jest  stała  liczba  neutro- 
nów w kolejnych  pokoleniach,  czyli  k — 1.  Wtedy 
mówi  się,  że  rozpatrywany  układ  jest  krytyczny. 
Gdy  k < 1,  to  w kolejnych  pokoleniach  liczba  neu- 
tronów maleje  i reakcja  łańcuchowa  zanika,  a układ 
nazywany  jest  układem  podkry tycznym.  Natomiast 
gdy  k > 1,  to  liczba  neutronów  rośnie,  a układ  jest 
nadkrytyczny.  Układ  krytyczny  może  działać  w za- 
sadzie przy  dowolnej  gęstości  neutronów,  a co  za  tym 
idzie  — przy  dowolnej  mocy. 

W praktyce  każdy  układ  fizyczny  jest  skończony 
i neutrony  mogą  uciekać  poza  jego  granicę.  Prawdo- 
podobieństwo uniknięcia  tej  ucieczki  oznacza  się 
zwykle  przez  P i do  czterech  czynników  perif  trzeba 
dołączyć  piąty;  otrzymuje  się  w ten  sposób  tzw.  efek- 
tywny współczynnik  mnożenia  w układzie  skończo- 
nym kct  = Ppsrif=  Pk.  Tak  jak  poprzednio  — 
układ  skończony  jest  podkry  tyczny  przy  kot  < 1, 
krytyczny  przy  kot  = 1 i nadkrytyczny  przy  kot  > 1 • 
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Dotychczas  rozpatrywany  układ  składający  się 
z jednorodnej  mieszaniny  paliwa  i moderatora  byłby 
z praktycznego  punktu  widzenia  zupełnie  nieprzy- 
datny. Zwykle  w reaktorze  paliwo  rozmieszcza  się 
w moderatorze  w postaci  regularnej  siatki  elementów 
paliwowych.  Ponieważ  w paliwie  pochłanianie  neu- 
tronów zarówno  w zakresie  energii  termicznych  jak 
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Rys.  11.  Rozkład  gęstości  neutronów  termicznych  i rezonanso- 
wych w reaktorze  niejednorodnym 


i rezonansowych  jest  znacznie  silniejsze  niż  w mode- 
ratorze, to  i gęstość  neutronów  jest  mniejsza  (rys.  11). 
Powoduje  to  zmniejszenie  prawdopodobieństwa  po- 
chłonięcia neutronu  w paliwie,  co  pociąga  za  sobą 
zmniejszenie  współczynnika  wykorzystania  cieplnego 
fi  zwiększenie  prawdopodobieństwa  uniknięcia  wy- 
chwytu rezonansowego  p.  Ostatecznie  jednak  iloczyn 
pf  w reaktorze  niejednorodnym  o odpowiednio  do- 
branym stosunku  ilości  paliwa  i moderatora  może  być 
znacznie  większy  niż  w odpowiednim  układzie  jedno- 
rodnym. 

Dążenie  do  najkorzystniejszego  bilansu  neutronów 
w reaktorze  nie  jest  główną  przyczyną  stosowania 
elementów  paliwowych  i struktury  niejednorodnej. 
Po  pierwsze,  większość  nuklidów  powstających  w pro- 
cesie rozszczepienia  jest  silnie  radioaktywna  i trzeba 
koniecznie  izolować  je  od  otoczenia  (najwygodniej- 
szym rozwiązaniem  jest  paliwo  otoczone  szczelną 


Rys.  12.  Przekroje  elementów  paliwowych:  a)  element  wieloprę- 
towy;  b)  element  płytkowy;  c)  element  rurowy;  d)  element  z płytek 
profilowanych 


koszulką  metalową).  Po  drugie,  w procesie  rozszczepie- 
nia w paliwie  wydziela  się  ciepło  i trzeba  je  odprowa- 
dzać na  zewnątrz  reaktora.  W tym  celu  przez  reaktor 
przepuszcza  się  chłodziwo,  które  omywa  elementy 
paliwowe,  odbiera  od  nich  ciepło  i oddaje  je  poza 
reaktorem.  Aby  uzyskać  jak  najlepsze  warunki  od- 
bioru ciepła  stosuje  się  elementy  paliwowe  o bardzo 
silnie  rozwiniętej  powierzchni  (na  rys.  12  pokazano 
przekroje  takich  elementów). 


Stany  nieustalone  reaktora 


Omówione  już  zostały  warunki,  w których  można 
zrealizować  stacjonarną  reakcję  łańcuchową  rozszcze- 
pienia w układzie  krytycznym.  Zrozumiałą  jest  jed- 
nak rzeczą,  iż  w praktyce  reaktor  jądrowy  często 
znajduje  się  w stanie  podkrytycznym  lub  nadkrytycz- 
nym,  choćby  w związku  z koniecznością  jego  urucha- 
miania i zatrzymywania,  a więc  trzeba  zmieniać  moc 
reaktora. 

Moc  reaktora,  w którym  efektywny  współczynnik 
mnożenia  wynosi  ke r,  a średni  czas  życia  jednego  po- 
kolenia neutronów  X,  w przybliżeniu  rośnie  lub  ma- 
leje wykładniczo  zgodnie  z wzorem 


gdzie  M0  oznacza  początkową  wartość  mocy.  Moc 
reaktora  maleje  lub  rośnie  tym  szybciej,  im  bardziej 
ke(  różni  się  od  jedności,  dlatego  też  różnicę  q = 
= ket—  1 przyjęto  nazywać  reaktywnością.  Im  więk- 
sza jest  reaktywność  danego  reaktora  (dodatnia  lub 
ujemna),  tym  gwałtowniejsze  zmiany  mocy  w nim 
zachodzą. 

Czas  życia  neutronów  (przy  pominięciu  neutronów 
opóźnionych)  w reaktorze,  X (drugi  parametr,  który 
określa  szybkość  zmian  mocy  reaktora),  zawarty  jest 
w granicach  10-7-I0~3  s.  Przy  takich  wartościach 
nawet  niewielkie  zmiany  reaktywności  powodowałyby 
tak  gwałtowny  spadek  lub  wzrost  mocy  reaktora,  że 
w praktyce  niemożliwa  byłaby  bezpieczna  jego  eksplo- 
tacja.  Udział  neutronów  opóźnionych  zwiększa  jed- 
nak czas  życia  neutronów  o kilka  rzędów,  tak  że  X 
wynosi  ok.  0,1  s,  a to  już  umożliwia  regulację  reak- 
tora. 

Wzór  na  moc  reaktora  obowiązuje  jedynie  wtedy, 
gdy  reaktywność  q < 0,007,  tzn.  jest  mniejsza  od 
udziału  neutronów  opóźnionych.  Po  przekroczeniu 
przez  reaktywność  tej  granicy,  neutrony  opóźnione 
przestają  już  praktycznie  wpływać  na  przebieg  reakcji 
łańcuchowej,  a o zachowaniu  się  reaktora  decydują 
jedynie  neutrony  natychmiastowe  o bardzo  krótkim 
czasie  życia.  Tak  więc  eksploatację  reaktora  trzeba 
prowadzić  tak,  aby  nigdy  reaktywność  nie  zbliżyła 
się  do  granicy  0,007. 

Zasadniczym  czynnikiem  regulującym  pracę  reakto- 
ra są  sprzężenia  temperaturowe,  które  polegają  na 
tym,  że  wzrost  mocy  powoduje  wzrost  temperatury, 
ten  z kolei  wywołuje  zmianę  przekrojów  czynnych, 
a co  za  tym  idzie  zmianę  reaktywności.  W większości 
reaktorów  występują  ujemne  sprzężenia  temperaturo- 
we i wzrost  gęstości  neutronów  powoduje  spadek 
reaktywności.  Ujemne  sprzężenie  temperaturowe  sta- 
nowi oczywiście  naturalny  czynnik  stabilizujący  pracę 
reaktora. 

W czasie  normalnej  eksploatacji  reaktora  zachodzą 
powolne  zmiany  parametrów  jądrowych,  związane 
z tworzeniem  się  produktów  rozszczepienia  oraz 
zmianą  składu  paliwa.  Na  ogół  zmiany  te  powodują 
stopniowy  spadek  reaktywności.  Dlatego  też  zwykle 
okres  eksploatacji  paliwa  w reaktorze  zależy  od  czasu, 
w ciągu  którego  reaktor  staje  się  podkry tyczny.  Nie- 
kiedy na  okres  ekpsloatacj i wpływają  również  zmiany 
strukturalne  zachodzące  w paliwie. 

Produkty  rozszczepienia  często  pochłaniają  neu- 
trony, wywierają  więc  ujemny  wpływ  na  reaktywność 
i z tego  względu  są  nazywane  truciznami.  Rozróżnia 
się  dwie  grupy  trucizn:  stałe  i przejściowe.  Pierwsza 
grupa  obejmuje  kilkadziesiąt  nuklidów  trwałych 
i długożyjących,  z których  najważniejszy  jest  izotop 
samaru  149Sm  o przekroju  czynnym  na  pochłanianie 
neutronów  termicznych  równym  5 104  b.  W grupie 
trucizn  przejściowych  istotną  rolę  odgrywa  właściwie 
jedynie  izotop  ksenonu  135Xe,  który  odznacza  się 
niezwykle  dużym  przekrojem  czynnym  na  pochłania- 
nie neutronów  termicznych  (2-1 06  b).  Czas  życia 
135Xe  wynosi  19,2  h,  natomiast  wydajność  w procesie 
rozszczepienia  ok.  6,3%.  Z tego  pewna  część  powstaje 
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bezpośrednio  z rozszczepienia,  reszta  zaś  w wyniku 
reakcji  rozpadu: 
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Czas  życia  135Cs  jest  rzędu  3 • 106  lat,  tak  że  z praktycz- 
nego punktu  widzenia  jest  on  nuklidem  trwałym. 

Fakt,  że  13&Xe  powstaje  głównie  z rozpadu  izotopu 
jodu  13&J,  powoduje  bardzo  ważne  z punktu  widzenia 
eksploatacji  reaktorów  zjawisko  tzw.  jamy  jodowej. 
Polega  ono  na  tym,  że  po  upływie  określonego  czasu 
nieprzerwanej  pracy  reaktora  przy  ustalonej  mocy 
ilość  ksenonu  osiąga  wartość  nasycenia  w wyniku 
ustalenia  się  równowagi  pomiędzy  powstawaniem 
jąder  135Xe  z rozpadu  133J  a ich  przemianą  w 136Xe 
wywołaną  pochłanianiem  neutronów.  Wzrost  ilości 
ksenonu  w reaktorze  zmniejsza  reaktywność,  czyli 
wywołuje  zatrucie.  Nagłe  wyłączenie  reaktora  powo- 
duje wzrost  zatrucia  ksenonem,  który  w dalszym  ciągu 
powstaje  z rozpadu  jodu,  a nie  jest  usuwany  z reaktora 
przez  pochłanianie  neutronów.  Dopiero  po  upływie 
ok.  10  h po  wyłączeniu  zatrucie  ksenonem  zaczyna  się 
zmniejszać  wskutek  rozpadu  zarówno  jodu  jak  i kse- 
nonu. Wielkość  jamy  jodowej  zależy  od  mocy  reakto- 
ra, a samo  zjawisko  występuje  nie  tylko  przy  wyłącze- 
niu, ale  także  przy  zmianach  mocy  reaktora. 

Zmiany  składu  paliwa  w czasie  eksploatacji  reak- 
tora polegają  przede  wszystkim  na  wypalaniu  się 
nuklidów  rozszczepialnych.  Gdy  paliwem  jest  uran 
naturalny  lub  wzbogacony  izotopem  235U,  to  stopnio- 
wo zmniejsza  się  koncentracja  tego  izotopu.  Z drugiej 
strony  pochłanianie  neutronów  w 238U  prowadzi  do 
powstawania  plutonu  239Pu 
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Okazuje  się,  że  jądro  238Pu  ma  właściwości  bardzo 
zbliżone  do  właściwości  235U.  Ma  ono  bardzo  duży 
przekrój  czynny  na  rozszczepienie  pod  wpływem  neu- 
tronów termicznych,  a średnia  liczba  neutronów 
rozszczepieniowych  na  1 akt  rozszczepienia  wynosi 
2,91.  Jest  więc  pluton  doskonałym  paliwem  reaktoro- 
wym. 

Zjawisko  powstawania  nuklidów  rozszczepialnych 
z materiałów  rodnych,  takich  jak  np.  238U,  charakte- 
ryzuje współczynnik  przemiany  paliwa  określony  jako 
stosunek  liczby  jąder  uzyskanych  nuklidów  rozszcze- 
pialnych do  liczby  wypalonych  jąder  paliwa  przy  koń- 
cu okresu  eksploatacji.  W reaktorach  termicznych 
z uranem  naturalnym  współczynnik  przemiany  się- 
gać może  0,7.  Jeśli  współczynnik  przemiany  jest 
większy  od  jedności,  to  zachodzi  tzw.  powielanie  pali- 
wa. W praktyce  powielanie  paliwa  udało  się  dotych- 
czas zrealizować  jedynie  w reaktorach  prędkich. 

Oprócz  cyklu  uranowo-plutonowego  istnieje  rów- 
nież cykl  torow-o-uranowy,  w którym  nuklidem  rod- 
nym jest  232Th,  a powstającym  z niego  nuklidem  roz- 
szczepialnym pod  wpływem  neutronów  termicznych 
jest  233U.  Cykl  torowo-uranowy  jest  bardzo  atrakcyj- 
ny, gdyż  istnieje  możliwość  powielania  paliwa  również 
w reaktorach  termicznych. 

Omówione  wyżej  zmiany  izotopowa  nie  wyczerpują 
wszystkich  zjawisk  zachodzących  w paliwie  w czasie 
eksploatacji  reaktora.  Paliwo  staje  się  mieszaniną  wie- 
lu  nuklidów  z grupy  aktynowców.  Część  z tych  nukli- 
dów ma  właściwości  materiałów  rodnych,  a część  — 
materiałów  rozszczepialnych. 


Sterowanie  reaktorem 


Metody  sterowania  polegają  na  zmianie  objętości  pr^v 
paliwa,  moderatora,  reflektora  lub  substancji  pochła-  sterownicze 
niającej  neutrony.  W reaktorach  termicznych  naj- 
częściej stosuje  się  ruchome  pręty  sterownicze  wyko- 
nane z materiałów  silnie  pochłaniających  neutrony 
termiczne,  takich  jak  kadm  lub  bor.  Można  je  podzie- 
lić na  trzy. grupy: 

1)  Pręty  bezpieczeństwa,  wprowadzające  do  układu 
dużą  reaktywność  ujemną,  służące  do  gwałtownego 
wyłączania  reaktora.  Są  one  połączone  z mechaniz- 
mem napędowym  — zwykle  elektrycznym,  lub  też 
hydraulicznym  albo  pneumatycznym.  Pręty  bezpie- 
czeństwa w wypadku  awarii  spadają  do  rdzenia  pod 
wpływem  siły  ciężkości.  Aby  przyspieszyć  ich  spada- 
nie mogą  być  zastosowane  wyrzutnie  stalowe  lub  ła- 
dunki wybuchowe. 

2)  Pręty  kompensacyjne,  służące  do  zmniejszania 
reaktywności  po  wstępnym  okresie  eksploatacji  paliwa. 

3)  Pręty  regulacyjne,  powodujące  niewielkie  stosun- 
kowo zmiany  reaktywności,  służące  do  kompensacji 
przypadkowych  odchyleń  mocy  reaktora  od  stanu 
równowagi,  a także  do  uruchamiania  i zatrzymywania 
reaktora  (il.  43,  tabl.  12). 

Często  w reaktorach  energetycznych  zamiast  prę- 
tów kompensacyjnych  stosuje  się  trucizny,  które  wy- 
palają  się  w trakcie  eksploatacji.  Zjawisko  pochłania- 
nia neutronów  w prętach  sterowniczych  stosuje  się 
również  do  wytwarzania  nuklidów  promieniotwór- 
czych. W reaktorach  prędkich,  ze  względu  na  małe 
pochłanianie  neutronów  o dużych  energiach,  zwykle 
do  sterowania  reaktorem  stosuje  się  ruchome  ele- 
menty paliwowe  lub  ruchome  części  reflektora. 


Teoria  transportu  neutronów 
i obliczanie  reaktorów 

Wyznaczenie  wielkości  określających  efektywny 
współczynnik  mnożenia  oraz  innych  wielkości  istot- 
nych z punktu  widzenia  eksploatacji  reaktora  wy- 
maga znajomości  przekrojów  czynnych  i rozkładu 
neutronów  w rozpatrywanym  układzie.  Pomiary  prze- 
krojów Czynnych  należą  do  dziedziny  fizyki  jądrowej,  r 
natomiast  do  fizyki  reaktorowej  należą  pomiary  lub 
teoretyczne  przewidywanie  rozkładu  neutronów. 

Opisu  zachowania  się  swobodnych  neutronów 
w ośrodku  materialnym  dostarcza  dział  fizyki  staty- 
stycznej zwany  teorią  transportu  neutronów.  Pod- 
stawowym równaniem  tej  teorii  jest  liniowe  równanie  teorja 
Boltzmanna,  które  swą  liniowość  zawdzięcza  założę-  transportu 
niu,  że  zderzenia  pomiędzy  neutronami  są  niezwykle  neutronów 
mało  prawdopodobne  i można  je  pominąć.  Poza  tym 
zakłada  się,  że  neutrony  poruszają  się  zgodnie  z za- 
sadami mechaniki  klasycznej,  a efekty  relatywistyczne 
i kwantowe  są  pomijalne. 

Rozkład  neutronów  opisuje  funkcja  N(r,  v,  t ), 
w której  argumentami  są:  wektor  położenia  neutronu 

r,  wektor  prędkości  v i czas  /.  Jej  sens  fizyczny  jest  ta- 
ki, że  N(ry  v , t)ArAv  oznacza  średnią  liczbę  neutronów 
znajdujących  się  w chwili  / w elemencie  objętości  Ar 
wokół  punktu  r o prędkościach  zawartych  w „ele- 
mencie” Av  wokół  prędkości  v.  Równanie  Boltzmanna  równanie 
wyraża  bilans  neutronów  wchodzących  i wychodzą-  Boltzmanna 
cych  z elementu  ArAv  i jest  równaniem  różniczkowo- 
-całkowym. 


Jak  każde  urządzenie  wytwarzające  energię,  reaktor 
musi  być  wyposażony  w układ  sterowania,  ponieważ 
stabilizujące  działanie  ujemnego  sprzężenia  tempera- 
turowego jest  niewystarczające,  a poza  tym  zachodzi 
konieczność  uruchamiania  i wyłączania,  a także  zmia- 
ny mocy  reaktora. 


Stany  statyczne  reaktorów 

W rzeczywistych  sytuacjach  fizycznych  rozwiązywa- 
nie równania  Boltzmanna  jest,  nawet  przy  użyciu 
komputerów,  bardzo  uciążliwe;  a niekiedy,  przy  ist- 
niejących możliwościach  obliczeniowych,  niewyko- 
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przybliżenie  nalne.  Z tego  względu  w obliczeniach  reaktorowych 
dyfuzyjne  stosuje  się  z reguły  metody  przybliżone.  Do  najważ- 
i wielo-  niejszych  z nich  należą:  przybliżenie  ^dyfuzyjne, 
grupowe  w którym  zakłada  się,  że  funkcja  A(r,j,  /)  zależy 

tylko  od  wartości  bezwzględnej  wektora  v,  tzn.  tylko 
od  energii  neutronu,  a nie  od  kierunku  jego  prędkości 
oraz  przybliżenie  wielogrupowe,  w którym  przyjmuje 
się,  że  energia  neutronów  może  przybierać  tylko  war- 
tości dyskretne. 

Obliczenia  reaktora  jądrowego  są  wykonywane 
zwykle  w kilku  etapach  za  pomocą  programów  nu- 
merycznych na  maszynę  cyfrową,  czyli  tzw.  kodów 
obliczenia  reaktorowych.  Pierwszy  etap  stanowią  obliczenia 
komórkowe  komórkowe.  Polegają  one  na  znajdowaniu  uśrednio- 
nych parametrów  charakteryzujących  rozkład  neutro- 
nów w komórce  elementarnej  reaktora  niejednorod- 
nego. Przez  komórkę  elementarną  reaktora  rozumie 
się  element  paliwowy,  tzn.  paliwo  wraz  z koszulką, 
otoczone  warstwą  chłodziwa  i moderatora.  Dla 
uproszczenia  obliczeń  zwykle  zakłada  się,  że  komórka 
elementarna  ma  symetrię  cylindryczną,  a reaktor  za- 
stępuje się  układem  nieskończonym  składającym  się 
z takich  komórek. 

Obliczenia  komórkowe  są  prowadzone  w przybliże- 
niu wielogrupowym  dla  kilkudziesięciu  grup  energe- 
tycznych. Na  ogół  nie  stosuje  się  przybliżenia  dyfu- 
zyjnego, gdyż  w komórce,  która  ma  stosunkowo  nie- 
wielki rozmiar  i zawiera  materiały  silnie  pochłaniające 
neutrony  termiczne  lub  rezonansowe,  prowadziłoby 
to  do  zbyt  dużych  błędów.  W wyniku  obliczeń  ko- 
mórkowych otrzymuje  się  tzw.  stałe  wielogrupowe, 
charakteryzujące  energetyczny  rozkład  neutronów 
uśredniony  na  cały  obszar  komórki, 
obliczenia  Drugi  etap,  tzw.  obliczenia  widmowe,  polega  na 
widmowe  redukcji  kilkudziesięciu  grup  energetycznych  do 
kilku  (zwykle  nie  więcej  niż  czterech)  przez  odpowied- 
nie procedury  uśredniania.  W widmowych  kodach 
reaktorowych  uwzględnia  się  w sposób  przybliżony 
to,  że  rozkład  neutronów  zmienia  się  od  komórki  do 
komórki. 

Na  podstawie  wyników  obliczeń  komórkowych 
i widmowych  można  określić  czynniki  wchodzące 
w skład  wzoru  na  współczynnik  mnożenia  k.  Tak 
więc  obliczenia  komórkowe  i widmowe  odpowiadają 
obliczeniu  współczynnika  mnożenia  nieskończonego 
układu  niejednorodnego. 

obliczenia  Trzeci  etap  stanowią  obliczenia  krytyczne.  Z reguły 
krytyczne  polegają  one  na  rozwiązywaniu  układu  równań  dyfu- 
zyjnych dla  kilku  grup  energetycznych  przy  użyciu 
stałych  znalezionych  w poprzednim  etapie  obliczeń. 
W wyniku  otrzymuje  się  efektywny  współczynnik 
mnożenia  ket.  Tak  więc  obliczenia  krytyczne  w istocie 
rzeczy  sprowadzają  się  do  znalezienia  prawdopodo- 
bieństwa uniknięcia  ucieczki  neutronów  z układu, 
zestaw  Obliczenia  komórkowe,  widmowe  i krytyczne  moż- 
wykładniczy  na  sprawdzać  doświadczalnie  na  zestawach  wykładni- 
i zestaw  czych  lub  krytycznych.  Zestawy  takie  zbudowane  są 
krytyczny  z takich  samych  materiałów  co  reaktor  i mają  tę  samą 
strukturę  komórki  podstawowej.  Zestaw  wykładniczy 
ma  zbyt  małe  rozmiary,  aby  osiągnąć  stan  krytyczny. 
Jego  nazwa  wynika  stąd,  że  rozkład  neutronów  po- 
chodzących z umieszczonego  w nim  źródła  ma  charak- 
ter wykładniczy.  Zestaw  krytyczny  jest  właściwie  reak- 
torem o bardzo  małej  mocy,  w którym  chłodzenie  za- 
pewnia konwekcja  naturalna  powietrza  lub  wody. 
W związku  z tym  koszt  budowy  zestawu  krytycznego 
jest  znacznie  niższy  niż  koszt  budowy  reaktora  o peł- 
nej mocy,  szczególnie  reaktora  energetycznego.  Poza 
tym  zestaw  krytyczny  może  być  łatwo  przebudowany, 
co  pozwala  na  sprawdzanie  różnorodnych  rozwiązań 
konstrukcyjnych  reaktora. 

obliczenia  Dalszym  krokiem  w obliczeniach  reaktorowych  są 
eksploafa-  obliczenia  eksploatacyjne,  których  celem  jest  określe- 
cyjne  nie,  jak  zmieniają  się  parametry  reaktora,  a przede 
wszystkim  kct , w miarę  eksploatacji  określonej  porcji 
paliwa.  Zwykle  obliczenia  eksploatacyjne  polegają  na 
wykonywaniu  obliczeń  krytycznych  w kolejnych  chwi- 


lach, połączonym  z rozwiązywaniem  równań  różnicz- 
kowych opisujących  zmiany  składu  paliwa  i powsta- 
wanie trucizn.  Dzięki  obliczeniom  eksploatacyjnym 
można  wybrać  optymalny  sposób  wymiany  paliwa 
i przedłużyć  czas  jego  przebywania  w reaktorze,  a w 
ten  sposób  obniżyć  koszt  eksploatacji.  Ma  to  szczegól- 
ne znaczenie  w reaktorach  energetycznych. 
Dotychczas  omawiane  obliczenia  dotyczyły  stanów 
statycznych  reaktora  lub  bardzo  powolnych  zmian 
zachodzących  w czasie  jego  eksploatacji.  Przewidy- 
waniem zachowania  się  reaktora  w stanach  nieustalo- 
nych zajmuje  się  tzw.  dynamika  reaktorów. 


Dynamika  reaktorów 

Jak  już  wspomniano,  podstawowe  równanie  Boltz- 
manna  opisujące  zachowanie  się  neutronów  w reakto- 
rze o niewielkiej  mocy  jest  liniowe,  gdyż  nie  zawiera 
członu  opisującego  zderzenia  neutronów  między  so- 
bą. Dotyczy  to  również  wszelkich  równań  przybliżo- 
nych, opisujących  stany  nieustalone  reaktora  o małej 
mocy. 

W reaktorze  o większej  mocy  istotną  rolę  odgrywa 
sprzężenie  temperaturowe  i w równaniach  opisujących 
stany  nieustalone  reaktora  pojawiają  się  człony  nie- 
liniowe. Poza  tym  do  równań  opisujących  gęstość 
neutronów  i gęstość  jąder,  z których  powstają  neutro- 
ny opóźnione,  trzeba  dołączyć  równania  przewod- 
nictwa ciepła  i przepływu  chłodziwa. 

Najważniejszym  zadaniem  dynamiki  jest  ustalenie, 
czy  reaktor  jest  stabilny  w warunkach  normalnej  pracy 
i w stanach  awaryjnych,  od  tego  bowiem  zależy  bez- 
pieczna jego  eksploatacja.  Sprowadza  się  to  do  ba- 
dania stabilności  równań  nieliniowych,  co  na  ogół 
jest  problemem  bardzo  skomplikowanym  z matema- 
tycznego punktu  widzenia.  Właściwe  obliczenia  dy- 
namiczne polegają  na  rozwiązywaniu  równań  dyna- 
miki reaktora  przy  zadanych  warunkach  początko-  kody 
wych.  W pracach  projektowych  stosuje  się  kody  dy-  dynamiczne 
namiczne,  które  uwzględniają  zależność  przestrzenną 
gęstości  neutronów  i in.  wielkości  wchodzących 
w skład  równań  dynamiki.  Zwykle  są  one  bardzo 
skomplikowane  i obliczenia  zajmują  dużo  czasu  na- 
wet przy  użyciu  szybkich  komputerów. 

Podczas  eksploatacji  reaktora  zachodzi  również 
konieczność  przewidywania  jego  stanów  przejścio- 
wych, ale  ze  względu  na  bezpieczeństwo  czas  wykony- 
wania obliczeń  musi  być  stosunkowo  krótki.  W tym 
wypadku  więc  stosuje  się  znacznie  prostsze  kody  dy- 
namiczne, oparte  na  ogół  na  tzw.  modelu  jedno- 
punktowym,  w którym  brak  zależności  przestrzen- 
nych. Aby  uniknąć  poważniejszych  błędów,  parame- 
try wchodzące  w skład  równań  dynamiki  ustala  się 
na  podstawie  ich  pomiarów  lub  przez  porównanie  wy- 
ników obliczeń  ze  zmierzonym  przebiegiem  gęstości 
neutronów  w zależności  od  czasu.  W ten  sposób  moż- 
na wybrać  optymalną  strategię  sterowania  łańcucho- 
wą reakcją  rozszczepienia  w reaktorze,  zarówno  z 
punktu  widzenia  bezpieczeństwa,  jak  i ekonomii. 


Budowa  i klasyfikacja 
reaktorów  jądrowych 

W różnych  krajach  zbudowano  dotąd  kilka  tysięcy 
reaktorów,  z czego  kilkaset  służy  do  produkcji  energii 
elektrycznej  (il.  41-45,  tabl.  12).  Ogromna  większość 
pracujących  reaktorów  to  reaktory  termiczne,  czyli 
takie,  w których  większość  rozszczepień  zachodzi  pod  reaktory 
wpływem  neutronów  termicznych.  Istnieją  również  termiczne 
reaktory  prędkie  (nie  zawierające  moderatorów),  w i prędkie 
których  rozszczepienia  są  wywoływane  głównie  przez 
neutrony  o dużych  energiach  (średnia  energia  neutro- 
nów wynosi  w nich  ok.  100  keV).  Zasadniczą  zaletą 
reaktorów  prędkich  jest  możliwość  powielania  paliwa 
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w cyklu  uranowo-plutonowym.  Z tego  względu  uważa 
się,  że  przyszłość  energetyki  opartej  na  reaktorach 
jądrowych  leży  w prędkich  reaktorach  powielających. 
Warto  dodać,  że  bomba  jądrowa  oparta  na  reakcji 
rozszczepienia  jest  właściwie  reaktorem  prędkim, 
w którym  reaktywność  znacznie  przekracza  grani- 
cę 0,007  określoną  przez  udział  neutronów  opóźnio- 
nych i reakcja  łańcuchowa  rozwija  się  w sposób  wy- 
buchowy. 

Rozróżnia  się  kilka  typowych  rozwiązań  konstruk- 
reaktor  cyjnych  reaktorów.  Przede  wszystkim  reaktory  wodne 
wodny  o małych  mocach  są  zwykle  budowane  w dużych  zbior- 
nikach wodnych,  często  z otwartym  lustrem  wody 
(reaktory  basenowe).  Reaktory  wodne  o większych 
mocach  są  umieszczone  z reguły  w zbiorniku  ciśnie- 
niowym. Znane  są  również  rozwiązania  konstruk- 
cyjne, w których  każdy  element  paliwowy  wraz  z opły- 
wającą go  warstwą  wody  chłodzącej  jest  zawarty 
w rurze  stalowej  i utrzymywany  pod  ciśnieniem. 
W reaktorach  z moderatorem  stałym,  jak  grafit  lub 
beryl,  sam  moderator  stanowi  materiał  konstrukcyjny 
rdzenia.  Cały  reaktor  może  być  także  umieszczony 
w zbiorniku  ciśnieniowym. 

Najkosztowniejszym  składnikiem  reaktora  jądro- 
wego jest  paliwo,  natomiast  znacznie  tańszy  jest  mo- 
derator. Z tego  względu  reaktor  jest  zwykle  podzie- 
rdzeń  lony  na  dwie  strefy.  Pierwsza  — tzw.  rdzeń,  zawiera 
paliwo,  moderator,  chłodziwo  i materiały  konstruk- 
cyjne oraz  pręty  regulacyjne,  kompensacyjne  i bez- 
reflektor  pieczeństwa.  Druga  — tzw.  reflektor,  jest  zbudowana 
z moderatora  i otacza  rdzeń,  a służy  do  zatrzymywa- 
nia części  neutronów  uciekających  z rdzenia.  W wielu 
rozwiązaniach  konstrukcyjnych  rdzeń  i reflektor  znaj- 
dują się  w szczelnych  zbiornikach  stalowych  i otoczo- 
ne są  specjalnymi  osłonami.  Zbiornik  ciśnieniowy 
utrzymuje  odpowiednie  ciśnienie  w reaktorze  i za- 
pewnia znacznie  większe  bezpieczeństwo  na  wypadek 
awarii.  W reaktorach  wodnych  ciśnienie  wewnątrz 
zbiornika  dochodzi  do  14,  a w gazowych  — do  4 
megapaskali.  Osłony  reaktora  zmniejszają  inten- 
sywność promieniowania  w otoczeniu  do  wartości 
dopuszczalnych  ze  względu  na  zagrożenie  obsługi.  Są 
one  również  stosowane  do  ochrony  niektórych  urzą- 
dzeń pomocniczych  i aparatury  przed  zniszczeniem 
lub  promieniotwórczością  wzbudzoną, 
osłona  Ponieważ  największe  pochłanianie  neutronów  w ma- 
terii zachodzi  w zakresie  energii  termicznych,  osłona 
reaktorowa  powinna  zawierać  moderator  spowalnia- 
jący neutrony  prędkie  wychodzące  z reaktora  oraz 
materiał  odznaczający  się  znacznym  przekrojem  czyn- 
nym na  pochłanianie  neutronów  termicznych.  Poza 
tym  powinna  efektywnie  pochłaniać  promieniowanie 
y wychodzące  z reaktora,  jak  również  powstające 
w osłonie.  Promieniowanie  a lub  /?  ma  bardzo  nie- 
wielki zasięg  i praktycznie  nie  wydostaje  się  poza 
pierwszą  warstwę  osłony. 

Największa  ilość  ciepła  powstającego  w osłonie  wy- 
dziela się  w warstwie  przylegającej  do  reaktora. 
Z tego  względu  warstwa  ta,  zwykle  oddzielona  od 
reszty  osłony,  jest  chłodzona  wodą  lub  powietrzem 
i nazywa  się  osłoną  termiczną.  Pozostała  część  pełni 
rolę  osłony  biologicznej.  Osłona  termiczna  jest  naj- 
częściej wykonana  z płyt  stalowych  z dodatkiem  boru, 
natomiast  biologiczna  z ciężkich  betonów,  składają- 
cych się  z cementu,  drobnego  złomu  stalowego  oraz 
rudy  barytowej,  limonitowej  lub  magnetytowej, 
paliwo  Reaktory  mogą  różnić  się  od  siebie  rodzajem  paliwa 
(uran  naturalny,  uran  wzbogacony  izotopem  235U 
lub  nuklidem  239Pu),  postacią,  w jakiej  paliwo  wystę- 
puje w reaktorze  (paliwo  metaliczne,  węgliki  lub 
tlenki  uranu  itp.)  oraz  kształtem  elementów  paliwo- 
wych. Początkowo  stosowano  głównie  uran  natural- 
ny, obecnie  w większości  reaktorów  paliwem  jest 
uran  wzbogacony  izotopem  23 5U,  przy  czym  wzboga- 
cenie waha  się  od  1%  do  93%.  Dzięki  temu  uzyskuje 
się  znacznie  lepsze  parametry  krytyczne  reaktora 
i lepszy  rozkład  neutronów.  Obok  uranu  stosuje  się 
również  239Pu  otrzymywany  z przemiany  jądrowej 


238U.  W przyszłości  coraz  większą  rolę  będzie  odgry- 
wać paliwo  plutonowe,  a także  WSU.  Paliwo  uranowe 
lub  plutonowe  stosuje  się  w postaci  metalicznej  lub 
ceramicznej  (tlenki  lub  węgliki),  a także  w postaci 
roztworu  metalu  w ceramice,  a elementy  paliwowe  są 
koszulkowane  stalą  nierdzewną,  cyrkonem  lub  alu- 
minium. 

Moderator  jest  bardzo  istotnym  elementem  reaktora  moderator 
termicznego  i często  używanym  kryterium  klasyfika- 
cyjnym. Rozróżnia  się  więc  następujące  zasadnicze 
typy  reaktorów  termicznych:  wodne,  ciężkowodne 
i grafitowe.  W niektórych  rozwiązaniach  stosuje  się 
również  beryl  w połączeniu  z wodą,  spełniającą  jed- 
nocześnie rolę  moderatora  i chłodziwa.  Istnieją  rów- 
nież reaktory,  w których  moderatorem  i chłodziwem 
są  ciekłe  związki  organiczne,  głównie  polifenyle;  takie 
reaktory  nie  mają  jednak  dużego  znaczenia  praktycz- 
nego. Najpowszechniej  używanym  moderatorem  jest 
zwykła  woda,  która  ma  doskonałe  właściwości  jądro- 
we i termiczne,  a jest  przy  tym  bardzo  tania. 

Chłodziwa  reaktorowe  można  podzielić  na  3 grupy:  chłodziwo 
gazy,  ciecze  niemetaliczne  i ciecze  metaliczne,  bardzo 
różniące  się  pomiędzy  sobą  właściwościami  fizyczny- 
mi, które  decydują  o efektywności  przejmowania 
i przenoszenia  ciepła.  Ważną  rolę  w wypadku  chło- 
dziw odgrywają  również  właściwości  jądrowe,  jak  np. 
pochłanianie  neutronów  czy  promieniotwórczość 
wzbudzona  oraz  właściwości  korozyjne.  Do  najczę- 
ściej stosowanych  chłodziw  w reaktorach  termicznych 
należy  zwykła  woda.  Używa  się  również  dwutlenku 
węgla,  a także  helu.  W reaktorach  prędkich  chłodzi- 
wem jest  zwykle  ciekły  sód  lub  jego  stopy,  ale  również 
przeprowadzane  są  próby  chłodzenia  gazem  dysocju- 
jącym, np.  N204,  który  dysocjuje  na  N02  pochłaniając 
ciepło  z reaktora  i redysocjuje  poza  reaktorem,  będąc 
w ten  sposób  bardzo  efektywnym  nośnikiem  ciepła. 

Wadą  sodu  jest  znaczna  aktywność  chemiczna  zarów- 
no w stosunku  do  powietrza  jak  i wody,  a także  silne 
właściwości  korozyjne.  Powoduje  to  bardzo  poważne 
trudności  konstrukcyjne  i eksploatacyjne  w reakto- 
rach chłodzonych  sodem. 

W reaktorach  termicznych  chłodziwo  spełniać  rów- 
nież może  funkcję  moderatora.  Z tego  względu  naj- 
częściej jako  chłodziwo  stosowana  jest  zwykła  woda, 
dwutlenek  węgla,  hel  i niekiedy  związki  organiczne. 

Woda  jako  chłodziwo  może  znajdować  się  pod  ciśnie- 
niem atmosferycznym  lub  podwyższonym.  W tym 
ostatnim  wypadku  mówi  się  o reaktorach  wodnych 
ciśnieniowych.  Niekiedy  dopuszcza  się  do  wrzenia, 
tak  że  chłodziwem  w tzw.  reaktorach  wodnych  wrzą- 
cych jest  mieszanina  wody  z parą. 

Chłodzenie  dwutlenkiem  węgla  jest  stosowane  w 
reaktorach  grafitowych  z uranem  naturalnym,  jednak 
ten  typ  chłodzenia  nie  ma  wielkiej  przyszłości,  po- 
dobnie jak  chłodzenie  związkami  organicznymi.  W no- 
woczesnych reaktorach  grafitowych  dwutlenek  węgla 
jest  zastąpiony  helem,  co  pozwala  znacznie  zwiększyć 
temperaturę  chłodziwa  na  wyjściu  reaktora  (do 
1000°  Q. 


Zastosowanie  reaktorów 
jądrowych 

Z uwagi  na  przeznaczenie  reaktory  można  podzielić 
w zasadzie  na  dwie  kategorie : badawcze  i energetycz- 
ne, przy  czym  te  ostatnie  obejmują  reaktory  stacjo- 
narne i napędowe. 

Reaktory  badawcze,  do  których  zaliczyć  należy  reaktory 
również  zestawy  krytyczne,  służą  jako  narzędzia  ba-  badawcze 
dań  w zakresie  fizyki  reaktorowej,  chemii  radiacyjnej, 
radiochemii,  właściwości  materiałów,  energetyki  ją- 
drowej itp.  oraz  jako  źródła  promieniowania  (głów- 
nie neutronów  i promieniowania  y)  do  produkcji  ra- 
dioizotopów (nuklidów  promieniotwórczych),  stoso- 
wanych w medycynie,  biologii,  rolnictwie,  przemyśle 
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itd.  Niektóre  reaktory  badawcze  z uranem  natural- 
nym lub  niskowzbogaconym  o dużym  współczynniku 
przemiany  paliwa  stanowią  również  źródło  nowego 
paliwa  plutonowego. 

Reaktory  badawcze  są  wyposażone  w kanały  do- 
świadczalne, dochodzące  do  reflektora  i rdzenia  reak- 
tora. Dąży  się  do  tego,  aby  strumień  neutronów 
i objętość  kanałów  doświadczalnych  były  jak  najwięk- 
sze. Szczególnie  duży  strumień  neutronów  jest  nie- 
zbędny w reaktorach  przeznaczonych  do  badań  ma- 
teriałowych, w których  sprawdza  się  w praktyce 
zachowanie  się  elementów  paliwowych  projektowa- 
nych reaktorów  energetycznych. 

W Polsce  w Instytucie  Badań  Jądrowych  w Świerku 
znajduje  się  kilka  zestawów  krytycznych  i dwa  reak- 
tory badawcze (II.  42, 44;  45,  tabl.  12).  Pierwszy  polski 
reaktor  EWA  (Eksperymentalny  Wodny  Atomowy) 
został  uruchomiony  w 1958  r.  Jego  paliwem  jest  uran 
wzbogacony  w izotop  235U  do  36%.  Jako  moderator 

1 reflektor  służy  zwykła  woda  i częściowo  beryl,  chło- 
dziwem jest  zwykła  woda.  Reaktor  EWA  jest  umiesz- 
czony w zbiorniku  betonowym,  który  służy  jako 
osłona  biologiczna  dla  osób  pracujących  w hali 
reaktora.  Obecna  moc  reaktora  wynosi  8 MW  (po- 
czątkowa 2 MW),  a strumień  neutronów  termi- 
cznych w kanałach  doświadczalnych  dochodzi  do 

2 1014  n/ cm2s.  Reaktor  służy  do  produkcji  radio- 
izotopów i do  badań  w zakresie  fizyki  i chemii. 

Drugi  polski  reaktor  MARIA  (nazwany  tak  na 
cześć  Marii  Skłodowskiej-Curie)  osiągnął  stan  kry- 
tyczny w grudniu  1974  r.  Jego  moc  nominalna  wy- 
nosi 30  MW,  a strumień  maksymalny  5 - 1014  n/cm2  s. 
Paliwem  jest  uran  wzbogacony  w izotop  835  U do  80%. 
Jako  moderator  służy  beryl,  reflektor  jest  zbudowany 
z grafitu,  chłodziwem  i zarazem  moderatorem  jest 
woda  pod  ciśnieniem  1,7  MPa.  MARIA  jest  reakto- 
rem uniwersalnym,  przeznaczonym  głównie  do  bada- 
nia materiałów  i do  produkcji  radioizotopów. 

Reaktory  energetyczne  są  przeznaczone  do  pro- 
dukcji energii  w elektrowniach  lądowych  lub  na  stat- 
kach (reaktory  napędowe).  Reaktory  napędowe  nie 
różnią  się  w zasadzie  od  stacjonarnych,  poza  tym,  że 
konstrukcyjnie  są  znacznie  trudniejsze.  Muszą  one 
bowiem  odznaczać  się  małymi  rozmiarami,  co  doty- 
czy również  osłon,  i zapewniać  bezpieczną  eksploa- 
tację również  w nie  sprzyjających  warunkach  w czasie 
podróży.  Dotychczas  reaktory  (wyłącznie  wodne  ci- 
śnieniowe) znalazły  zastosowanie  do  napędu  łodzi 
podwodnych,  okrętów  wojennych  i statków  morskich. 


Najważniejszym  jednak  argumentem  przemawiają- 
cym za  rozwojem  energetyki  jądrowej  jest  gwałtowne 
kurczenie  się  zasobów  paliw  klasycznych,  co  bez 
udziału  energii  jądrowej  doprowadziłoby  już  wkrótce 
do  ostrego  kryzysu  energetycznego. 


REAKTOR 

WYMIENNIK 


zbiornik  ciśnieniowy  osłona  przepływ  chłodziwa 


Rys.  13.  Schemat  reaktora  energetycznego 

Na  rys.  13  przedstawiono  schemat  typowego  reak- 
tora energetycznego  stacjonarnego  lub  napędowego. 
Chłodziwo  opuszczając  zbiornik  reaktora  unosi  ze 
sobą  ciepło,  które  następnie  oddane  w wymienniku 
ciepła  powoduje  tworzenie  się  pary  wodnej  używanej 
do  poruszania  turbiny  i wytwarzania  energii  elek- 
trycznej odprowadzanej  do  sieci  energetycznej  lub, 
w reaktorach  napędowych,  używanej  do  napędu  sil- 
ników. 


para 


Rys.  14.  Schemat  elektrowni  jądrowej  z reaktorem  wodnym  ci- 
śnieniowym 


Elektrownie  jądrowe 


Pierwsza  elektrownia  jądrowa  (atomowa)  o mocy 
5 MW  (elektrycznych)  została  zbudowana  w 1954  r. 
w ZSRR,  a już  w 1976  r.  na  świecie  pracowało  kilka- 
set elektrowni  jądrowych  o mocach  dochodzących  do 
1000  MW.  Początkowo  energia  z elektrowni  jądro- 
wych była  znacznie  droższa  niż  z elektrowni  klasycz- 
nych (węglowych  lub  wodnych).  W miarę  jednak  roz- 
woju techniki  reaktorów  cena  energii  jądrowej  spada 
i w 1976  r.  była  już  porównywalna  z ceną  energii 
z innych  źródeł.  Dotychczasowe  doświadczenia  wska- 
zują, że  elektrownie  jądrowe  są  bardzo  bezpieczne 
wbrew  dość  rozpowszechnionym  poglądom,  iż  każdy 
reaktor  jądrowy  stanowi  potencjalną  bombę.  Poza 
tym  elektrownie  jądrowe  nie  powodują  tak  wielkiego 
zanieczyszczenia  środowiska  jak  elektrownie  węglowe, 
które  wyrzucają  ogromne  ilości  produktów  spalania 
węgla  do  atmosfery.  Zasadniczym  problemem  w wy- 
padku elektrowni  jądrowych  jest  tzw.  zanieczyszcze- 
nie termiczne,  które  polega  na  wzroście  temperatury 
wód  wywołanym  odprowadzanym  z elektrowni  cie- 
płem, a także  gromadzenie  się  odpadów  promienio- 
twórczych. Wydaje  się  jednak,  że  nauka  potrafi 
w przyszłości  uporać  się  z obydwoma  problemami. 


Najczęściej  spotykanym  typem  reaktora  energe- 
tycznego jest  reaktor  wodny  ciśnieniowy  (rys.  14). 
Elektrownie  z tymi  reaktorami  pracują  j uż  w wielu 
krajach.  W ZSRR  i w innych  krajach  socjalistycznych 
działają  reaktory  wodne  ciśnieniowe  o rozwiązaniu 
konstrukcyjnym  nazwanym  WWER.  Pierwsza  polska 
elektrownia  jądrowa,  która  ma  być  zbudowana  nad 
Jeziorem  Żarnowieckim  w woj.  gdańskim  będzie  wy- 
posażona właśnie  w reaktor  WWER  o mocy  440  WM 
(elektrycznych).  Drugim  typem  reaktora  wodnego 
jest  reaktor  wodny  wrzący,  w którym  dopuszcza  się 
do  wrzenia  wody  w rdzeniu  reaktora,  co  pozwala 
obniżyć  ciśnienie  w zbiorniku  reaktora.  Jednakże 
reaktory  wodne  wrzące  są  nieco  trudniejsze  kon- 
strukcyjnie. 


gaz  para 


pompa 

— G 


woda  zasdająca 

Rys.  15.  Schemat  elektrowni  z reaktorem  chłodzonym  gazem 
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reaktory  Pierwszymi  reaktorami  energetycznymi  chłodzo- 
grafitowe  nymi  gazem  (dwutlenek  węgla)  były  reaktory  w Cal- 
der  Hall  (Wielka  Brytania)  oddane  do  eksploatacji 
w 1956  r.  Moderatorem  był  grafit,  a paliwem  uran  na- 
turalny. Schemat  działania  reaktora  z chłodzeniem 
gazowym  pokazany  jest  na  rys.  15.  Obecnie  prowadzi 
się  intensywne  prace  nad  ulepszonymi  wersjami  ener- 
getycznych reaktorów  grafitowych  z chłodzeniem  ga- 
zowym, tzw.  reaktorów  wysokotemperaturowych, 
w których  temperatura  gazu  na  wyjściu  osiąga  1000°C. 
Gaz  o tej  temperaturze  pozwala  osiągnąć  znacznie 
wyższą  sprawność  cieplną  elektrowni  jądrowej. 
Szczególnie  interesującym  rozwiązaniem  jest  reaktor, 
w którym  paliwem  jest  złoże  usypane  z kul  uranowych 
pokrytych  grafitem,  a chłodziwem  hel.  Prototyp  tego 
reaktora  pracuje  w Jul  ich  (RFN). 


Reaktory  wysokotemperaturowe  odznaczają  się 
bardzo  dużą  sprawnością  i pozwalają  na  dobre  wyko- 
rzystanie paliwa.  Dodatkową  zaletą  jest  możliwość 
użycia  tych  reaktorów  w przemyśle  chemicznym. 

Ze  względu  na  fakt,  że  ogromna  większość  uranu 
znajdującego  się  w przyrodzie  to  238U,  przyszłość 
energetyki  jądrowej  leży  w prędkich  reaktorach  po- 
wielających. Reaktory  prędkie  są  jednak  znacznie 
trudniejsze  zarówno  z punktu  widzenia  konstrukcyj- 
nego jak  i eksploatacyjnego  i ciągle  jeszcze  znajdują 
się  w stadium  prototypów.  Pierwsze  duże  elektrownie 
jądrowe  z reaktorami  prędkimi  pojawią  się  zapewne 
dopiero  po  1990  r. 

S.  Glasstone  Podstawy  techniki  reaktorów  jądrowych , War- 
szawa 1958;  S.  Glasstone  i M.  C.  Edlund  Podstawy  teorii  re- 
aktorów jądrowych,  Warszawa  1957;  J.  Mika  i A.  Zmysłowski 
Energia  jądrowa  i jej  zastosowanie , Warszawa  1962. 


Energia  termojądrowa 

Lech  Jakubov/ski  i Marek  Sadowski 


Energia  jądrowa  może  się  wyzwalać  nie  tylko  w pro- 
cesach rozszczepienia  ciężkich  jąder  atomowych,  ale 
również  w reakcjach  syntezy  (tj.  łączenia)  jąder  naj- 
lżejszych w jądra  cięższe.  Aby  reakcja  syntezy  mogła 
dojść  do  skutku,  jądra  muszą  pokonać  siły  wzajem- 
nego odpychania  elektrostatycznego  i zbliżyć  się  na 
odległość  rzędu  10" 12  cm.  W temperaturze  pokojo- 
wej średnia  energia  kinetyczna  ruchu  cieplnego  jąder 
atomowych  jest  zbyt  mała,  aby  tego  rodzaju  reakcja 
mogła  zachodzić.  Natomiast  w temperaturze  wielu 
milionów  stopni,  jaka  panuje  np.  we  wnętrzu  Słońca 
i innych  gwiazd,  energia  ruchu  cieplnego  jest  tak  duża, 
że  wystarcza  do  pokonania  sił  kulombowskich  mię- 
dzy jądrami,  co  umożliwia  połączenie  tych  jąder. 
Procesy  łączenia  jąder  atomowych,  które  zachodzą 
na  skutek  ruchów  termicznych  w bardzo  wysokich 
temperaturach,  nazywamy  reakcjami  syntezy  termo- 
jądrowej, a wydzieloną  w tych  procesach  energię  — 
energią  termojądrową. 

W dostatecznie  wysokich  temperaturach  następuje 
samorzutna  jonizacja  materii  — atomy  rozpadają  się 


na  dodatnio  naładowane  jony  i swobodne  elektrony, 
tworząc  kwazineutralną  mieszaninę  — tzw'.  plazmę. 
Istotne  jest,  że  dodatnie  i ujemne  cząstki  występują 
w plazmie  w takich  proporcjach,  że  wypadkowy  ła- 
dunek elektryczny  jest  równy  zeru  (kwazineutral- 
ność).  W plazmie  o niskiej  temperaturze  i małym 
stopniu  jonizacji  mogą  występować  atomy  niezjoni- 
zowane  (plazma  niskotemperaturowa).  W tempera- 
turze wielu  milionów  stopni,  w której  mogą  zachodzić 
reakcje  termojądrowe,  materia  ulega  całkowitej  jo- 
nizacji, powstaje  wówczas  plazma  wysokotempera- 
turowa — tzw.  plazma  gorąca. 

W warunkach  ziemskich  plazmę  spotyka  się  sto- 
sunkowo rzadko.  Plazma  o niskiej  temperaturze  wy- 
stępuje we  wnętrzu  płomienia,  w iskrze  lub  łuku  elek- 
trycznym oraz  w potężnych  wyładowaniach  atmo- 
sferycznych. Zewnętrzne  warstwy  atmosfery  ziemskiej 
stanowi  plazma  o małej  gęstości  tworząca  jonosferę. 
Ponad  jonosferą  istnieją  obszary  zawierające  zjonizo- 
waną  materię,  nazywane  pasami  van  Allena.  W ob- 
szarach międzygwiezdnych  występuje  również  plazma 
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koncentracja 


Rys.  1.  Występowanie  plazmy  w przyrodzie  oraz  zakres  badań  nad  plazmą.  Prostokąt  ukazuje  zakres  koncentracji  i temperatur,  którymi 
interesują  się  fizycy  prowadzący  badania  termojądrowe;  czarne  punkty  odpowiadają  najważniejszym  eksperymentom 
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o bardzo  małej  gęstości.  Natomiast  gorąca  plazma 
występuje  we  wnętrzu  miliardów  gwiazd,  w tym  także 
naszego  Słońca.  Zatem  tylko  znikoma  część  materii 
we  Wszechświecie  występuje  w trzech  podstawowych 
stanach  skupienia.  Ponad  99,9%  materii  Wszech- 
świata znajduje  się  w stanie  zjonizowanym  — stano- 
wi plazmę,  którą  można  uważać  za  odrębny  stan  ma- 
terii (rys.  1). 

W gorącej  plazmie  we  wnętrzu  gwiazd  między  czą- 
stkami obdarzonymi  wielką  energią  kinetyczną  za- 
chodzą reakcje  syntezy  termojądrowej.  W reakcjach 
tych  powstają  nowe  cięższe  jądra  atomowe,  a jed- 
nocześnie wydzielane  są  ogromne  ilości  energii,  której 
część  dociera  do  nas  w postaci  promieniowania. 


Reakcje  syntezy  termojądrowej 
i ich  znaczenie 


Reakcje  przebiegające  we  wnętrzu  gwiazd 

Jako  przykład  zwykłej  reakcji  syntezy  jądrowej  roz- 
patrywać można  przetworzenie  czterech  jąder  wodoru 
(protonów)  w jądro  helu.  Prawdopodobieństwo  jed- 
noczesnego zderzenia  się  czterech  protonów  jest  jed- 
nak bardzo  małe,  nawet  w warunkach  jakie  panują 
we  wnętrzu  gwiazd.  Przetworzenie  protonów  w jądra 
helu  możliwe  jest  poprzez  szereg  reakcji  pośrednich, 
czyli  w wyniku  cyklicznej  reakcji  jądrowej,  np.  tzw. 
cyklu  protonowo-protonowego,  składającego  się  z na- 
stępujących reakcji 

HHHUDH^  + 7 

D>+HWHes+y 

cykl 

protonowe-  2He3  - He4  4-  2H1 

-protonowy  lub 

HeS  He4->Be7 

Be7-ł~e~-*Li7 

Li74-H1-*2He7. 

Obecnie  uważa  się,  że  energia  wydzielona  w reak- 
cjach cyklu  protonowo-protonowego  jest  głównym 
źródłem  energii  w gwiazdach,  których  temperatura 
wnętrza  nie  przekracza  15  min  K.  Oprócz  podanego 
wyżej  cyklu  protonowo-protonowego  we  wnętrzach 
gwiazd  możliwy  jest  także  cykl  węglowo-azotowy 
(cykl  Bethego) 

C12+H,-*NM+y 


cykl 

Bethego 


*N13->C13-ł-/?+  4-  y 
C13-f  H1->N144y 
N14+H1-*0,5+y 
*015-^N15-f-j?+  + y 
N15+H1-vC12-fHe4, 


gdzie  * oznacza  jądro  wzbudzone. 

„spalanie"  Korzystając  z terminologii  chemicznej,  można  po- 
wodom wiedzieć,  że  powyższe  reakcje  opisują  proces  „spala- 
nia” wodoru  na  hel,  w którym  rolę  „katalizatorów” 
spełniają  jądra  węgla,  azotu  i tlenu.  Wydajność  ener- 
getyczna podanych  reakcji  syntezy  wynosi  ok. 
26  MeV  na  cykl,  co  oznacza,  że  ze  spalenia  1 g wo- 
doru można  uzyskać  ok.  6-1011  dżuli  energii.  Oma- 
wiane cykle  nie  wyczerpują  wszystkich  możliwości. 
W temperaturach  panujących  we  wnętrzach  gwiazd 
przebiegać  mogą  również  reakcje  syntezy  z udziałem 
innych  pierwiastków  lekkich,  np.  litu,  berylu  i boru. 
Produktem  końcowym  tych  reakcji  jest  również  hel. 
W temperaturze  ok.  100  min  K zachodzą  także  inne 
reakcje,  np.  Cis-f  He4-*Oie-ł-«.  Powstające  w wy- 


niku takich  reakcji  swobodne  neutrony  mogą  być 
pochłaniane  przez  jądra  ciężkie,  tworząc  w ten  spo- 
sób coraz  cięższe  jądra  atomowe. 


Znaczenie  reakcji  termojądrowych 
przebiegających  na  Słońcu 

Omawiane  procesy  przebiegają  bardzo  powoli;  we 
wnętrzu  Słońca  w ciągu  jednego  roku  w procesach 
syntezy  zużyte  zostaje  tylko  jedno  jądro  na  milion. 

Ze  względu  na  ogromne  rozmiary  i masę  Słońca,  wy- 
starcza to  jednak  do  utrzymania  odpowiedniej  tem- 
peratury i pokrycia  wszystkich  strat  energii  związa- 
nych z promieniowaniem. 

Aby  ocenić  znaczenie  reakcji  termojądrowych  za-  źródła  energii 
chodzących  we  wnętrzu  Słońca  należy  zauważyć,  że  na  Ziemi 
prawie  wszystkie  zasoby  energetyczne,  z których  ko- 
rzystamy dotychczas  na  Ziemi,  są  pochodzenia  sło- 
necznego. Węgiel  kamienny  powstał  ze  szczątków 
roślin,  które  w minionych  epokach  wytworzone  zo- 
stały w procesie  fotosyntezy  pod  wpływem  promie- 
niowania. Z przemiany  szczątków  zwierzęcych  i ro- 
ślinnych, a więc  pośrednio  kosztem  energii  Słońca, 
powstała  także  ropa  naftowa.  Nawet  energia  wyko- 
rzystywana w hydroelektrowniach  jest  pochodzenia 
słonecznego,  gdyż  woda  rzek  pochodzi  w większości 
z opadów  atmosferycznych,  a więc  z pary  wodnej, 
która  powstaje  głównie  nad  morzami,  na  skutek 
ogrzania  ich  przez  Słońce.  Podobnie  jest  z energią 
wiatrów.  Można  więc  stwierdzić,  że  istnienie  życia  na 
Ziemi  zależy  w rzeczywistości  od  reakcji  syntezy  ter- 
mojądrowej, które  przebiegają  nieustannie  we  wnę- 
trzu Słońca  — w ogromnym  reaktorze  termojądro- 
wym o wymiarach  liniowych  rzędu  105  km,  i tem- 
peraturze kilkunastu  milionów  K. 


Reakcje  syntezy  termojądrowej  możliwe 
do  realizacji  w warunkach  ziemskich 

W dążeniu  do  poznania  praw  natury  i opanowania 
nowych  źródeł  energii  badacze  zaczęli  się  zastanawiać, 
czy  reakcje  termojądrowe  można  realizować  na  Ziemi. 

Okazało  się,  że  w warunkach  ziemskich  dysponujemy  paliwa  termo  - 
doskonałym  paliwem  termojądrowym  — ciężkimi  izo-  jądrowe 
topami  wodoru  — deuterem  i trytem : 

D2+ D2->T3-hp+4,0  MeV 

D2  + D2->He3+*-j_3,2  MeV 

D2+T®-*He44  *4-17,6  MeV 

D2  4 He3-> He4  +p 4 1 8,4  MeV. 

Interesujące  są  również  reakcje  syntezy  z udziałem 
litu: 

Li6  4 *->He4-fT344,8  MeV 

Li«+j7->He44  He3  4- 3,9  MeV 

Li6 4 D2-+  2He4  4-  22,3  MeV. 

Podstawowym  warunkiem  realizacji  reakcji  syn- 
tezy termojądrowej  jest  wytworzenie  odpowiednio 
wysokiej  temperatury.  Występuje  tu  pewna  analogia 
do  temperatury  zapłonu  paliwa  chemicznego.  Oczy-  temperatura 
wiście  z tą  różnicą,  że  temperatura  „zapłonu”  reakcji  „zapłonu" 
termojądrowych  jest  o wiele  wyższa,  wynosi  dzie- 
siątki, a nawet  setki  milionów  stopni.  W tak  wyso- 
kich temperaturach  materia  może  istnieć  tylko  w po- 
staci całkowicie  zjonizowanego  gazu,  czyli  gorącej 
plazmy.  Taka  gorąca  plazma  intensywnie  promie- 
niuje, z czym  związane  są  duże  straty  energetyczne. 

Jednak  w miarę  podwyższania  temperatury  energia 
wydzielana  z reakcji  termojądrowych  wzrasta  szyb- 
ciej niż  energia  tracona  na  promieniowanie  (rys.  2). 

W związku  z powyższym  za  temperaturę  zapłonu 
reakcji  termojądrowych  można  uważać  wartość  tem- 
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temperatura  peratury,  przy  której  energia  wydzielana  i tracona  są 
zapłonu  sobie  równe.  W wypadku  reakcji  D-D  temperatura 
reakcji  ta  wynosi  ok.  350  min  K,  a w wypadku  reakcji  D-T  — 
D-D  i D-T  ok.  45  min  K. 


Rys.  2.  Określenie  temperatury  zapłonu  reakcji  termojądro- 
wych deuter-deuter  (D  + D)  oraz  deuter-tryt  (D-f-T)  przy  zało- 
żeniu, że  gorąca  plazma  nie  zawiera  domieszek  ciężkich  atomów, 
które  mogłyby  powodować  wzrost  strat  na  promieniowanie 


Warunki  realizacji  kontrolowanych 
reakcji  termojądrowych 

Warunek  podstawowy,  dotyczący  ogrzania  termoją- 
drowego paliwa  do  temperatury  zapłonu,  omówiony 
został  wcześniej.  Dalsze  warunki  dotyczą  odizolowa- 
nia tej  gorącej  plazmy  od  otoczenia  i utrzymania  jej 
przez  dostatecznie  długi  czas.  Gorąca  plazma  musi 
przy  tym  posiadać  odpowiednią  gęstość.  Równo- 
czesne spełnienie  tych  warunków  jest  bardzo  trudne. 

0 skali  trudności  świadczą  następujące  dane:  dla  plaz- 
my o koncentracji  odpowiadającej  normalnej  gęsto- 
ści powietrza  (ok.  3 1O10  cząstek/cm3)  w tempera- 
turze 100  min  K ciśnienie  osiąga  wartość  ok.  2 -1011  Pa. 
W praktyce  nie  ma  takich  materiałów,  które  mogły- 
by wytrzymać  działanie  tak  wysokich  temperatur 

1 tak  wielkich  ciśnień.  Konieczne  jest  zatem  obniże- 
nie ciśnienia  gorącej  plazmy,  np.  przez  zmniejszenie 
koncentracji  cząstek.  Ponieważ  reakcja  syntezy  za- 
chodzi tylko  w trakcie  zderzeń  cząstek,  zmniejszeniu 
koncentracji  plazmy  powinno  jednak  towarzyszyć 
wydłużenie  czasu  jej  utrzymania  w danym  obszarze. 

kryterium  Jako  kryterium  może  zatem  służyć  wartość  iloczynu 
Lawsona  koncentracji  n oraz  czasu  utrzymania  r (tzw.  kry- 
terium Lawsona).  Według  tego  kryterium,  przy  okre- 
ślonych wyżej  temperaturach  zapłonu  muszą  być  speł- 
nione następujące  warunki: 

dla  reakcji  D-D  nr  — 1016  cząstek* s/cm3, 
dla  reakcji  D-T  nr  — 3 • 1014  cząstek*  s/cm3. 

W warunkach  laboratoryjnych  do  utrzymywania 
gorącej  plazmy  wykorzystuje  się  silne  pola  magne- 
tyczne. Kwazistacjonarne  utrzymywanie  plazmy  jest 
jednak  możliwe  tylko  wtedy,  gdy  ciśnienie  wywierane 
przez  pole  magnetyczne  jest  równoważne  lub  większe 
od  ciśnienia  panującego  w plazmie.  Ciśnienie  plazmy 
można  przedstawić  w postaci  sumy  dwóch  składni- 
ków: 

Pg  = nekTe+riikTiy 

gdzie  ne  oraz  m — odpowiednio  koncentracja  elek- 

230 


tronów  i jonów,  k — stała  Boltzmanna,  Te  oraz  Ti  — 
odpowiednia  temperatura  elektronów  i jonów.  Ci- 
śnienie pola  magnetycznego  o indukcji  B0  wyraża  się 
natomiast  wzorem  pm  = B%l8n.  Korzystając  z poda- 
nych wyżej  zależności  łatwo  obliczyć,  ile  dla  plazmy 
o temperaturze  Te  = Ti  = 400  min  K wynosi  jej  kry- 
tyczna koncentracja,  przy  której  można  utrzymać  pla- 
zmę polem  magnetycznym  (tabela). 


B',  T 

nicryt,  cząstek /cm* 

2*o.  T 

mery  t,  cząstek/cm* 

1 

10“ 

50 

2,5*  1017 

5 

2,5*10“ 

100 

10“ 

10 

10“ 

Za  pomocą  znanych  dotychczas  środków  tech- 
nicznych, można  wytwarzać  w sposób  kwazistacjo- 
namy  pola  do  100  kGs.  Uzyskanie  silniejszych  pól 
magnetycznych  jest  możliwe  tylko  w urządzeniach 
pracujących  impulsowo,  a w wypadku  pól  powyżej 
1 MGs  — w sposób  wybuchowy,  niszczący  (— ► Naj- 
silniejsze pola  magnetyczne).  Koncentracja  plazmy, 
którą  można  utrzymać  w sposób  kwazistacjonarny, 
wynosi  ok.  1015-1016  cząstek/cm3,  a więc  według 
kryterium  Lawsona  czas  utrzymywania  takiej  plazmy 
powinien  wynosić  dla  reakcji  D-D  — od  1 do  10  s, 
a dla  reakcji  D-T  odpowiednio  — od  0,03  do  0,33  s.  niestabilność 
W praktyce  największą  przeszkodą  w osiągnięciu  p|azmy 
czasu  potrzebnego  na  utrzymanie  gorącej  plazmy  są 
różne  niestabilności  magnetohydrodynamiczne  (rys.  3) 


a)  b) 

Rys.  3.  Niestabilności  sznura  plazmowego:  a)  przewężanie 
sznura;  b)  wyginanie,  również  prowadzące  do  rozerwania  sznura. 

Okręgi  (kolor  czarny)  obrazują  linie  sił  pola  magnetycznego  wy- 
tworzonego przez  prąd  elektryczny  przepuszczany  przez  plazmę 

oraz  mikroniestabilności  plazmy.  Warunkiem  reali- 
zacji  kontrolowanych  reakcji  termojądrowych  jest 
zatem  również  wyeliminowanie  lub  odpowiednie  ogra- 
niczenie niestabilności  plazmowych. 

Oprócz  omówionych  wyżej  warunków,  należy  wy-  wpływ 
mienić  jeszcze  jedno  wymaganie:  gorąca  plazma  nie  domieszek 
powinna  zawierać  domieszek  ciężkich  jonów.  Nawet 
niewielkie  zanieczyszczenie  plazmy  ciężkimi  jonami 
wywołuje  bowiem  duży  wzrost  strat  energii  na  pro- 
mieniowanie, w związku  z czym  znacznie  podwyższa 
się  temperatura  zapłonu  reakcji  termojądrowych.  Na- 
leży więc  dążyć  do  uzyskania  bardzo  czystej  plazmy 
deuterowej  (lub  deuterowo-trytowej).  W celu  jak  naj- 
szybszego osiągnięcia  dodatniego  bilansu  energetycz- 
nego trzeba  również  dążyć  do  obniżenia  strat  energii 
we  wszystkich  urządzeniach  pomocniczych:  w uzwo- 
jeniach wytwarzających  pole  magnetyczne,  w ukła- 
dach pomp  próżniowych  oraz  w urządzeniach  kon- 
trolnych i pomiarowych. 


krytyczna 

koncentracja 

plazmy 


Militarne  wykorzystywanie  energii 
termojądrowej 

O możliwości  wytworzenia  gorącej  plazmy  i zreali- 
zowania niekontrolowanych  reakcji  termojądrowych 
w warunkach  ziemskich  przekonano  się  ostatecznie 
w 1952  r.,  kiedy  na  atolu  Eniwetok  przeprowadzono 
eksplozję  pierwszej  amerykańskiej  bomby  termoją- 
drowej. Paliwem  w tej  bombie  był  ciekły  deuter  i tryt. 
niekontrolo-  W rzeczywistości  była  to  nie  bomba,  ale  mała  fabryka 
wane  reakcje  wyposażona  w potężne  urządzenia  chłodnicze  o wa- 
termo-  dze  ponad  80  ton.  Jako  źródło  energii  inicjującej  reak- 
jądrowe  cje  termojądrowe  wykorzystano  wówczas  bombę 
atomową  o mocy  5-krotnie  większej  od  tej,  która 
zniszczyła  Hiroszimę.  W efekcie  eksplozja  miała 
energię  równoważną  wybuchowi  wielu  milionów  ton 
trotylu  (TNT  — trójnitrotoluen).  W około  10  mie- 
sięcy później  w ZSRR  zrealizowano  wybuch  bomby 
termojądrowej,  w której  wykorzystano  reakcje  z litem. 

Następnie,  w 1954  r.  Stany  Zjednoczone  przepro- 
wadziły wybuch  bomby  litowej  na  atolu  Bikini.  Była 
to  potężna  eksplozja  wyzwalająca  ok.  15  megaton 
TNT  energii,  która  prawie  10-krotnie  przewyższała 
siłę  wybuchową  wszystkich  bomb  zrzuconych  na  te- 
rytorium Niemiec  w latach  II  wojny  światowej.  Wtedy 
właśnie  doszło  do  tragicznego  wypadku  z japońskimi 
rybakami,  którzy  ulegli  napromieniowaniu  w odle- 
głości ok.  200  km  od  miejsca  eksplozji.  Od  czasu  wy- 
buchu tych  pierwszych  bomb  termojądrowych  aż  do 


kula  berylowa 
(reflektor  neutronów) 


uran  235U  lub  pluton  239Pu 


zwykły  materiał  wybuchowy 


warstwa  deuterku  litu  6LiD 


płaszcz  z naturalnego  uranu 
Rys.  4.  Schemat  budowy  bomby  termojądrowej  typu  3F 

1958  r.,  kiedy  to  wstrzymano  eksperymenty  z bronią 
jądrową,  przeprowadzono  eksplozje  wielu  bomb 
wodorowych  i litowych:  były  to  eksplozje  naziemne, 
powietrzne,  podziemne  i podwodne. 

Współczesne  bomby  termojądrowe  są  przeważnie 
typu  3F,  co  oznacza  „fission-fusion-fission”  (roz- 
szczepienie-synteza-rozszczepienie).  Schemat  ich  bu- 
dowy przedstawia  rys.  4.  W bombach  tych  materia- 
łem podstawowym  jest  deuterek  litu  6LiD  otoczony 
płaszczem  z naturalnego  uranu  238U.  Reakcję  termo- 
jądrową inicjuje  wybuch  zwykłej  bomby  atomowej 
zawierającej  uran  235U  lub  pluton  239Pu.  Potem  roz- 
wija się  reakcja  syntezy  termojądrowej  z udziałem 
litu  6Li.  Wytwarzane  przy  tym  neutrony  prędkie 
przenikają  do  płaszcza  z uranu  238U,  powodując 
reakcję  rozszczepieniową  i zwiększając  wypadkowy 
efekt  wybuchowy.  Warto  tutaj  zestawić  następujące 
dane: 

1 kg  uranu  w procesie  zwykłego  rozszczepienia 
wyzwala  energię  równoważną  wybuchowi  20  ki- 
loton  TNT, 

1 kg  6LiD  w reakcji  syntezy  wyzwala  energię  68  ki- 
loton  TNT, 

1 kg  mieszaniny  D-fT  w reakcjach  syntezy  wy- 
zwala energię  rzędu  8(Łkiloton  TNT. 

Dla  porównania  należy  przypomnieć,  że  do  komplet- 
nego zniszczenia  Hiroszimy  wystarczyła  bomba  ato- 
mowa o energii  równoważnej  20  kilotonom  TNT. 


Łatwo  wyciągnąć  stąd  wniosek,  że  w arsenałach  wielu 
państw  (broń  termojądrową  mają  obecnie  również 
Anglia,  Francja  i Chiny)  drzemią  dziś  ogromne  siły, 
których  niszczycielskie  użycie  groziłoby  całkowitym 
zniszczeniem  naszej  cywilizacji. 


Możliwości  pokojowego  wykorzystania 
energii  termojądrowej 

Potężne  wybuchy  termojądrowe  można  wykorzysty- 
wać do  wielkich  robót  ziemnych,  do  kopania  ogrom- 
nych kanałów  lub  drążenia  podziemnych  zbiorni- 
ków. Istnieją  także  projekty  uzyskiwania  energii 
z podziemnych  eksplozji  termojądrowych.  W warun- 
kach laboratoryjnych  i przemysłowych  nie  można 
jednak  jako  zapalnika  stosować  bomb  atomowych. 
Konieczne  jest  zatem  opanowanie  kontrolowanych 
reakcji  termojądrowych  przebiegających  w sposób 
regulowany  przez  człowieka.  Program  ten  napotyka 
jednak  duże  trudności  i wymaga  wielkich  nakładów 
finansowych.  Zanim  szczegółowo  omówimy  te  za- 
gadnienia warto  się  zastanowić,  czy  cel,  jakim  jest 
opanowanie  kontrolowanej  syntezy  termojądrowej, 
wart  jest  tych  zabiegów? 

W pierwszej  kolejności  warto  poznać  następujące 
dane: 

1 kg  węgla  daje  do  7 kWh  energii, 

1 kg  uranu  daje  od  70  000  kWh  (praktycznie)  do 

12  000  000  kWh  (teoretycznie), 

1 kg  deuteru  w reakcjach  syntezy  mógłby  wytwo- 
rzyć 24  000  000  kWh. 

Zasoby  węgla  są  eksploatowane  bardzo  intensywnie 
i obecnie  ocenia  się,  że  wystarczy  ich  jeszcze  na  około 
100  lat.  Podobna  sytuacja  jest  ze  złożami  ropy  nafto- 
wej. Zasoby  uranu,  natomiast,  przy  obecnej  spraw- 
ności przetwarzania  (gwarantującej  zużycie  zaledwie 
0,7%  masy  paliwa)  mogą  wystarczyć  zaledwie  na  kil- 
kadziesiąt lat.  Uran  naturalny  może  stanowić  trwałe 
źródło  energii  tylko  w reaktorach  powielających,  któ- 
rych wykorzystanie  w praktyce  napotyka  jeszcze  trud- 
ności (— ► Energia  jądrowa).  Poważny  problem  ener- 
getyki jądrowej  stanowią  również  odpady  promie- 
niotwórcze. 

W porównaniu  z zasobami  paliw  tradycyjnych 
i uranu  zapasy  paliwa  termojądrowego  — deuteru  — 
są  właściwie  niewyczerpalne.  Deuter  występuje  w wo- 
dach mórz  i oceanów  w ilości  1 atom  izotopu  na 
5000  atomów  wodoru  zwykłego.  Łączne  zasoby  deu- 
teru wynoszą  około  1017  kg,  co  odpowiada  zapasom 
energetycznym  rzędu  1024  kWh.  Przyjmując,  że  zu- 
życie energii  utrzyma  się  na  poziomie  dzisiejszym  (co 
odpowiada  wykorzystaniu  mocy  rzędu  5 miliardów 
kW)  deuteru  wystarczy  na  20  miliardów  lat.  Nawet 
przy  najbardziej  intensywnym  rozwoju  energetyki 
termojądrowej  paliwa  tego  nie  zabraknie.  Koszty  wy- 
dobycia tego  paliwa  są  przy  tym  bardzo  małe.  Współ- 
czesnymi metodami  produkcji,  kosztem  3 zł  z 1 1 
wody  wydziela  się  ok.  1/30  g deuteru.  W reakcjach 
termojądrowych  z takiej  ilości  deuteru  wyzwolić 
można  energię  równoważną  spaleniu  300  1 benzyny. 
Wykorzystanie  tych  ogromnych  zasobów  energetycz- 
nych jest  jednak  uzależnione  od  opanowania  kontro- 
lowanych reakcji  termojądrowych,  a w pierwszej  ko- 
lejności — od  poznania  własności  materii  w bardzo 
wysokich  temperaturach. 


Własności  plazmy 


Kwazineutralność  plazmy 

Do  podstawowych  własności  plazmy  zaliczyć  należy 
wspomnianą  na  wstępie  kwazineutralność  elektryczną. 
W rzeczywistości  w plazmie  występuje  pewne  roz- 
dzielenie ładunków.  Koncentracja  dodatnich  i ujem- 
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nych  cząstek  jest  jednak  tak  duża,  zwłaszcza  w plaz- 
mie o dużej  gęstości,  że  nawet  małe  rozdzielenie  ła- 
dunków wywołuje  bardzo  silne  pole  elektryczne  ( E ), 
które  przeciwdziała  dalszym  zmianom.  W plazmie 
wówczas  mogą  powstawać  oscylacje  elektrostatyczne. 
Natomiast  w obecności  zewnętrznego  pola  magne- 
tycznego H0  w plazmie  mogą  występować  także  drga- 
nia o charakterze  elektromagnetycznym.  Do  najważ- 
niejszych należą  podłużne  fale  magnetohydrostatycz- 

ne,  czyli  tzw.  fale  Alfvena  (dla  których  k\\H0y  E _L  H0, 

gdzie  k jest  wektorem  falowym  — reprezentującym 
kierunek  rozchodzenia  się  fali),  oraz  poprzeczne  fale 
magnetoakustyczne,  czyli  tzw.  fale  magnetodźwię- 

kowe  (k±H0>  E±H0). 


Promieniowanie  plazmy 

Inną  podstawową  własnością  plazmy  jest  jej  promie- 
niowanie. Przy  niskich  temperaturach  i małym  stop- 
niu jonizacji  plazma  emituje  przede  wszystkim  pro- 
mieniowanie o widmie  dyskretnym  — każda  linia 
widmowa  odpowiada  przejściom  elektronów  między 
określonymi  poziomami  energetycznymi  atomów  lub 
jonów.  Ze  wzrostem  temperatury  (i  jonizacji)  plazmy 
wzrasta  udział  promieniowania  o widmie  ciągłym, 
pochodzącego  z procesów  rekombinacji  jonów  i elek- 
tronów oraz  z procesu  hamowania  swobodnych  elek- 
tronów w polu  elektrycznym  jonów.  Zgodnie  ze  zna- 
pochła  nianie  ną  zasadą,  emisji  promieniowania  towarzyszy  jego 
plazmy  absorpcja  (pochłanianie).  Im  większa  jest  gęstość 
i grubość  warstwy  plazmowej,  tym  silniej  pochłania 
ona  promieniowanie.  Warto  zwrócić  uwagę  na  tę 
własność  plazmy,  ponieważ  od  niej  zależy  istnienie 
życia  na  Ziemi.  Gdyby  gorąca  plazma  Słońca  była 
zupełnie  przezroczysta,  to  promieniowanie,  które  do- 
cierałoby do  powierzchni  naszej  planety,  zamieniłoby 
wszystko  w popiół.  W rzeczywistości  ze  Słońca  do- 
ciera do  nas  promieniowanie  tylko  z zewnętrznej 
warstwy  plazmowej. 

Zgodnie  z tym,  co  powiedziano  wyżej,  gorąca  plaz- 
ma może  emitować  promieniowanie  o bardzo  szero- 
kim widmie  — od  fal  radiowych  do  twardego  pro- 
mieniowania rentgenowskiego.  Przez  plazmę  może 
przenikać  tylko  promieniowanie,  którego  częstość  co 
jest  większa  od  częstości  plazmowej  co0  = ]/ Ąnne2/me 
gdzie  n,  e , me  są  odpowiednio  koncentracją,  ładun- 
kiem i masą  elektronu.  Analiza  tego  promieniowania 
umożliwia  określenie  podstawowych  parametrów 
plazmy — jej  koncentracji  i temperatury. 

W świetle  molekulamo-kinetycznej  teorii  budowy 
materii  temperatura  jest  miarą  średniej  energii  ruchu 
cieplnego,  która  jest  proporcjonalna  do  kwadratu 
średniej  prędkości  ruchu  cząstek.  Należy  przy  tym 
zauważyć,  że  nie  wszystkie  cząstki  mają  taką  samą 
temperatura  energię  kinetyczną.  Istnieją  cząstki  poruszające  się 
plazmy  bardzo  wolno  i takie,  które  obdarzone  są  dużymi 
prędkościami  i ulegają  większej  liczbie  zderzeń.  W wy- 
niku tych  zderzeń  ustala  się  zwykle  stan  równowagi 
termodynamicznej,  w którym  rozkład  prędkości  czą- 
stek (a  tym  samym  ich  rozkład  energetyczny)  moż- 
na opisać  funkcją  maxwellowską.  Pojęcie  temperatury 
jest  dobrze  zdefiniowane  jedynie  dla  stanu  równowagi 
termodynamicznej . 

W praktyce  pojęcie  temperatury  stosuje  się  również 
w wypadkach  odchyleń  od  rozkładu  maxweIlowskiego 
rozpatrując  np.  oddzielnie  funkcje  rozkładu  dla  ru- 
chów poprzecznych  lub  podłużnych  (w  stosunku  do 
wyróżnionego  kierunku).  Często  rozkład  energetycz- 
ny elektronów  w plazmie  różni  się  od  rozkładu  ener- 
getycznego jonów  lub  resztek  atomów  neutralnych, 
temperatura  (Wprowadza  się  wówczas  pojęcie  temperatury  elek- 
elektronowa  tronowej  Te  oraz  temperatury  jonowej  Tj.)  Przy  do- 
I jonowa  statecznie  dużej  gęstości  plazmy,  w wyniku  zderzeń 
między  cząstkami,  ustala  się  w plazmie  po  pewnym 
czasie  stan  równowagi  termodynamicznej  (wówczas 
Te  = Tj).  Czas  ten  nazywa  się  czasem  relaksacji, 
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Należy  pamiętać,  że  „temperatura”  oznacza  wówczas 
tylko  miarę  średniej  energii  kinetycznej  i nie  charak- 
teryzuje w pełni  stanu  cieplnego  danego  ośrodka. 

Ze  względu  na  proporcjonalność  temperatury  i śred- 
niej energii  kinetycznej  cząsteczek,  temperaturę  wy- 
raża się  czasem  w jednostkach  energetycznych  — 
elektronowoltach.  Energii  1 eV  odpowiada  przy  tym 
temperatura  11  600  K (w  przybliżeniu  1 eV  = 104K. 


Inne  własności  plazmy 

Występowanie  w plazmie  dużej  ilości  swobodnych 
elektronów  i jonów  powoduje,  że  w odróżnieniu  od 
normalnego  gazu  plazma  posiada  zdolność  przewo- 
dzenia prądu  elektrycznego.  W przeciwieństwie  do 
zwykłych  przewodników  metalicznych  wraz  ze  wzro- 
stem temperatury  opór  elektryczny  plazmy  maleje, 
zmieniając  się  proporcjonalnie  do  T~3I2.  W rezultacie 
gorąca  plazma  wykazuje  dużą  przewodność  elektrycz- 
ną i w temperaturze  kilkunastu  min  K jej  opór  wła- 
ściwy jest  mniejszy  od  oporu  najlepszych  przewodni- 
ków metalicznych. 

Ze  względu  na  występowanie  w plazmie  dużej  licz- 
by swobodnych  cząstek  naładowanych  plazma  pod- 
lega również  działaniu  sił  pola  elektrycznego  i magne- 
tycznego, co  można  wykorzystać  do  jej  utrzymania 
w określonym  obszarze  w tzw.  pułapce  magnetycznej. 
Prawa,  które  rządzą  ruchem  cząstek  naładowanych 
w polach  elektrycznych  i magnetycznych,  dają  wy- 
tłumaczenie wielu  zjawisk  zachodzących  w plazmie. 
Konieczne  jest  jednak  uwzględnienie,  że  w plazmie 
ruch  swobodnych  cząstek  naładowanych  zakłócony 
jest  przez  zderzenia.  Ponieważ  naładowane  cząstki 
wytwarzają  pola  elektryczne  o stosunkowo  dużym  za- 
sięgu, w plazmie  o dużej  gęstości  występują  oddziały- 
wania kolektywne.  Polega  to  na  tym,  że  plazma  wy- 
kazuje skłonność  do  rozprzestrzeniania  zaburzeń  lo- 
kalnych na  cały  obszar  plazmowy.  Jeżeli  takie  zabu- 
rzenia nie  są  dostatecznie  tłumione,  występuje  nie- 
stabilność plazmy  (zob.  rys.  3).  Zjawiska  te  utrud- 
niają utrzymywanie  plazmy  w pułapkach  magnetycz- 
nych przez  dłuższy  czas. 

Plazmę  o małej  gęstości  można  traktować  jako 
zbiór  pojedynczych  cząstek,  z których  każda  oddzia- 
łuje niezależnie — jest  to  tzw.  model  jednocząstko- 
wy.  Plazmę  o większej  gęstości  można  rozpatrywać 
jako  przewodzący  ośrodek  ciągły,  który  opisują  rów- 
nania hydrodynamiki  i elektrodynamiki  — jest  to 
tzw.  model  magnetohydrodynamiczny  (model  mhd). 

Omówione  wyżej  własności  plazmy  są  bardzo  isto- 
tne zarówno  z punktu  widzenia  badań  podstawowych, 
jak  również  badań  zmierzających  do  opanowania 
energi  i termojądrowej . 


Metody  wytwarzania  gorącej 
plazmy 

Z wytwarzaniem  plazmy  związany  jest  problem  po- 
miaru wartości  bardzo  wysokich  temperatur.  Do  po- 
miarów takich  temperatur  nie  przydatne  są  oczywi- 
ście ani  termometry  cieczowe,  ani  gazowe.  Nie  można 
też  stosować  termometrów  oporowych  lub  termoelek- 
trycznych. Specjalne  sondy  kalorymetryczne  pozwa- 
lają wprawdzie  mierzyć  temperaturę  rzędu  kilku  ty- 
sięcy kelwinów,  ale  ulegają  szybkiemu  zużyciu,  a prócz 
tego  zaburzają  badany  ośrodek.  Dlatego  do  pomia- 
rów wysokich  temperatur  najbardziej  przydatne  są 
metody  optyczne.  Powyżej  1000  K powszechnie  sto- 
sowany jest  np.  pirometr  optyczny,  którego  działa- 
nie oparte  jest  na  porównaniu  promieniowania  ba- 
danego obiektu  z promieniowaniem  włókien  żarów- 
ki— wzorca.  Za  pomocą  takiego  przyrządu  można 
np.  określić  temperaturę  płomienia,  która  może 
sięgać  ok.  2000  K. 
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metody  «pek-  Do  pomiarów  jeszcze  wyższych  temperatur  wyko- 
troskopowe  rzystuje  się  fakt,  że  gorąca  plazma  wysyła  promienio- 
pomiaru  wanie  o różnych  długościach  fał,  od  fal  radiowych 
temperatury  do  krótkofalowego  promieniowania  nadfioletowego 
a nawet  rentgenowskiego.  Badania  tego  promienio- 
wania można  przeprowadzić  za  pomocą  spektrogra- 
fów i monochromatorów.  Na  podstawie  pomiaru 
stosunku  natężeń  linii  widmowych  emitowanych 
przez  jony  tego  samego  pierwiastka  (ale  o róż- 
nych stopniach  wzbudzenia)  można  np.  ocenić  tem- 
peraturę Te>  nawet  jeśli  wynosi  ona  wiele  milionów 
kelwinów.  Do  określenia  temperatury  7)  można  na- 
tomiast wykorzystać  zależność  szerokości  linii  wid- 
mowych od  ruchu  jonów  (tzw.  dopplerowskie  rozsze- 
rzenie linii). 

Metody  wytwarzania  plazmy  o bardzo  wysokich 
temperaturach  można  podzielić  na  dwie  zasadnicze 
kategorie.  Do  pierwszej  należą  metody  polegające  na 
wytworzeniu  plazmy  (lub  wiązki  cząstek)  o wysokiej 
energii  w specjalnych  urządzeniach  akceleracyjnych, 
a następnie  — na  iniekcji  tej  plazmy  (lub  cząstek)  do 
wnętrza  pułapki  magnetycznej.  Do  drugiej  kategorii 
zaliczają  się  metody,  które  polegają  na  wytworzeniu 
chłodnej  plazmy  od  razu  wewnątrz  pułapki  magne- 
tycznej, a następnie  — na  ogrzewaniu  tej  plazmy  do 
bardzo  wysokich  temperatur.  Można  tu  podać  pew- 
ną analogię:  metody  pierwszej  kategorii  przypomi- 
nają napełnianie  termosu  gorącym  płynem,  a metody 
drugiej  kategorii  odpowiadają  nagrzewaniu  płynu 
wewnątrz  zamkniętego  kociołka.  Klasyfikacja  metod 
wytwarzania  gorącej  plazmy  według  miejsca  jej  po- 
wstawania jest  jednak  zbyt  powierzchowna  i dlatego 
konieczne  jest  rozważenie  różnych  procesów  fizycz- 
nych, na  których  te  metody  się  opierają.  Poniżej  po- 
damy bardziej  szczegółowy  opis  niektórych  metod 
wytwarzania  gorącej  plazmy  i porównamy  ich  moż- 
liwości. 


Metoda  grzania  omowego 

Jest  to  najprostsza  metoda  wytwarzania  gorącej  plaz- 
my polegająca  na  przepuszczeniu  przez  zjonizowany 
gaz  bardzo  silnych  prądów  elektrycznych,  w wyniku 
czego  następuje  dalsza  jonizacja  gazu  i wzrost  jego 
temperatury.  Wydzielanie  ciepła  wiąże  się  przy  tym 
ze  zderzeniami  między  nośnikami  prądu  (elektronami) 
i innymi  cząstkami  gazu.  Ponieważ  przy  podwyższaniu 
temperatury  opór  plazmy  szybko  maleje  (przeciwnie 
niż  w przypadku  zwykłych  przewodników  metalicz- 
nych), możliwości  grzania  omowego  są  ograniczone. 
Stosując  omawianą  metodę  można  osiągnąć  tempera- 
tury ok.  kilku  keV  (rzędu  107K),  ale  ze  wzrostem 
temperatury  wydajność  tej  metody  maleje.  Nie  po- 
maga również  zwiększanie  natężenia  przepuszczanych 
prądów,  ponieważ  w pewnych  warunkach  może  to 
wywołać  niestabilność  plazmy. 

Metoda  grzania  omowego  jest  jednak  bardzo  wy- 
godna i może  być  wykorzystana  w różnych  układach 
eksperymentalnych.  Grzanie  omowe  można  stosować 
w układach  typu  otwartego  (patrz  rozdział  następny) 
wykorzystując  zewnętrzne  elektrody  i przepuszczając 
przez  plazmę  impulsy  prądu  o natężeniu  rzędu  milio- 
nów A.  Uzyskuje  się  wówczas  plazmę  o temperaturze 
ok.  kilkuset  eV  (kilku  milionów  K)  i koncentracji 
rzędu  1016  cząstek/cm3,  ale  o bardzo  krótkim  czasie 
trwania  (rzędu  10" 5 s),  co  spowodowane  jest  niestabil- 
nością sznura  plazmowego. 

Grzanie  omowe  stosuje  się  również  w zamkniętych 
(toroidalnych)  pułapkach  magnetycznych,  w których 
prądy  w plazmie  wytwarzane  są  metodą  indukcyjną 
za  pomocą  odpowiednich  transformatorów.  Przykład 
toroidalnego  układu  eksperymentalnego,  wyposażo- 
nego w transformator  do  grzania  omowego,  przedsta- 
wiono na  rys.  5.  Ze  względu  na  swoją  prostotę,  me- 
toda grzania  omowego  stosowana  jest  w większości 
układów  zamkniętych.  Przy  pomocy  tej  właśnie  me- 
tody w urządzeniach  typu  tokamak  udało  się  uzyskać 


plazmę  o koncentracji  6 -1013  cząstek/cm3  i tempera-  AKcator 
turze  7>  « 700  eV  (ok.  7 milionów  K)  i utrzymać  ją 
przez  stosunkowo  długi  czas  (ok.  30  ms). 

transformator  bezrdzeniowy 


Rys.  5.  Schemat  układu  toroidalnego  Alcator  (zbudowany  w Sta- 
nach Zjednoczonych),  w którym  stosuje  się  grzanie  omowe  plaz- 
my prądem  indukowanym  przez  transformator  bezrdzeniowy. 
Maksymalne  natężenie  tego  prądu  osiąga  wartość  650  kA.  Mała 
średnica  toroidainej  komory  układu  wynosi  25  cm,  duża  — 
ok.  100  cm.  Do  utrzymywania  plazmy  wykorzystuje  się  silne  ze- 
wnętrzne pole  magnetyczne  £max  = 12  T 


Metody  grzania  turbulencyjnego 

Grzanie  turbulencyjne  występuje  przy  oddziaływaniu 
z plazmą  wiązki  elektronów,  gdy  natężenie  tej  wiązki 
przekracza  pewną  wartość  krytyczną.  Można  je  zreali- 
zować dwoma  sposobami.  Przy  stosowaniu  pierwsze- 
go sposobu  najpierw  wytwarza  się  gęstą,  ale  stosun- 
kowo zimną  plazmę,  wykorzystując  inne  metody 
(np.  wstępną  jonizację  gazu  resztkowego  w komorze 
lub  iniekcję  plazmy  z zewnątrz).  Następnie  przez 
umieszczoną  w polu  magnetycznym  plazmę  prze- 
puszcza się  krótkie  impulsy  prądu  o bardzo  dużym 
natężeniu  przykładając  do  elektrod  impulsy  wysokie- 
go napięcia.  Przy  pomocy  takiej  metody  udało  się 
w pułapkach  typu  zwierciadlanego  otrzymać  plazmę 
o koncentracji  2 1013  cząstek/cm3  i temperaturze  7) 
wynoszącej  3-5  keV  (rzędu  107  K).  W pułapkach 
zamkniętych  uzyskano  omawianą  metodą  zbliżone 
wartości  temperatury,  ale  mniejszą  koncentrację 
plazmy. 

Przy  stosowaniu  drugiego  sposobu  plazmę  wytwa- 
rza od  razu  wiązka  elektronowa  przechodząca  przez 
gaz  niezjonizowany.  Wymagane  są  wówczas  mniejsze 
prądy,  niż  przy  omawianej  wyżej  metodzie,  ale  im- 
pulsy znacznie  dłuższe.  Przy  zastosowaniu  omawia- 
nego sposobu  w pułapce  typu  zwierciadlanego  udało 
się  uzyskać  plazmę  o koncentracji  10n-1012  czą- 
stek/cm3, temperaturze  T)  x 1 keV  i bardzo  wysokiej 
temperaturze  Te  x 1 50  keV.  Podobne  wyniki  (z  wy- 
jątkiem tak  wysokiej  temperatury  elektronowej)  uzy- 
skano ostatnio  także  w pułapkach  toroidalnych.  Na- 
leży podkreślić,  że  procesy  powodujące  grzanie  plazmy  ^ 
przy  oddziaływaniu  wiązka-plazma  są  bardzo  skom- 
plikowane i nie  mają  jeszcze  pełnej  interpretacji  teore- 
tycznej. 

Metody  grzania  rezonansowego 

Do  wytwarzania  gorącej  plazmy  w różnych  pułapkach 
magnetycznych  stosowane  jest  również  grzanie  rezo- 
nansowe, które  występuje  przy  oddziaływaniu  z plaz- 
mą silnych  fal  elektromagnetycznych  o odpowiednio 
dobranej  częstości.  Ponieważ  w polu  magnetycznym 
naładowane  cząstki  plazmy  (elektrony  i jony)  wyko- 
nują m.in.  ruchy  wirowe  z częstością  cyklotronową  — 
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fce  oraz  fd , to  dobierając  odpowiednio  częstość  fali 
elektromagnetycznej  / można  wywołać  elektronowy 
rezonans  cyklotronowy  (gdy  / = fce)9  lub  jonowy  re- 
zonans cyklotronowy  (gdy  / = fd);  prowadzi  to  do 
wzbudzenia  intensywnego  ruchu  cząstek  kosztem 
energii  fali.  Dla  przykładu  — w polu  o indukcji 
i?  = 5T  częstość  cyklotronowa  elektronów  wynosi 
fce  — 140  GHz,  co  odpowiada  fali  o długości  2 mm, 
a częstość  cyklotronowa  protonów  wynosi  fd  — 
78  MHz,  co  odpowiada  fali  o długości  ok.  4 m. 

Elektronowy  rezonans  cyklotronowy  można  uzy- 
skać stosując  zewnętrzny  generator  mikrofalowy 
i doprowadzając  falę  elektromagnetyczną  do  plazmy 
przez  odpowiednie  falowody.  Należy  przy  tym  zauwa- 
żyć, że  tłumienie  fali  elektromagnetycznej  i przekazy- 
wanie energii  plazmie  może  następować  nie  tylko 
w wyniku  rezonansu  cyklotronowego,  ale  również 
przy  jednakowych  prędkościach  fazowych  fali  i czą- 
stek plazmy  (występuje  wtedy  tzw.  tłumienie  Landaua), 
Metoda  elektronowego  rezonansu  cyklotronowego 
może  być  stosowana  zarówno  w zamkniętych  jak 
i otwartych  pułapkach  magnetycznych.  W stellarato- 
rach  za  pomocą  tej  metody  otrzymano  plazmę  o kon- 
centracji 1010-1012  cząstek/cm3  i temperaturze  Te  ~ 
a 30  eV.  W otwartej  pułapce  typu  zwierciadlanego 
z dodatkowym  polem  stabilizacyjnym  (eksperyment 
INTEREM)  udało  się  uzyskać  w ten  sposób  plazmę 
o koncentracji  1012  cząstek/cm3  i bardzo  wysokiej 
temperaturze  Te  x 100  keV. 

Do  wzbudzenia  jonowego  rezonansu  cyklotrono- 
wego nie  można  wykorzystać  falowodów  ze  względu 
na  znaczną  długość  fali  (rzędu  kilku  metrów),  tak  że 
fale  elektromagnetyczne  muszą  być  doprowadzane 
do  plazmy  innym  sposobem.  Stosuje  się  do  tego  celu 
układy  specjalnych  cewek  (tzw.  cewki  Stixa),  zasilane 
z silnych  generatorów  pracujących  na  częstości  ra- 
diowej. Metoda  jonowego  rezonansu  cyklotronowego 
jest  także  wykorzystywana  zarówno  w pułapkach 
zamkniętych  jak  i otwartych.  Udało  się  za  jej  pomocą 
wytworzyć  w Stellaratorze  C plazmę  o koncentracji 
1012-1013  cząstek/cm3  i temperaturze  Tj  x 550  eV. 
W eksperymentach  z otwartymi  pułapkami  zwiercia- 
dlanymi przy  zastosowaniu  omawianej  metody  uzy- 
skano plazmę  o koncentracji  1014  cząstek/cm3  i tem- 
peraturze Tj  1,5  keV  (przy  absorpcji  ok.  30%  do- 
starczanej energii). 

Do  metod  rezonansowych  zalicza  się  również  tzw. 
stochastyczne  grzanie  elektronów,  które  można  zrea- 
lizować w następujący  sposób.  Do  szczeliny  w metalo- 
wej przegrodzie  komory  eksperymentalnej  przykłada 
się  napięcie  o częstości  rzędu  kilku  MHz.  Elektrony, 
które  powstają  w wyniku  jonizacji  gazu  w tej  komorze, 
dostają  się  do  obszaru  wytwarzanego  pola  i uzyskują 
wówczas  dodatkową  energię.  Osiągana  temperatura 
elektronowa  jest  proporcjonalna  do  wielkości  (/£/)2/3, 
gdzie  / — częstość  stosowanego  napięcia,  U — jego 
amplituda.  Wykorzystując  powyższą  metodę  w pu- 
łapce typu  stellarator  uzyskano  plazmę  o koncentracji 
109  cząstek/cm3  i temperaturze  Te  ^ 300  eV. 


Metody  iniekcyjne 

Do  napełniania  pułapek  magnetycznych  (zwłaszcza 
pułapek  typu  otwartego)  bardzo  często  stosowane  są 
metody  iniekcyjne,  które  polegają  na  wstrzeliwaniu 
do  wnętrza  pułapki  strumienia  gorącej  plazmy,  wiązki 
wysokoenergetycznych  jonów  lub  szybkich  atomów 
neutralnych. 

Do  iniekcji  plazmy  stosowane  są  różnego  typu  iniek- 
iniektory  tory  plazmowe  (tzw.  działa  plazmowe).  Najczęściej 
współosiowe  w tym  celu  wykorzystuje  się  iniektory  współosiowe 
typu  Marshalla.  Schemat  budówy  takiego  i niektóra 
przedstawiono  na  rys.  6.  Jest  on  wyposażony  w dwie 
cylindryczne  i współosiowe  elektrody.  Jego  zasada 
działania  jest  następująca:  najpierw  do  obszaru  mię- 
dzy elektrodami  wpuszcza  się  impulsowo  określoną 
ilość  gazu  pod  normalnym  ciśnieniem  (np.  wodoru 
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lub  deuteru).  Następnie  elektrody  iniektora  przyłącza 
się  do  baterii  naładowanych  do  wysokiego  napięcia 
kondensatorów.  Wyładowanie  elektryczne,  które  roz- 


izolator 


iskiernik 


otwory  do  wypu- 
szczania gazu 

powstająca 
warstwa  plazmy 


bateria  kondensatorów 


Rys  6.  Schemat  współosiowego  iniektora  plazmowego  (nazywa- 
nego także  działem  plazmowym  lub  koaksjalnym  akceleratorem 
plazmy) 


wija  się  w obszarze  międzyelektrodowym,  powoduje 
jonizację  wpuszczonego  wcześniej  gazu  i utworzenie 
się  warstwy  plazmy,  przez  którą  płynie  prąd  wyłado- 
wania. Pole  magnetyczne,  które  towarzyszy  przepły- 
wowi tego  prądu,  wywołuje  przesuwanie  i stopniowe 
przyspieszanie  utworzonej  warstwy  plazmy  w kierun- 
ku wylotu  iniektora.  W rezultacie  z iniektora  wyrzu- 
cany jest  strumień  wysokoenergetycznej  plazmy  lub 
oddzielne  zgęstki  plazmowe  — tzw.  plazmoidy.  plazmoidy 

Oprócz  współosiowych  iniektorów  plazmowych, 
do  wytwarzania  strumieni  gorącej  plazmy  stosuje  się 
również  inne  typy  iniektorów,  np.  bezelektrodowe 
iniektory  indukcyjne  oraz  iniektory  typu  Halla. 

W iniektorach  indukcyjnych  plazmę  wytwarza  się 
przez  szybkie  rozładowanie  baterii  kondensatorów 
przez  spiralne  uzwojenie,  które  otacza  stożkową  iniektory 
komorę  szklaną  lub  ceramiczną.  W czasie  przepływu  indukcyjne 
prądu  przez  uzwojenie  pojawia  się  szybkozmienne 
pole  magnetyczne,  które  indukuje  wirowe  pole  elek- 
tryczne, wywołujące  z kolei  jonizację  gazu  i powstanie 
plazmy.  Oddziaływanie  z zewnętrznym  polem  mag- 
netycznym prowadzi  w rezultacie  do  przyspieszenia 
wytworzonej  plazmy. 

W iniektorach  typu  Halla  wyładowanie  plazmowe  iniektory 
inicjowane  jest  w polu  elektrycznym  skrzyżowanym  Halla 
z kwazistacjonarnym  polem  magnetycznym,  np.  we 
współosiowych  iniektorach  Halla  stosuje  się  podłużne 
pole  elektryczne  Ez  oraz  radialne  pole  magnetycz- 
ne Br. 

Interesującą  odmianą  iniektora  plazmowego  jest 
tzw.  działo  prętowe  RPI,  które  opracowano  w Instytu- 

szybkodziałający  zawór  izolator  elektrody  prętowe 


Rys.  7.  Schemat  plazmowego  działa  prętowego  RPI,  opracowa- 
nego w Instytucie  Badań  Jądrowych  w Świerku.  Ażurowa  kon- 
strukcja elektrod  ułatwia  ruch  cząstek  naładowanych  i umożliwia 
ogniskowanie  strumienia  plazmy  wzdłuż  osi  układu 


działo 

prętowe 

RPR 


układ  DCX 


cie  Badań  Jądrowych  w Świerku.  Działo  RPI  ma  rów- 
nież cylindryczne  elektrody,  ale  — w odróżnieniu  od 
zwykłych  iniektorów  współosiowych  — zbudowane 
są  one  z dużej  liczby  cienkich  prętów  ułożonych 
współosiowo  na  obwodzie  cylindrycznych  pierścieni 
(rys.  7).  W czasie  wyładowań  elektrycznych  cząstki 
naładowane  mogą  poruszać  się  swobodnie  między 
prętami  elektrod  i ulegać  przyspieszeniu.  Ponieważ 
powierzchnia  czynna  elektrod  jest  w tym  wypadku 
mniejsza  niż  w iniektorze  z elektrodami  pełnymi,  wy- 
twarzana plazma  może  zawierać  mniej  zanieczyszczeń 
pochodzących  z powierzchni  elektrod  iniektora. 

Omawiane  wyżej  iniektory  mogą  wytwarzać  plaz- 
moidy  o koncentracji  1013-1015  cząstek/cm3,  zależnie 
od  typu  iniektora  i warunków  jego  pracy.  Przy  odpo- 
wiednim doborze  warunków  pracy  iniektora  wytwa- 
rzane plazmoidy  mogą  mieć  bardzo  duże  prędkości 
rzędu  107-108  cm/s,  a ich  średnia  energia  kinetyczna 
może  osiągać  wartość  kilku  keV.  Ze  względu  na  to, 
że  znaczna  część  tej  energii  związana  jest  z ruchem 
uporządkowanym,  a nie  z chaotycznym  ruchem  ciepl- 
nym cząstek,  temperatura  wytwarzanej  plazmy  nie 
przekracza  kilkuset  eV  (tj.  kilku  milionów  kelwinów). 

Przy  iniekcji  plazmy  do  wnętrza  pułapki  magne- 
tycznej wstrzeliwana  plazma  musi  pokonać  barierę 
pola  magnetycznego,  co  wpływa  na  obniżenie  jej  kon- 
centracji i prędkości,  a w niektórych  wypadkach  — - 
także  temperatury.  Efekty  te  zależą  od  konfiguracji 
i natężenia  pola  magnetycznego  pułapki.  Stosując 
iniekcję  plazmy  w pułapkach  otwartych  typu  Probko- 
tron  uzyskano  plazmę  o koncentracji  109  cząstek/cm3 
i temperaturze  Tj  « 5 keV.  W pułapkach  typu  stel- 
larator  za  pomocą  iniektorów  plazmowych  uzyskano 
plazmę  o koncentracji  109-10U  cząstek/cm3  i tempera- 
turze jonowej  30-100  eV. 


Iniekcja  wysokoenergetycznych  jonów 

Gorącą  plazmę  można  również  wytwarzać  przez 
iniekcję  do  pułapek  magnetycznych  wiązek  wysoko- 
energetycznych jonów,  które  uzyskuje  się  za  pomocą 
akceleratorów  cząstek  naładowanych.  Bardzo  dobre 
rezultaty  daje  przy  tym  metoda  polegająca  na  Wstrze- 
liwaniu jonów  cząsteczkowych  D;J\  które  wewnątrz 
pułapki  ulegają  dysocjacji  na  neutralne  atomy  deuteru 
i jony  atomowe  D+.  Neutralne  atomy  uciekają  wów- 
czas z pułapki,  unosząc  pewną  część  energii  i pędu, 
a jony  D+  są  zatrzymywane  w polu  magnetycznym, 
powodując  jonizację  (tzw.  „wypalanie”)  resztek  gazu 
w komorze  eksperymentalnej. 

Omówiona  metoda  stosowana  była  w amerykań- 
skich urządzeniach  DCX,  których  zasadę  budowy 
przedstawiono  na  rys.  8,  a widok  ogólny  na  ilustracji 
46  (tabl.  12).  W urządzeniach  tych  wstępna  dyso- 
cjacja  jonów  D2  następowała  w łuku  elektrycznym, 
który  palił  się  między  dwiema  elektrodami  umiesz- 
czonymi w pułapce  magnetycznej  typu  zwierciadla- 


uzwojenie  elektromagnesu  wiązka  jonów  D£ 


tuk  elektryczny  linie  sił  pola  magnetycznego 

Rys.  8.  Zasada  budowy  amerykańskich  urządzeń  typu 
DCX.  Wyładowanie  łukowe  powoduje  dysocjacje  wstrzeliwanych 
jonów  molekularnych  Df , a do  utrzymywania  gorącej  plazmy  słu- 
ży pułapka  magnetyczna  typu  zwierciadlanego 


nego.  Wysokoenergetyczne  jony  D+  zderzając  się 
z cząsteczkami  pozostałego  w komorze  gazu  wytwa- 
rzały obłok  gorącej  plazmy.  Energii  wstrzeliwanych 
jonów  odpowiadała  temperatura  rzędu  6 miliardów  K. 

Tak  wysoką  temperaturę  uzyskiwała  jednak  tylko 
część  cząstek  plazmy;  pozostałe  cząstki  miały  tempe- 
raturę znacznie  niższą. 

Iniekcja  jonów  była  również  stosowana  w jednym 
z największych  urządzeń  radzieckich  — w układzie 
OGRA.  Komora  tego  układu  miała  średnicę  ok.  2 m 
i długość  ok.  20  m.  W odróżnieniu  od  układów  DCX,  układ 
w układzie  tym  nie  stosowano  pomocniczego  wyłado-  OGRA 
wania  łukowego,  a dysocjacja  jonów  molekularnych 
następowała  na  skutek  zderzeń  tych  jonów  z neutral- 
nymi cząsteczkami  pozostałego  w komorze  gazu. 
Podobnie  jak  w urządzeniach  DCX  w urządzeniu 
OGRA  uzyskiwano  temperatury  setek  milionów  K. 


Iniekcja  wysokoenergetycznych 
atomów  neutralnych 

Plazma  o bardzo  wysokiej  temperaturze  może  być 
wytwarzana  także  za  pomocą  intensywnych  wiązek 
prędkich  atomów  neutralnych.  Wiązki  takie  można 
uzyskać  przepuszczając  wiązkę  wysokoenergetycz- 
nych jonów  przez  komorę  zawierającą  znaczną  liczbę 
cząsteczek  gazu.  Część  jonów  wychwytuje  elektrony 
i biegnie  dalej  jako  prędkie  atomy  neutralne.  Uzyska- 
ną w ten  sposób  wiązkę  wysokoenergetycznych  ato- 
mów neutralnych  można  następnie  wprowadzić  do 
pułapki  magnetycznej,  gdzie  przy  odpowiednio  do- 
branych warunkach,  atomy  te  ulegają  ponownej  joni- 
zacji tworząc  plazmę  o odpowiednio  wysokiej  tem- 
peraturze. 

Metoda  ta  wykorzystana  została  w amerykańskich 
urządzeniach  Baseball,  w angielskim  układzie  Pho- 
enix,  a także  w radzieckim  urządzeniu  OGRA  II. 
W urządzeniach  tych  uzyskano  plazmę  o koncentracji 
108-109  cząstek/cm3  i maksymalnej  temperaturze 
Tj  « 20  keV  (tj.  200  min  K). 


Metody  kompresji  adiabatycznej 

W celu  podwyższenia  temperatury  i koncentracji 
plazmy,  która  została  wytworzona  w procesie  joniza- 
cji wstępnej  lub  iniekcji  i znajduje  się  wewnątrz  pu- 
łapki magnetycznej,  można  zastosować  metodę  kom- 
presji adiabatycznej.  Polega  ona  na  ściśnięciu  plazmy 
w wyniku  przyłożenia  dodatkowego  rosnącego  pola 
magnetycznego.  Jeżeli  zmiany  pola  i objętości  plazmy 
następują  w sposób  adiabatyczny,  następuje  wówczas 
wzrost  gęstości  i temperatury  plazmy  (rys.  9). 

Metoda  kompresji  adiabatycznej  stosowana  była 
dotychczas  głównie  w układach  typu  otwartego,  np.  w 
pułapkach  zwierciadlanych  uzyskano  tą  metodą  plazmę 

0 koncentracji  1011  cząstek/cm3  i temperaturze  Te  ~ 

~ 10  keV.  Ostatnio  kompresja  adiabatyczna  stoso- 
wana jest  coraz  częściej  także  w pułapkach  typu  zam- 
kniętego, np.  w amerykańskim  układzie  toroidalnym 

ATC  przy  pomocy  tej  metody  udało  się  uzyskać  z plaż-  układ  ATC 
my  o koncentracji  4 -1013  cząstek/cm3  i temperaturach 
Te  x 1 keV  i Tj  « 200  eV  — plazmę  o koncentracji 
2 1014  cząstek/cm3  oraz  temperaturach  Te  z,  2 keV 

1 Tj  ^ 600  eV. 


Inne  metody  grzania  plazmy 

Do  nagrzewania  plazmy  wykorzystuje  się  również 
zjawiska,  które  występują  przy  rozchodzeniu  się  fal 
o bardzo  dużej  amplitudzie  — tzw.  fal  uderzeniowych  wykorzysta - 
(-*  pale  uderzeniowe).  Do  bardziej  znanych  zalicza  nie  fal  ude- 
się  przy  tym  metodę  grzania  plazmy  za  pomocą  fal  rzeniowych 
uderzeniowych,  których  grubość  frontu  jest  mniejsza 
niż  długość  drogi  swobodnej  cząstek  plazmy.  Metoda 
ta  różni  się  od  omówionej  wyżej  metody  grzania 
turbulencyjnego  tym,  że  nie  wymaga  wymuszania 
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Rys.  10.  Metoda  „plasma  focus”.  Mechanizm  formowania  ognis- 
ka plazmowego  w pobliżu  wylotu  iniektora  współosiowego. 
Warstwa  zjonizowanego  gazu,  przez  którą  przepływa  prąd  wy- 
ładowania, po  wyrzuceniu  z obszaru  iniektora  ulega  odkształ- 
ceniu i radialnej  kompresji.  Na  osi  układu  tworzy  się  wówczas 
obszar  gęstej  i bardzo  gorącej  plazmy.  Obok  seria  zdjęć  wylotu 
współosiowego  iniektora  plazmowego  ukazująca  różne  fazy  ogni- 
ska plazmowego 


• uzwojenia,  w których  aktualnie  płynie  prąd 

O uzwojenia  okresowo  niezasilane 

Rys.  9.  Adiabatyczna  kompresja  plazmy  przez  narastające  pole 
magnetyczne.  Wzrostowi  natężenia  pola  towarzyszy  zmniejszenie 
obszaru  zajmowanego  przez  plazmę  oraz  wzrost  koncentracji 
i temperatury  ściskanej  plazmy.  Rysunki  przedstawiają  kolejne 
fazy  zjawiska 


przepływu  prądów  wzdłuż  linii  sił  pola  magnetycz- 
nego. Brak  jeszcze  pełnej  interpretacji  teoretycznej 
tych  zjawisk,  eksperymentalnie  jednak  stwierdzono, 
że  przy  prędkościach  znacznie  większych  od  pręd- 
kości dźwięku  w plazmie  występuje  anomalna  lep- 
kość, co  prowadzi  do  grzania  jonów.  Przy  odpowied- 
nim doborze  liczby  Macha  i innych  parametrów  moż- 
na tą  metodą  wytwarzać  plazmę  o określonym  sto- 
sunku temperatur  TejTi  i bardzo  wysokiej  tempera- 
turze elektronowej. 

metody  W badaniach  eksperymentalnych  stosowane  są  bar- 
mieszane  dzo  często  metody  mieszane.  Na  przykład  w niektó- 
rych układach  zamkniętych  wykorzystuje  się  najpierw 
grzanie  omowe  i rezonansowe,  a następnie  realizuje 
się  kompresję  adiabatyczną.  Pozwala  to  poprawić 
parametry  plazmy,  zwiększyć  jej  koncentrację  i tem- 
peraturę lub  wydłużyć  czas  jej  utrzymania. 

Ograniczone  możliwości  omówionych  wyżej  spo- 
sobów wytwarzania  plazmy  wysokotemperaturowej 
powodują,  że  nadal  poszukuje  się  nowych,  bardziej 
efektywnych  metod.  W ostatnich  latach  szczególnie 
intensywnie  rozwinęły  się  badania  nad  wyładowania- 
mi typu  plasma  focus  (ognisko  plazmowe)  oraz  ba- 
dania nad  wytwarzaniem  gorącej  plazmy  za  pomocą 
laserów. 


Wyładowanie  typu  plasma  focus 

Metoda  oparta  na  wyładowaniach  typu  plasma  focus 
jest  właściwie  odmianą  metody  iniekcyjnej,  w której 
stosuje  się  iniektory  współosiowe  o specjalnej  kon- 
strukcji, przystosowane  do  pracy  przy  stosunkowo 
wysokim  ciśnieniu  gazu  roboczego  i dużych  prądach 
wyładowania.  W takich  warunkach  w obszarze  mię- 
dzy elektrodowym  iniektora  może  uformować  się 
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wyraźna  warstwa  zjonizowanego  gazu  (tzw.  warstwa 
prądowa),  przez  którą  przepływa  prawie  cały  prąd 
wyładowania.  Pod  wpływem  sił  elektrodynamicznych 
warstwa  ta  przesuwa  się  wzdłuż  iniektora,  a po  dojś- 
ciu do  końca  elektrod  ulega  wygięciu  i radialnej 
kompresji  (rys.  10). 

Największa  kompresja  i nagrzanie  plazmy  wystę- 
puje na  osi  symetrii  układu,  w pobliżu  końca  elektro- 
dy wewnętrznej.  W obszarze  tym  powstaje  „ognisko 
plazmowe”,  które  w pewnych  przypadkach  może 
mieć  bardzo  małe  rozmiary  — średnicę  rzędu  1 mm 
i długość  rzędu  kilku  mm  (efekt  takiego  ogniskowania 
ukazuje  seria  fotografii  przedstawiona  na  rys.  10). 
W ognisku  plazmowym  można  uzyskać  plazmę  o bar- 
dzo dużej  koncentracji  i bardzo  wysokiej  tempera- 
turze. W wielu  eksperymentach  typu  plasma  focus 
uzyskuje  się  plazmę  o koncentracji  5 « 101#  cząstek  /cm3 
i temperaturze  rzędu  2,5  keV.  W największych  ukła- 
dach osiągane  są  rekordowe  koncentracje  1020  czą- 
stek/cm3 i temperatury  ok.  6 keV.  Mimo  że  czas 
życia  otrzymywanej  w ten  sposób  plazmy  jest  bardzo 
krótki  (10-8-10“7  s),  istnieją  w niej  warunki  do  wy- 
twarzania neutronów  z reakcji  syntezy  jądrowej.  Dla- 
tego podczas  wyładowań  typu  plasma  focus  obser- 
wuje się  silne  impulsy  promieniowania  neutronowego. 
Średnia  wydajność  neutronów  jest  przy  tym  w przy- 
bliżeniu proporcjonalna  do  kwadratu  energii  kumu- 
lowanej w układzie  przed  wyładowaniem.  W najwięk- 
szych działających  obecnie  układach  typu  plasma 
focus  obserwuje  się  wytwarzanie  1010-1012  neutronów 
na  jedno  wyładowanie. 

Uzyskanie  bardzo  dużych  koncentracji  i temperatur 
plazmy,  a także  silnych  impulsów  neutronowych, 
spowodowało  duży  wzrost  zainteresowania  wyłado- 
waniami plasma  focus.  Badania  w tym  kierunku  pro- 
wadzone są  w wielu  krajach  — w Stanach  Zjednoczo- 
nych, w Związku  Radzieckim,  Wielkiej  Brytanii,  Re- 
publice Federalnej  Niemiec  i we  Włoszech,  a także 
w Polsce. 


SMetody  laserowe 

Kierunek  badawczy,  któremu  poświęca  się  obecnie 
wiele  uwagi,  stanowią  prace  nad  wytwarzaniem  go- 
rącej plazmy  za  pomocą  laserów.  Metody  takie  opie- 
rają się  głównie  na  wykorzystaniu  impulsowych  lase- 
rów wielkiej  mocy.  Jeżeli  wiązka  z takiego  lasera  jest 
ogniskowana  w obszarze  gazowym  lub  na  powierz- 
chni ciała  stałego  i gęstość  strumienia  energii  świetlnej 
w ognisku  osiąga  wartość  1010-1012  W/cm2,  następuje 
proces  jonizacji  i rozwija  się  wyładowanie  plazmowe. 
Zjawisko  to  może  być  wykorzystane  do  wytwarzania 
plazmy  o wysokiej  temperaturze,  ponieważ  część  pro- 
mieniowania lasera  może  być  pochłaniana  przez  plaż- 


mę  powstającą  w czasie  rozwoju  wyładowania-  Kiedy 
stopień  jonizacji  gazu  w obszarze  przed  nagrzaną 
plazmą  osiąga  dostatecznie  dużą  wartość,  nowa  warst- 
wa plazmy  staje  się  nieprzepuszczalna  dla  rozpatry- 
wanego promieniowania.  W ten  sposób  strefa  pochła- 
niania przemieszcza  się  w kierunku  lasera.  Proces 
ten  przebiega  bardzo  szybko  (z  prędkością  rzędu 
107  cm/s)  i uniemożliwia  wydzielenie  się  całej  energii 
impulsu  w małym  obszarze  początkowego  wyłado- 
wania, co  utrudnia  osiągnięcie  bardzo  wysokich  tem- 
peratur. 


Utrzymywanie  gorącej  plazmy 

Plazmę  jako  zbiór  cząstek  naładowanych  najłatwiej 
jest  utrzymać  w określonym  obszarze  przez  otoczenie 
jej  polem  magnetycznym  o odpowiedniej  konfiguracji. 
Silne  pola  magnetyczne  potrzebne  do  tego  celu  wy- 
twarza się  za  pomocą  elektrycznych  prądów  przepusz- 
czanych przez  specjalne  uzwojenie  zewnętrzne  lub  za 
pomocą  prądów  płynących  przez  badaną  plazmę. 
Możliwe  jest  również  połączenie  obu  tych  sposobów. 


wiązka,  laserowa 


Rys.  11.  Zasada  eksperymentu,  w którym  gorąca  plazma  jest  wytwarzana 
przez  zogniskowanie  bardzo  silnej  wiązki  laserowej 
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Rys.  12.  Schemat  eksperymentu  laserowego,  w którym  wysokotemperaturowa  plazma  była  wytwarzana  przez  9 wiązek  laserowych 
Wiązki  te  oświetlały  jednocześnie  małą  kulkę  deuteryzowancgo  polietylenu  (o  promieniu  0,25  mm).  Łączna  energia  impulsów  lasero- 
wych osiągała  1300  J,  a czas  ich  trwania  wynosił  2-16  ns,  co  zapewniało  bardzo  dużą  moc  promieniowania 


Wielka  moc  współczesnych  układów  laserowych 
(1012-1013  W przy  czasie  trwania  impulsu  10“n-10“9s) 
umożliwia  jednak  skuteczną  jonizację  cienkich  folii 
metalowych  i organicznych,  drobnych  cząsteczek 
deuterku  litu  lub  małych  kulek  zamrożonego  wodoru 
(deuteru).  W eksperymentach  tego  typu  (rys.  11)  prze- 
ciętnie na  jedno  wyładowanie  uzyskuje  się  1015-1017 
jonów  o średniej  energii  100-1000  eV.  W celu  zwięk- 
szenia energii  i mocy  dostarczanej  do  plazmy,  a także 
dla  uzyskania  lepszej  symetrii  wyładowania  najwięk- 
sze eksperymenty  laserowe  realizowane  są  w układach 
wielowiązkowych  (rys.  12).  W eksperymentach  tego 
typu  uzyskuje  się  plazmę  o rekordowej  koncentracji 
5 -1022  cząstek  na  1 cm3  i temperaturze  jonowej  Tj  X 
* 500  eV. 


Zjawisko  pinchu 

Rozpatrzmy  najpierw  utrzymywanie  plazmy  za  po- 
mocą pola  magnetycznego  wytwarzanego  przez  prąd 
elektryczny,  który  przepływa  wzdłuż  osi  cylindrycznej 
kolumny  plazmowej.  Pole  magnetyczne,  które  towa- 
rzyszy przepływowi  tego  prądu,  ma  wówczas  kieru- 
nek azymutalny.  Oddziaływanie  takiego  pola  z po- 
osiowym prądem  elektrycznym  powoduje  radialne 
ściśnięcie  plazmy  w cienki  sznur  plazmowy  (rys.  13). 
Omawiane  zjawisko  nazywa  się  pinchem  liniowym 
lub  Z-pinchem  (ang.  pinch  ‘ściskać’).  Wykorzystując 
zjawisko  Z-pinchu  zbudowano  wiele  urządzeń  do  ba- 
dań plazmowych,  np.  przedstawiony  na  ii.  47  (tabl. 
12)  Columbus  II. 


Z-pinch 
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Rys.  13.  Zjawisko  pinchu  liniowego.  Przepływowi  prądu  przez 
plazmę  towarzyszy  azymutatne  pole  magnetyczne.  Zwiększenie 
natężenia  prądu  powoduje  wzrost  natężenia  pola  magnetycznego 
oraz  ściśnięcie  kolumny  plazmowej  w cienki  sznur  plazmowy 


Ściśnięcie  sznura  plazmowego  może  być  również 
wywołane  przez  szybko  narastające  zewnętrzne  pole 
magnetyczne  Bz.  Takie  pole  można  wytworzyć  drogą 
rozładowania  dużej  baterii  kondensatorów  przez  od- 
powiednio masywną  cewkę.  Natężenie  prądu  elek- 
trycznego w takiej  cewce  może  osiągnąć  miliony  am- 
perów.  W plazmie  indukowane  są  wówczas  silne  prą- 
dy elektryczne  Iz  o kierunku  azymutalnym,  które 
w oddziaływaniu  z zewnętrznym  polem  Bz  wywołują 
ściśnięcie  plazmy  ku  osi  symetrii  układu  (rys.  14). 
Ze  względu  na  kierunek  prądów  omawiany  proces 
nazywa  się  theta-pinchem  (0-pinch).  Wykorzystując 
0*pinch  zjawisko  0-pinchu  zbudowano  wiele  urządzeń  ba- 
dawczych, m.in.  amerykańskie  układy  Scylla  oraz 
angielski  układ  Thetatron.  Zdjęcie  ilustrujące  ściska- 
nie plazmy  w takim  układzie  przedstawia  rys.  14b. 
W układach  z 0-pinchem  można  wytwarzać  plazmę 
o koncentracji  1 01®— 1017  cząstek/cm3  i stosunkowo  wy- 
sokich temperaturach  Te  » 0,3-1, 5 keV  i 7}  4 keV, 

ale  czas  jej  utrzymywania  jest  bardzo  krótki  — 
rzędu  10  ps. 


Zasadniczą  wadą  omówionych  wyżej  układów  typu 
Z-pinch  lub  0-pinch  jest  krótki  czas  utrzymywania 
plazmy  spowodowany  szybką  ucieczką  cząstek  nała- 
0-pinch  dowanych  przez  oba  końce  komory  eksperymentalnej, 
toroidalny  Aby  wyeliminować  te  straty  w ostatnich  latach  pod- 
jęto badania  0-pinchu  toroidalnego  w układach  zam- 
kniętych w kształcie  pierścienia  (rys.  15).  W zwykłej 
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Rys.  14.  Zjawisko  0-pinchu.  a)  Szybko  narastające  osiowe  pole 
magnetyczne  indukuje  azymutalne  prądy,  które  nagrzewają 
zjonizowany  gaz,  a następnie  (pod  wpływem  działania  sił  elek- 
trodynamicznych) powodują  ściskanie  plazmy  w kierunku  osi 
układu,  b)  Zdjęcia  kolejnych  faz  zjawiska  wykonane  wzdłuż 
osi  cylindrycznej  komory  eksperymentalnej  za  pomocą  ultra- 
szybkiej kamery  fotograficznej  w odstępach  co  2 ps 
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Rys.  15.  Zjawisko  pinchu  toroidalnego.  Wzrostowi  indukowanego 
w plazmie  prądu  towarzyszy  zwiększenie  pola  magnetycznego, 
które  powoduje  ściskanie  pierścienia  plazmowego 


komorze  toroidalnej  na  plazmę  działają  dodatkowe 
siły  radialne,  gdyż  linie  sił  pola  magnetycznego  mają 
większą  krzywiznę  przy  wewnętrznej  stronie  komory. 
Siły  te  dążą  do  przesunięcia  sznura  plazmy  w stronę 
zewnętrznej  ścianki  torusa.  Ich  działanie  można  wy- 
eliminować stosując  specjalną  konfigurację  sznura 
plazmowego,  w której  wewnętrzna  powierzchnia  plaz- 
mowego torusa  jest  odpowiednio  „pofałdowana”. 
Siły  naruszające  stabilność  można  również  skompen- 
sować w układzie  toroidalnym,  w którym  indukowany 
jest  dostatecznie  silny  prąd  Iz.  Pole  magnetyczne  po- 
chodzące od  tego  prądu  nakłada  się  wtedy  na  zew- 
nętrzne pole  magnetyczne  i daje  pole  wypadkowe, 
którego  linie  sił  owijają  po  linii  śrubowej  sznur  plaz- 
mowy. Wyładowania  tego  typu  noszą  nazwę  „screw- 
-pinch”.  Największe  urządzenie  do  badań  0-pinchu 
toroidalnego  stanowi  obecnie  układ  Scyllac  (USA), 
w którym  duża  średnica  toroidalnej  komory  próżnio- 
wej wynosi  4 m,  a do  wytwarzania  pola  magnetycz- 
nego wykorzystana  jest  bateria  kondensatorów 
o energii  15  MJ. 


Pułapki  megnetyczne  typu  otwartego 

Do  utrzymywania  gorącej  plazmy  w pożądanym  ob- 
szarze stosuje  się  również  układy  z kwazistacjonar- 
nymi  polami  magnetycznymi  — tzw.  pułapki  magne- 
tyczne. Najprostszymi  pułapkami  magnetycznymi  są 
pułapki  zwierciadlane  (ang.  mirror  machines\  rys.  16). 
W urządzeniach  tych  stosuje  się  uzwojenia  zewnętrzne 
wytwarzające  osiowe  pole  magnetyczne  słabsze  w 
środkowej  części  komory,  a silniejsze  na  obu  jej  koń- 
cach. Zagęszczające  się  na  końcach  komory  linie  sił 
pola  magnetycznego  tworzą  wówczas  tzw.  zwierciadła 
magnetyczne,  które  odbijają  część  uciekających  z pla- 
zmy cząstek  z powrotem  do  wnętrza  komory.  Cząstki, 
które  mają  zbyt  dużą  składową  prędkość  wzdłuż  osi 
komory,  uciekają  z układu. 

W prostych  pułapkach  zwierciadlanych  nie  udało 
się  jednak  utrzymać  plazmy  o dużej  gęstości,  np. 
w największym  tego  typu  układzie  Ogra  I (ZSRR) 
uzyskano  plazmę  o koncentracji  n « 108  cząstek/cm3 
i czasie  utrzymania  r ^ 0,3  ms,  a w układzie  DCX  II 


screw-pinch 


pułapki 

zwierciadlane 


(USA)  plazmę  o parametrach  n a 8 TO9  cząstek/cm* 
oraz  r ^ 30  ms.  Inną  wadą  układów  z pułapkami 
zwierciadlanymi  było  występowanie  niestabilności 
magnetohydrodynamicznych.  Niestabilności  te  można 
jednak  wyeliminować  przez  zastosowanie  pułapek 
typu  ,, minimum-B’’,  w których  pole  magnetyczne 
pułapki  wzrasta  we  wszystkich  kierunkach  od  środka  układu, 
„mini-  np.  pułapka  typu  „karo”  (ang.  cusp geometry;  rys.  17). 
mum-B"  Ze  względu  na  duże  straty  cząstek  czas  utrzymywania 


plazma  kierunek  prądu 


magnetycznego 

Rys.  16.  Zasada  budowy  pułapki  magnetycznej  typu  zwiercia- 
dlanego. Pole  magnetyczne  silniejsze  na  obu  końcach  komory 
powoduje  zawracanie  uciekających  z plazmy  cząstek  naładowa- 
nych i działa  jak  zwierciadło  magnetyczne 

plazmy  w pułapkach  karo  jest  krótki  — wynosi  zwy- 
kle kilkadziesiąt  ps.  W układach  tego  typu  można 
jednak  metodą  iniekcji  wytworzyć  plazmę  o koncen- 
tracji 1013-10lł  cząstek/cm3,  co  w rezultacie  daje  po- 
równywalne z pułapkami  zwierciadlanymi  wartości 
iloczynu  n • r.  Pułapkami  otwartymi  typu  minimum-B 
są  również  pułapki  zwierciadlane  z prętami  stabiliza- 
cyjnymi (tzw.  pułapki  typu  Joffe,  rys.  18).  Zbudowano 
szereg  urządzeń  eksperymentalnych  tego  typu,  z któ- 
rych najbardziej  znane  są  radzieckie  Probkotrony. 
Osiągnięto  w nich  koncentrację  plazmy  rzędu  5 TO9 
cząstek/cm3,  temperaturę  T}  « 4 keV  oraz  czas  utrzy- 
mywania plazmy  r ^ 10  ms,  a więc  znacznie  dłuższy 
niż  w układach  typu  karo.  Pułapką  tego  typu  był 
radziecki  układ  OGRA  II  (il.  50,  tabl.  13). 

Zmniejszając  tylko  liczbę  prętów  do  4 i łącząc  od- 
powiednio ich  końce,  zbudowano  pułapki  minimum-B 
z uzwojeniami  w kształcie  szwu  na  piłce  tenisowej. 
Pułapki  takie  zastosowane  są  w układach  eksperymen- 
talnych Baseball  i Alice  (USA),  Phoenix  (Anglia)  oraz 
DECA  II  (Francja).  W układach  tego  typu,  stosując 
iniekcję  wysokoenergetycznych  cząstek  neutralnych. 


uzyskano  plazmę  o koncentracji  2 108  cząstek/cm3 
i czasie  utrzymania  50  ms  (Alice),  a przy  wyko- 
rzystaniu iniekcji  strumieni  plazmowych  — plazmę 
o koncentracji  1 013- 1 01 4 cząstek/cm3,  ale  o krótszym 
czasie  utrzymania  50  ps  (DECA  II). 

Omówione  wyżej  pułapki  z minimum-B  mają  jed- 
nak istotną  wadę;  między  równoległymi  uzwojeniami 
stabilizacyjnymi  występują  liniowe  szczeliny,  przez 
które  ucieka  część  cząstek  plazmy.  Wady  tej  pozba- 


cewki  elektromagnesu  linie  sił  pola 


Rys.  18.  Zasada  budowy  pułapki  zwierciadlanej  z prętami  stabi- 
lizacyjnymi (pułapka  typu  Joffe).  Prądy  płynące  przez  prze- 
wody ułożone  współosiowo  na  obwodzie  cylindrycznej  komory 
eksperymentalnej  wytwarzają  pola  magnetyczne,  które  nakła- 
dają się  na  pole  zwykłej  pułapki  zwierciadlanej.  W rezultacie 
plazma  wypełnia  obszar  pokazany  w przekroju  po  prawej  stronie 
rysunku 

wioną  jest  pułapka  typu  SM  ( Spherical  Multipole ), 
którą  opracowano  w Instytucie  Badań  Jądrowych  pułapka  SM 
w Świerku.  Pułapkę  typu  SM  można  zrealizować 
rozmieszczając  symetrycznie  na  powierzchni  kulistej 
komory  próżniowej  odpowiednio  skierowane  dipole 
magnetyczne,  a w praktyce  — silne  elektromagnesy. 

Rozkład  linii  sił  pola  magnetycznego  w takiej  pułapce 
jest  pokazany  na  ilustracji  51  (tabl.  13).  Jak  wynika 
z rozważań  topologicznych  i modelowych,  w pułapce 
typu  SM  nie  ma  liniowych  szczelin  ucieczki  plazmy, 
występuje  natomiast  pewna  liczba  wąskich  stożków 
ucieczki.  Przy  odpowiednim  doborze  natężeń  skła- 
dowych pól  magnetycznych  wszystkim  stożkom  ucie- 
czki w takiej  pułapce  może  jednak  odpowiadać  kąt 
bryłowy  mniejszy  niż  w innych  pułapkach  mini- 
mum-B. W przeprowadzonych  dotychczas  ekspery- 
mentach z pułapką  SM  uzyskano  czas  utrzymywania 
plazmy  w przybliżeniu  3-krotnie  dłuższy  niż  w kon- 
wencjonalnej pułapce  typu  karo.  Prowadzi  się  obec- 
nie badania  w celu  uzyskania  jeszcze  lepszych  para- 
metrów plazmy,  np.  przez  wykorzystanie  mieszanych 
pól  magnetycznych  — tzw.  konfiguracji  hybrydo- 
wych, oraz  stosowanie  różnych  metod  wytwarzania. 


Pułapki  magnetyczne  typu  zamkniętego 

W ostatnich  latach  szczególnie  intensywnie  prowa- 
dzone były  badania  nad  pułapkami  magnetycznymi 
typu  zamkniętego,  których  typowymi  przykładami  są 
układ  toroidalny  przedstawiony  na  rys.  19  oraz  an- 
gielski układ  ZETA. 

Wadą  prostych  układów  toroidalnych  jest  występo- 
wanie radialnych  nieskompensowanych  gradientów 
pola  magnetycznego,  które  wywołują  przemieszczanie 
cząstek  naładowanych  w poprzek  linii  sił  pola  ogra-  układy 
niczającego  (ruchy  dryfowe)  i prowadzą  do  niestabil-  toroidalne 
ności  plazmy.  Ruchy  dryfowe  można  ograniczyć  przez 
odpowiednie  skręcenie  linii  sił  pola  magnetycznego, 
np.  przez  nadanie  komorze  kształtu  ósemki  lub  przez 
zastosowanie  skręconych  uzwojeń  ułożonych  na  ob- 
wodzie komory  toroidalnej.  Koncepcję  tę  wykorzysta- 
no budując  amerykańskie  układy  toroidalne,  które 
otrzymały  nazwę  stellaratorów  (rys.  20),  szereg  urzą-  stellaratory 
dzeń  w Anglii,  we  Francji  i NRF,  a także  radziecki 
stellarator  Uragan  (il.  48,  tabl.  13). 
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Innym  rodzajem  pułapek  zamkniętych  są  układy 
toroidalne  typu  tokamak  (il.  49,  tabl.  13),  których 
zasadę  budowy  ilustruje  rys.  22.  W odróżnieniu  od 
omówionych  wyżej  prostych  układów  toroidalnych 
(typu  ZETA),  w układach  typu  tokamak  pole  stabi- 
lizujące Bz  jest  znacznie  silniejsze  od  pola  B9. 

Wielką  zaletą  omówionych  wyżej  pułapek  toroidal- 
nych jest  brak  możliwości  ucieczki  cząstek  nałado- 
wanych wzdłuż  linii  sił  pola  magnetycznego.  W pułap- 
kach tego  typu,  oprócz  zwykłej  dyfuzji  cząstek  spo- 
wodowanej zderzeniami  binarnymi  (dwucząstkowy- 


toroidalna  komora  próżniowa 


linie  sił  pola  magnetycznego, 
które  towarzyszy  prądowi  wyładowania 


pierwotne  uzwojenie 
transformatora 


Rys.  19.  Zasada  budowy  zamkniętych  pułapek  magnetycznych 
typu  toroidalnego.  Plazma  w komorze  eksperymentalnej  stanowi 
wtórne  uzwojenie  transformatora,  co  umożliwia  indukowanie 
prądów  powodujących  wytwarzanie  i nagrzewanie  plazmy 


uzwojenie  wytwarzające  pole  B$ 


Rys.  20.  Zasada  budowy  pułapek  typu  stellarator.  Dodatkowe 
uzwojenia  powodują  skręcenia  linii  sił  wypadkowego  pola  mag- 
netycznego i wpły  wają  stabilizująco  na  wyładowanie  plazmowe. 
Na  rysunku  pominięto  rdzeń  transformatora,  który  się  stosuje 
zwykle  do  zasilania  wyładowań 


uzwojenia  w postaci  pierścieni 
wytwarzające  pole  Bz 


komora  próżniowa 


plazma 


przewodzący  pierścień 
wytwarzający  pole  By 


Rys.  21.  Zasada  budowy  pułapki  Levitron.  Wewnątrz  toroidalnej 
komory  otoczonej  uzwojeniami  stabilizującymi  umieszczony  jest 
pierścień  z prądem,  który  wytwarza  dodatkowe  pole  magnetyczne, 
stabilizujące  plazmę 
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mi),  występuje  jednak  dyfuzja  anomalna,  która  po- 
woduje znaczne  straty  cząstek  i zmniejsza  czas  życia 
plazmy.  W ostatnich  latach  udowodniono  jednak,  że 
można  stworzyć  warunki,  w których  uzyskuje  się 
znacznie  dłuższy  czas  życia  plazmy.  W eksperymen- 
tach przeprowadzonych  w stellaratorze  Wendelstein 
w Garching  (NRF)  otrzymano  czas  utrzymania 
t » IOOtb  — (gdzie  t b — czas  życia  plazmy  obliczo- 
ny teoretycznie),  a w urządzeniach  tokamak  zbudo- 
wanych w Instytucie  Energii  Atomowej  w Moskwie  ut- 
rzymano plazmę  o koncentracji  (3-6)  TO13  cząstek/cm3, 
temperaturach  Te  x 1000eV  (12  min  K)  i T}  x 700  eV 
(8  min  K)  przez  czas  r = 30tb  (ok.  70  ms). 

W Moskwie  zbudowano  bardzo  wiele  układów 
typu  tokamak,  z których  największy  obecnie  jest 
układ  T-10.  Duży  promień  toroidalnej  komory  tego 
układu  wynosi  1,5  m,  maksymalne  pole  magnety- 
czne Bz  — 5 T,  a prąd  wyładowania  /ma*  = 500  kA. 
Parametry  plazmy  otrzymywanej  w tokamakach  są 
tak  dobre,  że  nawet  dla  oszczędności  czasu  i środków 
w Princeton  (USA)  przebudowano  na  tokamak  naj- 
większy stellarator  amerykański  — Model  C (il.  49, 
tabl.  13).  Podjęta  została  również  budowa  nowych 
tokamaków  w USA,  Anglii,  Francji,  NRF  oraz 
w Japonii.  Część  tych  układów  jest  obecnie  budowana 
w ramach  współpracy  międzynarodowej. 

Równocześnie  z pracami  nad  ulepszeniem  pułapek 
toroidalnych  wzrosło  także  zainteresowanie  innymi 
pułapkami  typu  zamkniętego.  Badania  różnych  ukła- 
dów zamkniętych  wykazały  jednak,  że  spełnienie  wa- 
runków minimum-B  jest  topologicznie  niemożliwe. 
W związku  z tym  zwrócono  uwagę  na  możliwość  za- 


metalowy  torus  komory  próżniowej 


kierunek  prądu 
stabilizującego 
wyładowanie 


kierunek 
wypadkowego  pola 
magnetycznego 


Rys.  22.  Zasada  budowy  pułapek  typu  tokamak.  Sznur  plaz- 
mowy utrzymywany  jest  polem  magnetycznym  Bv  pochodzącym 
od  prądu  wyładowania.  Do  stabilizacji  wykorzystuje  się  silne 
pole  magnetyczne  Bz,  wytwarzane  przez  cewki  umieszczone  na 
obwodzie  toroidalnej  komory  eksperymentalnej.  Linie  sił  wy- 
padkowego pola  magnetycznego  są  silnie  skręcone 


komora 

przewodzące  pierścienie  plazma  próżniowa 

wytwarzające  pole  magnetyczne 

Rys.  23.  Zasada  budowy  pułapki  typu  kwadrupola  toroidalnego. 
Plazma  jest  utrzymywana  głównie  przez  pole  magnetyczne  po- 
chodzące od  prądów  płynących  w dwóch  pierścieniowych  uzwo- 
jeniach wewnętrznych.  W analogiczny  sposób  można  zbudować 
oktupol  toroidalny  lub  układ  jeszcze  wyższego  rzędu 


układ 

T-10 


warunek  pewnienia  „średniego”  minimum-B  wzdłuż  określo- 
average  nych  torów  ruchu  cząstek  plazmy  (czyli  tzw.  average 
minimum-B  minimum-B).  Spełnienie  warunku  average  mini- 
mum-B można  osiągnąć  nie  tylko  w stellaratorach 
i tokamakach,  ale  również  w pułapkach  typu  Levi- 
tron  lub  spherator,  w których  wewnątrz  toroidalnej 
(lub  elipsoidalnej)  komory  umieszczone  jest  dodatko- 
we pierścieniowe  uzwojenie  z odpowiednio  silnym 
prądem.  Pole  magnetyczne  B pochodzące  od  tego 
prądu  nakłada  się  na  pole  toroidalne  Bz , wywołując 
„skręcenie”  linii  sił  pola  wypadkowego.  W rezultacie 
plazma  utrzymywana  jest  wokół  pierścieniowego 
uzwojenia  wewnętrznego  (rys.  21).  Inną  odmianę  pu- 
łapek zamkniętych,  spełniających  warunek  average 
minimum-B,  stanowią  pułapki  toroidalne  ąuadrupo- 
lowe  lub  oktupolowe,  w których  wewnątrz  toroidalnej 
komory  umieszcza  się  odpowiednio  2 lub  4 pierścienie 
z prądem  (rys.  23).  W pułapkach  tego  typu  plazma 
zajmuje  obszar  wokół  i pomiędzy  przewodzącymi 
pierścieniami,  które  zapewniają  najlepszą  stabilność 
magnetohydrodynamiczną. 

Porównując  różne  pułapki  typu  zamkniętego  można 
stwierdzić,  że  największy  postęp  w technice  otrzymy- 
wania i utrzymywania  gorącej  plazmy  został  dotych- 
czas osiągnięty  w urządzeniach  tokamak,  dlatego 
też  wysiłek  wielu  ośrodków  badawczych  skierowany 
jest  obecnie  na  budowę  i badanie  dużych  układów 
typu  tokamak.  Równocześnie  prowadzi  się  badania 
w różnych  innych  kierunkach. 


Perspektywy  dalszych  osiągnięć 


Dotychczasowe  osiągnięcia  w dziedzinie  badań  ter- 
mojądrowych ujmuje  wykres,  na  którym  podane  są 
podstawowe  parametry  wytwarzanej  plazmy : jej  tem- 


temperatura  „zapłonu” 
reakcji  termojądrowych 

g** 

Rys.  24.  Wykres  zestawiający  najlepsze  wyniki,  uzyskane  w róż- 
nych urządzeniach  do  badań  termojądrowych.  Zaznaczone  na 
rysunku  płaszczyzny  odpowiadają  określonym  wartościom  ilo- 
czynu koncentracji  n i czasu  utrzymania  plazmy  r.  Warunkiem 
uzyskania  dodatniego  bilansu  energetycznego  reakcji  termoją- 
drowej w mieszaninie  deuter-tryt  o temperaturze  powyżej  45  mhi 
K Jest  nz  ^ 10“  s/cm* 


peratura,  gęstość  oraz  czas  utrzymywania  (rys.  24). 

Wykres  umożliwia  porównanie  wyników,  które  udało 
się  osiągnąć  w różnych  układach  eksperymentalnych 
przy  wykorzystaniu  wyżej  wymienionych  metod  wy- 
twarzania i nagrzewania  plazmy.  Na  szczególną  uwa- 
gę zasługują  rekordowe  wartości  iloczynu  koncentra- 
cji i czasu  utrzymania  plazmy  ( m « 1013  cm"3,  s), 
które  osiągnięto  w ostatnich  latach  w niektórych 
urządzeniach  typu  plasma  focus  oraz  w eksperymen- 
tach z laserem. 

Należy  przy  tym  zauważyć,  że  nie  ma  zasadniczych 
trudności  z wytworzeniem  jonów  o jeszcze  większych 
energiach  i uzyskaniem  jeszcze  wyższych  temperatur. 

Poważne  trudności  związane  są  natomiast  z utrzymy- 
waniem plazmy  w izolacji  w tak  wysokich  tempera- 
turach i dlatego  ciągle  poszukuje  się  nowych  bardziej 
efektywnych  metod. 

Potrzeba  rozwoju  badań  termojądrowych  zintensy- 
fikowała postęp  w technice  i technologii.  W dziedzi- 
nie techniki  wysokiej  próżni  zbudowano  np.  układy 
pompujące  o próżni  granicznej  rzędu  10" 7 Pa  i wy- 
dajności wielu  tysięcy  l/s  oraz  opanowano  technolo- 
gię wysokopróżniowych  materiałów  konstrukcyjnych, 
potrzebnych  do  budowy  przyszłego  reaktora  termoją- 
drowego. Bardzo  duży  postęp  nastąpił  także  w dzie- 
dzinie budowy  elektromagnesów,  zwłaszcza  nadprze- 
wodzących, potrzebnych  do  utrzymywania  gorącej 
plazmy.  Wiele  wysiłku  włożono  również  w rozwój 
techniki  wysokich  napięć. 

Zbudowano  generatory  udarowe,  zdolne  do  kumu- 
lowania energii  do  kilkunastu  milionów  dżuli  i wy- 
twarzania impulsów  prądowych  o amplitudzie  do  kil- 
ku milionów  amperów. 

W chwili  obecnej  istnieje  już  wiele  wstępnych  pro-  technologia 
jektów  technicznych  reaktorów  termojądrowych  reaktorów 
o różnych  zasadach  działania.  Projekty  te  opierają  termo- 
się  zwykle  na  założeniu,  że  w przyszłym  reaktorze  jądrowych 
termojądrowym  komora  próżniowa,  która  zawierać 
będzie  gorącą  plazmę,  otoczona  zostanie  grubą  war- 
stwą moderatora  neutronów.  Badania  nad  różnego 
typu  materiałami  wykazały,  że  ścianki  takiej  komory 


osłona  biologiczna 

zewnętrzna  ścianka 
próżniowa 

magnes 

izolacja 
komórkowa  struktura  ścianki 


Rys.  25.  Projekt  konstrukcj  i jednego  z sektorów  reaktora  ter- 
mojądrowego z komorą  toroidalną  o średnicy  zewnętrznej  rzędu 
kilkunastu  metrów 


16  - Encykłopedia  fizyki  współczesnej 
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mogą  być  wykonane  z niobu  i molibdenu  lub  niobu 
i wanadu,  a moderator  — z czystego  litu,  ze  stopu 
lit-beryl  lub  z eutektycznego  związku  (LiF)2BeF2. 
Umieszczone  na  zewnątrz  moderatora  uzwojenia 
elektromagnesów  mogą  być  natomiast  wykonane 
z materiałów  nadprzewodzących  pracujących  w od- 
powiednio niskich  temperaturach.  Poza  tym,  przyszły 
reaktor  termojądrowy  musi  mieć  oczywiście  odpo- 
wiednią konstrukcję  wspierającą  i specjalne  osłony 
biologiczne.  Schemat  ideowy  takiego  reaktora  przed- 
stawiono na  rys.  25. 

Z analizy  różnych  możliwych  konfiguracji  wynika, 
że  dla  przyszłego  reaktora  termojądrowego  korzystna 
byłaby  konfiguracja  typu  tokamak  (lub  stellarator), 
o ile  uda  się  uzyskać  odpowiednio  długi  czas  utrzy- 
mywania plazmy  i zwiększyć  osiągane  wartości  ilo- 
czynu nr.  Obliczenia  wykazały  również  możliwość 
wykorzystania  konfiguracji  typu  otwartego  (np.  pu- 
łapek zwierciadlanych),  pod  warunkiem,  że  uda  się 
opracować  odpowiednio  wydajny  system  iniekcyjny 
oraz  ograniczyć  straty  cząstek  naładowanych.  Istnieją 
także  projekty  impulsowych  reaktorów  termojądro- 


Radioizotopy 

Lech  Stolarczyk 

Jądro  atomowe  jest  układem  złożonym  z protonów 
i neutronów  silnie  ze  sobą  związanych  siłami  jądro- 
wymi. Jądro  o określonych  liczbach  protonów  p i ne- 
utronów n (liczba  atomowa  Z i liczba  masowa  A) 
może  znajdować  się  w jednym  z możliwych  dla  niego 
kwantowych  stanów  energetycznych.  Najtrwalszym 
nuklid  stanem  danego  jądra  (czyli  inaczej  nuklidu)  jest  stan 

0 najniższej  możliwej  energii,  czyli  tzw.  stan  podsta- 
wowy. Jądra  w stanie  podstawowym  bez  ingerencji 
z zewnątrz  albo  trwają  niezmienione  — są  to  izotopy 
trwałe,  albo  z określonym  prawdopodobieństwem 
ulegają  samorzutnej  reakcji  (przemianie)  jądrowej  — 
są  to  izotopy  promieniotwórcze,  inaczej  radioizotopy 
(->  Rozpady  jąder).  Samorzutna  przemiana  radioizo- 
topów w izotopy  lub  radioizotopy  (na  ogół  innego 
pierwiastka)  zachodzi  przez  emisję  cząstek  elementar- 
nych lub  jąder  (np.  helu).  Najważniejszymi  samo- 
rzutnymi przemianami  są:  emisja  /?+,  /?',  a,  wychwyt 
K oracz  samorzutna  reakcja  rozszczepienia.  Rozszcze- 
pieniu ulegają  tylko  jądra  najcięższe,  nigdy  nie  jest 
to  proces  dominujący  (np.  dla  izomeru  kalifornu 
2||mCr  stanowią  one  3,1  % samorzutnych  reakcji 
jądrowych,  a dla  uranu  238U  — ok.  10“ 4 %). 

Jądra  powstające  w reakcjach  jądrowych  są  bardzo 
często  w stanie  wzbudzonym,  mogą  one  ulec  przemia- 
nie jądrowej  albo  w jednym  lub  kilku  etapach  w'ypro- 
mieniow'ać  energię  wzbudzenia  w postaci  fotonów 
(promieniowanie  y)  i przejść  do  stanu  podstawowego, 
przemiana  y Proces  emisji  promieniowania  y,  zwany  przemianą  y, 
jest  na  ogół  bardzo  szybki.  Zwykle  zachodzi  on 
z prawdopodobieństwem  bliskim  1 w ciągu  czasu  ok. 
10“15s.  Zdarzają  się  jednak  takie  stany  wzbudzone, 
w których  przemiana  y jest  znacznie  wolniejsza 
(mniej  prawdopodobna),  i wtedy  jądro  może  trwać 
w takim  stanie  znacznie  dłużej.  Na  przykład  izotop 
bizmutu  210Bi,  trwały  w stanie  podstawowym,  posiada 
taki  stan  wzbudzony,  dla  którego  nawet  po  upływie 
milionów  lat  prawdopodobieństwo  przejścia  do  stanu 
podstawowego  jeszcze  znacznie  różni  się  od  1 . Takie 
względnie  trwałe  stany  wzbudzone  izotopów  nazy- 
stan  meta-  wamy  stanami  metatrwałymi.  Jądra  tego  samego  izo- 
trwały  topu  znajdujące  się  w różnych  stanach  (podstawowym 

1 metatrwałym)  nazywamy  izomerami.  Izomery  róż- 
nią się  nieco  masą.  Izomeria  jądrowa  nie  jest  zjawis- 
kiem częstym,  a tylko  kilka  izotopów  ma  więcej  niż 

2 izomery.  Jądra  w stanie  wzbudzonym,  w szczegól- 
ności w stanie  metatrwałym,  są  mniej  trwałe  od  jąder 

izomer  w stanie  podstawowym;  mogą  one  ulegać  takim  re- 


wych  opartych  na  wykorzystaniu  metod  lasero- 
wych. 

Wszystkie  przeprowadzone  dotychczas  obliczenia 
techniczne  wskazują  na  to,  że  przyszłe  reaktory  ter- 
mojądrowe będą  prawdopodobnie  miały  stosunkowo 
duże  rozmiary  (promień  samej  komory  próżniowej  — 
rzędu  kilku  do  kilkunastu  metrów).  Moc  tych  reak- 
torów będzie  prawdopodobnie  osiągać  wartości  od 
kilku  do  kilkunastu  gigawatów. 

Można  śmiało  powiedzieć,  że  ludzkość  jest  już  bar- 
dzo blisko  zdobycia  nowego  niewyczerpalnego  źródła 
energii.  Na  drodze  do  tego  celu  piętrzą  się  jednak 
jeszcze  poważne  trudności,  tak  że  nie  sposób  dokład- 
nie określić  termin  uruchomienia  pierwszego  reak- 
tora termojądrowego. 

L.A.  Arcimowicz  Czwarty  stan  materii , Warszawa  1972; 
J.  Crussard  Energia  termojądrowa , Warszawa  1967;  A. W.  Czer- 
nietski  Wstęp  do  fizyki  plazmy , Warszawa  1971 ; D. A.  Fjrank- 
Kamieniecki  Plazma  — czwarty  stan  materii , Warszawa  1963; 
W.F.  Kalinin  Termojądrowy  reaktor  przyszłości.  Warszawa  1968; 
S.  Kaliski  Lasery  — synteza  termojądrowa.  Warszawa  1975; 
J.G.Linhart  Fizyka  plazmy , Warszawa  1963;  M.  Sadowski 
Świat  wysokich  temperatur.  Warszawa  1975;  W.  Zonn  As- 
trofizyka ogólna , Warszawa  1955. 


akcjom,  które  byłyby  niemożliwe,  gdyby  jądra  były 
w stanie  podstawowym. 

Izotopy  i radioizotopy  oznaczamy  symbolami  lite- 
rowymi odpowiedniego  pierwiastka  chemicznego  do- 
pisując przed  tymi  symbolami  u dołu  liczbę  Z, 
a u góry  — liczbę  A.  W skróconym  zapisie  opuszcza- 
my liczbę  Z,  ponieważ  jest  ona  zaszyfrowana  w sym- 
bolu chemicznym.  Wyjątkowo  izotopy  wodoru  zapi- 
sujemy często  innymi  literami  niż  jego  symbol  che- 
miczny H:  D od  deuter  i T od  tryt.  Symbole,  w któ- 
rych po  liczbie  masowej  dopisuje  się  literę  m ozna- 
czają izomery  w stanie  wzbudzonym  metatrwałym 
(np.  2l0Bi  to  stan  podstawowy,  a 210mBi  to  wspo- 
mniany, wyjątkowo  trwały  izomer  wzbudzony).  W wy- 
padku izomerii  wielokrotnej  oraz  na  oznaczenie 
innych  niż  metatrwałe  stanów  wzbudzonych  posłu- 
gujemy się  symbolami  izotopu  z odpowiednimi  do- 
piskami, znakami  (np.  gwiazdka  za  symbolem)  itp. 

Dobrą  miarą  trwałości  izotopu  jest  okres  połowicz-  okres 
nego  rozpadu  /1/2,  czyli  czas,  w ciągu  którego  połowa  połowicznego 
jąder  danego  izotopu  (izomeru)  ulega  rozpadowi,  rozpadu 
Dla  izotopów  trwałych  /1/2  = oo.  Im  trwalszy  radio- 
izotop, tym  mniejsze  prawdopodobieństwo  zajścia 
reakcji  i tym  dłuższe  jest  /1/2.  Radioizotopy  o bardzo 
długich  /1/2  (np.  dłuższych  od  1017  lat  ) są  niewykry- 
walne.  Podział  izotopów  na  izotopy  trwałe  i radio- 
izotopy jest  nieostry,  zależny  od  dokładności  metod 
pomiarowych.  Istnieje  nieliczna  grupa  izotopów', 
których  nietrwałości  nie  można  ani  teoretycznie 
wykluczyć,  ani  doświadczalnie  potwierdzić  (zob. 
rys.  5,  str.  221).  Praktycznie  granicą  doświadczalnego 
zidentyfikowania  nuklidu  jako  radioizotopu  jest 
jego  trwałość  odpowiadająca  nie  krótszemu  tlf2  niż 
10“6  s.  Granica  ta  nie  jest  oczywiście  ostra.  W pew- 
nym sensie  umownie  możemy  więc  radioizotopy 
określić  jako  nuklidy  mające  w stanie  podstawowym 
(a  w wypadku  izomerów  — w stanie  metatrwałym) 
wartości  t1/2  leżące  w przedziale  od  10“ 6 s do 
1017  lat. 

Jednak  nawet  w grupie  izotopów  trwałych  możemy  energia 
mówić  o zróżnicowanej  trwałości  jąder.  Miarą  tej  wiązania 
trwałości  jest  energia  wiązania  En  przypadająca  na 
jeden  nukleon.  Najtrwalszymi  jądrami  są  jądra  z licz- 
bą masową  25  ^ A ^ 150,  mające  największą  energię 
En.  Jądra  o parzystych  liczbach  p i n (parzysto-parzy- 
ste)  są  na  ogół  trwalsze  od  jąder  o jednej  z tych  liczb 
nieparzystej  (nieparzysto-parzystych  lub  parzysto-nie- 
parzystych),  a jądra  nieparzysto-nieparzyste  są  zawsze 
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znacznie  mniej  trwałe.  W tej  ostatniej  grupie  spoty- 
kamy tylko  cztery  izotopy  trwałe  (D,  6Li,  10B  oraz 
14N).  Pierwiastki  o Z parzystym  mają  często  po  kilka 
trwałych  izotopów  i wiele  radioizotopów,  a pier- 
wiastki o Z nieparzystych  tworzą  znacznie  mniej 
nuklidów  o porównywalnej  trwałości.  Dla  dużych 
liczb  masowych  energia  En  maleje  do  zera  i tak  dla 
Z > 83  nie  ma  już  izotopów  trwałych,  a dla  Z ^ 83 
jedynie  technet  (nieparzyste  Z = 43)  nie  ma  żadnego 
trwałego  izotopu. 


Metody  radiometryczne 
pomiaru  radioizotopów 

Najczęściej  w pomiarach  ilościowych  wykorzystuje 
się  zdolność  cząstek  naładowanych  i promieni  y 
dejonizacji  ośrodka,  do  którego  cząstka  i promienie 
oddziały-  trafiają  (metody  jonizacyjne).  Cząstka  a lub  fi  prze- 
wanie  kazuje  wzdłuż  toru  swego  lotu  energię  cząsteczkom 
a,  fi  lub  y ośrodka,  a część  tej  energii  zużywa  się  na  wytworzenie 
z materią  jonów.  Fotony  (a  więc  promienie  y)  mogą  całą  swą 
energię  lub  jej  część  przekazać  jakiemuś  elektronowi 
ośrodka  (zjawisko  fotoelektryczne  lub  efekt  Compto- 
na),  który  wyrwany  ze  swego  położenia  przejmuje 
tę  energię  jako  energię  kinetyczną.  W wypadku  foto- 
nów o energii  większej  od  1,022  MeV  możliwe  jest 
zjawisko  tworzenia  par,  w którym  foton  znika,  a pow- 
staje para  negaton-pozyton.  Masa  spoczynkowa 
powstałych  cząstek  równoważna  jest  energii  1,022 
MeV,  a nadwyżka  energii  fotonu  ponad  tę  wartość 
pojawia  się  jako  energia  kinetyczna  tych  cząstek. 
Wytworzone  cząstki  jonizują  ośrodek  wzdłuż  swych 
torów,  a spowolniony  pozyton  anihiluje  następnie 
z którymś  z elektronów  (negatonów)  ośrodka  — 
obie  cząstki  znikają,  a na  ich  miejsce  pojawiają  się 
dwa  fotony  o energii  0,51 1 MeV.  Fotony  te  mogą  dalej 
oddziaływać  z ośrodkiem.  We  wszystkich  więc  wy- 
padkach ośrodek  ulega  jonizacji  wzdłuż  toru  pier- 
wotnych lub  wtórnych  cząstek. 

Jeżeli  jonizacja  wywołana  przez  promienie  a,  fi  lub 
y zajdzie  w komorze  z rozrzedzonym  gazem  i dołą- 
czonymi elektrodami,  to  przykładając  do  elektrod 
odpowiednie  napięcie  możemy  „wyłapać”  na  elektro- 
dach cały  ładunek  wytworzonych  jonów  (liczniki 
proporcjonalne).  Ponieważ  każdy  rodzaj  promienio- 
wania musi  przekazać  ośrodkowi  określoną  energię 
licznik  na  wytworzenie  określonej  liczby  (ładunku)  jonów, 
proporcjo-  liczniki  proporcjonalne  pozwatają  zmierzyć  energię 
nalny  promieniowania  przekazaną  ośrodkowi.  Gdy  pro- 
mieniowanie jest  bardzo  słabe,  pomiar  taki  staje  się 
jednak  niemożliwy.  Można  wtedy  przyłożyć  do  elek- 
trod znacznie  wyższe  napięcie,  tak  aby  wytwarzane 
przez  promieniowanie  jony  ulegały  przyspieszeniu 
w polu  elektrycznym  w komorze  i wywoływały  joni- 
zacje wtórne  (liczniki  Geigera-Mlillera  — GM). 
Każde  trafienie  cząstki  jonizującej  w licznik  spowoduje 
licznik  w tych  warunkach  przepływ  prądu  trwający  od  1 ps 
Geigera-  do  1 ms  (zależnie  od  konstrukcji  licznika).  Licznik 
Mullera  GM  umożliwia  zliczanie  cząstek  (lub  fotonów) 
jonizujących  trafiających  w licznik. 

Zastąpienie  gazu  w komorze  półprzewodnikiem 
znacznie  rozszerza  możliwości  badawcze,  a odpowied- 
nia konstrukcja  detektorów  (komór,  liczników) 
promieniowania  umożliwia  tworzenie  zestawów  z de- 
tektorów i współpracujących  z nimi  urządzeń  elektro- 
nicznych (tabl.  14,  il.  53).  Zmiany  te  umożliwiają 
ilościową  i jakościową  analizę  promieniowania,  czyli 
określenie  ilości  i energii  cząstek  emitowanych  przez 
radioizotopy. 

Metody  radiometryczne  cechuje  wysoka  czułość 
i duża  dokładność,  dzięki  czemu  można  szybko  iden- 
warunek  tyfikować  i określać  ilościowo  różne  radioizotopy, 
wykrywał-  Warunkiem  wykrywalności  radioizotopu  jest  takie 
ności  jego  stężenie,  aby  w próbce  zachodziło  przynajmniej 
radioizotopu  kilka  rozpadów  w ciągu  sekundy.  Izotop  B26Ra  o 


/i/a  = 1590  lat  można  wykryć  przy  zawartości  w prób- 
ce 10-9  g;  gdy  radioizotop  ma  łlft  krótszy  — wykry- 
walna ilość  substancji  jest  znacznie  mniejsza. 


Otrzymywanie  radioizotopów 


Znanych  izotopów  jest  blisko  1800,  a tylko  ok.  270 
to  izotopy  trwałe,  resztę  stanowią  radioizotopy.  Ale 
tylko  nieliczne  z nich  występują  w przyrodzie.  W du- 
żych skupiskach  spotyka  się  tylko  radioizotopy 
o długich  /1/2,  należące  do  pokazanych  na  rys.  1 
rodzin  promieniotwórczych.  Towarzyszą  im  w bardzo 
małych  stężeniach  krótkożyjące  radioizotopy  z tych 
rodzin.  Wyodrębnienie  poszczególnych  radioizoto- 
pów ze  źródeł  naturalnych  jest  zawsze  bardzo  kosz- 
towne i rzadko  opłacalne.  Wiele  różnych  radioizoto- 
pów, ale  w bardzo  małych  stężeniach,  powstaje 
w reakcjach  jądrowych  inicjowanych  przez  promie- 
niowanie kosmiczne,  np.  izotop  węgla  l4C  występuje 
w atmosferycznym  dwutlenku  węgla  COz  w stężeniu 
ok.  10~10  %•  Izotop  14C  można  wykryć  w jeszcze 
znacznie  mniejszym  stężeniu,  jednak  otrzymywanie 
go  ze  środowiska  naturalnego  jest  niemożliwe,  a ściśle 
mówiąc  byłoby  ono  niesłychanie  kosztowne.  Po- 
wszechnie w środowisku  naturalnym  występują  też 
w małych  stężeniach  i inne  radioizotopy  o długim 
/ 1/2,  np.  izotop  potasu  40K. 

Przeprowadzane  wybuchy  jądrowe  wprowadziły 
do  środowiska  naturalnego  znaczne  ilości  różnych 
innych  radioizotopów,  z których  trwalsze  stanowią 
nawet  poważne  zagrożenie,  głównie  ze  względu  na 
wywołane  ich  promieniowaniem  przyspieszanie  de- 
generacyjnych  mutacji,  wzrost  zachorowań  na  bia- 
łaczkę i in.  I te  radioizotopy  nie  mogą  jednak  być 
otrzymywane  ze  środowiska  naturalnego. 


Aktywacja  neutronowa 

Ogromna  większość  wykorzystywanych  radioizoto- 
pów jest  celowo  wytwarzana  w specjalnie  prowa- 
dzonych, kontrolowanych  reakcjach  jądrowych  (-> 

Energia  jądrowa).  Z punktu  widzenia  techniki  wy- 
twarzania radioizotopów  w większych  ilościach  aktywacja 
najważniejsze  są  reakcje  przebiegające  w wyniku  neutronowa 
trafienia  w jądro  neutronem  (aktywacja  neutronowa) 
oraz  reakcje  należące  do  szeregu  konsekutywnych 
procesów  samorzutnych,  inicjowanych  takim  tra- 
fieniem. Reakcje  te  przeprowadza  się  na  wielką  skalę 
wprowadzając  do  kanałów  reaktora  jądrowego  różne 
substancje,  zwane  ogólnie  materiałami  tarczowymi. 

W reakcji  59Co-f « -►  80Co  otrzymuje  się  z trwałego  otrzymy- 
izotopu  kobaltu  59Co  radioaktywny  izotop  60Co,  wanie 
stosowany  na  wielką  skalę  jako  źródło  użytecznego  kobaltu 
promieniowania  y.  Radioizotopu  80Co  nie  wyodręb-  60Co 
nia  się  z masy  macierzystego  izotopu  trwałego,  ale 
wykorzystuje  mieszaninę  izotopów  tym  bogatszą 
w radioizotop,  im  większe  było  natężenie  strumienia 
neutronów  w reaktorze  i im  dłużej  materiał  tarczowy 
przebywał  w kanałach  reaktora.  Podobnie  w reakcji: 

“N-fJn-*-  lJN*  ->  powstaje  promienio- 

twórczy izotop  węgla,  który  można  chemicznie  od- 
dzielić od  macierzystego  materiału  tarczowego  i prze- 
kształcić w potrzebny  związek  chemiczny. 

W analogicznych  reakcjach  otrzymuje  się  z trwa- 
łych izotopów  ||C1  oraz  JgS  cenne  radioizotopy 
HS  i |fP.  Wszystkie  wymienione  radioizotopy  emitują 
promieniowanie  /?“,  któremu  w wypadku  60Co  towa- 
rzyszy wtórna  emisja  dwóch  fotonów  y o energiach 
1,17  i 1,33  MeV  emitowanych  przez  wzbudzony  60Ni. 

Materiał  tarczowy,  w którym  w kanałach  reaktora 
powstały  znaczne  ilości  radioizotopów,  jest  potężnym 
źródłem  promieniowania  i bezpośrednie  zetknięcie 
się  z nim  byłoby  zabójcze  dla  każdej  istoty  żywej. 

Dlatego  wydobywanie  tego  materiału  oraz  jego  dalsza 
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przeróbka  mechaniczna  (np.  porcjowanie,  pakowanie; 
lub  chemiczna  muszą  być  prowadzone  w specjalnych 
komorach,  zwanych  gorącymi,  izolowanych  osłonami 
biologicznymi  (ciężkie  betony,  ściany  z cegieł  ołowia- 
nych, wzierniki  z grubego  szkła  ołowiowego  itp.)  za 
pomocą  manipulatorów  (il.  56,  tabl.  15).  Otrzymy- 
wane po  obróbce  próbki,  kształtki  itp.  umieszcza  się 
w specjalnych  pojemnikach  stanowiących  właściwą 


biologiczną  osłonę  radioizotopu,  która  umożliwia 
bezpieczny  transport  (ii.  54,  tabl.  14). 

Równorzędnym  źródłem  użytecznych  radioizoto- 
pów jest  sam  proces  łańcuchowego  rozszczepienia 
przebiegający  w materiale  paliwowym  reaktora. 
W jednym  akcie  rozszczepienia  powstają  dwa  jądra, 
przy  czym  dla  danych  A i Z jądra  macierzystego 
liczby  masowe  jąder  produktów  rozszczepienia  wy- 
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Rys.  1.  Rodziny  promieniotwórcze  (historyczne  nazwy  radioizotopów  podano  w kolorze  niebieskim) 


kazują  rozrzut  w granicach  od  70  do  ok.  160  z maksi- 
mami wokół  wartości  95  i 140.  Najważniejszymi* 
długożyjącymi  radioizotopami  powstającymi  w ten 
sposób  są  90Sr  (rJ/2  ok.  19,9  lat),  137Cs(/!/2  ok.  331  lat), 
*5Zr  (/x/2  ok.  65  dni),  91Y  (tlf2  ok.  61  dni),  *°Tc  (/1/2  ok. 
2, 12  lat),  140Ba(/1/2  ok.  13,4  dni),  “7Pm(f1/2ok.  2,26  lat), 
103Ru(/1/2  ok.  40  dni),  144Cs(/1/2  ok.  282  dni).  Obok 
nich  powstają  znaczne  ilości  innych,  krócej  żyjących 
radioizotopów. 

Wiele  powstałych  izotopów  silnie  pochłania  neu- 
przeróbka  trony,  co  powoduje  spowolnienie  reakcji  łańcuchowej, 
wypalonego  a z czasem  jej  zanik.  Wyjmowanie  paliwa  wypalonego 
paliwa  przeprowadza  się  jednak  dopiero  wtedy,  gdy  pochła- 
reaktoro-  nianie  neutronów  przez  wytworzone  izotopy  uniemoż- 
wego  liwia  dalszą  pracę  reaktora,  a wówczas  w paliwie  po- 
wstają już  tak  wielkie  ilości  radioizotopów,  że  wy- 
palone paliwo  jest  ogromnym  źródłem  promieniowa- 
nia. Paliwo  takie  przechowuje  się  więc  przez  pewien 
czas  w specjalnych  schronach,  a po  zniknięciu  w nim 
najkrócej  żyjących,  ale  najsilniej  promieniujących 
radioizotopów  może  być  poddane  przeróbce  chemicz- 
nej. Urządzenia  do  przeróbki  paliwa  są  jednak  znacz- 
nie większe  i kosztowniejsze  od  przedstawionych  na 
il.  15  (tabl.  56)  urządzeń  do  przeróbki  zaktywowa- 
nego  w kanałach  reaktora  materiału  tarczowego. 
Obecnie  przeróbkę  taką  prowadzą  jedynie  nieliczne 
kraje.  Głównym  jej  celem  nie  jest  uzyskanie  radio- 
izotopów, ale  odzyskanie  zawartego  w paliwie  wy- 
palonym materiału  rozszczepialnego,  w szczególności 
uzyskanie  wytworzonego  plutonu.  Radioizotopy 
wydziela  się  niejako  ubocznie  w ilościach  określo- 
nych zapotrzebowaniem  na  nie. 

Niektóre  radioizotopy  otrzymywane  z reakcji  roz- 
szczepienia, zwłaszcza  radioizotopy  krótkożyjące 
(f1/2  rzędu  kilku  dni)  można  otrzymywać  w zwykłych 
urządzeniach  do  przeróbki  materiału  tarczowego. 
Wprowadza  się  w tym  celu  materiał  rozszczepialny 
do  kanałów  reaktora  i wyjmuje  go  wcześniej  niż  pa- 
liwo wypalone.  Na  przykład  235U  wprowadzony  do 
kanału  reaktora  ulega  oczywiście  reakcji  rozszcze- 
pienia i gromadzą  się  w nim  radioizotopy  — pro- 
dukty rozszczepienia.  Uran  w kanale  reaktora  nie 
jest  jednak  prętem  paliwowym,  czas  jego  przebywania 


w reaktorze  nie  jest  uzależniony  od  technologii  pracy 
reaktora  i wyjmuje  się  go  z kanału  wtedy,  gdy  na- 
gromadzą się  w nim  odpowiednie  ilości  potrzebnych 
radioizotopów.  Aktywność  takiego  materiału  roz- 
szczepieniowego  jest  wtedy  jeszcze  znacznie  niższa 
od  aktywności  paliwa  wypalonego.  Dlatego  wydzie- 
lanie radioizotopów  można  tu  prowadzić  w konwen- 
cjonalnych komorach  gorących.  Co  więcej,  radio- 
izotopy takie,  podobnie  jak  i radioizotopy  wytwa- 
rzane innymi  sposobami,  rozpadają  się  w czasie 
prowadzenia  procesu  ich  wytwarzania,  a więc  w ten 
sposób  osiąga  się  prawie  stałe  stężenie  w czasie  kilka- 
krotnie dłuższym  od  ich  /1/2.  Stąd  optymalny  czas 
przebywania  23SU  w komorze  w celu  wytworzenia  wytwarzanie 
izotopu  "Mo  (/1/2  ok.  67  godzin)  wynosi  od  kilkunastu  99 Mo 
do  kilkadziesięciu  dni,  a nie  wiele  miesięcy  — aż  do 
wypalenia  się  paliwa.  Ten  sam  izotop  można  otrzy- 
mywać aktywując  neutronem  trwały  izotop  "Mo, 
ale  wówczas  nie  można  go  chemicznie  oddzielić  od 
materiału  tarczowego  (ten  sam  pierwiastek).  Dlatego 
stosowany  w medycznej  scyntygrafii  radioizotopowej 
"Mo  otrzymuje  się  opisaną  metodą. 


Zastosowanie  radioizotopów 

Radioizotopy  długożyjące  (*1/2  od  godzin  do  tysięcy 
lat)  wykorzystuje  się  w badaniach  naukowych  i tech- 
nice jako  atomy  znaczone.  Niektóre  radioizotopy, 
szczególnie  z /a/2  rzędu  lat,  są  wygodnymi,  o różnej 
wydajności  lub  aktywności  źródłami  promieniowania 
a,/? i y.  Wreszcie  radioizotopy  krótkożyjące  (t1/2 
często  rzędu  sekund),  ale  łatwo  powstające  z okre- 
ślonych izotopów  trwałych  pod  wpływem  zderzeń 
z neutronami  lub  fotonami,  mają  zastosowanie  w 
chemii  analitycznej  w metodzie  zwanej  analizą  akty- 
wacyjną. 

Pierwsze  z wymienionych  zastosowań  pozwala 
badać  mechanizm  i kinetykę  wielu  reakcji  chemicz- 
nych, procesów  biologicznych  i procesów  związanych  atomy 
z wędrówką  materiałów  (substancji,  atomów,  faz),  znaczone 
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substancja  Jeżeli  np.  jako  jeden  z substratów  reakcji  wprowadzi 
znaczona  się  substancję  znaczoną,  tzn.  zawierającą  w swym 
składzie  izotopowym  niewielką  domieszkę  określo- 
nego radioizotopu,  to  można  śledzić,  w jakim  pro- 
dukcie reakcji,  a nawet  w jakim  miejscu  w molekule 
wbudowuje  się  ten  radioizotop.  Domieszkę  radio- 
izotopu wprowadza  się  w takiej  ilości,  aby  nie  sta- 
nowiła ona  zagrożenia  ze  względu  na  swoje  promie- 
niowanie, a przy  tym,  żeby  można  było  przeprowa- 
dzać pomiary  metodami  radiometrycznymi. 


Zastosowanie  w medycynie 

Podobnie  w badaniach  fizjologicznych  (np.  w medy- 
cynie) dodając  związki  znaczone  do  pokarmu,  leku 
czy  wprowadzając  do  organizmu  inną  drogą  (np. 
przez  iniekcje)  możemy  śledzić  w organizmie  żywym 
ich  drogę,  badać  gromadzenie  się,  przetwarzanie 
i wydalanie.  W medycynie,  szczególnie  w diagnostyce, 
są  stosowane  dziesiątki,  a może  nawet  setki  różnych 
metod  wykorzystujących  radioizotopy  jako  atomy 
znaczone. 

Jedną  z najnowszych  metod  z tej  dziedziny  jest 
scyntygrafia  scyntygrafia  radioizotopowa,  omówiona  dokładniej 
radioizoto-  w artykule  „Fizyka  medyczna”.  Wykorzystuje  się  tu 
topowa  głównie  izomer  technetu  "™Tc  o /1/2  ok.  6 h,  który 
emitując  y przechodzi  w znacznie  trwalszy  "Tc. 
Promieniowanie  y tego  procesu  jest  łatwo  wykry- 
walne przy  natężeniach  jeszcze  zupełnie  nieszkodli- 
wych. Izomer  "mTc  otrzymujemy  z molibdenu  w reak- 
cji "Mo  ->  -f99mTc. 

Do  zakładu  leczniczego  dostarcza  się  tzw.  generator 
technetu,  czyli  rurkę  zawierającą  radioizotop  "Mo 
osadzony  na  podłożu.  Tutaj  powstały  w generatorze 
izomer  technetu  "mTc  jest  wymywany  za  pomocą 
standardowych  zestawów  odczynników  i wprowa- 
dzany do  organizmu  badanej  osoby,  gdzie  umiejsca- 
wia się  na  lub  w odpowiednich  narządach.  Promienio- 
wanie y "mTc  pozwala  badać  te  narządy,  wykrywać 
w nich  zmiany  niedostrzegalne  innymi  metodami. 
Natężenie  tego  promieniowania  jest  niewielkie,  a krót- 
ki /1/2  sprawia,  że  maleje  ono  szybko  w czasie.  Dla- 
tego metoda  jest  nieszkodliwa  dla  badanych.  Suma- 
ryczne dawki  wprowadzonego  do  organizmu  pro- 
mieniowania są  w tej  metodzie  mniejsze,  niż  w prze- 
świetleniu promieniami  rentgenowskimi.  Powstały 
z 99 ™ Tc  trwalszy  radioizotop  "Tc  zawarty  jest  w ta- 
kich ilościach,  że  jego  promieniowanie  jest  już  nie 
tylko  nieszkodliwe,  ale  praktycznie  niewykrywalne. 


Zastosowanie  w technice 

W technice  szczególnie  użyteczne  okazują  się  radio- 
izotopy do  śledzenia  przebiegu  procesów  w niedo- 
stępnej z zewnątrz  aparaturze,  w reaktorach  itp. 
Badanie  radioizotopowe  ustala  rzeczywisty  przebieg 
procesów  w aparaturze,  co  pozwala  na  wykrycie 
i usunięcie  nieprawidłowości,  maksymalną  wydajność 
i optymalizację  procesów.  W instalacjach,  w których 
reagentami  są  ciecze  lub  gazy  (np.  przemysł  rafine- 
ryjny, petrochemiczny,  koksochemiczny  itp.),  wpro- 
wadza się  rozpuszczalne  lub  lotne  związki  znaczone 
radioizotopami,  a następnie  radiometrycznie  określa 
szybkości  przepływu  i czasy  zatrzymania  się  reagen- 
tów w różnych  częściach  aparatury.  Czujniki  radio- 
metryczne umieszcza  się  na  zewnątrz  aparatury 
bezpośrednio  przy  miejscach  badanych  lub  wprowa- 
dza się  je  do  wnętrza  aparatury  lub  rurociągu, 
bezpieczeń-  Ilości  radioizotopów  i ich  rodzaj  (/1/2)  tak  są  do- 
stwo  pracy  bierane,  aby  badania  można  było  bezpiecznie  prze- 
prowadzić z wymaganą  dokładnością  i aby  końcowe 
stężenie  wprowadzonego  radioizotopu,  rozcieńczo- 
nego materiałem  nieaktywnym,  było  niższe  od  stę- 
żenia dopuszczalnego  przepisami  ochrony  radiolo- 
gicznej, albo  aby  wprowadzony  radioizotop  po  użyciu 
mógł  być  oddzielony  i zabezpieczony  w pojemniku. 

246 


Nad  spełnieniem  tych  wymogów  czuwają  w Polsce 
specjalnie  przeszkoleni  inspektorzy  ochrony  przed 
promieniowaniem,  a nadzór  nad  ich  szkoleniem 
i wszelką  działalnością  związaną  z radioizotopami 
prowadzi  Centralne  Laboratorium  Ochrony  Radio- 
logicznej (CLOR). 

Badając  procesy  dotyczące  sypkich  ciał  stałych 
radioizotop  wprowadza  się  często  w postaci  grudek 
lub  igiełek.  Przykładem  przemysłowego  wykorzysta- 
nia metody  atomów  znaczonych  może  być  badanie 
w Polsce  w Wizowie  i w NRD  w Coswig  przyczyn  zastosowanie 
zaklejania  się  pieców  cementowych.  Po  przeprowa-  wcemen- 
dzeniu  badania  okazało  się,  że  w wyniku  fluidyzacji  towni 
ruch  materiałów  w niektórych  partiach  pieców  obro- 
towych był  szybszy  od  przewidywanego  i do  strefy 
wysokotemperaturowej  dostawał  się  nierozłożony 
siarczan  wapnia.  Wmontowanie  w piece  progów 
spowalniających  ruch  materiału  pozwoliło  na  usu- 
nięcie tych  nieprawidłowości.  Przykłady  takie  można 
mnożyć.  Na  pewno  jednak  można  powiedzieć,  że 
upowszechnienie  stosowania  radioizotopowych  me- 
tod badania  procesów  technologicznych  stanowi 
jeden  z podstawowych,  ciągle  jeszcze  niedostatecznie 
wykorzystywanych  czynników  usprawniania  techno- 
logii i poprawy  zarówno  jakości  produktów,  jak  i eko- 
nomii ich  wytwarzania. 

Innymi  przykładami  zastosowania  radioizotopów  wykrywanie 
jako  atomów  znaczonych  mogą  być:  wykrywanie  wad 
nieszczelności  czynnych  rurociągów  (radioizotop  urządzeń 
przenika  przez  nieszczelności  i gromadzi  się  w ich  technicznych 
pobliżu),  badanie  rozchodzenia  się  ścieków  w zbior- 
nikach wodnych,  badanie  rozkładu  zanieczyszczeń 
w atmosferze  i wiele  innych. 


Zastosowanie  źródeł  promieniowania 

Radioizotopy  jako  źródła  promieniowania  bywają 
wykorzystywane  na  wielką  skalę  w defektoskopii, 
czyli  do  wykrywania  wad  w odlewach,  spawach 
i innych  urządzeniach.  Stosuje  się  tu  niewielkie  źródła 
przenikliwego  promieniowania  y,  które  łatwo  jest 
wprowadzić  w rozmaite  zakamarki  badanych  obiek- 
tów i wykonać  odpowiednie  prześwietlenia.  Radio- 
izotopowe źródełka  można  wprowadzać  w miejsca, 
w których  nie  zmieściłaby  się  lampa  rentgenowska 
i dlatego  defektoskopia  radioizotopowa  jest  znacznie 
wszechstronniejsza  od  rentgenowskiej,  jakkolwiek 
zasady  obu  tych  metod  są  takie  same. 

Ilustracja  53  (tabl.  14)  przedstawia  jednoczesne  defektosko* 
prześwietlanie  sześciu  zaworów  tym  samym  defekto-  pia  radio- 
skopem  zawierającym  radioizotop  60Co,  obok  wi-  izotopowa 
dzimy  jedno  z otrzymanych  w ten  sposób  zdjęć. 

Aktywność  radioizotopu  jest  tak  dobrana,  aby  prze- 
bywanie w pobliżu  źródła  w czasie  potrzebnym  na 
jego  ustawienie  lub  usunięcie  powodowało  wprowa- 
dzenie do  ciała  operatora  dawki  znacznie  mniejszej 
od  dopuszczalnej.  Natomiast  wymagane  naświetlenie 
kliszy  osiąga  się  odpowiednio  dobierając  czas  ekspo- 
zycji, w trakcie  której  operator  nie  jest  potrzebny. 


Rys.  2.  Schemat  izoto- 
powego urządzenia  do 
pomiaru  grubości  błon 


elektroda  do  układu 


Innym  zastosowaniem  radioizotopów  jako  źródeł 
promieniowania  są  rozmaite  czujniki  i wskaźniki;  na 
rys.  2 widzimy  schemat  urządzenia  do  ciągłego  po- 


miaru  grubości  błony  opartego  na  zasadzie  pochła- 
niania promieniowania  /?.  Z jednej  strony  błony 
znajduje  się  źródełko  radioizotopowe,  a z drugiej 
detektor  radiometryczny.  Sygnał  z urządzenia  może 
automatycznie  korygować  grubość  produkowanej 
błony.  Urządzenia  tego  typu  można  stosować  do  re- 
gulacji grubości,  np.  w produkcji  papieru,  blach 
w walcowniach  i in. 

poziomo-  Przykładami  urządzeń  o podobnej  zasadzie  dzia- 
irtierz  łania  są:  pływakowy  poziomomierz  izotopowy  oraz 
wskaźnik  poziomu  cieczy  w zbiorniku  zaopatrzonym 

licznik 


zamknięty  promieniotwórczym 


Rys.  3.  Schematy  poziomomierzy  izotopowych:  a)  poziomomierz 
pływakowy;  b)  poziomomierz  ze  źródłem  umieszczonym  na 
zewnątrz  zbiornika 


w zewnętrzne  źródło  promieniowania  (rys.  3).  W po- 
ziomomierzach  pływakowych  wykorzystuje  się  fakt,  że 
promieniowanie  jest  znacznie  silniej  pochłaniane  przez 
ciała  stałe  i ciecze  niż  przez  gaz,  a w działaniu  pozio- 
momierza  odgrywa  głównie  rolę  zmniejszanie  się 
natężenia  promieniowania  w miarę  oddalania  się 
detektora  od  źródła  punktowego, 
bomba  Znacznie  większe  źródła  promieniowania  są  sto- 
kobaltowa  sowane  w medycynie  do  niszczenia  tkanek  nowotwo- 
rowych. Są  to  tzw.  bomby  kobaltowe,  czyli  źródła 
zawierające  (w  odpowiedniej  osłonie)  radioizotop  60Co 
w takiej  ilości,  że  wypromieniowywana  przezeń 
energia  promieniowania  y ma  moc  ok.  jednego  lub 
kilku  watów.  Przez  zastosowanie  specjalnych  osłon 


promieniowanie  to  (drobna  jego  część)  skierowuje 
się  na  tkankę  nowotworową.  Czas  napromieniania 
dobiera  się  tak,  aby  tkanka  nowotworowa  uległa 


kobalt  60  osłona  ze  stopu 

\ / wi/ftlframnw/pnn 


Rys.  4.  Schemat  kanadyjskiej  medycznej  bomby  kobaltowej 
Theratron 


zniszczeniu,  a słabiej  napromieniowane  tkanki  są- 
siednie doznały  tylko  odwracalnych  zmian  (np. 
możliwe  do  zagojenia  rany)  (rys.  4 oraz  il.  52,  tabl.  14). 

Jeszcze  silniejsze  źródła  promieniowania  y stosuje  sterylizacja 
się  w niektórych  procesach  technologicznych  — 
np.  w produkcji  sprzętu  medycznego  jednorazowego 
zastosowania  oraz  sterylnych  opatrunków.  Stosowa- 
ne tu  radioizotopy  to  głównie  kobalt  60Co,  a także  na 
mniejszą  skalę  cez  137Cs.  Moc  promieniowania  y 
emitowanego  przez  te  źródła  nieraz  przekracza 
10  kW. 


Analiza  aktywacyjna 

Trzecią  ważną  dziedziną  niejako  pośredniego  wyko- 
rzystania radioizotopu  jest  analiza  aktywacyjna. 

Metoda  ta,  jak  już  wspomnieliśmy,  polega  na  napro- 
mienieniu, najczęściej  neutronami,  a czasem  fotonami 

0 energii  regulowanej  w zakresie  od  10  do  30  MeV, 
badanych  próbek  i analizie  emitowanego  po  aktywacji  aktywacja 
promieniowania.  W czasie  aktywacji  neutronowej  neutronami 
z izotopów  trwałych  powstają  w próbce  możliwe  do  j fotonami 
wykrycia  i zidentyfikowania  radioizotopy.  W akty- 
wacji fotonami  niektóre  trwałe  izotopy  z próbki 

ulegają  wzbudzeniu  i emitują  promieniowanie  y. 

Obserwujemy  wtedy  rozproszenie  promieniowania 
padającego,  występujące  rezonansowo  dla  energii 
odpowiadających  energiom  wzbudzenia  i emisji  y 
izotopów  trwałych  zawartych  w próbce.  Aktywacja 
fotonami  może  również  wywoływać  rozpady  wzbu- 
dzonych energetycznie  jąder,  co  prowadzi  do  powsta- 
wania wykrywalnych  radiometrycznie  radioizotopów. 

Ilość  każdego  powstałego  radioizotopu  jest  w danych 
warunkach  aktywacji  proporcjonalna  do  ilości  ma- 
cierzystego izotopu  trwałego,  analiza  aktywacyjna 
pozwala  zatem  na  wykrycie  i oznaczenie  ilości  ma- 
cierzystych izotopów  trwałych  w badanej  próbce. 

W wypadku  rozpraszania  rezonansowego  te  same 
informacje  uzyskuje  się  na  podstawie  analizy  promie- 
niowania pochłanianego  i rozpraszanego.  Czułość  ozułosc 
analizy  aktywacyjnej  przewyższa  znacznie  nie  tylko  analizy  akty- 
czułość  tradycyjnych  metod  chemicznych,  ale  i ana-  wacyjnej 
lizy  spektralnej.  Co  więcej,  analiza  aktywacyjna 
pozwala  na  określenie  zawartości  wielu  pierwiastków, 
których  widmo  spektralne  leży  w dalekim  nadfiolecie 

1 które  z tego  względu  nie  są  wykrywalne  zwykłymi 
metodami  spektralnymi. 

Aktywację  neutronową  nieraz  prowadzi  się  w kana- 
łach reaktora,  ale  wtedy  nie  można  wykorzystać 
wielu  przydatnych  w analizie  aktywacyjnej  radioizo- 
topów o krótkim  f1/2.  Dlatego  lepsze  są  inne  źródła 
neutronów  aktywujących  próbki.  Często  stosuje  się 
np.  źródła  radowo-berylowe,  w których  zachodzą 
reakcje:  226Ra  ->  222Rn  + 4He  i *He-rJBe  ->  QIC)  -+ 

_►  i|C-rJ n.  Natężenie  neutronów  z takiego  źródła 
jest  jednak  słabe,  co  ogranicza  czułość  metody.  Naj- 
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większe  możliwości  w nowoczesnej  analizie  aktywa- 
cyjnej stwarza  generator  neutronów  złożony  z akcele- 
ratora przyspieszającego  jądra  deuteru  D i wstrzeli- 
wującego  je  w tarczę  z tytanu  lub  cyrkonu  nasyco- 
nego trytem  T.  Jądra  deuteru  otrzymuje  się  w proce- 
sie hydrolizy  ciężkiej  wody,  które  następnie  w zmien- 
nym polu  elektrycznym  wielkiej  częstotliwości  (w  tzw. 
źródle  jonów)  ulegają  dysocjacji.  Otrzymywane  jądra 
deuteru  przyspieszane  napięciem  150-200  kV  tra- 
fiają w jądra  trytu  i zachodzi  reakcja  syntezy  jądrowej 
fD+JT  ->  JHe+Jw.  Powstałe  neutrony  mają  energię 
14  MeV. 

Aktywacja  fotonami  jest  metodą  uzupełniającą, 
ponieważ  jest  dla  pewnych  pierwiastków  lepsza, 
a dla  innych  gorsza  od  aktywacji  neutronowej.  Wzbu- 
dzona radioaktywność  próbek  badanych  analizą 
aktywacyjną  jest  na  tyle  krótkotrwała  i słaba,  że 
można  analizę  aktywacyjną  zaliczyć  do  grupy  metod 
nieniszczących. 

Ilustracją  czułości  analizy  aktywacyjnej  może  być 
zastosowanie  przykład  jej  wykorzystania  w kryminalistyce  do  okre- 
w kry  mi-  ślania,  z jakiej  odległości  (w  zakresie  od  0 do  4 m) 
nalistyce  został  oddany  strzał  do  ofiary.  Badanie  polega  na 
określeniu  ilości  i rozmieszczenia  antymonu  osadzo- 
nego na  ciele  (ubraniu)  ofiary  w pobliżu  wlotu  po- 
cisku, a wydzielonego  podczas  wybuchu  spłonki 
z zawartego  w niej  siarczku  antymonowego.  Obłok 
siarczku  antymonowego  w miarę  oddalania  się  od 
wylotu  lufy  staje  się  większy  i rzadszy.  W wypadku 
strzału  z odległości  2 m w pobliżu  wlotu  pocisku 
osadza  się  ok.  10~9g  antymonu.  Po  strzale  z bliższej 
odległości  ilość  osadzonego  antymonu  jest  większa 
i jest  on  osadzony  bliżej  wlotu.  Problem  ustalenia 
y odległości  strzału  bywa  nieraz  najważniejszy  w wy- 
padku istnienia  alternatywy  samobójstwa  lub  mor- 
derstwa. 


Datowanie  promieniotwórcze 

Oprócz  wymienionych  głównych  dziedzin  zastosowań 
radioizotopów  istnieją  inne,  nie  mieszczące  się  w po- 
wyższej klasyfikacji.  Najważniejszą  ich  grupę  sta- 
nowią metody  datowania  promieniotwórczego,  wy- 
korzystujące stałość  okresu  /1/2.  Najbardziej  znaną 
metodą  tego  rodzaju  jest  określanie  zawartości  radio- 
izotopu 14C  w szczątkach  organicznych.  Radioizotop 
ten  pod  wpływem  promieniowania  kosmicznego 
nieustannie  powstaje  w atmosferze  z zawartego  w niej 
azotu  14N  i nieustannie  rozpada  się  z /1/2  = 5740  lat. 
Oba  procesy  prowadzą  do  wytworzenia  się  w atmo- 
sferycznym dwutlenku  węgla  C02  izotopu  14C  o sta- 
łym, ale  bardzo  małym  natężeniu.  W procesie  foto- 
syntezy C02  izotop  przyswajają  organizmy  żywe. 


a w skorupach  korali,  mięczaków  i in.  związany 
jest  z wapniem  Ca  w CaCOs.  Po  ustaniu  procesów 
życiowych  ustaje  też  przyswajanie  14C  z atmosferycz- 
nego C02  i w szczątkach  organicznych  oraz  w wytwo- 
rzonym wapieniu  zawartość  14C  spada  w czasie.  Mie- 
rząc stężenie  14C  można  więc  określić,  jak  dawno  zo- 
stały wytworzone  badane  szczątki  organiczne  lub 
wapienie.  Czułość  metody  pozwala  na  datowanie 
próbek  nie  starszych  niż  70  000  lat.  Do  oznaczania 
wieku  starszych  próbek  geologicznych  (rzędu  milio- 
nów lat)  można  wykorzystać  słabo  promieniotwórczy, 
naturalny  radioizotop  potasu  40K  o /,/2  = ok.  1,3  1 09 
lat.  Radioizotop  ten  emituje  pozyton  i przekształca 
się  w trwały  izotop  argonu  40 Ar,  wykrywalny  w bar- 
dzo małych  stężeniach  metodami  analizy  aktywa- 
cyjnej. Wytworzony  argon  pozostaje  uwięziony  w 
skale  zawierającej  radioaktywny  potas.  Czas  upły- 
wający od  wytworzenia  się  skały  można  obliczyć 
oznaczając  w niej  stosunek  stężeń  40Ar  do  40K. 

Wskaźniki  radioizotopowe  można  wykorzystać 
również  do  niezawodnego  określenia  daty  produkcji  kontrola 
wyrobów  przemysłowych,  których  czas  używalności  terminu 
jest  ściśle  ograniczony.  W tym  celu  wystarczy  dodać  ważności 
do  wyrobu  dwa  radioizotopy  o różnych  t 1/2  w okre-  produktów 
ślonym  stosunku  stężeń,  a po  pewnym  czasie  z po- 
miarów radiometrycznych  określić  stosunek  ich  stę- 
żeń. Inaczej  mówiąc  — wprowadzamy  do  wyrobu 
wewnętrzny  zegar  izotopowy.  Dodane  ilości  radio- 
izotopów muszą  być  oczywiście  bezpiecznie  małe. 

Zegar  izotopowy  jest  niezależny  od  dalszych  procesów 
technologicznych,  jak  np.  porcjowanie,  pakowanie. 

Podane  przykłady  nie  wyczerpują  wszystkich  moż- 
liwych zastosowań  radioizotopów  w różnych  dzie- 
dzinach nauki,  techniki.  Wystarczy  powiedzieć,  że 
katalogi  producentów  związków  znaczonych  za- 
wierają tysiące  pozycji  i wszystkie  one  znajdują  od- 
biorców. 

W Polsce  radioizotopy  i związki  znaczone  produku- 
je Ośrodek  Produkcji  i Dystrybucji  Izotopów  (OPiDI) 
w Świerku  koło  Otwocka.  Ośrodek  OPiDI  zajmuje  się 
nie  tylko  dystrybucją  zwiąków  znaczonych  i radio- 
izotopów wyprodukowanych  w kraju,  ale  i importo- 
wanych z zagranicy.  Ze  względów  ekonomicznych 
i technicznych  w Polsce  nie  prowadzi  się  przeróbki 
paliwa  wypalonego,  a radioizotopy  produkuje  się 
w kanałach  reaktorów  Instytutu  Badań  Jądrowych 
(IBJ)  w Świerku.  Z tych  radioizotopów  w OPiDI 
tworzy  się  (dozowanie,  pakowanie)  źródła  wzorcowe, 
źródła  dla  defektoskopii  i innych  celów  oraz  wyrabia 
i pakuje  związki  znaczone.  W OPiDI  wyrabia  się 
również  wspomniane  uprzednio  generatory  technetu 
dla  medycyny. 

R.  Szepke  Radiometria  stosowana,  Warszawa  1967;  W.  Szy 
mański  Wstęp  do  fizykochemii  jądrowej,  Toruń  1974;  O.  Wol- 
CZEK  Izotopy, Warszawa  1965. 
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CHEMIA  KWANTOWA 

Józef  Stanisław  Kwiatkowski 


W trakcie  wyko- 
nywania badań 
zarówno  doświad- 
czalnych, jak  i te- 
oretycznych otrzy- 
muje się  czasami 
nieoczekwane  wy- 
niki. Obok  podany 
rysunek  przedsta- 
wia obliczone  przez 
fizyków  jądrowych 
warstwice  gęsto- 
ści dla  jądra  32S. 
Czyżby  odkryto 
„ szczęśliwe ” jądro 
atomowe? 

Kiedy  przed  pięćdziesięciu  laty  powstała  mechanika 
kwantowa,  i kiedy  z powodzeniem  zaczęto  stosować 
jej  prawa  do  wyjaśniania  elementarnych  zjawisk 
zachodzących  w mikroświecie  atomów  i cząsteczek, 
zaczęto  rozumieć,  że  w teorii  kwantów  sformułowane 
zostały  podstawowe  prawa  obejmujące  znaczną  część 
fizyki,  całą  chemię,  a nawet  niektóre  zjawiska  biolo- 
giczne. Przedmiotem  chemii  kwantowej  jest  zastoso- 
wanie mechaniki  kwantowej  do  opisu  budowy  ato- 
mów i cząsteczek,  oddziaływań  między  nimi  i ele- 
mentarnych procesów  chemicznych.  W realizacji  tego 
napotykamy  jednak  poważne  trudności,  gdyż  prawa 
mechaniki  kwantowej  wymagają  stosowania  równań, 
których  nie  można  rozwiązać  ściśle.  Ta  trudność 
matematyczna  przez  długi  czas  hamowała  rozwój 
chemii  kwantowej.  Wprowadzano  wiele  drastycznych 
przybliżeń  do  teorii  kwantowej,  ograniczając  się  do 
jakościowego  wyjaśniania  własności  cząsteczek. 

Pojawienie  się  i rozwój  elektronicznych  maszyn 
cyfrowych  (komputerów)  nastąpił  niezwykle  szybki 
rozwój  chemii  kwantowej.  Obecnie  możemy  obliczać 
i przewidywać  wiele  własności  cząsteczek  bez  zna- 
jomości wartości  doświadczalnych  dla  tych  układów. 
Dzięki  rozwojowi  techniki  obliczeniowej  możemy 
uzyskiwać  dla  małych  cząsteczek  teoretyczne  wartości 
fizyczne  o dokładności  porównywalnej  z dokładnością 
najprecyzyjniejszych  pomiarów  lub  przekraczającej 
dokładności  tych  pomiarów.  Również  dla  większych 
cząsteczek  w wielu  wypadkach  teoria  może  z powo- 
dzeniem współzawodniczyć  z doświadczeniem  w prze- 
chemia  widywaniu  ich  własności, 
kwantowa  Metody  obliczeniowe  chemii  kwantowej  stanowią 
jako  jakby  „teoretyczną  technikę  pomiarową”  lub  „przy- 
narzędzie  rządy  teoretyczne”,  których  zdolność  rozdzielcza 


(dokładność)  zwiększa  się  z dnia  na  dzień.  W chwili 
obecnej  zdolność  rozdzielcza  „przyrządów  teoretycz- 
nych” dla  małych  układów  jest  bardzo  duża,  nato- 
miast dla  układów  dużych  zdolność  rozdzielcza  jest 
jeszcze  mała,  chociaż  i w tym  wypadku  metody  obli- 
czeniowe chemii  kwantowej  mają  czasami  przewagę 
nad  pomiarami  doświadczalnymi.  Możemy  bowiem 
obliczyć  takie  wartości,  które  dla  cząstek  są  bardzo 
trudne  do  zmierzenia  lub  w ogóle  nie  są  mierzalne 
(np.  próbka  nie  jest  rozpuszczalna  lub  związek  che- 
miczny występuje  w tak  rzadkiej  formie  tautome- 
rycznej,  że  nie  można  dokonać  pomiaru). 

Coraz  częściej  więc  chemicy  zastanawiają  się,  czy 
jakąś  konkretną  wielkość  fizyczną  cząsteczki  mierzyć, 
czy  też  lepiej  ją  obliczyć,  rezygnując  czasami  z bardzo 
pracochłonnych  i uciążliwych  pomiarów  na  rzecz 
wartości  teoretycznej,  która  jest  wprawdzie  mniej 
dokładna  (powiedzmy,  że  dokładność  jest  rzędu 
10-15%),  ale  którą  otrzymuje  się  stosunkowo  szybko. 
Coraz  częściej  w pracach  chemicznych  konfrontuje 
się  wartości  mierzone  z wartościami  obliczonymi  lub 
używa  się  poglądowych  metod  chemii  kwantowej  do 
wyjaśnienia  faktów  doświadczalnych.  Chemia  kwan- 
towa zajmuje  się  bowiem  nie  tylko  obliczeniami  z za- 
stosowaniem komputerów,  ale  głównie  teoretycznym 
wyjaśnianiem  podstawowych  zjawisk  przyrody  (w  jaki 
sposób  atomy  łączą  się  tworząc  cząsteczki,  dla- 
czego określona  cząsteczka  ma  takie  a nie  inne 
własności  itp.),  formułowaniem  ogólnych  praw 
dotyczących  układów  chemicznych  oraz  wyjaśnia- 
niem własności  konkretnych  układów.  Chemia 
kwantowa  przekłada  również  abstrakcyjny  język 
mechaniki  kwantowej  na  język  poglądowy,  tworząc 
np.  poglądowy  model  cząsteczki  i jej  oddziaływania 
z otoczeniem.  Oczywiście  model  ten  musi  być  zgodny 
z prawami  mechaniki  kwantowej.  Od  mechaniki 
kwantowej,  jak  od  każdej  innej  teorii  fizycznej, 
oczekujemy  wyjaśniania  znanych  faktów  doświadczal- 
nych i przewidywania  nowych. 

Konfrontacja  naszych  wyobrażeń  o świecie  atomów 
i cząsteczek  z faktami  doświadczalnymi  potwierdza  jak 
dotąd  słuszność  naszych  poglądów  na  budowę  ukła- 
dów chemicznych.  Należy  zdawać  sobie  jednak  spra- 
wę, że  zgodność  wyników  teoretycznych  z doświad- 
czeniem nie  jest  nigdy  bezwzględnym  potwierdzeniem 
teorii,  gdyż  każda  teoria  (a  więc  i mechanika  kwanto- 
wa) ma  ograniczony  zakres  stosowalności.  Wcześniej 
czy  później  zostaną  wykonane  doświadczenia,  których 
wyniki  będą  sprzeczne  z teorią  uznawaną  obecnie  za 
słuszną.  I chociaż  zostanie  stworzona  nowa  teoria,  to 


dokładność 

obliczeń 

kwantowych 


chemia 
kwantowa 
jako  teoria 
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stara  teoria  będzie  nadal  stosowana,  tylko  granice  jej 
stosowalności  zostaną  zawężone  i dokładniej  sprecyzo- 
wane. Omawiana  tutaj  chemia  kwantowa  jest  nierela- 
tywistyczną  mechaniką  kwantową  atomów  i cząste- 
czek. Jest  to  więc  metoda  przybliżona,  nie  uwzględnia- 
jąca wielu  subtelnych  efektów  związanych  z zależ- 
nością masy  od  prędkości.  Wszystkie  dotychczasowe 
wyniki  świadczą  jednak  o tym,  że  nierelatywistyczna 
chemia  kwantowa,  z wyjątkiem  bardzo  nielicznych 
wypadków,  zadowalająco  opisuje  układy  chemiczne 
i zachodzące  w nich  procesy. 


Fizyczne  określenie  układu 
chemicznego 


Chemicznie  interesującym  układem  może  być  atom, 
jon,  cząsteczka,  kompleks  molekularny,  cały  kryształ 
lub  zespół  atomów,  jonów,  cząsteczek  itd.  poruszają- 
cych się  względem  siebie  lub  biorących  udział  w rea- 
kcji chemicznej.  Każdy  z tych  układów  składa  się 
z zespołu  jąder  atomowych  i elektronów,  które  od- 
działują ze  sobą  za  pomocą  sił  elektrostatycznych; 
ruchy  tych  zespołów  opisane  są  prawami  mechaniki 
kwantowej. 

funkcja  Dwoma  podstawowymi  pojęciami  mechaniki  kwan- 
falowa  towej  są  funkcja  falowa  i operator.  Funkcja  falowa 
a stan  opisuje  stan  układu,  tj.  stan  zespołu  jąder  atomowych 
układu  i elektronów  układu.  Innymi  słowy,  funkcja  falowa 
uKładu  dia  określonego  stanu  określa  wszystkie  wła- 
sności cząstek  • danym  stanie.  Funkcja  falowa 


Funkcja  falowa,  gęstość  prawdopodobieństwa,  prawdopo- 
dobieństwo 


Wielkość 


Zapis 


Funkcja  falowa  stanu  stacjo- 
narnego n cząstek 

Gęstość  prawdopodobień- 
stwa w stanie  opisanym  ~ 
funkcją  V 

Prawdopodobieństwo  znale- 
zienia cząstki  1.  w elemen- 
cie objętości  dvi  = dx±  dyldzl 
przy  zupełnie  dowolnych 
położeniach  pozostałych 
cząstek 

Prawdopodobieństwo  znale- 
zienia cząstki  1 . w dvu cząstki 
2.  w dvt, ... , cząstki  /i-tej  w 
dVn 

Prawdopodobieństwo  znale- 
zienia układu  n cząstek  w 
całej  przestrzeni 


*yu  tu  xt,yt,z»,  ... . xn,yn,  z„ ) 
lub  !P(1,2 
Pd, 2 «)  = 

- ni,2t...,/i)!P*(l,2,...,n) 


p (1 , 2, ... , ń)  di\ 


p (1 , 2, . . . , ri)  dv1dot . . .dvn 
j p ( 1 , 2, ... , ń)  dvxdv% ...  dvn  — 1 


Zamiast  współrzędnych  xu  ylf  zL  cząstki  1.  użyto  symbolu  1.  Po- 
dobnie oznaczono  współrzędne  cząstki  2., ...,  n-tej 


układu  n cząstek  zależy  od  współrzędnych  wszystkich 
cząstek  (tj.  od  3 n współrzędnych  położeń  cząstek  i ich 
n współrzędnych  spinowych,  chociaż  te  ostatnie 
współrzędne  w rozważaniach  pominiemy)  oraz,  w wy- 
padku stanów  niestacjonarnych,  dodatkowo  od  czasu 
(zob.  tabela  powyżej). 

W dalszych  rozważaniach  będziemy  ograniczali 
uwagę  tylko  do  układów  stacjonarnych,  których  ener- 
gęstość  gia  nie  zależy  od  czasu.  Kwadrat  funkcji  falowej, 
prawdopo-  a ściślej  iloczyn  funkcji  falowej  pomnożony  przez  jej 
dobieństwa  wielkość  sprzężoną  (funkcja  falowa  może  być 

funkcją  zespoloną)  nazywamy  gęstością  prawdopo- 
dobieństwa q.  Funkcja  falowa  musi  być  unormowana, 
tzn.  scałkowanie  gęstości  prawdopodobieństwa  po 
całej  przestrzeni  daje  1,  co  fizycznie  oznacza,  że 
prawdopodobieństwo  znalezienia  w całej  przestrzeni 
układu  cząstek  znajdującego  się  w stanie  opisanym 
funkcją  !P(1,  2, ...,  n)  jest  równe  pewności. 

Drugim  podstawowym  pojęciem  stosowanym  w me- 
chanice kwantowej  jest  pojęcie  operatora,  szczególnie 
operatora  Hamiltona.  Operator  ten,  zwany  też  hamil- 
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tonianem,  jest  operatorem  całkowitej  energii  układu 
cząstek  i można  go  przedstawić  w postaci 

H = f+V, 

gdzie  f oznacza  operator  energii  kinetycznej,  a Fjest 
operatorem  energii  potencjalnej.  Dla  każdej  cząstki 
o masie  mi  operator  energii  kinetycznej  jest  operato- 
rem różniczkowym  mającym  postać  sumy  drugich 
pochodnych  cząstkowych 


fi=  - 


& te 2 

2mt\x\  + Ą 


gdzie  h jest  stałą  Plancka  h podzieloną  przez  2n.  Opera- 
tor energii  kinetycznej  całego  układu  n cząstek  jest 
po  prostu  sumą  operatorów  energii  kinetycznej  po- 

71 

szczególnych  cząstek,  tj.  f = Ti . Natomiast  ope- 

<— 1 

rator  energii  potencjalnej  jest  sumą  energii  elektrosta- 
tycznego oddziaływania  wszystkich  cząstek  ze  sobą 


V 


1 ^ ZiZje* 

2 Zj  Zj  “7JT’ 

t-1  i-l 


gdzie  zie  i z}e  są  ładunkami  cząstek  odpowiednio 
/-tej  oraz  /-tej,  a m jest  odległością  pomiędzy  tymi 
cząstkami. 

Operator  Hamiltona,  jako  sumę  operatora  T oraz 
K,  możemy  bardzo  łatwo  podać  dla  dowolnego  układu 
chemicznego.  Innymi  słowy,  dla  dowolnego  zespołu 
jąder  atomowych  i elektronów  możemy  hamiltonian 
traktować  jako  znany.  Posługując  się  tak  określonym 
operatorem  Hamiltona  można  sformułować  podsta- 
wowe równanie  mechaniki  kwantowej  (równanie 
Schrodingera)  opisujące  stany  stacjonarne  układu 
chemicznego: 


równanie  falowe*. 


operator 

Hamiltona 


funkcja  własna 
(funkcja  stanu) 


wartość  własna 
(energia  stanu) 


Równanie  (1)  jest  równaniem  różniczkowym  (na- 
zywanym w mechanice  kwantowej  zagadnieniem  na 
wartości  własne),  które  należy  rozwiązać,  aby  znaleźć 
funkcję  falową  układu  oraz  odpowiadającą  tej  funkcji 
wartość  energii.  Okazuje  się,  że  z rozwiązania  równa- 
nia (1)  otrzymujemy  wiele  (cały  układ)  funkcji 
opisujących  poszczególne  stany  układu  oraz  odpowied- 
nie energie  tych  stanów  Et: 


rozwiązanie  równania  falowego: 
stan  podstawowy 

n 


stany  wzbudzone 


&Z  • fi  4 > • • • 

j-.‘,  ' ' i r. 


ogólnie  ip } 
ogólnie  Ef 


energia  stanu 
podstawowego 


\ 

energie  stanów 
wzbudzonych 


Ważną  właściwością  układu  chemicznego,  związaną 
z postacią  energii  potencjalnej  w hamiltonianie,  jest 
to,  że  układ  w stanie  stacjonarnym  może  przyjmować 
tylko  określone  dyskretne  wartości  energii.  Najniższa 
wartość  własna  jest  zawsze  skończona  (tutaj  £,1), 
a odpowiedni  stan  jest  nazywany  stanem  podstawo- 
wym (opisuje  go  funkcja  lE1)t  podczas  gdy  pozostałe 
dyskretne  wartości  energii  ( E2 , Ez  itd.)  odnoszą  się  do 
stanów  wzbudzonych  (opisanych  odpowiednio  funk- 
cjami *P2,  !PS  itd.).  Przy  wyższych  energiach  występuje 
na  ogół  kontinuum,  które  odpowiada  ciągłemu  roz- 
kładowi energii  (rys.  1).  Fizycznie  oznacza  to  stany 
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energia  zjonizowane  lub  zdysocjowane.  Energia  zerowa  ukła- 
zerowa  du  jest  z definicji  energią  stanu,  w którym  wszystkie 
układu  jądra  atomowe  i elektrony  są  oddalone  na  nieskoń- 
czoną odległość  jedne  od  drugich.  Poziomy  energe- 
tyczne stanów  związanych  mają  więc  energie  ujemne. 
Wartość  liczbowa  całkowitej  energii  układu  w stanie 
podstawowym  jest  równa  energii  niezbędnej  do  całko- 
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widmo  ciągłe  £>0 
poziom  zerowy  £=  0 

widmo  dyskretne  stanów 
związanych  £ < 0 


Rys.  1.  Schematyczne  przedstawienie  rozwiązania  równania 
(1).  Energie  Ei  dyskretnych  stanów  opisanych  funkcjami  Vt  są 
uporządkowane  ze  względu  na  wzrastającą  ich  wartość  (stany 
związane  mają  ujemne  wartości  energii).  Poziom  o energii 
E = 0 odpowiada  jonizacji,  powyżej  tego  poziomu  widmo 
energii  jest  ciągłe;  wybór  poziomu  zerowego  jest  wyłącznie 
sprawą  umowy 
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witego  zjonizowania  i zdysocjowania  układu.  Dla 
dużych  układów  ich  energia  może  być  rzędu  tysięcy 
elektronowoltów.  Z drugiej  strony,  mierzone  w czą- 
steczkach organicznych  energie  przejść  ze  stanu  pod- 
stawowego do  stanu  wzbudzonego  są  rzędu  kilku 
elektronowoltów.  Aby  teoretycznie  otrzymać  energię 
przejścia,  należy  obliczyć  energię  odpowiedniego 
stanu  wzbudzonego  i odjąć  od  niej,  również  obliczo- 
ną, energię  stanu  podstawowego  układu.  Musimy 
więc  najpierw  obliczyć  dwie  bardzo  duże  liczby  i przez 
odjęcie  ich  od  siebie  otrzymać  małą  liczbę  odpowiada- 
jącą mierzonej  energii  przejścia.  Przykład  ten  ukazuje, 
jak  dokładne  muszą  być  obliczenia  mechaniki  kwan- 
towej, aby  poprawnie  interpretować  wielkości  fizyko- 
chemiczne układów.  Nic  dziwnego,  że  kilkanaście 
lat  temu  jeden  z twórców  chemii  kwantowej, 
C.A.  Coulson,  przyrównał  obliczenia  chemii  kwanto- 
wej do  znajdowania  masy  kapitana  statku  przez  zwa- 
żenie statku  wraz  z kapitanem,  a potem  — statku  bez 
kapitana. 


Rys.  2.  Atom  jednoelektronowy  można  poglądowo  przedstawić 
w postaci  układu  składającego  się  z jądra  o ładunku  +Ze  i ma- 
sie M oraz  elektronu  o ładunku  — e i masie  m.  Położenie  elek- 
tronu względem  jądra  określa  się  wówczas  jednoznacznie  po- 
dając jego  współrzędne  kartezjańskie  x,  y,  z lub  współrzędne 
biegunowe  r,  0,  <p 
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Równanie  Schrodingera  można  rozwiązać  w sposób 
ścisły  (tzn.  w postaci  analitycznej,  za  pomocą  znanych 
funkcji)  wyłącznie  dla  atomów  jednoelektronowych. 
W wypadku  każdego  innego  układu  chemicznego  rów- 
nanie (1 ) można  rozwiązać  jedynie  w sposób  przybliżo- 
ny (może  to  jednak  być  rozwiązanie  bardzo  dokładne, 
przekraczające  dokładnością  pomiary  doświadczal- 
ne!!!). 

Funkcje  falowe  opisujące  stany  związane  elektro- 
nu (o  energiach  E<0)  w atomie  jednoelektronowym 
mają  we  współrzędnych  biegunowych  (rys.  2)  postać 
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w której  funkcje  radialne,  zależne  wyłącznie  od  odle- 
głości elektronu  od  jądra,  wyrażone  są  za  pomocą 
dobrze  znanych  w matematyce  wielomianów  La- 
guerre’a,  natomiast  funkcje  kątowe  wyrażone  są  za 
pomocą  stowarzyszonych  wielomianów  Legendre’a. 
Funkcje  falowe  (3)  oznaczone  są  trzema  liczbami 
kwantowymi  /*,  /,  m , z których  pierwsza  może  przyj- 
mować dowolne,  ale  wyłącznie  dodatnie  wartości  cał- 
kowite (nie  może  jednak  być  równa  0),  natomiast 
liczby  / i m mogą  przyjmować  ograniczone  wartości. 
Fakt,  że  wspomniane  liczby  mogą  przyjmować  ściśle 
określone  wartości,  wynika  z warunków  matematycz- 
nych na  istnienie  rozwiązania  równania  (1)  dla  elektro- 
nu w atomie  jednoelektronowym.  Funkcje  falowe 
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Rys.  3.  Energie  elektronu  w atomie  wodoru  w stanie  podstawo- 
wym i w stanach  wzbudzonych.  Dla  przejrzystości  opuszczono 
wartości  energii  elektronu  w stanach  on  = 5,  6,  7,  8,  9.  Wynoszą 
one  odpowiednio  — 0,54,  — 0,38,  —0,28,  —0,21,  — 0,17  eV. 
Wzór  (4)  jest  tylko  częścią  rozwiązania  równania  (I)  dla  atomu 
wodoru,  opisującą  najbardziej  interesujące  chemika  i fizyka  stany 
związane  elektronu.  Obszar  widma  ciągłego  (E  > 0)  także  wynika 
z rozwiązania  równania  (1) 


/ 
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opisujące  stan  elektronu  w tym  atomie  „ponumero- 
wane” są  więc  trzema  wskaźnikami ; nie  jest  to  sprzecz- 
ne z tym,  co  powiedziano  już  wcześniej,  że  funkcje 
własne  i energie  własne  otrzymane  z rozwiązania  rów- 
nania (1)  można  ponumerować  za  pomocą  kolejnych 
liczb  całkowitych.  Poszczególne  trójki  liczb  n,  l i m 
można  przecież  przyporządkować  jednoznacznie  ko- 
lejnym liczbom  całkowitym. 

Rozwiązując  zagadnienie  na  wartości  własne  dla 
atomu  jednoelektronowego,  otrzymujemy  oprócz 
funkcji  własnych  Wnim  wartości  własne  odpowiadają- 
ce danym  funkcjom: 
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f*Z2e* 
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(4) 


gdzie  masa  zredukowana  / 1 = mMJ(m+M).  Jak  wynika 
ze  wzoru,  energia  elektronu  zależy  wyłącznie  od  licz- 
by kwantowej  n (rys.  3).  Tak  więc  różne  funkcje  własne 
¥ mm  różniące  się  liczbami  / i m,  ale  mające  takie  samo 
n,  mają  identyczną  wartość  własną  (liczba  stanów 
o takiej  samej  energii  En  wynosi  nz).  Inaczej  można 
powiedzieć,  że  różne  stany  elektronu  w atomie  jedno- 
elektronowym  mogą  mieć  takie  same  energie.  Takie 
wypadki  nazywamy  degeneracją  stanów  (w  przypadku 
degeneracja  atomów  jednoelektronowych  mówimy  o degeneracji 
stanów  typu  / oraz  m). 

Nie  będziemy  podawać  ogólnej  postaci  analitycz- 
nej rozwiązania  (3)  dla  elektronu  w atomie.  Podamy 
jedynie  kilka  funkcji  Wnimt  a właściwie  pewne  ich 
kombinacje.  Okazuje  się,  że  funkcje  Yim  występujące 
w funkcji  'Fnim  dla  1 są  funkcjami  zespolonymi 
(a  więc  i funkcje  W nim  są  wówczas  zespolone).  Dla 
celów  praktycznych  w wielu  wypadkach  wygodniej 
jest  posługiwać  się  funkcjami  rzeczywistymi  (można  je 


wówczas  łatwo  przedstawić  graficznie).  Dlatego  parę 
funkcji  *Enim  i 5P nim ’ różniących  się  znakiem  liczby 
m (tzn.  m — —ni)  zastępujemy  parą  funkcji 


Funkcje  falowe  elektronu  atomu  jednoelektronowego  oraz 
powierzchnie  graniczne 
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a0  «=  h2[me2  = 0,0529  nm  (promień  orbity  Bohra), 
r = (jc*+^*  + 2a)1/a  (odległość  elektronu  od  jądra), 

Z— liczba  porządkowa  atomu  (dla  atomu  wodoru  Z = 1) 


Funkcje  falowe  atomu  wodoru  oznacza  się  tradycyjnie  w spe- 
cjalny sposób.  Każda  funkcja,  dla  której  / = 0 jest  oznaczona 
symbolem  s,  funkcja,  dla  której  / = 1 oznaczona  jest  symbolem 
p,  dla  / = 2 używa  się  symbolu  d itp.  Przed  każdym  z tych 
symboli  umieszcza  się  wartość  głównej  liczby  kwantowej.  U do- 
łu symboli  p,  d itd.  zaznacza  się  własności  kątowe  funkcji. 
Dla  funkcji  typu  ns,  które  nie  zależą  od  kątów,  nie  umieszcza 
się  żadnego  indeksu.  Funkcje  falowe  atomu  wodoru  można 
zapisywać  w różny  sposób,  np.  lub  po  prostu  1$. 


Zależność  funkcji  falowej  elektronu  w atomie  wodoru  w stanie  podstawowym  i jej  kwadratu  od  odległości  od  jądra 
oraz  rozkład  przestrzenny  chmury  elektronowej 
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gęstość  radialna  c) 
P(r)=4j:r3p1s 
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mniejszej  od  r chmury  elektronowej*1 
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warstwice  funkcji  W^s 
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znalezienia  elektronu 
w płaszczyźnie  przecho- 
dzącej przez  jądro  d) 
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*)  Wartości  *F1S  podane  są  w jednostkach  b)  Wartości  pls  podane  są  w jednostkach  1 Ina*.  c)  Wielkość  zakreskowanego  pola 

przedstawia  prawdopodobieństwo  znalezienia  elektronu  w odległości  międ^  i rj-fć/r!  od  jądra.  d)Prawdopodobieństwo  jest  proporcjo- 
nalne do  gęstości  linii.  Najbardziej  prawdopodobnym  miejscem  znalezienia  elektronu  w przestrzeni  jest  powierzchnia  kuli  o promieniu 
a0  (ściślej : w warstwie  kulistej  zawartej  między  kulami  o promieniach  a0—s  oraz  a^+e,  gdzie  e jest  bardzo  małe).  •)  Powierzchnia  kuli. 
wewnątrz  której  znajduje  się  praktycznie  cały  ładunek.  Atom  wodoru  w stanie  podstawowym  ma  tylko  10%  ładunku  na  zewnątrz  kuli 
o promieniu  2 ,6a0  = 0,14  nm. 
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Postępowanie  takie  jest  uzasadnione  matematycznie 
i podyktowane  jest  wyłącznie  celami  praktycznymi. 
W tabeli  na  stronie  252  przedstawiliśmy  tylko  kilka 
funkcji  falowych.  Czytelnik  powinien  pamiętać,  że 
jest  ich  jednak  nieskończenie  wiele  i oczywiście  dla 
n > 3 postać  funkcji  jest  bardziej  skomplikowana 
aniżeli  postać  funkcji  dla  n — 1 i n — 2.  Należy  pod- 
kreślić jeszcze  raz,  że  wspomniane  funkcje  (3)  i energie 
(4)  odpowiadające  tym  funkcjom  są  rozwiązaniami 
ścisłymi  (1). 


Atom  wodoru 


turów  w obu  wypadkach  są  takie  same.  Istotna  róż- 
nica polega  na  tym,  że  funkcja  falowa  może  w pew- 
nych obszarach  być  dodatnia  (dla  stanu  podstawowe- 
go atomu  wodoru  funkcja  ?Pi*  przyjmuje  zawsze  war- 


Elektron  w stanie  podstawowym  atomu  wodoru  opi- 
sany jest  funkcją  falową  'Pu  = (7r^)~1/2e“r/a°,  nato- 
miast gęstość  prawdopodobieństwa  dla  tego  stanu 
wynosi  g18  = | ^l2  = (jwJ)-^-2''/**.  Z postaci  tych 
funkcji  widać,  że  zarówno  Pu  jak  i gls  zależą  funkcyj- 
nie jedynie  od  odległości  elektronu  od  jądra  atomu 
wodoru.  Obie  funkcje  mają  kulistą  symetrię  względem 
początku  układu. 

Istnieje  kilka  sposobów  przedstawiania  właściwoś- 
ci przestrzennych  tych  funkcji.  Zarówno  funkcja 
jak  i jej  kwadrat  mają  największą  wartość  w po- 
czątku układu  (r  = 0),  w miarę  oddalania  się  od 
tego  punktu  maleją  wykładniczo.  Elektron  wyobraża- 
my sobie  jako  rozmyty  ładunek  rozłożony  w prze- 
strzeni z gęstością  prawdopodobieństwa  eo  (scałko- 
wanie  po  całej  przestrzeni  gęstości  eg  daje  —e,  tj.  ła- 
dunek elektronu;  ładunek  elektronu  będziemy  ozna- 
czali dalej  przez  e,  ale  pamiętajmy,  że  ładunek  elektro- 
nu jest  ujemny).  Elektron  jest  więc  „chmurą  elektro- 
nową” o gęstości  eg.  Chmura  ta  w stanie  podstawo- 
wym atomu  wodoru  jest  sferycznie  symetryczna, 
chmura  Dokonując  przekroju  tej  chmury  dowolną  płaszczyzą 
elektronowa  i łącząc  punkty  o jednakowej  gęstości  ładunku  otrzy- 
mamy warstwice  ładunku.  W podobny  sposób  można 
przedstawić  wartstwice  funkcji  falowej  Pls.  Intere- 
sujące jest  prawdopodobieństwo  znalezienia  elektro- 
nu na  pewnej  odległości  r od  środka  układu  (ściślej 
w warstwie  kulistej  między  kulami  o promieniach 
r i r+dr).  W tym  celu  należy  obliczyć  gęstość  radialną 
P(r) — w przypadku  stanu  podstawowego  atomu 
wodoru  P(r)  = o15(r)47c/-2.  Funkcja  ta  ma  dla  r = 0 
wartość  0,  a na  odległości  a0  ma  maksimum.  Mnożąc 
gęstość  radialną  P(r)  przez  grubość  warstwy  kulistej 
dr  otrzymujemy  wspomniane  prawdopodobieństwo 
znalezienia  elektronu  (ogólnie  cząstki)  w warstwie 
kulistej.  Jeżeli  wielkość  P(r)dr  scałkujemy  po  r od 
wartości  0 do  jakiejś  wartości  r',  to  otrzymamy  praw- 
dopodobieństwo znalezienia  elektronu  wewnątrz  kuli 
r' 

o promieniu  r' : i7(r0  = $P(r)dr.  Ponieważ  r ' możemy 
0 ... 
wybierać  w sposób  dowolny,  TI  jest  funkcją  promienia. 

W przestrzeni  funkcję  77(r)  dla  danego  r można  przed- 
stawić jako  powierzchnię  kuli  o promieniu  r.  W miarę 
oddalania  się  od  jądra  prawdopodobieństwo  znale- 
zienia elektronu  w kuli  o promieniu  r jest  coraz  więk- 
sze. Dobierając  promień  tak,  aby  wewnątrz  kuli 
powierzchnia  znajdował  się  prawie  cały  ładunek  (czyli  ell(r)  « e\ 
graniczna  otrzymujemy  kulę  o powierzchni  zwanej  powierz- 
chnią graniczną  chmury  elektronowej  lub  po  prostu  — 
powierzchnią  graniczną,  lub  konturem  granicznym. 

Dla  celów  porównawczych  promień  kuli  dobiera  się 
zwykle  tak,  aby  powierzchnia  graniczna  obejmowała 
90-95%  ładunku.  Tego  typu  powierzchnie  graniczne 
wystarczą  do  zrozumienia  wielu  podstawowych 
zagadnień  strukturalnych  chemii  bez  szczegółowego 
rozpatrywania  warstwie  ładunku.  W wielu  wypadkach 
wystarczy  nawet  znajomość  tylko  powierzchni  gra- 
nicznej. 

Powierzchnie  graniczne  (kontury)  można  oczy- 
wiście wykreślić  nie  tylko  dla  kwadratów  funkcji  falo- 
wych, ale  również  dla  samych  funkcji.  Kształty  kon- 


Rys.  4.  Powierzchnie  graniczne  funkcji  falowych  elektronu  w ato- 
mie wodoru  dla  n = 1 i n = 2.  U dołu  pokazano  przecięcie  po- 
wierzchni granicznej  funkcji  typu  ns  dowolną  płaszczyzną  prze- 
chodzącą przez  jądro  oraz  przecięcie  funkcji  typu  npx  płasz- 
czyzną xy.  Funkcje  typu  ns  (ls,  2s, ...)  są  funkcjami  kulistosy- 
metrycznymi  (nie  zależą  one  od  kątów).  Funkcje  typu  npx , npv 
i npz  zależą  od  kątów  i są  antysymetryczne  względem  odbicia 
w płaszczyźnie  odpowiednio  yz,  x z i xy.  Znaki  4-  oraz  — ozna- 
czają wartości  dodatnie  i ujemne  funkcji  fałowych 

tości  dodatnie),  a w innych  ujemna,  podczas  gdy 
gęstość  prawdopodobieństwa  jest  zawsze  wielkością 
dodatnią. 

Omawialiśmy  dotychczas  stan  podstawowy  atomu 
wodoru  opisany  funkcją  falową  'F1&.  W podobny 
sposób  można  przedstawić  funkcje  falowe  opisujące  stany 
poszczególne  stany  wzbudzone  atomu  wodoru,  wzbudzone 
Z różnego  rodzaju  przedstawień  graficznych  funkcji  atomu 
falowych  najbardziej  użyteczne  są  kontury  funkcji  wodoru 
falowych  (lub  ich  przekroje  płaszczyzną;  rys.  4). 

Kontur  każdej  funkcji  typu  s,  tzn.  XP1S,  jak  również 
W2S,  itd.,  ma  kształt  kulisty,  a kule  te  są  tym  więk- 
sze, im  większa  jest  wartość  głównej  liczby  kwantowej 
n.  Jest  to  związane  z faktem,  że  w wyższych  stanach 
„chmura  elektronowa”  jest  bardziej  rozmyta  w prze- 
strzeni, należy  więc  przestrzeń  otoczyć  kulą  o więk- 
szym promieniu,  aby  wewnątrz  tej  kuli  znalazł  się 
prawie  cały  ładunek  elektronowy.  Najbardziej 
prawodpodobna  odległość  elektronu  od  jądra  w sta- 
nie Yzg  atomu  wodoru  wynosi  (3+]/5 )a0y  czyli  jest 
ponad  pięć  razy  większa  aniżeli  analogiczna  odległość 
w stanie  podstawowym  Funkcje  falowe  dla  n = 2 
i / = 1 zależą  od  kątów  (innymi  słowy  są  one  ukie- 
runkowane). 

Na  przykład  funkcja  xP2px  jest  proporcjonalna  do 
xt  i znika  dla  x = 0.  Dla  dodatnich  wartości  x fun- 
kcja ta  jest  dodatnia,  natomiast  dla  ujemnych  x 
przyjmuje  wartości  ujemne.  Te  własności  kątowe 
funkcji  oznaczone  są  na  powierzchni  granicznej  zna- 
kami -fi  — . Łatwo  prześledzić  w analogiczny  sposób 
własności  przestrzenne  funkcji  'PzPy  i WiPt.  Powie- 
rzchnie graniczne  dla  funkcji  falowych,  dla  których 
n ^ 3 i l > 2,  są  bardziej  skomplikowane.  Nie 
będziemy  ich  jednak  tutaj  przedstawiać. 
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Spin  elektronu 

Badania  doświadczalne  nad  wpływem  pola  magne- 
tycznego na  własności  atomów  srebra  wykazały,  że 
elektron  ma  pewien  własny  moment  pędu  nazwany 
spinem.  Nie  będziemy  szczegółowo  uzasadniać  istnie- 
nia tej  wielkości  (wymagałoby  to  odwołania  się  do 
relatywistycznej  mechaniki  kwantowej);  dla  naszych 
celów  wystarczy  wiedzieć,  że  spin  elektronu  jest  pew- 
nym dodatkowym  momentem  pędu  nie  związanym 
z ruchem  orbitalnym  elektronu  wokół  jądra.  Czasami 
tłumaczy  się  istnienie  spinu  jako  wynik  obrotu  elek- 
tronu dookoła  własnej  osi,  ale  nie  należy  tego  brać 
zbyt  dosłownie,  gdyż  spin  nie  ma  swojego  odpowiedni- 
ka w mechanice  klasycznej. 

Do  pełnego  opisu  stanu  elektronu  nie  wystarczy 
podać  funkcję  falową  'łfnim  zależną  od  trzech  współ- 
rzędnych przestrzennych  r,  #,  <p.  Poprawna  funkcja 
falowa  powinna  zawierać  również  informacje  o spinie 
elektronu.  W tym  celu  wystarczy  funkcję  W-nim  po- 
mnożyć przez  funkcję  opisującą  stan  spinu  elektronu 
(jest  to  słuszne  tylko  w nierelatywistycznej  mechanice 
kwantowej,  którą  się  właśnie  zajmujemy).  Spin  jedne- 
go elektronu  jest  jednoznacznie  określony  przez  po- 
danie tzw.  rzutu  spinu  na  wyróżnioną  oś;  rzut  ten 
może  przyjmować  tylko  dwie  wartości  ms  = +1Uh 
lub  ms  — —xj2h  (albo  1/2  lub  —1/2  w jednostkach 
fi).  Mówimy,  że  „elektron  ma  spin  1/2  lub  —1/2”, 
i tę  sytuację  charakteryzujemy  za  pomocą  strzałek 
t lub  l . Umówimy  się  dalej,  że  funkcję  spinową  opi- 
sującą stan,  w którym  m»  — 1/2,  oznaczać  będziemy 
przez  a,  natomiast  przez  p oznaczymy  funkcję  spino- 
wą elektronu,  dla  którego  m$  — —1/2.  Tak  więc  po- 
prawna funkcja  falowa  opisująca  stan  elektronu 
w atomie  jednoelektronowym  ma  postać. 

| nlmCC  dla  f 

Anlmm-  = { • (5) 

\VnimP  dla  j 

Pojęcie  spinu  w zasadzie  nie  jest  potrzebne  dla  zro- 
zumienia własności  stanów  elektronu  i ich  energii 
w przypadku  atomu  jednoelektronowego.  Jest  ono 
natomiast  konieczne  przy  opisie  zespołu  elektronów. 
Zanim  zaczniemy  omawiać  bardziej  złożone  układy, 
wprowadzimy  jeszcze  pojęcie  multipletowości  stanu. 
Jest  to  wielkość  określona  wyłącznie  własnościami 
spinów  poszczególnych  elektronów  układu.  Jak  już 
wspominaliśmy,  każdy  elektron  ma  spin  1/2  lub  — 1/2. 
Elektrony  można  więc  podzielić  na  dwie  grupy  — 
elektrony  o spinach  1/2  i elektrony  o spinach  —1/2. 
Multipletowością  stanu  (lub  jego  krotnością)  nazy- 
wamy wielkość  M = 2|J£msj  +1,  gdzie  suma  przebiega 
po  wszystkich  elektronach  układu.  Tak  więc  stan 
elektronu  w atomie  jednoelektronowym  ma  multi- 
pletowość  równą  2 (stan  dubletowy),  gdyż  M — 2 • 
•1/2+1  =2.  Dla  dwóch  elektronów  możemy  mieć 
dwie  multipletowości.  Jeżeli  elektrony  mają  taki  sam 
spin,  wówczas  M = 3 (stan  trypletowy),  a gdy  spiny 
są  przeciwne,  wówczas  mamy  stan  singletowy,  gdyż 
M — 1.  Bardzo  łatwo  jest  obliczyć  multipletowość 
dowolnego  stanu  układu  elektronów,  jeżeli  tylko  wie- 
my, jakie  są  spiny  poszczególnych  elektronów. 


Metody  przybliżone  mechaniki 
kwantowej 

Jak  już  poprzednio  wspomnieliśmy,  problem  ruchu 
elektronu  w polu  działania  jądra  atomowego  o ładun- 
ku Ą-Ze  (inaczej  — zagadnienie  ruchu  dwóch  cząstek) 
ma  ścisłe  rozwiązanie  w mechanice  kwantowej  — rów- 
nania (3)  i (4).  Jest  to  problem  analogiczny  do  proble- 
mu ruchu  dwóch  ciał  w mechanice  klasycznej.  Na 
przykład  równania  Newtona,  które  opisują  ruch  Ziemi 
wokół  Słońca  z pominięciem  wpływu  innych  ciał 


Układu  Słonecznego,  mają  rozwiązania  ścisłe.  Dobrze 
wiadomo  jednak,  że  ruch  Ziemi  w Układzie  Słonecz- 
nym zależy  nie  tylko  od  oddziaływania  pomiędzy  Słoń- 
cem a Ziemią,  lecz  także  od  wpływu  wszystkich  planet 
i innych  ciał  Układu  Słonecznego  i chociaż  potrafimy 
sformułować  równania  Newtona  opisujące  ruch  wszy- 
stkich ciał,  nie  potrafimy  rozwiązać  tych  równań 
w sposób  ścisły. 

Podobna  sytuacja  występuje  w mechanice  kwanto- 
wej, gdzie  nawet  dla  atomu  helu  (trzy  cząstki : jądro  4- 
+dwa  elektrony),  dla  którego  znamy  równanie 
Schródingera  (rys.  5),  nie  potrafimy  tego  równania 
rozwiązać  w sposób  ścisły. 


Rozwiązanie  numeryczne  równania 
Schródingera 

Czytelnik  interesujący  się  rozwojem  i możliwościa- 
mi komputerów  zaproponuje  niewątpliwie  nume- 
ryczne rozwiązanie  równania  (1)  dla  atomu  helu. 
I rzeczywiście  tak  można  uczynić.  W tym  celu  należy 
ustalić  w przestrzeni  położenie  np.  elektronu  drugiego 
i rozwiązać  numerycznie  równanie  (1),  opisujące  ruch 
elektronu  pierwszego  znajdującego  się  w polu  działa- 
nia jądra  oraz  „unieruchomionego”  elektronu  drugie- 
go. Pole  działające  na  elektron  pierwszy  nie  jest  j uż  po- 
lem centralnym  (jak  to  było  w wypadku  elektronu 
w atomie  jednoelektronowym)  i rozwiązanie  równania 
(1)  nie  ma  postaci  analitycznej ; jest  ono  przedstawione 
w postaci  zbioru  wartości  funkcji  falowej  dla  poszcze- 
gólnych położeń  elektronu  pierwszego  w przestrzeni 
(rozwiązanie  numeryczne).  Rozwiązanie  będzie  tym 
bardziej  dokładne,  im  więcej  zostanie  podanych  war- 
tości funkcj  ifalowej  dla  różnych  położeń  elektronu 
pierwszego. 

Przyjmijmy,  że  zadowoli  nas  podanie  wartości 
funkcji  falowej  w 1000  punktach  przestrzeni.  Ponieważ 
atom  helu  ma  dwa  elektrony,  to  aby  mieć  rozwiązanie 
numeryczne  opisujące  ruch  obu  elektronów  w atomie, 
należy  drugi  elektron  umieścić  w 1000  punktach  prze- 
strzeni i dla  każdego  „ustalonego”  położenia  roz- 
wiązywać równanie  ruchu  dla  pierwszego  elektronu 
w 1000  punktach.  Przedstawienie  takiej  funkcji  falo- 
wej w postaci  książkowej  wymagałoby  wydania  tomu 
o 1000  stronach,  z 1000  wartości  funkcji  na  każdej 
stronie.  Obliczona  w ten  sposób  funkcja  falowa  dla 
atomu  litu  (3  elektrony)  wymagałaby  całego  księgo- 
zbioru (1000  książek  1000-stronicowych,  a na  każdej 
stronie  1000  wartości  funkcji!!!).  Proszę  wyobrazić 
sobie  podobne  przedstawienie  funkcji  falowej  dla 
cząsteczki  benzenu  zawierającej  12  jąder  i 42  elektro- 
ny. Nic  dziwnego,  że  ten  sposób  przedstawienia  sta- 
nów układu  chemicznego  jest  nie  tylko  niepopularny, 
ale  jest  zupełnie  bezużyteczny.  Na  szczęście  mechanika 
kwantowa  dysponuje  metodami  przybliżonymi,  które 
pozwalają  opracować  metody  obliczeniowe,  za  po- 
mocą których  w wielu  wypadkach  można  uzyskać 
wyniki  zgodne  z danymi  doświadczalnymi. 


Rachunek  zaburzeń 

Pierwszą  z metod  przybliżonych  mechaniki  kwantowej  rach unek 
jest  rachunek  zaburzeń.  Omówimy  schematycznie  tyl-  zaburzeń 
ko  jedną  z wersji  tej  metody,  tzw.  rachunek  zaburzeń  Rayleigha- 
Rayleigha-Schródingera.  Rozważmy  układ  chemiczny  Schrodin- 
opisany  równaniem  falowym  (1)  HW  = EW.  Dowol-  gera 
ny  stan  układu  opisany  jest  funkcją  falową  W i 
o energii  Et  (por.  wzory  (1)  i (2)).  Oczywiście  nie  znamy 
rozwiązania  równania  HW  — EW,  ale  szukamy  tego 
rozwiązania  w szczególny  sposób.  Przyjmijmy  miano- 
wicie, że  hamiltonian  układu  H można  zapisać 
w postaci  sumy  operatora  i operatora  H\  przy 
czym  załóżmy,  że  znamy  rozwiązanie  równania  falo- 
wego w przypadku  operatora  H(°\  tzn.  znamy  roz- 
wiązanie równania  f/(0>  y<°>  = Ć<°>  <p(0)  (znamy  więc 
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operator  zbiór  funkcji  własnych  ę>J.0)  i energii  ć£0>).  Podziału 
zaburzeniowy  hamiltonianu  H na  dwie  części  należy  dokonać 
w taki  sposób  (istnieje  kilka  sposobów  tego  podziału), 
aby  operator  Hf  (operator  zaburzeniowy)  był  mały 
w stosunku  do  operatora  /f<°>.  Wówczas  szukana 
funkcja  falowa  ^ i energia  Ei  układu  dają  się  wyrazić 
jako  sumy  odpowiednich  wielkości  niezaburzonego 
układu,  tzn.  ę>{0)  i ć\0)  oraz  poprawek  zaburzeniowych 
różnego  rzędu : 

Wi  = + + 3)+... 

E{  = ć(0>  + ^1>  + ^2>  + <5£,i(3> +...  (6) 

gdzie 

Sy(»9  óEp,  ... 

są  poprawkami  1.,  2., ...  rzędu  odpowiednio  do  funkcji 
falowej  i energii  układu  w /-tym  stanie.  Kolejne  popraw- 
ki óWi  i ó Ei  wyrażone  są  przez  całki,  których  wartość 
zależy  jedynie  od  hamiltonianu  zaburzeniowego  H' 
oraz  od  funkcji  własnych  ^0)  i energii  własnych  ć^0) 
układu  niezaburzonego.  Stosunkowo  prostą  postać  ma 
poprawka  zaburzeniowa  1 . rzędu  do  energii.  Wyraża  się 

ona  prostą  całką  <52E^1>  = / ę><°>*  H'<p[0)dv,  a więc  po- 
prawka ta  zależy  jedynie  od  H'  oraz  od  jednej 
funkcji  falowej  układu  niezaburzonego.  Niestety, 
istotną  wadą  rachunku  zaburzonego  w podanym 
tu  sformułowaniu  jest  to,  że  w przypadku  poprawek 
1.  rzędu  do  funkcji  falowej  oraz  poprawek  wyższych 
rzędów  do  energii  i funkcji  falowych,  musimy  posługi- 
wać się  sumami  nieskończonymi  (musimy  znać  wszyst- 
kie funkcje  własne  i wszystkie  energie  własne  układu 
niezaburzeniowego).  Niemniej,  wspomniany  rachunek 
zaburzeniowy  umożliwia  w prosty  sposób  obliczenie 
poprawki  1.  rzędu  do  energii,  i w wielu  wypadkach 
energia  układu  Ei  « ć£0)  + stosunkowo  dobrze 
zgadza  się  z danymi  doświadczalnymi, 
stan  Zilustrujemy  powyższe  rozważania  na  przykładzie 
podstawowy  stanu  podstawowego  atomu  helu.  W atomie  tym 
atomu  helu  (rys.  5)  operatorem  /T<°>  może  być  suma  energii  kine- 
tycznej obu  elektronów  (Ti 4-  T2)  i energii  potencjalnej 


-e 


Rys.  5.  Schematyczny  obraz  atomu  helu;  pod  spodem  hamiho" 
nian  opisujący  ruchy  elektronów  w tym  atomie,  Tx  i Tt  operatory 
energii  kinetycznej  elektronu  1 i 2,  Vt  i Vz  operatory  elektrosta- 
tycznego oddziaływania  pomiędzy  jądrem  i elektronem  1 oraz 
jądrem  i elektronem  2,  e*lrxz  oddziaływanie  między  elektronami. 
Gdyby  usunąć  jeden  z elektronów,  tzn.  gdyby  zjonizować  atom 
helu,  to  ruch  pozostałego  elektronu  opisany  byłby  w sposób 
ścisły  funkcjami  (3)  o energiach  ze  wzoru  (4)  przy  Z — 2 

obu  elektronów  w polu  jądra  atomu  helu  (Fi+  K2). 
Operatorem  zaburzeniowym  jest  wówczas  energia  po- 
tencjalna oddziaływania  elektrostatycznego  pomiędzy 
elektronami  e2/r12.  Ponieważ  w operatorze  Tf<°>  nie  ma 
oddziaływania  pomiędzy  elektronami,  równanie  falo- 
we f/<°>9?<°)  = ć<0>9?(°)  rozbija  się  na  dwa  równania, 
z których  każde  opisuje  elektron  1 lub  elektron  2 
w polu  działania  jądra  o ładunku  -f  2e.  A więc  każde 
z tych  równań  opisuje  przypadek  atomu  jednoelektro- 
nowego  dla  Z = 2.  Rozwiązanie  tych  równań  ma  po- 
stać ścisłą:  funkcje  falowe  mają  postać  (3),  natomiast 
energie  można  obliczyć  ze  wzoru  (4)  (należy  oczywiś- 
cie za  Z podstawić  2).  Układ  dwóch  elektronów  atomu 
helu,  w wypadku  gdy  pomiędzy  elektronami  pominięto 


oddziaływanie,  opisany  jest  funkcją  falową,  która  jest 
iloczynem  funkcji  fałowych  opisujących  oddzielnie 
każdy  z elektronów  w jonie  atomu  helu,  natomiast 
energia  układu  tych  elektronów  jest  sumą  energii  obu 
elektronów  w poszczególnych  stanach  jonu.  Dla  stanu 
podstawowego  energia  obu  elektronów  (energia 
niezaburzonego  układu)  wynosi  ći0>  = 2EX  = 2Z2 
(— 13,6eV)=  —108,8  eV  (lub  w tzw.  jednostkach 
atomowych  energii  — 4,0j.at.). 

Jednostki  atomowe  wprowadza  się  w celu  uniezależnienia  wiel-  jednostki 
kości  charakteryzujących  układ  (energia,  odległości  między  czą-  atomowe 
stkami  układu  itp.)  od  dokładności  pomiaru  stałych  uniwersal- 
nych, jak  ładunek  i masa  elektronu,  stała  Plancka.  Przyjmując, 
że  m — 1,  e = 1 oraz  h — 1,  energia  elektronu  w stanie  podsta- 
wowym wodoru  wynosi  Ex  — —0,5  j.at.  w — 13,6  eV.  Tak  więc 
1 j.at.  energii  « 27,2  eV.  Za  jednostkę  atomową  odległości  przyj- 
muje się  a,  (1  bohr)  = 0,0529  nm. 

Doświadczalna  wartość  energii  obu  elektronów 
w stanie  podstawowym  atomu  helu  wynosi  — 78,98  eV 
(—2,90  j.at.).  Jak  widać,  jeżeli  pominiemy  oddziały- 
wanie pomiędzy  elektronami,  opis  własności  obu  elek- 
tronów w atomie  helu  nie  jest  poprawny.  Obliczona 
energia  układu  niezaburzonego  różni  się  o przeszło 
30%  od  energii  doświadczalnej.  Jak  już  wspominaliś- 
my poprzednio  można  łatwo  obliczyć  poprawkę 
1 rzędu  do  energii.  Funkcją  falową  układu  niezaburzo- 
nego jest  w przypadku  stanu  podstawowego  helu  ilo- 
czyn dwóch  funkcji  !F100  ze  wzoru  (3)  dla  Z = 2 
(tabela  str.  252).  Obliczona  poprawka  1 rzędu  do 
energii  stanu  podstawowego  jest  równa  SE^  = 34  eV, 
a więc  energia  całkowita  atomu  helu  obliczona  z do- 
kładnością do  poprawki  1 rzędu  wynosi  Ex  = + 

4-  di*1)  = — 74,8  eV  (—2,75  j.at.),  i zgadza  się  stosun- 
kowo dobrze  z wartością  doświadczalną  (obliczona 
wartość  energii  stanowi  95%  energii  doświadczalnej). 

Rachunek  zaburzeń  ograniczony  do  poprawki  1 
rzędu  do  energii,  nie  daje  bardzo  dokładnych  wyni- 
ków. Nic  zresztą  dziwnego,  gdyż  energia  zaburzeń 
wcale  nie  jest  małą  i wynosi  przeszło  30%  energii  rzędu 
zerowego.  Natomiast  uwzględnienie  poprawki  2 rzę- 
du do  energii  daje  już  energię  całkowitą  stanu  pod- 
stawowego atomu  helu  z dokładnością  do  0,5%  warto- 
ści doświadczalnej.  Istnieje  wiele  sformułowań  ra- 
chunku zaburzeń,  i w różnych  wersjach  był  on  stoso- 
wany do  obliczenia  m.in.  energii  stanu  podstawowego 
atomu  helu.  W jednej  z tych  wersji  poprawka  18  rzędu 
do  energii  wynosi  5*10“9eV.  Pomimo  trudności 
z obliczaniem  poprawek  wyższych  rzędów  rachunek 
zaburzeń  ma  duże  znaczenie  w mechanice  kwanto- 
wej, a szczególnie  przy  opisie  oddziaływań  między- 
cząsteczkowych  lub  przy  opisie  wpływu  pól  zewnętrz- 
nych działających  na  rozważany  układ. 


Zasada  wariacyjna 

Drugą  z metod  przybliżonych  mechaniki  kwantowej 
jest  metoda  oparta  na  zasadzie  wariacyjnej.  Jest  ona 
w wielu  wypadkach  bardziej  dogodna  od  rachunku  za- 
burzeń, gdyż  można  ją  stosować  do  dowolnego  ukła- 
du, dla  którego  szukamy  rozwiązania  (2)  równania 
falowego  (1).  Opis  tej  metody  ograniczymy  do  stanu 
podstawowego  układu  Eu  a potem  zilustrujemy  przy- 
kładowymi obliczeniami  dla  stanu  podstawowego 
atomu  helu. 

Wybierzmy  dowolną  funkcję  próbną  #,  która  w spo-  funkcja 
sób  przybliżony  opisuje  stan  podstawowy  rozważane-  próbna 
go  układu.  Z zasady  wariacyjnej  wynika,  że  obliczona 
energia  stanu  podstawowego  układu  opisanego  tą 
próbną  funkcją  nie  jest  nigdy  mniejsza  niż  dokładna 
energia  Ex  z dokładnego  rozwiązania  równania  (1), 
tzn, 

£ = j <P*H<Pdv  > Ex.  (7) 

Próbne  funkcje  falowe  <P  można  wybierać  różnymi 
sposobami.  Jeżeli  wybierzemy  kilka  funkcji  próbnych 
<Ply  #2,  <PZy  ...,  to  z wszystkich  obliczonych  energii 
Ci,  ć2,  ća, ...  najlepsze  przybliżenie  do  energii  dokładnej 
Ex  będzie  mieć  energia  ći  o najmniejszej  wartości. 
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Na  ogół  jednak  postępujemy  trochę  inaczej.  Uza- 
leżniamy wybór  funkcji  próbnej  0 opisującej  układ  n 
elektronów  od  parametrów  cx,  c2, ...,  Ck,  tzn.  funkcja 
parametry  falowa  powinna  mieć  postać  0(1,  2, ...,«;  cu...  , c*). 
wariacyjne  Mamy  więc  niejedną  funkcję  0,  ale  cały  zbiór  funkcji, 
ponieważ  dla  każdego  zbioru  parametrów  mamy  inną 
funkcję.  Energia  układu  opisanego  próbną  funkcją 
zależy  oczywiście  od  tych  parametrów,  tzn.  C = ć( cXy 
c2,...,Ck).  Z zasady  wariacyjnej  wynika  po  pierwsze 
to,  że  należy  tak  dobrać  parametry  cu  ...,at,  aby 
energia  C była  najmniejsza,  ponieważ  ta  najmniejsza 
wartość  energii  Cmin(cx, ...,  Ck)  będzienajbliższa  warto- 
ści dokładnej,  a po  drugie  to,  że  przy  wprowadzeniu 
dodatkowych  parametrów  c*+1,...,c*+z  otrzymujemy 
ćmin(cx,c2,  ...,Cfc+i)<  ćmin(cx,...tCk)  ijednocześnie  funk- 
cję falową  0(1,2,..., n;  C!,...,ca;+z)o  lepszym  przybliże- 
niu do  funkcji  falowej  opisującej  dokładnie  stan  ukła- 
du. A więc  zwiększenie  ilości  tzw.  parametrów  waria- 
cyjnych w funkcji  falowej  pozwala  obliczyć  energię 
całkowitą  układu  z coraz  większą  dokładnością 
(należy  przy  tym  pamiętać,  że  wartość  ćminfci,  c2, ...) 
nigdy  nie  może  być  mniejsza  od  wartości  dokładnej 
Exl\l).  Jeżeli  więc  użyjemy  bardzo  wielu  parametrów 
w próbnej  funkcji  falowej,  uzyskać  możemy  wartość 
energii  układu  bardzo  zbliżoną  do  energii  dokładnej 
Ex  (czasami  takie  obliczenia  są  bardzo  kłopotliwe 
z powodu  dużej  liczby  niezbędnych  parametrów). 

Funkcję  próbną  0 można  w różny  sposób  uzależniać 
od  parametrów  cp.  Szczególnie  prosta  sytuacja  jest 
wówczas,  gdy  funkcja  próbna  0 jest  przedstawiona 
w postaci  liniowej  kombinacji  znanych  funkcji  xv 


Rozpatrzmy  teraz  stan  podstawowy  atomu  helu. 
W przypadku  jonu  He+  wiadomo,  że  jeden  elektron 
opisany  jest  w sposób  ścisły  funkcją  falową  *P1S  = 
= Nlse~Zrla°y  gdzie  Z = 2.  W przypadku  atomu  helu, 
gdy  mamy  w atomie  dwa  elektrony,  możemy  przyjąć, 
że  w przybliżeniu  własności  każdego  z elektronów 
opisane  są  funkcją  falową  015  podobną  do  funkcji 
*PłS,  ale  nie  mamy  już  powodu,  aby  przyjmować,  że 
ładunek  jądra  wynosi  -f  2e.  Jeden  z elektronów,  po- 
wiedzmy elektron  1,  „widzi”  bowiem  jądro  atomu 
helu  nie  o ładunku  -f-2c,  ale  o ładunku  Z'e  gdyż 
elektron  2 ekranuje  ładunek  jądra.  Analogicznie, 
elektron  2 „widzi”  jądro  atomu  o ładunku  ZV,  takim 
samym  jak  w przypadku  rozważanego  elektronu  1 . 
Intuicyjnie  należy  oczekiwać,  że  Z'  będzie  zawarte  po- 
między 1 a 2,  tzn.  należy  oczekiwać  ładunku  pośred- 
niego między  ładunkiem  atomu  wodoru  a ładunkiem 
jonu  He+.  Możemy  więc  przyjąć,  że  funkcje  opisujące 
każdy  z elektronów  w atomie  helu  mają  postać 
(pis  = NX8ęTz'rłaQ.  Funkcja  falowa  opisująca  układ 
tych  dwóch  elektronów  zależy  więc  bezpośrednio  od 
współrzędnych  obu  elektronów  oraz  od  jednego  pa- 
rametru wariacyjnego  Z',  tzn. 

<P(1,2;Z')  = ę>łs(l)ę>is(2)  = ]NIS|2e'Z'(ri+,2)  °D- 

Energia  układu  opisanego  taką  funkcją  falową  wynosi 
<fi  = (Z')2— 27/8Z'.  Przyjmując  więc  różne  ładunki 
Z',  otrzymujemy  różne  funkcje  próbne  0 (1,2;  Z') 
i różne  energie  układu  odpowiadające  tym  funkcjom. 
Najlepszą  funkcją  0 (1, 2;  Z')  jest  funkcja  dla  takiego 
Z\  dla  którego  CX(Z')  ma  wartość  minimalną  (rys.  6), 


0 = ^ cpxp . (8) 

JCł-l 

Mówimy  wówczas,  że  funkcja  <P  zależy  liniowo  od 
parametrów  cp.  Zbiór  funkcji  xv  może  być  zbiorem 
dowolnych  znanych  funkcji,  ale  przy  jego  wyborze 
kierujemy  się  oczywiście  intuicją  fizyczną  lub  chemicz- 
metoda  ną.  Zasada  wariacyjna  w przypadku  funkcji  0 postaci 
Ritza  (8)  daje  prosty  sposób  (metoda  Ritza),  na  znajdowanie 
współczynników  cp  — należy  mianowicie  rozwiązać 
układ  równań  liniowych  m- tego  stopnia  na  szukane 
współczynniki 

m 

cp(Hpq—ĆSp,)  = 0,  dla?  = 1,2, ... , m,  (9) 

7>-l 

gdzie  HPą  = J x*pHxtdv,  SPV  = J %*viqdv. 

W równaniach  tych  Hvq  i SPQ  są  całkami,  które  mo- 
żerny  obliczyć,  gdyż  zależą  one  od  H oraz  od  znanych 
funkcji  xv • Niewiadomymi  wielkościami  są  współ- 
czynniki cPy  jak  również  ć,  które  daje  się  jednak  wyzna- 
czyć z warunku  istnienia  rozwiązania  układu  równań 
(9).  Mianowicie  układ  ten  ma  rozwiązanie  tylko  wów- 
czas, gdy  znika  wyznacznik  zbudowany  z wyrazów 
przy  niewiadomych  współczynnikach  cP  (pomijamy 
tutaj  trywialne  (zerowe)  rozwiązanie  równań  (9), 
gdy  wszystkie  cp  są  równe  0),  tzn.  gdy 

detjj fipq  — CSPq\  = 0. 

Ostatnie  wyrażenie  jest  równaniem  stopnia  m na 
niewiadome  C.  Rozwiązanie  ma  m pierwiastków  Cu 
ć2,  ...»  Cm.  Numerujemy  je  zgodnie  ze  wzrastającą 
energią;  tak  więc  <fx  będące  najmniejszą  liczbą  ze 
wszystkich  Ci  jest  energią  stanu  podstawowego  ukła- 
du opisanego  próbną  funkcją  0 postaci  (8).  Aby  podać 
szczegółową  postać  tej  funkcji,  należy,  wstawiając 
Ci  do  układu  (9),  znaleźć  układ  współczynników  cp 
odpowiadający  danej  energii  Cu  Oczywiście  w ten 
sam  sposób  można  obliczyć  funkcje  próbne  <P  odpo- 
wiadające energiom  <f2,...,Ćm.  Jak  widać,  każdemu 
Ci  (/  = 1,  ..*,  ni)  odpowiada  inna  funkcja  próbna  0. 
Dlatego  funkcję  (8)  oznaczamy  dodatkowo  indek- 

m 

sem  i,  tzn.  zapisujemy  ją  w postaci  0*  = J?  cptxv  ( cPi 

pTt 

jest p-tym  współczynnikiem  do  /-tej  funkcji  próbnej). 
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-2.75 

-2,8477 

-2,9037 

-3,0 


__J l_^J ^ 

1 1,687'  2 e 

ładunek  jądra  Z* 

Rys.  6.  Energia  C x układu  dwóch  elektronów  w stanie  podsta- 
wowym atomu  helu  obliczona  przy  założeniu,  że  każdy  z elek- 
tronów jest  opisany  funkcją  {Z’jaoy,i  e~z'riao  (Z' 

ładunek  jądra).  Linia  przerywana  odpowiada  dokładnej  energii 
atomu  helu 


tzn.  dla  Z'  = 1,6875  (jak  widać  Z' jest  rzeczywiście 
zawarte  pomiędzy  1 a 2).  Przy  tej  wartości  Z'  energia 
Cx  = —2,8477  j.at.  stanowi  98,07%  energii  dokładnej, 
a więc  różnica  między  wartością  obliczoną  a energią 
dokładną  jest  bardzo  mała.  Różnicę  tę  można  jeszcze 
bardziej  zmniejszyć,  modyfikując  funkcję  próbną. 
Przyjmijmy  np.  że  funkcja  falowa  opisująca  jeden 
elektron  w atomie  helu  ma  postać  <pxs  = NJsrn  ~l* 

• e-z'r/ao,  gdzie  /z' jest  bliskie  jedności,  tak  że  czynnik 
rn/_1  nieznacznie  tylko  zmienia  poprzednio  użytą 
funkcję  (pxs  (zarówno  n\  jak  i Z'  traktujemy  jako 
parametry  wariacyjne).  Funkcja  układu  dwóch  elek- 
tronów, będąca  iloczynem  powyższych  funkcji  jedno- 
elektronowych,  ma  wówczas  postać  0 (1,2;  /?',  Z'). 
Okazuje  się,  że  energia  układu  Cx  dla  tej  funkcji  jest 
minimalna  wówczas,  gdy  Z'  — 1,61162  oraz  ri  — 
= 0,955,  i wynosi  —2,8542  j.at.  Widać  więc  wyraźnie, 
że  zwiększenie  liczby  parametrów  w próbnej  funkcji 
polepsza  zgodność  energii  obliczonej  z energią  do- 
kładną (obliczona  energia  Ci  w drugim  wypadku  sta- 


stan 

podstawowy 
atomu  helu 


obliczanie 

energii 


nowi  już  98,30%  energii  dokładnej).  Funkcję  próbną 
można  jeszcze  bardziej  uogólnić,  mnożąc  #(1,2;  Z') 
np.  przez  wielomian  typu  (1  +clr^+c2lr^+czr^),  gdzie 
Ci,  c2,  cz  oraz  pf  q i s są  parametrami.  Energia  ćx 
obliczona  przy  użyciu  takiej  funkcji  stanowi  jeszcze 
lepsze  przybliżenie  do  energii  dokładnej.  W 1958  r. 
C.  L.  Pekeris  użył  w obliczeniach  dla  atomu  helu 
funkcji  próbnej  zawierającej  kilkaset  parametrów, 
potencjał  Obliczony  przez  niego  potencjał  jonizacyjny  atomu 
jonizacyjny  helu,  wynoszący  198310,67  cm”1,  nie  tylko  zgadza  się 
atomu  helu  z wartością  doświadczalną  198310,8  ± 0,15  cm"1, 
ale  jest  od  niej  bardziej  dokładny! 

Porównywaliśmy  wyniki  obliczeń  ćx  za  pomocą 
funkcji  próbnej  # z energią  dokładną  E1.  Dla  atomu 
helu  nie  znamy  funkcji  falowej  !Pi,  a więc  i nie  znamy 
Ex.  Co  oznacza  więc  wspomniana  energia  dokładna 
wynosząca  —2,9037  j.at.?  Czy  jest  nią  wartość  energii 
otrzymana  z pomiarów  doświadczalnych?  I tak,  i nie. 
Mierząc  wartość  energii  otrzymujemy  rzeczywistą 
wielkość  energii  dla  układu,  który  podlega  prawom 
relatywistycznej  mechaniki  kwantowej.  Ponieważ  zaj- 
mujemy się  tutaj  mechaniką  kwantową  nierelatywis- 
tyczną,  mierzoną  wartość  doświadczalną  należy  więc 
„przecechować”  do  wielkości,  z>  którą  możemy  po- 
równywać wyniki  otrzymane  z rozwiązania  nierela- 
tywistycznego  równania  (1).  W tym  celu  należy  od 
zmierzonej  wielkości  doświadczalnej  odjąć  szereg 
poprawek,  np.  poprawki  relatywistyczne  i promieniste. 
Zmierzona  energia  stanu  podstawowego  atomu  helu 
wynosi  —2,9033  j.at.,  a wspomniane  poprawki  są 
małe,  rzędu  0,0004  j.at.  Tak  więc  cytowana  już  wcześ- 
niej wielkość  —2,9037  j.at.  jest  „przecechowaną” 
energią  doświadczalną.  Warto  dodać,  że  ponieważ 
obliczona  przez  Pekerisa  wielkość  energii  stanu  pod- 
stawowego atomu  helu  (—2,90372  j.at.)  jest  bardziej 
dokładna  od  wielkości  mierzonej,  z wynikiem  teore- 
tycznym Pekerisa  porównywane  są  wszystkie  inne  wy- 
niki przybliżonych  obliczeń  dla  atomu  helu. 


Przybliżenie  jednoelektronowe 


spinorbital 


AO  — orbital 
atomowy 
MO  — orbita! 
molekularny 


Przybliżeniem  oddającym  ogromne  usługi  przy  opi- 
sie własności  układu  elektronów  w atomie  lub  w czą- 
steczce i będącym  podstawą  opisu  struktur  chemicz- 
nych jest  tzw.  przybliżenie  jednoelektronowe.  Zgodnie 
z nim,  ruch  każdego  elektronu  układu  rozpatruje  się 
w polu  jądra  (lub  jąder)  i w uśrednionym  polu  pocho- 
dzącym od  pozostałych  elektronów  układu.  Innymi 
słowy  stan  każdego  elektronu  układu  opisany  jest 
jednoelektronową  funkcją  falową,  zależną  od  współ- 
rzędnych określonego  elektronu  oraz  od  jego  spinu. 
Funkcje  takie  nazywamy  spinorbitalami  i oznaczamy 
je  symbolem  At  (czytelnik  nie  powinien  utożsamiać 
spinorbitali  h z funkcją  falową  Animms  (5),  która  opisuje 
w sposób  ścisły  stan  elektronu  w atomie  jednoelektro- 
nowym).  W wypadku  pominięcia  efektów  relatywis- 
tycznych, spinorbital  jest  iloczynem  orbitalu  atomo- 
wego (AO  — atomie  orbita l)  lub  orbitalu  molekularne- 
go (MO  — molecular  orbita f)  przez  funkcję  spinową 
<x  lub  /?  (wzór  10). 

Orbitalem  atomowym  lub  molekularnym  na- 
zywać będziemy  tutaj  funkcję  zależną  od  współrzęd- 
nych jednego  elektronu,  opisującą  ten  elektron  w 
atomie  lub  cząsteczce.  Funkcję  falową  opisującą  stan 
wszystkich  n elektronów  układu  można  zapisać  w 
postaci  wyznacznika: 


#(1,2,  ...,«)  = 


2,(1)  Ai  (2)  ...  Ax  (») 
A2(l)  A2  (2)  ...  Az  (n) 


| !n\ 


(11) 


An  (1)  An  (2)  ...  An  (w) 

Przedstawienie  funkcji  falowej  # w postaci  (11)  po- 
dyktowane jest  ogólnymi  własnościami  układu  n elek- 
tronów, takimi  jak  to,  że:  1)  elektrony  są  nierozróż- 
nialne,  2)  dowolne  dwa  elektrony  układu  nie  mogą 


być  opisane  takim  samym  spinorbitalem  At  — zasada 
Pauliego  (ale  ten  sam  AO  lub  MO  może  opisywać  dwa 
elektrony,  ponieważ  w myśl  (10)  z każdego  orbitalu 


stan  elektronu  stan  elektronu 

w atomie  w cząsteczce 


atomowy  atomowy  (AO)  molekularny  kulamy  (MO) 

można  utworzyć  dwa  spinorbitale)  oraz  3)  funkcja 
opisująca  układ  n elektronów  musi  być  antysymetrycz- 
na  ze  względu  na  zamianę  współrzędnych  dwóch  elek- 
tronów, tzn.  np.  #(1,2, ... , w)  = — #(2, 1, ... ,»). 

W przybliżeniu  jednoelektronowym  stan  podsta-  konfiguracja 
wowy  układu  (rys.  7)  można  opisać  wprowadzając  elektronowa 
konfigurację  elektronową,  która  przedstawia  upo- 
rządkowany ze  względu  na  wzrastającą  energię  ciąg 


a) 

*3 

*2 

f1 


b) 

f2 

£1 


-t- 

4- 

lub 

93 

-4- 

4- 

92 

92 

-4- 

4- 

9l 

9i 

konfiguracja 

7? 

ń 

*i 

lub 

9? 

ń 

♦i 

*4  1 

-4- 

93, 

<f4  lub 

93r 

94 

-4- 

4- 

<P2 

92 

-4- 

-4- 

9i 

91 

konfiguracja 

V? 

n 

94 

lub 

9i 

9i 

?3  74 

Rys.  7.  Konfiguracja  opisująca  w przybliżeniu  stan  podstawowy 
układu  6 elektronów  w atomie  (AO  — gn)  lub  w cząsteczce 
(MO  — y/i).  Liczba  elektronów  na  danym  orbitalu  podana  jest 
u góry  symbolu  orbitalu  ( <pt  — jeden  elektron  na  orbitalu  q>i> 
<Pi  — dwa  elektrony  na  orbitalu  ęt);  a)  orbitale  są  niezdegenero- 
wane;  b)  dwa  orbitale  są  zdegenerowane 


orbitali  z podaniem  „obsadzenia”  poszczególnych 
orbitali  przez  elektrony.  Zgodnie  z zasadą  Pauliego  na 
każdym  z orbitali  „umieszczamy”  po  dwa  elektrony 
o przeciwnych  spinach,  rozpoczynając  „obsadzanie” 
od  najniższego  energetycznie  orbitalu.  Może  się  zda- 
rzyć, że  jakieś  dwa  orbitale  mają  taką  samą  energię  degeneracja 
orbitalną  (degeneracja  orbitali).  Spośród  kilku  moż-  orbitali 
liwości  rozmieszczenia  dwóch  elektronów  na  zdege- 
nerowanych  orbitalach  (pamiętajmy,  że  energia 
układu  dwóch  elektronów  nie  równa  się  sumie  energii 
orbitalnych)  wybieramy  najbardziej  korzystną  ener- 
getycznie — jest  nią  sytuacja,  gdy  każdy  z elektronów 
jest  na  różnych  orbitalach,  ale  oba  elektrony  mają 
takie  same  spiny  (reguła  Hunda).  reguła  Hunda 


Równanie  Hartrea'ego-Focka 

Aby  otrzymać  przynajmniej  jakościowy  opis  konfi- 
guracji elektronów  w atomie  lub  cząsteczce  i podać 
względne  energetyczne  rozmieszczenie  orbitali,  na- 
leży znać  postać  tych  orbitali.  Jeśli  chodzi  o atomy 
sytuacja  jest  stosunkowo  prosta,  gdyż  należy  intui- 
cyjnie spodziewać  się,  że  orbitale  atomowe  mogą  mieć 
zbliżony  charakter  do  funkcji  falowych 
#2P  itd.  opisujących  w sposób  ścisły  elektron  w ato- 
mie jednoelektronowym.  Orbitale  atomowe  (fi  mogą 
np.  różnić  się  ładunkiem  efektywnym  Z'e  (jak  to  było 
w przypadku  atomu  helu)  w stosunku  do  ładunku 
Ze  atomu  jednoelektronowego  (tabela  str.  252).  Ale 
czy  takie  orbitale  atomowe  są  najlepszymi  jednoelek- 
tronowymi  funkcjami  opisującymi  elektron  w ato- 
mie? Orbitale  atomowe  można  przecież  wybierać  róż- 
nymi sposobami.  Odpowiedź  na  pytanie  wynika  z za- 
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sady  wariacyjnej.  Szukamy  próbnej  funkcji  falowej 
<P  (1,2, n)  postaci  (1 1)  — należy  więc  tak  zmieniać 
postać  AO  lub  MO,  aby  energia  konfiguracji  była  jak 
najmniejsza.  Zasada  wariacyjna  pozwala  otrzymać 
równania  HF  równania  (tzw.  równania  Hartree’ego-Focka  lub 
w skrócie  równania  HF),  z rozwiązania  których  otrzy- 
mujemy orbitale  atomowe  <Px  lub  molekularne 
oraz  odpowiadające  im  energie  orbitalne  £*.  W przy- 
zamknięto-  padku  gdy  mamy  parzystą  liczbę  elektronów  oraz 
powłokowa  tzw.  zamkniętopowłokową  konfigurację  stanu  pod- 
konfiguracja  stawowego  (po  dwa  elektrony  na  każdym  orbitalu), 
stanu  równania  HF  mają  postać 
podstawo- 
wego F<fi  = £i<fi 

lub  (12) 

Fijn  = sitpi  (dla  i = 1, ...,  h/2). 

Jest  to  postać  równań  bardzo  zbliżona  do  ogólnego 
równania  Schródingera  (1).  Zasadnicza  różnica  polega 
na  znacznym  uproszczeniu  równań  HF.  Podczas  gdy 
równanie  (l)było  równaniem  na  znajdowanie  jednej 
funkcji  falowej  dla  całego  układu,  równania  HF  są 
układem  nj 2 równań  na  orbitale  jednoelektronowe 
opisujące  w sposób  przybliżony  każdy  z elektronów 
oddzielnie. 

operator  Operator  Hartree’ego-Focka  F występujący  w (12) 
Nartree'ego-  zależy  od  energii  kinetycznej  jednego  elektronu,  od 
Focka  jego  oddziaływania  z jądrem  atomu  (lub  jądrami  czą- 
steczki) oraz  od  uśrednionego  potencjału  oddziały- 
wania ze  wszystkimi  pozostałymi  elektronami.  Uśred- 
niony potencjał  jest  niestety  określony  przez  wszy- 
stkie orbitale,  których  szukamy.  Oznacza  to,  że  ope- 
rator F zależy  od  współrzędnych  określonego  elek- 
tronu, np.  1 oraz  parametrycznie  od  orbitali  q>i  lub 
tzn.  F=  F(l;q>uv2,...9ipnjj  lub  F = F (1; 
yn/2).  Znalezienie  rozwiązania  układu  równań  (12) 
nie  jest  więc  proste,  rozwiązuje  się  je  metodą  itera- 
cyjną. 

W skrócie  postępowanie  iteracyjne  jest  następujące. 

1.  Zakładamy  początkowe  orbitale  ..., 

9nl 2 i definiujemy  F <0)(1 ; <p(l\ ... , ę^);  rozwiązujemy 

metoda  układ  równań  F(0)<pi  = €i<pt  dla  i*=  1, ... , w/2  znajdu- 
iteracyjna  jąc  orbitale  

2.  Definiujemy  F{1\l;<p({\  (p(P, ...  yfy);  rozwiązu- 
jemy układ  równań  = ei<pt  dla  i = 1,  ...,  n/ 2 

znajdując  orbitale  <p(p,  <p(pt ...» 

3.  Definiujemy  F(2>(1;  itd. 

Znalezione  w m-tym  cyklu  obliczeń  orbitale  ..., 
<P^l  używamy  do  określenia  operatora  F(m>,  i roz- 
wiązujemy układ  równań  F(m)q>t  — ei<Pi  dla  i — 1,..., 
n/ 2 znajdując  orbitale  Jeżeli  ten 

układ  orbitali  nie  różni  się  od  orbitali  z po- 
przedniego cyklu,  obliczenia  przerywamy,  gdyż  dal- 
sze postępowanie  iteracyjne  nie  zmieni  już  postaci 
orbitali.  Oczywiście  tak  samo  rozwiązuje  się  równa- 
nia HF  w przypadku  cząsteczki. 


Orbitale  pola  samouzgodnionego  SCF 

Orbitale  otrzymane  w wyniku  rozwiązania  iteracyj- 
nego  równań  (12)  nazywa  się  orbitalami  pola  samouz- 
godnionego  (SCF  — Self  Consistent  Field),  gdyż  orbi- 
tale określają  „samouzgodniony”  potencjał  uśred- 
niony (pole)  działający  na  poszczególne  elektrony 
układu. 

Cząsteczka  jest  o wiele  bardziej  złożonym  układem 
orbitale  niż  atom.  W atomie  położenia  elektronów  określone 
jedno-  są  względem  jednego  centrum  (jądro  atomu)  — orbi- 
centrowe  tale  atomowe  są  więc  jednocentrowe.  W cząsteczce 
orbitale  elektrony  są  własnością  całej  cząsteczki,  a orbitale 
wielo-  molekularne  są  wielocentrowe.  Nie  znamy  jednak  ich 
centrowe  ogólnej  postaci,  dlatego  też  rozwiązywanie  równań 
HF  dla  cząsteczek  nastręcza  duże  trudności,  czasami 

258 


wręcz  nie  do  pokonania.  Wobec  tego  rozwiązujemy 
równania  (12)  w uproszczonej  postaci  (tzw.  równania 
Hartree’ego-Focka-Roothaana  lub  po  prostu  równa- 
nia HFR).  Orbitale  molekularne  przybliża  się  przez 
liniową  kombinację  znanych  funkcji  jednoelektrono- 
wycłi 

Vł  = £ Cpifp-  (13) 

Układ  funkcji  <pp  nazywa  się  bazą.  Bardzo  często  jako 
bazę  wybiera  się  orbitale  atomowe  q>  atomów  wcho- 
dzących w skład  cząsteczki.  Mówimy  wówczas,  że 
orbitale  molekularne  przybliżone  są  przez  liniową 
kombinację  orbitali  atomowych  (LCAO  — Linear 
Combination  of  AO).  Rozwiązanie  równań  HF  z przy- 
bliżeniem (13)  — równań  KFR,  daje  wówczas  orbi- 
tale molekularne,  które  nazywa  się  orbitalami  SCF 
LCAO-MO.  Warto  dodać,  że  stosując  coraz  większą 
bazę  gdy  w wyrażeniu  (13)  m-> oo  otrzymujemy  roz- 
wiązania odpowiadające  równaniom  HF  (12).  Użycie 
bazy  nieskończonej  jest  oczywiście  niemal  niemożliwe 
(prowadzi  to  do  rozwiązywania  wyznacznika  nieskoń- 
czonego rzędu,  por.  (8)  i (9)).  Obliczenia  wykazują 
jednak,  że  użycie  dużej  skończonej  bazy  dla  małych 
układów  (np.  dla  atomów)  daje  zbliżone  wyniki  do 
rozwiązania  równań  HF  (12). 


Atomy  wietoelektronowe 

Wspominaliśmy  już  o tym,  że  użycie  przybliżenia 
jednoelektronowego  dla  układu  n elektronów  wy- 
jaśnia wiele  własności  atomów  lub  cząsteczek.  Jak 
opisujemy  w tym  przybliżeniu  atomy  wieloelektro- 
nowe?  Na  rys.  8 podano  schematyczne  przedstawie- 
nie konfiguracji  stanów  podstawowych  atomów  wo- 
doru, litu,  itd.  aż  do  neonu.  Podobne  konfiguracje 
można  zbudować  dla  pozostałych  pierwiastków  ukła- 
du okresowego.  Zanim  omówimy  krótko  charaktery- 
styczne własności  konfiguracji  elektronowych  ato- 
mów, powiemy  kilka  słów  o orbitalach  atomowych 
potrzebnych  do  określania  konfiguracji. 


Orbitale  atomowe 

Orbitale  atomowe  mogą  mieć  różną  postać  — mogą 
to  być  np.  funkcje  „podobne”  do  funkcji  (3)  atomu 
wodoru.  Tego  typu  orbitale  nazywane  są  orbitalami 
wodoropodobnymi.  Bardzo  często  używane  są  orbi- 
tale typu  Slatera  w postaci 

<Pn'lm  = Nn'rn'-1e-z'rln'a*Yim(&,  <p),  (14) 

gdzie  Nn'  jest  stałą  normalizacyjną,  n'  jest  tzw.  efek- 
tywną liczbą  kwantową  (według  reguł  Slatera  ri  — n 
dla  n = 1, 2 i 3,  ale  n'  nie  musi  być  w ogólności  liczbą 
całkowitą),  natomiast  Z'e  jest  efektywnym  ładunkiem 
jądra.  Dla  orbitali  poszczególnych  atomów  łatwo 
znajduje  się  ładunki  według  reguł,  które  podał  Slater 
(reguły  te  pominiemy,  ponieważ  nie  będziemy  z nich 
dalej  korzystać).  Część  kątowa  Yim  orbitali  Slatera 
jest  taka  sama,  jak  w funkcjach  (3). 

Orbitale  Slatera  są  tylko  przybliżonymi  orbitalami 
atomowymi,  ale  mają  bardzo  wygodną  postać  anali- 
tyczną. Najlepszymi  jednak  orbitalami  są  funkcje 
otrzymane  z rozwiązania  równań  HF  (orbitale  ato- 
mowe HF,  (pHF),  które  z kolei  nie  mają  zbyt  dogodnej 
postaci,  wyniki  bowiem  są  podane  w postaci  zbioru 
liczb  (tabel),  a nie  w postaci  funkcji  analitycznych. 
Wcześniej  już  wspominaliśmy  o zniechęcającym  spo- 
sobie przedstawiania  numerycznego  równania  (1)  dla 
funkcji  wieloelektronowej  układu.  Dla  atomu  helu 
np.,  taka  funkcja  wymagałaby  zapisania  całego  tomu, 
dla  atomu  litu  potrzebny  już  byłby  cały  księgozbiór. 
Jeśli  chodzi  o orbitale  HF  sytuacja  jest  o wiele  prost- 
sza. Do  opisu  atomu  helu  potrzebny  jest  jeden  orbi- 
tal;  numeryczne  przedstawienie  tej  funkcji  wymaga- 
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więc  np.  tabeli  z tysiącem  wartości  funkcji.  Dla  litu  atomu  jednoelektronowego  (tabela  str.  252  i rys.  4). 
musimy  znać  dwa  orbitale,  a więc  należy  podać  dwie  Ze  względu  na  to,  że  w atomach  wieloelektronowych 
podobne  tabele,  itd.  Operowanie  takimi  tabelami  na  każdy  elektron  atomu  nie  działa  już  potencjał  cen- 
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Rys  8 Konfiguracje  elektronowe  pierwszych  10  atomów  układu  okresowego  pierwiastków.  Dla  atomu  wodoru  orbital  \s  jest  ścis- 
łym rozwiązaniem  równania  (1).  Dla  pozostałych  atomów  orbitale  1j,2j  oraz  2 p są  przybliżonymi  funkcjami  jednoelektronowynu. 
W każdej  konfiguracji  uwzględniono  względne  rozmieszczenie  energetyczne  orbitali,  czyli  cu  < £s»  < £apx  = £sp„-  £tpz,  ale  me  uw- 
zględniono zróżnicowania  energetycznego  orbitali  między  różnymi  konfiguracjami  (rys.  10) 


(funkcjami)  jest  również  kłopotliwe.  Ale  postęp 
w technice  obliczeniowej  jest  bardzo  duży  i nie  tabela- 
ryzuje  się  już  funkcji  HF  dla  atomów.  Szybciej  bo- 
wiem można  taką  funkcję  obliczyć  mając  program 
obliczeniowy  na  komputer,  aniżeli  przepisać  ją 
z tablicy  bezbłędnie.  Bardzo  często  funkcje  HF  zapi- 
sane są  na  taśmach  magnetycznych,  tak  że  wykorzy- 
stanie ich  w obliczeniach  jest  proste. 

Istnieje  jeszcze  inny  sposób  postępowania.  Za  po- 
mocą liniowej  kombinacji  funkcji  typu  Slatera  (14) 
można  przybliżyć  orbitale  HF  z dowolnym  stopniem 
dokładności.  Orbital  HF  ma  wówczas  postać 

<f”F  = jj?  cn<ru 

j.i 

gdzie  (fj  oznacza  orbital  Slatera  (14)  z parametrem 
Z'  traktowanym  jako  nieznany.  E.  Clementi  pokazał, 
że  orbitale  HF  dla  atomów  od  litu  do  neonu  są  bardzo 
dobrze  przybliżone  przez  układ  9 funkcji  Slatera. 
Energie  całkowite  atomów  obliczone  w tym  przybli- 
żeniu zgadzają  się  z energiami  HF  z dokładnością  do 
0,0001  j.at.  Przybliżenie  orbitali  HF  przez  liniową 
kombinację  orbitali  atomowych  (nie  muszą  to  być 
koniecznie  orbitale  Slatera)  jest  korzystne,  gdyż  orbi- 
tale HF  są  wówczas  scharakteryzowane  przez  podanie 
małego  układu  liczb  (współczynniki  ca  oraz  np.  war- 
tości parametrów  Z'  dla  poszczególnych  orbitali  Sla- 
tera). 

Orbitale  atomowe  mają  pewną  cechę  wspólną. 
Kontury  tych  orbitali,  jak  również  kontury  gęstości 
są  bardzo  podobne  do  odpowiednich  konturów  ato- 
mu jednoelektronowego.  Dlatego  też  poszczególne 
orbitale  oznacza  się  symbolami  <p2s,  <P*p  a w 
przypadku  orbitali  Hartree’ego-Focka  dodaje  się  do- 
datkowo indeks  HF  u góry  orbitali  ®ar" 

dzo  często  skraca  się  cały  zapis,  oznaczając  orbitale 
jedynie  symbolami  ls,  2s,  2 p (2 px,  2py,  2 pz)  itd.  Tak 
więc  orbitale  atomowe  użyte  do  konstrukcji  konfigu- 
racji elektronowych  atomów  (rys.  8)  są  orbitalami 
przybliżonymi  albo  orbitalami  HF. 

Na  rys.  9 pokazano  warstwice  gęstości  poszczegól- 
nych orbitali  HF  dla  atomów  od  wodoru  do  neonu 
(w-  przypadku  wodoru  orbitale  HF  są  ścisłymi  fun- 
kcjami (3))  oraz  warstwice  całkowitych  gęstości  elek- 
tronowych dla  atomów.  Widać  wyraźnie,  że  zmie- 
niają się  rozmiary  określonych  orbitali  przy  przejściu 
od  atomu  do  atomu,  ale  zasadniczo  charakter  prze- 
strzenny jest  taki  sam,  jak  dla  odpowiednich  funkcji 


tralny,  jak  to  było  w przypadku  atomu  jednoelektro- 
nowego, energia  poszczególnych  orbitali  zależy  od 
liczby  kwantowej  n oraz  l (tzn.  np.  ^ £2<i>£3s  f 
# ezv  ź £3 d).  Dla  określonego  atomu  sekwencja 
energii  orbitalnych  jest  następująca: 

£15  < £25  < Ezp  (£2I>X  = £2 Vy  — £2pz)  < £35  < £3P  < £45  ^ 

^ £3 d itd.  Jeszcze  jedną  charakterystyczną  cechą  kon- 
figuracji elektronowych  jest  to,  że  energie  poszczegól- 
nych orbitali  ulegają  obniżeniu,  gdy  liczba  elektro- 
nów w atomie  zwiększa  się.  Widać  to  szczególnie  wy- 
raźnie na  rys.  10.  Bardzo  znacznemu  obniżeniu  ule- 
gają energie  orbitalne  £lfi.  Dla  atomu  wodoru 
eu(H)  = -0,5  j.at.  (-13,6  eV),  podczas  gdy  dla 
węgla  ei8(C ) = -11,3255  (-308,2),  a dla  azotu  i tlenu 
energie  eu  wynoszą  odpowiednio  —15,6290  (—425,3) 


liczba  porządkowa  pierwiastka  N 


Rys.  10.  Energie  orbitali  1 st  2s  i 2 p pierwszych  10  pierwiastków 
układu  okresowego  obliczone  metodą  HF  (energia  eis  = —0,5 
j.at.  = -13,6  eV  dla  atomu  wodoru  wynika  ze  ścisłego  rozwią- 
zania równania  (1).  Orbitale  typu  2 p każdego  atomu  są  potrójme 
zdegenerowane  (e*px  = «a pv  “ c*Pz) 
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większej wartości  e/a03,  a każda  następna— wartości 
2 razy  mniejszej  od  poprzedniej  aż  do  4,9-10-tya* 
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-0,5675 
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-0,6319 


-0,7299 


-0,7299 


-0,7299 


-0,8503 


-0,8503 
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z V^wia^nLerń^  i*'  miliarda  T^zy)  pierwszych  10  atomów  układu  okresowego  otrzymane  za  pomocą  kompu- 

Sm  ? ? równan  Hartree  ego-Focka.  Dla  każdego  atcmu  przedstawiono  warstwice  całkowitej  gęstości  oraz  warstwice  gęstości  poszczególnych 
elektron Z k£zde8°  orbftalu  HF  (przy  obliczaniu  całkowitej  gęstości  dokonywano  uśrednienia  sferycznego^rbitalf^p,  ponieważ 
Ry s.^oraz1 3^—3^ i *37  wg^.C^  Wah™ ^ien^ Amerfcar^ ^222  r ^ wdo^odo^ Iedst wem  “ w atomie  nic  ma  wyróżnionego  układu  współrzędnych), 
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liczba  porządkowa  pierwiastka  N 

Rys.  11.  Porównanie  doświadczalnych  wartości  potencjałów  jonizacyjnych  z wartościami  obliczonymi  metodą  HF  dla  atomów  o licz- 
bach porządkowych  od  3 do  54  (dane  liczbowe  wg  S.  Fraga  i in.,  Canad.  J.  Phys.,  51,2063  (1973)  oraz  C.  Roetti,  E. Clcmcnti,  J.  Chcm. 
Phys.  61,2062(1974) 


oraz  —20,6686  (—562,4);  pierwsze  wartości  są  wj.at., 
a w nawiasach  — w eV.  Z drugiej  strony  energie  orbi- 
talne €2s  oraz  e2p  ulegają  znacznie  słabszemu  obni- 
żeniu, np.  e2*(C)  = —0,7056  (—19,2),  e2p(C)  = 
= -0,4333  (-11,8),  e2s(N)  = -0,9453  (-25,7), 
e2p( N)  = -0,5675  (-15,4),  e2s  (O)  = -1,2443 

(-33,9),  e2p(0)  = -0,6319  (-17,2)  i są  porówny- 
walne z energią  orbitalną  e18  dla  wodoru.  Mówimy, 
że  elektrony  znajdujące  się  na  orbitalach  \s  (skróto- 
wo: elektrony  ls)  w atomach  węgla,  azotu  czy  tlenu 
są  energetycznie  znacznie  głębiej  położone  aniżeli 
elektrony  2s  czy  2 p tych  atomów.  Okaże  się  to  szcze- 
gólnie ważne  przy  omawianiu  budowy  cząsteczek. 

Orbitale  HF  dają  najlepszy  obraz  atomu  w przy- 
bliżeniu jednoelektronowym.  Na  poprzednich  stro- 
nach porównywaliśmy  wyniki  obliczeń  dla  atomu 
helu.  Użyte  orbitale  były  orbitalami  Slatera.  Według 
reguł  Slatera  dla  orbitalu  <pis  atomu  wieloelektrono- 
wego  należy  przyjąć  Z' = 1,70.  Obliczona  energia 
atomu  helu  przy  użyciu  takiej  funkcji  Slatera  jest 
rzędu  98%  energii  dokładnej  (rys.  6).  Używając  orbi- 
tali HF  (rys.  9)  obliczona  energia  wynosi  ćHF(He)  = 
—2,8617  j.at.,  co  stanowi  98,55%  energii  dokładnej. 
Jest  to  najlepszy  wynik  uzyskany  w przybliżeniu  jed- 
noelektronowym — lepszego  już  nie  można  uzyskać 
w tym  modelu,  gdyż  równania  HF  wynikają  z zasady 
wariacyjnej.  Dla  atomu  litu  energia  HF  atomu  wy- 
nosi ćIIF(Li)  = —7,4327  j.at.  (stanowi  to  99%  energii 
dokładnej  litu  —7,47807  j.at.),  a dla  atomu  berylu 
ćHF(Be)  = —14,5730  j.at.  zgadza  się  w 99,3%  z ener- 
gią dokładną.  Jak  wskazują  te  liczby,  obliczenia  Hart- 
ree’ego-Focka  dla  atomów  dają  dobre  wyniki  dla 
energii  całkowitych  atomów.  Inne  wielkości  obliczone 
tą  metodą  też  zgadzają  się  z danymi  doświadczalny- 
mi. Z rys.  11  wynika,  że  chociaż  w niektórych  wypad- 
kach obliczone  potencjały  jonizacyjne  atomów  są  niż- 
sze od  odpowiednich  wartości  doświadczalnych,  to 
jednak  teoretyczne  wyniki  doskonale  przewidują 
zmiany  wartości  potencjałów  przy  przejściu  od  atomu 
do  atomu. 


Korelacja  elektronów 

Metoda  Hartree’ego-Focka  ma  charakter  przybliżo- 
ny. Podstawą  tej  metody  jest  model  elektronów  (ogól- 
nie cząstek)  niezależnych,  w którym  każdy  elektron 
porusza  się  niezależnie  od  pozostałych.  Innymi  słowy 
prawdopodobieństwo  znalezienia  elektronu  w okre- 
ślonym obszarze  przestrzeni  nie  zależy  od  tego,  gdzie 
przebywa  drugi  elektron.  Intuicyjnie  wiemy  jednak, 
że  z powodu  odpychania  się  kulombowskiego  elek- 
tronów przebywanie  np.  dwóch  elektronów  w atomie 


helu  po  przeciwnych  stronach  jądra  powinno  być  energia 
uprzywilejowane.  Ruchy  elektronów  nie  są  nieza-  korelacji 
leżne  od  siebie,  są  one  skorelowane.  Obliczając  ener- 
gie metodą  Hartree’ego-Focka  popełniamy  błąd,  gdyż 
nie  uwzględniamy  korelacji  elektronów.  Ten  błąd 
nosi  nazwę  energii  korelacji  (Iikor)  i jest  różnicą 

£*kor  ^ £,dokł_£HFj 

gdzie  Eaokl  oznacza  dokładną  wartość  energii  dla  da- 
nego układu  otrzymaną  z rozwiązania  równania  (1) 

(lub  wartość  doświadczalną  energii  atomu  po  odjęciu 
poprawek  relatywistycznych  itp.). 

Energia  korelacji  jest  mała.  Dla  atomu  helu  wynosi 
ona  —0,042  j.at.  (ok.  1,5%  energii  dokładnej), 
a dla  litu  —0,045  j.at.  (1%  energii  dokładnej).  W ato- 
mie berylu  energia  korelacji  równa  się  —0,094  j.at., 
ale  stanowi  ona  tylko  0,7%  energii  całkowitej.  Ener- 
gia korelacji  dla  innych  atomów  jest  również  mała 
i stanowi  mniej  niż  1%  energii  dokładnej.  Bezwzględ- 
na wartość  energii  korelacji  w atomach  oczywiście 
rośnie  wraz  ze  wzrostem  liczby  elektronów  w atomie. 

Wzrost  ten  nie  jest  jednak  równomierny.  Na  przykład 
energia  korelacji  helu  i litu  oraz  neonu  i sodu  jest 
praktycznie  taka  sama,  a energia  korelacji  berylu  jest 
około  dwukrotnie  wyższa  od  energii  korelacji  litu. 

Porównanie  z konfiguracjami  tych  atomów  (rys.  8) 
wskazuje,  że  najważniejszą  rolę  odgrywa  korelacja  energia 
par  elektronów  1$2  lub  2 s2t  natomiast  korelacja  mię-  korelacji 
dzy  parą  ls2  a elektronem  2$  lub  między  parą  li 2 a konfigura- 
i parą  2s?  (np.  w berylu)  nie  ma  istotnego  znaczenia,  cja 
Gdy  przechodzimy  od  berylu  o konfiguracji  \s22s2  do 
innych  atomów  zapełniając  orbitale  2 ,pt  energia 
korelacji  wzrasta.  Wzrost  ten  związany  jest  ze  zbliżo- 
nymi energiami  orbitali  2s  i 2 p oraz  z efektami  de- 
generacji orbitali  2 p.  Wyjaśnienie  tych  spraw  wyma- 
gałoby jednak  szerszej  dyskusji. 

Zwróćmy  jeszcze  uwagę  na  fakt,  że  energie  korela- 
cji dla  jonu  Li+  oraz  atomu  Li  są  praktycznie  takie 
same,  a stanie  się  jasne,  dlaczego  obliczony  potencjał 
jonizacyjny  litu  za  pomocą  metody  Hartree’ego-Focka 
(rys.  11)  jest  w bardzo  dobrej  zgodności  z doświad- 
czeniem. Zgodnie  z definicją  potencjału  powinniśmy 
odejmować  od  energii  dokładnej  Li+  energię  dokład- 
ną Li.  Ale  Edoki( Li+)  = ćHF(Li+)-f Ekor(Li+)  oraz 
EAoM(Li)  = ćHF(Li)+£’kor(Li),  a ponieważ  energie 
korelacji  Li+  i Li  są  takie  same,  więc  Edokł(Li+)  — 

-Edokł(Li)  = ćHF(Li+)-ć'HF(Li).  Tak  więc,  odej- 
mując dwie  przybliżone  liczby  (energie  HF)  otrzy- 
maliśmy potencjał  jonizacyjny  w bardzo  dobrej 
zgodności  z doświadczeniem,  ponieważ  przy  odejmo- 
waniu skasowały  się  błędy  (energie  korelacji).  Podob- 
na sytuacja  występuje  dla  sodu  (liczba  porządkowa 
1 1)  i jego  jonu  oraz  dla  potasu  (liczba  porządkowa  19) 
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i jego  jonu,  natomiast  dla  innych  atomów  już  nie, 
ponieważ  energia  korelacji  atomu  nie  jest  na  ogół 
równa  energii  korelacji  jego  jonu. 

W jaki  sposób  można  uzyskać  lepsze  wyniki  aniżeli 
uzyskiwane  metodą  Hartree’ego-Focka  ? Należy  wyjść 
poza  przybliżenie  jednoelektronowe  i uwzględnić 
korelacje  elektronów.  Można  to  zrobić  kilkoma  spo- 
sobami — omówimy  tutaj  tylko  jeden,  tzw.  metodę 
oddziaływania  konfiguracji  (metoda  CI — Configu - 
metoda  Cl  ration  Interaction). 


Metoda  oddziaływania  konfiguracji 

Omawialiśmy  poprzednio  konfiguracje  podstawowe 
układu  elektronów.  Ale  można  oczywiście  dla  każ- 
dego układu  elektronów  przyporządkować  orbitale, 
które  nie  są  obsadzone  przez  elektrony  konfiguracji 
podstawowej ; pozwala  to  zbudować  tzw.  konfiguracje 
konfiguracje  wzbudzone  układu  (rys.  12).  Każda  z konfiguracji 
wzbudzone  opisana  jest  funkcją  mającą  postać  wyznacznika  (lub 
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Rys.  12.  Konfiguracja  podstawowa  i kilka  konfiguracji  wzbudzo- 
nych atomu  helu.  Pierwsze  cztery  konfiguracje  są  singletami, 
ostatnia  konfiguracja  jest  trypletem 


sumy  wyznaczników)  postaci  (11).  Jeżeli  znamy  postać 
orbitali  dla  konfiguracji  podstawowej  (np.  mogą  to 
być  orbitale  wyznaczone  metodą  HF)  oraz  dla  kon- 
figuracji wzbudzonych,  wówczas  możemy  szukać  fun- 
kcji próbnej  opisującej  układ  elektronów  w postaci 
(por.  wzór  8): 

m 

0pr  = £ AP0P, 

J>  = 1 

gdzie  <t>p  jest  funkcją  opisującą  różne  konfiguracje. 
Okazuje  się,  że  dla  m = oo  za  pomocą  powyższego 
rozwinięcia  można  wyrazić  funkcję  dokładną  dane- 
go układu.  Oczywiście  w praktyce  bierze  sięskończo- 


Energie  atomów  helu  i berylu  obliczone  metodą  Hartre- 
e’ego-Focka  i metodą  oddziaływania  konfiguracji 


Liczba  konfiguracji 

Energia,  j.at. 

Błąd,  j.at. 

HEL 

1 (HF) 

-2,8617 

-0,0421 

20  (Cl) 

-2,9028 

-0,0009 

35  (CI) 

-2,9032 

-0,0005 

wartość  dokładna 

-2,9037 

— 

BERYL 

1 (HF) 

-14,573 

-0,094 

2 (Cl) 

-14,617 

-0,050 

55  (CI) 

-14,661 

-0,006 

wartość  dokładna 

- 14,667 

- 

porównanie  ną  sumę  (skończoną  liczbę  konfiguracji),  a współczyn- 
wyników  niki  Ap  oblicza  się  metodą  Ritza.  Uzyskana  funkcja 
metod  H F falowa  jest  tym  lepsza  od  funkcji  Hartree’ego-Foc- 
i Cl  ka,  im  więcej  uwzględnia  się  konfiguracji  wzbudzo- 
nych. W tabeli  podano  przykładowo  wyniki  dla  helu 
i berylu  uzyskane  metodą  HF  oraz  metodą  CI. 

Metoda  oddziaływania  konfiguracji  wyraźnie  pod- 
kreśla przybliżony  charakter  pojęcia  konfiguracji 
elektronowej  atomu.  Na  przykład  dla  atomu  berylu 
przy  użyciu  funkcji  falowej  będącej  kombinacją  linio- 
wą dwóch  konfiguracji  l.?22.y2  oraz  ls*2p*  otrzymuje 
się  energię  stanu  podstawowego  atomu  znacznie  lep- 
szą niż  metodą  HF.  Z drugiej  strony,  ze  współczynni- 
ków rozwinięcia  wynika,  że  konfiguracja  1j22s2  wy- 
stępuje ze  współczynnikiem  Ax  = 0,95,  natomiast 
konfiguracja  \s22pz  ze  współczynnikiem  = 0,31. 
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Współczynniki  te  oczywiście  zmieniają  się  w przypad- 
ku użycia  większej  liczby  konfiguracji.  Jak  więc  widać, 
model  jednoelektronowy  (tzn.  przypisanie  elektro- 
nów określonym  orbitalom)  jest  przybliżonym,  ale 
bardzo  użytecznym,  opisem  rzeczywistej  sytuacji. 


Podstawy  spektroskopii 
molekularnej 


W równaniu  Schrodingera  (1)  opisującym  dowolny 
układ  chemiczny,  np.  cząsteczkę,  elektrony  i jądra 
układu  są  traktowane  w ten  sam  sposób.  Jednakże 
masa  najlżejszego  jądra  (protonu)  jest  przeszło  1800 
razy  większa  niż  masa  elektronu.  Dlatego  też  jądra 
w cząsteczce  poruszają  się  znacznie  wolniej  niż  elek- 
trony; fakt  ten  jest  przyczyną  wielu  istotnych  włas- 
ności cząsteczek. 


Rozdzielenie  ruchu  elektronów  i jąder 

Różnice  pomiędzy  ruchem  jąder  i ruchem  elektronów 
cząsteczki  powodują,  że  jej  stany  energetyczne  można 
opisać  w pewien  przybliżony  sposób.  Można  poka- 
zać mianowicie,  że  równanie  Schrodingera  (1)  opi- 
sujące dowolną  cząsteczkę  można  zastąpić  układem 
dwóch  równań 

Hciyel  = Eeiycl  (16a) 

(W+E*)W  = EW.  (16a') 

Pierwsze  równanie,  zwane  elektronowym  równaniem  elektronowe 
Schrodingera,  opisuje  ruch  elektronów  cząsteczki  równanie 
w polu  nieruchomych  jąder.  Hamiltonian  elektrono-  Schrodingera 
wy  Hcl  składa  się  z energii  kinetycznej  wszystkich 
elektronów,  energii  oddziaływania  elektronów  z nie- 
ruchomymi jądrami,  energii  oddziaływania  elektro- 
statycznego pomiędzy  elektronami  oraz  z wyrazu 
opisującego  elektrostatyczne  oddziaływanie  pomię- 
dzy jądrami  (stały  wyraz  w przypadku  nieruchomych 
jąder).  Równanie  elektronowe  rozwiązuje  się  dla  róż- 
nych ustalonych  położeń  jąder  cząsteczki.  Funkcje 
elektronowe  9/el  oraz  energie  Ecl  zależą  więc  parame- 
trycznie od  położeń  jąder. 

Drugie  równanie  opisuje  ruch  jąder,  na  które 
działa  potencjał  Eel  pochodzący  od  elektronów. 

Hamiltonian  W jest  operatorem  energii  kinetycznej 
wszystkich  jąder  cząsteczki. 

Z postaci  równań  (16)  i (16a')  wynika,  że  nie  są  to 
równania  niezależne  od  siebie.  Wprawdzie  pierwsze 
równanie  można  rozwiązać  nie  znając  rozwiązania 
drugiego  równania,  ale  nie  odwrotnie.  Rozwiązania 
równań  (16)  związane  są  z rozwiązaniem  równania 
(1)  w prosty  sposób: 

R)  = ^i(7;  R)W(R). 

E = E*l(R)+EK  (17) 

Przez  podanie  r i R jako  argumentów  funkcji  falowych 
zaznaczono  tutaj  bezpośrednią  ich  zależność  od  zbioru 
wektorów  opisujących  położenia  wszystkich  elektro-  przybliżenie 

nów  (r)  i wszystkich  jąder  ( R );  występowanie  R , Borna- 
jako  argumentu  w Eel  oznacza,  że  energia  elektrono-  Oppenhei- 
wa  cząsteczki  zależy  parametrycznie  od  położeń  mera  (BO) 
jąder.  Przyjęcie  funkcji  falowej  i energii  w postaci 
(17)  nosi  nazwę  przybliżenia  Borna-Oppenheimera 
(przybliżenie  BO).  Jest  to  najczęściej  stosowane 
przybliżenie  przy  opisie  własności  cząsteczek.  Nie- 
kiedy (ale  bardzo  rzadko)  stosuje  się  przybliżenie  adia- 
batyczne— do  potencjału  Eel  ( R ) w (17)  i w rów- 
naniu (16a')  dodaje  się  poprawkę  uwzględniającą  drob- 
ny wpływ  ruchu  jąder  na  ruch  elektronów.  Poprawkę  przybliżenie 
tę  można  obliczyć,  jeśli  znamy  funkcję  falową  opi-  adiabatyczne 


sującą  układ  elektronów  cząsteczki  w przybliżeniu 
BO.  Poprawkę  adiabatyczną  oblicza  się  jednak  tylko 
w nielicznych  przypadkach,  gdyż  jest  ona  bardzo 
mała.  Na  przykład  dla  cząsteczki  wodoru  poprawka 
adiabatyczna  do  energii  dysocjacji  cząsteczki  jest 
rzędu  0,01%  tej  energii.  Jeszcze  mniejsze  znaczenie 
mają  efekty  nieadiabatyczne.  Należałoby  je  uwzględ- 
nić np.  w obliczeniach,  w których  jest  potrzebna 
wysoka  dokładność  wyników. 

cząsteczka  Zajmijmy  się  teraz  równaniem  elektronowym  (16a). 
dwuatomowa  Dla  uproszczenia  za  podstawę  rozważań  weźmiemy 
cząsteczkę  dwuatomową,  choć  uogólnienie  rozważań 
na  cząsteczki  wieloatomowe  nie  sprawia  żadnego 
kłopotu.  Jak  wspomnieliśmy  już  poprzednio,  aby 
opisać  ruch  elektronów  w cząsteczce  należy  rozwią- 
zać równanie  elektronowe  dla  ustalonych  położeń 
jąder  cząsteczki.  Niestety,  jak  wiadomo,  nie  można 
uzyskać  ścisłego  rozwiązania  w postaci  analitycznej 
dla  układu  większego  niż  jednoelektronowy.  Roz- 
wiązanie równania  elektronowego  znajdujemy  więc 
stosując  metody  przybliżone  chemii  kwantowej 
(przeważnie  metodę  wariacyjną).  Równanie  to  ma 
wiele  rozwiązań — jest  nim  zbiór  funkcji  falowych 

^i(r;  £)  oraz  zbiór  odpowiadających  im  energii 

Eg(R).  Indeks  n numeruje  poszczególne  stany  cząste- 
czek (w  ogólności  n jest  tylko  indeksem  i nie  ma  nic 
wspólnego  z główną  liczbą  kwantową  dla  atomów 
jednoelektronowych).  Umówimy  się,  że  stan  podsta- 
wowy oznaczać  będziemy  indeksem  n — 0,  a stany 
wzbudzone  numerować  będziemy  kolejnymi  liczbami 


Rys.  1 3.  Schematyczne  przedstawienie  zależności  energii  od 
odległości  między  jądrowej  R dla  kilku  stanów  elektronowych 
cząsteczki  dwuatomowej  (krzywe  energii  potencjalnej).  Eg — 
energia  stanu  podstawowego  cząsteczki  (cząsteczka  stabilna),  /fmin 
odległość  międzyjądrowa,  przy  której  występuje  minimum  energii 
elektronowej  stanu  podstawowego;  2T*1 , E*  — energie  elektro- 
nowe odpowiednio  niestabilnego  i stabilnego  stanu  wzbudzonego 
cząsteczki 

całkowitymi.  Typowe  Wykresy  Eg  ( R ) dla  stanu  pod- 
stawowego oraz  dla  kilku  stanów  wzbudzonych 
cząsteczki  dwuatomowej  są  przedstawione  na  rys.  13. 
Wykresy  te  nazywane  są  krzywymi  energii  potencjal- 
nej. Należy  pamiętać,  że  mamy  nieskończoną  liczbę 
stanów  elektronowych  cząsteczki,  ale  w praktyce 
krzywe  ograniczamy  się  tylko  do  rozważania  stanu  podsta- 
energii  wowego  i kilku  najniżej  leżących  stanów  wzbudzo- 
potencjalnej  nych.  Kształt  krzywej  energii  potencjalnej  ukazującej 
zmianę  energii  jE®1  jako  funkcji  odległości  między- 
jądrowej  jest  jedną  z najbardziej  charakterystycznych 
właściwości  struktury  cząsteczki.  Stabilność  cząsteczki 
jest  uwarunkowana  faktem  występowania  względ- 
nego minimum  funkcji  Eg.  Każdej  wartości  Eg  dla 
określonej  odległości  międzyjądrowej  odpowiada 
funkcja  falowa  Wg,  która  jest  przedstawiona  w po- 
staci numerycznej.  Uogólnienie  pojęcia  krzywych 
energii  potencjalnej  podanych  na  rys.  13  w stosunku 
do  cząsteczki  wieloatomowej  jest  bardzo  proste. 
Dla  cząsteczki  dwuatomowej  funkcje  Eg  są  zależne 


od  jednego  parametru  — odległości  międzyjądrowej  cząsteczka 
R.  Dla  cząsteczki  wieloatomowej  należy  uwzględnić  wieloatomo- 
wszystkie  parametry  wyznaczające  względne  położę-  wa 
nia  jąder  cząsteczki  (zbiór  tych  parametrów  oznacza- 
my nadal  symbolem  R).  Energie  JEg1  ( R ) cząsteczki 
wieloatomowej  są  funkcjami  wieloparametrowymi  — 
są  to  powierzchnie  energii  potencjalnej  w przestrzeni 
wielowymiarowej.  Przedstawienie  graficzne  tych  krzy- 
wych dla  cząsteczek  wieloatomowych  jest  niemożli- 
we. Nie  przeszkadza  to  zupełnie  w dyskusji  stanów 
elektronowych  cząsteczek  złożonych  posługiwać  się 
krzywymi  przedstawionymi  na  rys.  13. 

Oscylacje  i rotacje  cząsteczek 

W przypadku  cząsteczek  dwuatomowych  — w sposób 
ścisły,  a dla  cząsteczek  wieloatomowych  — z bardzo 
dobrym  przybliżeniem,  równanie  (16ar)  opisujące  ru- 
chy jąder  cząsteczki  rozbija  się  na  dwa  równania 
postaci 

Hr ot(#,  <p)  ^rot(^>  = £rot  |PjOt(0,  <p)y  (1 6b) 

(tfoscW  f £elW  + Er°t)  «Posc(£)  = E„vJ  M 

(16c) 

gdzie  W = Hrot  -f  //osc,  W = ^roty/osc 

oraz  E * — £rot-f  £osc. 

W równaniach  powyższych  kąty  # oraz  y charakte- 
ryzują położenie  cząsteczki  podczas  obrotu.  Pierwsze 
z powyższych  równań  (zapisane  tutaj  w postaci  sym- 
bolicznej) opisuje  ruch  obrotowy  (rotację)  cząsteczki 
dwuatomowej  i jest  bardzo  dobrze  znane  matematy- 
kom. Rozwiązaniem  tego  równania  są  funkcje  kąto- 
we takiej  samej  postaci,  jak  dla  atomu  wodoru,  por. 
wzór  (3).  Ze  względu  na  tradycję,  w przypadku  ruchu 
rotacyjnego  zamiast  używania  indeksu  l jak  w (3), 
wprowadza  się  liczbę  kwantową  Jy  określającą  stany  liczba  _ 
rotacyjne  cząsteczki.  Oczywiście,  tak  jak  liczba  /,  rotacyjna  J 
liczba  rotacyjna  / może  przyjmować  wartości  / = 0, 1 , 

2,....  Energie  poszczególnych  stanów  rotacyjnych 
y/rot  wynoszą  JE™1  = BJ  (7+1),  gdzie  B jest  tzw. 
stałą  rotacyjną. 

Równanie  (16c)  opisuje  ruch  związany  ze  zmianą 
współrzędnej  R — opisuje  więc  ono  oscylacje  jąder 
cząsteczki  zachodzące  w polu  sił  o potencjale  równym 
sumie  potencjału  elektronowego  Eg  dla  różnych  sta- 
nów oraz  członu  rotacyjnego  zależącego  od  rotacyjnej 
liczby  kwantowej  J.  Dla  danych  n oraz  J równanie 
(16c)  ma  wiele  rozwiązań,  które  rozróżniamy  wskaźni- 
kiem v.  Dlatego  też  w (16c)  funkcje  falowe  oraz  stan 
energie  E zostały  oznaczone  trzema  wskaźnikami  elektronowy, 
nt  v , J oznaczającymi  odpowiednio  stan  elektro-  oscylacyjny 
nowy,  oscylacyjny  i rotacyjny.  i rotacyjny 

Równania  (16a),  (16b)  oraz  (16c)  mają  zasadnicze 
znaczenie  dla  spektroskopii  molekularnej.  Rozwiązu- 
jąc układ  tych  równań  znajdujemy  układ  poziomów 
energetycznych  cząsteczki  i odpowiadające  im  funkcje 
falowe;  możemy  więc  znaleźć  różnice  pomiędzy  ener- 
giami poziomów  energetycznych  (różnice  te  są  mie- 
rzone w doświadczeniu),  jak  również  potrafimy  obli- 
czyć prawdopodobieństwa  przejść,  czy  też  określić 
reguły  wyboru  dla  określonych  typów  przejść. 

Z równań  (16aM16c)  wynika,  że  w przybliżeniu 
funkcja  falowa  cząsteczki  Y — ^cl  ¥/osc  ^rot,  na- 
tomiast jej  energia  wynosi  E = Eel-\-Eosc-\-Erot. 

Określając  stan  energetyczny  cząsteczki  musimy  więc 
oprócz  podania  stanu  elektronowego  określić  jej 
stan  oscylacyjny  oraz  stan  rotacyjny.  Na  rys.  14 
przedstawiono  schemat  diagramu  poziomów  ener- 
getycznych cząsteczki  dwuatomowej  (rysunek  ten 
można  traktować  oczywiście  jako  uogólniony  dia- 
gram poziomów  energetycznych  dla  cząsteczki  wielo- 
atomowej). 

Spektroskopia  molekularna  zajmuje  się  badaniem 
oddziaływań  pomiędzy  materią  (cząsteczki)  a promie- 
niowaniem elektromagnetycznym.  Używając  pomia- 
rowych technik  absorpcyjnych  lub  emisyjnych  wy- 
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różnice  znaczamy  różnice  energii  pomiędzy  różnymi  stanami 
energii  mię-  cząsteczki.  Jak  widać  z rys.  14  różnice  energii  pomię- 
dzy stanami  dzy  stanami  elektronowymi  są  dużo  większe  aniżeli 
różnice  pomiędzy  stanami  oscylacyjnymi  określonego 
stanu  elektronowego,  a te  z kolei  są  większe  niż 
różnice  pomiędzy  poziomami  rotacyjnymi.  Typowe 
różnice  wartości  energii  wynoszą:  dla  przejść  rota- 
cyjnych od  0,001  do  0,01  eV,  dla  przejść  oscylacyjnych 
od  0,05  do  0,2  eV,  dla  przejść  elektronowych  od  2 do 


Rys.  14.  Poziomy  energetyczne  cząsteczki  dwuatomowej.  Krzywe 
energii  potencjalnej  wykreślone  są  dla  elektronowego  stanu  pod- 
stawowego E0  oraz  dla  pierwszego  stanu  wzbudzonego  Ex.  Przed- 
stawiono kilka  stanów  oscylacyjnych  oraz  kilka  stanów  rotacyj- 
nych dla  poziomów  oscylacyjnych  v = 0,  v = 1 oraz  dla  v'  = 4. 
Dla  trzech  typów  przejść  użyto  różnych  skal  energetycznych.  Na 
prawo  pokazano  ten  sam  układ  poziomów  energetycznych,  ale 
bez  krzywych  energii  potencjalnej  — poziomy  oraz  Ej  odpo- 
wiadają położeniu  minimum  odpowiednich  krzywych 


Rys.  15.  Dwa  różne  sposoby  przedstawiania  stanów  energetycz- 
nych złożonej  cząsteczki.  W przybliżeniu  nierelatywi stycznym 
każdy  stan  ma  określoną  multipletowość  zależną  od  wzajemnego 
ukierunkowania  spinów  elektronów  cząsteczki  (zob.  rys.  12).  Dla 
cząsteczek  o parzystej  liczbie  elektronów  elektronowy  stan  pod- 
stawowy jest  stanem  singletowym  ( S0 ).  Na  schemacie  zaznaczono 
po  dwa  wzbudzone  stany  singletowe  ( Slt  SJ  i tryple  to  we  (7\,  Tz). 
Symboli  Sn  i Tn  używa  się  zamiast  funkcji  falowych  !Pcl  określa- 
jących poszczególne  stany  elektronowe  cząsteczki.  Dla  trzech 
stanów  S0t  Sj  i Tj  zaznaczono  w kółkach  kierunki  spinów  dwóch 
elektronów  położonych  najwyżej  energetycznie  w konfiguracji 
elektronowej  opisującej  dany  stan  cząsteczki  — linie  poziome 
oznaczają  orbitale  molekularne.  Połowa  pozostałych  elektronów 
w każdym  ze  stanów'  ma  spiny  skierowane  przeciwnie  do  spinów 
drugiej  połowy  elektronów.  Z obliczeń  kwantowych  wynika,  że 
dwa  stany  opisane  konfiguracjami  różniącymi  się  tylko  kierun- 
kiem spinów  (np.  stany  S,  i Tx ) mają  różną  energię.  W wypadku 
stanów  singlctowych  i trypletowych  zawsze  ten  ostatni  stan  ma 
niższą  energię  aniżeli  odpowiadający  mu  stan  singlctowy.  Każ- 
demu stanowi  elektronowemu  odpowiada  układ  stanów  oscyla- 
cyjnych 
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5 eV.  Jak  widać,  różne  typy  przejść  obserwuje  się  podział 
w różnych  częściach  widma  elektromagnetycznego,  spektroskopii 
Rozróżniamy  dlatego  m.in.  spektroskopię  mikro- 
falową, podczerwieni  oraz  światła  widzialnego  i nad- 
fioletu. Podział  ten  oczywiście  nie  wyczerpuje  wszyst- 
kich możliwości  technicznych.  Istnieje  dziedzina 
zwana  spektroskopią  ramanowską  (badanie  widm 
oscylacyjnych  w obszarze  widzialnym  i nadfioletu). 

Ściśle  ze  spektroskopią  molekularną  wiążą  się  spek- 
troskopia magnetycznego  rezonansu  jądrowego  oraz 
spektroskopia  elektronowego  rezonansu  spinowego 
(->  Spektroskopia  rezonansów  magnetycznych). 

Dla  dużych  cząsteczek,  kiedy  zahamowana  jest  ich 
rotacja  (szczególnie  gdy  cząsteczki  znajdują  się  w roz- 
tworze lub  w ośrodku  sztywnym)  na  schemacie  pozio- 
mów energetycznych  podawane  są  tylko  stany  elek- 
tronowe i stany  oscylacyjne  (rys.  -15).  Aby  okreś- 
lić stan  takiej  złożonej  cząsteczki,  należy  oprócz 
podania  funkcji  falowej  określającej  stan  elektrono- 
wy (rozwiązanie  równania  16a)  podać  funkcję  fa- 
lową ¥/osc  opisującą  określony  stan  oscylacyjny  cząs- 
teczki. Innymi  słowy,  w przypadku  pominięcia  rotacji, 
należy  znać  rozwiązanie  równań  (16a)  i (16c).  Aby 
podać  rozwiązanie  tego  ostatniego  równania,  należy 
przede  wszystkim  2nać  energię  E^1  (R).  Dla  cząsteczki 
dwuatomowej  należy  podać  przebieg  krzywej  energii 
potencjalnej  (rys.  13).  Postać  tej  funkcji,  jak  już 
wspomnieliśmy  poprzednio,  jest  nieznana.  Stosuje  się 
jednak  wiele  uproszczeń  opisujących  przebieg  takich 
krzywych. 


Oscylator  harmoniczny 

W przypadku  cząsteczki  dwuatomowej  najprostszym  cząsteczka 
przybliżeniem  funkcji  energii  Eg(R)  jest  parabola  dwuatomowa 
postaci  V(R)  = l/2k(R— Rmm)2,  gdzie  k jest  tzw. 
stalą  siłową  charakteryzującą  siły  powstające  w cząs- 
teczce przy  przesunięciu  jąder  z ich  położenia  równo- 
wagi Rmin.  Założenie  to  jest  równoważne  przyjęciu, 
że  jądra  drgają  ruchem  harmonicznym  (jest  to  przy- 
padek tzw.  oscylatora  harmonicznego).  Rozwiązanie 
równania  (16c)  dla  tego  przypadku  jest  bardzo  do- 
brze znane.  Funkcje  własne  charakteryzujące 

poszczególne  stany  oscylacyjne  cząsteczki,  mają  po- 
stać analityczną  (nie  będziemy  podawali  tutaj  tych 
funkcji,  ale  przebieg  ich  dla  kilku  stanów  oscylacyj- 
nych pokazany  jest  na  rys.  16),  a wartości  własne 
£osc  wynoszą 

£?c  = Mt>+72),  (18) 

gdzie  v jest  częstością  oscylacji,  natomiast  v jest  oscy- 
lacyjną liczbą  kwantową  (v  = 0,  1,  2,...).  Model 


odległość  międzyjądrowa  R odległość  międzyjądrowa  R 


Rys.  16.  Porównanie  energii  cząsteczki  dwuatomowej  i oscyla- 
tora harmonicznego:  a)  poziomy  energetyczne  i przebieg  odpo- 
wiednich funkcji  falowych  oscylatora  harmonicznego,  b)  krzywa 
energii  potencjalnej  cząsteczki  dwuatomowej 


oscylatora  harmonicznego  opisuje  w dobrym  przy- 
bliżeniu tylko  najniższe  stany  oscylacyjne  cząsteczki. 
Związane  jest  to  z faktem,  że  parabola  V(R)  jest  do- 
brym przybliżeniem  dla  krzywej  Eel(R)  tylko  w pobli- 
żu jej  minimum.  W rzeczywistości  drgania  oscylacyjne 
w cząsteczce  są  anharmoniczne.  Anharmoniczność  ta 
powoduje,  że  odstępy  pomiędzy  poziomami  oscyla- 
cyjnymi cząsteczki  dwuatomowej  maleją  ze  wzrostem 
pobudzenia,  podczas  gdy  w oscylatorze  harmonicz- 
nym są  one  stałe  (rys.  16). 


Rys.  17.  Schematyczne  przedstawienie  trzech  stanów  energetycz- 
nych złożonej  cząsteczki  (zob.  rys.  15)  z zaznaczonymi  kształtami 
funkcji  oscylacyjnych  (funkcje  oscylacyjne  zaznaczono  tylko  dla 
dwóch  najniższych  stanów  oscylacyjnych  oraz  dla  stanu  oscyla- 
cyjnego o dużej  wartości  liczby  kwantowej  r).  Natężenie  różnych 
przejść  między  stanem  podstawowym  S0  i stanem  wzbudzonym 
(np.  5j)  jest  m.in.  proporcjonalne  do  kwadratu  całki  nakrywania 
odpowiednich  stanów  oscylacyjnych.  Na  przykład,  dla  sytuacji 
przedstawionej  na  rysunku  przejście 
v = 0 — *■  v"  « 1"  jest  silniejsze  niż  przejście 
v = 0 •—>  v " — 0",  ponieważ 

j*r  *&*>  j*r 

Ważną  konsekwencją  wzoru  (18)  jest  to,  że  dla 
v = 0 energia  oscylacyjna  2łJ®«  = 7a hv  i cząsteczka 
nie  może  nigdy  mieć  energii  całkowitej  odpowiadają- 
cej minimalnej  wartości  Eel(R)  dla  R — Rmin- 
cząsteczka  Rozważania  dotyczące  cząsteczki  dwuatomowej  mo- 
wieio-  żna  rozszerzyć  na  cząsteczki  wieloatomowe  (rys.  17). 
atomowa  Cząsteczka  złożona  z N jąder  posiada  3N—  6 drgań 
podstawowych  (lub  3 AT—  5 drgań  w przypadku 


Rys.  18.  Krzywa  energii  potencjalnej  cząsteczki  dwuatomowej 
w stanie  podstawowym.  Zaznaczono  energię  wiązania  i energię 
dysocjacji 


cząsteczki  liniowej)  i w przybliżeniu  każde  z tych 
drgań  można  opisać  równaniami  oscylatora  harmo- 
nicznego. Tak  więc  całkowita  energia  oscylacyjna 
cząsteczki  jest  sumą  energii  poszczególnych  oscyla- 

3A’-6 

torów  harmonicznych,  tzn.  Eosc  = £ hvi(vt  -f  V*). 

<~i 

Model  oscylatora  harmonicznego  można  użyć  do 
przybliżonego  opisu  oscylacji  stanu  podstawowego 
cząsteczki,  jak  również  do  opisu  oscylacji  jej  stanów 
wzbudzonych.  Pozwala  to  wyjaśnić  wiele  jakościo- 
wych właściwości  widm  elektronowych  złożonych 
układów  (np.  różnice  w natężeniu  pasm  oscylacyjnych 
widma  elektronowego). 


Cząsteczka  H2 


Zanim  zaczniemy  omawiać  zastosowania  metod  che- 
mii kwantowej  do  opisu  właściwości  cząsteczek,  po- 
święcimy kilka  słów  cząsteczce  wodoru.  Cząsteczka  ta 
zajmuje  szczególne  miejsce  w mechanice  kwantowej 
atomów  i cząsteczek.  Jest  ona  najprostszą  cząsteczką 
zawierającą  dwa  elektrony,  nic  więc  dziwnego,  że 
mimo  iż  nie  można  było  dla  niej  znaleźć  ścisłego  roz- 
wiązania równania  Schródingera,  od  początku  pow- 
stania chemii  kwantowej  usiłowano  obliczyć  w sposób 
przybliżony  jej  energię  wiązania  (rys.  18).  Zagadnie-  energia 
niu  temu  poświęcono  wiele  prac,  uzyskując  teoretycz-  wiązania 
ne  wielkości,  które  mniej  lub  bardziej  zgadzały  się 
z doświadczalną  wartością  energii  wiązania  wynoszą- 
cą 4,75  eV.  Już  w 1933  r.  H.M.  James  i A.S.  Coolidge 
wykonali  obliczenia  dla  cząsteczki  wodoru  używając 
funkcji  falowej  typu  (8),  gdzie  funkcje  xp  zawierały 
wielomiany  postaci  (zob.  oznaczenia  na  rys.  19): 

Jest  to  szereg  potęgowy  pomnożony  przez  czynnik 
wykładniczy  zależny  od  nieznanego  parametru  a. 


Rys.  19.  Oznaczenia  położeń  elektronów  1 i 2 oraz  jąder  a i b 
w cząsteczce  wodoru.  Zamiast  współrzędnych  kartezjańskich  ra 
lub  r&  można  użyć  współrzędnych  eliptycznych 

- ra  + rb  r*—ri> 

i = — — oraz  t)  = — b — 


Oczywiście  w wyrażeniu  (8)  bierze  się  pod  uwagę 
skończoną  liczbę  wyrazów,  a współczynniki  cv  oraz 
parametr  a wyznacza  się  wariacyjnie.  Im  więcej  wyra- 
zów będzie  występowało  w rozwinięciu  funkcji  (8), 
tym  uzyskane  wyniki  będą  dokładniejsze. 

James  i Coolidge  stosując  1 3-członowe  rozwinięcie 
funkcji  falowej  (8)  uzyskali  dla  energii  wiązania 
wartość  4,72  eV,  zgadzającą  się  dobrze  z wynikiem 
doświadczalnym. 

Interesowano  się  jednak  wykonaniem  bardziej  do- 
kładnych obliczeń,  które  umożliwiłyby  zbadanie  sto- 
sowalności praw  mechaniki  kwantowej  dla  układów 
cząsteczkowych  (m.in.  można  byłoby  sprawdzić  sto- 
pień dokładności  szeregu  przybliżeń  stosowanych 
w chemii  kwantowej). 

Obliczenia  tego  typu  stały  się  dopiero  możliwe 
po  pojawieniu  się  w pracowniach  naukowych  kompu- 
terów. W 1959  r.  W.  Kolos  i C.C.J.  Roothaan,  roz- 
szerzając obliczenia  Jamesa  i Coolidge’a  i stosując 
40-członowe  rozwinięcie,  uzyskali  energię  wiązania 
De  = 38  286,9  cm-1,  a w kilka  miesięcy  później 


wynik 
Jamesa 
i Coo!idge'a 


wynik 
Kolosa 
i Roothaana 
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pomiar  Herzberg  i Monfils  zmierzyli  dokładniej  wartość  tej 
Herzberga  energii  uzyskując  De  = 38  287,0±0,8  cm-1.  Pomiary 
i IV!!onf<łsa  energii  wiązania,  jak  również  jej  obliczona  wartość 
były  tak  dokładne,  że  podanie  wartości  De  w „dużych 
jednostkach”  jakimi  są  jednostki  atomowe  energii 
(1  j.at.  energii  ^ 2,19  105  cm-1)  czy  elektronowolty 
(I  eV  x 8 103  cm"1)  nie  jest  celowe. 

Jak  widać,  wartość  teoretyczna  i doświadczalna 
prawie  idealnie  zgadzały  się  ze  sobą.  Była  to  jednak 
zgodność  pozorna.  Należało  oczekiwać,  że  energię 
wiązania  można  obliczyć  jeszcze  dokładniej  przy 
użyciu  lepszej  funkcji  próbnej  (zawierającej  więcej 
parametrów  wariacyjnych),  aniżeli  ta,  którą  użyto 
w 1959  r.  Nieznane  były  różnego  rodzaju  poprawki, 
np.  poprawki  relawistyczne  wynikające  z zależności 
masy  od  prędkości,  czy  też  poprawki  promieniste 
związane  z oddziaływaniem  pomiędzy  naładowanymi 
cząstkami.  Nie  znano  dokładnie  poprawek  adiaba- 
tycznych na  ruch  jąder,  ani  poprawek  wynikających 
z efektów  nieadiabatycznych.  Zastrzeżenie  budziło 
też  porównywanie  teoretycznej  i doświadczalnej 
energii  wiązania,  gdyż  ta  ostatnia  wielkość  nie  jest 
bezpośrednio  mierzalna.  Należało  raczej  obliczyć 
bardzo  dokładnie  krzywą  energii  potencjalnej,  a na- 
stępnie należało  obliczyć  energię  najniższego  poziomu 
oscylacyjnego,  a tym  samym  energię  dysocjacji.  Do- 
piero tak  obliczoną  wartość  D0  można  porównać 
z bezpośrednio  mierzoną  wartością  energii  dysocjacji 
cząsteczki. 

obliczenia  Obliczenia  takie  przeprowadzili  W.  Kołos  (Uniwer- 
Kołosa  i sytet  Warszawski)  oraz  L.  Wolniewicz  (Uniwersytet 
Woiniewicza  Mikołaja  Kopernika  w Toruniu)  w czasie  pobytu 
na  University  of  Chicago.  Po  opracowaniu  specjalnego 
programu  obliczeniowego,  korzystając  z 80-człono- 
wego  rozwinięcia  funkcji  falowej  (8)  uzyskali  wyniki, 
które  przedstawiono  w tabeli.  Jak  widać,  przybliże- 
nie adiabatyczne  daje  wartość  energii  dysocjacji  D0 
nie  różniącą  się  wiele  od  D0  obliczonej  w przybliżeniu 
BO.  Różnica  ta  wynosi  tylko  5,9  cm-1.  Ale  wynik 
doświadczalny  był  znany  wówczas  z dokładnością 


Energia  dysocjacji  cząsteczki  wodoru 


Metoda  obliczenia 

Otrzymana  wartość,  cm-1 

Przybliżenie  Borna-Oppenheimera 

D0  =36112,2 

Przybliżenie  adiabatyczne 

D0  =36118,1 

Poprawki  relatywistyczne 

JDT  = —0,5 

Poprawki  promieniste 

JDra  * = -0,2 

0 

Całkowita  wartość  teoretyczna 

36117,3 

do  ±0,3  cm"1,  dlatego  bardzo  ważne  było  obliczenie 
D0  w przybliżeniu  adiabatycznym.  Poprawki  relaty- 
wistyczne i promieniste  chociaż  bardzo  małe,  musiały 
być  również  uwzględnione  w tak  dokładnych  oblicze- 
niach. Zupełnie  niedawno  okazało  się,  że  nie  uwzględ- 
nione początkowo  przez  Kolosa  i Woiniewicza  efekty 
nieadiabatyczne  są  zupełnie  do  pominięcia. 

Ostateczna  teoretyczna  wartość  energii  dysocjacji 
D0  — 36  117,3  cm"1  zaskoczyła  teoretyków  (rys.  20). 
Była  ona  większa  niż  wartość  doświadczalna!  Było 
to  nie  tylko  dziwne,  ale  również  niepokojące.  Zgodnie 
bowiem  z zasadą  wariacyjną,  jeśli  korzystając  z szere- 
gu funkcji  próbnych  d>1)r  obliczymy  odpowiadające 
tym  funkcjom  energie  dysocjacji  £>Pr,  to  najlepszym 
przybliżeniem  do  doświadczalnej  energii  dysocjacji 
będzie  ta  wartość  Z)jr,  która  jest  największa.  Ale  nigdy 
obliczona  wartość  D0  (po  uwzględnieniu  poprawek) 
nie  powinna  być  większa  od  wartości  doświadczalnej 
(rys.  21).' Tymczasem  wartość  teoretyczna  była  więk- 
sza od  doświadczalnej  o 3,7  cm"1,  a więc  wynosiła 
znacznie  więcej  niż  błąd  pomiaru  doświadczalnego 
(rys.  20).  Co  więcej,  należało  oczekiwać,  że  gdyby 
obliczyć  D0  z jeszcze  lepszą  funkcją  próbną  lub  gdyby 
uwzględnić  efekty  nieadiabatyczne  (później  okazało 
się,  że  te  ostatnie  poprawki  są  nieistotne),  to  wówczas 
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energia  dysocjacji  jeszcze  zwiększyłaby  się,  a tym  sa- 
mym powiększyłaby  się  rozbieżność  pomiędzy  do- 
świadczeniem a teorią.  Było  to  bardzo  niepokojące. 
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0j5ożw  Herzberg.  Monfils  1 960 


361 13,6  cm-1  ±0,3  cm-1 


0Q6Or  Kofos,  Wolniewicz 

m 361 17,3  cm-1  1964-1966 
361 17,4  cm"1  1968 


Rys.  20.  Porównanie  energii  dysocjacji  D0  cząsteczki  wodoru 
wyznaczonej  doświadczalnie  oraz  obliczonej  teoretycznie 


dogopr 


Do°ŚW  U>o°W  + ADT  + AD?) 

D0pr  + dD0Popr 


Rys.  21.  Wartość  energii  dysocjacji  obliczana  metodą  wariacyjną 
przy  użyciu  przybliżonej  (próbnej)  funkcji  falowej  nie  może  być 
większa  od  wartości  otrzymanej  z dokładnego  rozwiązania  rów- 
nania Schródingera 


bo  gdyby  tak  było  w rzeczywistości,  to  metod  chemii 
kwantowej  nie  można  byłoby  stosować  do  układów 
cząsteczkowych,  ściślej  mówiąc,  zasada  wariacyjna 
nie  mogłaby  być  używana  do  znajdowania  kresu 
dolnego  obliczonej  energii  cząsteczek.  Traciłyby  wów- 
czas sens  jedne  z podstawowych  równań,  opisujące 
w przybliżony  sposób  cząsteczki  — równania  Hart- 
reełego-Focka.  Nie  miałaby  sensu  metoda  oddziały- 
wania konfiguracyjnego. 

Istniała  jednak  pewna  szansa  wytłumaczenia  wy- 
stępującej rozbieżności,  np.  wyniki  obliczeń  mogły  być 
błędne  lub  mogły  być  niepoprawne  wyniki  pomiarów 
lub  ich  interpretacja.  Doświadczalną  wartość  energii 
dysocjacji  uważano  jednak  wówczas  za  bardzo  do- 
kładną, natomiast  sceptycznie  odnoszono  się  do 
wyniku  obliczonego.  Rozbieżność  spowodowaną 
nieuwzględnianiem  w obliczeniach  nie  znanego  do- 
tychczas efektu  można  było  śmiało  wykluczyć,  gdyż 
obliczenia  kwantowe  np.  dla  atomu  helu  dały  wyniki 
zgodne  z doświadczalnymi. 

Kołos  i Wolniewicz  udali  się  powtórnie  do  USA 
i powtórzyli  obliczenia  energii  dysocjacji  dla  cząstecz- 
ki wodoru.  Obliczenia  te  zostały  wykonane  za  po- 
mocą nowego  programu  obliczeniowego  i z zastoso- 
waniem lepszej  funkcji  falowej  (100-członowe  roz- 
winięcie). Obliczenia  prowadzono  w tzw.  podwójnej 
precyzji  eliminującej  ewentualne  błędy  wynikające 
z zaokrąglenia.  Poprzednie  wyniki  zostały  w pełni 
potwierdzone  — stosując  lepszą  funkcję  falową  uzys- 
kali oni  wynik  teoretyczny  lepszy  od  poprzedniego 
o 0,1  cm"1.  Tym  razem  zaniepokoił  się  Herzberg 
o swoje  poprzednie  pomiary  — powtórzył  je  w innych 
warunkach  i z większą  dokładnością.  Wynik  nowych 


energia  dysocjacji  D0 


pomiarów  był  nieoczekiwany.  Okazało  się  bowiem, 
że  poprzednie  wyniki  były  fałszywe.  Herzberg  stwier- 
dził tym  razem  zachodzenie  na  siebie  linii  widmo- 


DqOŚW  Herzberg,  Monfils  1960 


Herzberg  1970 


Kotos,  Wolniewicz  1 968 


Rys.  22.  Nowe  pomiary  energii  dysocjacji  cząsteczki  wodoru 
wykazały,  że  energia  ta  była  poprzednio  zmierzona  niepoprawnie 

wych  i niestety  nie  udało  mu  się  dokładnie  wyznaczyć 
nowy  pomiar  nowej  wartości  energii  dysocjacji.  Mógł  on  jedynie 
Herzberga  stwierdzić,  że  energia  dysocjacji  jest  zawarta  pomię- 
dzy 36  118,3  a 36  116,3  cm”1  (rys.  22).  Ostateczny 
wynik  teoretyczny  otrzymany  przez  Kołosa  i Wolnie- 
wicza  prawie  dokładnie  odpowiadał  wartości  poś- 
redniej zakresu  danych  doświadczalnych. 

Wyniki  obliczeń  wykonane  przez  Kołosa  i Wolnie- 
wicza  dla  cząsteczki  H2  mają  ogromne  znaczenie  dla 
podstaw  chemii  kwantowej.  Wykonane  zostały  dla 
bardzo  małej  cząsteczki,  ale  wykazały,  że  wyniki 
teoretyczne  mogą  współzawodniczyć  z powodzeniem 
w dokładności  z wynikami  doświadczalnymi,  a co 
więcej,  że  dzięki  nim  można  nawet  korygować  błędy 
w wynikach  pomiarów.  Na  ogół,  kiedy  porównuje  się 
jakieś  wartości  obliczone  z odpowiednimi  danymi 
zmierzonymi,  mówi  się,  że  „wyniki  teoretyczne  zga- 
dzają się  z danymi  doświadczalnymi”,  natomiast 
w przypadku  cząsteczki  wodoru  należało  powiedzieć, 
że  „wynik  doświadczalny  zasadniczo  zgadzał  się 
z wartością  teoretyczną”. 

Warto  podkreślić,  że  oprócz  energii  dysocjacji 
obliczono  dla  K2  wartości  wielu  innych  wielkości 
mających  znaczenie  dla  spektroskopii  (m.in.  wiel- 
kości charakteryzujące  oddziaływania  pola  elektro- 
magnetycznego z cząsteczką,  jak  momenty  elektryczne 
czy  polaryzował ność).  Okazuje  się,  że  obliczenia  te 
mają  również  praktyczne  znaczenie.  Na  przykład 
obliczony  tzw.  moment  kwadrupolowy  cząsteczki  H2 
został  niedawno  zastosowany  przez  astronomów  do 
wyznaczania  zawartości  wodoru  na  Jowiszu.  Obliczo- 
no również  potencjał  jonizacyjny  dla  cząsteczki  H2  — 
wartość  teoretyczna  124  416,8  cm-1  zgadza  się  bardzo 
dobrze  z wartościami  doświadczalnymi  zmierzonymi 
przez  Herzberga  (124  41 8,4  ±0,4  cm-1)  lub  przez 
Takezawę  (124  41 7± 2 cm"1).  Z innych  wielkości, 
które  obliczono,  warto  wymienić  energie  poziomów 
oscylacyjnych  stanu  podstawowego  cząsteczki  H2, 
jak  również  krzywe  energii  potencjalnej  dla  kilku 
stanów  wzbudzonych  cząsteczki.  Podobne  oblicze- 
nia wykonano  dla  cząsteczek  D2  i HD. 


Cząsteczki  dwuatomowe 


Aby  wyjaśnić  wiele  istotnych  właściwości  cząsteczek, 
nie  musimy  wykonywać  tak  skomplikowanych  obli- 
czeń, jak  dla  cząsteczki  wodoru.  Stan  elektronów  w 
cząsteczce  decyduje  w przeważającej  mierze  o jej 
właściwościach  fizykochemicznych.  Aby  określić 
ten  stan,  należy  oczywiście  rozwiązać  równanie  elek- 
tronowe, które  jest  bardzo  podobne  do  równania 
elektronowego  dla  atomu.  Oba  równania  różnią  się 
jedynie  energią  potencjalną  — w atomie  występuje 
oddziaływanie  z jednym  jądrem,  natomiast  w cząs- 


teczce ruch  elektronów  zachodzi  w polu  co  najmniej 
dwóch  jąder. 

Najprostszy  opis  stanu  elektronów  w cząsteczce 
otrzymujemy  w modelu  jednoelektronowym  (por. 
Przybliżenie  jednoelektronowe),  a najlepszymi  orbi- 
talami molekularnymi  są  orbitale  uzyskane  za  pomocą 
rozwiązania  równań  Hartreełego-Focka.  Niestety, 
dla  cząsteczek  wieloatomowych  numeryczne  rozwią- 
zywanie tych  równań  jest  niemożliwe  i zadowalamy 
się  przybliżeniami  analitycznymi,  które  szczególnie 
dla  dużych  cząsteczek  są  mało  dokładne.  Niemniej, 
wyznaczone  w ten  sposób  orbitale  molekularne  umoż- 
liwiają poglądowe  wyjaśnienie  właściwości  cząste- 
czek i powiązanie  ich  z właściwościami  atomów.  Za- 
dawalające jakościowe  wyniki  można  uzyskać  również 
w przypadku  posługiwania  się  orbitalami  moleku- 
larnymi nie  wyznaczonymi  metodą  SCF. 

Rozpatrzmy  najprostszą  cząsteczkę,  jaką  jest  jon 
HJ.  Przy  dużych  odległościach  między  jądrami  układ 
ten  składa  się  w zasadzie  z atomu  wodoru  oraz  pro- 
tonu (sytuacja  a lub  b na  rys.  23).  Jeśli  jednak  od- 
ległość między  jądrami  jest  mała,  wówczas  nie  można 
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Rys.  23.  Cząsteczka  H+  przy  dużej  (a,  b)  i małej  (c)  odległości 
międzyjądrowej.  Zaznaczono  przekroje  konturów  orbitali  ato- 
mowych (pa  oraz  (po  typu  Is  oraz  wiążącego  orbitalu  molekular- 
nego Kropkami  zaznaczono  położenie  protonów 


elektronu  przypisać  ani  jądru  A ani  też  jądru  B — 
elektron  jest  wspólną  własnością  obu  jąder.  Elektron 
w cząsteczce  H2  przy  dużej  odległości  międzyjądro- 
wej  R jest  opisany  albo  orbitalem  atomowym  va 
albo  (fB  (oba  typu  ls).  W przypadku  skończonej  od- 
ległości międzyjądrowej  stan  podstawowy  elektronu 
w HJ  opisujemy  orbitalem  molekularnym  y i natu- 
ralne jest  przybliżenie  MO  w postaci  y>  — cxq>A  + 
+c2(pb.  Współczynniki  cx  oraz  c2  można  łatwo  wy- 
znaczyć z warunku  normalizacji  orbitalu  y oraz 
z własności  symetrii  układu.  Otrzymujemy  wówczas 
dwa  orbitale  molekularne. 


= j * ■=■  (<Pa+<Pb) 

1/2(1+$) 

= . 1 Wa-<Pb) 

l/2(l-S) 


(19) 


gdzie  S = / <PA7'iidv  jest  całką  nakrywania  przyj- 
mującą  wartości  pośrednie  pomiędzy  0 oraz  1 
(rys.  24).  Znając  orbitale  molekularne  możemy  ob- 
liczyć przyporządkowane  im  energie  orbitalne.  W przy- 
bliżeniu energie  te  wynoszą 


£b  = sa  = SH—P,  (20) 


gdzie  en  jest  energią  elektronu  atomu  wodoru  w sta- 
nie opisanym  orbitalem  <pa  (lub  <pz?),  natomiast  fi  jest 
tzw.  całką  rezonansową.  Nie  będziemy  tutaj  szczegóło- 
wo omawiać  tej  całki,  zaznaczymy  jedynie,  że  jej 


Rys.  24.  Nakrywanie  się  przekrojów  konturów  orbitali  atomowych 
typu  1 s przy  różnych  odległościach  międzyjądrowych  R 
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całka  wartości  nic  są  większe  od  zera  (tzn.  p ^ 0),  oraz  że 
rezonansowa  P -*  0,  gdy  R ->  oo.  Jak  więc  widać  energia  orbitalna 
jest  niższa  od  energii  orbitalnej  ea.  Ze  wzorów 


/ 

/** 

*5 

atom  A atom  6 

cząsteczka  A-B 

Rys.  25.  Poziomy  energetyczne  w rozdzielonych  atoniach  i w dwu* 
atomowej  cząsteczce  homojądrowej.  Znaki  *f  oraz  — przy  wią- 
żącym i anty  wiążącym  orbitalu  oznaczają,  że  orbitale  te  są  przy- 
bliżone odpowiednio  przez  sumę  lub  różnicę  orbitali  atomowych 
</>a  oraz  <pa 


<Pa  9 a 


Rys.  26.  Wykresy  wartości  funkcji  falowych  wzdłuż  osi  między- 
jądrowej:  a)  orbitale  atomowe  <pa  i (pa  typu  1$,  b)  wiążący  i anty- 
wiążący  orbital  molekularny,  c>  kwadraty  orbitali  molekularnych 


(20)  wynika  również,  że  energia  et  ma  niższą  wartość 
od  energii  orbitalu  atomowego  <pa  (lub  <pb\  natomiast 
energia  ea  ma  wartość  wyższą  od  tych  energii 
(rys.  25). 

Rysunek  26  przedstawia  schemat  wykresu  obu 
orbitali  molekularnych  oraz  wykres  kwadratów  tych 
funkcji.  Na  wykresie  ly-^l2  widać  wyraźnie,  że  naj- 
większa gęstość  prawdopodobieństwa  Qb  — e|yt>l2  zna- 
lezienia elektronu  w cząsteczce  jest  przy  jądrach.  Cha- 
rakterystyczny przy  tym  jest  fakt,  że  gęstość  prawdo- 
podobieństwa znalezienia  elektronu  pomiędzy  jądrami 
jest  duża  — oznacza  to,  że  istnieje  wiązanie  elektrono- 
we pomiędzy  jądrami.  Orbital  molekularny  opisujący 
orbita!  to  wiązanie  nazywamy  dlatego  orbitalem  wiążącym 
wiążący  (indeks  b przy  funkcji  y>b  jest  skrótem  wyrazu  bonding). 

Wiążący  orbital  molekularny  nie  ma  symetrii  sferycz- 
nej, jak  orbitale  atomowe  typu  Is,  lecz  ma  symetrię 
cylindryczną  wokół  osi  międzyjądrowej.  O każdym  or- 
bitalu molekularnym  tego  typu  będziemy  mówili,  że 
ma  symetrię  a lub  po  prostu,  że  jest  to  MO  typu  o. 
wiązanie  o Wiązanie  elektronowe,  które  jest  opisane  takim  orbi- 
talem, nazywać  będziemy  wiązaniem  <r,  a elektrony 
opisane  takim  orbitalem  nazywać  będziemy  elektro- 
elektrony  a nami  o. 

Wykres  |y>a|2  jest  zupełnie  inny  od  wykresu  kwadra- 
tu funkcji  yb.  Jeżeli  elektron  jest  opisany  orbitalem 
molekularnym  wówczas  gęstość  prawdopodobień- 
stwa Qa  — e\ya\2  znalezienia  elektronu  jest  największa 
przy  jądrach  i jest  zdecydowanie  mała  w obszarze 
między  jądrami  cząsteczki  (ęa  = 0 dokładnie  w środku 
odległości  międzyjądrowej).  Łatwo  też  zauważyć,  że 
gęstość  prawdopodobieństwa  znalezienia  elektronu 
poza  obszarem  międzyjądrowym  jest  dość  duża  dla 
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niewielkich  odległości  od  jądra.  Te  własności  orbitalu  orbital 
molekularnego  ya  uzasadniają  nazywanie  go  orbita-  antywiążący 
lem  anty  wiążącym  (indeks  a przy  funkcji  ya  jest  skró- 
tem wyrazu  antibonding).  Zauważmy  też,  że  orbital 
ya  ma  podobnie  jak  orbital  y >b  symetrię  cylindryczną; 
ma  więc  on  symetrię  o.  Aby  jednak  wyróżnić  jego 
antywiążący  charakter,  oznaczać  będziemy  orbital 
y>a  symbolem  <j*. 

Jaki  wpły  w na  energię  cząsteczki  Hf  mają  omówio- 
ne różnice  w rozkładzie  ładunku  elektronowego?  Mo- 
żemy to  wyjaśnić  za  pomocą  prostego  modelu  elektro- 
statycznego (rys.  27).  Układ  składający  się  z dwóch  ła- 
dunków dodatnich  (protony  cząsteczki  Hf)  jest  ukła- 
dem nietrwałym  (sytuacja  a).  Wyobraźmy  sobie,  że 
między  ładunkami  dodatnimi  pojawił  się  mały  ładu- 
nek ujemny  (sytuacja  b).  Układ  ten  jest  nadal  nietrwa- 


Rys.  27.  Model  elektrostatyczny  wyjaśniający  zależność  wiążą- 
cych i antywiążących  własności  orbitalu  od  rozkładu  ładunku 


Rys.  28.  Krzywe  energii 
potencjalnej  dla  dwóch 
najniższych  stanów  ele- 
ktronowych (wiążącego 
i antywiążącego)  jonu 
H+ ; tH  jest  energią  ele- 
ktronu w stanie  podsta- 
wowym atomu  wodoru  odległość  międzyjeidrowa  R 

ły,  gdyż  mały  ładunek  ujemny  nie  jest  w stanie  skom- 
pensować odpychających  sił  pomiędzy  ładunkami  do- 
datnimi. Dopiero  gdy  ładunek  ujemny  jest  wystarcza- 
jąco duży  (sytuacja  c),  układ  jest  trwały  w wyniku 
kompensacji  sił  odpychających  przez  siły  przyciągają- 
ce występujące  pomiędzy  ładunkami.  Ten  prosty  mo- 
del tłumaczy  trwałość  cząsteczki  Hf  wówczas,  gdy 
elektron  jest  opisany  orbitalem  y>b  (orbitalowi  temu 
odpowiada  wzrost  gęstości  ładunku  elektronowego 
między  jądrami),  oraz  nietrwałość  cząsteczki,  gdy  elek- 
tron jest  opisany  orbitalem  y>a  (orbitalowi  temu  odpo- 
wiada mały  ładunek  elektronowy  pomiędzy  jądrami). 
Zrozumiały  się  staje  teraz  przebieg  krzywych  poten- 
cjalnych Eel(R)  dla  cząsteczki  Hf  przedstawiony  na 
rys.  28. 


Cząsteczki  dwuatomowe  homojądrowe 

Orbitale  molekularne  y>b  oraz  ya  dla  cząsteczki  Hf  są 
orbitalami  przybliżonymi  utworzonymi  z orbitali  ato- 
mowych typu  1 s.  Dla  cząsteczki  Hf,  jak  również  dla 
innych  homojądrowych  cząsteczek  dwuatomowych, 
można  utworzyć  przybliżone  orbitale  molekularne 
z orbitali  atomowych  odpowiadających  stanom  wzbu- 
dzonym atomu  wodoru.  Na  przykład  można  łatwo 
utworzyć  orbitale  molekularne  z orbitali  typu  2 s: 

rpb  ~ 2sa~\-2sb,  y>a  ~ 2sa—2sb- 

Zarówno  niższy  energetycznie  orbital  wiążący,  jak 
i orbital  antywiążący  mają  symetrię  a.  W przypadku 
tworzenia  orbitali  molekularnych  z orbitali  atomo- 
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typu  <y 
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typu  Ti 


wiązanie 

dwu* 

elektronowe 


jon  Hej 
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elektronowe 


wych  typu  2py  ze  względu  na  ukierunkowanie  tych 
ostatnich,  mamy  dwa  rodzaje  MO  (rys.  29) — orbi- 
tale o symetrii  a i orbitale  o symetrii  n.  Te  ostatnie 
orbitale  są  antysymetryczne  względem  odbicia 
w płaszczyźnie  przechodzącej  przez  oś  wiązania. 
Wprowadzona  symbolika  orbitali  molekularnych 
(por.  rys.  29,  30)  wymaga  krótkiego  wyjaśnienia. 
Homojądrowe  cząsteczki  dwuatomowe  mają  tzw. 
środek  symetrii,  którym  jest  punkt  leżący  w środku 
odległości  między  jądrami  cząsteczki.  Orbitale  mo- 
lekularne, które  są  symetryczne  względem  odbicia 
w środku  symetrii  oznacza  się  wskaźnikiem  g (niem.  — 
gerade ),  natomiast  MO  będące  antysymetrycznymi 
względem  tego  odbicia  mają  wskaźnik  u (niem.  — 
ungercde). 

Znając  przybliżoną  postać  orbitali  molekularnych 
możemy  ustalić  elektronowe  konfiguracje  dla  homo- 
jądrowych  cząsteczek  dwuatomowych.  Należy  oczy- 
wiście każdemu  MO  przyporządkować  olaeśloną 
energię.  Niestety,  nie  można  tego  zagadnienia  roz- 
wiązać w sposób  ogólny  — dla  każdej  cząsteczki 
należy  wykonać  oddzielnie  obliczenia  numeryczne. 
Tak  się  jednak  składa,  że  względna  kolejność  pozio- 
mów energetycznych  na  ogół  nie  zależy  od  rodzaju 
cząsteczki  (rys.  30).  Warto  zwrócić  uwagę  na  fakt, 
że  orbitale  n(2px)  i n*(2 pz)  różnią  się  od  odpowiednich 
orbitali  n(2pz)  i n*(2pz)  jedynie  obrotem  o 90°  wokół 
osi  y.  Ponieważ  żaden  z kierunków  prostopadłych 
do  osi  cząsteczki  nie  jest  wyróżniony,  orbitale  n(^2pz) 
i n{2pz)  mają  taką  samą  energię  orbitalną  (podobna 
sytuacja  jest  dla  orbitali  7z*(2px)  i n*(2 pzj);  wystę- 
pują więc  poziomy  podwójnie  zdegenerowane. 

Ustalenie  konfiguracji  elektronowej  określonej 
cząsteczki  jest  bardzo  proste  (rys.  7).  Poszczególne 
orbitale  molekularne  obsadzamy  kolejno  elektro- 
nami zaczynając  od  orbitali  najniższych  energetycz- 
nie i pamiętając,  że  na  każdym  orbitalu  mogą  być 
najwyżej  dwa  elektrony  o przeciwnie  skierowanych 
spinach^  oraz  pamiętając  o regule  Hunda.  Podane 
w tabeli  konfiguracje  elektronowe  dla  kilku  cząsteczek 
i ich  niektórych  jonów  tłumaczą  w prosty  sposób 
obserwowane  różnice  w charakterze  wiązań  wystę- 
pujących w cząsteczkach  i ich  jonach.  Na  przykład 
cząsteczka  H2  różni  się  od  swojego  dodatniego  jonu 
tym,  że  na  orbitalu  wiążącym  ma  dwa  elektrony, 
a nie  jeden.  Wiązanie  w H2  ma  więc  dokładnie  taki 
sam  charakter,  jak  wiązanie  w jonie  H f . Jest  ono  jed- 
nak znacznie  silniejsze  w neutralnej  cząsteczce,  gdyż 
wiązanie  to  pochodzi  od  dwóch  elektronów.  Dlatego 
też  odległość  między  jądrami  w H2  jest  mniejsza  od 
odległości  między  jądrami  w Hf.  Jak  widać  więc 
dia  utworzenia  kowalencyjnego  wiązania  chemicznego 
nie  jest  niezbędna  para  elektronów.  Niemniej  wiąza- 
nie dwuelektronowe  odgrywa  w pewnym  sensie  wy- 
różnioną rolę,  gdyż  jest  silniejsze  od  wiązania  jedno- 
elektronowego.  Jest  to  jednak  różnica  ilościowa,  a nie 
jakościowa. 

Rozpatrzmy  z kolei  jon  Hef.  W jonie  tym  dwa 
elektrony  znajdują  się  na  orbitalu  wiążącym  oraz 
jeden  na  orbitalu  antywiążącym.  Mamy  więc  w tym 
wypadku  wiązanie  trójelektronowe.  Jest  ono  jednak 
słabsze  od  wiązania. dwuelektron owego,  gdyż  efekty 
energetyczne  jednego  z elektronów  znajdującego  się 
na  MO  wiążącym  i elektronu  na  MO  antywiążącym 
znoszą  się  wzajemnie  (zob.  wzór  (20))  — ściślej  biorąc 
efekt  antywiążący  przeważa  trochę  nad  efektem 
wiążącym.  Jon  dodatni  cząsteczki  helu  jest  układem 
trwałym,  a jego  wiązanie  pochodzi  w zasadzie  od 
jednego  elektronu  znajdującego  się  na  orbitalu  wią- 
żącym. Zrozumiały  jest  również  fakt,  że  w przedsta- 
wionym schemacie  jak  i w rzeczywistości  cząsteczka 
He2  będzie  układem  nietrwałym  (efekt  wiążący  dwóch 
elektronów  na  orbitalu  1 jest  znoszony  przez  efekt 
antywiążący  dwóch  elektronów  na  orbitalu  l<rM). 
Dwa  atomy  helu  odpychają  się  więc  wzajemnie  (od- 
pychanie walencyjne)  nie  tworząc  cząsteczki. 

Na  przykładzie  cząsteczki  Li2  można  wytłumaczyć 
znany  dobrze  z chemii  fakt,  że  elektrony  powłok 


wewnętrznych  nie  biorą  udziału  w tworzeniu  wiązań  cząsteczka 
chemicznych.  W miarę  zbliżania  się  dwóch  atomów  Li2 
litu  przy  tworzeniu  cząsteczki  przenikają  się  najpierw 
orbitale  2s  (są  one  bardziej  rozmyte  w przestrzeni  niż 
orbitale  ls)  i tworzy  się  orbita!  wiążący  i antywiążący. 

Koncentracja  ujemnego  ładunku  elektronowego 
w obszarze  między  jądrami  cząsteczki  powoduje  dal- 
sze zbliżanie  się  atomów.  Jednocześnie  jednak  nastę- 
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Rys.  29.  Przekroje  konturów  orbitali  molekularnych  utworzo-  0(2-) 
nych  w wyniku  dodawania  lub  odejmowania  orbitali  atomowych 
2 s i 2 p umieszczonych  w punktach  położeń  jąder  A i B.  Kontury 


orbitali  molekularnych  utworzonych  z orbitali  atomowych  Is 
są  podobne  do  konturów  orbitali  c(2s) 
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Rys.  30.  Poziomy  energetyczne  rozdzielonych  atomów  oraz  dwu- 
atomowej  cząsteczki  homojądrowej 
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Konfiguracje  elektronowe  cząsteczek  i jonów 


Cząsteczka  lub  jon 

Konfiguracja  elektronowa 

D0  lub  Dt  (w  na- 
wiasie), eV 

Re,  nm 

«; 
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0,68) 

0,142 

puje  zwiększenie  się  odpychania  kulombowskiego  pojedyncze  wiązanie  (wiązanie  a)  pochodzące  od 
pomiędzy  jądrami  atomów  litu  oraz  pojawia  się  od-  dwóch  elektronów  znajdujących  się  na  orbitalu 
pychanie  walencyjne  elektronów  na  orbitalach  1 off  wiążącym  2og. 

i lou.  Dlatego  w cząsteczce  litu  mamy  w zasadzie  Elektrony  w cząsteczce  opisane  orbitalami  moleku- 
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Rys.  31.  Warstwice  gęstości  elektronowych  7 homojądrowych  cząsteczek  dwuatomowych  (wiązania kowalencyjne)  otrzymane  z obliczeń 
metodą  HF  (zob.  rys.  9,  podpis).  Zewnętrzne  warstwice  odpowiadają  gęstości  6,1  -lO"6  efa$.  Warstwice  gęstości  elektronowych  cząste- 
czek He2ł  Be*  oraz  Ne,,  ktćre  nie  są  stabilne  w stanie  podstawowym,  nie  zostały  wykreślone 
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wiązanie  ny  larnymi  typu  n będziemy  nazywali  elektronami  n, 
elektron  a a wiązanie  elektronowe  opisane  orbitalem  n będziemy 
nazywali  wiązaniem  n.  Często  zdarza  się,  że  obok 
wiązań  n występują  w cząsteczce  wiązania  o.  Na  przy- 
kład w cząsteczce  N2  (zob.  podane  w tab.  Konfigu- 
racje elektronowe  cząsteczek  i jonów,  zob.  rys.  31) 
mamy  wiązanie  potrójne  utworzone  przez  sześć  elek- 
tronów : dwa  wiązania  n oraz  jedno  wiązanie  a (efekty 
wiążące  elektronów  na  orbitalach  lcrg  i 2 og  są  zno- 
szone przez  efekty  antywiążące  elektronów  na  orbi- 
talach odpowiednio  \ou  i 2au). 

Uważny  czytelnik  zapewne  zwróci  uwagę  na  fakt, 
że  dla  cząsteczek  N2,  NJ  oraz  F2  sekwencja  orbitali 
3 ag  oraz  1 nu  została  odwrócona  w porównaniu  z rys. 
30.  W pierwszych  dwóch  przykładach  zostało  to  uczy- 
nione wbrew  obliczeniom  (najdokładniejsze  obliczer 
nia  przewidują  sekwencję  taką  jak  na  rys.  30),  bowiem 
stwierdzono  doświadczalnie  dla  tych  cząsteczek,  że 
wyższym  energetycznie  orbitalem  jest  3og  a nie  1 nu. 
Natomiast  dla  cząsteczki  F2  obliczenia  Hartree’ego- 
Focka  podają  odwróconą  kolejność  wspomnianych 
orbitali  (rys.  31). 

Z podanego  schematu  orbitali  molekularnych  wy- 
nika, że  jonizacja  cząsteczki  N2  prowadzi  do  oder- 
wania elektronu  znajdującego  się  na  orbitalu  wiążą- 
cym 3 og  i wobec  tego  jon  NJ  ma  słabsze  wiązanie 
(Z>0  = 8,72  eV)  niż  neutralny  układ  N2(£>0  = 9,76  eV). 
Jeśli  chodzi  o cząsteczkę  tlenu,  to  jej  stan  podstawo- 
wy jest  trypletem  ze  względu  na  degenerację  orbitali 
anty  wiążących  \ng  (reguła  Hunda,  zob.  rys.  7).  Wy- 
jaśnienie tego  faktu  było  jednym  z większych  osiąg- 
nięć teorii  MO.  Widzimy  dalej,  że  zjonizowanie  nie- 
których cząsteczek  wzmacnia  wiązanie  między  ato- 
mami (porównaj  wartości  D0  oraz  Re  dla  02  z od- 
powiednimi wartościami  dla  OJ),  gdyż  odrywając 
elektron  z orbitalu  antywiążącego  \ng  zmniejszamy 
efekt  anty  wiążący  w cząsteczce.  Zrozumiałą  jest  rów- 
nież rzeczą,  że  w jonach  ujemnych  02  oraz  0|“ 
efekty  antywiążące  są  większe  niż  w 02,  a tym  samym 
w jonach  wiązania  są  słabsze  i dłuższe  (dla  02,  Ol 
oraz  0|~  wartości  Re  w nm  wynoszą  odpowiednio 
0,121;  0,126  oraz  0,149). 


Cząsteczki  dwuatomowe  heterojądrowe 

Wiele  trudności  napotykamy  przy  tworzeniu  orbitali 
molekularnych  z orbitali  atomowych  dla  dwuato- 
mowych  cząsteczek  heterojądrowych.  Nie  występuje 
już  w tym  wypadku  płaszczyzna  symetrii  prostopadła 
do  osi  cząsteczki  i wobec  tego  współczynników  w roz- 
winięciu y = CAfA+CBWB  należy  szukać  metodą 
wariacyjną.  Kłopotliwy  jest  również  dobór  orbitali 
atomowych  <fa  oraz  (pn>  gdyż  różnego  typu  AO 
w różnych  atomach  mają  różne  energie.  Korzysta  się 
tutaj  jednak  z takich  orbitali  atomowych,  aby  ich 
kombinacje  liniowe  były  jak  najbardziej  efektywne. 
Oznacza  to  m.in.,  że  energie  określonych  <pa  i <pb 
nie  powinny  wiele  różnić  się  między  sobą.  Dlatego 
też  tworząc  orbitale  molekularne  na  przykład  dla 
cząsteczki  LiH  powinniśmy  pamiętać,  że  energia 
orbitalu  15h  jest  bliższa  energii  orbitalu  2jli  , aniżeli 
energii  Dli  (por.  rys.  10).  Dwa  elektrony  znajdujące 
się  na  orbitalu  atomowym  15  litu  nie  odgrywają 
czasl^zka  *stotneJ  r°li  w tworzeniu  wiązania  w cząsteczce  LiH 
ą C^LiH  (ro^a  tyck  e^ktronów  sprowadza  się  w zasadzie  do 
~1!  ekranowania  jądra  Li),  natomiast  wiązanie  w cząs- 
teczce jest  głównie  utworzone  przez  elektron  1 s wo- 
doru i elektron  2 s litu  — para  ta  zajmuje  w stanie 
podstawowym  cząsteczki  orbital  molekularny  po- 
staci y>  = caIs^+cbIs^.  Cząsteczki  heterojądrowe 
mają,  podobnie  jak  homojądrowe,  symetrię  osiową, 
dlatego  nadal  obowiązuje  podział  orbitali  molekular- 
nych na  orbitale  typu  a oraz  n (nie  występuje  tutaj 
jednak  środek  symetrii).  Dlatego  wspomniany  wyżej 
orbital  w LiH  ma  symetrię  a. 

Przy  tworzeniu  orbitali  molekularnych  dla  innych 
heterojądrowych  cząsteczek  dwuatomowych  sytuacja 


jest  na  ogół  bardziej  złożona.  Na  przykład  w cząs- 
teczce CO  orbitale  1$  zarówno  węgla  jak  i tlenu  są 
skoncentrowane  blisko  odpowiednich  jąder  i prak- 
tycznie nie  nakrywają  się  zupełnie  z orbitalami  15 
drugiego  atomu.  Nakrywanie  się  ich  z orbitalami  2 s 
lub  2 py  (przy  założeniu,  że  oś  y pokrywa  się  z osią 
cząsteczki  drugiego  atomu)  jest  trochę  większe,  jed- 
nak różnica  pomiędzy  energiami  orbitali  (por.  rys.  10), 
np.  1 j tlenu  i 25  lub  2 py  węgla,  jest  tak  duża,  że  i w tym 
wypadku  nie  mamy  efektywnej  kombinacji  liniowej 
orbitali  atomowych.  Tak  więc,  elektrony  powłok 
wewnętrznych  cząsteczek  heterojądrowych  nie  biorą 
również  udziału  w tworzeniu  wiązania  chemicznego. 
Natomiast  orbitale  atomowe  25  i 2 p obu  atomów 
tworzą  już  efektywne  kombinacje  liniowe.  Ogólnie 
można  powiedzieć,  że  wiązania  są  tworzone  przez 
elektrony  walencyjne  znajdujące  się  na  orbitalach 
walencyjnych  (orbitale  walencyjne  — orbitale  ato- 
mowe o największej  dla  danego  atomu  wartości  głów- 
nej liczby  kwantowej  n w stanie  podstawowym). 

W celu  otrzymania  orbitali  molekularnych  dla 
cząsteczki  CO  tworzymy  efektywne  kombinacje  linio- 
we walencyjnych  orbitali  atomowych.  Z orbitali  2 px 
tlenu  oraz  2 px  węgla  otrzymujemy  wiążący  i antywią- 
żący  orbital  molekularny  typu  n.  Podobnie  z orbitali 
2pz  otrzymujemy  orbitale  n.  Natomiast  gdy  chcemy 
otrzymać  orbitale  molekularne  typu  <r  z orbitali  ato- 
mowych 25  i 2py  poszczególnych  atomów  postępu- 
jemy inaczej.  W przypadku  cząsteczki  heterojądro- 
wej  nie  potrafimy  rozstrzygnąć,  które  z czterech  orbi- 
tali (orbitale  25  i 2 py  atomu  tlenu  oraz  orbitale  25 
i 2 py  atomu  węgla)  będą  tworzyły  najbardziej  efek- 
tywną kombinację  liniową  (z  porównania  energii 
orbitalnych  nie  możemy  skorzystać,  gdyż  energie 
tych  czterech  orbitali  są  bliskie  sobie).  Dlatego  też 
orbitale  molekularne  cr  dla  cząsteczki  CO  zakładamy 
w postaci 

y>i  = Cu  2sc-ł-CiZ2pyc-TCiz2so+Cu2pyOj 

gdzie  wskaźniki  C i O odnoszą  się  odpowiednio  do 
atomów  węgla  i tlenu.  Z czterech  orbitali  atomowych 
można  utworzyć  cztery  orbitale  molekularne,  różniące 
się  współczynnikami  (oraz  energiami  orbitalnymi)  — 
dwa  z nich  są  orbitalami  wiążącymi,  a dwa  orbi- 
talami anty  wiążącymi. 

Trudno  jest  nam  ustalić  konfigurację  elektronową 
cząsteczek  heterojądrowych,  ponieważ  m.in.  dla  róż- 
nych cząsteczek  kolejność  orbitali  może  być  różna. 
Zazwyczaj  dzieli  się  po  prostu  wszystkie  orbitale  na 
orbitale  a i tt,  a w obrębie  każdej  grupy  numeruje  się 
je  kolejno  l<r,  2<r, ...,  1 jt,  2n, ...  według  wzrastającej 
energii  orbitalnej  (podobnie  postąpiono  w przypadku 
cząsteczek  homojądrowych,  por.  rys.  31).  Dla 
cząsteczki  CO  ustalono  (korzystając  z wyników  doś- 
wiadczalnych i teoretycznych)  następującą  konfigu- 
rację elektronową  CO:  lor22ff23cr24<72l7c45<7“. 

Chcąc  uzyskać  możliwie  najdokładniejsze  wyniki 
ilościowe  dla  cząsteczek,  nie  należy  ograniczać  się 
do  przybliżania  orbitali  molekularnych  za  pomocą 
dwóch  tylko  orbitali  atomowych,  jak  to  uczyniono 
w przypadku  cząsteczek  homojądrowych.  Dla  cząs- 
teczek dwuatomowych,  ze  względu  na  występującą 
w nich  symetrię  osiową,  można  obliczyć  dokładne 
orbitale  HF,  które  dają  najlepszy  obraz  cząsteczki 
w przybliżeniu  jednoelektronowym.  Rysunki  31  i 32 
przedstawiają  warstwice  gęstości  elektronowych  dla 
kilku  dwuatomowych  homo-  i heterojądrowych 
cząsteczek.  Widać  tu  wyraźnie,  jak  poszczególne 
orbitale  molekularne  zmieniają  się  przy  przejściu  od 
cząsteczki  do  cząsteczki.  Widać  również  wyraźnie, 
jak  zmieniają  się  energie  poszczególnych  orbitali 
molekularnych  w serii  cząsteczek. 


Wiązanie  chemiczne 

Obliczenia  gęstości  elektronowych  w układach  dwu- 
atomowych są  pomocne  w zrozumieniu  koncepcji 
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elektrony 

walencyjne, 

orbitale 

walencyjne 


cząsteczka 

CO 


ustalanie 

konfiguracji 


cząsteczka,  konfiguracja 
sianu  podstawowego 


LiF 

1 o2  2 o2  3 o2  4 o2  1 tt4 


NaF 

1 a2  2 o2  3 o2  4 o2  5 a2  6 o2  - 
1 tt4  2 tu4 


KF 

1 o22o23a24o25o26o2- 
7 o2  8 o2  1 7T4  2 tt4  3 tt4 


LiCI 

1 o22o23o24o25o26  o2  - 
1^42^4 


całkowita  gęstość  orbitalna  gęstość  elektronowa 

elektronowa  część  kationowa  część  anionowa 


1 s 25  2pn  2po  3 s Zpn  Zpo 


— 106,978832 

-2,45539 
(2  o) 


1 s 2s  2pn  2 po  3 s 3 prj 


-26,12023  -0,48384 

(la)  {1  tt) 

-1,38967  -0,50556 

(3  a)  <4  a) 


-261,372233 


-2,81091  -1,53279 
(3  a)  (4  a) 

-40,99253  -1,53560 
(1  o)  (1  ir) 


-698,  664548 


• © 


© O 


-14,50644  -1%, 53588  -0,97356 
(3  a)  (4  a)  (2  tt) 

-133,54887  -11,53652  -0,96494 

(1  o)  (In)  -1,76483  (7  o) 

(5o) 


-467,01 1591 


-2,58036 
(4  0) 


-26,06527  -0,42032 

(2  0)  (2  rc) 

-1,31697  -0,43015 

(5  o)  (6  a) 


-26,01738  -0,37249 

(2  o)  (3  tt) 

-1,26973  -0,37767 

(6  o)  (8  o) 


0 5 lOt 

1  i 1 


• O 8 


-104,70159  -7,89396 

(1  o)  (1  n) 


-10,42823  -7,89499  -0,34798 

(2  o)  (3  0)  (2  tt) 


NaCI 

1 a2  2 o2  3 o2  4 u2  5 o2  6 a2  - 
7 o28  o2  1 tt42  it43  n4 

-621,436935  -2,86591  -1,58904 

(5  0)  (60) 

-40,54773  -1,58855 
(2  o)  (2  it) 


O 3 


-104.69210  -7,88635  -0,93555  -0,35835 

(1  a)  (1  rt)  (7  0)  (8 o| 

-10,42057  -7,88735  -0,34378 

(3  a)  (4  a)  (3  tt) 


KCI 

1 a2  2 o2  3 o2  A-  o2  5 a2  6 o2  7 o2  - 
8a29o2  10a2  1 n42n43n447t4 


-1058,7525  -14,5186  -11,5481  -0,9866 

(3  a)  (4  o)  (3  n) 


-133,5603  -11,5484  -1,7789  -0,9901 

(1  o)  (In)  (7  o)  (8  o) 


-104,6711  -7,8645  -0,9078  -0,3326 

(2  °)  (2  ti)  (9  a)  (io c) 

-10,3986  -7,8653  -0,3245 

<5o)  (6  a)  (4n) 


Rys.  32.  Warstwice  gęstości  elektronowych  6 halogenków  metali  alkalicznych  (wiązania  jonowe)  otrzymane  z obliczeń  metodą  Hartree’ego-Focka. 
Warstwice  gęstości  elektronowych  dla  poszczególnych  orbitali  uporządkowano  ze  względu  na  ich  jonowe  pochodzenie  (zob.  rys.  9,  podpis) 


cząsteczka  atom 

litku  sodu  sodu 

NaLi  Na 


atom 

litu 

Li 


Rys.  33.  Warstwice  gęstości  elektronowych  (obliczone  z funkcji  HF)  stabilnej  cząsteczki  NaLi  i atomów  tworzących  tę  cząsteczkę.  Obok  podano 
warstwice  „różnic  gęstości  elektronowych”,  tzn.  różnic  między  gęstością  stabilnej  cząsteczki  i gęstościami  niezaburzonych  atomów  umieszczonych 
względem  siebie  w odległości  odpowiadającej  położeniu  rówmowagi  cząsteczki.  Linie  ciągłe  oznaczają  obszary  dodatnich  wartości  różnic  gęstości 
(w-  wyniku  utworzenia  cząsteczki  z atomów  gęstość  elektronowa  w tym  obszarze  zwiększyła  się),  linie  przerywane  oznaczają  obszary  ujemnych  warto- 
ści różnic  gęstości  (w  wyniku  utworzenia  cząsteczki  z atomów  gęstość  elektronowa  w tym  obszarze  zmniejszyła  się).  Zob.  rys.9,  podpis 
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wiązania  chemicznego.  Możemy  bowiem  analizować 
wiązanie  chemiczne  badając  różnice  w gęstościach 
elektronowych  cząsteczki  i atomów  (rys.  33).  W przy- 
padku stabilnej  cząsteczki  gęstość  elektronowa  w ob- 
szarze między  jądrami  cząsteczki  jest  większa  w po- 
równaniu do  gęstości  elektronowej  izolowanych  ato- 
mów. 

Za  pomocą  obliczeń  możemy  obserwować  zmiany 
zachodzące  w gęstościach  elektronowych  poszczegól- 
nych atomów  przy  ich  wzajemnym  zbliżaniu  się 
(praktycznie  prawie  przy  ciągłej  zmianie  odległości 
międzyjądrowej,  rys.  35).  Szczególnie  interesujący  jest 
wiązanie  przypadek  cząsteczki  o wiązaniu  jonowym  LiF 
jonowe  (rys.  35B).  Rozkład  gęstości  elektronowej  w cząsteczce 
przy  dużych  odległościach  międzyjądrowych  odpo- 
wiada rozkładowi  gęstości  elektronowej  w izolowa- 
nych neutralnych  atomach  litu  i fluoru  (rys.  9). 
Rozkład  ten  ulega  gwałtownej  zmianie  już  przy  od- 
ległości ok.  13,9ao  (ok.  0,74  nm);  (rys.  35B,  punkt  B). 
Tworzą  się  wówczas  jony  Li+  oraz  F~,  które  prawie 
nie  zmienione  zbliżają  się  nadal  do  położenia  równo- 
wagi przy  ok.  2,94a0  (ok.  0,156  nm).  A więc  układ 
jonowy  Li+F~  tworzy  się  przy  znacznie  większej 
odległości  międzyjądrowej  niż  położenie  równowagi 
cząsteczki!  W układzie  He2  dwa  atomy  helu  odpy- 
chają się,  w przeciwieństwie  do  dwóch  atomów  wo- 
doru w układzie  H2.  Gęstość  elektronowa  w układzie 
He2  jest  wypychana  z obszaru  międzyjądrowego. 
Takie  zachowanie  się  atomów  jest  charakterystyczne 
dla  atomów  gazów  szlachetnych  posiadających  za- 
pełnione powłoki  elektronowe. 


Pomiary  a obliczenia 

Podobnie  jak  w obliczeniach  Hartree’ego-Focka  dla 
atomów,  tak  i dla  cząsteczek  obliczone  energie  HF 
stanowią  przeszło  99%  energii  dokładnej  cząsteczki 
(np.  dla  Li2:  ćhf  = — 14,8715  j.at.;  £do$w  — 
= -14,9944  j.at.;  dla  F2:ćHf  = -198,7683  j.at., 
£dośw  = -199,670  j.at.).  Znacznie  gorsze  wyniki  uzy- 
skuje się  przy  obliczaniu  energii  wiązania  lub  energii 
dysocjacji  cząsteczek.  Na  przykład  obliczona  metodą 
HF  energia  dysocjacji  cząsteczki  02  wynosi  1,43  eV, 
co  stanowi  zaledwie  27%  wartości  doświadczalnej 
5,21  eV.  Dla  cząsteczki  F2,  której  doświadczalna  ener- 
gia wiązania  wynosi  1,68  eV,  obliczenia  metodą  HF 
wykazują,  że  jest  ona  nietrwała  (ujemna  energia  wią- 
zania—1,37  eV !). 

Przyczyną  tych  rozbieżności  jest  stosowanie  przy- 
bliżenia jednoelektronowego,  w którym  pomija  się 
korelację  elektronów.  Energia  korelacji  dla  F2  jest 
większa  o ok.  3 eV  od  energii  korelacji  dla  dwóch  izo- 
lowanych atomów  fluoru  — wystarcza  to,  aby  otrzy- 
mać za  pomocą  metody  HF  absurdalny  wynik  dla 
energii  wiązania  cząsteczki  F2.  Wspominaliśmy  już,  że 
energię  korelacji  można  uwzględnić  w obliczeniach, 
posługując  się  metodą  oddziaływania  konfiguracyjne- 
go. Połączenie  metody  CI  z procedurą  SCF  dało  dla 
F2  energię  wiązania  1,67  eV  w doskonałej  zgodności 
z doświadczeniem.  Podobnie  dla  cząsteczki  02 
uwzględnienie  oddziaływania  konfiguracyjnego  daje 
nie  tylko  dobry  wynik  dla  energii  dysocjacji  cząsteczki 
(4,72  eV,  tj.  91%  wartości  doświadczalnej),  ale  prze- 
bieg krzywej  energii  potencjalnej  jest  również  w dobrej 
zgodności  z krzywą  doświadczalną  (rys.  34). 

W wielu  przypadkach  obliczenia  Hartree’ego-Focka 
dają  wartości  teoretyczne,  które  są  w dobrej  zgodności 
z danymi  doświadczalnymi.  Na  przykład  przewidywa- 
ne położenia  równowagi  dla  halogenków  alkalicz- 
nych, obliczone  momenty  dipolowe  (charakteryzujące 
niejednorodność  rozkładu  ładunku  elektrycznego  w 
cząsteczkach),  jak  również  wartości  wielu  wielkości 
spektroskopowych  są  w zasadzie  w bardzo  dobrej 
zgodności  z doświadczeniem  (tabela). 

Nie  zawsze  jednak  taka  zgodność  występuje,  zwłasz- 
cza gdy  zmierzone  wartości  doświadczalne  są  małe, 
np.  gdy  moment  dipolowy  cząsteczki  jest  mniejszy  od 

18  - Encyklopedia  fizyki  współczesnej 


1 D (1  debaja).  Dobrym  przykładem  ilustrującym  wy-  moment 
stępujące  tu  trudności  jest  przypadek  cząsteczki  CO.  dipolowy 
Wartość  doświadczalna  momentu  dipolowego  cza-  cząsteczki 

CO 


odległość  międzyjądrowa  R 

Rys.  34.  Porównanie  doświadczalnej  krzywej  energii  potencjalnej 
dla  stanu  podstawowego  cząsteczki  02  z krzywą  obliczoną  me- 
todą Hartree’ego-Focka  (HF)  oraz  obliczoną  przy  uwzględnie- 
niu oddziaływania  konfiguracyjnego;  wg  H.F.  Scheafer  III, 
J.  Chem.  Phys.  54,  2207  (1971) 


Momenty  dipolowe  i stale  spektroskopowe  halogenków 
alkalicznych  otrzymane  metodą  Hartree’ego- Focka.  Wy- 
niki porównano  z danymi  doświadczalnymi  (wartości  w na- 
wiasach) 
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(8,206) 

(9,002) 

(8,6) 

(debaj) 

3,18 

3,05 

Energia  wiąza- 
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Wg  R.L.  Matca,  J.  Chem.  Phys.  47,  4595,  5295  (1967);  48, 
335  (1968);  49,  1264(1968). 


steczki  jest  -0,112  D (znak  - oznacza  kierunek  mo- 
mentu dipolowego  C~0+).  Moment  dipolowy  obli- 
czony metodą  HF  różni  się  od  doświadczalnego  mo- 
mentu o ok.  0,4  D i ma  przeciwny  znak  (C+0~),  wy- 
nosi bowiem  0,274  D.  Dopiero  uwzględnienie  w obli- 
czeniach oddziaływania  konfiguracyjnego  poprawia 
teoretyczny  wynik  do  wartości  —0,077  D. 

Porównanie  teoretycznych  wartości  z danymi  do- 
świadczalnymi wskazuje,  że  obliczenia  HF  dla  ukła- 
dów dwuatomowych  mogą  niejednokrotnie  dawać 
wyniki,  które  różnią  się  od  danych  doświadczalnych 
nie  więcej  niż  o ok.  10-20%.  Taka  dokładność  w wielu 
wypadkach  jest  wystarczająca  dla  celów  porównaw- 
czych. Dlatego  też  kilka  lat  temu  powstał  pomysł  zbu- 
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odległość  międzyjądrowa  R 
B) 


C) 


dowania  „instrumentu  obliczeniowego”,  za  pomocą 
którego  chemik  lub  fizyk,  którzy  nie  są  specjalistami 
z zakresu  programowania  i nie  znają  szczegółów  me- 
tod matematycznych  potrzebnych  do  rozwiązywania 
równań  HF,  mogliby  otrzymywać  teoretyczne  warto- 
ści określonych  wielkości  fizykochemicznych  czą- 
steczki. Szczególne  znaczenie  ma  to  wówczas,  gdy  wy- 
konanie pomiarów  jest  bardzo  trudne  (np.  wymagają- 
ce budowania  specjalnej  aparatury)  lub  nawet  niebez- 
pieczne (praca  ze  związkami  trującymi).  Chemik  lub 
fizyk  może  wówczas  zdecydować  czy  wykonywać  po- 
miary, czy  też  oprzeć  się  na  wartościach  teoretycznych 
(wprawdzie  przybliżonych,  ale  stosunkowo  łatwo  osią- 
galnych). Kilka  lat  temu  A.C.  Wahl  i jego  współpra- 
cownicy z Argonne  National  Laboratory  (USA)  zbu- 
dowali system  obliczeniowy  nazwany  BISONem. 

Za  pomocą  tego  systemu  można  obecnie  dla  dowol- 
nego układu  dwuafomowego  obliczać  funkcje  falowe 
Hartree’go-Focka,  a następnie  uzyskiwać  informacje 
o gęstościach  elektronowych  w stanie  podstawowym 
oraz  w stanach  wzbudzonych,  obliczać  parametry  czą- 
steczek (np.  momenty  dipolowe)  czy  też  stałe  spektro- 
skopowe, jak  również  analizować  krzywe  energii  po- 
tencjalnej. Wyniki  końcowe  w zależności  od  życzenia 
mogą  być  wydrukowane  na  papierze,  przedstawione 
na  ekranie  kineskopu  lub  za  pomocą  filmu  (np. 
zmiany  w czasie  gęstości  ładunku  elektronowego  przy 
tworzeniu  cząsteczki).  Rys.  9 oraz  31-33  i 35  zostały 
właśnie  otrzymane  za  pomocą  systemu  BISON.  Co 
BISON  ciekawsze,  BISON  został  tak  skonstruowany,  aby 
fizyk  czy  chemik  mógł  porozumieć  się  z „przyrządem 
obliczeniowym”  za  pomocą  mowy  ludzkiej.  Muszą  oni 
jednak  używać  pewnych  słów  kodu  zrozumiałego  dla 
systemu  BISON.  Typowa  konwersacja  pomiędzy  che- 
mikiem a BISONem  może  wyglądać  następująco: 
Chemik:  Chciałbym  znać  wartość  momentu  dipolo- 
wego najniższego  energetycznie  stanu  duble- 
towego n cząsteczki  tlenku  wapnia  (CaO). 
BISON : Przy  jakiej  odległości  międzyjądrowej  ? 
Chemik:  Przy  odległości  równowagi. 

BISON:  Jeżeli  należy  obliczyć  położenie  równowagi, 
czas  obliczeń  będzie  wynosił  ok.  4 h.  Praw- 
dopodobny błąd  momentu  dipolowego  bę- 
dzie wynosił  ok.  20%.  Czy  mam  wykonywać 
obliczenia? 

Jeżeli  chemik  odpowie  „Tak”,  system  obliczeniowy 
zacznie  wykonywać  operacje  obliczeniowe. 

Dokładność  wyników  teoretycznych  uzyskiwanych 
za  pomocą  systemu  BISON  w niektórych  wypadkach 
nie  jest  oczywiście  zadowalająca.  Dlatego  też  konty- 
nuowane są  prace  nad  modyfikacją  tego  systemu. 
W przyszłości  chemik  lub  fizyk  będzie  mógł  uzyskiwać 
za  pomocą  tego  systemu  (lub  podobnego)  wyniki  teo- 
retyczne, które  będą  bardziej  dokładne  od  dotychcza- 
sowych (system  zostanie  udoskonalony  m.in.  przez 
uwzględnienie  oddziaływania  konfiguracyjnego).  Nie- 
mniej już  dzisiaj  chemik  kwantowy  może  w wielu  wy- 
padkach uzyskiwać  wyniki  teoretyczne,  które  dostar- 
czają cennych  wskazówek  doświadczalnikom.  I to  nie 
tylko  dla  małych  układów  cząsteczek  dwuatomowych, 
ale  również  dla  znacznie  większych  — dużych  ukła- 
dów wieloatomowych. 


Małe  układy  wieloatomowe 


Wspominaliśmy  już  o tym,  że  znajdowanie  orbitali 
molekularnych  HF  dla  cząsteczek  zbudowanych  z wię- 
cej niż  dwóch  atomów  stwarza  duże  trudności  nume- 
ryczne. Praktycznie  dla  takich  układów  znajduje  się 


orbitale  molekularne  przybliżone  przez  liniową  kom- 
binację funkcji  jednoelektronowych  (13).  Niemniej 
takie  orbitale  molekularne  znajdowane  metodą  SCF 


Rys.  36.  Tworzenie  cząsteczki  wody  z atomu  wodoru  i cząsteczki 
OH.  Warstwice  gęstości  elektronowej  OH,  H oraz  H20  obli- 
czone zostały  metodą  HF.  Wewnętrzne  warstwice  dla  OH  i HaO 
odpowiadają  gęstości  1,0 e/aj,  a dla  atomu  wodoru  gęstości 
0,25 e/o*;  warstwice  zewnętrzne  odpowiadają  gęstości  4,9-10“* 
efal;  wg  A.C.  Wahl,  U.  Blukis,  J.  Chem.  Educ.  45,  787  (1968) 


dają  np.  poprawny  opis  całkowitego  ładunku  elek- 
tronowego w cząsteczce.  Można  więc  przyjąć,  że  na 
przykład  rys.  36  poprawnie  przedstawia  rozkład  ła- 
dunku elektronowego  w cząsteczce  wody.  Dzięki  obli- 
czeniom teoretycznym  możliwe  jest  szczegółowe 
przeanalizowanie  zmian  rozkładu  ładunku  elektrono- 
wego cząsteczki;  wówczas,  gdy  znajduje  się  ona  w są- 
siedztwie innej  cząsteczki  (lub  atomu),  w wyniku  od- 
działywania między  nimi  nastąpi  reakcja  chemiczna 
(rys.  37). 

Metody  chemii  kwantowej  mogą  być  również  z po- 
wodzeniem zastosowane  do  badania  reakcji  chemicz- 
nych za  pomocą  tzw.  powierzchni  energii  potencjalnej 
układów.  Określenie  tych  powierzchni  jest  pierwszym 
krokiem  przy  teoretycznej  dyskusji  na  temat  szybkości 
reakcji  chemicznych.  Ogólne  własności  powierzchni 
energii  potencjalnych  można  prześledzić  na  przykła- 
dzie liniowej  reakcji  F-fH2— ► FH-t-H.  Rysunek  38 
przedstawia  względną  energię  całkowitą  układu  trzech 
atomów  (fluor  oraz  dwa  atomy  wodoru)  przy  ich  róż- 
nych wzajemnych  odległościach.  Energię  tę  obliczano 
przez  odjęcie  energii  substancji  reagujących  (tzn.  ener- 
gii atomu  F i energii  cząsteczki  H2)  od  energii  całko- 
witej układu : jeden  atom  fluoru  -f  dwa  atomy  wodoru. 
Obliczenia  dla  wspomnianej  reakcji  wykonano  w przy- 
bliżeniu jednoelektronowym  metodą  SCF  oraz  z 
uwzględnieniem  efektów  korelacji  metodą  SCF  CI. 
Rysunek  38  przedstawia  powierzchnię  energii  poten- 
cjalnej uzyskaną  za  pomocą  tego  drugiego,  bardziej 
dokładnego,  sposobu.  Linie  stałej  energii  naniesione 
są  jako  linie  warstwicowe.  Powierzchnia  energii  po- 
tencjalnej utworzona  jest  z dwóch  długich  wąskich 
dolin  przedstawiających  trwałe  cząsteczki  H2  i HF. 
Obszar  odpowiadający  substancjom  reagującym  (stan 
początkowy)  oddzielony  jest  od  obszaru  odpowiada- 
jącego produktom  (stan  końcowy)  obszarem  o wyż- 
szej energii,  w wyniku  czego  reakcja  ma  energię  akty- 
wacji (odpowiada  jej  bariera  reakcji  AEb  zaznaczona 
na  rys.  38).  Obliczona  wysokość  bariery  metodą  SCF 
CI  wynosi  5,8  kcal/mol  (metoda  SCF  bez  oddziaływa- 


Rys.  35.  Sekwencja  warstwie  całkowitej  gęstości  elektronowej  w układach  H2,  LiF  i He2  przy  różnej  odległości  międzyjądrowej  R. 
A)  Wiązanie  kowalencyjne:  tworzenie  cząsteczki  wodoru  Hz.  B)  wiązanie  jonowe:  tworzenie  cząsteczki  fluorku  litu  LiF.  C)  odpychanie 
między  atomami  gazów  szlachetnych  na  przykładzie  oddziaływania  między  atomami  helu.  Wewnętrzna  w-arstwica  dla  H..  odpowiada 
gęstości  0,25e/tfj>,  a wewnętrzne  warstwice  dla  LiF  i He2  odpowiadają  gęstości  1,0 ela^.  Warstwice  zewnętrzne  odpowiadają  gęstości 
4,9-10 Wykresy  u dołu  ukazują  zmiany  całkowitej  energii  cząsteczek  wraz  ze  zmianą  R 
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odległość  pomiędzy  jądrami  R 


Rys>  V-Jlzy  reakcic  Chemiczne  scharakteryzowane  przy  pomocy  warstwie  obrazujących  różnice  w gęstości  elektronowych  substratów 
i produktów  reakcji;  obliczenia  przeprowadzone  zostały  metodą  HF 


a>  b) 
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nia  konfiguracyjnego  daje  wysokość  bariery  równą  aż 
34,3  kcal/mol),  podczas  gdy  wyznaczona  doświadczal- 
nie energia  aktywacji  wynosi  ok.  1,7  kcal/mol  (ok. 

7 kJ/mol).  Przy  tak  małych  wartościach  energii  akty- 
wacji nie  można  jej  porównywać  bezpośrednio  z wy- 
sokością bariery  reakcji.  Prawdopodobnie  doświad- 
czalna bariera  reakcji  ma  wysokość  rzędu  5 kcal/mol 
(ok.  20  kJ/mol)  lub  nieco  mniej.  Wskazuje  to  na  bar- 
dzo dobrą  zgodność  wyników  obliczeń  metodą  SCF 
CI  z doświadczeniem  w porównaniu  z obliczeniami 
SCF  nie  uwzględniającymi  efektów  korelacji.  Oblicze- 
nia SCF  CI  dają  jeszcze  jeden  bardzo  interesujący  wy- 
nik — wskazują  one  mianowicie,  że  reakcja  F+H2  -*  reakcja 
->  FH+H  jest  reakcją  egzotermiczną.  Obliczona  bo-  F+H2-*FH  + H 
wiem  energia  końcowa  reakcji  jest  niższa  od  energii 
początkowej  o 20,4  kcal/mol,  co  stosunkowo  dobrze 
zgadza  się  z odpowiednią  wartością  doświadczalną 
wynoszącą  31,2  kcal/mol.  Warto  w tym  miejscu  pod- 
kreślić, że  obliczenia  SCF  bez  CI  nie  przewidują,  że 
reakcja  jest  egzotermiczna  — różnica  pomiędzy  ener- 
gią stanu  końcowego  a energią  stanu  początkowego 
reakcji  została  obliczona  jako  dodatnia  (+0,6  kcal/ 

/mol).  Uwzględnienie  efektów  korelacyjnych  w obli- 
czeniach, w których  porównuje  się  różnice  wielkości, 
ma  w wielu  przypadkach  istotne  znaczenie  (zwięk- 
szenie rozmiarów  oddziaływania  konfiguracyjnego  z 


Rys.  38.  Teoretyczny  opis  reakcji  chemicznej:  a)  Tradycyjna 
dwuwymiarowa  powierzchnia  energii  potencjalnej  liniowego 
układu  FH2  wyznaczona  na  podstawie  obliczeń  SCF  CI.  Energia 
podana  jest  w kcal/mol.  Odległość  F-H  zmienia  się  od  I,4«0 
do8,0a„,  a odległość  H-H  od  l,Oa0  do  7,6cr0.  Linia  przerywana 
oznacza  ,, drogę”  reakcji  odpowiadającą  najmniejszej  energii, 
b)  Schematyczne  przedstawienie  zależności  energii  reakcji  od 
współrzędnej  reakcji,  czyli  od  odległości  wzdłuż  drogi  reakcji 
o najmniejszej  energii  (linia  przerywana  na  rys.  a).  Zaznaczono 
wysokość  bariery  AEb  (energię  aktywacji)  oraz  energię  AEctz 
charakteryzującą  egzotermiczność  reakcji 


Porównanie  wyników  obliczeń  metodą  SCF  dla  cząsteczki 
NHa  z danymi  doświadczalnymi 


Wartość 

Wielkość 

obliczona 

metodą 

SCF 

doświad- 

czalna 

Długość  wiązania  N — H,  nm 
Kąt  między  wiązaniami  H — N — H, 

0,1000 

0,10116 

stopnie 

107,2 

106,8 

Moment  dipolowy  fi,  D 

1,66 

1,48 

Energia  całkowita,  j.at. 

-56,2219 

-56,578 

Bariera  dla  inwersji,  kcal/mol 

5,1 

5,8 

Wg  A.  Rauk,  L.C.  Allen,  E.  Clcraenti,  J.  Chem.  Pbys.  52,  4133 
(1970). 


214  konfiguracji  do  338  konfiguracji  poprawiło  zgo- 
i dność  obliczonej  energii  AEezz  z wartością  doświad- 
\ czalną  — wartość  obliczona  AEegz  — —34,4  kcal/ 


układów  obliczenia  są  kosztowne,  a wyniki  uzyskiwa- 
ne, jak  już  wspominaliśmy  kilkakrotnie,  są  mało  do- 
kładne. Aby  uzyskać  bowiem  dla  danego  układu  jak 
najlepszy  obraz  orbitalny,  tzn.  aby  wyniki  uzyskane 
metodą  SCF  MO  były  jak  najbardziej  zbliżone  do  wy- 
ników metody  Hartree^go-Focka,  przy  szukaniu  orbi- 
tali molekularnych  w postaci  (13)  musimy  używać  jak 
najdłuższej  bazy  (jak  największe  m w (13)).  Z punktu 
widzenia  rachunkowego  nie  jest  to  jednak  proste. 
Przyjęcie  dużej  liczby  funkcji  bazy  powoduje,  że 
dla  układu  wieloatomowego  rośnie  liczba  całek  jedno- 
i dwuelektronowych  występujących  w równaniach 
SCF  (12).  Gdy  liczba  funkcji  bazy  wynosi  w,  wów- 
czas liczba  całek  jednoelektronowych  równa  jest 
/w(m-bl)/2,  natomiast  liczba  całek  dwuelektrono- 
wych wynosi  [/?7(m-f  l)/4]  [/n(/??-fl)/2-ł-l].  Jak  widać 
liczba  tych  ostatnich  całek  gwałtownie  rośnie  wraz  ze 
wzrostem  liczby  funkcji  bazy  (wprawdzie  dla  m = 10 


cząsteczka 

amoniaku 


inwersja 


H2+F 

/mol  jest  większa  o ok.  10%  od  wartości  doświad- 
czalnej). 

Obliczenia  metodą  SCF  wykonano  dla  wielu  czą- 
steczek kilku-  i nawet  kilkudziesięcioatomowych. 
Jednakże  obliczenia  takie  dla  dużych  układów  są  mało 
dokładne  (str.  279).  Natomiast  dla  układów  kilku- 
atomowych  uzyskiwane  wyniki  z obliczeń  SCF  wyka- 
zują nieraz  bardzo  dobrą  zgodność  z wielkościami 
mierzonymi.  Przykładowo  w tabeli  porównano  obli- 
czenia SCF  z danymi  doświadczalnymi  dla  cząsteczki 
amoniaku.  Na  uwagę  zasługuje  fakt,  że  obliczenia 
SCF  dają  nie  tylko  poprawny  opis  geometrii  cząstecz- 
ki, ale  również  poprawnie  przewidują  wysokość  barie- 
ry dla  inwersji  w cząsteczce.  Cząsteczka  NH3  bowiem 
ma  kształt  piramidy,  a przejście  atomu  azotu  z jednej 
pozycji  do  drugiej  (inwersja)  wymaga  pokonania 
bariery  potencjału,  którą  można  zarówno  zmierzyć, 
jak  i obliczyć.  Jak  widać  na  przykładzie  cząsteczki 
NH3,  obliczenia  SCF  z powodzeniem  zostały  zastoso- 
wane do  opisu  tej  bariery  (mogą  więc  one  być  zastoso- 
wane do  badań  konformacyjnych). 


Metody  nieempiryczne 
i empiryczne  chemii  kwantowej 


Metoda  SCF  MO,  w której  orbitale  molekularne  po- 
szukiwane są  w postaci  (13),  może  być  zastosowana  do 
dowolnego  układu  chemicznego.  Jednakże  dla  dużych 


liczba  całek  jednoelektronowych  wynosi*  55,  a całek 
dwuelektronowych  4540,  ale  dla  m = 100  całek  jed- 
noelektronowych mamy  5050,  a dwuelektronowych 
już  12  751 250).  Obliczanie  dużej  liczby  całek  jest  bar- 
dzo pracochłonne  nawet  dla  szybkiego  komputera. 

Czytelnik  zdaje  sobie  oczywiście  sprawę,  że  rozmiar 
użytej  bazy  zależy  od  tego,  czy  zbieżność  rozwinięcia 
(13)  jest  szybka,  czy  też  nie,  tzn.  czy  używając  okre- 
ślonej bazy  (wybrana  postać  funkcji  bazy  oraz  ich  licz- 
ba) wyniki  uzyskane  metodą  SCF  MO  są  zbliżone  do 
wyników  metody  HF.  Okazuje  się,  że  używając  orbi- 
tali atomowych  jako  bazy  uzyskujemy  stosunkowo 
szybką  zbieżność  rozwinięcia  (13).  Pojawia  się  jednak 
wówczas  dodatkowy  kłopot.  Dla  cząsteczek  zawiera- 
jących więcej  niż  dwa  atomy  obliczanie  niektórych 
całek  występujących  w równaniach  (12)  jest  skompli- 
kowane. Można  uniknąć  tego  kłopotu  używając  w roz- 
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zbieżność 

rozwinięcia 


winięciu  (13)  nie  orbitali  atomowych  (AO  mają  wy- 
kładniczą zależność  od  odległości  elektronu  od  jądra 
postaci  orz'rla°t  zob.  (14)),  ale  tzw.  funkcji  gaussow- 
skich postaci  e_ar2.  Niestety,  unikając  kłopotu  z obli- 
czeniem szeregu  wspomnianych  całek  w (12),  traci  się 
zbieżność  rozwinięcia  (13).  Innymi  słowy,  aby  zrepro- 
dukować  wyniki  obliczeń  uzyskane  dla  określonej  czą- 
steczki metodą  SCF  przy  użyciu  AO  musimy,  używa- 
jąc jako  bazy  funkcji  Gaussa,  użyć  znacznie  większego 
rozwinięcia  (13).  A to  z kolei  zwiększa  liczbę  całek 
jedno-,  a szczególnie  dwuelektronowych. 

Pomimo  trudności  typu  numerycznego,  wykonano 
obliczenia  za  pomocą  metody  SCF  MO  dla  wielu  zło- 
żonych układów,  np.  dla  zasad  kwasów  nukleinowych 
i dla  ich  pary  guanina-cytozyna  (układ  136  elektro- 
nów), a ostatnio  dla  2,4,7-trójnitrofluorenonu  zawie- 
rającego aż  160  elektronów.  E.  Clementi  i jego  współ- 
pracownicy, którzy  wykonali  te  obliczenia  przyznają, 
że  wyniki  obliczeń  są  bardzo  przybliżone,  a jednocześ- 
nie bardzo  pracochłonne.  Na  przykład  dla  pary  gua- 
nina-cytozyna należało  obliczyć  ok.  70  mld  całek 
dwuelektronowych.  Pomimo  tego,  że  autorzy  ci  wy- 
konywali obliczenia  na  bardzo  szybkim  komputerze 
IBM  360/195  (obliczał  ok.  105  całek  na  1 s),  obliczenia 
SCF  trwały  ok.  8 dni.  Autorzy  wspominają,  że  wyko- 
nywane przez  nich  4 lata  wcześniej  obliczenia  na  IBM 
7094  dla  reakcji  NH3  + HC!^NH4C1  przebiegały 
ok.  400  razy  wolniej  (a  więc  gdyby  chciano  wówczas 
wykonać  obliczenia  dla  pary  guanina-cytozyna,  mu- 
siano by  zużyć  na  to  3200  dni!).  W ciągu  kilku  lat  na- 
stąpił więc  bardzo  duży  postęp  w technice  obliczenio- 
wej. Ale  nie  tylko  w technice  obliczeniowej.  Autorzy 
powyższych  obliczeń  w ciągu  kilku  lat  zmodyfikowali 
i udoskonalili  także  program  obliczeniowy  SCF  MO. 
Połączenie  myśli  matematycznej  programistów  (mate- 
matyków, chemików  kwantowych)  z jednoczesnym 
rozwojem  komputerów  doprowadziło  do  takiego 
przyspieszenia  obliczeń. 

Obliczenia  HF  czy  też  SCF  MO,  o których  wspo- 
minaliśmy dotąd,  są  obliczeniami  nieempirycznymi. 
W obliczeniach  tego  typu  nie  korzysta  się  z danych 
doświadczalnych  — wschodząc  z założeń  i postulatów 
mechaniki  kwantowej  wykonuje  się  obliczenia  aż  do 
uzyskania  wyników,  które  można  porównać  z danymi 
doświadczalnymi.  Jedynymi  w-artościami  doświadczal- 
nymi stosowanymi  w teorii  są  stałe  uniwersalne,  takie 
jak  ładunek  i masa  elektronu,  czy  też  stała  Plancka, 
teorie  Teorie  takie  w chemii  kwantowej  nazywane  są  często 
ab  initio  teoriami  ab  initio , bowiem  w teoriach  tych  obliczane 
są  wszystkie  całki  występujące  od  momentu  rozpoczę- 
cia obliczeń  (czyli  ab  initio). 

Mimo  dynamicznego  rozwoju  w dziedzinie  kompu- 
terów, wysoki  koszt  obliczeń  ab  initio  i ich  niewystar- 
czająca dokładność  dla  dużych  układów  chemicznych 
powodują,  że  nadal  w chemii  kwantowej  używane  są 
metody  przybliżone,  szczególnie  metody  półempirycz- 
ne.  W metodach  tych  niektóre  całki  występujące  w 
teorii  wyznacza  się  z danych  doświadczalnych.  Omó- 
wiliśmy poprzednio  w sposób  jakościowy  wiązanie 
chemiczne  w układach  dwuatomowych  (str.  267).  Za- 
miast obliczać  wartość  całki  rezonansowej  fi  występu- 
jącej w wyrażeniu  na  energię  orbitalu  wiążącego 
(wzór  (20)),  możemy  tak  dobrać  jej  wartość,  aby  pew- 
ne wyniki,  np.  energię  cząsteczki  lub  jej  potencjał  joni- 
zacyjny otrzymać  zgodne  z doświadczeniem.  Postępo- 
wanie takie  umożliwia  nieraz  wyznaczenie  innych 
wielkości  teoretycznych,  już  bez  odwoływania  się  do 
teorie  pół-  doświadczenia.  W taki  sposób  sformułowana  teoria 
empiryczne  nosi  nazwę  teorii  półempirycznej,  a całki,  które  trak- 
tuje się  jako  wielkości  dobierane,  nazywamy  para- 
metrami teorii.  Teorie  półempiryczne  są  często  bar- 
dziej przydatne  od  teorii  ab  initio , szczególnie  w od- 
niesieniu do  dużych  cząsteczek.  Jednak  rozmiar  ukła- 
dów chemicznych,  dla  których  obliczenia  ab  initio 
stają  się  użyteczne,  zwiększa  się  z każdym  rokiem. 

W ciągu  kilkudziesięcioletniej  historii  chemii  kwan- 
towej opracow-ano  tak  dużo  wersji  różnych  metod  pół- 
empirycznych,  że  nie  sposób  je  tu  wszystkie  omówić. 


Wspomnijmy  jedynie  o najbardziej  charakterystycz- 
nych metodach. 

Najstarsza  metoda  półempiryczna  chemii  kwanto- 
wej wyrosła  na  gruncie  badań  własności  cząsteczek 
organicznych.  Elektrony  walencyjne  atomów  wcho- 
dzących w skład  tych  cząsteczek  tworzą  charakterysty- 
czne dwie  grupy  wiązań  — wiązania  o oraz  wiązania  n. 

Te  ostatnie  wiązania  utworzone  są  przez  układ  elek- 
tronów n odpowiedzialny  za  wiele  charakterystycz- 
nych własności  cząsteczek  organicznych.  W przybliżę-  przybliżenia 
niu  ^-elektronowym  rozpatruje  się  jedynie  układ  elek-  .^-elektrono- 
tronów  n cząsteczki,  tzn.  znajduje  się  funkcję  falową  we 
i energię  dla  tych  tylko  elektronów.  Zakłada  się,  że 
elektrony  n poruszają  się  w pewnym  potencjale  po- 
chodzącym od  jąder  cząsteczki  i układu  elektronów  o. 

W najprostszym  sformułowaniu  Zaproponowanym  metoda  HMO 
przez  E.  Hiickla  (metoda  HMO  — Hiickel  MO)  po-  — Hiickel  MO 
szukuje  się  orbitali  molekularnych  dla  elektronów  n 
cząsteczki  w postaci  LCAO  (jako  bazę  funkcji  w (13) 
wybiera  się  jedynie  orbitale  walencyjne  atomów  odda- 
jących elektrony  n do  układu).  Drastycznym  przybli- 
żeniem wprowadzonym  w metodzie  HMO  jest  pomi- 
nięcie oddziaływania  między  elektronami  n w hamil- 
tonianie ^-elektronowym  — przyjmuje  się  go  w posta- 
wy n * 

ci  H = J?Het(i),  gdzie  suma  przebiega  po  wszyst- 

i«l 

kich  elektronach  n cząsteczki.  Współczynniki  cp%  roz- 
winięcia MO  na  AO  (13)  oblicza  się  metodą  Ritza 
(por.  wzory  (8)  oraz  (9)).  Parametrami  empirycznymi 
teorii  są  całki  kulombowskie  ap(=  = f<PpHe1<ppdv) 

oraz  całki  rezonansowe  pPQ  (=  Hvq  = f<pPHet<pQdv). 

Rozwiązując  układ  równań  typu  (9),  otrzymujemy 
orbitale  molekularne  y*  oraz  odpowiadające  im 
energie  orbitalne  £*. 

Gdy  uwzględniamy  w hamiltonianie  ^-elektrono- 
wym bezpośrednio  oddziaływanie  między  elektronami 
(tzn.  w hamiltoniaanie  ^-elektronowym  występuje  wy- 
raz 'Ze2inu  gdzie  suma  przebiega  po  wszystkich 

i<i 

elektronach  ^),  orbitale  molekularne  yn  są  nadal  pizy- 
bliżone,  tak  jak  w metodzie  HMO  w postaci  LCAO 
(13),  ale  znajduje  się  je  przez  rozwiązanie  równań 
SCF.  Parametrami  empirycznymi  metody  są  w zasa- 
dzie całki  rezonansowe  typu  fiPg,  jednak  dodatkowo 
wiele  całek  występujących  w elementach  macierzowych 
operatora  Hartree’go-Focka  F w (12)  przybliża 
się  przez  wartości  doświadczalne  (np.  przez  potencja- 
ły jonizacyjne  czy  też  powinowactwa  elektronowe 
poszczególnych  stanów  walencyjnych  atomów)  lub 
też  przyjmuje  się  na  nie  przybliżoną  postać  (np.  wzory 
ekstrapolacyjne  na  całki  dwuelektronowej.  Metoda 
półempiryczna  SCF  LCAO  MO  jest  szczególnie  uży- 
teczna przy  interpretacji  elekti Gilowych  widm  absorp- 
cyjnych cząsteczek  organicznych.  Okazuje  się  jednak, 
że  w tym  celu  należy  użyć  konfiguracyjnego  oddziały- 
wania (zob.  Korelacja  elektronów)  — konfiguracje 
wzbudzone  dla  cząsteczki  tworzy  się  z orbitali  mole- 
kularnych uzyskanych  z rozwiązań  równań  SCF.  Taką 
wersję  metody  półempirycznej  nazywa  się  metodą 
SCF  LCAO  MO  CI,  a jej  bardzo  popularny  wariant 
z przybliżeniami  wyprowadzonymi  przez  trzech  che- 
mików kwantowych  nosi  nazwę  metody  Parisera-Par- 
ra-Pop!e’a  (lub  metody  PPP),  od  nazwisk  autorów 
metody. 

Obie  wspomniane  metody  można  rozszerzyć  na 
elektrony  walencyjne  cząsteczki  (i  to  oczywiście  nie 
tylko  dla  cząsteczek  organicznych,  ale  dla  dowolnego  rozszerzona 
układu  chemicznego).  Rozszerzenie  metody  HMO  teoria  Hiickla 

nosi  nazwę  rozszerzonej  teorii  Hiickla  (EHT  — Ex EHT 

tended  Hiickel  Theory)  — najbardziej  popularna  wer- 
sja tej  metody  została  opracowana  przez  R.  Hoffman- 
na w latach  1963-64.  W metodzie  tej,  podobnie  jak 
w HMO,  hamiltonian  układu  elektronów  walencyj- 
nych jest  określony  w postaci  H = Ęh*1  (i)  (tutaj 

suma  przebiega  po  wszystkich  elektronach  walencyj- 
nych układu),  a orbitale  molekularne  (będące  kombi- 
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nacją  liniową  orbitali  walencyjnych  atomów  tworzą- 
cych cząsteczkę)  znajduje  się  metodą  Ritza.  W meto- 
dzie EHT  sposób  oceny  całek  <xp  oraz  ppq  jest  inny  niż 
w metodzie  HMO,  pominiemy  jednak  tutaj  szczegóły 
parametryzacji. 

Jeśli  w hamiltonianie  dla  elektronów  walencyjnych 
uwzględni  się  bezpośrednie  oddziaływania  pomiędzy 
elektronami,  to  orbitale  molekularne  znajduje  się 
wówczas  za  pomocą  procedury  SCF.  Niektórzy  ba- 
dacze wprowadzili  niezależnie  od  siebie  różne  przybli- 
żenia na  poszczególne  całki  występujące  w elemen- 
tach macierzowych  operatora  F — przybliżeń  tych 
jest  dużo,  i nie  będziemy  ich  tutaj  wymieniać.  Naj- 
bardziej popularne  z tych  metod  są : metoda  CNDO/2 
opracowana  przez  J.A.  Pople'a  i G.A.  Segala  (1966), 
oraz  wersja  tej  metody  z dołączonym  konfiguracyj- 
nym oddziaływaniem  — metoda  CNDO/S  CI  (J.  Del 
Bene  i H.H.  Jaffe,  1968),  metoda  INDO  (J.A.  Popie 
i współpracownicy  1967)  oraz  metoda  MINDÓ/2 
(M.J.S.  Dewar  i E.  Haselbach,  1970).  Metody  te, 
uwzględniające  elektrony  walencyjne  i oparte  na  pro- 
cedurze SCF,  nazywane  są  często  metodami  AVE 
{AU  Valence  Electrons ). 

Półempiryczne  teorie  miały  i mają  nadal  bardzo 
duże  znaczenie  dla  chemii.  Niekorzystną  sytuację 
stwarza  fakt,  że  jest  tych  teorii  za  dużo.  Każda  ze 
wspomnianych  metod  (HMO,  SCF  MO  CI,  EHT, 
AVE)  ma  wiele  wariantów  różniących  się  sposobem 
oceny  parametrów  półempirycznych  czy  też  sposobem 
przybliżeń  wprowadzonych  do  oceny  całek.  Przyczyną 
takiej  sytuacji  jest  to,  że  nie  można  sformułować  teorii 
półempirycznej  w ten  sposób,  aby  interpretowała  ona 
wszystkie  fakty  doświadczalne.  Wartość  wyznaczo- 
nych parametrów  półempirycznych  określonej  metody 
zależy  od  tego,  do  interpretacji  jakich  własności  fizy- 
kochemicznych cząsteczki  została  użyta  teoria.  Na 
przykład  metoda  CNDO/2  odnosi  duże  sukcesy  w in- 
terpretacji geometrii  cząsteczek,  natomiast  przewidy- 
wane widma  elektronowe  cząsteczek  nie  pokrywają 
się  z doświadczeniem.  Poprawną  interpretację  widm 
elektronowych  otrzymuje  się  wówczas,  gdy  nie  tylko 
dołączy  się  konfiguracyjne  oddziaływanie,  ale  gdy  do- 
datkowo w metodzie  CNDO/2  zmieni  się  niektóre 
całki  (dokonać  więc  trzeba  zmiany  parametryzacji). 
Taka  zmieniona  metoda  CNDO/S  CI  poprawnie  opi- 
suje własności  spektroskopowe  cząsteczek,  ale  nie  jest 
już  ona  w stanie  opisać  poprawnie  ich  geometrii  stanu 
podstawowego.  Nic  więc  dziwnego,  że  chemicy  kwan- 
towi rozbudowują  obliczenia  ab  initio , aby  uwolnić  się 
od  niepewności  spowodowanej  wprowadzoną  para- 
metryzacją. 

Dlatego  też  należy  z dużą  ostrożnością  podchodzić 
do  wyników  obliczeń  półempirycznych.  Niemniej, 
kilkudziesięcioletnia  praktyka  tych  obliczeń  wskazuje, 
że  metody  półempiryczne  w wielu  przypadkach  opisują 
poprawnie  korelacje  pomiędzy  własnościami  serii 
podobnych  cząsteczek. 


Disże  układy 


Przez  duże  układy  będziemy  rozumieli  tutaj  wielo- 
elektronowe  układy  chemiczne,  np.  cząsteczkę  orga- 
niczną lub  nieorganiczną,  kompleks  tych  cząsteczek, 
kryształ  lub  polimer.  Ograniczymy  nasze  rozważania 
w zasadzie  jedynie  do  cząsteczek  organicznych  (ukła- 
dy te  były  przedmiotem  najbardziej  intensywnych  ba- 
dań teoretycznych).  Są  to  na  ogół  układy  płaskie  (lub 
też  układy,  których  niektóre  części  są  płaskie),  odzna- 
czające się  dużą  stabilnością  energetyczną.  Zanim 
omówimy  niektóre  zastosowania  chemii  kwantowej 
do  badania  własności  tych  układów,  opiszemy  jako- 
ściowo strukturę  elektronową  najprostszych  cząste- 
czek, rozpoczynając  od  skrótowego  przedstawienia 
pojęcia  orbitali  zhybrydyzowanych  na  przykładzie 
cząsteczki  etylenu. 


Orbitale  zhybrydyzowane 


Cząsteczka  etylenu  C2Hi  jest  układem  płaskim  i sy- 
metrycznym — odległości  między  środkami  atomów 
węgla  i wodoru  (długość  wiązania  C — H)  są  takie 
same,  a kąty  H — C — H utworzone  między  dwiema 
prostymi  liniami  wyrysowanymi  od  środka  atomu  cząsteczka 
węgla  do  atomu  wodoru  wzdłuż  wiązań  (kąty  wiązań)  etylenu 
są  prawie  równe  120°.  W najprostszym  schemacie 
jednoelektronowym  (str.  251)  wiązania  w etylenie 
utworzone  są  przez  elektrony  walencyjne  atomów 
wchodzących  w skład  cząsteczki  (elektrony  2 s i 2 p 
dwóch  atomów  węgla  i elektrony  Is  czterech  atomów 
wodoru).  Omawiając  konfiguracje  elektronowe  ato- 
mów (zob.  Atomy  wieloelektronowe)  podaliśmy  dla 
węgla  konfigurację  stanu  podstawowego  l522522/?2. 

Jest  to  konfiguracja  elektronowa  stanu  podstawowe- 
go swobodnego  atomu  węgla.  Gdyby  taką  konfigura- 
cję przyjąć  dla  węgla  w cząsteczce,  nie  można  by  było 
wytłumaczyć  w prostym  schemacie  równocenności 
szeregu  wiązań  cząsteczki.  W cząsteczce  atom  nie  jest 
swobodny;  jest  on  otoczony  innymi  atomami,  które 
powodują  zmianę  rozkładu  elektronów  walencyjnych 
atomu  w porównaniu  z atomem  swobodnym.  Mówi-  stan 
my,  że  atom  w cząsteczce  znajduje  się  w określonym  walencyjny 
stanie  walencyjnym.  Przez  stan  walencyjny  atomu  bę-  atomu 
dziemy  rozumieli  pewien  hipotetyczny  rozkład  elek- 
tronów atomu.  Stan  walencyjny  określonego  atomu 
węgla  np.  w cząsteczce  etylenu  to  taki  rozkład  elek- 
tronów tego  atomu,  który  powstałby  w wyniku  usu- 
nięcia wszystkich  pozostałych  atomów  z cząsteczki 
z ich  elektronami  do  nieskończoności  przy  niezmie- 
nionym ukierunkowaniu  wiązań.  W stanie  walencyj- 


Rys.  40.  Kształty  orbitali  zhybrydyzowanych  i niezhybrydyzo- 
wanych  atomów  węgla  i wodoru  w cząsteczce  etylenu:  a)  przekrój 
powierzchni  granicznej  orbitalu  zhybrydyzowanego  typu  sp*; 
b)  przekroje  powierzchni  granicznych  orbitali  zhybrydyzowa- 
nych spl  atomów  węgla  i orbitali  1$  atomów  wodoru;  c)  orbitale 
2 pg  atomów  węgla 
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nym  atomu  elektrony  znajdują  się  na  tzw.  zhybrydy- 
zowanych orbitalach,  które  można  przedstawić  jako 
liniową  kombinację  AO  swobodnego  atomu  (każdy 
orbital  zhybrydyzowany  ma  więc  częściowo  cechy 
różnych  orbitali  swobodnego  atomu).  W przypadku 
atomu  węgla  w cząsteczce  etylenu  mamy  do  czynienia 
z hybrydyzacją  trygonalną  (lub  hybrydyzacją  typu 
sp2)  --  w wyniku  mieszania  jednego  orbitala  typu  2s 
i dwóch  orbitali  typu  2 p otrzymujemy  trzy  równoważ- 
ne orbitale  (hybrydy)  sp 2 : 

hi  ~ + (r  = 1,  2,  3). 

Podczas  hybrydyzacji  tego  typu  jeden  z orbitali  2 p 
(tutaj  2 pz)  pozostaje  niezmieniony. 

Na  rys.  40  przedstawiono  przekroje  powierzchni 
granicznych  orbitali  sp2.  Okazuje  się,  że  orbitale  sp2 
są  symetryczne  względem  odbicia  w płaszczyźnie  czą- 
steczki (przy  przyjęciu  układu  współrzędnych  jak  na 
rys.  40  jest  nią  płaszczyzna  xy ).  Natomiast  orbital  2 pz 
jest  antysymetryczny  względem  odbicia  w płaszczyź- 
nie cząsteczki. 

Korzystając  więc  z orbitali  zhybrydyzowanych  moż- 
na bardzo  łatwo  wytłumaczyć  tworzenie  się  wiązań 
w cząsteczce  etylenu.  Cząsteczka  ta  ma  pięć  wiązań 
typu  a.  Jedno  z tych  wiązań,  wiązanie  C— -C,  utwo- 
rzone jest  przez  dwa  zhybrydyzowane  orbitale  sp 2 ato- 
mów węgla  cząsteczki  i opisane  jest  wiążącym  orbita- 
lem  molekularnym  (analogicznie  jak  w przypadku 
cząsteczek  dwuatomowych  orbital  molekularny  jest 
kombinacją  liniową  dwóch  zhybrydyzowanych  orbi- 
tali atomowych  sp2  zlokalizowanych  na  dwóch  ato- 
mach węgla).  Cztery  pozostałe  wiązania  typu  cr  (są  to 
wiązania  C— H)  opisane  są  orbitalami  molekularny- 
mi utworzonymi  z kombinacji  liniowych  orbitala  ato- 
mowego ls  atomu  wodoru  i jednego  zhybrydyzowa- 
nego  orbitala  sp2  atomu  węgla.  W cząsteczce  etyle- 
nu— oprócz  wspomnianych  pięciu  wiązań  — wystę- 
puje dodatkowe  wiązanie.  Jest  ono  utworzone  wsku- 
tek silnego  przenikania  się  orbitali  atomowych  2pz 
atomów  węgla.  To  dodatkowe  wiązanie  opisane  jest 
wiążącym  orbitalem  molekularnym  utworzonym  przez 
kombinację  liniową  orbitali  atomowych  2 pz  (por.  rys. 
29)  zlokalizowanych  na  atomach  węgla  cząsteczki 
(jest  to  wiązanie  typu  n).  W cząsteczce  etylenu  wystę- 
puje więc  wiązanie  podwójne  pomiędzy  atomami  węg- 
la — jedno  wiązanie  o i jedno  wiązanie  n.  Własności 
przestrzenne  obu  wiązań  są  oczywiście  odmienne. 
Oprócz  omówionej  powyżej  hybrydyzacji  typu  sp2 
bardzo  użyteczne  w chemii  są  hybrydyzacje  typu  sp 3 
oraz  typu  sp.  Nie  będziemy  jednak  ich  tu  omawiali. 


4 — *- 


4 — *- 


Rys.  41.  Układ  orbitali  molekular- 
ne-c,  nych  cząsteczki  etylenu.  Str^ał- 
<7c_h  kami  zaznaczono  obsadzenie  orbi- 
tali przez  elektrony  walencyjne 
(konfiguracja  stanu  podstawowego) 

Z rozważań  energetycznych  wynika,  że  orbitale  mo- 
lekularne opisujące  wiązania  a w cząsteczce  mają  niż- 
szą energię  aniżeli  orbitale  molekularne  typu  n.  Każ- 
dy z tych  orbitali  molekularnych  w stanie  podstawo- 
wym cząsteczki  jest  zajęty  przez  dwa  elektrony  o prze- 
ciwnie skierowanych  spinach  (por.  rys.  41).  Nad  orbi- 
talami wiążącymi  znajdują  się  orbitale  molekularne 
antywiążące,  nieobsadzone  w stanie  podstawowym 
przez  elektrony. 

W podobny  sposób,  w jaki  rozpatrywaliśmy  tworze- 
nie orbitali  molekularnych  w etylenie,  można  rozwa- 
żać orbitale  molekularne  cząsteczek  bardziej  złożo- 
nych, jak  benzenu,  naftalenu  itp.  Komplikacje  wiążą 
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się  wyłącznie  ze  zwiększeniem  się  liczby  elektronów  cząsteczka 
walencyjnych.  I tak  np.  w benzenie  (30  elektronów  benzenu 
walencyjnych)  mamy  sześć  atomów  węgla  o hybrydy- 
zacji sp2  i sześć  atomów  wodoru.  Każdy  atom  węgla 
tworzy  jedno  wiązanie  cc-n  z atomem  wodoru  oraz 
dwa  wiązania  <rc-c  z sąsiednimi  atomami  węgla. 

Mamy  więc  w benzenie  6 wiązań  ac-n  i 6 wiązań 
erc-c.  Każdy  z atomów  węgla  ma  po  jednym  nie- 
zhybrydyzowanym  orbitalu  atomowym  typu  2 pz. 

Z orbitali  tych  możemy  utworzyć  więc  wiązania 
typu  n.  W jaki  sposób?  Czy  w taki  sam  sposób  jak 
w etylenie?  W cząsteczce  etylenu  dwa  orbitale  2 pz 
tworzą  wiązanie  typu  n i wspólnie  z wiązaniem  oc-c 
w cząsteczce  zostaje  utworzone  wiązanie  podwójne. 

Fakt  ten  zaznaczony  jest  we  wzorze  strukturalnym 
etylenu  przez  podwójną  kreskę  pomiędzy  atomami 

węgla  ^ benzenie  powinniśmy  w za- 

sadzie wyróżnić  trzy  wiązania  — benzen  powinien 
mieć  trzy  wiązania  podwójne  (struktura  a).  Struktura 
taka  jest  jednak  sprzeczna  z własnościami  benzenu. 

Na  przykład  wszystkie  długości  wiązań  pomiędzy  ato- 
mami węgla  są  jednakowe,  cząsteczka  ma  wysoką  sy- 
metrię/)^. Fakty  te  związane  są  z własnościami  elek- 
tronów opisanych  orbitalami  atomowymi  typu  2 pz. 

Okazuje  się,  że  są  one  bardzo  „ruchliwe”,  w przeci- 
wieństwie do  elektronów  tworzących  wiązania  a nie 
ograniczają  swojej  obecności  do  obszaru,  gdzie  two- 
rzą wiązania.  Nie  można  po  prostu  odróżnić  wiązań 
7t  (struktura  b).  Orbitale  atomowe  2 pz  poprzez  liniowe 
kombinacje  tworzą  orbitale  molekularne.  W czą- 
steczce benzenu  sześć  orbitali  atomowych  2 pz  tworzy 
sześć  liniowo  niezależnych  orbitali  molekularnych: 
trzy  z nich  są  \yiążącymi  orbitalami,  a trzy  orbitalami 
antywiążącymi. 

W cząsteczkach  organicznych  zawierających  tlen  elektrony 
lub  azot,  oprócz  elektronów  o i n rozróżnia  się  jeszcze  typu  n 
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Rys.  42.  Układ  orbitali  molekularnych  w cząsteczkach  benzenu 
i pirydyny.  Strzałkami  zaznaczono  obsadzenie  orbitali  moleku- 
larnych przez  elektrony  walencyjne  atomów  (konfiguracja  stanu 
podstawowego) 


cząsteczka  jeden  rodzaj  elektronów  — elektrony  typu  n.  Własno- 
pirydyny  ści  tych  ostatnich  elektronów  omówimy  na  przykła- 
dzie cząsteczki  pirydyny  (rys.  42).  Swobodny  atom 
azotu  w stanie  podstawowym  ma  konfigurację  elektro- 
nową \ś*2&2p* — ma  więc  on  pięć  elektronów  walen- 
cyjnych. W pierścieniu  pirydynowym  orbitale  atomo- 
we azotu  mają,  podobnie  jak  orbitale  węgla,  hybrydy- 
zację sp 2.  Dwa  elektrony  walencyjne  atomu  azotu 
opisane  hybrydami  sp 2 tworzą  wiązanie  <rc-v  z elek- 
tronami sp2  sąsiednich  atomów  węgla.  Trzeci  orbital 
orbita!  sp2  azotu  nie  tworzy  żadnego  wiązania,  gdyż  w jego 
niewiążący  sąsiedztwie  nie  ma  innego  atomu  ani  grupy.  Orbital 
(orbita!  n)  ten  nazywamy  orbital em  niewiążącym  (od  ang.  non - 
bonding ) lub  po  prostu  orbitalem  n.  Na  orbitalu  tym 
znajduje  się  para  elektronów  n mających  przeciwnie 
skierowane  spiny.  Warto  podkreślić,  że  orbital  nie- 
wiążący opisujący  elektrony  n jest  symetryczny  wzglę- 
dem odbicia  w płaszczyźnie  cząsteczki  (jest  to  zrozu- 
miałe, gdyż  orbital  n jest  po  prostu  orbitalem  zhybry- 
dyzowanym  sp2).  Ostatni,  piąty  elektron  walencyjny 
azotu,  jest  opisany  orbitalem  2pz  i jest  po  prostu  elek- 
tronem n.  Elektron  ten  wchodzi  w sprzężenie  z pię- 
cioma elektronami  n pochodzącymi  od  atomów  węgla 
cząsteczki.  Mamy  w ten  sposób  utworzony,  podobnie 
jak  w benzenie,  układ  sześciu  elektronów  n.  I zupełnie 
w ten  sam  sposób  jak  w benzenie  z sześciu  orbitali 
atomowych  2 pz  możemy  utworzyć  sześć  niezależnych 
orbitali  molekularnych  7ty  z których  trzy  najniższe 
energetycznie  będą  obsadzone  przez  sześć  elektronów 
w stanie  podstawowym  cząsteczki  pirydyny.  Na  uwagę 
zasługują  pewne  różnice  pomiędzy  orbitalami  mole- 
kularnymi benzenu  i pirydyny.  W benzenie,  mającym 
wysoką  symetrię,  współczynniki  rozwinięcia  orbitali 
molekularnych  na  orbitale  atomowe  2 pz  można  łatwo 
wyznaczyć,  korzystając  z własności  symetrii  układu. 
Tak  więc  postać  takich  przybliżonych  orbitali  mole- 
kularnych benzenu  jest  wyznaczona  przez  topologię 
układu.  Natomiast  dla  pirydyny,  wykorzystując  jedy- 
nie własności  symetrii  cząsteczki  nie  można  wyzna- 
czyć postaci  orbitali  molekularnych.  Dalsza  różnica 
polega  na  tym,  że  w benzenie  występują  orbitale  mole- 
kularne Ti  zdegenerowane,  natomiast  w pirydynie  nie 
występuje  degeneracja  orbitali  ti. 

Pomiędzy  układem  wiążących  orbitali  molekular- 
nych ti  pirydyny  a układem  antywiążących  orbitali  ti* 
znajduje  się  orbital  niewiążący  n zajęty  w stanie  pod- 
stawowym cząsteczki  przez  dwa  elektrony.  Tak  wyso- 
kie energetycznie  położenie  orbitalu  n związane  jest 
z tym,  że  nie  tworzy  on  żadnego  wiązania. 

Posługując  się  orbitalami  zhybrydyzowanymi  moż- 
na bardzo  łatwo  określić,  ile  elektronów  typu  o i ti  ma 
dana  cząsteczka,  a tym  samym  można  określić,  ile 
orbitali  molekularnych  typu  o i ti  można  zbudować 
dla  niej.  Hybrydyzacja  orbitali  atomowych  jest  tylko 
procedurą  matematyczną  i chociaż  jest  ona  bardzo 
użyteczna  przy  opisie  jakościowym  wiązań  w cząs- 
teczce, nie  jest  wcale  konieczna.  Zgodnie  bowiem 
ze  schematem  przybliżenia  jednoelektronowego,  każ- 
dy elektron  walencyjny  cząsteczki  opisany  jest  orbita- 
lem molekularnym,  który  może  być  przybliżony  przez 
LCAO.  Jako  rozwinięcia  MO  na  LCAO  można  użyć 
orbitali  atomowych  walencyjnych  atomów  tworzących 
cząsteczkę  (taką  bazę  używa  się  w obliczeniach  pół- 
empirycznych),  ale  baza  może  być  oczywiście  większa. 
W tym  sformułowaniu  orbital  molekularny  opisujący 
elektron  o lub  ti  jest  rozciągnięty  po  całej  cząsteczce, 
i nie  charakteryzuje  określonego  wiązania  pomiędzy 
dwoma  atomami  cząsteczki. 

Niezależnie  od  rodzaju  przybliżenia  użytego  do 
opisu  orbitali  molekularnych  wszystkie  MO  cząstecz- 
ki organicznej  (jeśli  jest  ona  płaska)  dzielimy  na  dwa 
typy  — orbitale  a (tutaj  wchodzą  też  orbitale  ny  które 
mają  symetrie  a)  i orbitale  ti.  Orbitale  zajęte  przez 
elektrony  w konfiguracji  podstawowej  nazywamy 
orbitalami  wiążącymi,  natomiast  orbitale  nie  zajęte 
przez  elektrony  w tej  konfiguracji  nazywamy  orbitala- 
mi antywiążącymi.  Względne  rozmieszczenie  energe- 
tyczne orbitali  molekularnych  o , ti  oraz  n w cząsteczce 


pokazane  jest  na  rys.  43.  Obliczenia  półempiryczne 
typu  EHT  lub  AVE,  jak  również  obliczenia  ab  initio 
pokazują,  że  w złożonych  cząsteczkach  organicznych 
niektóre  orbitale  molekularne  n znajdują  się  pomię- 


te 

’o> 


c 

<v 


Rys.  43.  Schematyczny  uk- 
ład orbitali  molekularnych 
w cząsteczce  organicznej. 
Strzałki  oznaczają  okreś- 
lone przejścia  elektronowe 
związane  z absorpcją  pro- 
mieniowania elektroma- 
gnetycznego 
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dzy  orbitalami  ti  — w takich  układach  nie  ma  więc 
ścisłego  podziału  obszarów  energii  orbitalnych  na 
obszar  energii  orbitali  a,  n oraz  n.  W ogólności  jednak 
orbitale  a mają  niższe  energie  niż  orbitale  Tiy  a te  z ko- 
lei niższe  niż  orbitale  n.  Schemat  energetyczny  orbi- 
tali molekularnych  przedstawiony  na  rys.  43  tłuma- 
czy niektóre  fakty  z elektronowej  spektroskopii  mo- 
lekularnej (-►  Spektroskopia  molekularna  — Widma 
elektronowe  cząsteczek).  Tak  więc  promieniowanie 
elektromagnetyczne  padające  na  cząsteczkę  powoduje 
różnego  typu  przejścia  elektronowe,  mające  swoje 
charakterystyczne  własności.  Zadaniem  spektros- 
kopii doświadczalnej,  jak  również  teoretycznej  jest 
m.in.  określenie  natury  stanów  wzbudzonych  (tzn. 
rodzaju  przejścia:  przejście  ti  ->  ti*  czy  n ->  ti*  itd.) 
cząsteczek  organicznych  (zob.  rys.  15). 


Własności  fizykochemiczne  cząsteczki 

Korzystając  z określonej  metody  półempirycznej  lub 
ab  initio  można  dla  danej  cząsteczki  wyznaczyć  jej 
orbitale  molekularne,  a tym  samym  można  wyznaczyć 
przybliżoną  funkcję  falową  opisującą  konfigurację 
stanu  podstawowego  cząsteczki.  Za  pomocą  tej  funk- 


Kąty  między  wiązaniami  w różnych  cząsteczkach 


Cząsteczka 

Kąt 

Wartość,  stopnie 

doświadczalna 

teoretyczna 

(metoda 

CNDO/2) 

NH, 

H— N— H 

103 

107 

HjO 

H— O— H 

104 

107 

COt 

O— C— O 

180 

180 

NF, 

F— N— F 

104 

103 

CH, 

H— C— H 

120 

120 

NH, 

H— N— H 

107 

107 

BF, 

F— B— F 

120 

120 

H,CO 

H— C— H 

117 

115 

FaCO 

F— C— F 

108 

109 

c,h4 

H— C— C 

122 

123 

Wg  G.  Klopman,  B.  0’Leary,  Topics  Curr.  Chcm.  15, 445  (1970); 
B.  Roos,  I.  Fischer-Hjalmars,  Kemisk  Tidskrift,  No.  12,10(1970). 


układ  orbitali 
molekular- 
nych 


przejścia 

Tl  ->  71* 

n ->  ti* 
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cji  falowej  możemy  pokusić  się  o interpretację  wielu 
własności  fizykochemicznych  cząsteczki. 

W zależności  od  geometrii  układu  zawierającego 
elektrony  n,  delokalizacja  tych  ostatnich  w cząsteczce 


Metody  półempiryczne  opisujące  własności  elek- 
tronów n cząsteczki  mogą  być  użyte  do  interpretacji 
geometrii,  tj.  długości  wiązań,  nie  dla  całej  cząsteczki, 
ale  tylko  tych  ich  części,w  których  występuje  delokali- 


Rys.  44.  Długości  wiązań  w cząsteczce  naftalenu  i azulenu.  Linie  niebieskie  — wartości  doświadczalne,  linie  czarne  — wartości  obli- 
czone metodą  PPP;  linia  pozioma  odpowiada  wartości  0,1397  nm  (długość  wiązania  C — C w cząsteczce  benzenu).  W różnych  pomia- 
rach otrzymano  różne  wartości  długości  wiązań  w azulenie  (dwie  linie  niebieskie) ; wg  I.  Fischer-Hjalmars,  B.  Roos,  Kemisk  Tidskrift, 
No.  11, 28  (1970) 


c) 


długość  fali  ż 


zachodzi  w różny  sposób.  Długości  wiązań  w 
steczkach  organicznych  są  więc  zależne  od  tej  delokali- 
zacji.  Rysunek  44  podaje  np.  porównanie  pomiędzy 
doświadczalnymi  i teoretycznymi  długościami  wiązań 
w naftalenie  i azulenie.  Z rysunku  tego  widać  również, 
że  pomimo  tego,  iż  obie  cząsteczki  mają  po  10  elektro- 
nów n,  to  różnice  w topologii  cząsteczek  mają  istotne 
znaczenie  dla  długości  wiązań  w cząsteczkach. 
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Rys.  45.  Widma  absorpcyjne  w zakresie  nadfioletu  z kilku  cąsteczek 
organicznych.  Obliczone  metodą  PPP  położenia  maksimów  pasm  absor- 
pcyjnych oznaczone  są  liniami  pionowymi  (wysokość  linii  j est  propor- 
cjonalna do  obliczonego  natężenia  oscylatora  / lub  do  Ig/);  związek 
między  ekstynkcją  molarną  e i natężeniem  / jest  postaci:  Ig  e = 4 — 
— Ig/;  a)  anilina,  fenol  i anion  fenolu;  wg  M.  Ticłtf,  R.  Zahradnik, 
J.  Phys.  Chem.  73,  534  (1969);  b)  forma  laktimowa  pirydyno-2-aldoksy- 
mu,  jego  kation  i anion  oraz  forma  laktamowa  związku;  wg  J.S.  Kwiat- 
kowski, W.  Herzog  (Boniewicz),  B.  Szczodrowska,  J.  Molec.  Struct., 
26,333  (1975);  c)  2,6-dwu(bisetyloamino)puryna;  wg  J.S.  Kwiatkow- 
ski, Buli.  Inst.  Phys.  Res.  Atom.  (Bułgaria)  21,  327  (1971) 

zacja  elektronów  n.  Nie  można  więc  na  podstawie 
tych  metod  obliczyć  np.  długości  wiązań  C — H w czą- 
steczkach. Można  to  uczynić  natomiast  na  podstawie 
metod  półempirycznych  typu  AVE.  Metody  te  (a 
szczególnie  metoda  CNDO/2  lub  MINDO/2)  w wielu 
wypadkach  interpretują  poprawnie  nie  tylko  war- 
tości długości  wiązań,  ale  również  i wartości  kątów 
w różnego  typu  cząsteczkach. 


czą- 


logarytm  z natężenia 


energia  przejścia  AE 


Metody  pólempiryczne  interpretują  poprawnie  tak- 
że wartości  innych  wielkości  fizykochemicznych  czą- 
steczek, jak  np.  momentów  dipolowych,  potencjałów 
jonizacyjnych,  ciepła  tworzenia  cząsteczek  jak  rów- 
nież wartości  całego  szeregu  wielkości  charakteryzu- 
jących widma  tak  jądrowego,  jak  i elektronowego  re- 
zonansu paramagnetycznego. 

Gdy  chcemy  zinterpretować  elektronowe  widma  ab- 
sorpcyjne w zakresie  nadfioletu  szczególnie  użyteczna 
okazuje  się  metoda  PPP.  Rysunek  45  podaje  krzywe 
absorpcyjne  kilku  związków  organicznych  wraz  z po- 
łożeniami przewidywanych  przez  teorię  położeń  pasm 
absorpcyjnych.  Teoria  nie  tylko  interpretuje  popraw- 
nie położenia  pasm  absorpcyjnych  cząsteczek,  ale 
również  położenia  pasm  absorpcyjnych  ich  anionów 
i kationów  oraz  różnych  form  tautomerycznych 
cząsteczek.  Metoda  PPP  jest  szczególnie  użyteczna 
przy  interpretacji  przesunięć  pasm  absorpcyjnych  w 
serii  podobnych  cząsteczek  (rys.  46). 


Biochemia  kwantowa 

Rozpatrywanie  podstawowych  procesów  biologicz- 
nych jako  procesów  zachodzących  na  poziomie  mole- 
kularnym lub  submolekularnym  pociągnęło  za  sobą 
rozwój  teorii  tych  zjawisk  — rozwój  biologii  moleku- 
larnej. W ostatnich  kilkunastu  latach  zaczęto  coraz 
częściej  stosować  metody  mechaniki  kwantowej  do 
zagadnień  biologicznych,  co  spowodowało  nawet  wy- 
dzielenie odrębnego  działu  nazywanego  biologią 
kwantową  (lub  w węższym  znaczeniu  biochemią 
kwantową,  obejmującą  badanie  metodami  chemii 
kwantowej  własności  cząsteczek  o znaczeniu  bioche- 
micznym). Ten  nowy  dział  obejmuje  badania  teore- 
tyczne nad  własnościami  wielu  leków  (farmakologia 
kwantowa),  modelowych  białek  i składników  kwasów 
nukleinowych  (biochemia  kwantowa  kwasów  nuklei- 
nowych). Badania  z dziedziny  biochemii  kwantowej 
prowadzone  są  w wielu  laboratoriach  na  całym  świe 


badanie  Metody  chemii  kwantowej  stosowane  są  w wielu 
konformacji  wypadkach  do  badania  konformacji  cząsteczek.  Kon- 
formację cząsteczki  można  badać  bezpośrednio  obli- 
czając zmianę  energii  całkowitej  cząsteczki  wraz  ze 
zmianą  geometrii  części  cząsteczki  (np.  przy  obrocie 
określonej  grupy  wokół  wiązania)  lub  też  w sposób  po- 
średni przez  obliczenie  wielu  własności  cząsteczki  dla 
jej  różnych  konformacji  i porównanie  tych  własności 
z własnościami  doświadczalnymi.  Na  przykład  dane 
doświadczalne  pokazują,  że  cząsteczka  3-formylopiry- 
H dyny  występuje  w roztworze  jako  mieszanina  dwóch 

| form  cis  (la)  i trans  (Ib),  a mierzony  moment  dipolo- 

aC\  wy  cząsteczki  (ściślej  biorąc  zmierzony  moment  dipo- 

Iowy  mieszaniny  obu  form)  wynosi  2,37  D.  Momenty 
dipolowe  obliczone  dla  formy  (la)  i (Ib)  wynoszą  od- 
powiednio 1,13  D i 3,90  D.  Przyjmując,  że  w roztwo- 
ja  rze  występuje  mieszanina  obu  form  w proporcji  ok. 

40%  formy  (la)  i ok.  60%  formy  (Ib),  otrzymuje  się 
obliczony  moment  dipolowy  dla  mieszaniny  w zgod- 
9 ności  z wartością  doświadczalną.  Obliczona  w ten 

I sposób  zawartość  procentowa  obu  form  w mieszani- 

a^H  nie  jest  w bardzo  dobrej  zgodności  z wartością  wyzna- 

czoną doświadczalnie  za  pomocą  pomiarów  jądrowe- 
go rezonansu  magnetycznego  (30%  formy  la,  70% 
Ib  formy  Ib). 


cie,  a niektóre  laboratoria  zajmują  się  wyłącznie  tymi 
badaniami. 

Wyniki  zastosowań  metod  chemii  kwantowej  do  badanie 
opisu  struktury  elektronowej  zasad  kwasów  nukleino-  kwasów 
wych,  ich  licznych  pochodnych  i oddziaływań  między  nuklemo- 
nimi  są  dobrą  ilustracją  szczególnie  żywej  współpracy  wych 
fizyków  i chemików  teoretyków  z biologami.  Kwasy 
nukleinowe  są  odpowiedzialne  za  przekazywanie  in- 
formacji genetycznej  (-*•  Kwasy  nukleinowe).  Zmiany 
informacji  genetycznej  są  przyczyną  powstawania  mu- 
tacji, które  mogą  być  spowodowane  np.  niewielką 
zmianą  konfiguracji  atomów  w kwasie  dezoksyrybo- 
nukleinowym (DNA);  są  to  więc  zjawiska,  którymi 
rządzą  prawa  mechaniki  kwantowej.  Nic  więc  dziw- 
nego, że  próbowano  i próbuje  się  nadal  rozwiązać 
problemy  teoretyczne  związane  z budową  oraz  funk- 
cją kwasów  nukleinowych. 

W celu  zbadania  struktury  elektronowej  podstawo- 
wych składników  kwasów  nukleinowych  (cytozyny, 
uracylu,  tyminy,  guaniny,  adeniny,  jak  również  wielu 
ich  pochodnych)  użyto  wszystkich  znanych  metod  obli- 
czeniowych chemii  kwantowej  (tak  półempirycznych 
jak  i nieempirycznych).  Pozwoliło  to  wyjaśnić  wiele 
problemów  związanych  z własnościami  stanu  podsta- 
wowego tych  cząsteczek.  Na  przykład,  na  długo  przed 
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moment  zmierzeniem  momentów  dipolowych  i potencjałów 
dipoSowy  jonizacyjnych  zasad  kwasów  nukleinowych  wykonano 
cytozyny ! obliczenia  wartości  tych  wielkości,  a późniejsze  po- 
guaniny  miary  potwierdziły  obliczone  wartości.  Jednak  mo- 
menty dipolowe  cytozyny  i guaniny  nie  zostały  dotąd 
zmierzone,  a informacje  o nich  można  uzyskać  tylko 
z obliczeń.  Ma  to  istotne  znaczenie  dla  zrozumienia 
oddziaływań  pomiędzy  zasadami  w łańcuchu  DNA. 


H 

-9,2 


Rys.  47.  Energia  oddziaływania  (w  kcal/mol)  między  cząsteczką 
cytozyny  i cząsteczką  wody  przy  różnych  wzajemnych  ustawie- 
niach. Linie  grube  oznaczają  miejsca  najbardziej  prawdopo- 
dobne (największa  energia  oddziaływania)  na  przyłączenie  czą- 
steczki wody  do  cytozyny.  Linie  ciągłe  oznaczają  ustawienie  obu 
cząsteczek  w tej  samej  płaszczyźnie,  linie  przerywane  oznaczają 
ustawienie  cząsteczki  wody  prostopadle  do  płaszczyzny  cyto- 
zyny; wg  G.N.J.  Port,  A.  Pullman,  FEBS  Letters31,  70  (1973) 
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Rys.  48.  Komplementarne  pary  adenina-tymina  (A-T)  oraz  gua- 
nina-cytozyna  (G-C)  w DNA ; podano  też  pary  nieprawidłowe, 
powstające  gdy  jedna  z zasad  występuje  w rzadkiej  formie  tau- 
tomerycznej  (oznaczona  gwiazdką) 


Obliczenia  kwantowe  dla  stanu  podstawowego  za- 
sad DNA  pozwoliły  wyjaśnić  wiele  problemów  zwią- 
zanych z reaktywnością  chemiczną  tych  cząsteczek 
jak  również  przewidzieć  najbardziej  prawdopodobne 
miejsca  w zasadach  na  przyłączenie  cząsteczki  wody 
(rys.  47). 

Obliczenia  kwantowe  dla  zasad  kwasów  nukleino- 
wych są  bardzo  ważne  w związku  z obserwowaną  w za- 
sadach tautomerią.  W proponowanej  przez  Watsona 
i Cricka  strukturze  DNA  zasady  połączone  w komple- 
mentarnych parach  występują  w ściśle  określonych 
formach  tautomerycznych  (formy  aminowe  i lakta- 
mowe).  Jeśli  jedna  z zasad  wystąpi  w rzadkiej  formie 
tautomerycznej,  następuje  wówczas  zmiana  własności 
kompleksowania  i w łańcuchu  DNA  zostanie  wbudo- 
wany niewłaściwy  nukleotyd  (powstaje  wówczas  błąd 
w tworzeniu  pary  zasad  a w konsekwencji  organizm 
syntetyzować  może  niewłaściwe  białka,  powodując 
„chorobę”  organizmu).  Rysunek  48  przedstawia  na 
c przykładzie  par  adenina-tymina  oraz  guanina-cyto- 
zyna  powiązanie  zmian  w tautomerii  ze  zmianami 
w tworzeniu  komplementarnych  par  zasad.  Prawdo- 
podobieństwo występowania  określonej  zasady  DNA 
w rzadkiej  formie  tautomerycznej  jest  bardzo  małe. 
Zwiększa  się  ono  w istotny  sposób  pod  wpływem  dzia- 
łania wielu  czynników,  np.  promieniowania  elektro- 
magnetycznego, czynników  jonizujących  czy  też  wsku- 
tek działania  mutagenów  chemicznych  na  zasady. 
W ostatnim  wypadku,  w wyniku  działania  hydroksy- 
loaminy lub  hydrazyny  na  cytozynę,  powstają  między 
innymi  pochodne  cytozyny,  dla  których  prawdopodo- 
bieństwo występowania  w rzadkiej  formie  jest  o wiele 
większe  niż  w wypadku  niepodstawionej  cytozyny. 
Fakt  ten  tłumaczy  występowanie  licznych  mutacji  pod 
wpływem  działania  tych  związków  na  DNA. 

Znając  własności  poszczególnych  zasad  można  za- 
jąć się  zagadnieniem  własności  par  zasad,  znaczeniem 
wiązań  wodorowych,  za  pomocą  których  połączone 
są  pary  zasad,  zagadnieniem  stabilności  podwójnego 
heliksu  DNA  i wreszcie  strukturą  kwasów  nukleino- 
wych. Wykonano  np.  obliczenia  oddziaływań  pomię- 
dzy parami  zasad  przy  zmiennej  orientacji  zasad.  Po- 
kazano, że  w wypadku  pary  guanina-cytozyna  naj- 
bardziej prawdopodobne  ustawienie  zasad  jest  takie, 
jakie  jest  obserwowane  w podwójnym  heliksie  DNA. 
Natomiast  dla  pary  adenina-uracyl  oprócz  ustawienia 
obserwowanego  w spirali  DNA  możliwe  było  inne 
ustawienie  wzajemne  zasad,  co  znalazło  potem  po- 
twierdzenie w kryształach  pochodnych  adeniny  i ura- 
cylu. 

Wiele  prac  z dziedziny  chemii  kwantowej  zostało 
poświęconych  badaniu  własności  szczególnego  typu 
wiązań  zwanych  wiązaniami  wodorowymi,  za  pomocą 
których  połączone  są  komplementarne  pary  zasad 
w DNA  (rys.  48).  Wiązanie  wodorowe  X— H—Y  po- 
wstaje wówczas,  kiedy  atom  wodoru  H połączony 
jest  z silnie  elektroujemnym  atomem  X (np.  atomem 
azotu  lub  tlenu),  natomiast  atom  Y ma  tzw.  wolną 
parę  elektronów  (np.  wiązania  wodorowe  N — H—O 
lub  N— -H— N pomiędzy  zasadami  DNA  na  rys.  48). 
Wiązania  wodorowe  są  kilkadziesiąt  razy  słabsze  od 
przeciętnych  wiązań  chemicznych  (np.  energia  wiąza- 
nia wodorowego  dla  dwóch  cząsteczek  wody  wynosi 
ok.  5 kcal/mol  21  kJ/moI),  niemniej  są  one  jednym 
z czynników  decydujących  o komplementarności  za- 
sad i mają  specyficzny  wpływ  na  trwałość  pary.  Po- 
przez wiązanie  wodorowe  zachodzi  częściowa  deloka- 
lizacja  elektronów  n obu  zasad;  jest  to  między  innymi 
przyczyną  większej  stabilności  pary  w stosunku  do 
układu  izolowanych  dwóch  zasad.  Oprócz  prac  pogłę- 
biających wiadomości  dotyczące  oddziaływań  między 
poszczególnymi  zasadami  prowadzone  są  także  ba- 
dania większych  zespołów  zasad,  takich  jak  polinu- 
kleotydy.  Jednakże  wyciąganie  ogólnych  wniosków 
dotyczących  własności  DNA  z tego  typu  badań  jest 
jeszcze  przedwczesne. 

Zrozumienie  roli  i funkcji  jaką  pełnią  kwasy  nuklei- 
nowe w żywym  organizmie  powoduje  nadal  ogromne 
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wiązania 

wodorowe 


284 


zainteresowanie  strukturą  tych  kwasów.  Nic  więc 
dziwnego,  że  biologia  kwantowa  rozwija  się  bardzo 
intensywnie,  i należy  spodziewać  się,  że  będzie  rozwi- 
jała się  w najbliższej  przyszłości.  Być  może  badania 
kwantowe  nad  strukturą  kwasów  nukleinowych  i biał- 
kami pomogą  wyjaśnić  procesy  starzenia  się  organiz- 
mu, czy  też  wyjaśnią  przyczyny  powstawania  chorób. 
Może  powstanie  więc  „kwantowa  teoria  raka”,  a może 
powstanie  „medycyna  kwantowa”,  która  nie  tylko 
znajdzie  skuteczne  lekarstwo  przeciw  rakowi,  ale  rów- 
nież przeciw  innym  chorobom. 

Podany  w niniejszym  artykule  przegląd  niektórych 
zastosowań  mechaniki  kwantowej  w chemii  z ko- 
nieczności jest  powierzchowny  i niepełny.  Zostały 
pominięte  tutaj  zastosowania  teorii  kwantowych  do 
interpretacji  budowy  związków  kompleksowych.  Nie 
omówiono  szczegółowo  zastosowania  metod  kwanto- 


SPEKTROSKOPIA 


Oddziaływanie  promieniowania  elektromagnetyczne- 
go lub  korpuskulamego  z materią  we  wszystkich  jej 
makro-  i mikroskopowych  formach  jest  podstawą  ca- 
łej spektroskopii,  niezależnie  od  tego  czyjej  przedmio- 
tem badań  jest  struktura  izolowanego  elementu  mikro- 
lub  makroukładu,  czy  też  zjawiska  i procesy  zacho- 
dzące w tych  układach.  Najważniejszą  konsekwencją 
takiego  oddziaływania  jest  fakt,  że  energia  jest  po- 
chłaniana lub  wysyłana  przez  materię  w pewnych  dy- 
skretnych, skończonych  porcjach  — kwantach  energii. 
Badając  częstość  lub  długość  fali  pochłanianego  czy 
wysyłanego  promieniowania  możemy  wyznaczyć  wiel- 
kość zmian  energii  w procesie  oddziaływania  promie- 
niowania z materią,  a tym  samym  określić  dyskretne 
poziomy  energetyczne  badanego  układu.  Każdy  układ 
materialny  ma  charakterystyczne  dla  siebie  poziomy 
energetyczne,  co  umożliwia  podział  spektroskopii  na 


wych  do  badania  własności  kwasów  nukleinowych, 
pominięto  zastosowanie  tych  metod  do  badania  bia- 
łek i witamin  oraz  zastosowanie  w farmakologii.  Nie 
wspomniano  zupełnie  o teorii  reakcji!  fotochemicz- 
nych itp.  zagadnieniach. 

Autor  uzna  jednak,  że  artykuł  ten  spełni  swoje  za- 
danie, jeśli  Czytelnik  wyrobi  sobie  nowy  pogląd  na 
budowę  cząsteczek  i nowy  sposób  myślenia  o ukła- 
dach chemicznych. 

C.A.  Coulson  Wiązania  chemiczne.  Warszawa  1963;  A.  Go- 
łębiewski Chemia  kwantowa  związków  nieorganicznych , War- 
szawa 1969;  A.  Gołębiewski  Chemia  kwantowa  związków  orga- 
nicznych, Warszawa  1973 ; W.  Kolos  Kwant  ovse  teorie  w chemii 
i biologii,  Wrocław  1971 ; W.  Kolos  Chemia  kwantowa.  Warsza- 
wa 1978;  J.  S.  Kwiatkowski,  B.  Pullman,  Adv.  Heterocycl. 
Chem.  18,  200  (1975);  A.  Pullman  Topics  Curr.  Chem.  31,  45 
(1972);  B.  Pullman,  A.  Pullman  Quantum  Biochemistry , New 
York  1963 ; A.  J.  Sadlej  Elementarne  metody  chemii  kwantowej. 
Warszawa  1966. 


podstawowe  działy:  spektroskopię  jądrową,  której 
przedmiotem  badań  są  poziomy  energetyczne  i włas- 
ności jąder  atomowych;  spektroskopię  atomową,  hi- 
storycznie najstarszy  dział  spektroskopii,  zajmujący 
się  badaniem  poziomów  energetycznych  atomów; 
spektroskopię  molekularną,  badającą  poziomy  ener- 
getyczne i strukturę  cząsteczek  oraz  oddziaływania 
międzycząsteczkowe;  spektroskopię  kryształów,  któ- 
rej przedmiotem  badań  jest  struktura  energetyczna 
kryształów  oraz  czynniki  określające  i wpływające  na 
tę  strukturę. 

Spektroskopia  wraz  z jej  zastosowaniami  stanowi 
jeden  z najbardziej  podstawowych  działów  fizyki,  che- 
mii i innych  dyscyplin  pokrewnych.  Poniżej  omówio- 
ne zostaną  podstawy  i zastosowania  wybranych  dzia- 
łów spektroskopii  oraz  metody  badań  spektroskopo- 
wych. 


Spektroskopia  atomowa 

Tadeusz  Skałiński 


Promieniowanie  optyczne  wysyłane  przez  pary  ato- 
mowe wzbudzone  do  świecenia  przez  wyładowanie 
elektryczne,  przez  ogrzanie  do  wysokiej  temperautry 
lub  optycznie  zawiera  w sobie  ogromną  ilość  informa- 
cji o atomach,  które  to  promieniowanie  wysłały.  Aby 
tę  informację  wyzyskać,  winniśmy  promieniowanie  ro- 
złożyć w widmo,  tj.  przeanalizować,  jak  przebiega 
w nim  zależność  natężenia  od  częstości  drgań.  W od- 
różnieniu od  promieniowania  o widmie  ciągłym,  wy- 
syłanego przez  rozżarzone  ciała  stałe,  promieniowa- 
nie par  atomowych  ma  widmo  liniowe. 

Badanie  tych  widm  ujawniło  liczne  prawidłowości, 
których  interpretacja  pozwoliła  na  wyciągnięcie  da- 
leko idących  wniosków  o strukturze  atomu.  Ten  za- 
kres zagadnień  jest  przedmiotem  badań  spektroskopii 
atomowej. 


Atom  wodoropodobny  i jego  widmo 

Zagadnienie  wyznaczenia  energii  stanów  stacjonar- 
nych atomu  o jednym  elektronie  i ładunku  jądra  Ą-Ze 
atom  może  być  rozwiązane  w sposób  konsekwentny  meto- 
wodoropo-  darni  relatywistycznej  mechaniki  kwantowej  (równa- 
dobny  nie  Diraca).  Ujęcie  nierelatywistyczne,  w którym 
w mechanice  punktem  wyjścia  jest  równanie  Schrodingera,  prowa- 
kwantowej  dzi  do  wyznaczenia  funkcji  własnych  i wartości  włas- 


nych operatora  energii  (-*-  Chemia  kwantowa).  Ener- 
gia stanów  stacjonarnych 
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gdzie  e,  m — oznaczają  ładunek  i masę  elektronu, 
h = 6,626176*  10"34  J*s  — stałą  Plancka;  n = 1, 2, 3... 
— główną  liczbę  kwantową. 

W nierelatywistycznej  mechanice  kwantowej  wpro- 
wadza się  jeszcze  dwie  liczby  kwantowe:  / — orbitalne- 
go momentu  pędu  elektronu  fil  (j/|  = }//(/+ 1)  ==  /*, 

h = hl2n)  oraz  mi  — rzutu  / na  kierunek  kwantowa- 
nia; rzut  ten  jest  równy  hmi  (rys.  1).  Liczby  kwantowe 
n , /,  mi  (wszystkie  całkowite)  spełniają  następujące 
warunki:  0 ^ n — 1 i \mi\  < /.  Z wyrażenia  na 

Wn  widać,  że  w tym  ujęciu  energia  stanu  nie  zależy  od 
/ (mówimy  o zwyrodnieniu  względem  /).  Zależność 
energii  stanu  od  orientacji  momentu  orbitalnego  ujaw- 
nia się  dopiero  po  przyłożeniu  pola  zewnętrznego 
(zob.  str.  288). 


Rys.  1 . Skwantowane  ustawienie  wektora  ł względem  kierunku 
wyróżnionego;  / = 2;  l*  — ]/ó  (promień  okręgu).  Zaznaczone 
położenia  odpowiadają  wartościom  mi  = 2,  1,  0,  — 1,  —2.  Kie- 
runek składowej  prostopadłej  do  osi  kwantowania  nie  jest  okre- 
ślony — wszystkie  są  jednakowo  prawdopodobne 


-2 


-3 
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oś  Kwantowania  m^(w  jedn.h) 


oś  kwantowania  m$( w jedn. /) ) 


Rys.  2.  Skwantowanc  ustawienia  wektora  s względem  kierunku 
wyróżnionego;  s = */»!  s+  = )/3/2  (promień  okręgu).  Te  dwie 
możliwości  ustawienia  spinu  względem  kierunku  wyróżnionego 
zostały  potwierdzone  w doświadczeniu  nad  odchylaniem  atomów 
srebra  biegnących  w poprzek  niejednorodnego  pola  magnetycz- 
nego 


W okresie  powstawania  mechaniki  kwantowej  anali- 
za struktury  widm  (głównie  metali  alkalicznych)  do- 
prowadziła Uhlenbecka  i Goudsmitha  do  wniosku,  że 
każdy  elektron  jest  obdarzony  własnym,  wewnętrznym 
momentem  pędu  — spinem.  Jest  on  stały  i jego  liczba 
kwantowa  s = 1/2.  Podobnie  jak  w wypadku  momen- 


tu orbitalnego  spin  elektronu  wynosi  sft9  przy  czym 

spin  j7|  = 1)  = s*  — Rzut  spinu  na  oś 

elektronu  kwantowania  jest  równy  mji  — ±7a^  (rys.  2).  Spin 
sumuje  się  z orbitalnym  momentem  pędu,  tworząc 
całkowity  moment  pędu  elektronu  Gest  to  specyficz- 
ny sposób  sumowania,  zarazem  wektorowy  i spełnia- 
jący reguły  kwantowe).  Podkreślić  tu  należy,  że  spin 
elektronu  nie  wynika  z rozważań  nierelatywi  stycznej 
mechaniki  kwantowej  i w tym  schemacie  jest  wielko- 
ścią dołączoną  fenomenologicznie.  To  dołączenie 
znajduje  swój  wyraz  w dodaniu  do  zespołu  liczb  kwan- 
towych opisujących  stan  elektronu  liczby  kwantowej 
m8  = ±1/2  oraz  w przedstawieniu  funkcji  stanu  elek- 
tronu w postaci  W = y>(n , /,  mi)-a(m8).  Spin  elektro- 
nu (ogólniej  — spin  każdej  cząstki  elementarnej)  jest 
wielkością  fizyczną  charakterystyczną  dla  świata  ato- 
mowego i nie  ma  analogii  w fizyce  klasycznej. 


Widmo  wodoru 

Podstawowa  zależność  fizyki  kwantowej  wiążąca  róż- 
nicę energii  stanów  układu  fizycznego  AW  z częstością 
wysłanego  (lub  pochłoniętego)  promieniowania  ma 
postać: 

AW  = kv  = hvc9 

przy  czym  v jest  częstością  promieniowania,  v = 
= vfc  — liczbą  falową  (w  cm"1).  Jeśli  wyrażenie 
2nze*mlh*c  oznaczymy  przez  R9  to  energia  Wn  — 
= — RZ2hc/n 2.  R jest  bardzo  ważną  stałą  fizyczną; 
stała  Jest  t0  tzw*  stała  Rydberga,  ma  ona  wartość  109737,31 
Rydberga  cm-1.  Wyrażona  w skali  liczb  falowych  różnica  energii 
między  stanem  początkowym  i i końcowym /wynosi 
zatem: 


Gdy  Z = 1,  przy  nj  = \ (stan  podstawowy)  i m = 
= 2,  3,  4,...  (n  może  przy  przejściu  zmieniać  się  o do- 
wolną liczbę  jednostek),  otrzymamy  liczby  falowe  ko- 


obszar  jonizacji  : n 


Rys.  3.  Diagram  układu  poziomów  energetycznych  atomu  wodoru 
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lejnych  linii  pierwszej  serii  widmowej  wodoru  (serii  serie 
Lymana),  leżącej  w dalekim  nadfiolecie  (rys.  3).  Gdy  widmowe  i 
m oo,  to  v ->■  +i£;  stała  Rydberga  wyraża  więc 
w liczbach  falowych  energię  wiązania  elektronu  w sta- 
nie podstawowym  atomu  wodoru.  Podobnie  — przyj- 
mując stan  o nf  = 2 jako  końcowy,  otrzymamy  dla 
m = 3,  4,  5...  kolejne  linie  serii  Balmera  (il.  131, 
tabl.  33)  itd. 

Atom  wieloelektronowy 

Analiza  struktury  widma  atomu  wieloelektronowego 
sprowadza  się  (przez  analogię  z widmem  wodoru)  do 
wyznaczenia  energii  stanów  stacjonarnych,  obliczenia 
ich  funkcji  stanu  i ustalenia  reguł  dozwalających  na 
przejścia  między  różnymi  stanami.  Zagadnienie  to 
jest  jednak  bardzo  skomplikowane  (zagadnienie  wielu 
ciał)  i można  je  rozwiązać  jedynie  wprowadzając  da- 
leko posunięte  uproszczenia. 

Z zasady  Pauliego,  wg  której  elektrony  należące 
do  atomu  (ogólniej  — do  określonego  mikroukładu 
fizycznego)  muszą  być  w różnych  stanach  kwanto- 
wych (tj.  stanach  opisanych  przez  nie  powtarzające  się 
w danym  układzie  kombinacje  liczb  kwantowych  n9  /, 
mt  i ma\  oraz  z ograniczeń  nałożonych  na  te  liczby 
wynika,  że  gdy  elektrony  wypełniają  powłoki  o okreś- 
lonym n w powłoce  może  być  2n 2 elektronów.  Po- 
nadto elektrony  obsadzają  kolejne  stany  o najniż- 
szej energii,  a ponieważ  energia  stanu  zależy  głównie 
od  liczby  kwantowej  n9  będziemy  mieli  do  czynienia 
z kolejnym  wypełnianiem  powłok  od  pierwszej  ( n = 1) 
począwszy.  Można  wykazać,  że  wypełnione  powłoki 
charakteryzują  się  szczególną  trwałością  i słabą  ak- 
tywnością chemiczną.  To  samo,  acz  w mniejszym 
stopniu,  odnosi  się  do  wypełnionych  podpowłok 
(tj.  zbioru  stanów  o określonych  n i /).  Wypadko- 
we momenty  pędu  (orbitalnego  i spinowego)  oraz 
związane  z nimi  momenty  magnetyczne  w wypełnio- 
nych powłokach  i podpowłokach  zerują  się. 

Przybliżenia  i założenia  upraszczające  są  następu- 
jące: 

a)  rozważamy  stany  wzbudzenia  jednoelektrono- 
wego; 

b)  oddziaływanie  elektrostatyczne  elektronu  optycz- 
nego z pozostałymi  elektronami  przedstawiamy  za  po- 
mocą obliczonego  w sposób  uproszczony  potencjału ; 

c)  uwzględniamy  oddziaływanie  magnetyczne  mię- 
dzy momentami  orbitalnymi  i spinami  elektronów 
powłoki  walencyjnej; 

d)  uwzględniamy  reguły  wyboru  ustalające  możli- 
wości przejścia  promienistego  między  określonymi 
poziomami. 

W spektroskopii  atomowej  stosuje  się  następującą 
konwencję:  wartości  liczby  kwantowej  orbitalnego 
momentu  pędu  elektronu  / — 0,  1,  2,  3,  4,  5,  6 ...  za- 
stępuje się  umownymi  oznaczeniami  s9p9  d9f9  g9  h9  i ... 

Oznaczenie  literowe  poprzedza  się  główną  liczbą 
kwantową,  np.  3 p oznacza  elektron  w stanie  o n = 3 
i / = 1 . Przy  opisie  konfiguracji  powłoki  elektronowej 
górny  wskaźnik  oznacza  liczbę  elektronów  w określo- 
nym stanie  (np.  1 s2  2 s2  2 p oznacza  konfigurację,  w któ- 
rej pierwsza  podpowłoka  jest  wypełniona  dwoma 
elektronami,  a druga  zawiera  dwa  elektrony  2 s i jeden 
elektron  2 p). 

Momenty  orbitalne  i spiny  elektronów  powłoki  wa-  całkowity 
lencyjnej  atomu  wieloelektronowego  po  dodaniu  moment  pędu 
dają  całkowity  moment  pędu  powłoki  elektronowej,  powłoki 
Jeśli  nie  ma  oddziaływań  zewnętrznych,  moment  ten  elektronowe} 
pozostaje  niezmienny,  przy  czym  (podobnie  jak  i mo- 
menty poszczególnych  elektronów)  jest  skwantowa- 
ny;  jego  składowa  wzdłuż  osi  kwantowania  wynosi 
hMj9  a wielkość  całkowitego  momentu  pędu  jest 

równa  hJ9  gdzie  \J\  = }//(/+ 1)  = /*.  Liczby  kwan- 
towe Mj  i J charakteryzują  stan  atomu.  J jest  liczbą 
dodatnią  (całkowitą  lub  połówkową)  lub  zerem. 

Mj  przybiera  jedną  z 2/+ 1 wartości  — —J  + 1, ...» 


reguły 
wyboru 
dla  J i Mj 


widma 
elektronów 
o jednym 
elektronie 
walencyjnym 


Ze  sposobu  otrzymania  rzutu  J na  oś  kwantowania 
wynika,  że  gdy  liczba  elektronów  w powłoce  walen- 
cyjnej jest  nieparzysta,  Mj  jest  liczbą  połówkową  (nie- 
parzysta liczba  rzutów  poszczególnych  spinów,  z któ- 
rych każdy  jest  równy  ±V«),  gdy  jest  ona  parzysta, 
Mj  jest  całkowite.  Ponieważ  zaś  J jest  równe  maksy- 
malnej wartości  Mj,  więc  ta  sama  uwaga  dotyczy  J. 

Ważną  cechą  charakterystyczną  kwantowania  prze- 
strzennego całkowitego  momentu  pędu  powłoki  elek- 
tronowej jest  to,  że  ustalona  jest  wyłącznie  wielkość 
składowej  wzdłuż  osi  kwantowania,  orientacja  skła- 
dowej poprzecznej  pozostaje  nieoznaczona  — wszyst- 
kie jej  położenia  są  jednakowo  prawdopodobne.  Moż- 
na ten  stan  zobrazować  modelowo  przyjmując,  że 

wektor  J wykonuje  jednostajną  precesję  dokoła  osi 
kwantowania. 

Przy  przejściach  promienistych  jednofotonowych 
reguły  wyboru  na  J i Mj  są  następujące : AJ  = 0,  ± 1 
(przejście  / = 0 -*  / = 0 jest  wzbronione),  AMj  = 
= 0,  ±1-  Ten  symboliczny  zapis  należy  rozumieć  na- 
stępująco: tylko  te  przejścia  promieniste  są  w atomie 
dozwolone,  w których  liczby  kwantowe  J i Mj  sta- 
nów początkowego  i końcowego  spełniają  podane 
wyżej  warunki. 

W metalach  alkalicznych  (Li,  Na,  K,  Rb,  Cs)  oraz  w 
jonach  o strukturze  izoelektronowej  z nimi  (Be+,  Mg+, 
Ca+,  Ba+,  Sr+,  B*+,  Al2+  itp.)  mamy  jeden  elektron 
na  zewnątrz  wypełnionych  powłok  elektronowych. 
Całkowity  orbitalny  moment  pędu  elektronów  atomu 
L jest  więc  równy  momentowi  orbitalnemu  / elektronu 
walencyjnego  (/  = L,  a stany  atomu  odpowiednio  do 
wartości  L będą  oznaczone  literami  5,  P>  D,  F,  G, 
H,  /...). 

W układzie,  w którym  jest  określony  wypadkowy 
orbitalny  moment  pędu  powłoki  elektronowej,  obo- 
wiązują następujące  reguły  wyboru  dla  liczby  L: 
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Rys.  4.  Schemat  poziomów  atomu  sodu  i serie  występujące  w jego 
widmie.  Rozszczepienia  stanów  3 P,  4 P i 3 D są  wielokrotnie  po- 
większone 


AL  = ±\  {AL  = 0 wzbronione!).  Sprzężenie  wypad- 
kowego momentu  orbitalnego  L ze  spinem  S daje 

całkowity  moment  powłoki  J.  Stosownie  do  tego  bę- 
dziemy mieli  następujące  ciągi  termo  w:  nS,  nP , nD  ... 
Każdy  z nich  (z  wyjątkiem  termów  nS ) rozszczepia  się 
na  dwa  poziomy  struktury  subtelnej  o / = L±1J2 
(/iP1/2  i nP3j 2;  nD3j9,  i nD 6(f2  itd.).  Termy  S są  pojedyn- 
cze o J = 1/z{nS1f2).  Rysunek  4 ukazuje  omówione 
tu  układy  termów  w atomie  sodu.  Stanem  podsta- 
wowym jest  3 51/2- 


Struktura  subtelna  poziomów  atomu  wodoru 

Relatywistyczna  mechanika  kwantowa  Diraca  prowa- 
dzi do  wniosku,  że  struktura  subtelna  poziomów  wo- 
doru wykazuje  zwyrodnienie  względem  L : energia  za- 
leży jedynie  od  liczb  kwantowych  n i J.  Wyrażenie  na 
energię  stanu  stacjonarnego  Wn>  wzór  (1),  zostaje 
uzupełnione  w pierwszym  przybliżeniu  wyrazem  po- 
prawkowym rzędu  wielkości  a2 (a  = e2jhc  « 1/137  — 
jest  to  tzw.  stała  struktury  subtelnej  Sommerfelda) 
i zależnym  od  n i /.  Obliczoną  zgodnie  z tym  wzorem 
strukturę  poziomów  wodoru  o n = 2 i n = 3 oraz 
strukturę  pierwszej  linii  serii  Balmera  Ha  ukazuje 
rys.  5.  Zgodnie  z regułami  wyboru  linia  ta  winna  mieć 
5 składowych,  których  metodami  spektroskopii  trady- 
cyjnej nie  można  rozdzielić  (wskutek  rozszerzenia  linii 
wywołanej  efektem  Dopplera).  Mimo  to  jednak  już 
prace  H.G.  Kuhna  i G.W.  Seriesa  oraz  R.C.  Willia- 
msa  nad  H i D,  prowadzone  metodami  interferome- 
trycznymi, wykazały  pewne  odstępstwa  od  przewidy- 
wań teoretycznych.  Badania  doświadczalne  były  sty- 
mulowane przez  równoczesny  rozwój  elektrodynamiki 
kwantowej,  która  analizując  efekty  związane  z fluk- 


Rys.  5.  Struktura  linii  Hz  wodoru:  a)  wg  teorii  Diraca;  b)  z uw- 
zględnieniem przesunięcia  Lamba 


tuacjami  w zerowym  polu  promieniowania,  przewi- 
dywała dodatkowe  przesunięcia  wzajemne  poziomów 
w stosunku  do  położeń  przewidzianych  przez  teorię 
Diraca.  To  przesunięcie  nazwano  przesunięciem  Lam- 
ba i Retherforda.  Dodatkowa  poprawka  do  wzoru, 
w której  występuje  zależność  od  liczby  kwantowej 
L,  jest  rzędu  a3.  Z jej  postaci  wynika,  że  największych 
przesunięć  można  oczekiwać  dla  stanów  S i małych 
wartości  liczby  kwantowej  głównej  n.  Uwzględnienie 
przesunięcia  prowadzi  do  komplikacji  układu  pozio- 
mów i struktury  subtelnej  linii  (rys.  5).  W szczegól- 
ności teoria  przewidywała  podwyższenie  energii  po- 
ziomu 22Sxj2  w stosunku  do  22P1j2  o 1057,99  ±0,1 6 
MHz.  Pierwsze  dokładne  pomiary  przesunięcia  Lam- 
ba przeprowadzono  łącząc  metody  spektroskopii 
optycznej  i mikrofalowej.  Ich  zasadę  w ogromnym 
uproszczeniu  przedstawia  rys.  6.  Zauważymy  naj- 
pierw, że  stan  2 25x;a  jest  stanem  metatrwałym,  tzn. 
mimo,  że  jest  to  stan  wzbudzony,  reguły  wyboru 
zakazują  przejścia  promienistego  do  stanu  podstawo- 
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wego  12£i/2  (odpowiadałoby  to  przejściu  o AL  — 0). 
Czas  życia  atomów  w tym  stanie  jest  bardzo  długi 
i energia  wzbudzenia  (przekraczająca  10  eV)  może  być 


Rys.  6.  Schemat  doświadczenia  Lamba-Retherforda : S źródło 
atomów  wodoru,  D układ  diafragm  wydzielających  smukłą 
wiązkę  atomów,  W urządzenie  do  przyspieszania  elektronów 
i wzbudzania  atomów  wodoru  przez  zderzenia,  R obszar  pomia- 
rowy, w którym  można  wytwarzać  zmienne  pole  elektromagne- 
tyczne, Z — elektroda  zbiorcza,  El — układ  elektromedyczny 
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stracona  jedynie  niemal  w procesie  bezpromienistym 
(zderzenia).  W aparaturze  Lamba  i Retherforda  wiąz- 
ka atomów  wodoru  była  wzbudzona  przez  zderzenia 
z elektronami  do  stanów  o n = 2.  Z tej  mieszaniny 
atomów  w stanach:  podstawowym  1 251/2  i wzbudzo- 
nych 2 2S1/2,  22/>i/2,  22i>3/2  atomy  w stanach  2 P 
wysyłały  w czasie  ok.  1 ns  foton  linii  Lya  (pierwszej 
linii  serii  Lymana)  i powracały  do  stanu  podstawowe- 
go. W swej  dalszej  drodze  przechodziły  przez  obszar 
pomiarowy  (obszar  oddziaływania  z polem  mikro- 
falowym) i dochodziły  do  układu  detekcyjnego,  nie 
wywołując  żadnych  efektów  (podobnie  jak  atomy, 
które  nie  zostały  w ogóle  wzbudzone).  Inaczej  było 
z atomami  w stanie  metatrwatym  2 zSAj2.  Gdy  docho- 
dziły one  do  detektora,  kosztem  ich  energii  wzbudze- 
nia wyrzucane  były  elektrony  rejestrowane  następnie 
w układzie  elektrometrycznym.  W doświadczeniu 
chodziło  o to,  by  przez  przyłożenie  w obszarze  po- 
miarowym oscylującego  pola  elektromagnetycznego 
o częstości  odpowiadającej  rozszczepieniu  poziomów 
2251/2-22i>1/2  (ok.  1058  MHz)  wymusić  przejście  do 
stanu  promienistego,  a z niego,  po  emisji  fotonu, 
otrzymać  atom  w stanie  podstawowym,  nie  oddziału- 
jący już  z detektorem.  Wymuszenie  przejścia  ma 
charakter  bardzo  ostrego  rezonansu,  co  sprawia, 
że  badany  efekt  jest  niezmiernie  czuły  na  dostrojenie. 
Można  więc  wyznaczyć  szukane  rozszczepienie  z do- 
kładnością lepszą  niż  0,1  MHz.  Otrzymany  wynik 
1057,77  ±0,10  MHz  doskonale  się  zgadza  z podaną 
wyżej  przewidywaną  wartością  teoretyczną. 

Dzięki  rozwojowi  różnych  technik  spektroskopii 
współczesnej  (omawianych  dalej)  stało  się  możliwe 
rozszerzenie  zakresu  badań  na  wyższe  stany  wzbu- 
dzone atomu  wodoru  i na  wielokrotnie  zjonizowane 
atomy  różnych  pierwiastków  cięższych. 

W układach  wieloelektronowych  istnieją  różne  typy 
sprzężeń  momentów  elektronowych  w powłoce  wa- 
lencyjnej atomu.  Z nich  dwa  najprostsze  to: 

1)  Sprzężenie  LS  (Russela-Saundersa).  Z tym  ty- 
pem sprzężenia  mamy  do  czynienia  wówczas,  gdy  od- 
działywania wzajemne  między  momentami  orbital- 
nymi poszczególnych  elektronów  oraz  między  spinami 
znacznie  górują  nad  oddziaływaniami  spin-orbita. 
Wówczas  tworzy  się  wypadkowy  moment  orbitalny 

powłoki  walencyjnej  L = ...  oraz  wypadkowy 

spin  S = ^+5^+  ...  Oba  momenty  wypadkowe  do- 
dają się,  tworząc  w ogólności  dla  każdego  L liczbę 
2S±  1 możliwych  kombinacji  prowadzących  do  róż- 
nych wartości  / (rozszczepienie  multipletowe  ter- 
mów).  Rozszczepienia  multipletowe  wykazują  regu- 
larności. Za  przykład  może  służyć  reguła  odległoś- 
ciowa Landćgo:  rozszczepienie  pary  kolejnych  po- 
ziomów^: Au-^iAu-*)  =/:(/— 1):(/— 2).  Reguła 
ta  ma  duże  znaczenie  przy  analizie  nadsubtelnej 
struktury  linii  widmowych. 
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Terminu  „multiplet”  używa  się  na  ogół  w dwóch  multiplet 
różnych  znaczeniach,  odnosi  się  go  albo  do  termu 
energii,  albo  do  układu  linii  widmowych.  Pierwsze 
znaczenie  odpowiada  sytuacji  omawianej  w tekście. 

Gdy  np.  w rtęci,  mającej  w powłoce  walencyjnej  dwa 
elektrony,  spiny  są  równoległe  (S  =1),  wówczas  każ- 
dy z termów  L (np.  P,  D ...)  rozszczepi  się  na  2S±  1 = 

= 3 poziomy  o / = L— 1,  L,  L+l  (np.  63jP0,  63/\, 

63P2).  Mamy  trypletowy  układ  poziomów.  Natomiast 
grupę  linii  widmowych  powstałych  z przejść  między 
poziomami  dwu  różnych  rozszczepionych  na  multi- 
plety termów  (np.  nazwiemy  multipletem 

widmowym. 

W układach  wieloelektronowych  sumowanie  spi- 
nów prowadzi,  zależnie  od  ich  orientacji,  do  różnych 
wartości  wypadkowej  5,  co  oznacza,  że  w określonym 
atomie  może  występować  kilka  układów  termów 
o różnej  krotności.  W układzie  dwuelektronowym 
wypadkowa  S może  być  równa  bądź  0,  bądź  1 i ter- 
my są  odpowiednio  pojedyncze  (układ  singletowy) 
lub  potrójne  (układ  trypletowy).  Ważnym  warunkiem 
uzupełniającym  reguły  wyboru  dla  przejść  promieni- 
stych jest  zakaz  interkombinacji  AS  — 0.  Przejściu 
promienistemu  nie  może  towarzyszyć  przeoriento- 
wanie się  spinu.  Ta  reguła  nie  jest  bezwzględnie  zacho- 
wana w atomach  ciężkich  (np.  linia  253,7  nm  rtęci). 

Jednak  przejścia  promieniste  zachodzące  z jej  naru- 
szeniem są  znacznie  mniej  prawdopodobne  niż  inne, 
przy  których  reguła  ta  jest  spełniona. 

2)  Sprzężenie  {JJ}.  Oddziaływania  spin-orbita  sprzężenie 
znacznie  górują  nad  oddziaływaniami  wzajemnymi  {/.  /} 
momentów  orbitalnych  oraz  spinów.  W konsekwencji 
dla  każdego  elektronu  oddzielnie  tworzą  się  najpierw 

wypadkowe  momenty  całkowite  lx+s1  = j\;  U+s2  = 

= A...,  a następnie  moment  całkowity  tworzy  się 

przez  złożenie  A+/»+  •••  — A Nie  możemy  teraz 
mówić  ani  o wypadkowym  momencie  orbitalnym,  ani 
o wypadkowym  spinie  powłoki  walencyjnej.  Umowny 
zapis  stanu  atomu  w wypadku  sprzężenia  {f,j}  jest: 

nAnMhJth-  , . 

W atomach  mających  więcej  niz  jeden  układ  ter- 
mów napotykamy  stany  wzbudzone  (stany  metatrwa- 
łe),  z których  promienisty  powrót  do  stanów  niżej  " Jl  wałe 
położonych  (w  szczególności  do  stanu  podstawowego) 
nie  jest  dozwolony  ani  pośrednio,  ani  bezpośrednio, 
np.  stany  23S’i  i 2ł50  w He  lub  63P0  i 6 3P2  w rtęci. 

Atomy  w takich  stanach  mają  czasy  życia  od  ok.  10" 2 s 
do  1 s.  Dezaktywacja  ich  zachodzi  głównie  w sposób 
bezpromienisty  przy  zderzeniach  ze  ściankami  naczy- 
nia, w którym  gaz  jest  zamknięty.  Jednakże  w szcze- 
gólnych warunkach  można  obserwować  przejścia  pro- 
mieniste z tych  stanów.  Są  to  tzw.  linie  wzbronione, 
o bardzo  małym  w porównaniu  z liniami  dozwolony- 
mi natężeniu.  Występują  one  np.  w widmach  mgławic 
lub  w świeceniu  górnych  warstw  atmosfery  (w  zorzy 
polarnej).  Atomy  w stanach  metatrwałych  odgrywają 
istotną  rolę  w wyładowaniach  elektrycznych  w gazach 
rozrzedzonych.  Szczególnie  w gazach  szlachetnych, 
w mieszaninie  He  i Ne,  atomy  He  w stanach  meta- 
trwałych stanowią  rezerwuar  energii  przekazywanej 
do  stanu  3s2  neonu  stanowiącego  stan  wyjściowy  do 
akcji  laserowych. 


Rozszczepienie  poziomów  energetycznych 
atomu  w polu  magnetycznym 
(zjawisko  Zeemana) 

Badania  rozszczepienia  poziomów  atomowych,  a co 
za  tym  idzie  — i linii  widmowych  w polu  magnetycz- 
nym dostarczają  wielu  cennych  informacji  pomocnych 
przy  identyfikacji  i systematyzacji  widm  i poziomów 
energetycznych.  Doprowadziły  one  również  do  stwo- 
rzenia nowych  metod  spektroskopii  atomowej. 

Z momentami  pędu  elektronu  (orbitalnym  i spinerti) 
są  związane  elementarne  momenty  magnetyczne 
(-►Teoria  magnetyzmu): 


- eh  r - eh  - 

Mi  = — l i Ms  = J . 

2 mc  mc 

Zjawisko  Zeemana  należy  rozpatrywać  jako  oddziały- 
wanie między  polem  zewnętrznym  i tymi  elementar- 
nymi momentami.  Zasadniczym  czynnikiem  charak- 
teryzującym sytuację  fizyczną  po  wprowadzeniu  pola 
magnetycznego  jest  wyznaczenie  kierunku  kwanto- 
wania jednakowego  dla  wszystkich  atomów  zbioru. 
Drugim  istotnym  czynnikiem,  który  należy  wziąć  pod 
uwagę  przy  analizie  tego  zjaw  iska  jest  stosunek  wiel- 
kości oddziaływania  między  polem  magnetycznym 
i momentami  atomowymi  do  wielkości  oddziaływań 
wewnątrza tomowych  sprzęgających  ze  sobą  różne 
momenty. 

Ograniczymy  się  przy  tym  do  rozpatrzenia  tylko 
przypadków  krańcowych:  a)  pola  silnego  — gdy  ener- 
gia oddziaływania  poszczególnych  momentów  z polem 
jest  duża  w porównaniu  z energią  sprzężeń  między 
tymi  momentami;  wówczas  to  sprzężenia  wewnątrz- 
atomowe  zostają  przełamane  i każdy  z momentów 
ustawia  się  niezależnie  względem  pola;  b)  pola  słabe- 
go — gdy  energia  oddziaływania  z polem  stanowi 
tylko  niewielkie  zaburzenie  sprzężeń  wewnątrzato- 
mowych,  które  zostają  zachowane;  skutkiem  oddzia- 
ływania z polem  jest  tylko  skwantowane  ustawianie 
się  momentu  wypadkowego  względem  pola. 

Moment  magnetyczny  powłoki  walencyjnej  o jed- 
nym elektronie  wynosi 


— > — * — ► Pri  — ► — ► — ► — ► 

M = jui+Ms  = — , 

eh 

gdzie  mb  = "2^:  jest  magnetonem  Bohra  (moment  ma- 
gnetyczny elektronu  w stanie  p;  l = 1).  W nieobec- 
; . 1'  ności  pola  kierunki  m różnych  atomów  są  rozłożone 

elel^onae  c^aotycznie  w przestrzeni.  Gdy  natomiast  wprowadzi- 
I walencyjnym  mY  silne  pole  Hy  sprzężenie  LS  zostanie  przełamane 
w silnym  pclu  i każdy  z momentów  ustawi  się  niezależnie  w sposób 

skwantowany  względem  pola  H.  Rzuty  / i s będą  opi- 
sane przez  liczby  kwantowe  rmi  mg  = 4;ł/s.  Tak  więc 

rzut  m na  kierunek  H: 

Mh  = ~ Ms(mi-\-2me)y 


a energia  oddziaływania  z polem 

WH  = —m-H  ~ MBH{mi  + 2ms). 


Każdej  wartości  / odpowiada  27+1  wartości  mi> 
a ponadto  dwie  wartości  m8  = ±V2,  zatem  poziom 
ulega  rozszczepieniu.  Wartości  nawiasu  otrzymane 
przy  sumowaniu  różnych  mi  i ms  częściowo  się  powta- 
rzają i otrzymujemy  ostatecznie  2/-f-  3 różnych  war- 
tości liczbowych.  Energia  całkowita  W — fVn+  WH, 
gdzie  W0  jest  energią  w nieobecności  pola.  Liczby 
falowe  linii  składowych  struktury  zeemanowskiej 
przejścia  między  poziomami  i i / opisuje  wzór: 


vif  = (*r-  wf)/hc  = !-[(<+  ^)-(<+ 


Wprowadzając  na  WH  wyrażenia  zależne  od  mi 
i m8y  stosując  reguły  wyboru  Ami  — Olub  ±1  i Ams  — 
= 0(!)  (zachowanie  orientacji  spinu  w przejściu  pro- 
mienistym) otrzymujemy: 

vf/  = v‘/+  Ami  = V’±LHArm ; 

0 4nmc 2 0 

L — 4,68604  m~*1T“x  jest  tzw.  jednostką  Lorentza.  Ot- 
rzymujemy w ten  sposób  rozszczepienie  linii  na  3 skła- 
dowe odpowiednio  do  wartości  Ami : 

V*7  = i gdy  mi  — ± 1 (składowe  a) 

vf  = v</  gdy  mi  — 0 (składowa  n). 


Jest  to  tzw.  tryplet  Lorentza  — jak  to  przewidywała 
klasyczna  teoria  tego  zjawiska.  Rozsunięcie  składo- 
wych bocznych  jest  proporcjonalne  do  natężenia  pola 
magnetycznego. 

Aby  zaobserwować  zjawisko  Zeemana,  winniśmy 
umieścić  źródło  promieniowania  między  biegunam/ 
silnego  elektromagnesu.  Stosowane  są  dwa  typy 
obserwacji : podłużna  — promieniowania  rozchodzą- 
cego się  wzdłuż  linii  sił  pola  (do  obserwacji  służy  kanał 
przewiercony  w rdzeniu  elektromagnesu),  i poprzecz- 
na — prostopadle  do  linii  sił  (rys.  7).  W każdym  z tych 


Rys.  7.  Dwa  sposoby  obser- 
wacji zjawiska  Zeemana  (ob- 
serwacja podłużna  i poprze- 
czna) 


spektrometr 


przypadków  otrzymuje  się  inny  obraz  składowych 
(rys.  8).  Przy  obserwacji  podłużnej  obserwuje  się  tylko 
składowe  a.  Są  one  spolaryzowane  kołowo,  o przeciw- 
nych zwrotach  (rys.  8a).  Przy  obserwacji  poprzecznej 
mamy  wszystkie  trzy  składowe:  składowa  nie  prze- 
sunięta ( n ) jest  spolaryzowana  liniowo,  równolegle 

do  kierunku  H;  składowe  v są  również  spolaryzowane 

liniowo,  prostopadle  do  H (rys.  8b).  Tego  typu  struk- 
tura nosi  czasem  nazwę  normalnego  zjawiska  Zeema- 
na. Nazwa  ma  pochodzenie  historyczne  — rozszcze- 
pienie na  trzy  składowe  wynikało  z teorii  elektronów 
Lorentza,  przeto  struktury,  które  były  zgodne  z tą 
teorią,  nazywano  normalnymi,  wszystkie  inne  stano- 
wiły zjawisko  anomalne. 

Słabe  pole  zewnętrzne  nie  narusza  sprzężeń  we- 
wnątrza tomowych  i stanowi  w stosunku  do  nich  jedy- 
nie niewielkie  zaburzenie.  Na  przykład  przy  sprzęże- 
niu LS  całkowity  moment  powłoki  elektronowej  J 
pozostaje  wielkością  dobrze  określoną,  a skutkiem 

oddziaływania  z poiem  jest  taka  orientacja  J względem 

pola  H , że  rzut  J na  kierunek  pola  wynosi  Mjh. 
Energia  oddziaływania  z polem  będzie  więc  (podobnie 
jak  poprzednio)  proporcjonalna  do  rzutu  Mj  całko- 
witego momentu  pędu  na  kierunek  pola: 


ehH 


gdzie  g jest  stałą  charakteryzującą  dany  poziom  i wy- 
rażającą się  w wypadku  sprzężenia  LS  bardzo  prosto 
przez  liczby  kwantowe  L,  S i J: 

i J(JĄ- 1 ) -[■  «S,(*S>  •+■  1)  — L(LĄ- 1) 

*=1+ wTT) 

(w  innych  rodzajach  sprzężeń  wyrażenie  na  g jest 
znacznie  bardziej  złożone).  Stałe  g różnych  poziomów 
są  w ogólności  różne,  zależne  od  L,  S i J;  a więc: 

vif  = vjf +LH(giMij—gfMj). 

Reguły  wyboru  na  Mj  są  następujące:  AM ; = 0 
lub  ± 1.  Przejściu  o AMj  = 0 odpowiadają  składowe 
TT,  a przejściu  o AM j = i 1 — składowe  o.  Ich  wa- 
runki obserwacji  i stan  polaryzacji  jest  podobny  jak 
w silnym  polu. 

Struktura  zeemanowska  stanów  o tych  samych 
liczbach  kwantowych  L,  Si  J>  a więc  stanów  odpowia- 
dających tej  samej  sekwencji  termów  (np.  6zPlf  13PU 
ZZPX  itd.),  jest  identyczna.  Różni  się  natomiast  struk- 
tura stanów  tworzących  określony  multiplet  (np.  6ZP0, 
6ZPU  6 ZP2),  bo  różne  są  wartości  J (chociaż  L i S są 
takie  same).  Rozszczepienia  dubletu  sodu  w słabym 
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zjawiska 

Zeemana 
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Rys.  8.  Rozszcze- 
pienie zcemanow- 
skie  w siłnym  polu 
magnetycznym  i ro- 
dzaje polaryzacji 
linii:  a)  obserwacja 
podłużna,  b)  obser- 
wacja poprzeczna 


polaryzacja 

składowych 


zjawisko 
Zeemana 
w słabym 
polu 


rozszczepie- 
nie dubletu 
sodu 
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polu  przedstawia  rys.  9.  Trzem  stanom  3 2S1/2,  32P1^ 
32P3/2  odpowiadają  wartości  g'  = 2,  g"  = 2/s  i g"'  = 
= 4/3.  Charakterystyczną  cechą  otrzymanej  struktury 

Mj 


1 

i 

1 . h 

z,ł 
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Rys.  9.  Struktura  zeemanowska  dubletu  rezonansowego  sodu 
w słabym  polu  magnetycznym 

jest  zgrupowanie  składowych  a na  zewnątrz  struktury, 
a składowych  rc  — w obszarze  bliskim  położenia  linii 
w polu  zerowym,  v0.  Ze  wzrostem  natężenia  pola  skła- 
dowe c odsuwają  się  coraz  dalej,  a wskutek  postępu- 
jącego przełamywania  sprzężenia  wewnątrzatomo- 
wego  grupują  się,  tworząc  w końcu  obraz  taki  jak 
w silnym  polu.  Widać  wreszcie,  że  ponieważ  w sła- 
bym polu  o obrazie  zeemanowskim  decyduje  całko- 
wity moment  pędu  powłoki  elektronowej,  nie  ma 
potrzeby  rozpatrywania  oddzielnie  sytuacji,  gdy 
v/  powłoce  walencyjnej  jest  jeden  elektron  lub  gdy  jest 
ich  kilka. 


Rładsiibtelna  struktura  limi  widmowych 

Badanie  widm  za  pomocą  urządzeń  spektralnych 

0 wielkiej  zdolności  rozdzielczej  (interferometry) 
ujawniło,  że  linie  widmowe  mają  niejednokrotnie 
strukturę  bardzo  złożoną,  rozszczepiają  się  na  kilka, 
a czasem  nawet  kilkanaście  składowych.  Strukturze 
tej  nadano  nazwę  nadsubtelnej  struktury  linii,  a jej 
zbadanie  nie  tylko  pozwoliło  na  odkrycie  nowych 

1 ważnych  efektów  związanych  z oddziaływaniem 
elektronów  powłoki  z jądrem  atomu,  lecz  również 
doprowadziło  do  wyznaczenia  podstawowych  para- 
metrów charakteryzujących  jądro. 

Badanie  struktury  nadsubtelnej  utrudnia  fakt,  że 
linie  widmowe  mają  skończoną  szerokość  spektral- 
ną, co  wynika  z nałożenia  się  kiiku  efektów.  Wspom- 
nimy tu  o dwóch.  Szerokość  naturalna  jest  związana 
z nieokreślonością  energii  A W stanu  atomowego, 
zgodnie  z zasadą  Heisenberga  A Wt  ^ hy  gdzie  r jest 
czasem  życia  atomu  w tym  stanie.  Przechodząc  do 
częstości,  otrzymujemy  Av  = AWjh  ^ (1/2jct)  i przy 
typowych  czasach  życia  stanów  wzbudzonych  (r  = 
= 10-9  s)  Av  x 1,5*  108  Hz.  Jedynie  stan  podstawo- 
wy i stany  metatrwałe  można  uważać  za  spektralnie 
ostre.  Szerokość  dopplerowska  linii  wiąże  się  z tym, 
że  promieniowanie  jest  wysyłane  przez  zbiór  atomów 


0 chaotycznie  rozłożonych  prędkościach  ruchu  ter- 
micznego. Szerokość  ta  Avd  = 8,6- 10" 7 v0j/ 77/ 1 za- 
leży więc  od  częstości  przejścia  vQ , od  temperatury 
bezwzględnej  gazu  T i jego  masy  cząsteczkowej  //. 
Szerokość  dopplerowska  jest  dla  przejść  optycznych 
co  najmniej  o rząd  wielkości  większa  od  szerokości 
naturalnej,  którą  możemy  wówczas  w pierwszym 
przybliżeniu  pominąć.  Przy  badaniach  nadsubtelnej 
struktury  stosujemy  więc  źródła  promieniowania  tak 
zbudowane,  -by  rozszerzenie  dopplerowskie  linii  zmi- 
nimalizować. 

Podobieństwo  między  strukturą  hipermultipletów 
(tak  nazwano  multiplety  nadsubtelnej  struktury) 

1 multipletów  struktury  subtelnej  nasunęło  hipotezę 
(W.  Pauli  1924  r.),  że  jądro  atomowe  jest  obdarzone 
własnym  momentem  pędu  (spinem  jądrowym),  z któ- 
rym jest  związany  również  moment  magnetyczny.  Spin 

jądrowy  fil  jest  opisany  przez  liczbę  kwantową  / (|/|  = 

= //(/+I)  - /*). 

Jądra  o nieparzystej  liczbie  masowej  mają  w ogól- 
ności spin  połówkowy  (/  = V2, 3/2  Gdy  liczba  ma- 
sowa jest  parzysta,  spin  jądra  jest  na  ogół  równy  zeru. 
Wśród  jąder  trwałych  niewiele  jest  wyjątków  od  tej 
reguły : 2H(/  = 1),  *Li  (/  = 1),  14N(/  = 1 ),  40K  (/  = 4). 

Oddziaływanie  między  spinem  jądrowym  I i całko- 
witym momentem  pędu  powłoki  elektronowej  / pro- 
wadzi do  wytworzenia  całkowitego  momentu  pędu 

atomu  F = /+/  (podobnie  jak  sprzężenie  momentów 
L i S w /).  Z niezwykłej  małości  rozszczepienia  nad- 
subtelnego  wnioskujemy,  że  oddziaływanie  między/ 

i J jest  bardzo  słabe  i nie  narusza  istniejących  w po- 
włoce elektronowej  sprzężeń.  Analiza  widm  nadsub- 
telnej struktury  ujawniła  prawidłowości  analogiczne 
do  widm  struktury  subtelnej.  Ułatwiło  to  poważnie 
rozwikłanie  tych  struktur  i wyznaczenie  na  tej  pod- 
stawie spinu  jądrowego  /.  Przez  wiele  lat  analiza  nad- 
subtelnej struktury  była  jedynym  źródłem  informacji 
o spinie  jądrowym  i większość  danych  dotyczących 
jąder  trwałych  pochodzi  z tych  właśnie  pomiarów. 

W dotychczasowych  rozważaniach  traktowano 
jądro  jako  twór  punktowy.  Nawet  wprowadzenie  spi- 
nu jądrowego  nie  wymagało  dodatkowych  założeń 

0 jego  skończonych  rozmiarach.  Jednakże  staranne 
wyznaczenie  rozszczepień  nadsubtelnych  wykazało, 
że  w wielu  wypadkach  napotykamy  wyraźne  odstęp- 
stwa od  wzmiankowanych  poprzednio  reguł  odległoś- 
ciowych. Te  odstępstwa  powiązano  z modyfikacją  wy- 
rażenia na  energię  oddziaływania  elektrostatycznego 
między  jądrem  i elektronem  walencyjnym,  wynikają- 
cą ze  skończonych  rozmiarów  jądra  i z faktu,  że  jądro 
(a  zatem  i rozkład  ładunku  elektrycznego)  nie  jest 
kuliste.  Jądro  jest  elipsoidą  obrotową  (spłaszczoną  lub 
wydłużoną;  — ► Modele  jądrowe).  Natężenie  pola 
elektrycznego  pochodzącego  od  powłoki  elektronowej 
zmienia  się  w obszarze  jądra  i występuje  dodatkowe 
oddziaływanie,  zależne  od  stanu  powłoki  elektrono- 
wej. Wskutek  tego  oddziaływania  rozszczepienia  nad- 
subtelne  ulegają  modyfikacji.  Aby  efekty  można  było 
zaobserwować,  musi  być  spełniony  warunek  / ^ 1 

1 J 1.  Analiza  modyfikacji  struktury  nadsubtelnej 
pozwala  na  obliczenie  elektrycznego  momentu  kwa- 
drupolowego  jądra  (wielkości  tensorowej  będącej 
miarą  odstępstwa  rozkładu  ładunku  w jądrze  od  roz- 
kładu kulistego),  a stąd  na  wnioskowanie  o kształcie 
jądra. 

Na  nadsubtelną  strukturę  linii  widmowych  wpływa 
skład  izotopowy  pierwiastka.  Na  przykład  rtęć  w po- 
staci naturalnej  jest  mieszaniną  sześciu  izotopów. 
Dwa  z nich  (199Hg  i 201  Hg)  obdarzone  są  spinem 
jądrowym,  pozostałe  (198Hg,  2W>Hg,  202Hg  i 204Hg) 
mają  spin  jądrowy  równy  zeru. 

Analiza  zaobserwowanej  struktury  linii  wykazała 
istnienie  przesunięcia  izotopowego,  przesunięcia  o in- 
nym charakterze  niż  wywołane  przez  różnice  w wiel- 
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kości  masy  zredukowanej  m układu  jądro-elektron. 
Powodem  przesunięcia  izotopowego  jest  tzw.  efekt 
objętościowy. 

•Różne  izotopy  tego  samego  pierwiastka  mają 
w jądrze  różne  liczby  neutronów.  Ze  wzrostem  liczby 
neutronów  wzrasta  objętość  jądra,  a zatem  ulega 
zmianie  rozkład  pola  kulombowskiego  w jego  bez- 
pośrednim otoczeniu.  Wynikają  stąd  niewielkie  mo- 
dyfikacje energii  stanów  elektronowych,  szczególnie 
widoczne  wówczas,  gdy  dodając  neutron,  przechodzi- 
my od  wypełnionej  powłoki  neutronowej  w jądrze  do 
obsadzania  następnej. 

Informacje  uzyskane  z omówionych  efektów  nie 
stanowią  wszystkich  informacji,  jakie  można  uzyskać 
z badań  nadsubtelnej  struktury  linii.  Osiągnięto  w tej 
dziedzinie  taką  dokładność  pomiarów,  że  przy  inter- 
pretacji zaobserwowanego  rozszczepienia  "zachodzi 
np.  konieczność  uwzględnienia  skończonych  rozmia- 
rów di  pola  magnetycznego,  jakim  jest  jądro,  a przy 
dyskusji  efektu  oddziaływania kwadrupolowego  trzeba 
wprowadzić  poprawkę  uwzględniającą  to,  że  skończo- 
ne rozmiary  ładunku  jądra  i jego  odstępstwo  od  roz- 
kładu kulistego  wywołują  ze  swej  strony  pewne  de- 
formacje w powłoce  elektronowej,  częściowo  kom- 
pensujące oddziaływanie  kwadrupolowe. 

Rozwinięcie  metod  pompowania  optycznego  i spek- 
troskopii laserowej  (zob.  niżej)  pozwoliło  rozszerzyć 
badania  nadsubtelnej  struktury  linii  widmowych  na 
krótkożyjące  (czas  życia  rzędu  1 min)  izotopy  róż- 
nych pierwiastków  dalekie  od  tzw.  ścieżki  trwałości 
(->  Jądra  atomowe  i ich  wzbudzenia),  zawierające 
znaczny  nadmiar  lub  niedobór  neutronów,  dostępne 
w bardzo  małych  ilościach. 

W wielu  doświadczeniach,  które  objęły  zbadanie 
izotopów  baru  (A  125-135),  metali  alkalicznych:  sodu 
(A  21-31),  rubidu  (A  76-98),  cezu  (A  118-145)  i fransu 
(A  208-213),  wreszcie  rtęci  (A  181-206),  stosowano 
bardzo  wyspecjalizowane  techniki  spektroskopii  lase- 
rowej nieraz  połączone  np.  z metodami  pompowania 
optycznego,  separacji  stanów  przez  odchylanie  wiązek 
atomowych  w niejednorodnym  polu  magnetycznym 
lub  zestrajania  częstości  wzbudzenia  optycznego  ato- 
mu z częstością  lasera  przez  skierowanie  wiązki  ato- 
mowej i światła  współliniowo  i dobór  przesunięcia 
dopplerowskiego  przez  nadanie  atomom  odpowied- 
niej prędkości.  Z badań  tych  można  wnioskować 
o kształcie  jąder  i o nośnikach  momentów  jądrowych. 


Metoda  pompowania  optycznego 


Przy  omawianiu  nadsubtelnej  struktury  linii  widmo- 
wych zwróciliśmy  uwagę  na  ograniczenie  możliwości 
badania  wąskich  struktur  spowodowane  rozszerze- 
niem dopplerowskim  linii  widmowych.  Metodami  tra- 
dycyjnymi wyznaczamy  rozszczepienie  poziomów  po- 
średnio— jako  różnicę  liczb  falowych  składowych 
rozszczepionych  linii  A — va  — ys(rys.  lOa),  co  stano- 
wi dalsze  ograniczenie  precyzji  pomiarów.  Gdy  w do- 
datku rozszczepiają  się  oba  stany  zaangażowane  w 
przejściu,  wówczas  zaobserwowana  struktura  zależy 
od  rozszczepienia  obu  stanów,  a to  komplikuje  proce- 
durę analizy  rozszczepienia  (rys.  lOb). 

Metoda  pompowania  optycznego,  zainicjowana 
i rozwinięta  przez  A.  Kastlera  i J.  Brossela,  jest  sposo- 
bem przygotowania  układu  atomowego  do  pomiarów 
pozwalających  m.in.  na  bezpośrednie  mierzenie  nie- 
wielkich rozszczepień  określonego  poziomu.  Przygo- 
towanie to  polega  na  tym,  że  za  pomocą  wzbudzenia 
optycznego  (promieniowaniem  o odpowiednio  dobra- 
nym składzie  spektralnym,  kierunku  rozchodzenia  się 
wiązki  i rodzaju  jej  polaryzacji;  rys.  7,  8,  9)  możemy 


Rys.  10.  Nadsubtelna  struktura  linii  widmowych.  Schematy 
przejścia  i odpowiadające  im  struktury:  a)  jeden  stan  rozszcze- 
piony, b)  oba  stany  rozszczepione 


otrzymać  selektywne  obsadzenie  wybranych  podpo- 
ziomów  badanej  struktury.  Różni  się  ono  znacznie  od 
obsadzenia,  które  odpowiada  stanowi  równowagi  ter- 
modynamicznej. Tak  przygotowany  układ  możemy 
poddać  działaniu  pól  elektromagnetycznych  o często- 
ści rezonansowej  dla  przejścia  między  podpoziomami 
zeemanowskimi  lub  nadsubtelnymi  i obserwować  re- 
zonans magnetyczny,  tj.  przejścia  wymuszone  przez 
pole  magnetyczne,  albo  też  przerwać  pompowanie 
i obserwować  samorzutny  powrót  układu  do  stanu 
równowagi  termodynamicznej  (relaksację  układu). 
W obu  rodzajach  doświadczeń  sygnał  pomiarowy  jest 
niesiony  przez  promieniowanie  świetlne,  co  zapewnia 
bardzo  wysoką  czułość  detekcji.  Częstości  przejść 
między  rozszczepionymi  podpoziomami  zawierają  się 
w obszarze  od  niewielu  kHz  (rezonanse  jądrowe)  do 
kilkunastu  GHz  (przejścia  między  podpoziomami 
nadsubtelnej  struktury),  czyli  w zakresie  częstości 
radiowych  i mikrofalowych. 

W omawianym  zakresie  częstości  szerokość  dopple- 
rowska  sygnału  jest  tak  mała,  że  można  jej  zupełnie 
nie  bfać  pod  uwagę.  W ten  sposób  zostaje  połączona 
bardzo  wielka  precyzja  wyznaczania  częstości  w ob- 
szarze pól  radiowych  z ogromną  czułością  detekcji 
optycznej. 


Pompowanie  optyczne  par  atomowych 
w stanie  podstawowym 

Zasadę  pompowania  optycznego  w stanie  podstawo- 
wym rozpatrzymy  na  przykładzie  sodu.  Dla  uprosz- 
czenia pominiemy  na  razie  obecność  spinu  jądrowego. 
Komórka  szklana  K zawierająca  parę  sodu  pod  nie- 


Rys.  11.  Układ  do  badania  pompowania  optycznego  w stanie 
podstawowym:  K komórka  z parami  sodu,  L lampa  spektralna. 
Fi  CP  filtry  wydzielające  linię  Dx  i polaryzujące  jej  światło  koło- 
wo, FT  i FR  fotopowielacze  elektronowe  mierzące  sygnał  światła 
przepuszczonego  lub  fluorescencji  rezonansowej;  H0  stałe  pole 
magnetyczne,  H1  pole  magnetyczne  oscylujące 
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Rys.  12.  Schemat  prze- 
biegu pompowania.  Roz- 
szczepienie zeemanow- 
skie  jest  bardzo  małe  w 
porównaniu  z odległością 
poziomów.  Skuteczne  dla 
pompowania  jest  przej- 
ście n.  Relaksacje  R 
przeciwdziałają  pompo- 
waniu 
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wielkim  ciśnieniem  (psa  # 10" 5 Pa)  jest  umieszczona 
w polu  magnetycznym  H0  (rys.  1 1).  Parę  sodu  wzbu- 
dzamy światłem  linii  rezonansowej  Dx  (rys.  12)  spo- 
laryzowanym kołowo  i biegnącym  wzdłuż  linii  sił 
pola.  Badamy  bądź  promieniowanie  przepuszczone 
przez  komórkę,  bądź  też  promieniowanie  fluorescen- 
cji  rezonansowej  obserwowane  w kierunku  prosto- 
padłym do  wiązki  wzbudzającej.  Z obrazu  struktury 
zeemanowskiej  linii  Dx  sodu  widzimy,  że  wzbudzenie 
promieniowaniem  o polaryzacji  kołowej  <r+  (odpowia- 
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dającej  AMj  = -f  1)  działa  tylko  na  atomy  w stanie 
podstawowym  o mj  — — 1U  i prowadzi  do  stanu 
3 zPyj2  o Mj  = -f  V*.  Jest  to  w rozpatrywanych  wa- 
runkach jedyne  przejście  dozwolone  przez  reguły  wy- 
boru. W ten  sposób,  chociaż  pewna  część  atomów 
powróci  do  stanu  wyjściowego,  pozostałe  znajdą  się 
w stanie  o mj  — -f  1/2  i pozostaną  w nim  (nie  ma  z nie- 
go absorpcji).  Gdy  będziemy  pompowali  światłem 
o dostatecznie  dużym  natężeniu,  po  upływie  krótkiego 
czasu  przeważająca  część  atomów  zostanie  przeniesio- 
na do  stanu  o mj  = +V2.  Oczywiście  będą  wystę- 
powały równocześnie  procesy  relaksacyjne  R , dążące 
do  przywrócenia  stanu  równowagi  termodynamicznej, 
umiemy  jednak  zmniejszyć  je  do  tego  stopnia,  by 
w czasie  doświadczenia  utrzymać  znaczną  przewagę 
obsadzenia  podpoziomu  mj  = + V2  nad  obsadzeniem 
mj  = — V*.  Zmiany  w obsadzeniu  podpoziomu  dol- 
nego są  sygnalizowane  przez  wzrost  przezroczystości 
komórki  (przepompowanie  większości  atomów  z pod- 
poziomu mj  — — Va  do  rrtj  = -f -V2  eliminuje  ze  zbio- 
ru te,  które  mogą  pochłaniać  padające  promieniowa- 
nie o użytej  polaryzacji).  Zmniejszeniu  absorpcji 
oczywiście  towarzyszy  spadek  natężenia  fluorescencji 
rezonansowej.  Oba  przebiegi  ilustruje  rys.  13.  Przy- 
puśćmy, że  wskutek  pompowania  w ogólnej  liczbie  N 


czas 


Rys.  13.  Zmiany  natężenia  wiązki  przechodzącej  It  oraz  fluore- 
scencji rezonansowej  If  w czasie  pompowania  (0  ^ ^ ft).  Prze- 

bieg It  znajdujemy  stosując  niezależną  od  pompowania  słabą 
wiązkę  sondującą.  Pompowanie  przerywamy  w chwili  tx  i dla 
t > tj  przebiegi  ilustrują  relaksację  w ciemności 

atomów  sodu  w cm3  ustala  się  taki  rozkład,  iż  na 
poziomie  nu  — 1/2  znajduje  się  rt+  atomów,  na  pozio- 
mie mj  = — V2  znajduje  się  n atomów  (w  stanie  rów- 
nowagi w każdym  z tych  podpoziomów  jest  N/2  ato- 
mów w cm3).  Stopniem  orientacji  (lub  polaryzacją) 
zbioru  atomów  nazywamy  wielkość  P — (n+  —rT)!N. 
Zbiór  zorientowany  ma  makroskopowy  moment  pędu 
o gęstości  g = (fi ] 2)  NP  (J  = Va)  i związany  z nimi 
makroskopowy  moment  magnetyczny  o gęstości 
cyn  = y (fi jl)  NP  (tutaj  y — współczynnik  geomagne- 
tyczny). 

W słabym  polu  magnetycznym  H0  rozszczepienie 
zeemanowskie  f0  sąsiednich  (tj.  o nu  różniącym  się 
o 1)  podpoziomów  wynosi /0  = Jeżeli  teraz, 

przy  ustalonym  natężeniu  wiązki  pompującej,  wy- 
tworzymy w obszarze  komórki  oscylujące  pole  magne- 
tyczne Hi  (prostopadłe  do  H0)  o częstości  / przestra- 


janej  w obszarze/0,  to  przy  / = f0  zaobserwujemy  rap- 
towne zmniejszenie  natężenia  wiązki  przechodzącej 
przez  komórkę.  Odpowiada  to  rezonansowi  częstości 
pola  oscylującego  z częstością  odpowiadającą  roz- 


szczepieniu podpoziomów  zeemanowskich.  Wymusza 
ono  przejście  między  podpoziomami  o nu  — ł/2 
i mj  — — V2,  wyrównując  ich  obsadzenia.  Ostrość 
sygnału  przy  przejściu  przez  rezonans  pozwala  na 
bardzo  dokładne  zmierzenie /0,  a stąd  — rozszczepie- 
nia zeemanowskiego.  Częściej  (ze  względów  technicz- 
nych) stosuje  się  pewną  modyfikację  opisanego  ukła- 
du: częstość  generatora  pola  oscylującego  /<,  jest  usta- 
lona, a przez  obszar  rezonansu  przechodzimy  zmie- 
niając powoli  natężenie  rozszczepiającego  pola  mag- 
netycznego (rys.  14). 

W atomie  rzeczywistym,  którego  jądro  ma  spin 
różny  od  zera,  obraz  pompowania  nie  różni  się  istotnie 
od  opisanego  powyżej,  jakkolwiek  jego  przebieg 
i opis  ilościowy  są  bardziej  skomplikowane.  Obecność 
spinu  jądrowego  powoduje  pojawienie  się  nadsubtel- 
nej  struktury  poziomów,  ich  rozszczepienie  zeema- 
nowskie jest  więc  bardziej  złożone;  słabość  oddziały- 
wania nadsubtelnego  sprawia  przy  tym,  że  już  w nie- 
wielkich polach  (rzędu  10“  4 T)  sprzężenie  między  / i J 
zostaje  naruszone,  podpoziomy  zeemanowskie  prze- 
stają być  równoodległe  i przy  ustalonej  częstości 
rezonanse  między  sąsiednimi  podpoziomami  zeema- 
nowskimi  pojawiają  się  przy  różnych  wartościach  H. 
Badanie  widma  rezonansowego  (za  przykład  może 


natężenie  pola  magnetycznego,  jedn. dowolne 


Rys.  15.  Widmo  rezonansowe  cezu.  Liczby  przy  maksimach 
oznaczają  zmiany  kwantowej  liczby  magnetycznej  (Mf  — kMf). 
Oprócz  przejść  jednokwantowych  (AMy  =1)  widoczne  są  ostre 
maksima  przejść  wielokwantowych  (AMf  — 2,  3) 

służyć  widmo  Cs,  rys.  15)  przy  różnych  wielkościach 
pola  rozszczepiającego  i różnych /0  jest  ważnym  źród- 
łem informacji  o przebiegu  rozszczepienia  zeema- 
nowskiego w polach  pośrednich. 

Gdy  komórkę  wypełnimy  substancją,  której  stałe 
rozszczepienia  zeemanowskiego  są  doskonale  znane, 
wyznaczenie  częstości  rezonansowej  f0  pozwoli  wy- 
znaczyć natężenie  pola  magnetycznego,  w którym  się 
komórka  znajduje.  Na  tej  zasadzie  zbudowano  bar- 
dzo precyzyjne  magnetometry  do  mierzenia  słabych 
pól  (m.in.  do  badań  przestrzeni  kosmicznej). 

Pompowanie  atomów  o różnym  od  zera  spinie  ją- 
drowym prowadzi  za  pośrednictwem  sprzężenia  7 J 
do  orientacji  spinów  jądrowych.  W ten  sposób  można 
otrzymać  układy  zorientowanych  jąder  promienio- 
twórczych i obserwować  np.  anizotropię  rozkładu 
przestrzennego  wysyłanego  promieniowania  jądro- 
wego fi  lub  y.  Niepromieniotwórcze  jądra  mogą  być 
użyte  jako  zorientowane  (spolaryzowane)  tarcze  lub 
źródła  zorientowanych  wiązek  w badaniach  rozpra- 
szania. 
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Procesy  relaksacji 

Wspomnieliśmy  o tym,  że  wytworzeniu  różnicy  obsa- 
dzeń towarzyszy  występowanie  procesów  relaksacyj- 
nych, dążących  do  sprowadzenia  układu  do  stanu 
równowagi  termodynamicznej.  Przy  stałym  pompo- 
waniu, procesy  relaksacyjne  prowadzą  do  ustalenia 
się  stanu  stacjonarnego,  w którym  uzyskany  stopień 
orientacji  zależy  od  szybkości  obu  procesów.  Gdy 
pompowanie  zostaje  wyłączone,  relaksacja  sprowadza 
układ  do  stanu  równowagi  termodynamicznej  (rys.  13, 
przebiegi  krzywych  przy  t >łi).  Z czasowego  przebiegu 
zaniku  orientacji  (mamy  do  czynienia  zazwyczaj  z za- 
nikiem wykładniczym  lub  kombinacją  zaników  wy- 
kładniczych o różnych  stałych  czasu)  możemy  wnio- 
skować o naturze  procesów  relaksacyjnych.  Są  one 
związane  ze  zderzeniami,  jednak  zależnie  od  sytuacji 
fizycznej  — natura  mechanizmów  dezorientujących 
może  być  różna.  Przy  pompowaniu  par  metali  alka- 
licznych potężnym  czynnikiem  relaksacyjnym  są  zde- 
rzenia atomów  zorientowanych  ze  ściankami  szkla- 
nymi lub  kwarcowymi  komórki.  Zderzeniu  ze  ścianką 
towarzyszą  oddziaływania  chemiczne  wiążące  na  niej 
atom  metalu.  W ten  sposób  orientacja  wywołana  przez 
pompowanie  zostaje  całkowicie  utracona.  Aby  zredu- 
kować wpływ  ścianek,  napełnia  się  komórki  rezonan- 
sowe gazem  buforującym  (jest  to  najczęściej  gaz  szla- 
chetny pod  ciśnieniem  od  dużego  ułamka  hPa  do  kil- 
kuset hPa)  albo  też  pokrywa  się  ścianki  komórki  cien- 
ką warstwą  nieaktywnej  chemicznie  substancji  (cięż- 
kie parafiny  lub  silany).  W pierwszym  wypadku  droga 
swobodna  zorientowanych  atomów  ulega  znacznemu 
skróceniu  i atomy  wolniej  dyfundują  ku  ściankom, 
w drugim  — zderzenie  ze  ściankami  wywiera  tak  słabe 
działanie  relaksacyjne,  że  można  uzyskać  wysoki  sto- 
pień orientacji.  Dzięki  pokryciu  ścianek  warstwą 
ochronną  lub  użyciu  gazu  buforującego  dezorientacja 
następuje  dopiero  po  wielu  zderzeniach. 

Oddziaływania  międzyatomowe  prowadzące  do  re- 
laksacji są  więc  różnorodne.  Na  podstawie  analizy 
procesów  relaksacji  stworzono  liczne  modele  opisu- 
jące mechanizmy  zderzeń.  Badanie  przebiegów  re- 
laksacji przyczyniło  się  do  głębszego  poznania  tak 
podstawowego  zjawiska  fizycznego,  jakim  jest  zde- 
rzenie. Odkryto  m.in.  tworzenie  się  chwilowych  czą- 
steczek w zderzeniach  potrójnych  oraz  zerwanie  w 
czasie  trwania  zderzenia  wewnątrzatomowego  sprzę- 
żenia IJ  (niezmiernie  słabego  w porównaniu  z potęż- 
nymi siłami  występującymi  w zderzeniu);  sprzężenie 
zostaje  przywrócone  po  zakończeniu  zderzenia  (z  inną, 
przypadkową  wartością  F ) i dalsza  ewolucja  stanu 
atomu  następuje  przy  jego  zachowaniu  — aż  do  na- 
stępnego zderzenia. 

Oprócz  analizy  procesów  zderzeniowych  badanie 
relaksacji  w obecności  gazu  buforującego  pozwala  na 
dokładne  wyznaczenie  współczynnika  dyfuzji  atomów 
zorientowanych  w gazie,  badanie  zaś  relaksacji  na 
ściankach  komórki  pokrytych  warstwą  ochronną  do- 
starcza wielu  informacji  o procesie  adsorpcji  na  takiej 
warstwie. 

Relaksacje  bada  się  obserwując  przebiegi  zmian  na- 
tężenia światła  wiązki  sondującej  w różnych  proce- 
sach nieustalonych  (zanik  orientacji  po  przerwaniu 
pompowania  lub  czasowy  przebieg  narastania  orien- 
tacji przy  pompowaniu  niezmiernie  słabą  wiązką). 
Skład  spektralny  i rodzaj  polaryzacji  wiązki  sondują- 
cej jest  taki  sam  jak  wiązki  pompującej,  jednak  jej  na- 
tężenie winno  być  możliwie  małe,  by  uniknąć  efektów 
pompowania  przez  nią.  Stałe  czasowe  relaksacji  T 
zależą  oczywiście  od  warunków  fizycznych.  W typo- 
wych warunkach  doświadczalnych  T przybiera  war- 
tości od  kilku  setnych  do  kilku  dziesiątych  sekundy. 

Gaz  buforujący  może  wnosić  pewne  dodatkowe  za- 
burzenie. Gdy  jego  ciśnienie  jest  wystarczająco  duże, 
by  czas  między  kolejnymi  zderzeniami  był  mniejszy 
od  czasu  życia  atomów  w stanie  wzbudzonym,  wów- 
czas zderzenia  wywołują  wyrównanie  obsadzeń  pod- 
poziomów  zeemanowskich  w tym  samym  stanie  i wszy- 


stkie podpoziomy  stanu  podstawowego  zostają  wsku- 
tek reemisji  równomiernie  zapełnione.  Do  wytwo- 
rzenia różnicy  obsadzeń  w stanie  podstawowym  moż- 
na wtedy  doprowadzić  przez  intensywne  pompowa- 
nie, które  wydajnie  opróżnia  jeden  z podpoziomów. 


Pompowanie  optyczne  par  atomowych 
w stanie  wzbudzonym.  Podwójny  rezonans 

Selektywne  obsadzenie  wybranych  podpoziomów  zee- 
manowskich stanu  wzbudzonego  można  uzyskać  przez 
odpowiednią  polaryzację  światła  wzbudzającego.  Ry- 
sunek 1 6 przedstawia  w znacznym  uproszczeniu  układ 
doświadczenia  Brossela  nad  pompowaniem  rtęci  w 
stanie  rezonansowym,  a rys.  17  — schemat  pozio- 


Rys.  16.  Uproszczony  schemat  doświadczenia  nad  podwójnym 
rezonansem:  K komórka  z parą  rtęci,  H 0 stałe  pole  magnetyczne, 
Hx  oscylujące  pole  magnetyczne,  FP1  i FP2  fotopowielacze, 
W wzmacniacz  różnicowy 
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Rys.  17.  Schemat  poziomów  rtęci  zaangażowanych  przy  podwój- 
nym rezonansie  (wzbudzenie  i reemisja):  a)  w nieobecności  re- 
zonansowego pola  oscylującego,  b)  w wypadku  rezonansu  ( RF 
częstość  radiowa) 


mów  jednego  z jej  parzystych  izotopów.  Komórka 
kwarcowa  wypełniona  rtęcią  umieszczona  jest  w sta- 
łym polu  magnetycznym  H0.  Wzbudzenie  linią  rezo- 
nansową o polaryzacji  it  następuje  prostopadle  do  kie- 
runku pola.  Wzbudzona  fluorescencja  rezonansowa 
jest  wykrywana  w dwu  kierunkach  obserwacji.  Wzdłuż 
pola  H0  wydzielamy  składowe  o polaryzacji  <r,  pro- 
stopadle do  niego  składową  n.  W nieobecności  zabu- 
rzeń (pola  rezonansowego  częstości  radiowej,  zderzeń) 
z obsadzonego  przez  wzbudzenie  podpoziomu  Mj  = 0 
następuje  bezpośredni  powrót  do  stanu  podstawo- 
wego— wysłane  promieniowanie  ma  polaryzację  n 
(równoległą  do  H0)  i tylko  fotodetektor  FP2  może  je 
wykryć.  Zgodnie  z prawami  przestrzennego  rozkładu 
promieniowania  n emisja  wzdłuż  pola  Ho  nie  zachodzi 
(rys.  17a).  Jeśli  jednak  atomy  w komórce  zostaną  pod- 
dane działaniu  pola  oscylującego  Hx  o częstości  re- 
zonansowej dla  przejścia  między  podpoziomami 
Mj  = 0->Mj  = ±1,  wówczas  w emisji  pojawią  się 
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podwójny  składowe  a struktury  zeemanowskiej  (rys.  17b),  co 
rezonans  zostanie  zarejestrowane  przez  fotodetektor  FPL  Gdy 
ustalimy  częstość  pola  radiowego  i będziemy  powoli 
przestrajać  H0  przez  obszar  rezonansu,  to  ze  wzmac- 
niacza różnicowego  otrzymamy  sygnał  odpowiada- 
jący rezonansowi  magnetycznemu.  Kształt  krzywej 
rezonansu  magnetycznego  (amplitudę  w funkcji  H0) 
możemy  przewidzieć  teoretycznie  analizując  procesy, 
od  których  jest  on  zależny,  a więc:  wzbudzenie  atomu 
rtęci  ze  stanu  podstawowego  6lS0  do  stanu  rezonan- 
sowego 6zPl9  oddziaływanie  w stanie  wzbudzonym 
z polem  radiowym  wymuszającym  przejście  Mj  — 0 
do  Mj  — ±1,  emisję  samorzutną  po  średnim  czasie 
r i powrót  atomu  do  stanu  podstawowego.  Funkcja 
zatem  opisująca  kształt  linii  rezonansowej  będzie  za- 
wierała : zależność  od  odstrojenia  co— cu0  częstości  pola 
radiowego  od  częstości  rezonansowej  co0 , zależność 
od  amplitudy  H1  tegoż  pola  i zależność  od  czasu  życia 
r stanu  wzbudzonego.  Kształt  otrzymanych  krzywych 
znakomicie  się  zgadza  z przewidywanym  teoretycznie 
(rys.  18).  Prosty  rachunek  pozwolił  powiązać  szero- 
kość połówkową  krzywej  rezonansowej  ztcu1/2  w gra- 
nicznym wypadku  dążących  do  zera  amplitud  Hx 


należenie  pola  magnetycznego  , jedn.  dowolne 
a)  b)  c) 


Rys.  18.  Krzywe  rezonansowe  otrzymane  w doświadczeniu 
Brossela.  Punkty  — wyniki  pomiarów,  linie  ciągłe  — krzywe 
teoretyczne  (jeden  punkt  rodziny  krzywych  dopasowano  do  wy- 
niku doświadczenia).  Układy  krzywych  (a,  b,  c)  odpowiadają 
różnym  gęstościom  nasyconej  pary  rtęci ; krzywe  każdego  układu 
odpowiadają  różnym  amplitudom  pola  częstości  radiowej; 
As  szerokość  naturalna  linii 


z czasem  życia  stanu  wzbudzonego  (AcolJt  = 2/r). 
Można  więc  zmierzyć  bezpośrednio  szerokość  natu- 
ralną linii  (jak  wiemy,  w obszarze  częstości  radiowych 
rozszerzenie  dopplerowskie  nie  odgrywa  żadnej  roli) 
oraz  rozszczepienie  zeemanowskie,  a stąd  z kolei  — 
stałą  Landego  (stałą  g).  Oba  pomiary  doprowadziły 
do  bardzo  ciekawych  wyników.  Okazało  się  miano- 
wicie, że  rozszczepienie  zeemanowskie  stanu  wzbu- 
dzonego różni  się  nieco  od  tego,  które  odpowiada  do- 
skonałemu sprzężeniu  LS: 

gex p = 1.43 8 3 ±0,0004;  g'tfor  = 1,5. 

Różnica  przekracza  wielkość  błędu  pomiarowego 
i pozwala  wnioskować  o pewnej  niedoskonałości 

sprzężenia  LS  w atomie  rtęci  w stanie  63/Y  Na  ten 
sam  fakt  wskazuje  równocześnie  zachodzenie  przej- 
ścia interkombinacyjnego,  łączącego  singletowy  stan 
podstawowy  z trypletowym  stanem  rezonansowym, 

które  w sprzężeniu  LS  jest  silnie  wzbronione.  Wpływ 
tego  wzbronienia  zaznacza  się  wyraźnie  w stosunkowo 
długim  czasie  życia  stanu  63PX  (r  = 1,18  • 10”7s). 

Pomiary  rozszczepienia  zeemanowskiego  i wyzna- 
czenie stałej  Landego  z taką  dokładnością,  na  jaką 
pozwala  metoda  pompowania  optycznego,  dostar- 
czają na  ogół  bardzo  dobrych  informacji  o naturze 
sprzężenia. 

294 


Spójna  dyfuzja  promieniowania 
rezonansowego 


Przy  opisywaniu  stanu  atomu  (ogólniej  — elementarnego  ukła- 
du kwantowego,  czyli  mikroukładu),  za  pomocą  funkcji  falowej 
należy  sprecyzować,  jakimi  wielkościami  (obserwablami)  jeste- 
śmy zainteresowani.  Musimy  pamiętać  przy  tym,  że  zgodnie 
z podstawowymi  prawami  mechaniki  kwantowej  nie  wszystkie 
obserwable  mogą  być  wyznaczone  w jednym  pomiarze.  W za- 
gadnieniach spektroskopii  najczęściej  interesuje  nas  energia  stanu 
i związane  z nią  wielkości  kwadratu  całkowitego  momentu  pędu 
oraz  jednej  z jego  składowych.  Odpowiada  to  tzw.  reprezentacji 
energetycznej  i sprowadza  się  do  rozwiązania  równania  Schró- 
dingera  dla  stanu  stacjonarnego  HW  — EW  (gdzie  H jest  opera- 
torem energii  układu).  Rozwiązanie  tego  równania  polega  na 
znalezieniu  takiego  zbioru  funkcji  stanu  y^by  zachodziło:  H\f/t  = 
= Eiy/i  (Et  jest  liczbą).  Funkcje  \pt  nazywamy  funkcjami  własnymi 
układu,  liczby  zaś  E{  są  to  wartości  własne  energii  (przedstawia- 
jące jedyne  wyniki,  jakie  możemy  otrzymać  z pomiaru  energii 
naszego  mikroukładu).  Można  teraz  rozróżnić  dwie  sytuacje 
w odniesieniu  do  stanu  naszego  mikroukładu.  Mówimy,  że  jest 
on  w stanie  własnym  vit  jeżeli  pomiar  energii  przeprowadzony 
na  nim  daje  z pewnością  wielkość  Et.  Jeśli  natomiast  pomiar 
energii  daje  nam  wielkość  Ex  z amplitudą  prawdopodobieństwa 
ai,  wielkość  Ej  z amplitudą  aj  itd.,  to  stan  i v>/.ważanego  układu 
nazywamy  stanem  superpozycji  i przedstawiamy  jako  liniową 
kombinację  stanów  własnych: 

W = ...  +ai^i  = JT  afi//it 

przy  tym  E\ai\*  = 1.  Zbiór  funkcji  musi  spełniać  pewne  warun- 
ki kompletności  (winien  tworzyć  bazę).  Gdy  widmo  energii  wła- 
snych układu  jest  ciągłe,  a nie  punktowe,  definicje  stanu  superpo- 
zycji ulegają  prostemu  uogólnieniu.  Widać  wreszcie,  że  możemy 
uważać  stan  własny  za  szczególny  przypadek  stanu  superpozycji, 
gdy  tylko  jedna  z wartości  at  = l,  pozostałe  zaś  są  równe  zeru. 
Jeśli  mikroukład  poddany  jest  zewnętrznemu  zaburzeniu  zależ- 
nemu od  czasu,  wówczas  stan  ulega  ewolucji  i każde  aj  - «<(*). 
W ogólnym  wypadku  ewolucje  przebiegają  w każdym  mikrour.  la- 
dzie niezależnie.  Istnieją  jednak  pewne  specjalne  sytuacje  (i  te 
właśnie  nas  obecnie  interesują),  gdy  pod  wpływem  zaburzenia 
zewnętrznego  wszystkie  mikroukłady  należące  do  określonego 
zbioru  makroskopowego  (ansamblu)  dokonują  ewolucji  w pe- 
wien skoordynowany  sposób.  Tego  typu  ewolucje  obserwujemy 
w zbiorze  atomów  pompowanych  optycznie  i poddanych  rezo- 
nansowemu polu  częstości  radiowej.  Długość  fali  radiowej  wie- 
lokrotnie przewyższa  rozmiary  komórki  rezonansowej  i można 
przyjąć,  że  oddziaływanie  między  polem  i atomem  odpowiada 
w-  całym  obszarze  komórki  tej  samej  fazie  drgań  pola.  Wówczas 
ewolucja  a^t)  we  wszystkich  atomach  zachodzi  jednakowo,  czyli 
w uzgodnieniu  fazowym  (identyczne  mikroukłady  poddane  syn- 
chronicznie periodycznemu  zaburzeniu).  Tego  typu  zjawiskiem 
jest  np.  uzgodniona  w fazie  precesja  atomowych  momentów  mag- 
netycznych dokoła  kierunku  pola  prowadząca  do  wytworze- 
nia wirującej  składowej  poprzecznej  makroskopowego  momentu 
magnetycznego.  Ponieważ  w opisanym  przypadku  ewolucja  mi- 
kroukładów zachodzi  w zbiorze  przy  uzgodnieniu  fazowym, 
będziemy  mówili,  że  w tych  warunkach  występuje  spójność  sta- 
nów kwantowych. 

Omówiony  obraz  teoretyczny  superpozycji  sta- 
nów kwantowych  znajduje  piękne  potwierdzenie 
w doświadczeniach  nad  pompowaniem  optycznym 
w stanach  wzbudzonych,  w zjawisku  zwężenia  linii  re- 
zonansu magnetycznego  w stanie  6*PX  atomu  rtęci  ze 
wzrostem  ciśnienia  pary  (nawet  poniżej  szerokości 
naturalnej). 

Od  dawna  było  znane  zjawisko  uwięzienia  promie- 
niowania rezonansowego.  Przy  podwyższeniu  ciśnie- 
nia pary  foton  fluorescencji  rezonansowej  podlega 
reabsorpcji  (jednorazowej  łub  kilkakrotnej),  co  wy- 
dłuża czas  jego  przebywania  w komórce.  Nie  jest  to 
rzeczywiste  przedłużenie  czasu  życia  atomu  w stanie 
wzbudzonym  i nie  może  prowadzić  do  zwężenia  linii. 
Atomy  poddane  radiowemu  polu  rezonansowemu 
znajdują  się  jednak  nie  w stanie  własnym,  lecz  w stanie 
superpozycji 

V = a+,(/)  Vi  ± a0(t)  f0  ± <?_!(()  V-1 , 

gdzie  ai(t)  i yrt  (i  = -f  1,  0,  —1)  oznaczają  odpowied- 
nio amplitudy  i funkcje  własne  stanów  o Mj  — -f-1, 
0,  -1. 

Z ogólnych  rozważań  wynika,  że  kwant  wysłany 
przez  atom  w stanie  superpozycji  po  pochłonięciu  go 
przez  inny,  identyczny  atom  wzbudzi  go  również  do 
stanu  superpozycji,  a ten  z kolei  pod  wpływem  poła 
radiowego  będzie  kontynuował  ewolucję  poprzed- 
niego itd.  W tych  warunkach,  zgodnie  z kwantową 
zasadą  nierozróżnialności  atomów,  nie  możemy  wska- 
zać, czy  to  pierwszy  atom  wykonywał  ewolucję  w sta- 
nie wzbudzonym  przez  czas  odpowiednio  dłuższy, 
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czy  też  foton  przechodził  z atomu  do  atomu,  tylko  że 
ich  ewolucje  były  utrzymywane  przez  rezonansowe 
pole  radiowe  w ustalonej  fazie.  Taka  sytuacja  w isto- 
cie prowadzi  do  zwężenia  linii.  Jeśli  się  teraz  prze- 
prowadzi serie  pomiarów  szerokości  linii  rezonansu 
magnetycznego  w funkcji  ciśnienia  pary,  to  się  okaże, 
że  wraz  z malejącym  ciśnieniem  pary  szerokość  linii 
wzrasta  (!),  dążąc  do  wartości  odpowiadającej  rze- 
czywistemu czasowi  życia  atomu  w stanie  wzbudzo- 
nym (widać  to  wyraźnie  na  wykresach  przedstawio- 
nych na  rys.  18). 

Dalsza  analiza  wyrażeń  na  natężenie  promienio- 
wania wysłanego  przez  zbiór  atomów  w takich  warun- 
kach prowadzi  do  wniosku,  że  gdy  emisja  następuje 
w obecności  rezonansowego  pola  częstości  radiowej, 
natężenie  promieniowania  winno  być  zmodulowane 
z częstością  Larmora  lub  podwójną.  Te  modulacje 
w istocie  były  zaobserwowane,  zgodnie  z przewidywa- 
niami teoretycznymi . 

Spójne  wzbudzenie  stanów  można  uzyskać  nie  tyl- 
ko w obecności  radiowego  pola  rezonansowego. 
Dobre  wyniki  dało  wzbudzanie  bardzo  krótkimi 
(najwyżej  nanosekundowymi)  błyskami.  Szerokość 
spektralna  błysku  (impulsu)  jest  wtedy  wystarczająca, 
by  objąć  całą  badaną  strukturę  (zeemanowską,  nad- 
subtelną  lub  nawet  subtelną).  Wzbudzenie  wszystkich 
atomów  następuje  właściwie  w tym  samym  momencie 
(stałe  czasowe  ewolucji  są  znacznie  dłuższe  niż  czas 
wzbudzenia)  i zanika  wykładniczo  z nałożoną  modu- 
lacją o częstości  równej  rozszczepieniu  stanów  (zob. 
str.  297). 

W doświadczeniach  nad  pompowaniem  optycznym 
w stanie  podstawowym  rezonansowe  pole  radiowe 
wprowadza  spójność  między  podpoziomami  zeema- 
nowskimi.  Można  ją  wykryć  za  pośrednictwem  modu- 
lacji wiązki  poprzecznej  i wykorzystać  do  powiększe- 
nia dokładności  pomiarów  (m.in.  magnetometrycz- 
nych). 


Rys.  19.  Rozszczepienia  zeemanowskie  poziomów  energetycznych 
He  należących  do  n — 2 w układzie  trypletowym.  Stan  23S.  jest 
metatrwały  i może  stanowić  bazę  przejść  w układzie  trypletowym. 
Linia  X = 1083,034  nm  jest  w nim  linią  rezonansową.  Przecięcia 
poziomów  zaznaczone  czarnymi  okręgami  dają  sygnały,  na  pod- 
stawie których  można  obliczyć  rozszczepienie  stanów  3P,  3Pir 
wynoszące  2291,56±0,09  MHz.  Odległość  między  3P,  i 3 Po  obli- 
czona na  podstawie  analizy  teoretycznej  rozszczepienia  subtel- 
nego stanu  3P  helu,  wynosi  29  650^280  MHz.  Czas  życia  stanu 
2 *P  obliczony  z szerokości  sygnału  był  również  zgodny  ze  zmie- 
rzonym bezpośrednio.  Przecięcia  poziomów  oznaczone  okręga- 
mi niebieskimi  nie  spełniają  warunku  Amj  = 2 i takie  sygnały 
nie  były  obserwowane  przy  użytej  polaryzacji  światła 


ftffletoda  „przecinania  poziomów" 

Wzbudzenie  atomów  do  spójnej  superpozycji  sta- 
nów może  być  osiągnięte  wówczas,  gdy  znajdują  się 
one  w polu  magnetycznym  o stosownie  dobranym 
natężeniu 

Rysunek  19  przedstawia  diagram  energii  stanów 
23jP0,  j,  2 helu.  Każda  gałąź  wykresu  odpowiada  sta- 
nowi o określonych  liczbach  kwantowych  (7,  Mj) 
i obrazuje  zależność  energii  tego  stanu  od  natężenia 
pola  magnetycznego.  Weźmy  pod  uwagę  przecięcie  ga- 
łęzi (2, 7)  i (/,  — 7)  przy  Hc  « 0,057  T.  W tych  warun- 
kach dwóm  różnym  stanom  odpowiadać  będzie  ta 
sama  energia.  Jeśli  teraz  wzbudzimy  fluorescencję 
rezonansową  atomów  znajdujących  się  w polu  magne- 
tycznym i przejdziemy  przez  obszar  Hc  (zmieniając 
stopniowo  natężenie  pola),  to  zaobserwujemy  zmia- 
nę natężenia  fluorescencji  w obszarze  „przecięcia 
poziomów".  Na  podstawie  ogólnej  teorii  zjawiska 
Zeemana  możemy  z dobrym  przybliżeniem  obliczyć 
zmianę  energii  stanu  wywołaną  przez  przejście  od  H = 
= 0 do  H = Hc.  Z rys.  19  widać,  że  suma  zmian 
energii  poziomów  (2, 7)  i (7,  —7)  daje  wprost  rozszcze- 
pienie poziomów  ZPX  i aP2.  Szerokość  sygnału  (w  skali 
H,  którą  łatwo  przeliczyć  na  MHz)  zależy  tylko  od 
szerokości  naturalnej  poziomów,  daje  więc  informację 
o czasie  życia  stanu  wzbudzonego.  Dzięki  swej  pro- 
stocie metoda  wyznaczania  tych  dwóch  ważnych 
parametrów  stanów  atomowych  jest  ostatnio  bardzo 
szeroko  stosowana,  szczególnie  przy  badaniach  wyso- 
kich stanów  wzbudzenia  atomów  trudno  dostępnych 
innymi  metodami.  Z rys.  19  widać  również,  że  gdy 
H = 0,  przecinają  się  więcej  niż  dwa  poziomy.  Syg- 
nał „przecięcia  poziomów”  w polu  zerowym  może  być 
również  wykorzystany  do  obliczenia  czasu  życia  stanu 
wzbudzonego.  Ostatnio  stosowanie  tej  metody  roz- 
ciągnięto również  na  stany  wzbudzone  prostych 
cząsteczek. 


Pompowanie  nadsisbtelne 

Przy  pompowaniu  optycznym  w stanie  podstawowym 
atomów  o niezerowym  spinie  jądrowym  wytwarzamy 
różnicę  obsadzeń  nie  tylko  między  podpoziomami 
zeemanowskimi,  lecz  również  między  poszczególnymi 
składowymi  hipermultipletu.  Można  to  wykryć  przez 
zmianę  sygnału  optycznego  po  przyłożeniu  rezonan- 
sowego pola  elektromagnetycznego.  W metalach  al- 
kalicznych częstości  rezonansowe  Av  przejść  między 
podpoziomami  struktury  nadsubtelnej  odpowiadają 
już  jednak  obszarowi  mikrofalowemu  (np.  Av  = 1772 
MHz  dla  23Na,  Av  = 6834,7  MHz  dla  87Rb  i Av  = 
= 9192,6  MHz  dla  l33Cs).  Szczególnie  interesujące  są 
wypadki,  w których  jest  możliwe  przeprowadzenie 
pompowania  w nieobecności  pola  zewnętrznego, 
wówczas  bowiem  częstość  przejścia  (tzw.  przejścia  re- 
zonansowego nadsubtelnego)  może  być  wyznaczona 
z olbrzymią  dokładnością  (dzięki  niezależności  od 
ewentualnych  fluktuacji  pól  zewnętrznych).  Można 
więc  ją  przyjąć  jako  dogodny  wzorzec  częstości.  Po 
bardzo  licznych  badaniach  i dyskusjach  jako  definicję 
sekundy  przyjęto  w 1967  r.  czas  równy  9 192  631  770 
okresów  promieniowania  odpowiadającego  przejściu 
między  podpoziomami  nadsubtelnej  struktury  F = 
= 4 -+  F'  = 3 (Mf  = Mf'  = 0)  w stanie  podstawo- 
wym 6 251/2  atomu  izotopu  cezu  133Cs.  Wzorcem  pier- 
wotnym jest  układ,  w którym  atomy  cezu  biegną  w 
postaci  promienia  atomowego  (smukłej,  równoległej 
wiązki  atomów)  i separacja  atomów  w stanach  Fi  F' 
następuje  w polu  magnetycznym  (->  Spektroskopia 
mikrofalowego  rezonansu  rotacyjnego),  a nadsubtelne 
pompowanie  optyczne  wykorzystuje  się  w precyzyj- 
nych wzorcach  wtórnych,  w których  się  stosuje  op- 
tyczną detekcję  rezonansu  mikrofalowego.  Pompo- 
wanie odbywa  się  przez  wzbudzanie  jedną  z dwu  skła- 
dowych nadsubtelnej  struktury  linii  Dx.  Linia  Dx  w 
widmie  metali  alkalicznych  składa  się  w rzeczywistości 
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z czterech  składowych,  jednak  rozszczepienie  nad- 
subtelne  stanu  wzbudzonego  jest  wielokrotnie  mniej- 
sze od  rozszczepienia  stanu  podstawowego;  w przy- 
rządzie o niezbyt  wielkiej  zdolności  rozdzielczej  wy- 
dzielamy jedną  z dwu  par  składowych  i pompując  nią, 
struktura  opróżniamy  jeden  z podpoziomów  nadsubtelnych 
nadsufrteina  stanu  podstawowego  (rys.  20). 

f=ł+1/2 
f'=7— 1/2 


3 I 
I i 
I 3 
I I 


F=I  + 1/2 

2o 

^V2 

F'=I- 1/2 

Rys.  20.  Struktura 
nadsubtelna  linii  Dx 
metalu  alkalicznego  o 
spinie  jądrowym  I 

Wielkie  możliwości  wydajnego  pompowania  nad- 
subtelnego  otwiera  stosowanie  strojonych  laserów 
barwnikowych  o działaniu  ciągłym,  a zastosowanie 
gazu  buforującego  i wykorzystanie  wywołanego 
przezeń  specyficznego  efektu  zwężenia  linii  rezonansu 
nadsubtelnego  pozwala  uzyskać  dokładność  przy  wy- 
znaczaniu rozszczepienia  nadsubtelnego  do  ułamka 
Hz  (przy  częstości  9 • 109  Hz). 

powiązanie  Ogólna  zasada  powiązania  częstości  z wzorca  ato- 
zegara  z mowego  z zegarem  (w  tym  wypadku  z wysoce  stabil- 
wzorcem  nym  generatorem  elektronicznym,  umożliwiającym 
zsyntetyzowanie  częstości  wzorcowej  i zaopatrzo- 
nym w urządzenie  do  zliczania  okresów)  polega  na 
porównaniu  obu  częstości  drgań  metodą  interferencji. 
Przy  bardzo  bliskich  częstościach  interferujących  fal 
otrzymujemy  dudnienia,  których  liczba  w sekundzie 
daje  wprost  odstrojenie  zegara  od  wzorca  atomowego. 

Ostatnio  podjęto  dalsze  próby  zwiększenia  dokład- 
ności wzorca  częstości.  Wykorzystuje  się  układy  lase- 
rów o działaniu  ciągłym  i o częstości  stabilizowanej 
na  wybranych  liniach  widma  molekularnego.  Uzyski- 
wanie częstości  kombinacyjnych  przez  zdudnianie 
wiązek  laserowych  (dzięki  wykorzystaniu  nielinio- 
wych zjawisk  optycznych)  pozwala  na  nawiązanie 
częstości  optycznych  do  częstości  mikrofalowych 
i uzyskanie  dokładności  rzędu  10-15,  a stabilności 
nawet  do  10“ 17  (N.P.  Chebotaev).  Ta  dokładność  na- 
suwa poważne  problemy  związane  ze  znacznie  mniej 
dokładną  definicją  innych  podstawowych  stałych  fi- 
zycznych. 


Zderzenia  wymienne 

W mieszaninie  dwu  rodzajów  atomów  paramagnetycz- 
nych A i B (np.  Rb  i Cs)  orientacja  układu  atomów  A 
uzyskana  przez  pompowanie  optyczne  może  być  w 
zderzeniach  przekazana  atomom  B.  Wynik  zderzenia 
wymiennego  jest  więc  taki,  jak  gdyby  zderzające  się 
atomy  wymieniały  wzajemnie  swe  elektrony  walen- 
cyjne (stąd  nazwa : zderzenia  wymienne).  Symbolicznie 
można  to  przedstawić  w postaci  reakcji  A\+B\-+ 
— ► gdzie  strzałki  wskazują  orientację  wekto- 

rów spinu  elektronu  walencyjnego.  Ten  proces  jest, 
jak  widać,  pompowaniem  atomów  B oraz  równocześ- 


nie jednym  z czynników  relaksacji  atomów  A.  W ten 
sposób  można  uzyskiwać  orientację  atomów,  których 
bezpośrednie  pompowanie  jest  ogromnie  niewygodne, 
a czasem  wręcz  niemożliwe.  Za  pomocą  zderzeń  wy- 
miennych uzyskano  orientację  wszystkich  izotopów 
wodoru  (iH,  2H,  3H),  azotu  (14N,  1&N),  fosforu  32P 
a także  elektronów  swobodnych  e~ . 

W rzeczywistości  zderzenie  wymienne  prowadzi  do 
utworzenia  układu  przejściowego,  złożonego  ze  skład- 
ników A i By  mającego  charakter  chw  ilowej  cząsteczki. 
Jej  czas  życia,  ok.  10" 12  s,  jest  wystarczająco  długi, 
by  powstało  sprzężenie  w powłoce  elektronowej, 
i jednocześnie  dość  krótki  na  to,  by  sprzężenia  mię- 
dzy powłoką  elektronową  i jądrami  atomów  zostały 


mechanizm 

wymiany 


Czysto  jądrowa  orientacja  atomów 

Przy  pompowaniu  optycznym  (lub  przez  zderzenia 
wymienne)  atomów  obdarzonych  spinem  jądrowym 
i mających  w stanie  podstawowym  wypadkowy  mo- 
ment magnetyczny  powłoki  elektronowej  równy  zeru 
mamy  do  czynienia  z ciekawym  przypadkiem  czysto 
jądrowej  orientacji.  Przykładem  mogą  tu  służyć  3He 
(/  = V8,  stan  podstawowy  o zerowym  momencie 
orbitalnym  i zerowym  wypadkowym  spinie  elektro- 
nowym) oraz  199Hg  ( l — V2,  stan  podstawowy  61S0). 

Rtęć  można  pompować  czysto  optyczną  metodą  (rys.  pompowanie  ■ 
21),  wykorzystując  przy  tym  koincydencję  nadsubtel-  jądrowe 
nej  składowej  A (J  = V2  F = x/a)  i linii  parzystego 
izotopu  204Hg.  Pompowanie  3He  jest  znacznie  bardziej 
złożone:  za  pomocą  słabego  wyładowania  wytwarza- 
my w He  atomy  w stanie  metatrwałym  23S1  i pompu- 
jemy je  optycznie  linią  1083  nm  (rys.  19).  Przez 
sprzężenie  między  powłoką  elektronową  i spinem 
jądrowym  pompowanie  wywołuje  częściową  orientację 
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Rys.  21.  Pompowa- 
nie jądrowe  izotopu 
1B*Hg.  Na  rys.  zaz- 
naczono strukturę 
zcemanowską  tylko 
składowej  A 
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jądrową.  W zderzeniach  wymiennych  z atomami  he- 
lu w stanie  podstawowym  atomy  zorientowane  prze- 
kazują partnerom  zderzenia  energię  wzbudzenia  i orien- 
tację powłoki  elektronowej,  natomiast  orientacja 
jądrowa  pozostaje  nie  zaburzona.  Wypełniona  powło- 
ka elektronowa  o konfiguracji  1 sz  stanowi  znakomitą 
ochronę  jądra  przed  oddziaływaniami  zaburzającymi, 
atomy  3He  mogą  więc  zachowywać  orientację  jądrową 
przez  długie  godziny,  stanowiąc  w ten  sposób  zorien- 
towany zbiór  przygotowany  do  doświadczeń  fizyki 
jądrowej. 


Atomowa  spektroskopia 
laserowa 


Omówimy  tu  kilka  zasadniczych  kierunków,  w ja- 
kich się  rozwija  zastosowanie  laserów  w spektroskopii 
atomowej. 
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użycie  1)  Użycie  lasera  jako  przestrajanego  źródła  pro- 
przes^raja-  mieniowania  w badaniach  absorpcyjnych.  Szerokość 
nych  Saserów  spektralna  źródła  laserowego  może  być  bardzo  mała 
(do  kilku  MHz).  Wiązka  z lasera  zostaje  podzielona 
za  pomocą  półprzezroczystej  płytki  na  dwie,  z któ- 
rych jedna  przechodzi  przez  badany  ośrodek,  druga 
zaś  jest  wiązką  odniesienia.  Odpowiednie  wy  wzorco- 
wanie pozwala  nałożyć  na  widmo  absorpcji  skalę 
częstości. 

2)  Użycie  lasera  impulsowego  do  obserwacj  i zaniku 
fluorescencji  i dudnień  kwantowych,  powstających 
przy  spójnym  wzbudzeniu  nierozszczepionej  struktury, 
i wnioskowaniu  stąd  o wielkości  rozszczepienia  po- 
ziomów i o czasach  ich  życia. 

atomowa  Rozszczepienie  subtelne  stanów  atomowych  szyb- 
spekt  resko-  ko  maleje  ze  wzrostem  głównej  liczby  kwantowej  n 
pia  błyskowa  i liczby  kwantowej  momentu  orbitalnego  L,  toteż  nie 
można  go  obserwować  w badaniach  wyższych  sta- 
nów prowadzonych  zwykłymi  metodami  spektrosko- 
powymi (rozszczepienie  staje  się  znacznie  mniejsze 
wykorzysta-  od  szerokości  dopplerowskiej  linii,  przeto  struktury 
nie  dudnień  subtelnej  w ogóle  nie  można  zaobserwować).  Wyko- 
kwantowycfa  rzystanie  zjawiska  dudnień  kwantowych  pozwoliło  na 
przeprowadzenie  bardzo  dokładnych  pomiarów  roz- 
szczepień subtelnych  (np.  S.  Haroche  zmierzył  tą  me- 
todą rozszczepienia  stanów  />3/2-Z>5/2  w sodzie  i w ce- 
zie, od  stanu  9 D do  1 6Z>).  Idea  doświadczenia  (prosta 
w schematycznym  przedstawieniu,  lecz  bardzo  trudna 
i skomplikowana  w realizacji)  polegała  na  tym,  że 
atomy  badanej  pary  wzbudzano  ze  stanu  podstawo- 
wego krótkimi  (najlepiej  nanosekundowymi)  błyskami 
ze  strojonego  lasera  barwnikowego.  Stan  podstawowy 
w metalach  alkalicznych  jest  stanem  5,  a więc  przejście 
bezpośrednie  do  stanu  D jest  wzbronione  przez  reguły 
wyboru  dla  liczby  kwantowej  L.  Jednak  (i  to  jest 
bardzo  wygodne)  wiązka  laserowa  o dużej  mocy  może 
wywołać  przejście  dwufotonowe  — każdy  z fotonów 
niesie  kwantową  jednostkę  momentu  pędu  ±fi  i przy 
jednoczesnej  absorpcji  dwu  fotonów  możliwe  są 
przejścia  ze  zmianą  liczby  kwantowej  L o dwa  lub  bez 
jej  zmiany  (ALzfot  = 0 lub  2).  Musi  być  spełniony 
również  warunek  zachowania  energii  hvs_D  — hvx+hv2f 
przy  czym  w najprostszym  wypadku  vs_D  = 2vL 
(wszystkie  fotony  z lasera  mają  częstość  vl).  Krótki 
błysk  wzbudza  atomy  do  stanu  superpozycji  i fluore- 
scencja  obserwowana  prostopadle  do  wzbudzenia 
gaśnie  wykładniczo,  co  daje  bezpośrednią  informację 
o czasie  życia  t stanu  wzbudzonego,  a krzywa  zaniku 
fluorescencji  jest  modulowana  z częstością  odpowiada- 
jącą częstości  dudnień.  Gdy  na  sygnał  modulowanego 
zaniku  nałożymy  sygnały  czasu,  z częstości  modulacji 
wywnioskujemy  bezpośrednio  o częstości  rozszczepie- 
nia stanów. 

Zauważymy  wreszcie,  że  jeśli  struktura  jest  bardziej 
złożona  (np.  wysokie  stany  wzbudzenia  układu  try- 
pletowego),  to  modulacja  ma  postać  złożoną  i wid- 
mo częstości  znajdujemy  jako  transformatę  fourierow- 
ską czasowego  przebiegu  modulacji.  Zarówno  od- 
dzielenie modulacji  od  wykładniczego  zaniku,  jak 
też  jej  fourierowska  analiza  są  dokonywane  przez 
urządzenia  elektroniczne. 


Rys.  22.  Zasada  metody  spektroskopii  nasyceniowej : a)  linia 
absorpcyjna  o rozkładzie  dopplerowskim ; b)  zmiana  absorpcji 
wskutek  nasycenia  w odległości  Av  od  środka  linii  v0;  c)  zmiana 
absorpcji  w środku  linii  wskutek  nasycenia;  strzałki  oznaczają 
te  częstości  wiązki  sondującej,  przy  których  następowałyby  efekty 
nasycenia  (wiązka  sondująca  biegnie  w kierunku  przeciwnym  do 
wiązki  nasycającej) 


3)  Badanie  wąskich  struktur  metodami  spektro- 
skopii nasyceniowej ; eliminują  one  rozszerzenie  dop- 
plerowskie  i umożliwiają  rejestrację  widma  szerokości 
takiej  jak  szerokość  spektralna  wiązki  sondującej. 

Idea  metody  jest  objaśniona  na  rys.  22.  Przy  prze-  spektro- 
świetlaniu  ośrodka  pochłaniającego  wiązką  z lasera  skopia 
o bardzo  małej  szerokości  spektralnej  (np.  rzędu  nasyceniowa 
kilku  lub  kilkunastu  MHz)  padające  promieniowanie 
jest  pochłaniane  tylko  przez  te  atomy,  których  ruch 
wywołuje  przestrojenie  dopplerowskie  częstości  przej- 
ścia v0  atomu  w spoczynku  do  częstości  v wiązki  z la- 
sera. Przepuszczenie  przez  ośrodek  wiązki  z lasera 
o dużym  natężeniu  może  wywołać  znaczne  zmniej- 
szenie liczby  atomów  zdolnych  do  jej  pochłaniania 
(następuje  nasycenie  absorpcji,  rys.  22b).  Wykorzystaj- 
my teraz  do  sondowania  osłabioną  wiązkę  laserową. 

Przesyłamy  ją  przez  kuwetę  absorpcyjną  w kierunku 
przeciwnym  do  wiązki  nasycającej.  Jeżeli  częstość 
wiązki  nasycającej  nie  przypadnie  akurat  w środku 
badanej  linii  (co  odpowiada  jej  absorpcji  przez  atomy 
o zerowej  składowej  prędkości  ruchu  termicznego 
wzdłuż  kierunku  wiązki  laserowej),  to  nasycenie 
absorpcji  nie  będzie  odpowiadało  częstości  powraca- 
jącej wiązki  sondującej  i nie  wywrze  żadnego  wpływu 
na  jej  osłabienie  przy  przejściu  przez  kuwetę.  Dopiero 
dokładne  dostrojenie  wiązki  nasycającej  do  środka 
linii  badanej  będzie  sygnalizowane  przez  ostre  maksi- 
mum wiązki  sondującej  (rys.  22c). 

Nawet  względne  pomiary  ilościowe  rozszczepień 
struktury  tą  metodą  są  trudne  i wymagają  wzorcowa- 


Rys.  23.  Struktura  linii  Dx  serii  Balmera  deuteru.  Oznaczenia 
składowych  odpowiadają  przejściom  wskazanym  na  rys.  5; 
sygnał  wzorcujący  pochodzi  ze  stabilizowanego  lasera  He-Ne 
(wg  T.  W.  Hanscha,  A.  L.  Schawlowa  i in.) 

nia  układu  za  pomocą  linii  o długości  fali  nawiązanej 
bezpośrednio  do  kryptonowego  wzorca  długości. 

Pokonanie  tych  trudności  daje  jednak  w rekompensa- 
cie pomiar  z dokładnością  nigdy  przedtem  nie  osiąga- 
ną. Strukturę  linii  serii  Balmera  deuteru  przed- 
stawia rys.  23. 

Jednym  ze  szczytowych  osiągnięć  metody  spektro-  przesunięci© 
skopii  nasyceniowej  (dwufotonowej)  był  bezwzględny  Lamba 
pomiar  przesunięcia  Lamba  stanu  podstawowego  w w wodorze 
wodorze.  Wiązka  z iasera  barwnikowego  po  podwo- 
jeniu częstości  do  X x 243,0  nm  w nieliniowym  krysz- 
tale (— ► Optyka  nieliniowa)  wywoływała  dwufotono- 
wą absorpcję  w wodorze,  powodując  przejście  1 5 -> 

->  2 5,  które  można  obserwować  pośrednio  przez  śle- 
dzenie indukowanej  w zderzeniach  (25*  — ► 2 P)  linii 
Lys  oX  = 121,5  nm.  Przez  wzbudzenie  dwufotonowe 
wiązkami  przeciwbieżnymi  zwężono  spektralny  obszar 
wzbudzenia  poniżej  2%  szerokości  dopplerowskiej 
linii.  Równocześnie  podstawowa  częstość  lasera 
wzbudza  linię  H$  (25,  P -►  45,  P,  D\  vlvx  — 4v//^). 

T.  W.  Hansch  otrzymał  niezwykle  dokładne  wyzna- 
czenie częstości  przejścia  Ly*  rejestrując  w czasie 
przestrajania  lasera  przez  obszar  absorpcji  dwufoto- 
nowej równocześnie  przebieg  zmian  absorpcji  linii  Hp 
(wzorcując  zatem  bardzo  dokładnie  częstość  podsta- 
wową Vq).  Jest  ona  o 8,6±0,8  GHz  dla  wodoru 
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i 8,3 ±0,3  GHz  dla  deuteru  mniejsza  od  przewidywa- 
nej teoretycznie  częstości  linii  Ly «,  bez  uwzględnienia 
przesunięcia  Lamba  poziomu  15  (rys.  24). 


-10  o 10  20GHz 

częstość  wiązki  z lasera 


Rys.  24.  Wyznaczenie  przesunięcia  Lamba  poziomu  15  w deu- 
terze.  Wykres  górny  — zapis  struktury  linii  /?  serii  Balmera; 
wykres  dolny  — krzywa  dwufotonowego  wzbudzenia  linii  a 
serii  Lymana;  odcinki  — teoretyczna  struktura  linii  Hp.  Skala 
dolnego  wykresu,  a więc  i zaznaczonego  przesunięcia  Lamba  po- 
ziomu 15,  w v/4  (wg  T.  W.  Hanscha,  A.  L.  Schawlowa  i in.) 


dwufoto-  4)  Dwufotonowe  wzbudzenie  z eliminacją  rozsze- 
nowe  rżenia  dopplerowskiego  (B.  Cagnac)  — metoda  o bar- 
wzhudzenie  dzo  dużej  zdolności  rozdzielczej.  Jeśli  na  komórkę  Ky 
bez  rozsze-  zawierającą  np.  parę  sodu,  pada  wzdłuż  jej  osi  silna 
rżenia  i bardzo  wąska  spektralnie  wiązka  z przestrajanego 
dopplerow-  lasera  o częstości  v bliskiej  v0  (przy  tym  2v0  jest  czę- 
skiego  stością  przejścia  np.  32S1J2-¥Dlf2),  to  staje  się  możliwe 
dwufotonowe  wzbudzenie  atomów  sodu  wprost  do 
stanu  3*jE>1/2  (ogólnie  do  n2Dj  lub  n251/2).  Jednak  nawet 
przy  dostrojeniu  lasera  dokładnie  do  częstości  v0 
wzbudzenie  jest  słabe,  bowiem  pochłaniać  mogą  tylko 
te  atomy,  których  składowe  prędkości  bezładnego 
ruchu  cieplnego  vz  = 0.  Gdy  częstość  wiązki  v'  ± v0, 
pochłaniać  mogą  atomy  dla  których 

v = v0(l  -\-vz/ć). 


W układzie  odniesienia  związanym  z tymi  atomami 
„widziana”  przez  nie  częstość  wiązki  odbitej  od 
zwierciadła  Z,  ustawionego  za  kamórką,  wynosi 

v"  = v0(l  -vx/c). 

Przy  jednoczesnym  oddziaływaniu  obu  wiązek  (rezo- 
nans) energia  pochłonięta  (równa  hvi—kvf)  wyniesie 


/zv0|l±-y-j  1 — = 2kv0. 

Warunek  zgodności  energii  przejścia  dwufotonowego 
jest  jak  widać  spełniony  dla  wszystkich  atomów  nie- 
zależnie od  ich  prędkości,  przy  czym  prawdopodo- 
bieństwo wzbudzenia  przez  dwa  fotony  biegnące  w 
kierunkach  przeciwnych  jest  czterokrotnie  większe 
niż  gdy  fotony  poruszają  się  w tym  samym  kierunku. 
Nastąpi  więc  bardzo  silne  wzbudzenie  dwufotonowe; 
szerokość  spektralna  sygnału  jest  określona  przez  sze- 
rokość spektralną  wiązki  laserowej, 
badanie  Ważne  zastosowanie  tej  metody  to:  a)  Badania 
struktury  struktury  subtelnej  bardzo  wysoko  wzbudzonych  sta- 
subtelnej  nów  atomowych  (tzw.  stanów  rydbergowskich)  przy 
i nadsubtelnej  n rzędu  kilkudziesięciu.  Atom  ma  wówczas  osobliwą 
stanów  ryd-  stiukturę:  na  zewnątrz  rdzenia  o rozmiarach  10~5  cm 
bergowskich  rozciąga  się  chmura  elektronu  walencyjnego  na  obszar 
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tysiące  razy  większy.  B.  Stoicheff  zbadał  w ten  sposób 
rozszczepienie  poziomów  struktury  subtelnej  stanów 
D w rubidzie  aż  do  n = 65  (A65  D3/2  5/2)  = 35  MHz, 
zaś  położenie  tych  stanów  aż  do  n = 85  (0,16  cm-1 
poniżej  granicy  jonizacji).  Czasy  życia  atomów  w sta- 
nach rydbergowskich  są  bardzo  długie  (proporcjo- 
nalne do  n s),  nie  jest  więc  możliwa  bezpośrednia  obser- 
wacja fluorescencji  z tych  stanów.  Podstawową  metodą 
badania  jest  wyznaczanie  energii  jonizacji  przez  bada- 
nie elektronów  wyzwolonych  w tym  procesie,  b)  Ba- 
dania struktury  nadsubtelnej  wysoko  wzbudzonych 
stanów  (rozszczepiono  struktury  odległe  o kilkadzie- 
siąt MHz  i wyznaczono  przesunięcie  izotopowe  linii), 
c)  Badania  rozszerzenia  ciśnieniowego  linii  widmo- 
wych sodu  przy  bardzo  małych  ciśnieniach  gazu  za- 
burzającego (wyniki  bardzo  ważne  przy  analizie 
procesów  oddziaływania  w zderzeniach),  d)  Uzyskanie 
możliwości  selektywnego  obsadzania  wybranego  po- 
ziomu w układzie  złożonym  z wielu  bardzo  blisko  le- 
żących poziomów.  Ma  to  znaczenie  przy  badaniach 
mechanizmów  zderzeniowych  przekazywania  wzbu- 
dzenia, a także  przy  realizacji  metody  rozdzielania 
izotopów  przez  selektywne  wzbudzanie  optyczne. 


Spektroskopia  wiązka-tarcza 


Omówione  w poprzednich  rozdziałach  metody  sto- 
suje się  do  badań  stanów  podstawowych  i wzbudzo- 
nych atomów  neutralnych.  Badania  widm  jonów  są 
znacznie  bardziej  skomplikowane  (szczególnie  przy 
wielokrotnej  jonizacji)  wskutek  trudności  w wytwo- 
rzeniu i zmagazynowaniu  dostatecznej  liczby  jonów 
w obszarze  obserwacji  oraz  w uzyskaniu  wielokrotnej 
jonizacji.  Inne  trudności  w badaniach  atomowych  po- 
chodziły z ograniczonej  rozdzielczości  czasowej  foto- 
detektorów i układów  elektronicznych.  Wiele  z nich 
można  przezwyciężyć  dzięki  wprowadzonej  przed  kil- 
ku laty  metodzie  spektroskopowej:  wiązka-tarcza 
(S.  Bashkin,  H.J.  Andra). 

W tej  metodzie  jony  badanych  atomów  zostają 
przyspieszone  w akceleratorze  (np.  van  de  Graaffa 
lub  liniowym)  i zależnie  od  rodzaju  doświadczenia 
uzyskują  energię  100  keV-kilku  MeV  (nabywają  one 
prędkość  l-10mm/ns).  Przyspieszone  jony  przechodzą 
następnie  przez  niesłychanie  cienką  folię  węglową 
(ok.  10  pg/cm2).  W czasie  przejścia  trwającego  At  x 
~ 10“ 2 ps  zachodzi  oddziaływanie  z folią  i dalsza 
jonizacja,  prowadząca  niejednokrotnie  do  całkowitego 
niemal  odarcia  atomu  z elektronów  (wytworzone  zo- 
stają jony  dziesięcio-,  a nawet  kilkunastowartościowe, 
np.  Ar17+). 

Spektroskopia  wiązka-tarcza  dostarczyła  niezwykle 
interesujących  wyników.  Okazało  się  możliwe  połą- 
czenie z nią  specjalnych  metod  omówionych  po- 
przednio i uzyskanie  niezmiernie  wysokiej  precyzji 
pomiarów.  Ponadto  możliwe  jest  osiągnięcie  wzbudze- 
nia bardzo  wysokich  stanów  (praktycznie  dowolnych). 
Przy  pomiarach  tą  metodą  nie  ma  zaburzeń  wprowa- 
dzonych przez  zderzenia.  Badania  można  przepro- 
wadzać w ogromnie  szerokim  obszarze  widma  (od 
promieni  rentgenowskich  do  czerwonego  krańca  wid- 
ma widzialnego).  Gdy  wzbudzamy  stany  o liczbie 
kwantowej  J > U występują  zależne  od  \Mj\  różnice 
obsadzeń,  co  daje  możliwość  prowadzenia  doświad- 
czeń z rezonansem  magnetycznym  i jego  optyczną 
detekcją.  Ponieważ  czas  wzbudzenia  At  jest  rzędu  10" 2 
ps,  a nawet  10“3  ps,  otrzymujemy  spójne  wzbudzenie 
blisko  leżących  stanów  i modulowany  zanik  wysyła- 
nego promieniowania.  Szybkość  wiązki  atomowej 
wynosi  ok.  108  cm/s,  co  zapewnia  rozdzielczość  po- 
miarów czasowych  lepszą  niż  0,1  ns. 

Pierwsze  badania  widm  metodą  wiązka-tarcza 
przyniosły  ogromny  materiał,  w którym  oprócz  linii 
znanych  z pomiarów  metodami  tradycyjnymi  znalezio- 
no ogromną  liczbę  linii  nowych. 


rozszerzenie 

ciśnieniowe 

linii 

widmowych 


oddziaływa- 
nie przyspie- 
szonych 
jonów  z folią 


badania  widm  Wychodzące  z folii  wiązki  jonów  o różnej  krotno- 
a tomów  ści  rozdzielano  w separatorach.  Badając  świecenie 
zjonizo-  rozdzielonych  grup,  można  było  przypisać  nowo  od- 
wanyoh  kryte  linie  określonym  jonom.  Niejednokrotnie  do- 
datkową informację  przynosiło  wyznaczenie  czasu  gaś- 
nięcia  różnych  linii.  Z dużą  dozą  prawdopodobień- 
stwa można  przypuszczać,  że  linie  o tym  samym  cza- 
sie gaśnięcia  wychodzą  z tych  samych  stanów. 

Badaniom  poddawano  systematycznie  pewne  grupy 
jonów,  a więc  np.  widma  jonów  o strukturze  izoelek- 
tronowej: Lii,  Bell,  BIIL  CIV  itd.  (widmo  atomu 
obojętnego  oznacza  się  cyfrą  rzymską  I,  jonu  jedno- 
wartościowego  — cyfrą  II ; tak  więc  np.  CV  oznacza 
widmo,  lub  układ  termów,  węgla  czterokrotnie  jo- 
nizowanego, ArXVIII  — widmo  argonu  zjonizowane- 
go  siedemnastokrotnie,  Ar17+),  o strukturze  homolo- 
gicznej : Neli,  Arii,  KrII,  XeII.  Ważnym  elementem 
tych  badań  było  wyznaczanie  prawdopodobieństw 
przejść  dla  sekwencji  jonów  o strukturze  izoelektro- 
nowej i porównywanie  wyników  doświadczalnych 
z przewidywaniami  teoretycznymi,  opartymi  na 
przybliżonych  obliczeniach  funkcji  falowych.  Wyniki 
mogły  ocenić  dobroć  przybliżenia, 
badan  £e  Metoda  pomiaru  czasu  życia  w wiązce  wzbudzonych 

czasów  atomów  jest  stosunkowo  prosta  i polega  na  pomiarze 
życia  gaśnięcia  badanej  linii  wzdłuż  wiązki,  w funkcji 
wzbudzonych  odległości  od  folii.  Układ  spektrometryczny  i pole 
jonów  obserwacji  są  stałe,  a folię  przesuwa  się  skokami, 
(ich  wielkość  waha  się  od  0,05-0,01  mm  zależnie  od 
warunków.  Te  skoki  połączone  są  z przestrajaniem 
kanałów  analizatora  układu  elektronicznego  groma- 
dzącego dane  pomiarowe. 


Pomiar  przesunięcia  Lamba  przy  dużych  Z 

Wyrażenie  na  rozszczepienie  Lamba,  o którym  była 
mowa  na  str.  287,  jest  przybliżone.  W rzeczywistości 
jest  ono  opisane  przez  podwójne  rozwinięcie  względem 
a i («Z).  W wodorze  wyrazem  znaczącym  (mającym 
udział  przekraczający  99%  wielkości  rozszczepienia) 
jest  wyraz  zawierający  a (a Z)4.  Wyrazy  wyższego  rzę- 
du można  więc  pominąć.  Tymczasem  w jonach  o więk- 
szym Z (np.  07+),  w stanie  o n = 2,  udział  wyrazów 
wyższego  rzędu  wzrasta  niemal  do  10%  ; zbadanie  ich 
poprawności  i zgodności  z doświadczeniem  staje  się 
rzeczą  bardzo  interesującą.  Bezpośredni  pomiar  roz- 
szczepienia stanów  przy  użyciu  metody  Lamba  i Re- 
ther forda  w jonach  wodoropodobnych  o większym  Z 
napotyka  jednak  ogromne  trudności.  Jeżeli  nawet 
pominąć  trudności  związane  z ogniskowaniem  szyb- 
kich jonów  w polach  magnetycznych,  to  i tak  w wy- 
padku ciężkich  jonów  będziemy  mieli  do  czynienia 
z bardzo  znacznymi  częstościami  rezonansowymi 
między  rozszczepionymi  stanami,  leżącymi  w bardzo 
niedogodnym  obszarze  widma  (przesunięcie  5 wynosi 
783  GHz  dla  C5+,  a 2200  GHz  dla  07+  ; jest  to  obszar 
dalekiej  podczerwieni).  Do  wyznaczenia  5 potrzebna 
więc  będzie  inna  metoda,  która  wykorzystuje  zjawisko 
mieszania  się  stanów  251/2  i 2Pi/2,  gdy  atomy  wiązki 
adiabatycznie  wchodzą  w pole  elektryczne.  (Termin 
„przejście  adiabatyczne*5  oznacza  tu,  że  czas  nara- 
stania pola  elektrycznego  jest  bardzo  długi  w porówna- 
niu z okresem  przejścia  225j/2  ->  2 2P i/2)«  Zmieszanie 
stanów  wywołuje  skrócenie  czasu  życia  poprzednio 
metatrwałego  stanu  2 251/2.  To  skrócenie  zależy  od 
natężenia  pola  elektrycznego  E,  a także  od  wielkości 
przesunięcia  Lamba  S i wyraża  się  wzorem  ■ 

1 _ 1 |L(£)1* 

gdzie  r / jest  czasem  zaniku  stanu  25  po  wprowa- 
dzeniu atomu  w pole  elektryczne,  t2P  czasem  za- 
niku promienistego  stanu  2 P,  V{E)  — funkcją  natęże- 
nia pola  elektrycznego  wyrażającą  zaburzenie  stanu 
*5  /2.  Przesunięcie  5 wyznacza  się  z pomiaru  czasu 
zaniku  t s>  linii  Lya,  wysłanej  ze  stanu  25  , w funkcji 


natężenia  pola  elektrycznego  E.  Czas  r ^ jest  znany 
z licznych  doświadczeń.  Wyniki  prowadzą  do  dosko- 
nałej zgodności  z przewidywaniami  teoretycznymi: 


5(C5+) teor  = 783,68  ±0,25  GHz, 
5(C5+)exP  = 780,1  ±8,0  GHz, 
5(07+)teor  = 2205,17±  1,56  GHz, 
5(07+)exP  = 2202, 7±  11  GHz. 


Zastosowanie  metody  wiązka-tarcza  umożliwiło  balanse  ^ 
badanie  wzbudzeń  wieloelektronowych  (wzbudzo-  wz budzeń 
ne  dwa  — lub  więcej  — elektrony  w stosunku  do  wieloeSektro- 
konfiguracji  odpowiadającej  stanowi  podstawowemu  nowych 
atomu).  Systematyczne  badania  wzbudzenia  dwuelek- 
tronowego  rozpoczęto  w 1969  r.  (W.S.  Bickeli  M.  Du- 
fay).  W wiązce  poza  folią  znaczna  część  atomów  znaj- 
dowała się  w stanie  dwuelektronowego  wzbudzenia. 

Widma  wysyłane  przez  te  atomy  zawierały  ogromną 
liczbę  linii  nie  znanych  uprzednio.  Dotychczasowe 
badania  obejmują  zaledwie  kilka  najlżejszych  pier- 
wiastków i jonów,  np.  H",  Hel  i układy  izoelektro- 
nowe Liii,  BIV  oraz  Lii  i układy  izoelektronowe 
Bell,  CIV.  Napotyka  się  wiele  różnych  trudności. 

Jedną  z najpoważniejszych  stanowi  proces  autojoni- 
zacji.  Gdy  energia  stanu  wzbudzenia  dwuelektrono- 
wego przewyższa  energię  jonizacji  atomu  przy 
wzbudzeniu  jednoelektronowym,  wówczas  w wyniku 
oddziaływania  prowadzącego  do  mieszania  stanów 
o różnych  konfiguracjach  (tu  dyskretnego  stanu 
wzbudzonego  dwuelektronowo  i kontinuum  joniza- 
cji)—bardzo  się  zwiększa  prawdopodobieństwo 
przejścia  bezpromienistego  do  stanu  kontinuum  po- 
wyżej granicy jednoelektronowej  jonizacji,  połączone 
z emisją  elektronu.  Proces  ten  może  wywołać  skrócenie 
czasu  życia  stanu  wzbudzenia  dwuelektronowego  tak 
znacznie  (do  10"1*  s),  że  inne  przejścia  z niego  będą 
zupełnie  nieobserwowalne.  Pomiary  utrudnia  fakt,  że 
znaczna  część  przejść  ze  wzbudzenia  dwuelektrono- 
wego leży  w obszarze  bardzo  dalekiego,  próżniowego 
nadfioletu,  graniczącego  z obszarem  miękkich  promie- 
ni rentgenowskich,  a nawet  zachodzącego  na,  ten  ob- 
szar. Przejścia  autojonizacyjne  są  jednak  częściowo  og- 
raniczone przez  reguły  wyboru  i to  sprawia,  że  wiele 
stanów  ma  czasy  życia  już  uchwytne  w pomiarach 

(10"10-10"9  s).  . . . 

W badaniu  wzbudzeń  dwuelektronowych  otrzyma-  hatSame  ^ 
no  dwa  typy  widm:  jedne  z nich  odpowiadają  przej-  wzbudzeń 
ściom  od  konfiguracji  wzbudzenia  dwuelektrono-  dwuefektro- 
wego  do  poziomów  dyskretnych  wzbudzenia  jedno-  nowych 
elektronowego  (rys.  25),  inne  — przejściom  między 
różnymi,  nie  podlegającymi  autojonizacji  stanami 
układu  wzbudzenia  dwuelektronowego  (rys.  26). 

Pomiary  położeń  linii  widmowych  oczywiście  były 
uzupełnione  wyznaczeniem  ich  natężeń  i czasów  ży- 


2 p2  3P 


2s  2 p 3P 


Rys.  25.  Przejścia  w Hel  między  stanami  wzbudzenia  dwu-  1 jed- 
noelektronowego : linią  przerywaną  oznaczono  przejścia  dozwo- 
lone, lecz  nie  obserwowane  (wg  H.G.  Berry  ego) 
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widma  elek- 
tronów 
z autojoni- 
zacji 
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cia,  co  w metodzie  spektroskopii  wiązka-tarcza  nie 
nastręcza  szczególnych  trudności,  aż  do  czasów 
rzędu  10  ps.  Przyporządkowanie  zaobserwowanych 


Rys.  26.  Przejścia  w układzie  trypletowym  między  stanami  wzbu- 
dzenia dwuelcktronowego  w Hel  zaobserwowane  w doświad- 
czeniach wiązka-tarcza 

linii  przejściom  między  określonymi  stanami  wymaga- 
ło trudnej  i wnikliwej  analizy  teoretycznej.  Trzeba  było 
przyjąć  model  opisujący  konfigurację  i oddziaływania 
w powłoce  elektronowej,  przeprowadzić  przybliżone 
obliczenia  funkcji  falowych  i policzyć  stąd  energie  sta- 
nów i czasy  życia.  Na  ogół  otrzymano  dobrą  zgod- 
ność otrzymanych  wyników  dla  Hel,  Liii  i Lii,  któ- 
rych diagramami  poziomów  przy  różnych  konfigura- 
cjach wzbudzenia  dwuelektronowego  już  dysponuje- 
my. Obliczenia  dotyczące  układów  o większej  liczbie 
elektronów  dają  gorszą  zgodność  z doświadczeniem. 

Bardzo  ważnym  uzupełnieniem  badań  spektrosko- 
powych jest  badanie  widma  energetycznego  elektro- 
nów pochodzących  z procesu  autojonizacji.  Ich  energia 


składa  się  z dwóch  części : energii  związanej  z ruchem 
atomów  w wiązce  i energii  związanej  z procesem 
autojonizacji  z określonego  stanu  wzbudzenia  dwu- 
elektronowego. Po  oddzieleniu  pierwszej  części  e- 
nergii  otrzymujemy  widmo  energetyczne  elektronów 
z procesu  autojonizacji.  Jego  kolejne  maksima  od- 
powiadają energii  kolejnych  stanów  wzbudzenia  dwu- 
elektronowego. 

Wzbudzenie  wiązka-laser 

Mimo  wielu  niewątpliwych  zalet  metoda  wzbudza- 
nia atomów  w folii  ma  pewne  wady:  np.  nieselektywne 
jednoczesne  wzbudzanie  atomów  do  różnych  stanów, 
a nawet  produkcja  wielu  różnych  stopni  jonizacji, 
lub  efekty  kaskadowe  (atom  osiąga  kaskadowo  ba- 
dany stan)  w zaniku  stanów,  utrudniające  analizę 
wyników  pomiarów.  Często  można  uniknąć  tych  efek- 
tów wzbudzając  przyspieszone  w akceleratorze  jony 
wiązką  laserową.  Metoda  ta  pozwala  na  celowy  wybór 
szerokości  spektralnej  wiązki  z lasera,  na  precy- 
zyjne dostrojenie  częstości  przez  regulację  kąta  na- 
chylenia wiązki  laserowej  względem  wiązki  atomów 
(dostrojenie  dopplerowskie).  Omówione  poprzednio 
pomiary  można  w ten  sposób  przeprowadzić  ze  znacz- 
nie zwiększoną  dokładnością;  dotyczy  to  np.  pomiaru 
czasu  zaniku  fluorescencji  z określonych  stanów  pro- 
stych, badania  efektów  modulacyjnych  (przy  użyciu 
do  wzbudzenia  wiązki  laserowej  o takiej  szerokości 
spektralnej,  która  by  wystarczyła  do  objęcia  wszyst- 
kich poziomów  badanej  struktury,  pomiaru  nadsub- 
telnej  struktury  dolnego  stanu  przez  stopniowe  prze- 
strajanie  częstości  wzbudzającej  zmianą  nachylenia 
wiązki  laserow-ej  względem  wiązki  atomów  i obser- 
wację efektywności  wzbudzenia. 

Dokładność  otrzymanych  tą  metodą  wyników  na- 
leży do  szczytowych  osiągnięć  nie  tylko  spektroskopii, 
lecz  badań  fizycznych  w ogóle.  Pomiary  czasu  życia 
są  obarczone  błędem  rzędu  0,02  ns;  rozszczepienie 
poziomów  w stanie  wzbudzonym  można  mierzyć  z do- 
kładnością do  ułamka  MHz.  Prowadzi  to  do  dokład- 
niejszego wyznaczenia  wielkości  stałych  powszech- 
nych ; ostatnie  pomiary  stałej  Rydberga  dały  wartość 
R = 109  737,3143(4)  cm-1. 

H.A.  Enge,  M.R.  Wekr,  J.A.  Richards  Wstęp  do  fizyki  ato- 
mowej, Warszawa  1981;  W.  Hanle,  H.  Kleinpoppen  Progress  in 
Atomie  Spectroscopy , A i B Plenum  Press...  1979;  D.  Kunisz  Fi- 
zyczne podstawy  emisyjnej  analizy  widmowej.  Warszawa  1973; 
Z.  Leś  Wstęp  do  spektroskopii  atomowej , Kraków  1969;  artykuły 
w Postępach  Fizyki:  9,  495  (1958);  11,379  (1960);  12,  533  (1961); 
13,  27  (1962);  13,  41  (1962);  19,  557  (1968);  18,  287  (1968);  21 
209  (1970);  21, 511  (1970);  21, 543  (1970);  25,497  (1974);  26,  303 
(1975);  21,  297  (1976);  28,29(1977);  28,  167  (1977);  29,  3 (1978); 
29,  419  (1978). 


Spektroskopia  molekularna 


Podstawowe  pojęcia 
spektroskopii  molekularnej 

Jerzy  Prochorow 

Zanim  przejdziemy  do  szczegółowego  omówienia  za- 
kresu i przedmiotu  badań  spektroskopii  molekular- 
nej, poświęcimy  nieco  uwagi  ogólnym  cechom  cząste- 
czek i promieniowania  elektromagnetycznego,  oraz 
metodom  badania  ich  wzajemnego  oddziaływania. 


Energia  cząsteczek 

Jeżeli  izolowana  cząsteczka  ma  pewną  energię,  związa- 
ną np.  z ruchem  jaki  wykonuje,  lub  z określonym  od- 
działywaniem pomiędzy  jej  elementami,  to  mówimy, 
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że  cząsteczka  znajduje  się  w określonym  stanie 
energetycznym,  a ilość  energii,  jaką  ma,  określa 
ten  stan  energetyczny. 

Próbując  określić  energię  cząsteczki  stosujemy  za- 
zwyczaj uproszczenie  polegające  na  założeniu,  że 
poszczególne  ruchy  i oddziaływania  w obrębie  cząs- 
teczki są  od  siebie  niezależne,  a suma  ich  energii  sta- 
nowi całkowitą  energię  cząsteczki.  Można  wyróż- 
nić cztery  podstawowe  źródła  energii  cząsteczki. 

Pierwszym  źródłem  energii  jest  ruch  translacyjny 
(postępowy)  cząsteczki  jako  całości.  Cząsteczka 
o masie  M poruszająca  się  z prędkością  v w danym 
kierunku  ma  energię  kinetyczną  jEtrans  = Mv2j2.  Pręd- 
kość, a więc  i energia  kinetyczna  cząsteczki  w gazie 
zależy  od  temperatury  gazu,  przy  czym  z kinetyczno- 
molekularnej  teorii  gazów  wynika,  że  średnia  energia 
kinetyczna  ruchu  translacyjnego  jest  równa  £trans  = 
— z/zkT  (Je  — stała  Boltzmanna,  T — temperatura). 


stała 

Rydberga 


translacja 

cząsteczki 


Energia  ta,  w odróżnieniu  od  innych  rodzajów  enegrii 
cząsteczki,  zmieniać  się  może  w sposób  ciągły  (nie 
przybiera  dyskretnych  wartości,  albo  jak  mówimy,  nie 
jest  skwantowana). 

rotacja  Oprócz  ruchu  postępowego  cząsteczka  może  roto- 
cząstecz&d  wać,  tzn.  obracać  się  jako  całość  wokół  określonej 
w przestrzeni  osi,  co  jest  kolejnym  źródłem  energii 
cząsteczki.  Jeżeli  moment  bezwładności  względem  wy- 
branej osi  cząsteczki  izolowanej  jest  równy  /,  to 
energia  ruchu  rotacyjnego 

'"-w''"11- 

Liczba  J nazywa  się  kwantową  liczbą  rotacji  i może 
przybierać  wartości  / = 0, 1, 2,  3, ....  A zatem  energia 
rotacyjna  może  przybierać  tylko  pewne  (nie  wszystkie 
możliwe)  wartości.  Dlatego  właśnie  poziomy  rotacyjne 
(stany  energetyczne  rotacji)  są  dyskretne  (energia  ro- 
tacji jest  skwantowana). 

ruchy  oscy-  Innym  źródłem  energii  cząsteczki  są  ruchy  oscyla- 
lacyjrc®  cyjne  (drgania)  atomów  w cząsteczce  względem  ich 
cząsteczki  położeń  równowagi.  Oscylacje  takie  można  rozpatry- 
wać, tak  jakby  to  były  drgania  harmoniczne,  a wtedy 
każdemu  drganiu  atomów,  zachodzącemu  z częstoś- 
cią v,  można  przypisać  energię  Eos c = hv(v+\)\ 
tutaj  /r  jest  stałą  Plancka,  v — tzw.  kwantową  liczbą 
oscylacyjną,  która  podobnie  jak  kwantowa  liczba 
rotacyjna,  może  przybierać  tylko  pewne  wartości, 
a mianowicie  v = 0, 1,  2,  3,  ....  Tym  samym  również 
i poziomy  oscylacyjne  (stany  energetyczne  oscyla- 
cji) są  poziomami  dyskretnymi  (energia  oscylacji  jest 
skwantowana). 

Dwa  pierwsze  źródła  energii  związane  są  z cząs- 
teczką traktowaną  jako  całość,  trzecie  wiąże  się  z ru- 
chem elementów  składowych  cząsteczki,  jakimi  są 
atomy  (bądź  ściślej  jądra  atomowe), 
energia  Czwarte  źródło  energii  wiąże  się  z elektronami 
elektronową  w cząsteczce.  Elektrony  mogą  być  w cząsteczce  rozło- 
cząsteczki  żonę  w różny  sposób,  a z każdym  takim  możliwym 
rozkładem  ładunku  elektronowego  związana  jest  inna 
energia.  Energię  tę  nazywamy  energią  elektronową 
cząsteczki,  a stany  energetyczne  odpowiadające  ener- 
gii elektronowej  nazywamy  stanami  elektronowymi 
cząsteczki.  W zasadzie,  nie  można  podać  prostego, 
ogólnego  wyrażenia  opisującego  energię  elektronową 
cząsteczki  (-*  Chemia  kwantowa),  takiego  jak  w przy- 
padku energii  rotacyjnej  i oscylacyjnej.  Ale  również 
i energia  elektronowa  cząsteczki  jest  skwantowana 
i może  przybierać  tylko  pewne  dyskretne  wartości. 
Zmiana  rozkładu  ładunku  elektronowego  w cząstecz- 
ce, a więc  zmiana  stanu  elektronowego  cząsteczki,  mo- 
że pociągać  za  sobą  również  zmiany  (czasem  bardzo 
znaczne)  momentu  bezwładności  i częstości  oscylacji. 
Tym  samym  ze  zmianą  stanu  elektronowego  cząsteczki 
wiąże  się  na  ogół  zmiana  energii  Erot  i £osc. 

Te  cztery  źródła  energii  są  najważniejszymi,  ale 
nie  jedynymi  źródłami  energii  cząsteczki.  1 tak  np. 
jeżeli  jądra  atomowe  cząsteczki  mają  spin  jądrowy, 
to  z różną  orientacją  jąder  wiąże  się  różna  energia. 
Podobnie  dodatkowa  energia  pochodzić  może  od 
orientacji  spinów  elektronowych  i ruchów  orbitalnych. 
Są  to  jednak  na  ogół  już  tylko  efekty  dodatkowe  (i  czę- 
sto bez  większej  wagi)  w stosunku  do  wymienionych 
poprzednio  rodzajów  energii  cząsteczki, 
stan  Mówiąc  o różnych  rodzajach  energii  cząsteczki, 
podstawowy  .nie  mówiliśmy  nic  o tym,  jak  duże  są  te  energie  i czy 
cząsteczki  są  one  jednakowo  istotne  z punktu  widzenia  spek- 
troskopii molekularnej.  Aby  móc  o tym  nieco  więcej 
powiedzieć,  musimy  przede  wszystkim  sprecyzować 
skalę,  a więc  i zero  tej  skali,  oraz  jednostki,  w ja- 
kich będziemy  mierzyli  energię  cząsteczki.  W spektro- 
skopii molekularnej  definiujemy  zazwyczaj  zero  ener- 
gii jako  tzw.  stan  podstawowy  cząsteczki.  Jest  to 
umowna  definicja  i przez  stan  podstawowy  należy  rozu- 
mieć taki  stan,  do  osiągnięcia  którego  zmierzać  będzie 
coraz  więcej  cząsteczek  układu,  wtedy  gdy  (w  warun- 
kach równowagi  termicznej)  temperatura  układu  zmie- 
rza do  temperatury  zera  bezwzględnego.  Taki  stan  jest 


najniższym  możliwym  stanem  energetycznym  cząs- 
teczki, albo  mówiąc  inaczej,  jest  to  najniższa  możliwa 
energia,  jaką  może  osiągać  cząsteczka  zachowując 
swoje  cechy  indywidualne,  każde  dalsze  obniżenie  jej 
energii  związane  będzie  z reakcją  chemiczną,  a więc 
i ze  zmianą  samej  cząsteczki. 

W spektroskopii  molekularnej  nie  posługujemy  się 
jednolitą  skalą  energii.  Ze  względu  na  dość  znaczne 
różnice  energii  pochodzących  z różnych  źródeł,  a tak- 
że ze  względu  na  różny  często  charakter  problemów, 
w których  rozwiązaniu  pomaga  spektroskopia,  sto-  jednostki 
suje  się  różne  jednostki  do  określania  energii  samych  energii 
cząsteczek  i energii  procesów,  w których  one  uczest- 
niczą. Podstawową  jednostką  mógłby  być  oczywiście 
J/cząsteczkę,  jest  ona  jednak  bardzo  niewygodna 
i dlatego  podajemy  inne  jednostki,  częściej  używane 
w spektroskopii  molekularnej,  jak  również  związki 
między  nimi : 

1 eV/cząsteczkę  = 1,6021  TO-1* 

J/cząsteczkę  = 9,6481  • 10*  J/mol 
1 cm"1  = 1,9862  1 0-23 
J/cząsteczkę  — 11,9612 
J/mol  = 1,2398  *10-4  eV/cząsteczkę. 

Operując  tymi  jednostkami  możemy  teraz  porównać 
różne  energie  cząsteczki.  I tak  średnia  energia  trans- 
lacyjna,  w temperaturze  pokojowej,  jest  rzędu  4 kJ/ 

/mol.  Jednak  tylko  w nielicznych  procesach,  które  ba- 
da spektroskopia,  w grę  wchodzi  zmiana  energii 
translacyjnej.  Dlatego  też  w dalszych  naszych  roz- 
ważaniach nie  będziemy  brali  pod  uwagę  energii 
translacyjnej. 

Typowa  wielkość  zmiany  energii  rotacyjnej  cząs- 
teczki (energia  przejścia  rotacyjnego  — odstęp  ener- 
getyczny między  sąsiednimi  poziomami  rotacyjnymi 
cząsteczki)  jest  rzędu  10-2  -10-3  kJ/mol.  Typowe 
zmiany  energii  oscylacyjnej  są  rzędu  4-40  k J/mol. 

Natomiast  odstępy  energetyczne  pomiędzy  stanami 
elektronowymi  są  rzędu  400  kJ/mol. 

Widać  więc,  że  poszczególne  rodzaje  energii  skła-  poziomy 
dające  się  na  całkowitą  energię  cząsteczki  są  bardzo  energetyce- 
różne.  Gdybyśmy  chcieli  zobrazować  ten  wniosek  me  cząsteczki 
graficznie,  mogłoby  to  wyglądać  tak  jak  na  rys.  1 . 2-aioroowej 
Taki  schemat  poziomów  odpowiada  zasadniczo 
cząsteczce  dwuatomowej.  Dla  cząsteczek  wieloato- 
mowych  liczba  możliwych  oscylacji,  jakie  mogą  wy- 
konywać atomy  cząsteczki,  jest  tym  większa  im  więcej 
atomów  w cząsteczce  (nie  jest  to  zupełnie  ścisłe  i bę- 
dziemy o tym  jeszcze  dalej  mówili)  i nasz  rysunek 
musielibyśmy  uzupełnić  o wiele  innych  poziomów 
oscylacyjnych  (z  innym  odstępem  niż  ten  na  rysunku) 
i każdemu  z tych  poziomów  przyporządkować  od- 
powiednie poziomy  rotacyjne.  Nietrudno  sobie  wyo- 
brazić, że  im  większa  byłaby  cząsteczka,  tym  mniej 
czytelny  byłby  nasz  rysunek. 

Stany  energetyczne  cząsteczki  charakteryzują  pewne 

określone,  chociaż  czasami  (jak  np.  dla  stanów  2 

elektronowych)  bardzo  różne  wartości  energii.  Ale  i'  v 

to  stwierdzenie  nie  mówi  nam  wcale,  jakie  warunki 
muszą  być  spełnione,  ażeby  cząsteczka  przebywała  MU  ? j- 

w tym  czy  innym  stanie  energetycznym.  Czy  można 
w ogóle  przewidywać,  znając  energię  poszczególnych 
stanów,  jaka  część  cząsteczek  tworzących  układ  (np. 
gaz)  będzie  w określonych  warunkach  znajdowała  się 
w tym  czy  innym  stanie  energetycznym?  Otóż  takie 
przewidywania  są  w pewnych  warunkach  możliwe. 

Przypuśćmy,  że  mamy  pewien  zbiór  cząsteczek  w rów- 
nowadze termicznej  (tzn.,  że  temperatura  jest  jednako- 
wa w całym  układzie).  Intuicja  podpowie  nam  zapew- 
ne, że  na  to,  by  jakaś  cząsteczka  takiego  układu  mogła 
zmienić  swój  stan  energetyczny,  np.  przejść  ze  stanu 
o niższej  energii  do  stanu  o wyższej  energii,  musi 
istnieć  jakiś  czynnik  zewnętrzny,  który  dostarczy 

Rys.  1.  Schemat  poziomów  energetycznych  cząsteczki:  ZT0,  E' 
stany  elektronowe  — podstawowy  i wzbudzony,  r i v stany  oscy- 
lacyjne, } i y stany  rotacyjne  (dla  tych  ostatnich  skala  energii  na 
rysunku  została  zwiększona).  Na  rysunku  brak  jest  wyższych 
wzbudzonych  stanów  elektronowych 
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jej  energii  potrzebnej  do  takiego  przejścia.  Czyn- 
niki takie  mogą  być  różnej  natury  i o niektórych 
z nich  będziemy  jeszcze  dalej  mówili.  Na  razie  niech 
nasz  układ  będzie  odizolowany  od  wszelkich  zewnę- 
trznych czynników  doprowadzających  do  niego 
energię.  Czy  w takich  warunkach  cząsteczki  mogą 
czerpać  skądś  energię  potrzebną  do  przejścia  do  wyż- 
szego stanu  energetycznego?  Tak,  takim  źródłem 
energii  może  być  energia  ruchu  translacyjnego,  którą 
cząsteczki  mogą  wymieniać  między  sobą  wtedy,  gdy  się 
zderzają.  Średnia  energia  ruchów  translacyjnych  za- 
leży od  temperatury  układu  i jest  przez  ten  układ 
zachowana,  jeżeli  niemożliwa  jest  wymiana  energii 
z otoczeniem  układu.  Oznacza  to,  że  jeżeli  w jakimś 
zderzeniu  jedna  cząsteczka  uzyskuje  energię  i przecho- 
dzi do  wyższego  stanu  energetycznego,  to  druga  musi 
tę  energię  tracić,  a w następnym  zderzeniu  może  być 
odwrotnie.  W sumie  jednak  w układzie  takim  musi 
istnieć  równowaga  (dynamiczna),  tzn.  w każdym 
określonym  stanie  energetycznym  musi  znajdować 
rozkład  się  stale,  średnio  rzecz  biorąc,  tyle  samo  cząsteczek, 
obsadzeń  I trzeba  tylko  umieć  określić  — ile  cząsteczek  w jakim 
stanie?  Albo  inaczej,  jakie  jest  obsadzenie  (populacja) 
danego  stanu?  Ilościowej  odpowiedzi  na  to  pytanie 
dostarcza  wyrażenie  znane  pod  nazwą  rozkładu 
Boltzmanna : 

JUL  — c-(Ei-EQ)/kT 
"o 

Tutaj  m jest  liczbą  cząsteczek  w stanie  i o energii 
Ei,  albo  inaczej  obsadzeniem  /-tego  stanu,  — obsa- 
dzeniem najniższego  stanu  (stanu  o najniższej  możli- 
wej energii).  Sens  tego  wyrażenia  jest  prosty.  Im 
większa  jest  różnica  energii  Ei—EQy  tzn.  im  wyższy 
jest  dany  stan  energetyczny  i,  tym  mniej  cząsteczek 
może  w nim  w danej  temperaturze  przebywać,  tzn. 
tym  słabiej  jest  on  obsadzony.  Na  przykład  dla  stanów 
elektronowych,  dla  których  E(  — E0  jest  rzędu  102 
k J/mol  i więcej,  stosunek  m/n0  jest  w temperaturze 
pokojowej  rzędu  10‘10  i w praktyce  poza  stanem  pod- 
stawowym żadne  wyższe  stany  elektronowe  nie  są 
w'  takich  warunkach  w ogóle  obsadzone.  Natomiast 
wyższe  stany  oscylacyjne  i wyższe  stany  rotacyjne 
podstawowego  stanu  elektronowego  mogą  być  w tej 
temperaturze  w pewnym  stopniu  obsadzone,  szcze- 
gólnie te  ostatnie,  dla  których  różnica  energii  jest 
rzędu  zaledwie  10"2-10-3  kJ/moI.  Znajomość  obsa- 
dzenia poszczególnych  stanów  energetycznych  cząs- 
teczki jest  ważnym  elementem,  gdyż,  jak  przekonamy 
się  jeszcze  niejednokrotnie,  obsadzenie  stanów  decydu- 
je o rozkładzie  natężeń  w widmach  cząsteczek. 

Przejścia  do  wyższych  stanów  energetycznych  wy- 
magają doprowadzenia  do  cząsteczki  energii  z zew'- 
nątrz.  Taką  energię  niesie  ze  sobą  promieniowanie 
elektromagnetyczne.  Oddziaływanie  promieniowania 
elektromagnetycznego  z cząsteczką  może  zatem  zmie- 
nić energię  cząsteczki.  I to  właśnie,  jak  powiedzieliśmy 
na  samym  początku,  stanowi  fundament  spektrosko- 
pii. Zanim  jednak  przejdziemy  do  omawiania  tego 
oddziaływania  i obserwacji  jego  konsekwencji,  przy- 
pomnimy krótko  pewne  podstawowe  wiadomości 
dotyczące  promieniowania  elektromagnetycznego. 


Promieniowanie  elektromagnetyczne 

Zacznijmy  od  przypomnienia,  że  promieniowanie 
elektromagnetyczne  można  opisywać  dwojako : jako 
falę  i jako  strumień  fotonów.  Fala  elektromagnetycz- 
na  7- to  rozchodząca  się  w przestrzeni  i w czasie 
własności  spójna  zmiana  pola  elektrycznego  i magnetycznego, 
falowe  Fali  takiej,  jak  każdej  fali,  można  przyporządkować 
długość  X i częstość  v;  obie  te  wielkości  są  ze  sobą  zwią- 
zane zależnością: 

X — c/v , 

gdzie  c jest  prędkością  rozchodzenia  się  fali. 

Widmo  promieniowania  elektromagnetycznego, 
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tzn.  zakres  długości  fal  obejmujący  promieniowanie 
elektromagnetyczne  jest  olbrzymi.  Jednak  z punktu  wi- 
dzenia spektroskopii  molekularnej  zakres  ten  jest  sto- 
sunkowo wąski,  bo  obejmuje  fale  o długościach  od 
ok.  1 0“  ■ m do  ok.  10~3m.  W tym  obszarze  mieści  się 
tzw.  nadfiolet  i promieniowanie  widzialne  (światło) 
oraz  podczerwień  i daleka  podczerwień  (granicząca 
z mikrofalami).  Zamiast  długością  fali  można  się  po- 
sługiwać jej  odwrotnością  1 jX  = v,  nazywaną  liczbą 
falową;  jednostką  liczby  falowej  jest  cm-1. 


Obszar  widma 

Długość  fali  X 
nm 

Liczba  falowa  v 
cm~l 

Nadfiolet  (bliski) 

200-380 

50000-26300 

Widzialny 

380-780 

26300-12800 

Podczerwień 

780-3  -10* 

12800-333 

Podczerwień  (daleka) 

3 104-3  *30- 

333-33,3 

Inny  sposób  opisu  promieniowania  elektromagne-  fotony 
tycznego  polega  na  traktowaniu  go  jako  strumienia 
cząstek  — fotonów,  pozbawionych  wprawdzie  masy 
spoczynkowej,  ale  niosących  ze  sobą  ściśle  określoną 
energię, 

E = hi\ 

gdzie  v jest  wspomnianą  wyżej  częstością,  a h — stałą 
Plancka. 

Promieniowaniu  o danej  długości  fali  można  przy- 
porządkować ściśle  określoną  energię.  Energię  tę 
można  obliczyć  korzystając  z przytoczonych  do  tej 
pory  związków'  (np.  promieniowaniu  o długości  fali 
X = 400  nm,  odpowiada  energia  293,2  kJ/mol). 


Cząsteczka,  promieniowanie,  widma 

Kiedy  kwant  promieniowania  elektromagnetycz-  warunek 
nego  — foton,  pada  na  cząsteczkę,  może  być  przez  Bohra 
nią  pochłonięty.  Warunek,  który  muszą  spełniać 
cząsteczka  i foton  jest  prosty: 

AEnm  = En— Em  = h\\ 

tzn.  energia  jaką  niesie  ze  sobą  foton  musi  pasować 
do  różnicy  energii  AEnm  pomiędzy  stanami  energe- 
tycznymi m i n cząsteczki.  Warunek  ten  nosi  nazwę 
w-arunku  Bohra. 

Jeżeli  warunek  Bohra  jest  spełniony,  to  promie-  absorpcja 
niowanie  może  zostać  pochłonięte  — mamy  do  czynie-  i emisja 
nia  z procesem  absorpcji  promieniowania.  Cząsteczka 
przechodzi  wtedy  do  stanu  o wyższej  energii,  lub  jak 
mówimy  — zostaje  wzbudzona.  Możliwy  jest  rówmież 
proces  odwrotny.  Wzbudzona  cząsteczka  może  po- 
wrócić do  stanu  niższego,  a nadmiar  energii  zostaje 
wysłany  przez  nią  w postaci  kwantu  promieniowania, 
o częstości  (i  długości  fali)  określonej  warunkiem 
Bohra. Taki  proces  nazywa  się  emisją. 

Warunek  Bohra  określa,  jakie  promieniowanie 
(o  jakiej  energii,  długości  fali)  może  być  absorbowane 
lub  emitowane  przez  cząsteczkę,  nie  jest  to  jednak 
jedyny  warunek  określający  prawdopodobieństwo 
zachodzenia  aktów  absorpcji  i emisji.  Istnieją  jeszcze 
inne  warunki,  które  musi  spełniać  cząsteczka  i pro- 
mieniowanie i o nich  będziemy  dokładniej  mówili 
w następnych  rozdziałach. 

(Z  tego,  co  powiedziano  wyżej,  wynika,  że  jeżeli 
padające  na  cząsteczkę  promieniowanie  nie  spełnia 
warunku  Bohra,  to  nie  może  zostać  przez  nią  zaabsor- 
bowane. Nie  jest  to  zupełnie  prawdziwe,  gdyż  znane  są 
procesy,  w których  takie  promieniowanie  może  być 
absorbowane.  Należy  do  nich  dwu-  i wielofotomwa 
absorpcja  promieniowania;  ->  Optyka  nieliniowa). 

Jeżeli  na  układ  cząsteczek  pada  promieniowanie 
o różnych  długościach  fal,  to  może  się  zdarzyć,  że 
dla  niektórych  z tych  długości  będzie  spełniony  wa- 
runek Bohra  (i  inne  dodatkowe  warunki).  Promie- 
niowanie o takich  długościach  fali  będzie  przez 
cząsteczki  układu  absorbowane,  przy  czym  z reguły 
absorpcja  ma  różne  natężenie  dla  promieniowania 


widmo  o różnych  długościach  fali  (np.  dlatego,  że  obsadzenie 
absorpcyjne  różnych  stanów  jest  różne).  Jeżeli  potrafimy  prześle- 
dzić i zarejestrować  zmiany  natężenia  absorpcji 
w funkcji  długości  fali  absorbowanego  promieniowa- 
nia, to  uzyskany  przez  nas  w ten  sposób  obraz  jest  tzw. 
widmem  absorpcyjnym  badanych  cząsteczek.  Podob- 
nie, jeżeli  padające  promieniowanie  wzbudza  cząstecz- 
ki i wzbudza  je  do  różnych  stanów,  to  cząsteczki  po- 
zbywając się  ‘energii  wzbudzenia  mogą  ją  emitować 
w postaci  promieniowania,  przy  czym  natężenie  tej 
widmo  emisji  może  być  dla  różnych  długości  fal  różne  (o  tym, 
emisyjne  co  decyduje  o natężeniu  emitowanego  promienio- 
wania, będziemy  jeszcze  szczegółowo  mówili).  Jeżeli 
teraz  potrafimy  zmierzyć  natężenie  emitowanego 
promieniowania  w funkcji  długości  fali,  to  otrzymamy 
widmo  emisyjne. 

Widma  mogą  być  obserwowane  dlatego,  że  energia 
promieniowania  jest  pochłaniana  (bądź  wysyłana) 
przez  cząsteczkę.  Absorpcja  promieniowania  wywołu- 
je przejścia  pomiędzy  odpowiednimi  stanami  cząstecz- 
ki. Jeżeli  z absorpcją  taką  wiążą  się  przejścia  po- 
między różnymi  stanami  rotacyjnymi  cząsteczki,  to 
odpowiednie  widmo  absorpcyjne  nazywa  się  widmem 
rotacyjnym.  Jeżeli  są  to  przejścia  pomiędzy  stanami 
oscylacyjnymi,  to  odpowiednie  widmo  nosi  nazwę  wid- 
ma oscylacyjnego.  I wreszcie  w wypadku  przejść  po- 
między stanami  elektronowymi  — obserwujemy  wid- 
mo elektronowe. 

Warunek  Bohra  łączy  ze  sobą  energię  promienio- 
wania i energię  stanów  cząsteczki,  a ściślej  różnicę 
energii  pomiędzy  różnymi  stanami  — zwaną  często 
energią  przejścia.  Wiemy  już,  jakiego  rzędu  są  różnice 
energii  dla  różnych  rodzajów  stanów  energetycznych 
cząsteczki,  a więc  jakiego  rzędu  jest  odpowiednia 
energia  przejść,  a tym  samym,  jaka  musi  być  energia 
promieniowania,  żeby  mogło  ono  spowodować  przej- 
ścia pomiędzy  odpowiednimi  stanami  (znaleźć  ją  mo- 
żemy korzystając  z danych  przytoczonej  poprzednio 
tabeli  i pamiętając,  że  E = hv  = hej  A).  Jeżeli  porów- 
namy energię  przejść  z energią  promieniowania  elek- 
tromagnetycznego, to  stwierdzimy,  że:  widma  rota- 
cyjne leżą  w dalekiej  podczerwieni,  widma  oscyla- 
cyjne — w obszarze  podczerwieni,  a widma  elektro- 
nowe — w obszarze  widzialnym  i nadfiolecie, 
prawo  Jak  w praktyce  przebiega  określanie  natężenia 
Beera  absorpcji,  a więc  i badanie  widma  absorpcyjnego? 
Pochłanianie  promieniowania  przez  układ  cząsteczek 
(nazywa  się  taki  układ  po  prostu  próbką  badaną) 
opisuje  prawo  Beera.  Z prawa  tego  wynika,  że  pa- 
dające na  próbkę  promieniowanie,  określonej  długo- 
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Rys.  2.  Osłabienie  wiązki  światła  przechodzącej  przez  ośrodek 
pochłaniający  światło 

ści  fali  A,  ulega  w miarę  wnikania  w głąb  próbki  (np. 
na  odległość  d)  stopniowemu  osłabieniu  (rys.  2), 
zgodnie  z równaniem 

/ = I0c~ikxCdt 

gdzie  I jest  natężeniem  promieniowania  po  przejściu 
przez  próbkę  o grubości  d , J0  — natężeniem  promie- 
niowania padającego  na  próbkę,  c — stężeniem  czą- 
steczek pochłaniających  promieniowanie  w próbce, 
ah  — tzw.  współczynnikiem  absorpcji,  charaktery- 
stycznym dla  badanych  cząsteczek.  Logarytmując 
obie  strony  tego  równania  można  je  przedstawić  w do- 
godniejszej postaci: 

D = log  A = k\cd,  k[  = 0,4343  kx; 

D nosi  nazwę  gęstości  optycznej.  Jak  widać,  jest  to 


wielkość  proporcjonalna  do  stężenia  cząsteczek 
i grubości  próbki.  Jeżeli  stężenie  próbki  podawane 
jest  w molach  na  litr,  a grubość  w centymetrach,  to 
wówczas  prawo  Beera  można  zapisać  następująco: 

D = ex-cd. 

Nowy  współczynnik  absorpcji  ex  nazywa  się  teraz 
molowym  współczynnikiem  absorpcji,  albo  współ- 
czynnikiem ekstynkcji  (lub  po  prostu  ekstynkcją). 

W praktyce  więc  badanie  widma  absorpcyjnego  po- 
lega na  wyznaczaniu  gęstości  optycznej  lub  vvspół- 
czynnika  ekstynkcji  s w funkcji  długości  fali  (lub 
liczby  falowej  v = 1/A). 

Sama  idea  takiego  pomiaru  jest  prosta  — ilustruje  metody 
ją  rys.  3.  Podstawowe  elementy  układu  pomiarowego  pomiaru 
to  źródło  promieniowania,  układ  dyspersyjny  (mo-  widm 
nochromator)  i detektor  promieniowania.  Źródło  pro- 
mieniowania wytwarza  promieniowanie  o różnych 


rejestrujących 
i pomiarowych 

Rys.  3.  Schemat  układu  do  badania  widm  absorpcyjnych:  Z 
źródło  promieniowania,  M element  dyspersyjny  (pryzmat,  siat- 
ka), P — badana  próbka  D detektor  (fotopowielacz,  fotoopór, 
klisza  fotograficzna,  itp.),  S pomocnicze  elementy  optyczne  (so- 
czewki, lustra  itp.).  Promieniowanie  przetworzone  na  sygnał  (np. 
elektryczny,  zaczernienie  kliszy  fotograficznej  itp.)  przekazywany 
jest  z detektora  do  dalszej  obróbki,  której  celem  jest  jego  pomiar 
i ewentualnie  rejestracja 

długościach  fal  (na  ogół  tylko  z pewnego  obszaru  wid- 
ma). Z promieniowania  tego  układ  dyspersyjny  wy- 
dziela promieniowanie  o odpowiedniej  długości  fali. 

Promieniowanie  to  przechodzi  przez  badaną  próbkę 
i jest  w niej  pochłaniane,  w mniejszym  lub  większym 
stopniu,  bądź  też  przechodzi  przez  nią  bez  pochła- 
niania. Trafia  ono  następnie  do  detektora  promienio- 
wania, którego  zadaniem  jest  wykryć  je  i przetworzyć 
w taki  sposób,  żeby  można  było  określić  jego  natęże- 
nie, a tym  samym  wyznaczyć,  jaka  ilość  promienio- 
wania została  w próbce  zaabsorbowana. 

Idea  układu  pomiarowego  jest  prosta,  ale  przy  jego 
praktycznej  realizacji  występują  pewne  komplikacje. 

Wiążą  się  one  z tym,  że  różnym  rodzajom  widm  (rota- 
cyjnym, oscylacyjnym  i elektronowym)  odpowiada 
inny  obszar  widma  (daleka  podczerwień,  podczer- 
wień, obszar  widzialny  i nadfiolet).  A każdy  z tych 
obszarów  wymaga  stosowania  innych  źródeł,  elemen- 
tów dyspersyjnych  i detektorów.  Nie  ma  np.  takich 
źródeł,  które  dawałyby  promieniowanie  o dostatecz- 
nie dużym  natężeniu  dla  celów  praktycznych  w całym 
zakresie  widma.  Trzeba  wobec  tego  stosować  różne  ^ 
źródła  przy  badaniu  różnych  obszarów  widmowych,  i de- 

Do  badań  w nadfiolecie  używa  się  np.  lamp  wodoro-  tektory  pro.“ 
wych,  w obszarze  widzialnym  — lamp  żarowych,  miemowanna 
a w podczerwieni  — źródeł  cieplnych  (globarów). 

Podobnie  elementy  dyspersyjne  — przede  wszystkim 
pryzmaty,  właściwe  dla  różnych  obszarów  widma, 
muszą  być  wykonywane  z różnych  materiałów,  np.  z 
kwarcu  do  badań  w nadfiolecie,  z soli  kamiennej  do 
badań  w podczerwieni.  Wreszcie  detektory  promienio- 
wania, dobre  do  odbioru  promieniowania  z jednego 
obszaru  widma,  mają  z reguły  zbyt  małą  czułość  do 
odbioru  promieniowania  z innego  obszaru,  np.  dla 
nadfioletu  i obszaru  widzialnego  stosuje  się  jako  dete- 
ktory fotopowielacze,  a do  badań  w podczerwieni 
— termoelementy. 
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Różnice  w stosowanych  materiałach  optycznych 
i metodach  wytwarzania  i detekcji  promieniowania 
sprawiają,  że  układy  pomiarowe  do  badania  widm 
absorpcyjnych  (tzw.  spektrometry  i spektrofotome- 
try) są  w zasadzie  budowane  z przeznaczeniem  do 
pracy  w określonym  obszarze  widma,  np.  w podczer- 
wieni. Tym  samym  nadają  się  one  przede  wszystkim 
do  badania  jednego,  określonego  typu  widm,  np. 
widm  oscylacyjnych.  Nie  będziemy  głębiej  wnikali 
w różnego  rodzaju  rozwiązania  konstrukcyjne,  wła- 
ściwe dla  spektrofotometrów  przeznaczonych  do  pra- 
cy w określonych  obszarach  widmowych.  Czytelnika 
zainteresowanego  problemami  aparaturowymi  od- 
syłamy do  podręczników  spektroskopii  i monografii. 


Widma  oscylacyjne  i rotacyjne 
cząsteczek 

Krystyna  Szczepaniak 

Oscylacje  atomów  wchodzących  w skład  cząsteczek 
oraz  rotacja  całej  cząsteczki  powodują  absorpcję, 
emisję  i rozproszenie  promieniowania  elektromagne- 
tycznego, a więc  pojawienie  się  widm  absorpcji, 
emisji  i rozproszenia.  W praktyce  spektroskopowej 
badane  są  zwykle  oscylacyjne  i rotacyjne  widma  ab- 
sorpcji i widma  rozproszenia  ramanowskiego. 


Widma  rotacyjne 


Badania  widm  rotacyjnych  przyczyniają  się  skutecznie 
do  wyznaczania  rozmiarów  i kształtu  cząsteczek 
w fazie  gazowej.  Podstawowym  warunkiem  powstania 
widma  rotacyjnego  absorpcyjnego  (inaczej  mówiąc 
warunek  główną  regułą  wyboru)  jest  posiadanie  przez  cząstecz- 
trwałego  kę  trwałego  dipolowego  momentu  elektrycznego,  tj. 
momentu  takiego  rozkładu  ładunków,  przy  którym  środki  cięż- 
di potowego  kości  ładunków  dodatnich  i ujemnych  nie  pokrywają 
się.  Miarą  momentu  dipolowego  / 1 jest  iloczyn  ładun- 
ku q i odległości  r między  środkami  ciężkości  ładun- 
ków dodatnich  i ujemnych:  p — qr.  Trwały  moment 
dipolowy  mają  dwuatomowe  cząsteczki  złożone  z róż- 
nych atomów,  np.  HC1,  CO,  NO,  oraz  wiele  cząste- 
czek wieloatomowych,  jak  np.  HCN,  H20,  HCC13. 
Cząsteczki  nie  mające  trwałego  momentu  dipolowego, 
takie  jak  np.  H2,  N2,  Cl2,  C02,  CH4,  rotując  nie  po- 
chłaniają promieniowania  elektromagnetycznego, 
a więc  nie  dają  one  absorpcyjnego  widma  rotacyjnego. 
Cząsteczki  takie  mogą  natomiast  rozpraszać  promie- 
niowanie elektromagnetyczne  dając  rotacyjne  widmo 
rozpraszania  ramanowskiego.  Powstawanie  tego  wid- 
ma związane  jest  z nietrwałym  momentem  dipolo- 
wym indukowanym  w cząsteczce  przez  fale  elektroma- 
gnetyczne. 

cząsteczka  Omawianie  ruchów  rotacyjnych  cząsteczek  roz- 
dwuat omowa  poczniemy  od  najprostszych  cząsteczek  — cząsteczek 
dwuatomowych.  Pozwoli  nam  to  zrozumieć  podsta- 
wowe cechy  widma  rotacyjnego  bez  wprowadzania 
dodatkowych  komplikujących  elementów,  które  po- 
jawiają się  przy  omawianiu  bardziej  złożonych  czą- 
steczek. Początkowo  zajmiemy  się  rotacją,  nie  uwzglę- 
dniając faktu,  że  atomy  w cząsteczce  jednocześnie 


Rys.  4.  Model  cząste- 
czki dwuatomowej  AB 
obracającej  się  wokół 
osi  prostopadłej  do 
wiązania 


Najprostszym  modelem,  który  pomaga  w zrozumie- 
niu i wyjaśnieniu  podstawowych  cech  widma  rotacyj- 
nego, jest  cząsteczka  złożona  z dwóch  atomów  A 
i B o masach  triA  i ms  znajdujących  się  w stałej  odle- 
głości r0  od  siebie  (rys.  4).  Model  taki  nosi  nazwę 
sztywnego  rotatora.  Gdy  cząsteczka  obraca  się  wokół 
osi  prostopadłej  do  linii  łączącej  oba  atomy  i prze- 
chodzącej przez  środek  ciężkości  O,  jej  energia  kine- 
tyczna określona  jest  przez  moment  bezwładności  / 
i prędkość  kątową  co  : 

Ekin  = 

Moment  bezwładności 

/ = mA(rQ—x)2+mBXiy 


gdzie  x jest  odległością  atomu  B od  środka  ciężkości. 
Położenie  środka  ciężkości  można  wyznaczyć  z rów- 
nania rriA(r0—x)  = msxt  skąd  * = mAr0!(mA-trnB). 
Podstawiając  wartość  x do  wyrażenia  określającego 
moment  bezwładności  I otrzymuje  się,  po  prostych 
przekształceniach. 


/ = 


mAmB 

rriA+triB 


ri  = Mrl 


Wyrażenie  M = mAmsKrnA+niB)  nazywamy  masą 
zredukowaną.  Omawiany  ruch  rotacyjny  jest  zagad- 
nieniem dobrze  znanym  w mechanice.  Potrafimy  rów- 
nież rozwiązać  równanie  falowe  Schródingera  dla  ta- 
kiego ruchu  (-►  Chemia  kwantowa).  Otrzymane  w ten 
sposób  wartości  energii  układu  wyraża  się  wzorem 

gdzie  J jest  kwantową  liczbą  rotacyjną,  która  może 
przyjmować  tylko  całkowite  wartości  lub  0 (/  = 0, 
1,  2,  3, ...). 

Wyrażenie  h2l$n2Mr£  zwane  jest  stałą  rotacyjną 
i oznaczone  literą  B.  Przejściami  między  poziomami 
rotacyjnymi  rządzi  reguła  wyboru,  która  mówi,  że 
przy  absorpcji  dozwolone  są  tylko  te  przejścia,  w wy- 
niku których  kwantowa  liczba  rotacyjna  zmienia  się 
o ± 1 (AJ  = ± 1).  Zgodnie  z tą  regułą  zmiana  energii 
cząsteczki  przy  absorpcji  wynosi 

AErot  = Ej+x—Ej  = 2B(JĄ-\). 

Jak  wynika  z tego  wzoru  w miarę  wzrostu  J odle- 
głości między  poziomami  są  coraz  większe.  Schemat 
poziomów  energii  rotacyjnej  cząsteczki  dwuatomowej 


5 

r1 

AE=  105 

a 

AE  = 85 

AE=6B 

i , 

0 

AE=2B 


Rys.  5.  Schemat  poziomów  energetycznych  i widmo  rotacyjne 
cząsteczki  dwuatomowej  (rotatora  sztywnego) 


wykonują  ruch  oscylacyjny.  Jak  się  okaże,  pominięcie  przedstawia  rys.  5.  W dolnej  części  rysunku  pokazane 
oscylacji  nie  wpływa  istotnie  na  większość  cech  wid-  są  linie  rotacyjne  odpowiadające  przejściom  między 
ma  rotacyjnego.  kolejnymi  poziomami  rotacyjnymi.  Liczby  falowe  ko- 


cząsteczka 
jako  sztywny 
rotator 


kwantowa 

liczba 

rotacyjna 
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lejnych  linii  są  v0i  — 25,  v*2  = 45,  v2 z — 6£itd.,  a od- 
ległość między  liniami  Av  jes  stała  i równa  2 B. 
Mierząc  tę  odległość  możemy  wyznaczyć  stałą  B , 
a następnie  moment  bezwładności  i odległość  r0. 

Z tak  prostym  sposobem  ustalania  rozmiarów  czą- 
steczek na  podstawie  pomiarów  spektroskopowych 
mamy  do  czynienia  tylko  w przypadku  cząsteczek 
cząstka  jako  dwuatomowych.  I dla  nich  zresztą  przyjęliśmy  niezu- 
rotatcr  pełnie  prawidłowy  model  sztywnego  rotatcra. 
meszty wny  Dokładne  badania  linii  widma  rotacyjnego  wyka- 

zują, że  odległości  między  liniami  maleją  dla  więk- 
szych wartości  /.  Przyczyną  tego  jest  fakt,  że  czą- 
steczka pobudzona  do  wyższych  stanów  rotacyjnych 
obraca  się  prędzej  i wiązanie  nieco  się  rozciąga  pod 
wpływem  siły  odśrodkowej.  Wskutek  tego  moment 
bezwładności  wzrasta,  a odległości  między  limami  ma- 
leją. Konieczne  jest  zatem  wprowadzenie  pewnej  po- 
prawki do  wyrażenia  na  energię: 

£rot  = BJ(J+1)  — DJ(J+1). 

Stałą  D — 4B3/cd2  nazywa  się  stałą  odkształcenia  od- 
środkowego. Jest  ona  około  dziesięciu  tysięcy  razy 
mniejsza  niż  B;  dla  małych  wartości  / możemy  więc 
pominąć  drugi  składnik  wyrażenia, 
cząsteczki  Podane  wyżej  wzory  określające  stany  energii  ro- 
wieloatomo-  tacyjnej  cząsteczek  dwuatomowych  stosują  się  rów- 
we  liniowe  nież  do  liniowych  cząsteczek  wieloatomowych.  Od 
razu  jednak  napotykamy  pewne  trudności,  które  ilu- 
struje przykład  cząsteczki  trójatomowej  0=C=S. 
Cząsteczka  ta  ma  dwa  wiązania,  lecz  tylko  jeden  mo- 
ment bezwładności.  Problem  możemy  rozwiązać  ba- 
dając dwie  cząsteczki,  w skład  których  wchodzą  różne 
izotopy  siarki:  oraz  160laC34S.  Zakłada 

się,  że  dla  obu  odmian  cząsteczki  długości  wiązań  są 
takie  same.  Każdej  z odmian  cząsteczki  odpowiada 
nieco  inne  widmo  rotacyjne,  możemy  więc  wyznaczyć 
dwa  momenty  bezwładności  i znaleźć  długości  obu 
wiązań  cząsteczki. 

cząsteczki  Sytuacja  jest  bardziej  złożona,  gdy  mamy  do  czy- 
wieloato-  nienia  z cząsteczkami  wieloatomowymi  nieliniowymi. 

mowę  Rozróżniamy  wówczas  trzy  typy  ruchu  rotacyjnego 
nieliniowe  w zależności  od  stosunków  trzech  głównych  momen- 
tów bezwładności  Ia,  Ib,  Ic  względem  trzech  wzajem- 
nie prostopadłych  osi  związanych  z cząsteczką: 
a)  Do  pierwszego  typu  należą  cząsteczki  o nejwyż- 
szej  symetrii,  np.  cząsteczki  o tetraedrycznym  lub 
oktaedrycznym  rozkładzie  atomów,  takie  jak  np.: 


bąk  sferyczny  W cząsteczkach  takich  wszystkie  trzy  momenty  bez- 
władności są  sobie  równe  Ia  — Ib  = Ic-  Ten  typ 
cząsteczki  nazywa  się  bąkiem  sferycznym.  Cząsteczki 
tego  typu  nie  mają  trwałego  momentu  dipolowego, 
fi  = 0,  zatem  model  ten  jest  nieinteresujący  dla  ab- 
sorpcyjnej spektroskopii  rotacyjnej. 

b)  Do  drugiej  grupy  należą  cząsteczki,  dla  których 
dwa  spośród  trzech  momentów  bezwładności  są  sobie 
równe  Ia  = Ic  ^ Ib.  Przykładem  takich  cząsteczek 
mogą  być  NHS  i CHC13: 


N 

H 


Rozwiązując  równanie  falowe  dla  sztywnego  bąka 
symetrycznego  otrzymuje  się 


gdzie: 


£rot  = AJ{J+\)-(A-B)K\ 
h1  _ hz 


8 nzIA  9 


B = 


8 k2Ib  ' 


Trzeba  było  wprowadzić  dwie  liczby  kwantowe  J i K, 
ponieważ  dla  symetrycznego  bąka  występują  dwa  ro- 
dzaje obrotów.  Liczba  kwantowa  J opisuje  obrót 
wokół  osi  prostopadłej  do  jedynej  osi  symetrii,  a licz- 
ba kwantowa  K — obrót  cząsteczki  wokół  osi  symetrii. 
Obrót  cząsteczki  typu  bąka  symetrycznego  wokół  osi 
symetrii  nie  powoduje  zmiany  momentu  dipolowego, 
a tym  samym  pojawienia  się  widma  absorpcyjnego. 
Nic  więc  dziwnego,  że  reguła  wyboru  dla  liczby  kwan- 
towej K brzmi  AK  = 0.  Reguła  wyboru  dla  liczby 
kwantowej  / jest  taka  sama,  jak  dla  cząsteczek  dwu- 
atomowych i liniowych  AJ  — ± 1 . Ze  względu  na  te 
reguły  wyboru  różnica  energii  między  dwoma  kolej- 
nymi poziomami  rotacyjnymi  cząsteczki  tego  typu 
wyrażona  jest  wzorem: 

AEr*t  = 2£(/+l). 


Wyrażenie  to  jest  identyczne  z wyrażeniem  dla  czą- 
steczek liniowych.  Podobnie  jak  w wypadku  cząste- 
czek liniowych,  stosując  podstawienie  izotopowe  wy- 
znacza się  na  podstawie  widma  momenty  bezwładno- 
ści, a następnie  parametry  określające  strukturę  czą- 
steczki. W tabeli  na  następnej  stronie  podane  są  dłu- 
gości wiązań  i kąty  między  wiązaniami  dla  kilku  czą- 
steczek typu  bąka  symetrycznego  wyznaczone  za  po- 
mocą widm  rotacyjnych. 

c)  Cząsteczki,  które  mają  trzy  różne  momenty  bez- 
władności IA  * IB  * Ic,  należą  do  trzeciej  grupy, 
zwanej  bąkiem  niesymetrycznym.  Do  grupy  tej  należą 
cząsteczki  o najniższej  symetrii  lub  całkowicie  niesy- 
metryczne np.  H20,  CH3OH,  CH2BrCl: 


Poziomy  energii  rotacji  takich  cząsteczek  nie  mogą 
być  wyrażone  za  pomocą  jednego  ogólnego  równania, 
tak  jak  poziomy  energii  cząsteczek  opisanych  wyżej. 
Każdą  cząsteczkę  należy  traktować  oddzielnie.  Utrud- 
nia to  bardzo  obliczenia,  mimó  tego  zrobiono  duże 
postępy  w interpretacji  wielu  złożonych  widm  rota- 
cyjnych. niektórych  prostych  cząsteczek  typu  bąka 
niesymetrycznego,  szczególnie  tych,  dla  których  dwa 
momenty  bezwładności  mają  zbliżone  wartości.  Dla 
niektórych  płaskich  cząsteczek,  jak  np.  H20,  wyzna- 
czono z widm  trzy  momenty  bezwładności.  Tabela 
przedstawia  wyniki  analizy  widma  rotacyjnego  kilku 
małych  cząsteczek  typu  bąka  niesymetrycznego. 

Wszystko  co  dotychczas  powiedzieliśmy  o rotacji, 
dotyczyło  cząsteczek  swobodnych,  z jakimi  mamy  do 
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bąk 

symetryczny 


bąk  nie- 
symetryczny 


20  - Encyklopedia  fizyki  współczesnej 


Struktura  cząsteczek  typu  bąka  symetrycznego  wyznaczona  metodami  spektroskopii  rotacyjnej 


czynienia  w gazie  przy  niezbyt  wysokich  ciśnieniach. 

Przy  wysokich  ciśnieniach  w gazach,  a zwłaszcza 
relacja  w fazach  skondensowanych  (cieczach  i ciałach  sta- 
w fazach  łych),  rotacja  cząsteczek  jest  prawie  zawsze  mniej  lub 
skoftdcci'  bardziej  hamowana  w wyniku  oddziaływań  między- 
sowarsych  cząsteczkowych.  Energia  większości  oddziaływań  mię- 

306 


dzycząsteczkowych  jest  bowiem  tego  rzędu  wielkości 
(4-40  kJ/mol)  co  energia  rotacji.  Z tego  powodu 
ciecze  i ciała  stałe  nie  mają  widma  rotacyjnego.  Wy- 
jątek stanowią  cząsteczki  zamrożone  lub  rozpuszczo- 
ne w gazach  szlachetnych,  takich  jak  argon,  krypton 
czy  ksenon.  W gazach  szlachetnych  bowiem  oddzia- 


ły  wania  między  cząsteczkowe  są  tak  słabe,  że  cząstecz- 
ki znajdujące  się  w stałym  i ciekłym  roztworze  gazu 
szlachetnego  w temperaturze  4 K i 20  K mogą  wyko- 
nywać prawie  swobodną  rotację.  Badaniami  tego  typu 
zamrożonych  roztworów  zajmuje  się  na  świecie  wiele 
laboratoriów  naukowych. 


Widma  oscylacyjne 


wiązując  równania  ruchu  takiego  układu  w przybli- 
żeniu klasycznym: 

dt  dq  ' dq 

gdzie  T jest  energią  kinetyczną  1l2Mq2,  q = dq/dt, 
U — energią  potencjalną  {U  = kq2)f  otrzymuje  się 
częstość  drgań  oscylatora  harmonicznego 


warunek 
zmiany  mo- 
mentu dipo- 
lowego 


cząsteczka 

dwuatomowa 


Zajmiemy  się  teraz  oddziaływaniem  cząsteczek  z pro- 
mieniowaniem elektromagnetycznym  o większej  ener- 
gii, a mianowicie  promieniowaniem  podczerwonym, 
wzbudzającym  oscylacje  atomów  w cząsteczce.  Aby 
cząsteczka  mogła  mieć  absorpcyjne  widmo  oscylacyj- 
ne, konieczne  jest  by  drganie  wywoływało  zmianę  jej 
momentu  dipolowego.  W przypadku  dwuatomowych 
cząsteczek,  od  których  zaczniemy  nasze  rozważania, 
wymaganie  to  sprowadza  się  do  tego,  by  cząsteczka 
składała  się  z dwu  różnych  atomów.  Gdybyśmy  chcieli 
się  zająć,  tak  jak  w przypadku  rotacji,  cząsteczkami 
w fazie  gazowej,  to  napotykalibyśmy  dodatkowe 
trudności.  Otóż  wzbudzając  oscylacje  promieniowa- 
niem podczerwonym  powoduje  się  zmiany  nie  tylko 
energii  oscylacyjnej,  ale  również  mniejszej  od  niej 
energii  rotacyjnej  cząsteczki.  Tej  kombinacji  równo- 
czesnego wzbudzenia  oscylacji  i rotacji  można  unik- 
nąć badając  cząsteczki  w cieczach  lub  roztworach, 
w których  jak  już  mówiliśmy,  oddziaływania  między- 
cząsteczkowe  hamują  rotację.  Oczywiście  oddziały- 
wania te  zmieniają  również  oscylacje,  ale  zmiany  te 
nie  są  duże,  gdyż  energia  większości  oddziaływań 
międzycząsteczkowych  jest  znacznie  mniejsza  od  ener- 
gii oscylacji. 

Omawianie  ruchu  oscylacyjnego  zaczniemy  od  naj- 
prostszej cząsteczki  dwuatomowej,  którą  można  trak- 
tować, jak  dwie  masy  połączone  sprężyną  (rys.  6). 
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F F Rys.  6.  Model  cząsteczki  dwu- 

c'  atomowej 


gdzie  M jest  znaną  nam  już  masą  zredukowaną  oscy- 
latora, zaś  k — stałą  siłową. 

Harmoniczny  charakter  ruchu  atomów  w cząstecz- 
ce wynika  również  z dokładniejszych  rozważań  kwan- 
towomechanicznych  (->  Chemia  kwantowa).  Energia  energia  po- 
potencjalna  cząsteczki,  w najprostszym  przypadku  tencjalna 
cząsteczki  dwuatomowej,  zależy  od  sił  przyciągania 


Rys.  7.  Krzywa  energii  potencjalnej  cząsteczki  dwuatomowej. 
Grubą  linią  niebieską  oznaczono  przybliżenie  paraboliczne  w po- 
bliżu minimum.  De  energia  dysocjacji  względem  minimum  krzy- 
wej energii  potencjalnej;  r«  odległość  w stanie  równowagi 


ładunków  o różnych  znakach  i od  sił  odpychania 
ładunków  o jednakowych  znakach.  Przyjmuje  ona 
postać  taką,  jak  na  rys.  7.  Krzywą  taką  można  naj- 
ogólniej opisać  za  pomocą  szeregu  potęgowego 


U=  U9+Uiq+U*?+  ...  + Unqn, 


Gdy  sprężyna  nie  jest  rozciągnięta  ani  ściśnięta,  jej 
długość  wynosi  re  (rys.  6a).  Przy  tej  odległości  układ 
jest  w równowadze.  Podczas  rozciągania  sprężyny 
pojawia  się  siła  sprężysta  F działająca  w kierunku 
przeciwnym  do  rozciągania  (rys.  6b),  która  kieruje 
masy  rriA  i ms  z powrotem  do  stanu  równowagi. 
Atomy  mijają  jednak  stan  równowagi  i przekraczają 
odległość  re,  powodując  ściśnięcie  sprężyny  i pojawie- 
nie się  siły  F skierowanej  przeciwnie  do  kierunku 
ruchu  (rys.  6c).  Pod  wpływem  tej  siły  następuje  po- 
nownie powrót  do  stanu  równowagi.  Ruch  taki  po- 
wtarza się  tak  długo,  aż  energia  włożona  w pierwsze 
rozciągnięcie  sprężyny  zamieni  się  na  skutek  tarcia 
w energię  cieplną.  Zgodnie  z prawem  Hooke’a  siła  F 
jest  proporcjonalna  do  wychylenia  mas  z położenia 
równowagi : 

F = —k(r—re); 

r jest  odległością  drgających  mas  w danej  chwili,  a re 
ich  odległością  w stanie  równowagi.  Współczynnik' 
proporcjonalności  k nazywa  się  stałą  siłową  oscyla- 
tora. Znak  minus  pochodzi  stąd,  że  siła  Fjest  skiero- 
wana przeciwnie  do  wychylenia  r — re.  Ruch  pod 
cząsteczka  wpływem  siły  proporcjonalnej  do  wychylenia  jest 
jako  ruchem  harmonicznym,  a potencjał  dla  takiego  ruchu 
oscylator  ma  kształt  paraboliczny:  U — kqz,  gdzie  q jest  wy- 
harmoniczny  chyleniem  z położenia  równowagi  {q  = /*—/>).  Roz- 


gdzie  Ui  = (1  /«!)  (« dnUjdqn)q =0  są  zależne  od  kolejnych 
pochodnych  funkcji  energii  potencjalnej  w punkcie 
q — 0.  Gdy  wychylenia  atomów  z ich  położeń  rów- 
nowagi są  małe,  tzn.  gdy  znajdujemy  się  w pobliżu 
minimum  krzywej  energii  potencjalnej,  możemy 
w przybliżeniu  przyjąć,  że  krzywa  potencjalna  ma  po- 
stać U = Uo+U1q+U2q2.  Przyjmując  t/cza  zero  ukła- 
du oraz  biorąc  pod  uwagę  fakt,  że  (dU/dq)q„0  = 0 
w punkcie  odpowiadającym  minimum,  otrzymamy  na 
energię  potencjalną  wyrażenie  U = ^(d2Ujdq%r0q2. 

W tym  przybliżeniu  krzywa  energii  potencjalnej  jest 
więc  parabolą. 

Rozwiązanie  równania  falowego  Schródingera  dla 
oscylatora  harmonicznego  daje  energię  skwantowa- 
nych  poziomów 

E = hvQ(v- 1-£), 

gdzie  v0  jest  tą  samą  częstością,  jaką  otrzymuje  się  oscylacyjna 
z -rozwiązań  klasycznych,  v0  = (1/2ti)  \fkjM,  v jest  liczba 
oscylacyjną  liczbą  kwantową,  która  może  przybierać  kwantowa 
wartości  0, 1,  2, ...  Jak  wynika  ze  wzoru,  energia  oscy- 
lacji na  poziomie  v = 0 jest  różna  od  zera  i wynosi 
lhv0.  Oznacza  to,  że  w żadnych  warunkach,  nawet 
w temperaturze  zera  bezwzględnego,  oscylacje  ato- 
mów nie  ustają.  Ten  zasób  energii  oscylacyjnej,  której 
cząsteczka  nie  może  się  pozbyć,  nazywamy  zerowa 
energią  oscylacji. 
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Porównując  wyniki  przeprowadzonych  poprzednio 
rozważań  klasycznych  dotyczących  sił  działających 
na  atomy  w cząsteczce  z wynikami  rozważań  kwant  o- 
womechanicznych  widzimy,  że  wprowadzona  po- 
przednio stała  siłowa  k wiąże  się  z drugą  pochodną 
przybliżonej  funkcji  opisującej  energię  potencjalną, 


Jak  wiadomo,  energia  ruchu  elektronów  i jąder 
w cząsteczce  jest  skwantowana.  Przejściami  między 
różnymi  stanami  energii  oscylacyjnej  rządzi  reguła 
wyboru  Av  = ±1.  Odległość  między  sąsiednimi  po- 
ziomami, określająca  częstość  linii  w widmie  oscyla- 
cyjnym, wyraża  się  wzorem 

AE  — Ev+i—Ev  — hv0. 

Rys.  8 przedstawia  schemat  poziomów  oscylacyjnych 
cząsteczki  HC1  w przybliżeniu  harmonicznym.  Wy- 
znaczając częstość  oscylacji,  możemy  więc  wyznaczyć 
stałą  siłową.  W tabeli  zestawiono  dane  charakteryzu- 
jące niektóre  cząsteczki  dwuatomowe. 


Rys.  8.  Krzywa  energii  potencjalnej  i schemat  poziomów  ener- 
getycznych cząsteczki  dwuatomowej  w przybliżeniu-  oscylatora 
harmonicznego  (linia  niebieska).  Linią  czarną  zaznaczono  krzywą 
energii  bez  uwzględnienia  przybliżenia  oscylatora  harmonicz- 
nego; D0  spektroskopowa  energia  dysocjacji 


Dane  charakteryzujące  osc>lacje  cząsteczek 
dwuatomowych 


Cząsteczka 


HF 

3958 

HC1 

2886 

HBr 

255*8 

HJ 

2233 

CO 

2155 

NO 

1877 

NaCl 

378 

Częstość 
oscylacji  cm~ 


Stała  siłowa 
N/cm 


8,8 

4,84 

3,78 

2,89 

18,6 

15,4 

1,2 


Przybliżenie  oscylatora  harmonicznego  stosuje  się 
dla  niższych  poziomów  energetycznych.  Gdy  wzbu- 
dzone są  wyższe  poziomy  oscylacyjne  (patrz  rys.  8), 
pojawia  się  czynnik  nieharmoniczny  w potencjale 
w postaci  U = U^f-\-Uzqz.  Taka  zmodyfikowana  po- 
stać funkcji  energii  potencjalnej  prowadzi  do  nastę- 
pującego wyrażenia  na  energię  stanów  oscylacyjnych: 
E = ńv0(v+£)  — xhv0(v- fi)2, 

gdzie  x jest  stałą  anharmoniczności. 

Anharmoniczność  pociąga  za  sobą  pewne  ważne 
następstwa.  Po  pierwsze  odległości  między  poziomami 
oscylacyjnymi  stają  się  coraz  mniejsze,  w miarę  jak 
rośnie  oscylacyjna  liczba  kwantowa.  Mierząc  stop- 
niowe zmniejszanie  się  tych  odległości,  możemy  zna- 
leźć wartość  x , a stąd  wartość  spektroskopowej  energii 
dysocjacji  D0  = łv0(l— i*)  (rys.  8.)  Po  drugie  nie 

308 


obowiązuje  już  reguła  wyboru  Av  = ±1,  lecz  dozwo- 
lone są  również  przejścia,  dla  których  Av  = ± 2, 

±3, ...  Widmo  składa  się  więc  nie  z jednego  pasma 
podstawowego,  jak  to  ma  miejsce  w przypadku  oscy- 
latora harmonicznego,  lecz  z pasma  podstawowego 
i z szeregu  pasm  harmonicznych,  tzw.  nadtonów. 

Natężenie  nadtonów  jest  jednak  o kilka  rzędów  wiel- 
kości mniejsze  od  natężenia  pasma  podstawowego. 

Dwuat omowa  cząsteczka  ma  tylko  jedną  możli- 
wość oscylacji  lub — jak  to  się  często  mówi  — ma 
jeden  stopień  swobody.  Stanowi  ona  jeden  oscylator, 
którego  widmo  jest,  jak  widzieliśmy,  bardzo  proste  cząsteczka 
i łatwe  do  interpretacji.  Znacznie  bardziej  skompli-  wieloato- 
kowana  jest  sytuacja  w cząsteczce  zawierającej  więcej  mowa 
atomów.  Cząsteczkę  wieloatomową  możemy  trakto- 
wać jako  pewną  liczbę  punktów  materialnych  połą- 
czonych ze  sobą  sprężynami.  W tym  przypadku  nie 
można  już  traktować  oscylacji  jako  zmian  długości 
pojedynczych  wiązań,  lecz  jako  równoczesny  ruch 
wszystkich  atomów  w cząsteczce.  Kiedy  w cząsteczce 
wzbudzone  zostaną  drgania  jednego  wiązania,  ich 
energia  jest  przekazywana  do  drugiego  za  pośred- 
nictwem wspólnego  atomu: 


Rozciągnięcie  wiązania  AB  powoduje  ściśnięcie  wią- 
zania BC . Energia  potencjalna  cząsteczki  będzie  zale- 
żała od  wychyleń  wszystkich  atomów  z ich  położeń 
równowagi.  Gdy  cząsteczka  składa  się  z N atomów, 
to  istnieje  3 N współrzędnych  w trzech  kierunkach 
prostopadłych  x>  y,  z opisujących  te  wychylenia.  We 
współrzędnych  kartezjańskich  xyz,  opis  ruchu,  jaki 
wykonują  wszystkie  atomy  w cząsteczce,  jest  bardzo 
skomplikowany.  Niewiele  upraszcza  sprawę  wprowa- 
dzenie tzw.  współrzędnych  naturalnych,  tj.  zmian 
długości  wiązań  i zmian  kątów  między  wiązaniami. 

Okazuje  się  jednak,  że  można  znaleźć  takie  współrzęd- 
ne, zwane  współrzędnymi  normalnymi,  których  za- 
stosowanie uprości  bardzo  opis  ruchu  cząsteczki, 
utożsamiając  go  z opisem  ruchu  atomów  w cząsteczce 
dwuatomowej.  Te  niezwykle  ułatwiające  obliczenia 
współrzędne  normalne  są  po  prostu  kombinacjami 
liniowymi  współrzędnych  naturalnych. 

Złożony  ruch  cząsteczki  wieloatomowej  można  rozkład  na 
rozłożyć  na  szereg  ruchów  harmonicznych,  tzw.  drgań  drgania 
normalnych,  opisywanych  tak,  jak  ruch  cząsteczki  normalne 
dwuatomowej.  Każdemu  drganiu  normalnemu  o ener- 
gii Ei  = hv\(v  -f  V2)  odpowiada  częstość  normalna  v$  — 

= (l/2rc)}/ ki/ M . Energia  stanu  podstawowego  równa 

n 

E,  = \ może  być  bardzo  duża,  gdy  cząsteczka 

i— 1 

zawiera  wiele  atomów.  Do  każdego  drgania  nor- 
malnego można  zastosować  regułę  wyboru  Av  = ±1, 
obowiązującą  dla  oscylatora  harmonicznego. 

Wiemy,  że  w cząsteczkach  dwuatomowych  drganie 
może  być  wzbudzone  tylko  wówczas,  gdy  moment 
dipolowy  cząsteczki  zmienia  się  przy  drganiu.  Uogól- 
niając ten  wynik  na  przypadek  drgań  normalnych, 
możemy  powiedzieć,  że  wzbudzone  będą  tylko  te 
drgania  normalne,  które  prowadzą  do  zmian  momen- 
tu dipolowego  cząsteczki. 

Zastanówmy  się  teraz,  ile  drgań  normalnych  może 
mieć  cząsteczka  wieloatomowa.  Gdyby  atomy  two- 
rzące cząsteczkę  były  zupełnie  swobodne,  każdy  z nich 
miałby  3 stopnie  swobody  ruchu  postępowego  w kie- 
runkach y , z,  czyli  N atomów  miałoby  3 N stopni 

swobody.  Ponieważ  atomy  w cząsteczce  są  związane, 
ruch  postępowy  w przestrzeni  wykonuje  cała  cząstecz- 
ka. Na  ten  ruch  przypadają  3 stopnie  swobody.  Po- 
nadto cząsteczka  wykonuje  rotację,  na  którą  przypa- 
dają 3 stopnie  swobody  w cząsteczkach  nieliniowych 
względem  trzech  prostopadłych  osi  i dwa  stopnie  swo- 
body w cząsteczkach  liniowych  (gdzie  trzecia  oś  jest 
osią  cząsteczki).  Reszta  stopni  swobody,  tj.  3 N—6 


dla  cząsteczek  nieliniowych  oraz  3N—5  dla  cząste- 
czek liniowych  przypada  na  oscylacje.  Cząsteczkę  N- 
atomową  możemy  rozpatrywać  jako  3 N—6  (albo 
liczba  drgań  3N—5)  oscylatorów  wykonujących  3 N—6  (albo 
normalnych  3iV—  5)  drgań  normalnych.  Energia  drgań  każdego 
z oscylatorów  jest  skwantowana.  Do  każdego  z oscy- 
latorów stosuje  się  reguły  wyboru  opisane  poprzednio 
dla  oscylatorów  dwuatomowych.  Nie  są  to  jednak  oscy- 
latory dwua tomowe,  gdyż  każdy  atom  w cząsteczce 
oddziałuje  ze  wszystkimi  pozostałymi  atomami.  W os- 
cylatorze dwuatomowym  o energii  i częstości  oscylacji 
decyduje  siła  jednego  istniejącego  wiązania  chemicz- 
nego. Miarą  tej  siły  jest  stała  siłowa  oscylatora. 


Rys.  9.  Drgania  nor- 
malne cząsteczki  HsO 
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Rys.  10.  Widmo  oscylacyjne  H20  w roztworze  w CCI4 


W cząsteczce  wieloatomowej  występuje  wiele  takich 
sił  różnie  skierowanych.  Prowadzą  one  do  skompliko- 
wanych ruchów  oscylacyjnych  atomów.  Rysunek  9 
pokazuje  drgania  normalne,  a rys.  10  widmo  oscyla- 
cyjne cząsteczki  wody.  Jak  widać,  liczba  drgań  nor- 
malnych zgodna  jest  z liczbą  wewnętrznych  stopni 
swobody  3N—6  (dla  H20  3-3  — 6 = 3).  Można  by 
zapytać,  na  jakiej  podstawie  zostały  wprowadzone 
na  rys.  9 strzałki  oznaczające  kierunek  ruchu  atomów. 
Przy  dobieraniu  strzałek  kierujemy  się  następującą 
zasadą:  równoczesne  wychylenie  atomów  z położe- 
nia równowagi  nie  może  powodować  przemieszczenia 
środka  ciężkości  cząsteczki  ani  jej  obrotu  wokół 
jakiejś  osi. 

Współrzędne  normalne  są  przeważnie  złożonymi 
funkcjami  wychyleń  poszczególnych  atomów  z poło- 
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Rys.  11.  Drgania  normalne 
cząsteczki  CO,.  Strzałki  oz- 
naczają kierunki  wychyleń 
atomów  w płaszczyźnie  ry- 
sunku; znaki  + i — ozna- 
czają wychylenia  atomów 
v prostopadłe  do  płaszczyzny 
J rysunku 


żenią  równowagi.  Sytuacja  jednak  bardzo  się  uprasz- 
rola  symetrii  cza,  gdy  cząsteczka  ma  element  symetrii.  Rolę  sy- 


metrii w układach  cząsteczkowych  zilustrujemy  na 
podstawie  współrzędnych  normalnych  liniowej  czą- 
steczki CO*  (rys.  11).  Cząsteczka  CÓ2  ma  płaszczyznę 
symetrii  prostopadłą  do  jej  osi.  Oznacza  to,  że  w sta- 
nie równowagi  C02  ma  identyczną  konfigurację  po 
obydwu  stronach  płaszczyzny  symetrii.  Innym  ele- 
mentem symetrii  cząsteczki  C02jest  jej  oś.  Obrót  wokół 
tej  osi  o dowolny  kąt  nie  zmienia  konfiguracji  układu. 
Typ  symetrii  z dwoma  wymienionymi  elementami 
symetrii  oznaczamy  symbolicznie  gdzie 

odnosi  się  do  osi  symetrii  nieskończonego  rzędu, 
a wskaźnik  h dotyczy  płaszczyzny  prostopadłej  do  tej 
osi  symetrii. 

Liniowa  cząsteczka  C02  o symetrii  Dzoh  ma  4 
drgania  normalne  (3-3— 5 = 4)  przedstawione  na 
rys.  11.  Symetryczne  drganie  rozciągające  v1  nie  wy- 
wołuje zmiany  momentu  dipolowego  cząsteczki,  po- 
nieważ równa  się  zeru,  zarówno  gdy  cząsteczka  jest 
rozciągnięta,  jak  też  gdy  jest  ona  ściśnięta.  Drganie 
tego  typu,  symetryczne  względem  każdego  elementu 
symetrii,  nazywamy  drganiem  pełnosymetrycznym. 
Nie  jest  ono  nigdy  czynne  w podczerwieni.  Drganie  vt 
jest  drganiem  deformacyjnym  (cząsteczka  ulega  wy- 
gięciu — pojawia  się  moment  dipolowy).  Atomy  czą- 
steczki COa  mogą  wykonywać  pełne  drgania  w dwóch 
prostopadłych  do  siebie  kierunkach,  przy  czym  czę- 
stość obu  tych  drgań  jest  identyczna.  Takie  drgania 
o identycznej  częstotliwości  nazywa  się  drganiami 
podwójnie  zdegenerowanymi.  Moment  dipolowy  wy- 
giętej cząsteczki  COa  zmienia  się  podczas  drgań  defor- 
macyjnych  od  pewnej  skończonej  wartości  dodatniej 
poprzez  zero  do  pewnej  skończonej  wartości  ujemnej. 
Dzięki  temu  cząsteczka  może  oddziaływać  z promie- 
niowanem  elektromagnetycznym,  a więc  drganie  va 
j est  czynne  w podczerwieni.  Drganie  v3  jest  antysyme- 
trycznym  drganiem  rozciągającym.  Cząsteczka  w koń- 
cowych fazach  ruchu  ma  momenty  dipolowe  o prze- 
ciwnych znakach.  Drganie  vs  będzie  więc  również 
czynne  w podczerwieni.  Podczas  drgania  v3  zmieniają- 
cy się  moment  dipolowy  jest  zawsze  równoległy  do 
osi  cząsteczki. 

Nieliniowa  cząsteczka  HaO  należy  do  grupy  syme- 
trii C2r.  Oznacza  to,  że  ma  ona  oś  symetrii  drugiego 
rzędu,  tzn.  obrót  wokół  tej  osi  o kąt  180°  (360° : 2)  nie 
zmienia  konfiguracji  cząsteczki,  oraz  dwie  płaszczyz- 
ny symetrii  (płaszczyznę  cząsteczki  i płaszczyznę  do 
niej  prostopadłą  przechodzącą  przez  atom  tlenu). 
Cząsteczka  H20  ma  trzy  drgania  normalne  (3-3—6  = 
= 3)  pokazane  na  rys.  9.  Zmieniają  one  moment  di- 
polowy cząsteczki  i w związku  z tym  są  czynne 
w podczerwieni. 

Widma  oscylacyjne  cząsteczek  wieloatomowych  są 
przeważnie  bardziej  złożone  aniżeli  omówione  przez 
nas  dwa  przykłady  C02  i HzO.  Aby  znaleźć  postać 
drgań  normalnych,  należy  wziąć  pod  uwagę  symetrię 
cząsteczki  i zastosować  metodę  teorii  grup.  Przypi- 
sanie odpowiednim  drganiom  normalnym  linii  obser- 
wowanych w widmie  jest  olbrzymią  pracą,  prowadzo- 
ną dzisiaj  za  pomocą  najnowocześniejszych  elektro- 
nicznych maszyn  cyfrowych.  Dokonano  już  analizy 
drgań  normalnych  wielu  cząsteczek,  ale  jeszcze  wielka 
liczba,  zwłaszcza  cząsteczek  o niższej  symetrii,  pozo- 
staje ciągle  nie  rozszyfrowana. 

Chociaż  oscylacje  w cząsteczkach  wieloatomowych 
są  oscylacjami  wszystkich  atomów  cząsteczki,  zdarza 
się  często,  że  drgania  zlokalizowane  są  w pewnych 
grupach  atomów  wchodzących  w skład  cząsteczki. 
Gdy  taka  grupa  atomów  znajduje  się  w różnych  czą- 
steczkach, w widmach  występować  będą  pasma  o tych 
samych  prawie  częstościach  i natężeniach.  Jest 
to  efekt  tak  pewny  i sprawdzony  w tak  wielu  przykła- 
dach, że  obecność  lub  nieobecność  w widmie  badanej 
cząsteczki  pasma  w danym  zakresie  częstości  może 
być  poważnym  argumentem  świadczącym  o obe- 
cności lub  braku  odpowiedniego  zgrupowania  ato- 
mów w badanej  cząsteczce.  Częstości  związane  z da- 
nym ugrupowaniem  atomów  zwane  są  częstościami 
charakterystycznymi  grup  atomowych.  Rys.  12  przed- 
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liczba  falowa  7 

Rys.  12.  Częstości  charakterystyczne  kilku  grup  atomowych. 
Strzałkami  zaznaczono  kierunek  przesunięć  atomów 


Aby  znaleźć  najbardziej  prawdopodobną  strukturę 
i skład,  badamy  zakresy  widma,  w których  występują 

charakterystyczne  częstości  grup  OH  i ^>CH2.  Brak 

silnego  pasma  w obszarze  3500-3600  cm”1  świadczy 
o niewystępowaniu  grup  OH,  a więc  przeciw  struktu- 
rze I,  III,  V (bardzo  słabe  pasmo  przy  3520  cm"1  jest 
najprawdopodobniej  spowodowane  przez  zanieczysz- 
czenia). Brak  silniejszej  absorpcji  przy  2850  cm"1 
pozwala  odrzucić  struktury  H,  III  i V z kilkoma  gru- 
pami ^>CH2,  którym  ta  absorpcja  odpowiada.  Wy- 


stępowanie słabego  pasma  przy  2940  cm"1  świadczy 
o obecności  pojedynczej  grupy  ^>CH2  dołączonej  do 

grupy  \c— -O.  Najbardziej  prawdopodobna  wydaje 
się  więc  struktura  IV. 


Widma  oscylacyjne- rotacyjne 

Dotychczas  rozpatrywaliśmy  oscylacje  cząsteczek  nie 
uwzględniając  faktu,  że  wykonują  one  równocześnie 
ruch  oscylacyjny  i rotacyjny.  Pominięcie  rotacji  jest, 
jak  mówiliśmy,  uzasadnione  w odniesieniu  do  cząste- 
czek w cieczach,  roztworach  i ciałach  stałych,  gdzie 
siły  międzycząsteczkowe  powodują  prawie  całkowite 
zahamowanie  obrotów.  W fazie  gazowej  należy  ko- 
niecznie uwzględnić  równoczesne  występowanie  oscy- 


Rys.  13.  Widmo  oscylacyjne  nieznanej  próbki.  Krzywa  czarna  przedstawia  widmo  zarejestrowane  przy  większej  grubości  warstwy 
absorbującej,  krzywa  niebieska — przy  grubości  mniejszej 


Aby  zilustrować  zastosowanie  częstości  charakte- 
rystycznych grup  do  analizy  widma  oscylacyjnego 
cząsteczki  o nieznanym  składzie  i strukturze,  rozpa- 
trzymy następujący  przykład.  Weźmy  pod  uwagę 
widmo  absorpcyjne  w podczerwieni,  takie  jak  np. 
na  rys.  13.  Ze  sposobu  otrzymywania  związku,  któ- 
rego strukturę  i skład  mamy  ustalić,  wynika,  że 
możliwe  są  następujące  formy: 


J" 

4 


v =1 


v = 0 


Rys.  14.  Schemat  pozio- 
mów oscylacyjno-rotacyj- 
nych 


lacji  i rotacji.  Korzystając  z naszych  dotychczasowych 
wiadomości  możemy  zapisać,  że  dla  najprostszego 
przypadku  dwuatomowych  cząsteczek,  energia  rów- 
noczesnej rotacji  i oscylacji  cząsteczki  w przybliżeniu 
rotatora  sztywnego  i oscylatora  harmonicznego 
wynosi 

£osc  rot  = hv0(v  + 2)  (/  + 1). 


oscylacje 
i rotacje 
w gazach 


cząsteczka 

dwuatomewa 
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transmisja 


Gdy  zachodzi  przejście  pomiędzy  dwoma  poziomami, 
z których  wyższy  oznaczamy  pojedynczą  kreseczką 
a niższy  podwójną  (rys.  14),  otrzymujemy  następujące 
wyrażenie  na  różnicę  energii  poziomów: 

^scrot-^cro.  = W -✓')+*'/'</'+ 1)- 

1), 


gdzie  B'  i B"  są  stałymi  rotacyjnymi  odpowiadają- 
cymi dwu  stanom  oscylacyjnym,  a J'  — 0,  1,  2,  3, ... 
J"  = 0,  1,  2,  3,....  Przejściami  między  poziomami 
rządzą  reguły  wyboru  dla  liczb  kwantowych  v i /, 
które  mówią  że  Av  = v'—v,ł  = 1,  a AJ  = J'—J"  = 
= ±1- 

Musimy  teraz  rozważyć  dwa  możliwe  sposoby 
zmian  rotacyjnej  liczby  kwantowej  J.  Gdy  J'—J"  = 
= +1  otrzymujemy 

AEo&c  rot  = hv0+(B'+B'')J'+(B'-B")J'\ 

J'  = 1, 2,  3,  zaś  dla  = - 1 

AEosorot  = = 

= 1,2,  3. 

Rysunek  15  przedstawia  typowe  pasmo  oscylacyjno- 
-rotacyjne  cząsteczki  dwuatomowej.  Składa  się  ono 
z wielu  prawie  równoległych  linii.  Układ  linii  po  stro- 


liczba  faiowa  v Rys.  15.  Struktura  rotacyjna  pasma  oscylacyjnego  HBr 


gałęzie  nie  niższych  częstości  AJ  — — 1 nazywa  się  zwykle 
P i R gałęzią  P>  a układ  linii  po  stronie  wyższych  częstości 
AJ  = +1 — gałęzią  R.  W środku  pasma  przy  czę- 
stości v0  występuje  przeważnie  luka  odpowiadająca 
niedozwolonemu  przejściu  z AJ  = 0.  Wartości  B ' 
i B'ł  można  bezpośrednio  wyznaczyć  z widma  oscy- 
lacyjno-rotacyjnego.  Dla  składowych  gałęzi  P i R, 
w których  zachodzi  absorpcja  z tego  samego  poziomu 
rotacyjnego  otrzymuje  się  (rys.  14): 

vr(J')-vp{J')  = 2B"  (2/' 4*1). 

Z zależności  tej  można  wyznaczyć  B"  a następnie  mo- 
ment bezwładności  Dla  składowych  gałęzi  P i R , 
w których  zachodzi  wzbudzenie  do  tego  samego  po- 
ziomu rotacyjnego  /"  (rys.  14), 

vr(J')-vp(J'+ 2)  = 2B'(2J'+3). 

Z tej  różnicy  można  wyznaczyć  B'  oraz  moment  bez- 
władności /'. 

Rozważania  nasze  prowadzą  do  wniosku,  że  struk- 
tura widm  oscylacyjno-rotacyjnych  zależy  od  mo- 
mentu bezwładności,  a więc  od  odległości  międzyato- 
mowych.  Widma  oscylacyjno-rotacyjne  dają  więc 
jeszcze  jedną  możliwość  wyznaczania  rozmiarów 
i kształtu  cząsteczek. 

względne  Omawiając  widma  oscylacyjno-rotacyjne  cząste- 
natężenia  czek  dwuatomowych  warto  zwrócić  uwagę  na  natę- 
składowych  żenią  składowych  pasma  pokazanego  na  rys.  15. 
w widmie  Względne  natężenia  tych  składowych  są  w przybliże- 
niu proporcjonalne  do  obsadzania  poziomów  rota- 


cyjnych będących  poziomami  wyjściowymi  dla  przejść 
kwantowych.  Obsadzenie  poziomu  rotacyjnego,  czyli 
liczba  cząsteczek  znajdujących  się  w stanie  energe- 
tycznym opisanym  przez  liczbę  kwantową  /,  wynosi: 

Nj  = (2/+ 1 ) N0e~J{J+1)mT 


+ 10  +5  0 

natężenie 


P 


-5 


-10 


Rys.  16.  Wpływ  temperatury  na  rozkład  natężenia  pasma  oscyła- 
cyjno-rotacyjnego  HC1 


Natężenia  składowych  odpowiadających  przejściom 
z poziomów  o różnym  J będą  się  więc  zmieniać  wraz 
ze  zmianą  temperatury  próbki  (rys.  16). 

Energia  równoczesnych  oscylacji  i rotacji  wielo- 
atomowych  cząsteczek  liniowych  jest  w przybliżeniu 
sumą  jEosc+jErot.  Dla  takich  cząsteczek  występują 
dwa  podstawowe  typy  pasm  oscylacyjno-rotacyjnych. 
Gdy  momenty  dipolowe  związane  z drganiami  czą- 
steczki są  równoległe  do  jej  osi,  otrzymuje  się  pasmo 
rotacyjno-oscylacyjne  równoległe  (rys.  17).  Jeżeli  na- 


Rys.  17.  Pasmo  równoległe  cząsteczki  COa 


tomiast  oscylacyjne  momenty  dipolowe  są  prostopa- 
dłe do  osi  cząsteczki,  otrzymuje  się  pasmo  nazywane 
pasmem  prostopadłym  (rys.  18).  Dla  pasm  równo- 
ległych ważne  są  reguły  wyboru  takie  same,  jak  dla 
cząsteczek  dwuatomowych,  tj.  Av  = ±1,  AJ  — ±1. 
Podobnie  jak  dla  cząsteczek  dwuatomowych,  w wid- 
mie wystąpią  tylko  gałęzie  P i R.  Do  tych  pasm  można 
zastosować  rozważania  dotyczące  cząsteczek  dwuato- 
mowych i wyznaczyć  z odległości  między  liniami  ro- 
tacyjnymi pasma  oscylacyjnego  równoległego  war- 
tości B ' i B". 

Przy  drganiach  prostopadłych  do  osi  cząsteczki  waż- 
ne są  inne  reguły  wyboru,  a mianowicie:  Av  = ±1, 
AJ  = 0,  ± 1 . W związku  z tym  pasma  prostopadłe 
cząsteczek  liniowych  mają  oprócz  gałęzi  P i R także 
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gałąź  Q gałąź  centralną  Q odpowiadającą  przejściu  AJ  — 0 nych  na  równoległe  i prostopadłe.  Zależnie  od  tego 
(rys.  18).  Jedną  z głównych  cech  gałęzi  Q jest  to,  że  czy  zmiana  momentu  dipolowego  odbywa  się  w kie- 
wszystkie  przejścia  J'-+J"  tej  gałęzi  mają  prawie  taką  runku  najmniejszego,  pośredniego  lub  największego 
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samą  częstość  v0.  Ze  względu  na  nieznacznie  mniejszą 
wielkość  B"  w porównaniu  do  B\  gałąź  Q jest  nieco 
asymetryczna  od  strony  większych  J. 

Drgania  cząsteczek  typu  bąka  symetrycznego  dają- 
ce pasma  oscylacyjno-rotacyjne  są  związane  z wibra- 
cyjnym momentem  dipolowym,  ustawionym  równo- 
legle bądź  prostopadle  do  osi  cząsteczki.  Podobnie 
jak  dla  cząsteczek  liniowych,  obydwu  typom  drgań 
odpowiadają  różne  rotacyjno-oscylacyjne  reguły  wy- 
boru i stąd  różny  kształt  pasm.  Drgania  dające  pasmo 
równoległe  przedstawia  rys.  19.  Wszystkie  pokazane 
na  rysunku  drgania  mają  wibracyjny  moment  dipo- 


H 


Rys.  19.  Drgania  cząsteczek  będących  rotatorami  symetryczny- 
mi, prowadzące  do  pasm  absorpcyjnych  równoległych 


Iowy  skierowany  wzdłuż  osi  cząsteczki.  Dla  drgań 
tego  typu  regułami  wyboru  są: 

Av  = ±1,  AK  = 0,  AJ  = 0,  ±1  jeżeli  K * 0; 

Av  = ± 1,  AK  = 0,  AJ  = ± 1,  jeżeli  K = 0, 
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Rys.  21.  Drgania  cząsteczek  będących 
rotatorami  symetrycznymi  prowadzące 
do  pasm  prostopadłych 


liczba  falowa  v 


gdzie  liczby  kwantowe  K i J znane  nam  już  są  z roz- 
ważań widm  czysto  rotacyjnych.  Przykład  równoleg- 
łego pasma  oscylacyjno-rotacyjnego  cząsteczki  CHsBr 
przedstawia  rys.  20.  Pasmo  składa  się  z trzech  gałęzi 
P,  Q i R.  Jak  widać  na  rysunku  tylko  dla  gałęzi  P 
widoczne  są  rozdzielone  linie  rotacyjne.  Dla  gałęzi 
R i Q występują  pasma  bez  zaznaczonej  struktury  ro- 
tacyjnej. 

Drgania,  przy  których  powstaje  moment  dipolowy 
prostopadły  do  osi  cząsteczki,  przedstawia  schema- 
tycznie rys.  21.  Do  drgań  tego  typu  stosują  się  nastę- 
pujące reguły  wyboru  dla  liczb  kwantowych  oscyla- 
cyjnych i rotacyjnych  Av  — ±1,  AK  ==  ±1,  .AJ  — 
=0,±1.  Typowe  pasmo  oscylacyjno-rotacyjne  pro- 
stopadłe przedstawia  rys.  22. 

W przypadku  cząsteczek  typu  bąka  niesymetrycz- 
nego nie  możemy  dzielić  pasm  oscylacyjno-rotacyj- 


Rys.  22.  Pasmo  prostopadłe  cząsteczki  CHaCl  (rotator  syme- 
tryczny) 

momentu  bezwładności  mówimy  o pasmach  typu  A,  pasma  typu 
B lub  C.  Każde  z tych  trzech  pasm  ma  zwykle  pewien  A,  B i C 
charakterystyczny  kształt,  co  pozwala  je  odróżnić  od 
siebie. 


Widma  rozproszenia  Hamana 

Widma  rozproszenia  Ramana  są  jednym  z wielu  przy- 
kładów zjawisk  przewidywanych  przez  teoretyków 
wcześniej,  zanim  zostały  odkryte  doświadczalnie. 
W 1923  r.  A.G.  Smekal  zwrócił  uwagę,  że  w promie- 
niowaniu rozproszonym  powinny  się  pojawić  obok 
fotonów  o częstości  promieniowania  padającego  v0> 
fotony  o częstościach  v0±v.  Teoretycy  z niecierpliwo- 
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ścią  oczekiwali  doświadczalnego  potwierdzenia  swych 
przewidywań,  które  mogło  ugruntować  lub  obalić 
podstawy  mechaniki  kwantowej.  I oto  w 1928  r.  po- 
jawiają się  pierwsze  prace  doświadczalne  fizyka  hin- 
duskiego Ch.V.  Rama  na  dotyczące  rozproszenia 
w cieczy  (benzenie)  oraz  prace  fizyków  radzieckich 
G.  S.  Landsberga  i L.I.  Mandelsztama  dotyczące  roz- 
proszenia w kryształach  kwarcu. 

Mechanizm  rozproszenia  ramanowskiego  jest  na- 
stępujący: padające  promieniowanie  elektromagne- 
tyczne indukuje  w cząsteczce  moment  dipolowy 

tu  = a E, 

gdzie  a jest  polaryzowalnością  cząsteczki,  czyli  miarą 
zdolności  do  deformacji  rozkładu  jej  ładunków  w polu 
elektromagnetycznym  lub  elektrycznym.  Polaryzo- 
walność  jest  tym  większa,  im  słabiej  związane  są 
elektrony  zewnętrznych  powłok  z jądrami  atomów. 
W czasie  drgania  cząsteczki,  powodującego  perio- 
dyczne zmiany  jej  struktury,  zmienia  się  również  po- 
laryzowalność.  Jest  więc  ona  funkcją  współrzędnych 
q opisujących  drganie  cząsteczki : 

a = afe). 

Periodycznym  zmianom  współrzędnych  q odpowia- 
dają zmiany  periodyczne  x(q).  W przybliżeniu  har- 
monicznym 

a(q)  = a0  cos  2711*, 

gdzie  v jest  częstością  drgania,  np.  drgania  normal- 
nego w przypadku  cząsteczek  wieloatomowych.  Pro- 
mieniowanie elektromagnetyczne  E też  zmienia  się 
periodycznie:  E — £^>cos2tc^0^  a więc  indukowany 
w cząsteczce  przez  falę  elektromagnetyczną  moment 
dipolowy  m wynosi 

m = ao£ocos27tv/cos27tv. 

Stosując  znany  wzór  trygonometryczny  na  iloczyn 
cosinusów  otrzymamy 

fu  = 'Uo^Eo  [cos 2jt(v0— y)/-f  cos27c(v0-f  v)t\. 

Drgający  indukowany  moment  dipolowy  ma  więc 
składowe  v0-v  i v0+v.  Częstościami  v mogą  być  czę- 
stości oscylacji  lub  rotacji  opisywane  wzorami  poda- 
nymi poprzednio  przy  omawianiu  widm  oscylacyj- 
nych i rotacyjnych. 

Przedstawiony  mechanizm  rozproszenia  ramanow- 
skiego jest  bardzo  uproszczony.  Pełny  opis  teoretycz- 
ny tego  zjawiska  daje,  jak  już  mówiliśmy,  mechanika 


Rys.  23.  Schemat  po- 
ziomów energetycznych 
i widmo  Ramana  czą- 
steczki dwuatomowej ; 
linią  przerywaną  zazna- 
czono poziom  niestacjo- 
narny 


kwantowa.  Schemat  poziomów  energetycznych  wyni- 
kających z rozważań  mechaniki  kwantowej  przedsta- 
wia rys.  23.  Fotony  padającego  promieniowania 
o częstości  v0  ulegają  rozproszeniu  na  cząsteczkach. 
Gdy  po  rozproszeniu  promieniowania  cząsteczka  po- 
zostaje w tym  samym  stanie  energii  — mamy  do  czy- 
nienia z rozproszeniem  bez  zmiany  długości  fali,  któ- 
remu odpowiada  środkowa  linia  v0  w dolnej  części 
rys.  23.  Zdarza  się  jednak,  że  cząsteczka  po  rozpro- 
szeniu znajdzie  się  na  wyższym  poziomie  rotacyjnym 


lub  oscylacyjnym  i rozproszony  foton  ma  częstość 
zmniejszoną  o różnicę  energii  rotacyjnych  lub  oscyla- 
cyjnych poziomów  energetycznych.  Takiemu  rozpro- 
szeniu odpowiada  linia  v0—v  w dolnej  części  rys.  23, 
zwana  linią  stokesowską.  Jeżeli  przed  rozproszeniem 
cząsteczka  znajdowała  się  we  wzbudzonym  stanie  ro- 
tacyjnym lub  oscylacyjnym,  to  możłiwe  jest,  że  po 
rozproszeniu  znajdzie  się  w stanie  podstawowym. 
Rozproszony  foton  zwiększy  swą  częstość  o różnicę 
energii  hv  rotacyjnych  lub  oscylacyjnych  poziomów 
energetycznych.  Odpowiada  mu  linia  v0-f  v pokazana 
w dolnej  części  rys.  23,  zwana  linią  antystokesowską. 
Ponieważ  we  wzbudzonym  stanie  rotacyjnym,  a zwła- 
szcza oscylacyjnym,  jest  znacznie  mniej  cząsteczek  niż 
w stanie  podstawowym,  przejścia  antystokesowskie 
są  znacznie  rzadsze,  a linie  im  odpowiadające  mają 
mniejsze  natężenie.  Częstości  linii  ramanowskich  ro- 
tacyjnych i oscylacyjnych  otrzymać  można  na  pod- 
stawie rozważań  przeprowadzonych  poprzednio  dla 
odpowiednich  widm  rotacyjnych  i oscylacyjnych. 
W odniesieniu  do  tych  częstości  słuszne  będzie  to 
wszystko,  co  mówiliśmy  o rotacji  i oscylacji  cząste- 
czek dwuatomowych  i wieloatomowych,  rozpatrywa- 
nych jako  rotatory  sztywne  i niesztywne  oraz  oscyla- 
tory harmoniczne  i anharmoniczne,  drgania  normal- 
ne  itp. 

Na  zakończenie  warto  jeszcze  kilka  słów  powie- 
dzieć na  temat  warunków  pojawienia  się  linii  czy  pa- 
sma widma  ramanowskiego.  Podczas  gdy  warunkiem 
pojawienia  się  linii  czy  pasma  w widmie  absorpcji 
jest  zmiana  momentu  dipolowego  cząsteczki,  warun- 
kiem pojawienia  się  linii  i pasma  w widmie  ramanow- 
skim  jest  zmiana  polaryzowalności  a(<?).  To  zróżni- 
cowanie ogólnej  reguły  wyboru  widma  absorpcji 
i widma  Ramana  powoduje,  że  rotacja  i niektóre  drga- 
nia nieaktywne  w absorpcji  mogą  być  aktywne  w wid- 
mie Ramana  i na  odwrót.  Na  przykład  drganie  i ro- 
tacja dwuatomowej  cząsteczki  homopolarnej  jest  nie- 
aktywne w absorpcji,  natomiast  pojawia  się  w wid- 
mie Ramana,  ponieważ  rotacji  i drganiu  towarzyszy 
zmiana  polaryzowalności.  W szczególnym  przypadku 
cząsteczek  mających  środek  symetrii  (np.  C02)  obo- 
wiązuje tzw.  zakaz  alternatywny,  który  mówi,  że 
drgania  nieaktywne  w absorpcji  w podczerwieni  są 
aktywne  w rozpraszaniu  Ramana. 


Wpływ  oddziaływań  międzycząstecskowych 
na  widma  oscylacyjne  i rotacyjne 

Mówiliśmy  już,  że  oddziaływania  międzycząsteczko- 
we  mają  wpływ  na  obserwowane  widma  molekularne- 
W przypadku  widm  rotacyjnych,  dla  których  energia 
oddziaływania  z promieniowaniem  elektromagne- 
tycznym jest  tego  samego  rzędu  co  energia  oddziały- 
wań międzycząsteczkowych,  decydują  one  o istnieniu 
widma.  Wpływ  oddziaływań  międzycząsteczkowych 
na  widmo  oscylacyjno-rotacyjne  związany  jest  z tym, 
że  oddziaływania  te  mogą  w większym  lub  mniejszym 
stopniu  zmieniać  siły  wiązań  między  atomami  w czą- 
steczce, a więc  zmieniać  stałe  siłowe,  a tym  samym 
częstości  oscylacji.  Z drugiej  strony  mogą  one  powo- 
dować zmiany  rozkładu  ładunków  w cząsteczce, 
a więc  zmiany  momentu  dipolowego,  co  znajduje  wy- 
raz w zmianach  natężeń  pasm.  Oddziaływania  mię- 
dzycząsteczkowe  wywołują  często  pojawienie  się  mo- 
mentu dipolowego  i wystąpienie  w widmie  odpo- 
wiednich pasm,  które  odpowiadają  zmianom  tego  mo- 
mentu podczas  drgania.  Występuje  to  w cząsteczkach 
takich,  jak  CI2,  J2,  Br2.  Ze  względu  na  zerowy  moment 
dipolowy,  cząsteczki  te  w fazie  gazowej  nie  absorbują 
promieniowania  podczerwonego  i nie  mają  absorp- 
cyjnego widma  oscylacyjnego  i rotacyjnego.  Sytuacja 
zmienia  się  radykalnie  w roztworach,  gdy  jako  roz- 
puszczalnika użyjemy  np.  benzenu,  acetonu  czy  pi- 
rydyny. W roztworach  takich  występują  bowiem  silne 
oddziaływania  pomiędzy  cząsteczkami  chlorowców 
i rozpuszczalnikiem,  prowadzące  do  powstania  kom- 
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pieksów  międzycząsteczkowych  takich,  jak  np.  Cl2  — 
benzen  czy  Cl2  — aceton : 
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Powstanie  tych  kompleksów,  zwanych  kompleksami 
z przeniesieniem  ładunku  (charge-transfer)  powoduje, 
że  w cząsteczkach  chlorowców  następują  zmiany  roz- 
kładu ładunku  prowadzące  do  powstania  momentu 
dipolowego.  O strukturze  i własnościach  kompleksów 
z przeniesieniem  ładunku  będzie  jeszcze  mowa  ob- 
szerniej w rozdziale  omawiającym  widma  elektro- 
nowe. 

wiązanie  Innym  typem  oddziaływań  międzycząsteczkowych 
wodorowe  badanych  metodami  spektroskopii  oscylacyjnej  są 
oddziaływania  zwane  wiązaniami  wodorowymi.  Nie 
jest  przesadą  stwierdzenie,  że  wiązanie  wodorowe  sta- 
nowi główny  czynnik  wzajemnego  powiązania  czą- 
steczek, w tym  również  cząsteczek  układów  biolo- 
gicznych, oraz  że  decyduje  ono  w znacznym  stopniu 
o strukturze  materii  ożywionej.  Międzycząsteczkowe 
wiązanie  wodorowe  występuje  pomiędzy  dwiema 
cząsteczkami,  z których  jedna  zawiera  grupę  proto- 
nodonorową  X — H,  druga  zaś  atom  lub  grupę  ato- 
mów protonoakceptorowych.  Symbolicznym  ozna- 
czeniem wiązania  wodorowego  jest  zwykle  zapis 
X-H  - Y.  Grupami  protonodonorowymi  mogą  być 

/O—H,  \n— H /S— H.  Cl— H,  Br— H.  F— H, 

J — H oraz  w mniejszym  stopniu  C — H.  Protono- 
akceptorami  mogą  być  azot,  tlen,  chlorowce  i ich 
ujemne  jony,  siarka  a czasami  również  inne  atomy, 
np.  węgiel.  Energia  wiązań  wodorowych  waha  się 


Rys.  24.  Struktura  lodu  (lód  heksagonalny) 


nienia  część  wiązań  się  rozrywa  i to  jest  przyczyną 
wzrostu  gęstości  w temperaturze  topnienia. 

Szczególne  znaczenie  ma  wiązanie  wodorowe  w układy  bto- 
układach  biologicznych,  takich  jak  białka  i kwasy  logiczne 
nukleinowe.  W białkach  wiązania  wodorowe  typu 
N — H*Q=C  utrwalają  skręty  łańcuchów  polipep- 
tydowych  (rys.  25).  W kwasach  nukleinowych,  mają- 
cych również  helikalną  budowę,  łańcuchy  tzw.  kom- 
plementarne są  do  siebie  „dopasowane”  dzięki  istnie- 


• wodór 
O węgiel 

O łlen 

Q azot 


-ch3 


wiązanie 

wodorowe 


Rys.  25.  Fragment  heliksu  łańcucha  polipeptydowego 


tymina 


ade\\nina 


wodoru  O węgla  Q tlenu  azotu  fosforu 

Rys.  26.  Fragment  komplementarnego  łańcucha  kwasu  dezoksy- 
rybonukleinowego (DNA) 


w granicach  od  kilku  do  kilkunastu,  a nawet  w nie- 
których przypadkach  kilkudziesięciu  kJ/mol.  Wła- 
sności wielu  układów  molekularnych  określone  są 
przez  wiązania  wodorowe.  Np.  w lodzie  istnieje  regu- 
larna sieć  wiązań  wodorowych  (rys.  24).  Podczas  top- 

314 


niu  wiązań  wodorowych  między  parami  zasad  ade- 
niną i tyminą  oraz  guaniną  i cytozyną.  Fragment 
kwasu  dezoksyrybonukleinowego  pokazany  jest  na 
rys.  26.  Rola  wiązań  wodorowych  łączących  pary  za- 
sad jest  jak  widać  bardzo  duża. 


absorpcja 
w podczer- 
wieni 


Istnienie  wiązania  wodorowego  przejawia  się  bar- 
dzo wyraźnie  w widmie  absorpcji  w podczerwieni. 
Widmo  to  dostarcza  następujących  ważnych  infor- 
macji: 

1 . Wskazuje  na  obecność  wiązania  wodorowego  — 
nawet  bardzo  słabego. 

2.  Informuje,  jaki  protonodonor  X — H bierze  udział 
w wiązaniu  i z jakim  protonoakceptorem  Y oddzia- 
łuje X — H. 

3.  Mówi  o roli  środowiska  otaczającego  cząsteczki 
związane. 

4.  Pozwala  wyznaczyć  energię  wiązania  wodoro- 
wego. 


Rys.  27.  Możliwe  drgania 
wiązania  wodorowego 


Drgania  układu  związanego  wiązaniem  wodoro- 
wym w przybliżeniu  trójatomowym  X—H  -Y  przed- 
stawia rys.  27.  Powstaniu  wiązania  wodorowego  to- 
warzyszy pojawienie  się  nowych  częstości  w widmie, 
a mianowicie  częstości  odpowiadających  drganiom 
międzycząsteczkowego  wiązania,  przedstawionym  na 
rys.  27  ( 4 ) oraz  (5).  Są  to  drgania  o niskich  często- 
ściach w zakresie  tzw.  dalekiej  podczerwieni  (ok. 
50-250  cm"1).  Oprócz  pojawienia  się  tych  nowych  czę- 
stości, zmianom  pod  wpływem  powstania  wiązania 
wodorowego  ulega  również  widmo  donora  i akcep- 
tora protonu.  Największe  zmiany  zachodzą  w obsza- 
rze częstości  drgania  rozciągającego  donora  protonu 
X—  H (drganie  1 na  rys.  27).  Częstość  tego  drgania 
może  obniżyć  się  od  kilku  do  kilkuset  cm"1  (niekiedy 
nawet  więcej).  Pasmo  odpowiadające  temu  drganiu 
ulega  też  znacznemu  poszerzeniu  — nawet  do  setek 
cm"1.  Zwiększa  się  również  bardzo,  często  o rząd  lub 
dwa  rzędy  wielkości,  natężenie  pasma  odpowiadają- 
cego temu  drganiu.  Wiązanie  wodorowe  powoduje 
również  zauważalne  zmiany  w widmie  akceptora  pro- 
tonu. Np.  wiązanie  C=0  uczestniczące  w oddziały- 
waniu obniża  swą  częstość.  Ilustracją  zmian  w widmie 
pod  wpływem  powstania  wiązania  wodorowego  jest 
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Sczba  falowa  v 

Rys.  28.  Widmo  absorpcji  w podczerwieni  4-keto,  6-metylopi* 
Tymidyny  w roztworze  CDC13;  a)  małe  stężenie  badanych  czą- 
steczek, b)  większe  stężenie  badanych  cząsteczek 


rys.  28.  Pokazuje  on  widmo  absorpcji  w podczerwieni 
w zakresie  drgań  rozciągających  wiązanie  N — H w 
cząsteczce  znajdującej  się  w różnych  roztworach, 
a mianowicie  w roztworze,  w którym  nie  tworzą  się 
wiązania  wodorowe  typu  N — H— 0=C  (rys.  28a), 
oraz  w roztworze,  w którym  powstają  te  wiązania 
(rys.  28b).  Szerokie  pasmo  o bogatej  strukturze  od- 
powiada cząsteczkom  związanym  wodorowo,  wąskie 
pasmo  odpowiada  cząsteczkom  nie  oddziałującym  ze 
sobą.  Mierząc  natężenie  obu  tych  pasm  w roztworach 
oraz  badając  wpływ  temperatury  na  ich  natężenia 
można  wyznaczyć  energię  wiązań  wodorowych. 


Widma  elektronowe  cząsteczek 

Jerzy  Prochorow 

O przejściach  elektronowych  mówimy  wtedy,  gdy 
w trakcie  pochłaniania  (absorpcji)  lub  wysyłania  (emi- 
sji) kwantu  promieniowania  elektromagnetycznego 
przez  cząsteczkę  zmienia  się  energia  elektronów  czą- 
steczki. Odpowiednie  widma  absorpcji  bądź  emisji, 
związane  z tymi  przejściami,  nazywamy  widmami 
elektronowymi  cząsteczki.  Obszar,  w którym  wystę- 
pować mogą  takie  widma,  rozciąga  się  od  około 
120  nm  do  1000  nm,  a więc  obejmuje  nadfiolet,  ob- 
szar widzialny  i bliską  podczerwień. 


Stany  elektronowe  cząsteczki 

Stany  energetyczne  cząsteczki,  a więc  i elektronów 
w cząsteczce,  są  stanami  dyskretnymi.  Reguły,  które 
rządzą  przejściami  między  takimi  stanami,  można 
zrozumieć  i wytłumaczyć  tylko  na  podstawie  mecha- 
niki kwantowej.  Dlatego  w tym  miejscu  odsyłamy 
Czytelnika  do  działu  „Chemia  kwantowa”,  ażeby 
zapoznał  się  (o  ile  do  tej  pory  jeszcze  tego  nie  zrobił) 
z kwantowym  opisem  cząsteczki  i podstawowymi  po- 
jęciami tego  opisu,  z których  będziemy  w dalszej  czę- 
ści korzystali.  Na  razie  spróbujemy  tylko  krótko  upo- 
rządkować te  pojęcia  w taki  sposób,  abyśmy  mogli 
zrozumieć  istotę  i prawidłowości  rządzące  przejściami 
i widmami  elektronowymi  — innymi  słowy,  zapo- 
znamy się  na  razie  z teorią  przejść  i widm  elektro- 
nowych. 

Stany  energetyczne  cząsteczki  opisują  molekularne 
funkcje  falowe  y>n,  które  są  ścisłymi  rozwiązaniami 
równania  Schródingera.  Dla  cząsteczek  wieloelek- 
tronowych  takie  rozwiązania  nie  są  w ogóle  możliwe 
i do  otrzymania  i obliczenia  energii  stanów  stacjo- 
narnych cząsteczek  wieloelektronowych  korzysta  się 
z przybliżonych  metod.  Jedną  z nich  jest  metoda 
orbitali  molekularnych. 

Molekularna  funkcja  falowa  y>  określa  orbitę 
i własności  elektronu  w cząsteczce.  Gęstość  rozkładu 
ładunku  elektronowego  w każdym  punkcie  prze- 
strzeni jest  proporcjonalna  do  |^|2.  Wobec  małych 
rozmiarów  elektronu  w stosunku  do  rozmiarów  czą- 
steczki (a  nawet  w stosunku  do  rozmiarów  atomu), 
chmura  ładunku  elektronu  skupiona  jest  w pewnej 
ograniczonej  przestrzeni.  Dla  każdego  więc  elektronu 
można  wydzielić  pewną  powierzchnię  graniczną,  we- 
wnątrz której  zawarta  jest  większość  ładunku  elek- 
tronu, np.  95%.  I to  jest  właśnie  wyobrażenie  orbi- 
tala  elektronu.  W chemii  kwantowej  mówi  się  po  pro- 
stu o funkcji  falowej  elektronu  jako  o orbitalu  — 
wszak  jej  związek  z położeniem  elektronu  w prze- 
strzeni jest  oczywisty! 

Złożone  wieloatomowe  cząsteczki  mają  dużą  licz- 
bę takich  orbitali,  z których  każdy  opisany  jest  od- 
powiednią funkcją  falową  y>.  Orbital  y>  może  być 
np.  zlokalizowany  w znacznym  stopniu  na  jednym 
z jąder  cząsteczki  i jest  to  wtedy  orbital  atomowy, 
może  też  obejmować  dwa  lub  kilka  jąder  jednocze- 
śnie i wtedy  jest  to  orbital  molekularny.  Każdy  orbi- 
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tal  w cząsteczce  może  być,  zgodnie  z zakazem  Pau- 
liego,  obsadzony  co  najwyżej  przez  dwa  elektrony 
(a  w takim  przypadku  muszą  się  one  różnić  funkcją 
spinową  — ich  spiny  muszą  być  sparowane,  porównaj 
rys.  41). 


Oddziaływanie  cząsteczka  z promieniowaniem 
elektromagnetycznym 


dipoiowy 

moment 
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Tak  jak  w przypadku  widm  oscylacyjnych  czy  rota- 
cyjnych, również  i przy  przejściach  elektronowych 
cząsteczka  znajdująca  się  w stanie  y)n  może,  absor- 
bując kwant  promieniowania,  przejść  do  stanu 
jeżeli  spełniony  jest  warunek  Bohra:  En—Em=hv, 
tzn.  jeżeli  różnica  energii  obu  stanów  elektronowych 
jest  równa  energii  kwantu  promieniowania  oddziału- 
jącego z cząsteczką.  Musi  być  również  spełniony  pe- 
wien dodatkowy  warunek.  W pierwszym  przybliże- 
niu oddziaływanie  pola  elektrycznego  promieniowa- 
nia z elektronami  cząsteczki  jest  oddziaływaniem  wek- 
tora elektrycznego  z elektrycznym  momentem  dipo- 
lowym cząsteczki.  I stąd  dodatkowy  warunek,  który 
mówi,  że  aby  możliwe  było  przejście  elektronowe  ze 
stanu  xpn  do  stanu  ym,  wielkość  zwana  dipolowym 
momentem  przejścia  musi  być  różna  od  zera.  Wiel- 
kość ta  obrazująca  przesunięcia  ładunku,  lub  ina- 
czej zmiany  momentu  dipolowego,  wyraża  się  nastę- 
pująco : 

Rnm  — J y>nR  tym  dx , 

gdzie  R = e£ri  jest  tzw.  operatorem  elektrycznego 

i 

momentu  dipolowego;  jest  współrzędną  i-tego 
elektronu,  a sumowanie  obejmuje  wszystkie  elektro- 
ny; e jest  ładunkiem  elektronu.  Jeżeli  warunek  ten 
jest  spełniony,  to  może  nastąpić  przejście  elektrono- 
we, które  nazywamy  przejściem  dipolowym  elektrycz- 
nym, a prawdopodobieństwo  takiego  przejścia  jest 
proporcjonalne  do  R nm\2  • 

Oddziaływanie  promieniowania  z układem  cząste- 
czek może  prowadzić  do  trzech  zasadniczych  typów 
przejść  dipolowych  elektrycznych.  Cząsteczka  może 
absorbować  promieniowanie  i jej  energia  zostaje  pod- 
wyższona, mówimy  wówczas,  że  cząsteczka  została 
wzbudzona  (albo  że  jest  w stanie  wzbudzonym).  Czą- 
steczka w stanie  wzbudzonym  może  tracić  swoją 
energię  wysyłając  kwant  promieniowania,  który  unosi 
ze  sobą  traconą  przez  cząsteczkę  energię.  Prawdopo- 
dobieństwo pierwszego  procesu  — absorpcji — jest 
wprost  proporcjonalne  do  gęstości  energii  £>(v)  pro- 
mieniowania o częstości  v i do  liczby  cząsteczek  m 
w stanie  o niższej  energii,  z którego  następuje  ab- 
sorpcja. 

Prawdopodobieństwo  drugiego  procesu  — emisji 
spontanicznej — jest  proporcjonalne  do  liczby  czą- 
steczek nj  w stanie  o wyższej  energii,  tzn.  do  liczby 
cząsteczek  wzbudzonych.  Trzeci  wspomniany  proces 
to  emisja  wymuszona,  której  prawdopodobieństwo 
jest  proporcjonalne  zarówno  do  njy  jak  i do  e(v).  Ten 
ostatni  proces  jest  mało  istotny  w przypadku  roz- 
ważanych przez  nas  widm  elektronowych,  ma  nato- 
miast kapitalne  znaczenie  dla  pracy  lasera  (-►  La- 
sery — podstawy  działania). 

Nie  będziemy  próbowali  wyprowadzać  związków 
pomiędzy  wspomnianymi  tutaj  prawdopodobień- 
stwami. Podamy  je  tylko  za  Einsteinem,  który  pierw- 
szy je  wyprowadził  (nazywane  są  czasem  dlatego 
współczynnikami  Einsteina).  Jeżeli  przez  Bij , Bji  i Ajt 
oznaczymy  odpowiednio  prawdopodobieństwo  ab- 
sorpcji, emisji  wymuszonej  i emisji  spontanicznej,  przez 
v — częstość  promieniowania,  przez  c — prędkość 
światła,  a przez  h — stałą  Plancka,  to  wielkości  te 
wiążą  się  ze  sobą  następująco: 

Bij  = Bji  = (^/Snh^Aji. 

Prawdopodobieństwo  przejścia  absorpcyjnego,  jak 
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już  wspominaliśmy  poprzednio,  wiąże  się  z dipolo- 
wym momentem  przejścia,  tak  że 

Ba  = (2n/3h2)  \Rtj\2  (h  = /*/2rc), 

a z tych  dwóch  równań  wynika,  że  prawdopodobień- 
stwo emisji  spontanicznej 

Aji  = (6^nt/3hcz)vz\Rji\2 . 

Te  dwa  równania  pokazują,  że  zarówno  absorpcja, 
jak  i emisja  zależą  od  momentu  przejścia.  Niekiedy, 
chociaż  rzadko,  można  ocenić  moment  przejścia  bez 
konieczności  wykonywania  szczegółowych  rachun- 
ków. Czasem  funkcje  falowe  stanów  uczestniczących 
w przejściu  elektronowym  są  takie,  że  moment  przej- 
ścia jest  równy  zeru.  Wtedy  mówimy,  że  przejście  jest 
przejściem  wzbronionym  i nie  powinno  być  obserwo- 
wane. Jeżeli  natomiast  moment  przejścia  jest  różny 
od  zera,  to  przejście  jest  dozwolone  i w zasadzie  po- 
winniśmy mocje  obserwować.  O tym  czy  jakieś  przej- 
ście jest  wzbronione,  czy  też  nie,  mówią  reguły  wy- 
boru Określają  one  warunki,  w których  dipolowy 
moment  przejścia  Rij  — JYi/fyjdfr  = 0. 

Można  podać  szereg  reguł  wyboru,  mniej  lub  bar-  reguły 
dziej  ogólnych.  Dla  przykładu  przytoczymy  dwie  wyboru 
z nich:  1)  wzbronione  są  przejścia,  podczas  których 
następuje  zmiana  spinu  elektronu;  2)  wzbronione  są 
przejścia  pomiędzy  takimi  stanami  elektronowymi, 
których  funkcje  falowe  nie  spełniają  pewnych  okre- 
ślonych warunków  symetrii  (dokładne  rozważenie 
tych  warunków  symetrii  wymaga  znajomości  spec- 
jalnej teorii,  zwanej  teorią  grup,  i dlatego,  niestety, 
nie  będziemy  mogli  tego  tutaj  zrobić). 

Można  podać  inne  reguły  wyboru,  narzucające  wa- 
runki np.  na  nakrywanie  się  orbitali,  czy  na  zmiany 
momentu  pędu  cząsteczki.  Należy  jednak  pamiętać 

0 tym,  że  wyprowadzenie  ścisłych  reguł  wyboru  wy- 
maga znajomości  ścisłych  funkcji  falowych  (będą- 
cych ścisłymi  rozwiązaniami  równania  Schródingera), 
a tymi  na  ogół  nie  dysponujemy.  Dlatego  też  wspom- 
niane reguły  wyboru  wyprowadzane  są  przy  pewnych 
założeniach  upraszczających  i nie  mają  wcale  sensu 
absolutnie  ścisłych  nakazów,  tzn.  przejścia,  które  są 
wzbronione  przez  te  reguły,  nie  są  naprawdę  ściśle 
wzbronione  i mogą  być  w odpowiednich  warunkach 
obserwowane.  Po  prostu  ich  prawdopodobieństwo, 
a tym  samym  i ich  natężenie  jest  z reguły  bardzo  małe. 

1 tak  np.  reguła  wyboru  ze  względu  na  spin  ma  cha- 
rakter reguły  ścisłej  tylko  wtedy,  gdy  w cząsteczce 
nie  występuje  sprzężenie  spin-orbita  (będziemy  jeszcze 

0 tym  sprzężeniu  mówili  szerzej),  tymczasem  sprzę- 
żenie takie  jest  w praktyce  zawsze  obecne  w cząstecz- 
kach i wobec  tego  przejścia  elektronowe  zakazane 
ze  względu  na  spin  są  jednak  w widmach  obserwo- 
wane (przede  wszystkim  jako  widma  emisyjne).  Po- 
dobnie ma  się  rzecz  z przejściami  zakazanymi  ze 
względu  na  symetrię.  Tę  ostatnią  regułę  wyprowadza 
się  nie  uwzględniając  faktu,  że  wraz  z przejściami 
elektronowymi  wzbudzane  są  również  przejścia  oscy- 
lacyjne, a te  ostatnie  mogą  zmieniać  symetrię.  Mó- 
wiąc inaczej,  nawet  jeśli  reguła  ta  jest  spełniana  w od- 
niesieniu do  prostych  stanów  elektronowych,  to  nie 
musi  być  ona  spełniana  dla  stanów  elektronowo-oscy- 
lacyjnych  (nazywamy  je  stanami  wibronowymi).  Tak 
więc  reguły  wyboru  mają  ograniczony  charakter 

1 wskazują  raczej  na  to,  czy  dla  danego  przejścia 
można  oczekiwać  dużego  czy  małego  natężenia.  Na 
ogół,  jeśli  spróbujemy  porównać  natężenie  przejść 
wzbronionych  z natężeniem  przejść  dozwolonych  i je- 
śli przyjmiemy  natężenie  tego  ostatniego  jako  równe  1, 
to  natężenie  przejść  wzbronionych  ze  względu  na  sy- 
metrię jest  około  10  do  100  razy  słabsze,  a natężenie 
przejść  wzbronionych  ze  względu  na  spin  o około 

10  000  do  1 000  000  razy  słabsze.  strukturą 

Wspomnieliśmy  przed  chwilą,  że  przejściu  elek-  oscylacyjna 
tronowemu  towarzyszy  zmiana  energii  oscylacyjnej,  widm 
a więc  i przejście  oscylacyjne.  Jeżeli  wrócimy  jeszcze  elektrono- 
raz  do  rys.  1 ze  str.  301,  który  ilustrował  różne  po-  wych 
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ziomy  energetyczne  cząsteczki,  to  dojdziemy  do 
wniosku,  że  w trakcie  przejścia  elektronowego  zmie- 
niać się  na  pewno  może  i energia  rotacyjna  cząsteczki. 
Stąd  wniosek,  że  widmo  elektronowe  jest  z reguły 
widmem  złożonym : elektronowo-oscylacyjno-rota- 
cyjnym.  Bez  trudu  chyba  też  uzmysłowimy  sobie  fakt, 
jak  skomplikowane  musi  być  takie  widmo,  w którym 
na  przejście  elektronowe  nałożone  są  dodatkowo 
wszystkie  sytuacje,  które  poznaliśmy  omawiając  wid- 
ma oscylacyjne  i rotacyjne,  i jak  skomplikowana  musi 
być  analiza  takich  widm.  Zdamy  sobie  jeszcze  lepiej 
z tego  sprawę,  kiedy  spojrzymy  na  zdjęcie  (tzw.  spek- 
struktura  trofotogram,  ii.  132,  tabl.  33)  bardzo  niewielkiego, 
rotacyjna  bo  obejmującego  zaledwie  3 nm  wycinka  widma 
widma  ©Bek-  elektronowo-oscylacyjnego  cząsteczki  NCO  z uwidocz- 
tronowego  nioną  strukturą  rotacyjną. 

W praktyce  tak  skomplikowane  widmo  elektrono- 
we z widoczną  strukturą  rotacyjną  jest  obserwowane 
bardzo  rzadko  i tylko  dla  małych  (głównie  dwuato- 
mowych)  cząsteczek.  Gdy  cząsteczka  wieloatomowa 
znajduje  się  w fazie  gazowej  i pod  bardzo  niskim  ci- 
śnieniem, to  przy  bardzo  dużych  zdolnościach  roz- 
dzielczych aparatury,  można  niekiedy  obserwować 
widmo  z wyraźną  strukturą  rotacyjną.  Ponieważ  w 
przeważającej  większości  wypadków  • widma  dużych 
cząsteczek  badane  są  w roztworze  (lub  w fazie  stałej )- 
wobec  tego  widma  absorpcyjne  mają  charakter  sze- 
rokich pasm,  bez  śladów  struktury  rotacyjnej,  z za- 
znaczoną czasem  strukturą  oscylacyjną.  Rys.  29  ilu- 


liczba  falowa  v 

Rys.  29.  Widma  absorpcyjne  cząsteczki  CO(CN)2;  a)  w fazie 
gazowej,  b)  w roztworze 


Rys.  30.  Długofalowe  elektronowe  pasmo  absorpcyjne  cząsteczki 
naftacenu 


struje  zmiany  w wyglądzie  widma  cząsteczki  obserwo- 
wanej wpierw  w fazie  gazowej  a następnie  w roztwo- 
rze. Widać  od  razu,  że  przejście  od  gazu  do  roztworu 
spowodowało  zamazanie  się  większości  szczegółów 
struktury.  W większości  bardzo  dużych  cząsteczek, 
nawet  tak  stosunkowo  dobrze  rozdzielona,  jak  na 
rys.  29,  struktura  oscylacyjna  nie  jest  obserwowana 
w roztworze. 

Przyjrzyjmy  się  jeszcze  raz  rys.  29b.  Widać,  że 
w obrębie  obserwowanego  pasma  elektronowego, 
poszczególne  przejścia  oscylacyjne  mają  różne  na- 
tężenie, jedne  są  bardzo  słabe,  inne  mają  większe  na- 
tężenie, a największe  natężenie  mają  przejścia  oscy- 
lacyjne zgrupowane  w środkowej  części  widma.  Czy 
tak  zawsze  wyglądają  widma  elektronowe?  Otóż  nie. 
Na  rys.  30  pokazane  jest  jedno  z pasm  elektronowych 
cząsteczki  naftacenu.  Widzimy,  że  w tym  wypadku 
największe  natężenie  mają  pasma  oscylacyjne  z lewej 
strony  rysunku,  są  one  silniejsze  niż  pasma  znajdu- 
jące się  w części  centralnej  pasma  elektronowego. 

Czy  taka  informacja  o różnym  rozkładzie  natężeń 
przejść  oscylacyjnych  w obrębie  pasma  elektrono- 
wego ma  dla  nas  jakieś  praktyczne  znaczenie,  czy  mo- 
żemy ją  wykorzystać  do  określenia  jakichś  własności 
podstawowych  cząsteczki,  takich  jak  jej  struktura 
czy  geometria?  Żeby  odpowiedzieć  na  to  pytanie,  za- 
stanówmy się,  jak  w ogóle  powstają  takie  widma, 
i spróbujmy  ustalić  związki  między  obserwowanymi 
widmami  a najprostszymi  parametrami  cząsteczki  (np. 
długością  wiązań).  Zrooimy  to  na  przykładzie  naj- 
prostszym, a mianowicie  dwuatomowej  cząsteczki  AB. 

Z rozważań  nad  oscylacjami  cząsteczek  wiemy  już, 
że  taka  cząsteczka  ma  3 *2— 5 = 1 drganie  normalne, 
przejawiające  się  jako  zmiana  długości  wiązania  A — 2?, 
Wiemy  również,  jaka  może  być  częstość  takiego  drga- 
nia i jaka  jest  odległość  równowagi  re  w stanie  pod- 
stawowym. Wiemy,  że  drgania  cząsteczki  są  skwanto- 
wane  i że  energię  potencjalną  cząsteczki  w podstawo- 
wym stanie  elektronowym  możemy  przybliżyć  pewną 
krzywą,  zwaną  krzywą  energii  potencjalnej  (rys.  31). 


odległość  r 

Rys.  31.  Schematyczny  przebieg  rzeczywistej  krzywej  energii  po- 
tencjalnej cząsteczki  dwuatomowej.  Poziomy  oscylacyjne  zagęsz- 
czają się  wraz  ze  wzrostem  kwantowej  liczby  oscylacyjnej  v 


Krzywa  taka  ma  minimum  przy  odległości  równowa- 
gi re.  Jest  to  odległość,  przy  której  energia  potencjalna 
drgań  jest  równa  zeru,  maksymalna  jest  natomiast 
energia  kinetyczna.  Odwrotnie,  w punktach  na  krzy- 
wej (dla  danego  poziomu  oscylacyjnego)  energia  po- 
tencjalna drgań  jest  maksymalna,  a energia  kinetyczna 
jest  równa  zeru.  Te  punkty  są  punktami  zwrotnymi 
oscylacji  — po  maksymalnym  ściśnięciu  wiązania 
A — B (punkt  po  lewej  stronie  re)  następuje  jego  rozcią- 
ganie, aż  do  wartości  maksymalnej  (po  prawej  stro- 
nie re)y  a następnie  cały  cykl  oscylacji  powtarza  się. 

Co  się  dzieje,  kiedy  cząsteczka  zostaje  wzbudzona 
do  innego,  wyższego  stanu  elektronowego?  Zmienia 
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wpływ  się  rozkład  ładunku  elektronowego  w cząsteczce,  a to 
wzbudzenia  oznacza,  że  zmieniają  się  określone  siły  utrzymujące 
częsteczki  razem  A i B;  mogą  się  one  osłabiać  lub  wzmacniać, 
a to  z kolei  oznacza,  że  długość  wiązania,  a więc  i od- 
ległość równowagi  we  wzbudzonym  stanie  elektro- 
nowym może  ulegać  zmianie  — skróceniu  lub  wy- 
dłużeniu. Mogą  również  zmieniać  się  i inne  cechy 
krzywej  energii  potencjalnej  — może  mieć  ona  inny 
kształt  i inną  głębokość.  To  oczywiście  prowadzić 
może  do  zmiany  częstości  drgań  w stanie  wzbudzo- 
nym i do  innego  rozkładu  poziomów  oscylacyjnych 
w tym  stanie,  w stosunku  do  stanu  podstawowego. 
A zatem  krzywe  energii  potencjalnej  w różnych  sta- 
nach elektronowych  są  różne  i mogą  mieć  różne  po- 
łożenie minimum  (różne  odległości  równowagi), 
a bywa  i tak,  że  w ogóle  nie  mają  minimum.  Jak  się  te 
różnice  odbijają  na  widmach,  zobaczymy  zaraz  na 
przykładach.  Przedtem  jednak  podamy  pewną  za- 
sadę o podstawowym  znaczeniu  dla  teorii  widm.  Za- 
sada ta,  zwana  zasadą  Francka-Condona,  bierze  swój 
początek  z prostego  porównania  czasów,  w jakich 
mogą  przebiegać  pewne  określone  procesy  w czą- 
steczce. I tak  proces  przejścia  elektronowego,  a więc 
proces  przeskoku  elektronu  w obrębie  cząsteczki,  jest 
procesem  bardzo  szybkim  i można  oszacować,  iż 
trwa  on  około  10“ 15  s.  Natomiast  średni  czas  trwania 
oscylacji,  tzn.  czas  w jakim  zmieniają  swe  położenia 
atomy  cząsteczki,  jest  rzędu  10“ 12  s,  a więc  jest  średnio 
tysiąc  razy  dłuższy  niż  czas  przeskoku  elektronowego, 
zasada  Uwzględniając  ten  fakt  zasada  Francka-Condona 
Francka-  stwierdza,  że  w trakcie  przejścia  elektronowego  jądra 
Condona  atomowe  w cząsteczce  nie  zmieniają  w praktyce  ani 
swych  położeń  ani  swoich  prędkości.  Oznacza  to, 
że  spośród  wszystkich  możliwych  przejść  elektrono- 
wo-oscylacyjnych  pomiędzy  dwoma  stanami  elek- 
tronowymi najbardziej  prawdopodobne  są  te  przej- 
ścia, w wyniku  których  nie  zmienia  się  położenie  lub, 
jak  czasem  mówimy,  konfiguracja  jąder,  ani  ich  mo- 
ment pędu. 

Wrócimy  teraz  do  zapowiedzianych  przykładów. 
Rozpatrzymy  trzy  przypadki:  a)  kiedy  odległość 
równowagi  w stanie  wzbudzonym  / jest  taka  sama, 
jak  odległość  równowagi  w stanie  podstawowym 
b)  kiedy  odległość  równowagi  w stanie  wzbudzonym 
r'  jest  większa  niż  odległość  równowagi  w stanie 
podstawowym  r'  i c)  kiedy  r ' jest  mniejsza  od  r". 

Przypadek  a)  ilustruje  rys.  32.  Wiemy,  że  obsa- 
dzenie poszczególnych  poziomów  oscylacyjnych  w sta- 
nie podstawowym  zależy  od  temperatury  i że  w tem- 
peraturach niezbyt  wysokich  w stosunku  do  tempera- 
tury pokojowej  rozkład  obsadzeń  jest  taki,  iż  pra- 
ktycznie wszystkie  cząsteczki  są  w najniższym  stanie 
oscylacyjnym  (o  kwantowej  liczbie  oscylacyjnej 
v"  — 0).  W tej  sytuacji  prawie  wszystkie  przejścia 
elektrono wo-oscylacyjne  ze  stanu  podstawowego 
do  wzbudzonego  stanu  elektronowego  biorą  począ- 
tek ze  stanu  oscylacyjnego  v"  = 0.  Ponieważ,  w myśl 
zasady  Francka-Condona,  przy  przejściu  elektrono- 
wym do  wyższego  stanu  zarówno  odległość  między- 
jądrowa,  jak  też  i prędkość  ruchu  jąder  nie  powinna 
ulegać  wyraźnym  zmianom,  wobec  tego  możliwe  są 
przejścia,  które  zaznaczono  na  rys.  32  linią  pionową 
(lub  tylko  nieznacznie  odchyloną  od  pionu).  Tak 
więc  będzie  to  przede  wszystkim  przejście  do  stanu 
oscylacyjnego  v = 0 górnego  stanu  elektronowego. 
Jest  to  najbardziej  prawdopodobne  przejście.  Inne 
kolejne  przejścia  do  stanów  oscylacyjnych  v'  = 
= 1,  2,  3,  ...  są  coraz  mniej  prawdopodobne,  gdyż 
wymagają  albo  coraz  większej  zmiany  konfiguracji 
jąder  w trakcie  przejścia  (coraz  większe  odchylenie 
strzałek,  wskazujących  przejście,  od  kierunku  pio- 
nowego), albo  dużej  zmiany  pędu  jąder  przy  tej  samej 
konfiguracji,  a na  możliwość  poważniejszyh  zmian 
którejkolwiek  z tych  wielkości  narzuca  ograniczenia 
zasada  Francka-Condona.  Nie  oznacza  to,  że  przej- 
ścia ze  stanu  podstawowego  (z  poziomu  oscylacyj- 
nego v"  = 0)  do  wyższych  poziomów  oscylacyjnych 
W — 1,  2,  3,  ...)  stanu  wzbudzonego  są  absolutnie 
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niemożliwe.  Przejścia  takie  mogą  zachodzić,  ale  ich 
prawdopodobieństwo  w stosunku  do  prawdopodo- 
bieństwa przejścia  z v"  = 0 do  v = 0 jest  bardzo 
małe  i coraz  mniejsze  w miarę  wzrostu  kwantowej 
liczby  oscylacyjnej  w stanie  wzbudzonym  v\  W re- 
zultacie widmo,  które  powinniśmy  zaobserwować 
w rozpatrywanym  przypadku,  powinno  wyglądać  tak, 
jak  to  pokazano  u dołu  rys.  32.  Największe  natęże- 
nie ma  przejście  oscylacyjne  z poziomu  v"  = 0 dol- 
nego stanu  do  poziomu  v'  — 0 stanu  górnego  albo, 
jak  po  prostu  często  mówimy,  przejście  0-0  (przejście 
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Rys.  32.  Lustracja  zasady  Francka- 
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zero-zero).  Natomiast  natężenia  przejść  0-1,  0-2, 
0-3,  ...  bardzo  szybko  maleją. 

W podobny  sposób  możemy  rozpatrzyć  przypadek 

b) ,  kiedy  odległość  równowagi  w stanie  wzbudzo- 
nym jest  większa  niż  w stanie  podstawowym  (rys.  33). 
Również  teraz  przejścia  biorą  swój  początek  przede 
wszystkim  ze  stanu  oscylacyjnego  v"  = 0,  stanu  pod- 
stawowego. Tym  razem  jednak,  zgodnie  z zasadą 
Francka-Condona,  największe  natężenie  ma  przejście 
0-4,  a nie  przejście  0-0  i wobec  tego  widmo  wygląda 
inaczej  niż  poprzednio,  jak  to  widać  u dołu  rysunku. 
Nie  będziemy  analizować  szczegółowo  przypadku 

c) ,  gdy  r'e  < r",  i uzasadniać  wyglądu  obserwowane- 
go wówczas  widma  — rys.  34.  (Czytelnik  sam  już 
doskonale  potrafi  to  w tej  chwili  zrobić.)  Zajmiemy  się 
innym  przykładem,  który  jest  często  obserwowany 
w widmach  cząsteczek.  Ilustruje  go  rys.  35.  Tym  ra- 
zem wzajemne  położenie  krzywych  energii  potencjal- 
nych dwóch  stanów,  pomiędzy  którymi  zachodzi 
przejście  elektronowe,  jest  takie,  że  z dużym,  praw- 
dopodobieństwem mogą  zachodzić  przejścia  prowa- 
dzące do  obszaru  energii  leżącej  powyżej  granicy 
dysocjacji  w stanie  wzbudzonym.  Amplituda  oscy- 
lacji cząsteczki  wzbudzonej  do  takiego  obszaru  energii 
jest  nieskończenie  duża  albo,  mówiąc  inaczej,  wiąza- 
nie ulega  rozerwaniu  i cząsteczka  rozdziela  się  na 
atomy  A i B.  Energia  oscylacji  zamienia  się  na  energię 
kinetyczną  obu  fragmentów  A i B i nie  ma  już  mowy 

0 skwantowanych,  dyskretnych  poziomach  energii 
takiego  układu.  Takie  przejścia  prowadzą  w konse- 
kwencji do  widma  ciągłego,  a ich  rezultatem  jest 
dysocjacja  (fotodysocjacja)  cząsteczki.  Obraz  widma, 
jakiego  wówczas  możemy  się  spodziewać,  pokazany 
jest  na  rys.  35  u dołu. 

Nasze  rozważania  nad  zasadą  Francka-Condona 

1 jej  wykorzystaniem  do  interpretacji  widm  prowa- 
dziliśmy na  przykładzie  cząsteczki  dwuatomowej. 
Jeśli  chodzi  o cząsteczki  wieloatomowe  sytuacja  jest 
bardziej  skomplikowana,  a to  dlatego,  że  liczba  moż- 
liwych rodzajów  oscylacji  (liczba  drgań  normalnych) 
wzrasta  ze  wzrostem  liczby  atomów  w cząsteczce. 
Do  opisu  takich  złożonych  sytuacji  nie  nadaje  się 
dwuwymiarowa  krzywa  energii  potencjalnej,  spo- 
rządzana w funkcji  długości  jednego  wiązania.  Krzy- 
wą taką  należałoby  zastąpić  wielowymiarowymi  po- 
wierzchniami energii  potencjalnej  i taki  prosty,  gra- 
ficzny sposób  analizy,  jaki  powyżej  przeprowadziliś- 
my, przestaje  być  w ogóle  możliwy.  W cząsteczkach 
wieloatomowych  na  strukturę  oscylacyjną  pasma 
elektronowego  składać  się  mogą  przejścia  oscylacyjne 
ze  wzbudzeniem  różnych  rodzajów  oscylacji  (różnych 
drgań  normalnych,  jak  mówiliśmy  przy  omawianiu 
oscylacji  cząsteczek),  o bardzo  różnych  częstościach. 
Taka  właśnie  sytuacja  występuje  w widmie,  które 
pokazano  na  rys.  29,  gdzie  w obrębie  pasma  elektro- 
nowego można  zidentyfikować  dwie  częstości  oscy- 
lacyjne: ok.  1250  cm-1,  związaną  z drganiami  roz- 
ciągającymi w grupie  karbonylowej  C=0  (w  stanie 
wzbudzonym),  i ok.  125  cm-1,  związaną  prawdopo- 
dobnie ze  zmianą  kąta,  jaki  tworzą  ze  sobą  w cząstecz- 
ce dwa  wiązania  — C=N. 

Mimo  licznych  trudności,  zasadę  Francka-Condona 
po  przyjęciu  różnych  uproszczeń  można  zastosować 
także  do  analizy  widm  elektronowych  cząsteczek  wie- 
loatomowych. Dodajmy  jeszcze  dla  uzupełnienia,  że 
zasada  Francka-Condona,  którą  podaliśmy  i oma- 
wialiśmy w jej  klasycznym  sformułowaniu,  ma  rów- 
nież swoje  sformułowanie  w ramach  mechaniki  kwan- 
towej. Z przybliżenia  Borna-Oppenheimera  (-►Che- 
mia kwantowa)  wiemy,  że  funkcje  falowe  stanów  czą- 
steczki można  przedstawić  jako  iloczyn  odpowied- 
nich funkcji  elektronowych  <pe  (zależnych  od  współ- 
rzędnych elektronów  i jąder)  i funkcji  oscylacyjnych 
Xv  (zależnych  tylko  od  współrzędnych  jąder),  tzn. 
y>  = (feXv . Jeżeli  przypomnimy  sobie,  że  natężenie 
przejść  jest  proporcjonalne  do  kwadratu  dipolowego 
momentu  przejścia,  to  korzystając  z tego  faktu  mo- 
żemy napisać,  iż  natężenie  / przejścia  absorpcyjnego 


ze  stanu  oscylacyjnego  %e„  elektronowego  stanu  <pe,f 
do  stanu  oscylacyjnego  %v,  elektronowego  stanu  <pe , 
jest  proporcjonalne  do  \f<pe,R<Pe„  dv\2- 
gdzie  R jest  znanym  już  nam  operatorem  momentu 
dipolowego.  Druga  całka  zawiera  tylko  funkcje  falowe 
stanów  oscylacyjnych  (jest,  jak  mówimy,  całką  na- 
krywania się  tych  funkcji  falowych)  i jest  tym  większa, 
im  większe  jest  nakrywanie  obu  funkcji,  co  ma  z re- 
guły miejsce  właśnie  w punktach  zwrotnych  oscylacji 
(gdzie  amplituda  oscylacyjnych  funkcji  falowych  jest 
największa,  z wyłączeniem  stanu  v = 0;  oscylacyjne 
funkcje  falowe  pokazane  były  na  rys.  16  w artykule 
„Chemia  kwantowa”).  Sformułowanie  to  potwierdza 
wniosek,  że  najbardziej  prawdopodobne  będą  te 
przejścia,  które  zaznaczyliśmy  na  rys.  32-35  pionowo. 

Zasada  Francka-Condona  ma  nie  tylko  duże  zna- 
czenie dla  zrozumienia  postaci  obserwowanego  wid- 
ma i powiązania  tej  postaci  ze  zmianami  podstawo- 
wych parametrów  cząsteczki,  ale  jest  również  ważna 
dla  zrozumienia  wielu  innych  procesów  (o  niektórych 
z nich  będziemy  jeszcze  dalej  mówili),  w których 
udział  biorą  wzbudzone  stany  elektronowo-oscyla- 
cyjne  (nazywane  czasem  stanami  wibronowymi). 

Przedstawiliśmy  tylko  niezbędne  teoretyczne  pod- 
stawy interpretacji  absorpcyjnych  widm  elektrono- 
wych cząsteczek.  Teraz  zajmiemy  się  omówieniem 
niektórych,  często  spotykanych  w praktyce  widm. 


Widma  absorpcyjne 


Pierwszym  i naturalnym  podziałem,  z którego  zresztą 
korzystaliśmy  już  poprzednio,  jest  podział  cząsteczek 
na  małe  (przede  wszystkim  dwuatomowe)  i duże. 
Może  to  brzmieć  nieco  paradoksalnie,  ale  badanie 
i interpretacja  widm  prostych,  dwuatomowych  czą- 
steczek bywa  znacznie  bardziej  złożonym  zagadnie- 
niem niż  badanie  widm  cząsteczek  wieloatomowych. 
Znacznie  mniejsza  liczba  dozwolonych  poziomów 
oscylacyjnych  i rotacyjnych,  ze  stosunkowo  dużą  od- 
ległością między  tymi  poziomami  powoduje,  że  przy 
odpowiednich  warunkach  obserwacji  (w  fazie  gazo- 
wej i przy  dużej  zdolności  rozdzielczej)  widmo  elek- 
tronowe małej  cząsteczki  ujawnia  ogromne  bogactwo 
struktury,  tak  jak  to  mogliśmy  oglądać  na  il.  132 
(tabl.  33).  Interpretacja  takiego  widma,  a więc  przy- 
pisanie poszczególnych  przejść  oscylacyjnych  i rota- 
cyjnych, jest  z reguły  bardzo  żmudnym  przedsięwzię- 
ciem, chociaż  wykonalnym  i dostarczającym  bardzo 
istotnych  informacji  o stałych  siłowych  i rotacyjnych 
stanów  wzbudzonych  i charakterze  sprzężeń  momen- 
tów pędu  w cząsteczce.  Nie  będziemy  się  jednak  zaj- 
mować omawianiem  i interpretacją  takich  widm, 
można  to  bez  trudu  znaleźć  w każdej  książce  traktu- 
jącej o spektroskopii  molekularnej. 

Mówiliśmy  już  o tym,  że  dla  cząsteczek  wieloato- 
mowych konstruowanie  krzywych  energii  potencjal- 
nej w różnych  stanach  elektronowych  jest  w praktyce 
niewykonalne.  Energia  potencjalna  odnosząca  się  do 
danego  stanu  elektronowego  cząsteczki  wieloatomo- 
wej  jest  zależna  od  długości  wszystkich  wiązań  i ką- 
tów między  wiązaniami  i do  zilustrowania  takich 
przypadków  są  potrzebne  nie  krzywe  lecz  wielowy- 
miarowe powierzchnie  energii  potencjalnej.  Niemoż- 
liwa jest  zatem  analiza  widm,  taka  jaką  można  prze- 
prowadzić dla  cząsteczek  dwuatomowych,  ze  szcze- 
gółowym przypisaniem  struktury  oscylacyjnej  i ro- 
tacyjnej, tym  bardziej,  że  struktura  taka  nie  jest  na 
ogół  obserwowana.  Widma  elektronowe  są  szerokimi, 
prawie  pozbawionymi  szczegółów  pasmami.  W tej 
sytuacji  można  tylko  próbować  połączyć  obserwo- 
wane pasma  absorpcyjne  z pewnymi  zmianami  roz- 
kładu ładunku  elektrycznego  w cząsteczce,  a okre- 
ślenie rzeczywistej  struktury  stanu  wzbudzonego  by- 
łoby już  wielkim  osiągnięciem. 

Nasze  rozważania  o widmach  elektronowych  zacz- 
niemy od  widm  cząsteczek  organicznych.  W czą- 
steczkach tych  przejścia  elektronowe  są  przejściami 
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elektronów  walencyjnych  wiązań  pojedynczych  lub 
wielokrotnych,  bądź  też  elektronów  wolnych  par 
elektronowych,  a więc  elektronów  cr,  n lub  n (tzn. 
elektronów  znajdujących  się  na  orbitalach  wiążących 

0 i n lub  na  niewiążącym  orbitalu  n).  W przejściu 
elektronowym  elektrony  te  mogą  być  wzbudzone  do 
antywiążących  orbitali  0*  i n*.  W cząsteczkach  zatem 
mogą  być  obserwowane  pasma  absorpcyjne  związane 
z przejściami  typu  0 -►  cr*,  n -+  n*,  n ->  0*  i n n* 
(odczytujemy  je  jako  sigma-sigma  z gwiazdką,  pi-pi 
z gwiazdką  itd.),  w zależności  od  tego,  jakiego  typu 
elektrony  posiada  cząsteczka:  0 , n czy  n. 

Niekiedy  poważnym  ułatwieniem  przy  interpretacji 
widm  elektronowych  cząsteczek  organicznych  może 
być  występowanie  w cząsteczce  grup  chromoforo- 
wych.  Grupy  chromoforowe  (są  to  zespoły  atomów 

1 wiązań)  mają  swoją  charakterystyczną  absorpcję, 
która  w małym  stopniu  zależy  od  pozostałych  elemen- 
tów cząsteczki  i przez  to  ten  sam  chromofor  wystę- 

gtrujpy  pujący  w różnych  cząsteczkach  może  być  stosunkowo 
ohromofo-  łatwo  zidentyfikowany.  Zajmijmy  się  teraz  nieco  bli- 
rowe  żej  omówieniem  charakteru  widm  pewnych  klas 
związków  i grup  chromoforowych,  próbując  powią- 
zać je  z odpowiednimi  przejściami  elektronowymi, 
ze  zmianami  struktury  elektronowej  cząsteczki  i z 
efektami  uwarunkowanymi  budową  różnych  cząste- 
czek. 

Charakterystyczną  cechą  pewnych  związków  or- 
ganicznych jest  to,  że  wszystkie  wiązania  w cząsteczce 
są  wiązaniami  pojedynczymi.  Do  tej  klasy  związków 
należą  nasycone  węglowodory  — alkany  i cykloal- 
przejście  kany.  Jedynymi  możliwymi  przejściami  elektrono- 
g — * 0*  wymi  w cząsteczkach  takich  związków  są  przejścia 
elektronowe  z wiążących  orbitali  0 na  antywiążące 
orbitale  <r*,  tzn.  przejścia  o ->  o*.  Z przejściami  0-^0* 
związana  jest  stosunkowo  duża  zmiana  energii  elek- 
tronowej cząsteczki  i wobec  tego  widma  elektronowe 
takich  cząsteczek  leżą  daleko  w nadfiolecie  (w  tzw. 
nadfiolecie  próżniowym).  Cząsteczki  związków  nasy- 
conych nie  są  specjalnie  interesujące  ze  spektrosko- 
powego punktu  widzenia,  a badanie  ich  widm  jest 
bardzo  trudne,  ze  względu  na  obszar,  w którym  te 
widma  występują.  Jeżeli  do  cząsteczki  nasyconej 
wprowadzony  zostanie  jakiś  atom  lub  grupa  z wol- 
przejście  nymi  parami  elektronowymi  (elektrony  /i),  to  wów- 
n — > <7*  czas  możliwe  jest  przejście  elektronu  wolnej  pary 
(niewiążącego)  na  anty  wiążący  orbital  cr*,  tzn.  przej- 
ście n — > cr*.  Przejścia  n -►  cr*  mają  niższą  energię  niż 
przejścia  0 <r*  i w widmie  cząsteczki  możemy  wów- 

czas zaobserwować  bardziej  długofalową  absorpcję. 
Węglowodory  nasycone,  chociaż  niezbyt  interesujące 
dla  badacza,  są  bardzo  ważne  w badaniach  spektro- 
skopowych, gdyż  używa  się  ich  jako  rozpuszczal- 
ników, w których  badane  są  widma  innych  związków. 

Znacznie  bardziej  interesujące  są  cząsteczki  za- 
wierające nie  tylko  elektrony  <r,  ale  również  elektro- 
ny 7t  lub  n , bądź  też  jedne  i drugie  jednocześnie.  Czą- 
steczki takie,  to  węglowodory  nienasycone  (np.  alkeny 
i polieny)  i aromatyczne  (oraz  ich  pochodne),  a więc 
cząsteczki,  w których  występują  wiązania  podwójne, 
cząsteczka  Najprostszą  cząsteczką  z wiązaniem  podwójnym 
etylenu  R M 

jest  etylen:  J>C=C<  . W cząsteczce  tej  każdy 

h/ 

z dwóch  atomów  węgla  tworzy  wiązanie  z dwoma  ato- 
mami wodoru  i z drugim  atomem  węgla.  Kąty  po- 
między tymi  wiązaniami  wynoszą  około  120°  i wszy- 
stkie atomy  leżą  w jednej  płaszczyźnie  (cząsteczka 
jest  w stanie  podstawowym  płaska).  Oprócz  elektro- 
nów uczestniczących  w wiązaniu  0 (a  tym  samym  sil- 
nie związanych)  na  każdym  z atomów  węgla  znajduje 
się  po  jednym  elektronie  zajmującym  orbital  atomo- 
wy p , tak  jak  to  zaznaczono  na  rys.  36.  Orbitale 
p są  prostopadłe  do  płaszczyzny  cząsteczki  i oddzia- 
łując ze  sobą  mogą  tworzyć  orbital  molekularny  (po- 
równaj opis  tworzenia  orbitali  molekularnych  z or- 
bitali atomowych  w artykule  „Chemia  kwantowa” 


str.  269).  Jest  to  orbital  molekularny  typu  7r,  a z jego 
powstawaniem  wiąże  się  zmniejszenie  odległości  mię- 
dzy atomami  węgla;  odległość  ta  jest  mniejsza  niż 


Rys.  36.  Kształt  orbitali  w cząsteczce  etylenu:  a)  orbitale  ato- 
mowe j)x  oraz  molekularne:  b)  orbital  wiążący  tz,  c)  orbital  anty- 
wiążący  n* 

wtedy,  gdy  atomy  węgla  związane  są  ze  sobą  tylko 
pojedynczym  wiązaniem  typu  0.  Powstały  orbitał 
molekularny  n ma  kształt  zobrazowany  na  rys.  36b 
i jest  orbitalem  wiążącym,  chociaż  jego  energia  wią- 
zania jest  mniejsza  niż  energia  wiązania  wiązań  0. 
Orbitalowi  wiążącemu  towarzyszyć  musi  jak  zawsze 
orbital  antywiążący  ^*,  a kształt  tego  orbitala  ilu- 
struje rys.  36c.  Obydwa  elektrony  n cząsteczki  obsa- 
dzają niższy  energetycznie  orbital  wiążący.  Najniższe 
energetycznie  przejście  elektronowe  w cząsteczce 
etylenu  związane  jest  ze  wzbudzeniem  elektronu  z 
orbitala  wiążącego  : z do  orbitala  antywiążącego  tt*. 
Jest  to  więc  przejście  typu  n ->  n*. 

Zwróćmy  uwagę  na  to,  że  przejście  elektronowe 
71  7r*  w etylenie  prowadzi  do  zasadniczej  zmiany 

rozkładu  ładunku  elektronowego  w cząsteczce.  W sta- 
nie wzbudzonym  ładunek  zostaje  usunięty  z obrębu 
wiązania  węgiel-węgiel.  Wiązanie  ulega  zatem  osła- 
bieniu i nie  ma  już  charakteru  wiązania  podwójnego, 
jakim  było  w stanie  podstawowym.  Przejściu  elektro- 
nowemu Ti  — > 7i*  w cząsteczce  etylenu  odpowiada  pa- 
smo absorpcyjne  z maksimum  przy  ok.  165  nm  i jest 
to  absorpcja  wywołana  ugrupowaniem  C—C  w czą- 
steczce. 

Ciekawie  przedstawia  się  sytuacja  w cząsteczkach, 
w których  wiązania  podwójne  C=C  tworzą  tzw. 
układ  sprzężony.  W układzie  takim  kolejne  wiązania 
podwójne  rozdzielone  są  wiązaniami  pojedynczymi 
(cząsteczki  takie  nazywamy  polienami).  Najprostszym 
przykładem  jest  cząsteczka  butadienu,  pokazana  na 
rys.  37a,  w której  dwa  wiązania  podwójne  rozdzielo- 
ne są  przez  wiązanie  pojedyncze.  Rozumując  w ten 
sam  sposób,  jak  w przypadku  etylenu,  dochodzimy 


przejście 

n ->  n* 


układ 

sprzężony 
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cząsteczka 

butadienu 


cząsteczka 

likopenu 


Rys.  37.  Cząsteczka  butadienu 
i kształt  jednego  z jej  orbitali 
wiążących 
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do  wniosku,  że  w cząsteczce  butadienu  na  orbitalach 
atomowych  p (atomów  węgla)  znajdują  się  cztery 
elektrony.  Orbitale  molekularne  typu  n,  które  mogą 
powstać  z kombinacji  orbitali  atomowych,  rozcią- 
gają się  na  całą  cząsteczkę,  tak  jak  to  np.  pokazano 
na  rys.  37b.  W rezultacie,  elektrony  n są  zdelokalizo- 
wanc  w całym  układzie  wiązań  sprzężonych.  Okazuje 
się,  że  konsekwencją  delokalizacji  elektronów  n jest 
obniżenie  energii  przejść  7i-+n*,  a więc  i przesuwanie 
się  widma  elektronowego  w stronę  dłuższych  fal. 
Przesunięcie  jest  tym  większe,  im  większy  jest  obszar 
delokalizacji,  tzn.  im  dłuższy  jest  układ  sprzężony. 
Na  przykład  pasmo  absorpcyjne  etylenu  ma 

maksimum  przy  około  165  nm,  a w widmie  butadienu 
maksimum  tego  pasma  leży  przy  około  217  nm. 
W miarę  jak  wydłuża  się  łańcuch  wiązań  sprzężo- 
nych, widmo  przesuwa  się  coraz  dalej  w stronę  wi- 
dzialną. W heksatrienie  (trzy  wiązania-  podwójne 
C=C  w układzie  sprzężonym)  maksimum  pasma 
7t-+7Z*  leży  przy  256  nm,  a w dekatetraenie  (cztery  ta- 
kie wiązania)  przy  310  nm.  Wreszcie  cząsteczka  związ- 
ku zwanego  likopenem,  która  wygląda  tak : 


a w której  można  się  doliczyć  aż  jedenastu  wiązań 
w układzie  sprzężonym,  ma  widmo  z maksimum  pa- 
sma długofalowego  przy  około  470  nm.  Położenie 
pasma  w samym  środku  obszaru  widzialnego  sprawia, 
że  to  właśnie  likopen  nadaje  czerwone  zabarwienie 
pomidorom  i niektórym  owocom  (ii.  18,  tabl.  6). 

Bardzo  ważną  w chemii  klasą  związków,  dla  któ- 
rych charakterystyczna  jest  absorpcja  wywołana 
przejściami  n-+n*,  są  węglowodory  aromatyczne. 

Widma  tych  związków  poznamy  na  przykładzie  naj- 
ważniejszego przedstawiciela  tej  klasy,  a mianowicie 
cząsteczki  benzenu. 

Benzen  ma  sześć  elektronów  n i sześć  orbitali  n — cząsteczka 
trzy  wiążące  i trzy  antywiążące.  Cząsteczkę  tę  do-  benzenu 
kładnie  omówiono  w artykule  „Chemia  kwantowa” 

(str.  280).  W stanie  podstawowym  sześć  elektronów 


Rys.  39.  Widmo  elektronowe  cząsteczki  benzenu  i schemat  jej 
elektronowych  poziomów  energetycznych 
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Rys . 38.  Kształt  wiążących  orbitali  molekularnych  w cząsteczce  benzenu  (przekrój  w płaszczyźnie  cząsteczki ) 
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obsadza  trzy  wiążące  orbitale  n , których  kształt 
z grubsza  ilustruje  rys.  38.  Rozważania  zmierzające 
do  określenia  liczby  przejść  elektronowych  i ich  wła- 
ściwego przypisania  są  w przypadku  cząsteczki  ben- 
zenu znacznie  trudniejsze  niż  w przypadku  etylenu 
czy  butadienu.  Nie  będziemy  tutaj  próbowali  ich 
przeprowadzać,  powiemy  tylko,  że  rozważenie  róż- 
nych możliwych  konfiguracji  elektronowych,  z wy- 
korzystaniem elementów  symetrii  cząsteczki,  prowa- 
dzi do  wniosku,  że  w benzenie  powinny  występować 
trzy  przejścia  typu  n-+7t*  i widmo  absorpcyjne  po- 
winno zawierać  trzy  pasma.  Obserwowane  widmo 
benzenu  i diagram  stanów  przewidywany  przez  teorię 
pokazuje  rys.  39.  Widmo  benzenu  jest  bardzo  cha- 
rakterystyczne i cząsteczka  ta  łatwo  może  być  ziden- 
tyfikowana metodami  spektroskopowymi.  Inne  wę- 
glowodory aromatyczne  mają  również  charaktery- 
styczne widma,  czasem  o wysokim  stopniu  indywi- 
dualności. 

Zarówno  omawiane  przez  nas  wiązanie  podwójne 
C— C w etylenie,  jak  i pierścień  aromatyczny  (pier- 
ścień taki  jak  w cząsteczce  benzenu)  należą  do  wspo- 
mnianych poprzednio  grup  chromoforowych,  tzn. 
grup  posiadających  bardzo  charakterystyczne  widmo 
absorpcyjne  pozwalające  na  stosunkowo  łatwą  ich 
identyfikację  nawet  wtedy,  gdy  wchodzą  w skład  bar- 
dziej złożonych  cząsteczek.  W obu  tych  grupach 
charakterystyczna  absorpcja  związana  jest  z przej- 
ściami Jednak  nie  zawsze  charakterystyczna 

absorpcja  chromoforów  musi  być  związana  ze  wzbu- 
dzeniem elektronów  jr.  Na  przykład  bardzo  często 
spotykaną  w różnych  związkach  grupą  chromoforo- 

wą  jest  grupa  karbonylow-a  ^>C— O,  której  charakte- 
rystyczna absorpcja  wiąże  się  z przejściem  elektro- 
przejście  nowym  typu  tzn.  ze  wzbudzeniem  niewiążą- 

n —>  n*  cych  elektronów  wolnej  pary  elektronowej,  zlokali- 
zowanych przy  atomie  tlenu  O.  Charakterystyczne 
pasmo  absorpcji  n->ri*  grupy  karbonylowej  ma  mak- 
simum przy  ok.  280  nm. 

Charakterystyczna  absorpcja,  umożliwiająca  łatwą 
identyfikację  grup  chromoforowych  i stwierdzenie  ich 
obecności  w cząsteczce,  może  ulegać  zmianom,  cza- 
sem nawet  bardzo  znacznym,  jeżeli  grupa  chromo- 
forowa  silnie  oddziałuje  z innymi  częściami  cząsteczki 
lub  z inną  grupą  chromoforową  obecną  w cząsteczce. 

Widma  cząsteczek,  które  dotychczas  omówiliśmy, 
w celu  uświadomienia  sobie  faktu,  że  widma  elek- 
tronowa wiążą  się  z określonymi  zmianami  w układ- 
dzie  elektronowym  cząsteczki,  tylko  w niewielkim 
stopniu  ukazały  niezwykłą  złożoność  i różnorodność 
sytuacji,  z jakimi  można  się  zetknąć  badając  elektro- 
nowe widma  absorpcyjne  cząsteczek.  Na  przykład 
wpływ  roz-  poważne  zmiany  w widmie  absorpcyjnym  grup  chro- 
puszczalnika  moforowych  i cząsteczek  może  spowodować  roż- 
na widma  puszczalnik,  w którym  znajduje  się  badana  cząstecz- 
ka. Są  one  wynikiem  oddziaływania  rozpuszczonej 
cząsteczki  z otaczającymi  ją  cząsteczkami  rozpusz- 
czalnika i jeżeli  oddziaływania  te  ulegają  zmianom 
w wyniku  wzbudzenia  cząsteczki,  to  widmo  ulega 
przesunięciu.  Widmo  może  przesuwać  się  zarówno 
w stronę  dłuższych,  jak  i w stronę  krótszych  fal. 
Zależy  to  od  polarności  rozpuszczalnika  i cząsteczki 
rozpuszczonej  i od  tego,  jak  zmienia  się  moment  di- 
polowy cząsteczki  po  wzbudzeniu  — rośnie  czy  też 
maleje.  Są  teorie,  na  podstawie  których  można  prze- 
widywać kierunki  przesunięć  widm  związanych  z róż- 
nego typu  przejściami  elektronowymi  w cząsteczce. 
Obserwacja  przesunięć  widma  cząsteczki  w różnych 
rozpuszczalnikach  dostarczyć  może  informacji  o cha- 
rakterze oddziaływań  międzycząsteczkowych  i o tym, 
jak  zmieniają  się  w wyniku  wzbudzenia  różne  wiel- 
kości charakteryzujące  stany  elektronowe  cząsteczki, 
np.  moment  dipolowy. 

Oddziaływania  międzycząsteczkowe  wywołują 
zmiany  widma,  o czym  była  już  mowa  przy  okazji 
rozważań  nad  widmami  w podczerwieni  kompleksów' 
z wiązaniem  wodorowym.  I odwrotnie,  badając  zmia- 
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ny  widm  możemy  stwierdzać  obecność  takich  od- 
działywań i próbować  ustalić  ich  mechanizm,  tzn. 
ustalić  co  z czym  oddziałuje  (np.  czy  cała  cząsteczka, 
czy  też  pewien  jej  fragment)  i jakiego  rodzaju  siły  są 
zaangażowane  w oddziaływaniu. 

Zajmiemy  się  teraz  pewnym  przykładem,  który  zi- 
lustruje nam,  jak  można  dojść  do  ustalenia  charakte- 
ru oddziaływania  międzycząsteczkowego,  badając 
widma.  Od  bardzo  dawna  chemicy  znali  zjawisko  po- 
legające na  tym,  że  jeżeli  cząsteczki  pewnych  róż- 
nych związków  zmiesza  się  razem,  to  mieszanina  taka 
może  nabierać  zabarwienia  niebieskiego,  zielonego, 
czerwonego  itp.,  chociaż  roztwory  obu  substancji 
przed  zmieszaniem  były  zupełnie  bezbarwne.  Wiemy 
jakie  są  związki  pomiędzy  barwą  roztworu,  a jego 
widmem.  Jeśli  wyjściowe  roztwory  były  bezbarwne 
to  znaczy,  że  widma  rozpuszczonych  cząsteczek  leżą 
w nadfiolecie.  Jeżeli  po  zmieszaniu  powstała  miesza- 
nina uzyskała  pewną  barwę  to  znaczy,  że  absorbuje 
ona  teraz  w obszarze  widzialnym.  Moglibyśmy  przy- 
puszczać, że  w wyniku  zmieszania  widma  cząsteczek 
rozpuszczonych  przesunęły  się  po  prostu  w stronę 
dłuższych  fal.  Jednakże  zbadanie  widma  mieszaniny 


Rys.  40.  Widma  absorpcyjne  układu:  czterocyjanoetylen  (akcep- 
tor) i sześć  i o me  tyło  benzen  (donor)  w roztworze  (temperatura 
— 180°C):  1 widmo  absorpcyjne  sześciometylobcnzenu,  2 widmo 
absorpcyjne  czterocyjanoetylenu,  3 widmo  absorpcyjne  roztworu 
czterocyjanoetylen  -f  sześciometylobenzen.  Pasmo  mające 
maksimum  przy  ok.  19  000  cm-1  jest  pasmem  absorpcyjnym 
kompleksu  charge-transfer 


zaprzecza  temu.  Widma  cząsteczek  przed  zmiesza- 
niem i po  zmieszaniu  są  prawie  niezmienione.  Sytu- 
ację tę  ilustruje  rys.  40.  Ale  w mieszaninie  pojawia  się 
nowe  pasmo  absorpcyjne,  które  tak,  jak  się  tego  spo- 
dziewaliśmy, leży  w obszarze  widzialnym,  daleko 
od  widm  składników  mieszaniny.  Pasmo  to  jest  cha- 
rakterystyczne dla  zmieszanego  układu,  tzn.  dla  obu 
rodzajów  cząsteczek  występujących  w mieszaninie, 
np.  zamiana  jednej  z nich  na  inną  spowoduje  poja- 
wienie się  pasma  w całkiem  innym  obszarze.  Mówi- 
my, że  pasmo  to  jest  pasmem  absorpcyjnym  charakte- 
rystycznym dla  oddziałującego  układu.  Dokładne 
badania  pokazały,  że  pewna  liczba  cząsteczek  obu 
związków  tworzy  w mieszaninie  układy,  w których 
obie  cząsteczki  znajdują  się  bardzo  blisko  siebie,  two- 
rząc układ  luźno  związany.  Wzbudzenie  elektronowe 
w takim  układzie  wiąże  się  ze  wzbudzeniem  elektronu 
jednej  z cząsteczek,  ale  elektron  ten  nie  przechodzi 
do  wyższego  stanu  wzbudzonego  tej  cząsteczki,  lecz 
do  wyższego  stanu  wzbudzonego  drugiej  cząsteczki 
(mówiąc  inaczej  jest  przenoszony  z orbitala  mole- 
kularnego pierwszej  cząsteczki  na  nieobsadzony  or- 
bital  molekularny  zlokalizowany  na  drugiej  cząstecz- 
ce). Tak  więc  proces  wzbudzenia  prowadzi  do  prze- 
niesienia ładunku  elektronu  z jednej  cząsteczki  fzwa- 
nej  donorem  elektronu)  do  drugiej  cząsteczki  (zwanej 
akceptorem  elektronu).  Takie  oddziałujące  układy 
nazywa  się  w chemii  kompleksami  z przeniesieniem 
ładunku  (lub  czasem  kompleksami  charge-transfer , 
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od  angielskiej  nazwy  procesu  przeniesienia  ładun- 
ku). Pasma  absorpcyjne  charakterystyczne  dla  tych 
kompleksów  nazywamy  pasmami  absorpcyjnymi 
charge-transfer.  Proces  przenoszenia  ładunku  jest 
procesem  dosyć  powszechnie  spotykanym  wśród 
układów  molekularnych,  a kompleksy  z przeniesie- 
niem ładunku  odgrywają  zapewne  bardzo  poważną 
rolę  m.in.  w procesach  biologicznych.  Właśnie  ba- 
danie widm  tych  układów  pozwoliło  zrozumieć  na- 
turę zjawiska  i własności  takich  kompleksów. 

Możliwość  poznawania  oddziaływań  międzyczą- 
steczkowych  na  podstawie  badania  widm  sprawia,  że 
spektroskopia  molekularna  jest  potężnym  instru- 
mentem poznawania  otaczającego  nas  świata,  gdzie 
większość  zjawisk,  z którymi  stale  się  spotykamy,  jest 
właśnie  wynikiem  oddziaływań  między  różnymi  ele- 
mentami, z których  zbudowani  jesteśmy  my  sami  i to 
co  nas  otacza. 


Stany  wzbudzone  cząsteczek 


cztery  orbitale  molekularne  (w  skali  energii)  hipo- 
tetycznej cząsteczki  — dwa  o niższej  energii,  obsadzo- 
ne przez  cztery  elektrony,  i dwa  nie  zapełnione  (tak 
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Mówiliśmy  do  tej  pory  o widmach  absorpcyjnych, 
a więc  widmach  wywołanych  przejściami  elektrono- 
wymi ze  stanu  podstawowego  do  stanu  wzbudzonego. 
Zastanawialiśmy  się,  jakie  zmiany  w strukturze  ele- 
ktronowej pociąga  za  sobą  przejście,  jak  zmienia  się 
rozkład  gęstości  ładunku  elektronowego  w wyniku 
przejścia  i jak  zmiany  takie  można  odczytać  z obser- 
wacji widma.  Nie  obchodziły  nas  dotychczas  dalsze 
losy  cząsteczki  w stanie  wzbudzonym.  Będzie  to  te- 
matem naszych  dalszych  rozważań. 

Ze  wzbudzeniem  elektronowym  związana  jest  sto- 
sunkowo duża  energia,  np.  absorpcja  promieniowa- 
nia z zakresu  300-400  nm  — wzbogaca  cząsteczkę  o 
ok.  400  do  300  kJ/mol  lub  ok.  4 do  3 eV.  Elektro- 
nowe stany  wzbudzone  są  więc  stanami  o znacznym, 
w stosunku  do  stanu  podstawowego,  nadmiarze  energii 
i należy  się  spodziewać,  że  cząsteczka  nie  będzie  w ta- 
kim stanie  przebywała  zbyt  długo.  Istotnie  doświad- 
czenie pokazuje,  że  średni  czas  w jakim  cząsteczka 
przebywa  w stanie  wzbudzonym  — nazywany  cza- 
sem życia  stanu  wzbudzonego  — jest  bardzo  krótki, 
zazwyczaj  rzędu  10_7-10“9  s. 

Cząsteczka  wzbudzona  może  w różny  sposób  po- 
zbyć się  nadmiaru  energii  i powrócić  do  stanu  podsta- 
wowego. Skoncentrujemy  się  na  sposobie  powrotu 
cząsteczki  do  stanu  podstawowego,  z którym  wiąże 
się  wysłanie  nadmiaru  energii  w postaci  promienio- 
wania elektromagnetycznego  (uprzednio  pochłonię- 
tego). Taki  powrót  nazywa  się  przejściem  promieni- 
stym (lub  dezaktywacją  promienistą),  a jego  rezulta- 
tem jest  emisja  promieniowania  zwanego  najogólniej 
luminescencją.  Końcowym  efektem  takiego  procesu, 
którego  badaniem  może  zająć  się  spektroskopia,  jest 
widmo  emisyjne  — widmo  luminescencji.  Zanim  jed- 
nak zajmiemy  się  nieco  szczegółowiej  widmami  emi- 
syjnymi i tym  co  może  przynieść  ich  badanie,  musimy 
uzupełnić  nasze  wiadomości  o naturze  stanów  wzbu- 
dzonych i procesach  promienistych,  a także  bezpro- 
mienistych. 

Do  badań  stanów  wzbudzonych  cząsteczki  i pro- 
cesów dezaktywacji  (sposobów  i dróg  jakimi  cząstecz- 
ka pozbywa  się  energii  wzbudzenia)  tych  stanów 
potrzebna  jest  znajomość  schematu  stanów  energetycz- 
nych cząsteczki.  Ustalenie  takiego  schematu  jest 
zresztą  jednym  z pierwszych  zadań  i celów  spektro- 
skopii. Schemat  taki,  szczególnie  gdy  chodzi  o wie- 
loatomowe  cząsteczki,  może  być  bardzo  złożony  i na 
ogół  nigdy  nie  jest  w pełni  znany,  ponieważ  nasza 
wiedza  w tym  przedmiocie  ogranicza  się  do  kilku  naj- 
niżej położonych  (o  najniższej  energii)  stanów  wzbu- 
dzonych. Już  z artykułu  „Chemia  kwantowa”  wie- 
my, że  dodatkową  komplikacją  schematu  energetycz- 
nego cząsteczki  jest  występowanie  układów  stanów 
o różnych  multipletowościach.  Przypomnijmy  to  so- 
bie raz  jeszcze  na  prostym  przykładzie  zilustrowanym 
rys.  41.  Na  rysunku  tym  zaznaczono  schematycznie 


Rys.  41.  Schemat  energetyczny  orbitali  molekularnych  i możliwe 
konfiguracje  elektronowe  w stanie  podstawowym  i wzbudzonym 


właśnie  mógłby  wyglądać  schemat  orbitali  cząsteczki  muitSpłeto- 
butadienu).  Strzałki  na  rysunku  symbolizują  orien-  wość  stanów 
tację  spinów  elektronów.  Zgodnie  z zasadą  Pauliego 
w stanie  podstawowym  oba  elektrony  muszą  mieć 
przeciwne  spiny,  co  zaznaczono  przeciwnymi  zwro- 
tami strzałek  (rys.  4 la)  i wobec  tego  wypadkowy  spin 
5 = 0,  a muitipletowość  stanu  jest  25  + 1 = 1 i stan 
podstawowy  jest  stanem  singletowym. 

Wzbudzenie  elektronowe  jest  równoważne  przej- 
ściu jednego  z elektronów  na  wyższy  nie  obsadzony 
orbital.  Mamy  teraz  do  czynienia  z inną  konfiguracją 
elektronową;  jest  to  konfiguracja  stanu  wzbudzone- 
go. Teraz  jednak  zakaz  Pauliego  już  nie  obowiązuje, 
gdyż  oba  elektrony  znajdują  się  na  różnych  prze- 
strzennie orbitalach  i wobec  tego  możliwe  są  dwie 
sytuacje.  Albo  elektrony  będą  miały  spiny  przeciwnie 
(rys.  41b),  albo  też  jednakowo  skierowane  (rys.  41c). 

Przy  pierwszej  ewentualności  wypadkowy  spin  bę- 
dzie, tak  jak  w stanie  podstawowym,  równy  zeru. 

Natomiast  druga  ewentualność  prowadzi  do  wypad- 
kowego spinu  5 = 1 i multiplet owości  stanu  25+ 1 = 

= 3.  Tej  samej  więc  konfiguracji  elektronowej  od- 
powiadają dwa  stany  o różnych  multipletowościach 
— jeden  jest  singletem,  drugi  natomiast  trypletem. 

Z taką  sytuacją  mamy  do  czynienia  w cząsteczkach. 

Z naszego  rysunku  wynika,  że  oba  stany  mają  tę  sa- 
mą energię,  jednak  naprawdę  ich  energia  nie  jest  je- 
dnakowa. To,  że  elektrony  w stanie  trypletowym 
znajdują  się  na  różnych  przestrzennie  orbitalach  spra- 
wia, iż  energia  tego  stanu  jest  z reguły  niższa  niż  stanu 
singletowego  tej  samej  konfiguracji  elektronowej  (do- 
kładnie wyjaśniono  ten  efekt  w artykule  „Chemia 
kwantowa”. 

Spróbujmy  teraz  podać  ogólny  schemat  energe-  schemat 
tyczny  cząsteczki  i zobrazować  na  nim  drogi  powrotu  Jabłońskiego 
ze  stanów  wzbudzonych  do  stanu  podstawowego. 

Taki  schemat  nosi  w spektroskopii  nazwę  diagramu 
(lub  schematu)  Jabłońskiego  (od  nazwiska  wybitnego 
współczesnego  fizyka  polskiego  A.  Jabłońskiego,  któ- 
ry pierwszy  taki  schemat  zastosował  do  wyjaśnienia 
różnych  obserwowanych  widm  emisyjnych). 

Na  diagramie  (rys.  42)  zaznaczono  kilka  pierw- 
szych stanów  z sekwencji  stanów  singletowych  5lt 
>$2ł  *$3  oraz  dwa  pierwsze  stany  Tu  T2  z sekwencji  sta- 
nów trypletowych.  Dla  każdego  z tych  stanów  za- 
znaczono również  kilka  pierwszych  stanów  oscylacyj- 
nych. S0  jest  stanem  podstawowym  cząsteczki.  Ab- 
sorpcja promieniowania  o odpowiedniej  długości  fali 
prowadzi  ze  stanu  50  do  stanów  wzbudzonych  Su  52 
lub  wyższych.  Absorpcja  prowadząca  ze  stanu  50  do 
stanów  Tu  T2,  ...  jest,  o czym  już  wiemy,  procesem 
wzbronionym,  gdyż  wiąże  się  ona  ze  zmianą  spinu. 

Zakaz  ten  jak  wiemy,  nie  jest  zakazem  ścisłym  i w pe- 
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wnych  warunkach  absorpcja  taka  mcże  być  obserwo- 
wana. Jednak  w normalnych  warunkach  nie  można 
jej  na  ogół  zaobserwować. 

singlety  tryplety 


S3 


Rys.  42.  Diagram  Jabłońskiego  stanów  energetycznych  cząsteczki. 
Linie  ciągłe  łączące  różne  stany  odpowiadają  procesom  promie- 
nistym, linie  faliste  - procesom  bczpromienistym 

absorpcja  Absorpcja  promieniowania  może  prowadzić  do 
i emisja  każdego  ze  stanów  wzbudzonych  Su  S2y  S3,  ...,  Sn , 
na  diagramie  ale  emisja  w praktyce  zawsze  bierze  swój  początek 
Jabłońskiego  z najniższego  stanu  wzbudzonego  Su  a do  tego  rów- 
nież z najniższego,  zerowego  stanu  oscylacyjnego 
( v — 0)  tego  stanu  elektronowego.  Dlaczego  właści- 
wie nie  obserwujemy  fluorescencji  z wyższych  stanów 
wzbudzonych?  Nasz  diagram  energetyczny  jest  wpra- 
wdzie przejrzysty,  ale  daleko  odbiega  od  rzeczywistej 
sytuacji  w wieloatomowej  cząsteczce.  Wiemy,  że  ze 
wzbudzeniem  elektronowym  związane  jest  również 
wzbudzenie  oscylacji.  Przypuśćmy,  że  wzbudziliśmy 
naszą  cząsteczkę,  tę,  której  odpowiada  diagram  na 
rys.  42,  do  drugiego  wzbudzonego  stanu  singletowego 
S2  i że  to  wzbudzenie  sięga  do  poziomu  oscylacyjnego 
np.  v = 3.  Nasz  diagram  tego  nie  pokazuje,  bo  cały 
rysunek  stałby  się  nieczytelny,  ale  gdybyśmy  chcieli 
uzupełnić  go  dalszymi  poziomami  oscylacyjnymi  sta- 
nu Sl9  to  okazałoby  się,  że  w okolicy  poziomu  oscyla- 
cyjnego v = 3 w stanie  S2  znalazłoby  się  wiele  pozio- 
mów oscylacyjnych  stanu  S1  (poziomów  o bardzo 
wysokich  liczbach  oscylacyjnych).  Byłoby  ich  tym 
więcej  im  większa  jest  cząsteczka  (pamiętamy,  że 
liczba  drgań  normalnych  rośnie  z liczbą  atomów  w 
cząsteczce).  Gęstość  stanów  oscylacyjnych  stanu  Sx 
(ich  liczba  przypadająca  na  jednostkę  odstępu  ener- 
getycznego, np.  na  1 cm-1)  w okolicy  poziomu  v = 3, 
stanu  S2 , jest  bardzo  duża  — czasem  tak  duża,  że  od- 
stępy między  poszczególnymi  poziomami  oscylacyj- 
nymi są  nierozróżnialne  i poziomy  te  tworzą  pewien 
kwaziciągły  obszar  energii.  Ta  duża  gęstość  stanów 
oscylacyjnych  niższego  stanu  elektronowego  w ob- 
szarach energii  odpowiadających  wyższym  stanom 
elektronowym  stanowi  właśnie  w cząsteczce  „kanał”, 
przez  który  energia  wysokiego  wzbudzenia  elektro- 
nowego (w  naszym  przykładzie  wzbudzenia  do  S2 
i v — 3)  może  zostać  odprowadzona  z wyższeg  owzbu- 
dzonego  stanu  elektronowego  do  niższego  stanu  wzbu- 
dzonego (Si)  i w ten  sposób  „rozdzielona”  miedzy 
różne  oscylacje  tego  stanu.  W ten  sposób  energia 
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wzbudzenia  elektronowego  w wyższym  stanie  zostaje 
szybko  zamieniona  na  energię  oscylacji  w niższym 
stanie. 

W podobny  sposób  przebiegać  może  powrót  czą- 
steczki nie  tylko  ze  stanu  S2  do  Su  ale  również  ze  sta- 
nów wyższych  Sn  do  S1  (przy  pośrednictwie  stanów 
znajdujących  się  pomiędzy  Sn  i Sx).  Ogólnie  rzecz 
biorąc,  każde  wzbudzenie  do  wyższych  stanów  wzbu- 
dzonych kończy  się  w efekcie  tym,  że  cząsteczka  bar- 
dzo szybko  wraca  do  najniższego  poziomu  oscylacyj- 
nego pierwszego  wzbudzonego  stanu  elektronowego 
Sx.  Doświadczenie  pokazuje,  że  prawdopodobieństwo 
takiego  powrotu  z wyższych  stanów  wzbudzonych 
do  pierwszego  stanu  wzbudzonego  jest  bardzo  duże. 

Dodajmy  jeszcze  do  tego,  że  również  bardzo  prawdo- 
podobnym procesem  jest  strata  części  energii  wzbu- 
dzenia podczas  zderzeń  wzbudzonej  cząsteczki  z in- 
nymi cząsteczkami  w ośrodku.  Nie  potrafimy  jednak 
jeszcze  określić,  jaka  część  energii  wzbudzenia  tra- 
cona jest  na  tej  drodze. 

Trochę  inaczej  wygląda  sprawa  przejścia  cząsteczki 
ze  stanu  Sx  do  stanu  podstawowego  S0 . Oczywiście 
i w tym  wypadku  gęstość  stanów  oscylacyjnych  stanu 
S0  w obszarze  zerowego  stanu  oscylacyjnego  stanu  Sx 
jest  ogromna  i moglibyśmy  spodziewać  się  również, 
że  opisany  poprzednio  mechanizm  będzie  i teraz  wy- 
dajny. Rzecz  w tym  jednak,  że  obraz,  który  podaliśmy, 
jest  zbyt  uproszczony.  Gęstość  stanów  oscylacyjnych, 
to  tylko  jeden  z czynników  warunkujących  omawiany 
mechanizm.  Innym  ważnym  czynnikiem,  o którym 
nie  wspominaliśmy  do  tej  pory,  jest  odstęp  energii 
między  poszczególnymi  stanami  elektronowymi.  Otóż 
jeśli  odstęp  ten  jest  duży,  to  nawet  wielka  gęstość  sta- 
nów oscylacyjnych  nie  wystarcza,  aby  zapewnić  wy- 
dajną zamianę  energii  wzbudzenia  elektronowego 
(do  jednego  z wyższych  stanów)  na  energię  oscylacji 
w stanie  niższym.  W cząsteczkach  sytuacja  jest  na 
ogół  taka,  że  odstęp  energetyczny  między  stanem  pod- 
stawowym SQ  a pierwszym  wzbudzonym  stanem  sin-  Przejście 
gletowym  Si  jest  znacznie  większy  niż  pomiędzy  Sx  bczpromieiu- 
i S2  i kolejnymi  wyższymi  stanami  wzbudzonymi.  To  s*e 
właśnie  sprawia,  że  omówiony  mechanizm  jest  znacz- 
nie mniej  wydajny  i ważny  dla  przejścia  S1  S0  niż 
dla  przejść  S2  ^ Si,  S3^>  S2,  itp.  Proces  powrotu  czą- 
steczki z wyższych  stanów  singletowych  do  niższych 
jest  procesem  bardzo  szybkim  i zachodzi  w czasie, 
który  średnio  zawarty  jest  w przedziale  10“X1-10“14  s. 

W porównaniu  z nim  proces  Sx  — > S0  jest  procesem  bar- 
dzo wolnym,  gdyż  charakterystyczny  dla  niego  czas 
jest  rzędu  10“5-10“7s. 

Przejścia  Sn  Sn-i, .. .,  S2  Su  Sx  w*>  SQ  są  przejś- 

ciami, w których  energia  wzbudzenia  tracona  przez 
cząsteczkę  nie  jest  zamieniana  na  energię  kwantów 
promieniowania  elektromagnetycznego.  Takie  przej- 
ścia noszą  ogólną  nazwę  przejść  bezpromienistych 
(oznacza  się  je  czasem  i my  będziemy  się  takiego  ozna- 
czenia trzymali,  liniami  falistymi).  Przejścia  bezpro- 
mieniste  zachodzące  między  stanami  o tej  samej  multi-  konwersja 
pletowości,  jak  w omawianym  przez  nas  wypadku,  wewnętrzna 
nazywają  się  konwersją  wewnętrzną. 

Jakie  mogą  być  dalsze  losy  cząsteczki,  która  po 
wzbudzeniu  znalazła  się,  w wyniku  szybkich  przejść 
bezpromienistych,  w stanie  wzbudzonym  Si?  Wiemy 
już,  że  może  ona  powrócić  bezpromieniście  do  stanu 
podstawowego  S0,  chociaż  proces  takiego  powrotu 
nie  należy  do  zbyt  wydajnych.  Drugą  możliwością, 
którą  teraz  szerzej  się  zajmiemy,  jest  powrót  promie- 
nisty. Jego  rezultatem  jest  emisja  promieniowania 
i takie  właśnie  procesy  prowadzą  do  obserwacji  widm 
emisyjnych.  Emisja  ta  nazywa  się  fłuorescencją.  Sta- 
ranne badania  wykazały,  że  charakterystyczny  czas 
przejść  promienistych,  w większości  badanych  czą- 
steczek, zawiera  się  w granicach  10— 7— 10~a  s.  A zatem  fłuorescencją 
fłuorescencją  może  z powodzeniem  konkurować  z we- 
wnętrzną konwersją  S1^S0  w cząsteczce.  Staje  się 
jednocześnie  zrozumiałym  fakt,  dlaczego  w praktyce 
obserwowana  fłuorescencją  bierze  swój  początek  za- 
wsze ze  stanu  Ą. 


przejśoia  Wewnętrzna  konwersja  S1~*+  S0  i emisja  Si  ->  S0  nie 
między-  są  jedynymi  możliwymi  procesami,  w wyniku  których 
systemowe  opróżniany  jest  wzbudzony  stan  singletowy  Ą.  Na 
rys.  42  zaznaczony  jest  jeszcze  jeden  proces  polegający 
na  bezpromienistym  przejściu  ze  stanu  Si  do  stanu 
trypletowego  Ti.  Przejście  takie,  zwane  przejściem 
międzysystemowym,  przeprowadza  cząsteczkę  do 
stanu  o innej  multipletowości  niż  stan  wyjściowy 
i chociaż  wiemy,  że  przejścia  ze  zmianą  multipleto- 
wości są  na  ogół  bardzo  mało  prawdopodobne,  to 
wbrew  naszym  przypuszczeniom  przejścia  takie  są 
w cząsteczkach  zjawiskiem  dosyć  powszechnym.  Czyn- 
nikiem umożliwiającym  występowanie  przejść  mię- 
dzysystemowych  jest  obecność  tzw.  sprzężenia  spin- 
-orbita.  Jest  ono  rezultatem  oddziaływania  pomiędzy 
momentami  magnetycznymi,  orbitalnymi  i spinowy- 
mi elektronów  w cząsteczce. 

Zanim  zajmiemy  się  bardziej  szczegółowym  omó- 
wieniem widm  fluorescencji  cząsteczek,  zapoznamy 
się  pokrótce  z najważniejszymi  wielkościami  charak- 
teryzującymi emisję  i widma  emisyjne  cząsteczek. 
Wielkości  te  są  zazwyczaj  wyznaczane  w pomiarach 
luminescencyjnych  i stanowią  podstawową  informację 
widmo  o widmie  fluorescencyjnym,  a tym  samym  o stanie 
fluorescencji  wzbudzonym,  z którego  bierze  początek  fluorescencja. 

Pozwalają  one  również  na  ocenę  prawdopodobień- 
stwa zachodzenia  innych  (na  ogół  bezpromienistych) 
procesów  w tych  stanach.  Najważniejszymi  wielko- 
ściami charakteryzującymi  fluorescencję  są:  energia, 
czas  zaniku  i wydajność  kwantowa. 

Spośród  tych  trzech  wielkości  energia  jest  tą,  którą 
wyznacza  się  najłatwiej,  bo  z bezpośredniej  obserwacji 
widma  fluorescencji.  Podobnie  jak  i przy  przejściach 
absorpcyjnych,  również  i dla  przejść  emisyjnych  słusz- 


fluorescencji  odpowiada  oscylacjom  w stanie  podsta- 
wowym, gdyż  przejścia  ze  stanu  wzbudzonego  pro- 
wadzą do  różnych  stanów  oscylacyjnych  stanu  pod- 
stawowego. Zwróćmy  również  uwagę  na  to,  że  przej- 
ście emisyjne  0-0  jest  przejściem  o najwyższej  energii 
w widmie  fluorescencji,  a więc  przejściem  najbardziej 
krótkofalowym.  Z drugiej  strony  przejście  0-0  w wid- 
mie absorpcyjnym  jest  przejściem  najniższej  energii 
(porównaj  rys.  32,  33,  34),  tzn.  najbardziej  długofalo- 
wym w widmie  absorpcyjnym.  W obu  wypadkach 
energia  przejścia  0-0  jest  przynajmniej  teoretycznie 
jednakowa  i wobec  tego  jest  to  jedyne  przejście  wspól- 
ne dla  obu  widm.  A zatem  możemy  oczekiwać,  że 
widmo  fluorescencji  będzie  zawsze  leżało  w obszarze 
bardziej  długofalowym  niż  widmo  absorpcji  (to  spo-  reguła 
strzeżenie  nazywa  się  czasem  regułą  Stokesa,  a prze-  Stokesa 
sunięcie  między  widmem  absorpcji  i fluorescencji  — 
przesunięciem  Stokesa  lub  stokesowskim).  Możemy 
również  spodziewać  się,  że  między  widmem  absorpcji 
i fluorescencji  występować  będzie  zwierciadlana  sy- 
metria, szczególnie  wyraźna  wtedy,  gdy  oscylacje 
cząsteczki  w stanie  podstawowym  i w stanie  wzbudzo- 
nym nie  będą  się  różniły.  Długość  fali  wspólna  dla 
obu  widm  (albo  inaczej  punkt  przecięcia  widm  absor- 
pcji i emisji)  wyznacza  w takich  wypadkach  energię 
przejścia  0-0,  a więc  i odstęp  energetyczny  między 
stanem  podstawowym  i wzbudzonym. 

Oczywiście  nasze  oczekiwania,  jak  zresztą  zawsze, 
dotyczą  przypadków  idealnych,  z którymi  w praktyce 
prawie  nigdy  się  nie  stykamy.  Wspomniana,  symetria 
zwierciadlana  jest  tylko  symetrią  przybliżoną,  a nigdy 
dokładną,  co  widać  na  rys.  44.  Podobnie  w widmie 
cząsteczki  znajdującej  się  w roztworze  przejścia  0-0 
w absorpcji  i emisji  mają  z reguły  inną  energię. 


fe 

odległość  r 


Rys.  43.  Ilustracja  zasa- 
dy Francka-Condona  i 
rozkład  natężeń  w wid- 
mie emisyjnym 


na  i obowiązująca  jest  zasada  Francka-Condona. 
Bez  trudu  zatem  potrafimy  sobie  wyobrazić,  jak 
może  wyglądać  widmo,  jeżeli  tylko  wiemy  jak  wy- 
glądają odpowiednie  krzywe  energii  potencjalnej  sta- 
nu wzbudzonego  i podstawowego.  Znaną  już  nam 
ilustrację  zasady  Francka-Condona  przedstawia  rys. 
43,  tym  razem  jednak  w zastosowaniu  do  procesu 
emisji.  Nietrudno  jest  zrozumieć,  że  sytuacja  taka  jak 
na  rys.  43  prowadzi  do  widma  fluorescencji,  w którym 
największe  natężenie  winno  mieć  pasmo  oscylacyjne 
0-2,  a rozkład  natężeń  w obrębie  całego  pasma  elek- 
tronowego taki  jak  pokazany  u dołu  rysunku.  Zwróć- 
my uwagę  na  fakt,  że  struktura  oscylacyjna  widma 


Rys.  44.  Widmo  absorpcji  i fluorescencji  cząsteczki  antracenu. 

Strzałki  pokazują  położenie  przejścia  0-0  w emisji  (/)  i absorpcji  (2) 

Zajmiemy  się  teraz  czasem  życia  stanu  wzbudzo- 
nego i czasem  zaniku  fluorescencji.  Jeżeli  cząsteczka 
znajduje  się  w stanie  wzbudzonym,  a jedyną  drogą  jej 
powrotu  do  stanu  podstawowego  jest  przejście  pro- 
mieniste (nieobecne  lub  nieaktywne  są  wszelkie  pro- 
cesy bezpromienistej  dezaktywacji),  to  szybkość, 
z jaką  zachodzi  proces  promienisty,  określa  znany 
już  nam  współczynnik  Einsteina  emisji  spontanicznej 
Aji  (przejście  Mówiąc  inaczej  współczynnik  ten 
jest  stałą  szybkości  zaniku  stanu  wzbudzonego  na 
drodze  promienistej,  gdy  nieobecne  są  wszystkie  inne 
konkurencyjne  procesy  dezaktywacyjne  (bezpromie- 
niste).  Odwrotność  stałej  szybkości  jest  naturalnym  promienisty 
czasem  życia  r0  stanu  wzbudzonego  ze  względu  na  czas  życia 
emisję,  albo  jak  często  mówimy  — promienistym 
czasem  życia;  r0  = 1 /Aji.  Wiemy,  że  Aji  jest  pro- 
porcjonalne do  Ba  — współczynnika  absorpcji.  Wo- 
bec tego  bez  trudu  domyślimy  się,  iż  możliwe  jest 
ustalenie  związków  między  naturalnym  czasem  życia 
stanu  wzbudzonego  i wielkościami  charakteryzują- 
cymi przejście  absorpcyjne  do  tego  stanu.  Mamy 
wszelkie  podstawy,  aby  spodziewać  się,  że  własności 
stanu  wzbudzonego  warunkujące  absorpcję  i emisję 
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nie  są  wielkościami  od  siebie  niezależnymi,  lecz  że  są 
współzależne  i że  znając  jedne  potrafimy  określić 
czy  przewidzieć  drugie.  Tak  jest  w istocie.  Można  po- 
dać szereg  związków  łączących  naturalny  czas  życia 
z wyznaczonymi  doświadczalnie  wielkościami  cha- 
rakteryzującymi widma  absorpcyjne.  Na  przykład 
jednym  z takich  związków  jest  poniższa  zależność: 

r0*  3,5108(?2-zrv1/2JSWx)^; 

tutaj  v2  jest  średnią  częstością  pasma  absorpcyjnego, 
^v1/2  — szerokością  połówkową  pasma,  Em^  — 
współczynnikiem  ekstynkcji  w maksimum  pasma. 
Korzystając  z tej  zależności  spróbujemy  oszacować, 
jakiego  rzędu  jest  naturalny  czas  życia  wzbudzonego 
stanu  singletowego  typowej  cząsteczki.  W przypadku 
cząsteczek  organicznych  (np.  węglowodorów  aroma- 
tycznych) ekstynkcja  pasm  dozwolonych,  leżących 
w obszarze  około  30  000  cm-1,  jest  rzędu  ok.  104-105, 
co  przy  typowych  szerokościach  połówkowych  rzędu 
kilku  tysięcy  cm-1  prowadzi  do  wniosku,  że  naturalny 
czas  życia  jest  rzędu  10~8-10“9  s. 

Podana  wyżej  zależność  wykazuje,  że  im  bardziej 
jest  prawdopodobne  jakieś  absorpcyjne  przejście 
elektronowe  (tzn.  im  większe  jest  jego  natężenie),  tym 
krótszy  jest  naturalny  czas  życia  stanu  wzbudzonego 
osiąganego  w wyniku  takiego  przejścia.  Oznacza  to 
z kolei,  że  tym  większa  jest  możliwość,  że  przejście 
odwrotne  ze  stanu  wzbudzonego  do  podstawowego 
będzie  przejściem  promienistym,  a więc  odbywają- 
cym się  z emisją  promieniowania. 

Mówiliśmy  w swoim  czasie  o przejściach  wzbronio- 
nych, wskazując  na  to,  iż  są  one  mało  prawdopo- 
dobne, a więc  mają  bardzo  niskie  natężenie  w porów- 
naniu z natężeniem  przejść  dozwolonych.  Podaliśmy 
liczbę  106  jako  czynnik  wskazujący,  ile  razy  średnio 
niższe  natężenie  mają  przejścia  zakazane  ze  względu 
na  zmianę  multipletowości,  a więc  np.  przejścia 
S0-^TX.  Istotnie  przejścia  absorpcyjne  S0-*/i,  które 
w pewnych  szczególnych  warunkach  można  czasem 
obserwować,  mają  bardzo  małe  natężenie  — współ- 
czynniki ekstynkcji  są  rzędu  10-M0”3.  Nietrudno  jest 
stany  wobec  tego  ustalić,  że  promienisty  czas  życia  stanu 
mstatrwałe  trypletowego  Tu  musi  być  rzędu  10-3  s lub  dłuższy. 

Stany  o tak  długim  promienistym  czasie  życia  nazy- 
wane są  stanami  metatrwałymi.  Zrozumiałe  jest  też, 
że  emisja  z tych  stanów  jest  w normalnych  warunkach 
bardzo  mało  prawdopodobna,  a o konsekwencjach 
takiego  stanu  rzeczy  będziemy  jeszcze  mówić. 

Podkreślmy  raz  jeszcze,  że  promieniste  czasy  życia 
określają  średni  czas  życia  stanu  wzbudzonego  tylko 
i wyłącznie  ze  względu  na  promienisty  powrót  czą- 
steczki z tych  stanów.  Promienisty  czas  życia  może 
być  traktowany  jako  średni  czas  życia  cząsteczki  w 
danym  stanie  wzbudzonym  tylko  wtedy,  gdy  niemoż- 
liwe są  żadne  inne  drogi  powrotu  cząsteczki  do  stanu 
podstawowego.  Obserwowane  wtedy  natężenie  fluo- 
rescencji,  po  przerwaniu  wzbudzenia,  maleje  zgodnie 
z prawem  wykładniczego  zaniku:  I — /0e“*/T°,  gdzie 
I0  jest  początkowym  natężeniem  fluorescencji,  / — 
natężeniem  po  czasie  /,  a r0  — promienistym  (natu- 
ralnym) czasem  życia  stanu.  Po  czasie  t — r0  natę- 
czas  zaniku  żenie  wynosi  / = 70/e,  czyli  zmniejsza  się  e razy. 
fluorescencji  Taki  czas,  po  którym  natężenie  fluorescencj i zmniejsza 
się  e razy,  nazywa  się  czasem  zaniku  fluorescencji. 
Wtedy  gdy  emisja  jest  jedyną  drogą  dezaktywacji 
stanu  wzbudzonego,  czas  zaniku  fluorescencji  jest 
równy  promienistemu  czasowi  życia  stanu. 

Obserwowany  czas  zaniku  fluorescencji  jest  zawsze 
inny  niż  czas  promienisty,  gdyż  całkowita  szybkość 
opróżniania  stanu  wzbudzonego  jest  sumą  szybkości 
wszystkich  procesów,  zarówno  promienistych  jak 
i bezpromienistych,  i wobec  tego  czas  zaniku  fluo- 
rescencji t = 1 /(ke+ki).  Przez  ke  oznaczyliśmy  tutaj 
stałą  szybkości  przejścia  promienistego,  a przez  ki 
sumaryczną  stałą  szybkości  wszystkich  procesów  bez- 
promienistych (konwersji  wewnętrznej,  bezpromieni- 
stego  przejścia  międzysystemowego  itp.).  Ponieważ 
naturalny  czas  życia  jest  równy  r0  = 1 /£«,  wobec  tego 
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czas  zaniku  fluorescencji  jest  zawsze  krótszy  niż  na- 
turalny, promienisty  czas  życia.  Procesy  bezpromie- 
niste  skracają  czasy  zaniku  fluorescencji,  a zatem  ba- 
danie czasów  zaniku  fluorescencji  w funkcji  różnych 
czynników  zewnętrznych  lub  wewnętrznych  może  być 
źródłem  informacji  o procesach  dezaktywacyjnych. 

Poświęćmy  teraz  trochę  uwagi  trzeciej  wielkości  wydajność 
charakteryzującej  fluorescencj  ę.  Jest  nią  wydajność  kwantowa 
kwantowa  fluorescencji,  którą  definiuje  się  jako:  fluorescencji 

•wydajność  kwantowa  _ liczba  kwantów  wyemitowanych 
fluorescencji  liczba  kwantów  zaabsorbowanych 

Jeżeli  jedyną  możliwą  drogą  opróżniania  stanu  wzbu- 
dzonego byłyby  przejścia  promieniste,  to  oczywiście 
każdemu  kwantowi  zaabsorbowanemu  w układzie 
odpowiadałby  kwant  wyemitowany  i wydajność  kwan- 
towa byłaby  równa  1.  Ponieważ  jednak  w praktyce 
z taką  sytuacją  nigdy  nie  mamy  do  czynienia,  wobec 
tego  i wydajność  kwantowa  fluorescencji  jest  zawsze 
mniejsza  od  jedności.  Można  pokazać,  że  wydajność 
kwantowa 


ke+ki  ’ 

gdzie  key  tak  jak  poprzednio,  jest  stałą  szybkości 
przejścia  promienistego,  a ki  — sumaryczną  stalą 
szybkości  wszystkich  procesów  bezpromienistych. 

Możemy  teraz  ustalić  związki  pomiędzy  wydajno- 
ścią kwantową,  a czasem  zaniku  fluorescencji  r i pro- 
mienistym czasem  życia.  Jeśli  wykorzystamy  podane 
poprzednio  zależności,  to  znajdziemy,  że 

0 = ke r lub  0 — t/t0. 

Zauważyliśmy  już  na  pewno,  że  pomiar  czasu  za- 
niku i wydajności  kwantowej  fluorescencji  pozwala 
na  wyznaczenie  stałych  szybkości  ke  i ki.  Niestety, 
ani  pomiary  czasu  zaniku,  ani  pomiary  wydajności 
kwantowych  nie  są  doświadczalnie  łatwe  i wymagają 
stosowania  specjalnych,  czasem  bardzo  precyzyjnych 
technik  pomiarowych.  Dlatego  też,  chociaż  obserwacja 
i badanie  widm  fluorescencyjnych  jest  na  ogół  zada- 
niem niezbyt  skomplikowanym  (ale  niekoniecznie 
łatwym),  to  uzyskanie  pełnego  obrazu  mechaniz- 
mów i procesów  zachodzących  w stanach  wzbudzo- 
nych cząsteczek  jest  zadaniem  bardzo  trudnym  i nie 
zawsze  do  końca  wykonalnym. 

Jak  wynika  z rys.  42,  stan  Sx  może  dezaktywować  się 
nie  tylko  na  skutek  przejścia  promienistego  (fluore- 
scencji) oraz  wewnętrznej  konwersji,  ale  również 
w wyniku  przejścia  bezpromienistego  do  stanu  try- 
pletowego Tx.  Wspominaliśmy  już,  że  z przejściem 
tym,  zwanym  przejściem  międzysystemowym,  zwią- 
zana jest  zmiana  multipletowości  (spinu).  I chociaż 
przejścia  ze  zmianą  multipletowości  są  przejściami 
o bardzo  małym  prawdopodobieństwie,  to  jednak 
w wyniku  sprzężenia  spin-orbita  są  one  silnie  wzmac- 
niane. Okazuje  się,  że  w wieloatomowych  cząstecz- 
kach przejścia  Sx  w**  Tx  mogą  nawet  konkurować 
z fluorescencj ą i przewyższać  swoją  szybkością  proces 
konwersji  wewnętrznej  S,  ^ S0.  Typowe  stałe  szyb- 
kości ki sc  przejść  Sx  Tx  są  rzędu  106-107  s_1. 
A więc  istotnie  jest  to  jeszcze  jeden  ważny  sposób 
dezaktywacji  bezpromienistej  stanu  singletowego  Sx. 
Fakt  ten  ma  bardzo  ważne  i interesujące  konsek- 
wencje i te  za  chwilę  poznamy. 

W wyniku  przejścia  bezpromienistego  Sx  w*>  Ti 
cząsteczka  przechodzi  do  wzbudzonego  stanu  tryple- 
towego. Innym  sposobem  osiągnięcia  stanu  Tx  byłaby 
bezpośrednia  absorpcja  promieniowania  przez  czą- 
steczkę w stanie  podstawowym  S0  z przejściem  S0->TX. 
Wyjaśniliśmy  już  poprzednio,  że  przejście  takie  ma 
znikomo  małe  natężenie  w porównaniu  z przejściami 
dozwolonymi,  a nawet  w porównaniu  z przejściami 
wzbronionymi,  np.  ze  względu  na  symetrię.  Oczywi- 
ście jeśli  istnieje  sprzężenie  spin-orbita  w cząsteczce 
przejście  S0-*TX  ladzie  wzmacniane  i moglibyśmy 
oczekiwać,  że  będzie  ono  wzmacniane  w takim  samym 


stopniu,  jak  przejście  S1~*  Tx.  Tak  jednak  nie  jest, 
gdyż  i w tym  wypadku  istotną  rolę  w wielkości  wzmoc- 
nienia przejścia  odgrywa  wspomniany  już  przez  nas 
czynnik  odstępu  energetycznego  pomiędzy  oddziału- 
jącymi stanami.  Odległość  między  S0  i Tx  jest  z reguły 
dużo  większa  niż  odległość  między  Sx  i 7\  i to  wła- 
śnie sprawia,  że  oba  przejścia  nie  są  jednakowo  praw- 
dopodobne. 

Moglibyśmy  zapytać  się,  czy  ta  różnica  ma  jakieś 
istotne  następstwa?  Otóż  tak,  różnica  ta  ma  konsek- 
wencje natury  praktycznej.  Bardzo  małe  prawdopo- 
dobieństwo absorpcji  So-^-Ty  sprawia,  że  w ten  spo- 
sób właściwie  nie  można  osiągnąć  stanu  trypletowego ; 
oczywiście  w zbiorze  cząsteczek  stan  trypletowy  jest 
osiągalny  w wyniku  absorpcji  S0->Tlf  ale  procent 
ogólnej  liczby  cząsteczek  wzbudzonych  w ten  sposób 
do  stanu  Tx  jest  znikomo  mały  — nie  do  wykrycia 
zwykłymi  metodami.  Mówimy,  że  obsadzenie  (po- 
pulacja) stanu  Tx  osiągane  w ten  sposób  jest  niemie- 
rzalnie małe.  Skoro  tak,  to  pozostaje  nam  ewentual- 
nie próba  osiągnięcia  stanu  trypletowego  w bardziej 
skomplikowany  sposób,  a więc  przez  wzbudzenie 
cząsteczek  do  stanu  singletowego  Sx  (lub  wyższego) 
w nadziei,  że  przejście  bezpromieniste  Tx  bę- 

dzie procesem  na  tyle  wydajnym,  ażeby  liczba  czą- 
steczek przechodzących  do  stanu  Tx  stanowiła  znaczny 
procent  ogólnej  liczby  cząsteczek  wzbudzonych.  Tak 
też  jest  w istocie.  Zaproponowany  przez  nas  sposób 
osiągania  znacznego  obsadzenia  stanu  trypletowego 
jest  realizowany  w cząsteczkach  i stanowi  właściwie 
jedyny  sposób  obsadzania  stanu  trypletowego. 

Cząsteczka,  która  znalazła  się  w stanie  trypleto- 
wym  TXf  ma  teraz  do  wyboru  zasadniczo  dwa  sposoby 
opuszczenia  tego  stanu.  Może  tego  dokonać  albo  przez 
przejście  promieniste  Tx-+S0  albo  przejście  bezpro- 
mieniste Tx  SQ.  Przejściu  promienistemu  towarzyszy 
oczywiście  emisja.  Jest  to  jednak  emisja  różna  od 
znanej  nam  już  fluorescencji  i dla  odróżnienia  od  niej 
fosfores-  nazywana  fosforescencją.  Po  pierwsze  jest  ona,  jak 
cencja  wynika  ze  schematu  energetycznego  cząsteczki  (rys. 
42),  bardziej  długofalowa  niż  fluorescencja.  Po  drugie, 
mówiąc  o czasach  życia  stanów  wzbudzonych  doszli- 
śmy do  wniosku,  że  dla  stanu  trypletowego  czas  ten 
jest  znacznie  dłuższy  niż  dla  stanu  singletowego. 
Oczywiście  i czas  zaniku  fosforescencji  będzie  wobec 
tego  znacznie  dłuższy  od  czasu  zaniku  fluorescencji. 
Czas  ten,  przez  analogię  do  czasu  zaniku  fluorescencji, 
możemy  wyrazić  jako  Tj,  = 1 j(kp  Ą-kd),  gdzie  tym  razem 
kp  jest  stałą  szybkości  przejścia  promienistego  Tx-+S0y 
a ka  — stałą  szybkości  przejścia  bezpromienistego 
Tx  S0.  Dosyć  trudno  jest  podać  typowe  czasy  za- 
niku fosforescencji,  a to  dlatego,  że  są  one  bardzo  za- 
leżne od  warunków  zewnętrznych.  Na  przykład  czas 
zaniku  fosforescencji  cząsteczki  naftalenu  może  zmie- 
niać się  blisko  milion  razy  w zależności  od  tego,  w ja- 
kim ośrodku  fosforescencją  jest  obserwowana.  W 
ośrodku  ciekłym,  w temperaturze  pokojowej,  może 
on  być  rzędu  10“ 5 s,  a w ośrodku  usztywnionym  (w  tak 
zwanym  szkliwie  niskotemperaturowym,  które  uzy- 
skuje się  przez  ochłodzenie  mieszaniny  pewnych  wę- 
glowodorów do  temperatury  ciekłego  azotu,  tj.  do 
77  K)  może  sięgać  2 s.  Te  ogromne  zmiany  czasu  za- 
niku wynikają  głównie  z tego,  że  promienisty  czas 
życia  stanu  trypletowego  jest  długi  i wobec  tego  stan 
ten  może  ulegać  dezaktywacjom  bezpromienistym 
w wyniku  zderzeń  z cząsteczkami  ośrodka  i taka  deza- 
ktywacja — bardzo  wydajna  w ośrodku  ciekłym  — 
może  być  w znacznym  stopniu  zahamowana  w ośrod- 
ku usztywnionym,  gdzie  cząsteczki  nie  mają  swobody 
ruchu.  Konsekwencją  takiego  stanu  rzeczy  jest  fakt, 
że  fosforescencji  — w odróżnieniu  od  fluorescencji  — 
nie  można  w praktyce  zaobserwować  w ośrodkach 
ciekłych,  można  ją  dopiero  zaobserwować  w ośrod- 
kach usztywnionych.  Na  rys.  45  dla  ilustracji  naszych 
wywodów  pokazano  schematy  energetyczne  dwóch 
różnych  cząsteczek,  podano  wartości  stałych  szyb- 
kości różnych  procesów  promienistych  i bezpromie- 
nistych,  a także  widma  fluorescencji  i fosforescencji. 


Patrząc  na  ten  rysunek,  można  zadać  pytanie,  w ja- 
ki sposób  wyznaczono  te  wszystkie  stałe  szybkości. 
Sprawa  niestety  nie  jest  prosta  i uzyskanie  pełnego 


Si  [n,  n*) 


Rys.  45.  Schemat  poziomów  i widmo  emisji:  a)  cząsteczki  chlo- 
ronaftalenu;  stała  szybkość  przejścia  bezpromienistego 
jest  tylko  nieco  większa  od  stałej  szybkości  przejścia  promieni- 
stego Si  — ► S0  i w widmie  emisji  można  obserwować  zarówno 
fluorescencję  jak  i fosforescencję — pasmo  ok.  20  000  cm-1; 
b)  cząsteczki  benzofenonu ; stała  szybkości  przejścia  bezpromie- 
nistego Tx  jest  blisko  10  000  razy  większa  niż  stała  szybkości 
przejścia  promienistego  Sx  — > 50  i dla  tej  cząsteczki  w ogóle  nic 
obserwuje  się  fluorescencji,  jej  emisja  — to  wyłącznie  fosfore- 
s cencja 


obrazu  procesów  zachodzących  w stanach  wzbudzo- 
nych jest  rzeczą  raczej  dosyć  trudną,  a czasem  wręcz 
niemożliwą.  Podstawowe  informacje  uzyskuje  się 
oczywiście  z pomiarów  czasów  zaniku  fluorescencji 
i fosforescencji  oraz  z pomiarów  ich  wydajności  kwan- 
towych. Dla  fosforescencji,  tak  jak  i dla  fluorescencji,  wydajność 
można  zdefiniować  wydajność  kwantową,  chociaż  kwantowa 
tym  razem  odpowiednie  wyrażenie  będzie  bardziej  fosforescen- 
złożone  i będzie  musiało  zawierać  również  stalą  szyb-  cji 
kości  przejścia  bezpromienistego  Sx  ^ Tu  w wyniku 
którego  obsadzone  są  tryplety.  Oczywiście  uzyskane 
z pomiarów  czasów  zaniku  i wydajności  informacje 
są  na  ogół  niewystarczające  i trzeba  się  uciekać  do 
innych  pomiarów  pomocniczych,  bądź  też  czynić  róż- 
ne założenia  upraszczające  problem.  Dodatkowe  kom- 
plikacje wynikają  z faktu,  że  nasze  schematy  obrazują 
cząsteczkę  izolowaną.  W rzeczywistości  cząsteczka 
występuje  zawsze  w pewnym  otoczeniu,  z którym 
w mniejszym  lub  większym  stopniu  oddziałuje.  Te 
oddziaływania  wywołują  różne  procesy  (o  niektórych 
z nich  będziemy  jeszcze  mówili),  które  znakomicie 
komplikują  podany  schemat  dezaktywacji.  Chcąc 
uwzględnić  te  dodatkowe  procesy  musimy  wprowa- 
dzić do  naszego  schematu  opisujące  je  dodatkowe 
stałe  szybkości  (oczywiście  musimy  sobie  przedtem 
zdawać  sprawę  z tego,  jaki  jest  mechanizm  tych  pro- 
cesów— jak  one  przebiegają).  Nakreślony  obraz  jest 
zapewne  zniechęcający,  ale  naprawdę  nie  jest  aż  tak 
źle  i w wielu  wypadkach  potrafimy  poradzić  sobie 
z rozwikłaniem  tych  problemów,  jeśli  nawet  niezu- 
pełnie ściśle,  to  na  ogół  z dokładnością  wystarczającą 
do  wyrobienia  sobie  poglądu  na  to,  co  się  dzieje  i co 
może  się  dziać  ze  wzbudzoną  cząsteczką.  Niestety,  nie 
będziemy  tutaj  mogli  przedstawić  różnych  metod 
eksperymentalnych  i sposobów  postępowania,  za  po- 
mocą których  rozwiązuje  się  tego  typu  problemy; 
wszystkich,  którzy  pragną  osiągnąć  wyższy  stopień 
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wtajemniczenia  odsyłamy  do  literatury  tego  przed- 
miotu, podanej  na  końcu  tego  rozdziału. 

Fluorescencja  biorąca  swój  początek  ze  stanu  sing- 
letowego  Sy  i fosforescencja  biorąca  początek  ze 
stanu  trypletowego  Tx  nie  wyczerpują  problemu  pro- 
fluorescencja  cesów  emisyjnych,  z jakimi  można  się  spotkać  w czą- 
opóźniona  steczce.  Czasem  można  zaobserwować  emisję,  któ- 
rej mechanizm  jest  bardziej  złożony  niż  poznane  do- 
tychczas. Opisując  różne  przejścia  promieniste  i bez- 
promieniste  pominęliśmy  bowiem  jeszcze  jedną  moż- 
liwość, polegającą  na  przejściu  odwrotnym  Tx  Sy. 
Ponieważ  stan  Ty  ma  niższą  energię  niż  stan  Su  przej- 
ście takie  wymaga  dodatkowej  energii,  która  musi 
być  dostarczona  cząsteczce  z zewnątrz,  np.  w wyniku 
zderzenia  z cząsteczkami  ośrodka.  Przejście  takie  wy- 
maga, jak  mówimy,  pewnej  energii  aktywacji.  Jeżeli 
odstęp  pomiędzy  stanami  Sx  i Tx  nie  jest  zbyt  duży, 
to  energia  ruchów  cieplnych  w ośrodku  może  okazać 
się  wystarczająca  do  zaktywizowania  przejścia  Sy. 

W ten  sposób  cząsteczka  znajdzie  się  z powrotem 
w stanie  Sl9  a stąd  może  powrócić  do  stanu  podsta- 
wowego, np.  w wyniku  przejścia  promienistego,  emi- 
tując oczywiście  promieniowanie.  Ciąg  procesów  pro- 
wadzących do  takiej  emisji  jest  następujący:  absorpcja 
S0  -+  bezpromieniste  przejście  Sy  ^ Tx,  przej- 
ście aktywowane  termicznie  Tx»~+  Sx  i wreszcie  emi- 
sja Si  ->  S0.  Widmo  takiej  emisji  pokrywa  się  z wid- 
mem fluorescencji,  ale  między  tymi  dwoma  rodzajami 
emisji  jest  istotna  różnica.  Cząsteczka,  która  przeby- 
wała w stanie  trypletowym  i powróciła  do  stanu  sing- 
letowego,  przebywała  w stanie  wzbudzonym  (a  ści- 
ślej w dwóch  stanach  wzbudzonych)  znacznie  dłużej 
niż  cząsteczka,  która  powróciła  do  stanu  podstawo- 
wego bezpośrednio  ze  wzbudzonego  stanu  singleto- 
wego.  A zatem  czasy  zaniku  obu  fluorescencji  są  inne. 
Dlatego  też  emisja,  o której  mówimy,  nazywa  się 
fluorescencją  opóźnioną,  a jej  czas  zaniku  jest  okre- 
ślony przez  czas  życia  stanu  trypletowego. 

Poznaliśmy  różne  typy  emisji  prowadzące  do  róż- 
nych widm  emisyjnych  w cząsteczkach.  Poznaliśmy 
również  różne  procesy  bezpromieniste  konkurujące 
z emisją,  bądź  też  czasem  umożliwiające  jej  obser- 
wację (jak  to  się  dzieje  z obserwacją  fosforescencji 
i przejściem  bezpromienistym  Si  **+  Ti).  Oczywiście, 
to  czy  dla  danej  cząsteczki  można  obserwować  fluo- 
rescencję  czy  fosforescencję,  czy  też  obie  jednocze- 
śnie, a także  czy  nie  można  ich  w ogóle  obserwować, 
zależy  przede  wszystkim  od  budowy,  struktury  elek- 
tronowej cząsteczki  i innych  naturalnych  czynników, 
takich  jak  np.  sprzężenie  spin-orbita,  które  możemy 
określić  ogólnym  mianem  — własności  cząsteczki. 
Zdajemy  sobie  również  sprawę,  że  bardzo  /ażną  rolę 
w obserwacji  widm  emisji  cząsteczek  o 'grywają  wła- 
sności ośrodka,  które  mogą  zarówno  wzmacniać,  jak 
i osłabiać  emisję.  Znając  naturalne  własności  cząstecz- 
ki i ośrodka,  w którym  się  znajduje,  możemy  przewi- 
dywać, jak  wygląda  emisja  i jej  podstawowe  para- 
metry, takie  jak  czas  zaniku  i wydajność.  I odwrotnie, 
badając  widma  emisyjne  i ich  parametry  możemy 
wnioskować  o budowie  i własnościach  cząsteczki 
(a  także  i ośrodka,  w którym  cząsteczka  się  znajduje) 
oraz  o ewentualnych  oddziaływaniach  międzycząstecz- 
kowych.  Dlatego  też  na  zakończenie  naszych  roz- 
ważań podamy  przykład  takich  oddziaływań,  o któ- 
rych można  wnioskować  na  podstawie  badania  widm 
emisji. 

fluores-  Zacznijmy  od  przykładu,  który  ilustruje  rys.  46. 
cencja  Rysunek  ten  przedstawia  zmiany,  jakim  ulega  widmo 
pyrenu  fluorescencji  pyrenu,  wtedy  gdy  zmieniane  jest  stęże- 
nie pyrenu  w roztworze.  Gdy  stężenie  pyrenu  jest 
stosunkowo  niskie,  wówczas  jego  widmo  fluorescencji 
jest  takie,  jak  widmo  4 na  rys.  46.  Kiedy  stężenie  py- 
renu w roztworze  wzrasta  (kolejne  widma  5,  2 i 1) 
natężenie  tego  pasma  fluorescencji  maleje,  a jednocze- 
śnie pojawia  się  nowe  pasmo  fluorescencji,  bardziej 
długofalowe  i pozbawione  struktury  oscylacyjnej.  Na- 
tężenie tego  drugiego  pasma  wzrasta  w miarę  wzrostu 
stężenia,  a natężenie  pierwotnego  pasma  maleje.  Mó- 
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wimy,  że  fluorescencja  ta  jest  wygaszona,  co  możemy 
dokładnie  prześledzić  na  przykładzie  widm  5,  2y  1 
na  rysunku.  Dodajmy  jednocześnie,  że  w widmie 


Rys.  46.  Widmo  pyrenu  w roztworze  w różnym  stężeniu:  4 ni- 
skie stężenie  pyrenu,  3,  2 , 1 stężenie  coraz  większe.  Pozbawione 
struktury  pasmo  o maksimum  przy  ok.  470  nm  jest  pasmem 
fluorescencji  ekscimerów 


absorpcji  nie  obserwuje  się  żadnych  zmian  przy  zmia- 
nach stężenia.  Co  jest  przyczyną  obserwowanych 
zmian  widma  fluorescencji?  Może  i tutaj,  tak  jak 
w przypadku  kompleksów  z przeniesieniem  ładunku, 
mamy  do  czynienia  z powstawaniem  kompleksów. 

Otóż  tak  jest  w istocie,  ale  są  to  innego  rodzaju  kom- 
pleksy. Brak  zmian  widma  absorpcji  świadczy  o tym, 
że  kompleksy  te  nie  mogą  być  tworzone  w stanie  pod- 
stawowym, innymi  słowy,  cząsteczki  pyrenu  w stanie 
podstawowym  nie  oddziałują  ze  sobą  wzajemnie, 
a ściślej  mówiąc  siły,  z jakimi  na  siebie  oddziałują, 
są  tak  słabe,  że  nie  prowadzą  do  wytworzenia  kom- 
pleksu w stanie  podstawowym.  Kompleksy  takie  po- 
wstają jednak  w stanie  wzbudzonym,  o czym  właśnie 
świadczą  obserwowane  zmiany  w widmie  fluorescencji. 

Dokładne  badania  ujawniły,  że  kompleksy  te,  zwane 
ekscimerami,  powstają  w rezultacie  oddziaływania 
dwóch  cząsteczek  pyrenu — jednej  wzbudzonej,  dru- 
giej niewzbudzonej.  Nie  będziemy  tutaj  dociekali  cha- 
rakteru takich  oddziaływań  i bez  ich  znajomości  po- 
trafimy zrozumieć,  dlaczego  do  utworzenia  ekscimeru 
i zaobserwowania  zmian  w widmie  potrzebne  jest 
duże  stężenie  cząsteczek  w roztworze.  Aby  mógł  po- 
wstać ekscimer  z dwóch  cząsteczek,  z których  jedna  ekscimery 
jest  wzbudzona,  a druga  znajduje  się  w stanie  pod- 
stawowym, obie  cząsteczki  muszą  znaleźć  się  do- 
statecznie blisko  jedna  od  drugiej.  Przy  tym  spotkanie 
takie  musi  nastąpić  w czasie  krótszym  niż  czas  życia 
wzbudzonej  cząsteczki  (a  jest  on  w tym  wypadku  rzę- 
du 3 * 10“7  s).  Jest  rzeczą  zrozumiałą,  że  im  więcej  jest 
cząsteczek  w roztworze,  tym  większa  jest  szansa,  że 
w tak  krótkim  czasie  cząsteczką  wzbudzona  natrafi 
na  cząsteczkę  niewzbudzoną,  bądź  odwrotnie,  i po- 
wstanie wzbudzony  kompleks  — ekscimer,  którego 
jedną  z własności  jest  to,  że  najniższy  stan,  z które- 
go zachodzi  emisja,  ma  niższą  energię  niż  wzbu- 
dzony stan  singletowy  swobodnej  cząsteczki  pyre- 
nu. Stąd  też  fluorescencja  ekscimeru  jest  zawsze 
bardziej  długofalowa  niż  fluorescencja  cząsteczki 
pyrenu  (ta  ostatnia,  w kontekście  omawianych 
kompleksów',  nazywana  jest  czasem  fluorescencją 
monomerową). 

Znamy  wiele  cząsteczek,  które  mogą  tworzyć  kom- 
pleksy w stanie  wzbudzonym.  Okazuje  się  ponadto, 
że  kompleksy  takie  mogą  być  również  tworzone  po- 
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między  różnymi  cząsteczkami,  z których  jedne  są 
wzbudzone,  a drugie  w stanie  podstawowym.  Takie 
kompleksy  nazywane  są  heteroekscimerami  lub  eks- 
cipleksami.  I w takich  przypadkach  obserwujemy  wy- 
gaszanie widma  fluorescencj  i jednej  z cząsteczek,  przy 
wzroście  stężenia  drugiej  cząsteczki  (nie wzbudzonej) 
w roztworze,  z jednoczesnym  pojawieniem  się  nowego 
pasma  fluorescencj  i — fluorescencj  i kompleksu. 

Na  zakończenie  wspomnimy  jeszcze  o pewnej  nie- 
zwykle ważnej  kategorii  zjawisk,  które  są  przedmio- 
tem badań  spektroskopii  molekularnej  i które  ujaw- 
niają się  przez  zmiany  w-idm  fluorescencj  i bądź  fos- 
forescencji.  Zjawiska  te  określamy  ogólną  nazwą  mię- 
dzycząsteczkowego  przenoszenia  energii  wzbudzenia. 
Procesy  przenoszenia  energii  polegają  na  bezpromie- 
nistym  przenoszeniu  energii  wzbudzenia  elektrono- 
wego od  wzbudzonej  cząsteczki  zwanej  donorem  do 
niewzbudzonej  cząsteczki  zwanej  akceptorem.  Re- 
zultatem przenoszenia  energii  jest  powrót  wzbudzo- 
nego donora  do  stanu  podstawowego  i przejście  nie- 
wzbudzonego  akceptora  do  stanu  wzbudzonego. 
Schematycznie  proces  taki  możemy  zapisać  nastę- 
pująco: 

D+hv  D*+ A — ► A*+Dy 

gdzie  D i A oznaczają  cząsteczki  donora  i akceptora 
w ich  stanach  podstawowych,  a A*  i D*  — ich  stany 
wzbudzone. 


Mechanizmy  fizyczne  przenoszenia  energii  są  róż- 
ne i zależą  między  innymi  od  tego,  z jakich  stanów 
donora  (singletowego  czy  trypletowego)  do  jakich 
stanęw  akceptora  jest  ona  przeznoszona.  Aby  proces 
przenoszenia  energii  był  efektywny,  wymagany  jest 
w niektórych  wypadkach  bezpośredni  kontakt  czą- 
steczki donora  i akceptora  — tak  jest  wtedy,  gdy 
energia  przenoszona  jest  między  stanami  trypletowy- 
mi  donora  i akceptora.  W innych  wypadkach  taki 
bezpośredni  kontakt  nie  jest  w ogóle  potrzebny  i ener- 
gia wzbudzenia  może  być  przenoszona  na  bardzo 
znaczną  odległość  nawet  rzędu  kilku  nanometrów. 

Jeżeli  proces  przenoszenia  energii  jest  efektywny,  to 

wówczas  emisja  donora  — fluorescencja  bądź  fosfo- 

rescencja  — jest  w obecności  cząsteczek  akceptora 

silnie  wygaszona,  pojawia  się  natomiast  odpowiednia 

emisja  — fluorescencja  bądź  fosforescencja  akceptora.  f|uorescencja 

Taką  emisję  akceptora,  która  nie  jest  bezpośrednio  sensybeiizo- 

wzbudzana,  lecz  jest  wynikiem  procesu  przenoszenia  wana 

energii  nazywa  się  czasem  sensybilizowaną  (uczuloną) 

fluorescencją. 
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Spektroskopia  mikrofalowego  rezonansu 
rotacyjnego 


Jan  Stankowski 

Spektroskopia  mikrofalowego  rezonansu  rotacyjnego 
(obejmująca  badania  substancji  w stanie  gazowym) 
jest  jednym  z działów  radiospektroskopii,  czyli  spek- 
troskopii długofalowej  części  widma  promieniowania 
elektromagnetycznego  o długościach  fal  większych 
od  0,1  cm.  Innymi  ważnymi  metodami  'radiospek- 
troskopii są  metody  rezonansów  magnetycznych  (-► 
Spektroskopia  rezonansów  magnetycznych). 

Mikrofalowy  rezonans  rotacyjny  (MRR  — ang. 
Microwave  Rotational  Resonartce)  obserwuje  się 
w cząsteczkach  obdarzonych  elektrycznym  momen- 
tem dipolowym ; wartość  momentu  zmienia  się  w pro- 
cesie absorpcji  lub  emisji  fotonu.  Typowymi  cząstecz- 
kami tego  rodzaju  są:  HCN,  NH8,  H2Ó. 

W rozwoju  mikrofalowej  spektroskopii  gazów  do- 
niosłą rolę  odegrała  cząsteczka  amoniaku.  Cząstecz- 
ka amoniaku  NH,  jest  spłaszczonym  bąkiem  syme- 
trycznym. Poziomy  oscylacyjne  (-*  Spektroskopia 
molekularna,  rozdz.  Widma  oscylacyjne  i rotacyjne) 
cząsteczki  NH3  ulegają  rozszczepieniu  wskutek  in- 
wersyjnego  przemieszczania  atomu  azotu,  polegają- 
cego na  jego  przenikaniu  przez  barierę  potencjału  od- 
dzielającą dwa  położenia  równowagi  leżące  po  obu 
stronach  płaszczyzny  wyznaczonej  przez  atomy  wo- 
doru (rys.  1).  (Zjawisko  przenikania  cząstki  o energii 
mniejszej  od  wysokości  bariery  nazywa  się  efektem 
tunelowym,  gdyż  zachodzi  ono  jakby  dzięki  tunelowi 
w barierze  potencjału;  proces  ten  można  zrozumieć 
przyjmując  falowy  obraz  cząstki,  bowiem  tylko  w ta- 
kim przedstawieniu  istnieje  skończone,  różne  od  zera, 
prawdopodobieństwo  znajdowania  się  cząstki  poza 
barierą  potencjału).  Wartość  rozszczepienia  inwer- 
syjnego  NH3  wynosi  0,8  cm-1  (leży  więc  w obszarze 
mikrofal)  dla  oscylacyjnego  poziomu  podstawowego 
( v = 0)  oraz  36,5  cm-1  dla  poziomu  wzbudzonego 
(v  = 1).  Rozszczepienie  oscylacyjnego  poziomu  pod- 
stawowego (0,8  cm-1)  jest  wykrywane  metodą 
MRR  — odkryli  je  C.  E.  Cleeton  i N.  H.  Williams 
(1933  r.). 


Spektroskopia  polega  na  badaniu  rezonansowego 
oddziaływania  fotonów  z układem  molekularnym. 
Rezonans  zachodzi  wtedy,  gdy  energia  fotonu  hfr 
(rys.  2)  odpowiada  różnicy  energii  dwóch  dyskret- 
nych poziomów  energetycznych  układu  molekular- 
nego. W rezonansie  atomy  (cząsteczki)  silnie  absor- 
bują lub  emitują  promieniowanie  co  prowadzi  do  wy- 
stąpienia linii  rezonansowej  (rys.  3). 

Badanie  absorpcji  w paśmie  mikrofal  polega  na 
obserwowaniu  zmian  dobroci  rezonatora  mikrofalo- 
wego (-*  Generacja  mikrofal),  gdy  w sposób  liniowy 
zmienia  się  częstość  źródła  fal  elektromagnetycznych. 
Mikrofalowe  widmo  amoniaku  uzyskane  dla  róż- 


poziom 

wzbudzony 


AE=Mr 




poziom 

podstawowy 

Rys.  2. 


Rys.  1.  Zależność  energii  potencjalnej  atomu  azotu  w cząsteczce 
NH,  od  wychylenia  S od  położenia  równowagi ; St  i składowe 
dubletu  deformacyjnego,  uwarunkowane  inwersyjnymi  rozszcze- 
pieniami poziomu  v = 1 
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nych  ciśnień  gazu  w rezonatorze  przedstawia  rys.  4. 
Pod  normalnym  ciśnieniem  obserwuje  się  silną  ab- 
sorpcję w szerokim  zakresie  częstości,  a obserwowana 
całkowita  szerokość  widma  amoniaku  jest  odwrotnie 
proporcjonalna  do  czasu  między  kolejnymi  wzajem- 
nymi zderzeniami  cząsteczek.  W miarę  obniżania  ciś- 
nienia zderzenia  stają  się  coraz  rzadsze  i szerokie  pa- 
smo absorpcyjne  zwęża  się;  ukazuje  się  nam  wielo- 
składnikowe widmo  inwersyjne  NH3  (rys.  4b). 

Ze  względu  na  to,  że  widmo  amoniaku  związane 
jest  z elektrycznymi  przejściami  dipolowymi,  czę- 
stość rezonansowa  poszczególnych  linii  silnie  zależy 
od  zewnętrznego  pola  elektrycznego  (zjawisko  Starka). 


Rys.  3.  Linia  rezonansowa;  szerokością  połówkową  A /,;#  linii 
rezonansowej  jest  różnica  częstości  w połowie  wysokości  linii 


Położenie  linii  rezonansowej  można  zmieniać  za  po- 
mocą sygnału  prostokątnego  o częstości  fm  uzysku- 
jąc periodyczną  modulację  linii  rezonansowej.  Mo- 

generator  komora  dopływ  gazu 


dulację  za  pomocą  pola  elektrycznego,  zwaną  modu- 
lacją starkowską,  wykorzystuje  się  do  zwiększenia 
czułości  spektrometrów  MRR.  Najczęściej  spotykane 
rozwiązanie  spektrometru  MRR  jest  pokazane  na 
rys.  5.  Główną  częścią  spektrometru  jest  falowód  za- 
wierający badany  gaz.  Do  elektrody  przykłada  się 
prostokątne  impulsy  wysokiego  napięcia  wytwarza- 
jące pole  elektryczne  między  elektrodą  i ścianką  fa- 
lowodu. Modulacja  starkowska  powoduje  periodyczną 
zmianę  położenia  linii  rezonansowej,  co  pociąga  za 
sobą  periodyczną,  z częstością  modulacji,  zmianę 
mocy  na  detektorze.  Umieszczony  za  detektorem 
wzmacniacz  nastrojony  na  częstość  modulacji  star- 
kowskiej  fm,  rejestruje  linię  rezonansową  podczas  li- 
niowej zmiany  częstości  źródła  mikrofal. 


Maser  i wzorce  częstości 

W cząsteczce  NH3  występuje  kwadratowy  efekt  Star- 
ka, tzn.  przesunięcie  linii  rezonansowej  w polu  elek- 
trycznym jest  proporcjonalne  do  kwadratu  przyło- 
żonego pola  elektrycznego.  Dla  określonego  stanu 
rotacyjnego  cząsteczki  przesunięcie  częstości  rezo- 
nansowej Af  = fs— fr  w polu  E opisuje  wyrażenie: 

Af=  AE2, 

gdzie  A jest  wielkością  zależną  od  momentu  dipolo- 
wego badanej  cząsteczki  oraz  od  wartości  rzutu 
całkowitego  momentu  pędu  J na  kierunek  pola  Et 
który  oznaczamy  przez  Mj.  Dla  stanów  inwersyj- 
nych  cząsteczek  amoniaku  kwadratowy  efekt  Starka 
przedstawiono  na  rys.  6.  Pole  o natężeniu  1 kV/cm 
przesuwa  linię  inwersyjną  / = 3,  K — 3 (dla  Mj  = 1) 


modulacja 

starkowska 


kwadratowy 
efekt  Starka 


Rys.  4.  Widmo  mikrofalowe  amoniaku  przy  różnym  ciśnieniu; 
przy  ciśnieniu  1 Pa  ujawnia  się  struktura  inwersyjną.  Cyfry  przy 
składowych  oznaczają  liczby  kwantowe  /,  K charakteryzujące 
rotacyjny  ruch  cząsteczki 


Rys.  6.  Kwadratowy  efekt  Starka  w widmie  inwersyjnym  amo- 
niaku 


od  częstości  fr  = 23  870  MHz  do  wartości  /e  = 23  879 
MHz.  Widać  stąd,  że  silnie  niejednorodne  pole  elek- 
tryczne będzie  separować  obydwa  stany  inwersyjne. 
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Takie  oddziaływanie  niejednorodnego  pola  elektrycz- 
nego na  cząsteczki  amoniaku  wykorzystano  w części 
separująco-ogniskującej  (rys.  7)  urządzenia  zwanego 


cząsteczka 
niewzbudzona  (-) 


© 
© 


. l-:  © 

© © 


kierunek 

wiązki 


' ęW# , 


Rys.  7.  Separator  cząsteczek  wzbudzonych:  a)  kwadrupolowy, 
b)  kółkowy 


cząsteczki  cząsteczki  próżnia 

niewzbudzone  wzbudzone  10“4  Pa 


Rys.  8.  Schemat  masera  z wiązką  molekularną  amoniaku 


maserem  (z  ang.  microwave  amplification  by  stimu- 
lated  emission  of  radiatioń).  Z wiązki  molekularnej 
biegnącej  wzdłuż  osi  separatora  cząsteczki  niewzbu- 
dzone (— ) będą  do  pola  wciągane,  podczas  gdy 
cząsteczki  wzbudzone  (+)  będą  z niego  wypychane, 
maser  Schemat  masera  amoniakalnego  przedstawiony  jest 
amoniakalny  na  rys.  8.  Ze  źródła,  w którym  amoniak  znajduje  się 
pod  ciśnieniem  ok.  10  Pa  cząsteczki  NH3  wpadają  do 
obszaru  wielkiej  próżni  (10”  * Pa).  Tutaj  na  całej  swo- 
jej drodze  od  źródła  do  rezonatora  cząsteczki  nie 
zderzają  się  wzajemnie.  W obrębie  separatora  wiązka 
molekularna  pozbawiona  jest  cząsteczek  niewzbu- 
dzonych  i do  rezonatora  mikrofalowego,  nastrojo- 
nego na  linię  inwersyjną  wpadają  tylko  cząsteczki 
wzbudzone.  Ponieważ  w zakresie  mikrofal  cząsteczki 
wzbudzone  przechodzą  do  stanu  podstawowego  tylko 
w wyniku  wymuszonej  emisji  promieniowania,  tylko 
zderzenie  między  cząsteczkami  lub  kwant  o częstości 
rezonansowej  może  spowodować  akt  emisji.  W wy- 
niku przypadkowego  aktu  emisji  cząsteczki  wzbu- 
dzają elektromagnetyczne  drgania  w rezonatorze. 
Dla  małego  strumienia  cząsteczek  drgania  te  gasną 
wskutek  strat  energii  pola  elektromagnetycznego 
w ściankach  rezonatora.  Zwiększając  strumień  czą- 
steczek ze  źródła  możemy  spowodować,  że  energia 
wnoszona  do  rezonatora  przez  wzbudzone  cząsteczki 
stanie  się  większa  od  strat  rezonatora  i pole  elektro- 
magnetyczne będzie  podtrzymywane  przez  emisję 


cząsteczek  NH3.  Tak  powstające  pole  w.cz.  będzie 
wymuszało  dalsze  przejścia  w cząsteczkach  wpada- 
jących do  rezontatora  i to  spowoduje  trwałe  wzajem- 
ne sprzężenie  rezonatora  mikrofalowego  z wiązką 
molekularną. 

Maser  jest  źródłem  drgań  pola  w.cz.  o nadzwyczaj- 
nie dużej  stabilności,  gdyż  drgania  te  są  utrzymywane 
przez  promieniowanie  cząsteczek  o określonej  bu- 
dowie, których  częstość  mało  się  zmienia  pod  działa- 
niem czynników  zewnętrznych.  Za  pomocą  masera 
zostały  określone  najsubtelniejsze  oddziaływania  w 
molekule  NH3  (rys.  9). 

Promieniowanie  o najwyższej  stabilności  częstości 
można  uzyskać  za  pomocą  masera  wodorowego.  Ma- 
ser ten  pracuje  przy  częstości  1420  MHz  równej  roz- 
szczepieniu poziomów : singletowego  F = 0 i tryple- 
towego  F = 1 wodoru.  W maserze  wodorowym  wy- 
korzystuje się  magnetyczne  przejścia  dipolowe  i dla- 
tego wiązkę  atomów  wzbudzonych  uzyskuje  się 
w separatorze  magnetycznym  o silnej  niejednorod- 
ności pola  magnetycznego.  Graniczną  stabilność  tego 
masera  określa  się  na  10~14  co  stanowi  światowy  re- 
kord stabilności  częstości.  Maser  wodorowy  jest 


Rys.  9.  Nadsubtelna  struktura  linii  7 = 3,  K — 3 amoniaku 
J<NH*:,a)  A,  B i C struktura  kwadrupolowa,  b)  struktura  magne- 
tyczna linii  A 

urządzeniem  kontrolnym  dla  wzorca  cezowego,  speł- 
niającego obecnie  rolę  światowego  wzorca  częstości. 

Wzorzec  cezowy  jest  spektrometrem  absorpcyjnym 
z wiązką  atomów  cezu,  w którym  zastosowano  sprzę- 
żenie zwrotne  tak,  że  częstość  źródła  mikrofal  ustala 
się  za  pomocą  wybranej  linii  rezonansowej.  Wybra- 
na umownie  linia  cezowego  wzorca  ma  częstość 
/Cs  ==  9 192  631  770  Hz.  Widmo  cezu  jest  dzisiaj  pod- 
stawą atomowej  skali  czasu  przewyższającej  swoją 
precyzją  skale  astronomiczne  związane  z periodycz- 
nym ruchem  ciał  niebieskich.  Ruch  planet  i wszelkie 
zjawiska  astronomiczne  opisuje  się  właśnie  w ato- 
mowej skali  czasu,  wyznaczonej  przez  laboratoria 
czasu  posługujące  się  zegarami  cezowymi  i maserami 
wodorowymi. 

Masery  zapoczątkowały  elektronikę  kwantową 
i wskazały  na  możliwość  realizacji  laserów,  które  spo- 
wodowały wspaniały  rozwój  optyki  nieliniowej  i za- 
decydowały o dalszych  sukcesach  elektroniki  kwanto- 
wej (->  Optyka  nieliniowa.  Lasery  — podstawy  dzia- 
łania). 

Masery  i lasery  spowodowały  wzrost  zainteresowania  stanem 
układów  znajdujących  się  w ujemnej  temperaturze  bezwzględnej- 
Termin  ten  zrazu  szokuje,  gdyż  wiemy,  że  zero  bezwzględne  jest 
nieosiągalne.  Nie  jest  on  użyty  tutaj  w dotychczasowym  sensie, 
gdyż  bezwzględną  temperaturę  ujemną  nie  określa  energia  kine- 
tyczna chaotycznego  ruchu  cząsteczek,  lecz  energia  ich  dyskret- 
nych stanów.  Temperatury  nie  mierzy  się  termometrem  lecz  za 
pomocą  obsadzenia  dyskretnych  stanów:  ujemnej  temperaturze 
odpowiada  antyboltzmannowskie  obsadzenie  stanów  — w wyż- 
szym stanie  znajduje  się  więcej  cząsteczek  niż  w niższym.  Nie  ma 
również  sprzeczności  z naszą  wiedzą  o zerze  bezwzględnym,  gdyż 
ze  strony  ujemnych  temperatur  bezwzględnych  zero  bezwzględne 
również  jest  nieosiągalne. 

W warunkach  zwykłej  równowagi  termodynamicznej,  energia 
poszczególnych  atomów  i cząsteczek  opisana  jest  za  pomocą 
tzw.  rozkładu  boltzmarmows  kiego  (rys.  10).  Zgodnie  z tym  roz- 
kładem w zbiorze  cząsteczek  najliczniejsze  są  cząsteczki  o naj- 
mniejszej energii.  Rozkład  boltzmannowski  opisuje  również 
obsadzenie  stanów  o skwantowanej  energii:  liczbę  cząsteczek 
Nt  i Nt  znajdujących  się  w dwu  dowolnych  stanach  1 i 2 określa 
funkcja  wykładnicza  (rys.  10).  Gdy  Et<Et  stosunek 

NJN 1 «=  tT*El*Tf  (1) 

gdzie  JE  = Et-E1}  zaś  k jest  stałą  Bołtzmanna.  Jeżeli  przyj- 
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mierny  to  wyrażenie  za  wzór  definiujący  temperaturę,  za  pomocą 
obsadzenia  poziomów  energetycznych  możemy  określić  tempera- 
turę dowolnego  przejścia  rezonansowego.  „Termometrem”  jest 
wówczas  absorpcja  Pabs  mocy  mikrofalowej,  która  jest  wprost 
proporcjonalna  do  różnicy  obsadzeń  dwu  rozważanych  pozio- 
mów energetycznych  cząsteczki:  Pat>a  ~ W gazie, 


Rys.  10.  Obsadzenie  poziomów  określa  temperaturę  układu: 
a)  T > 0,  b)  T < 0 


w którym  cząsteczki  we  wszystkich  stanach  energetycznych  znaj- 
dują się  w'  równowadze  z otoczeniem,  moc  absorbowana  jest  do- 
datnia : Pa bs  > 0,  a więc  mamy  do  czynienia  z dodatnią  tempera- 
turą bezwzględną  dla  dowolnie  wybranego  dwupoziomowego 
układu.  Zupełnie  inną  sytuację  mamy  wówczas,  gdy  dla  dwóch 
wyizolowanych  poziomów  Nt  > Nu  tzn.,  że  górny  stan  jest 
silniej  obsadzony  niż  dolny.  Zgodnie  z tym  co  wyżej  powiedziano 
wystąpi  ujemna  absorpcja  równoważna  emisji,  a układ  rozwa- 
żany możemy  opisać  za  pomocą  ujemnej  temperatury  bezwzględ- 
nej. Widać  stąd  natychmiast,  że  układy  o temperaturze  dodat- 
niej (T>  0)  absorbują  energię,  gdyż  > 0,  a układy  o ujemnej 
temperaturze  (r<0)  ją  emitują,  bowiem  dla  nich  współczynnik 
absorpcji  jest  mniejszy  od  zera  (a  < 0).  Dzięki  maserom  rozwi- 
nięto termodynamikę  układów  o ujemnej  temperaturze  bez- 
względnej, w której  określono  warunki  jakie  musi  spełniać  taki 


układ:  1)  W układzie  dwupoziomowym  musi  istnieć  równowaga 
w sensie  termodynamicznym,  co  w doświadczeniach  mikrofalo 
wych  zapewnia  szybko  ustalające  się  oddziaływanie  spin-spin. 
2)  Rozważany  układ  dwupoziomowy  jest  adiabatycznie  odizo- 
lowany od  układów  o T>0  (duża  różnica  czasów  relaksacji  spin- 
-sieć  i spin-spin).  3)  Energia  układu  musi  być  ograniczona  od 
góry,  co  jest  spełnione  w układzie  o skwantowanych  poziomach 
energetycznych,  gdyż  jest  to  po  prostu  energia  górnego  poziomu. 

Zasadnicza  różnica  układów  o dodatniej  i ujemnej  temperatu- 
rze bezwzględnej  polega  na  tym,  że  w układach  z temperaturą 
T>  0 rozkład  obsadzeń  jest  wynikiem  chaotycznego  ruchu  ciepl- 
nego cząsteczek  (ich  kinetycznej  energii),  zaś  ujemna  temperatura 
bezwzględna  jest  związana  z energią  potencjalną  poszczególnych 
cząsteczek  tworzących  układ.  Osobliwością  układów  o ujemnej 
temperaturze  bezwzględnej  jest  to,  że  układy  o !T<0  są  „go- 
rętsze” od  układów  oT>0,  bowiem  zawierają  one  energię  zma- 
gazynowaną we  wzbudzonych  stanach  cząsteczek,  którą  na  dro- 
dze wymuszonej  emisji  promieniowania  poszczególne  cząsteczki 
oddają  polu  elektromagnetycznemu. 

Innymi  ważnymi  metodami  mikrofalowej  spektro- 
skopii gazów  jest  rezonans  podwójny  i molekularny 
rezonans  rotacyjny.  Rezonans  podwójny  stosowany 
jest  do  detekcji  przejść,  gdy  współczynnik  pochłania- 
nia dla  danego  przejścia  leży  poniżej  czułości  spektro- 
metru MRR.  W metodzie  tej  stosuje  się  równocze- 
śnie dwa  sygnały  mikrofalowe:  sygnał  o dużej  mocy 
powodujący  zmianę  obsadzeń  poziomów  energetycz- 
nych (przejście  R,  rys.  11)  i słaby  sygnał  wykrywa- 
jący przejście  Q.  W układzie  trzech  poziomów,  mię- 
dzy którymi  zachodzą  dwa  przejścia  R i Q,  pompo- 
wanie silnym  sygnałem  R opróżnia  w istotny  sposób 
poziom  7,  a tym  samym  staje  się  możliwa  obserwacja 
słabego  przejścia  Q.  Metodą  podwójnego  rezonansu 
zbadano  cząsteczkę  HDCO:  przejście  R (35  GHz) 
naświetlane  silnym  sygnałem  mikrofalowym  umoż- 
liwiło obserwację  przejścia  Q (13  GHz). 
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Rys.  12.  Molekularny  rezonans  rotacyjny 


Molekularny  rezonans  rotacyjny  (rys.  12)  polega 
na  przekazywaniu  energii  rotacyjnej  podczas  zderzeń 
cząsteczek,  w wyniku  czego  zmienia  się  obsadzenie 
inwersyjnych  poziomów  energetycznych.  Jest  to  waż- 
na metoda  badania  energii  zderzeń  cząsteczek. 

G.  M.  Barrow  Wstęp  do  spektroskopii  molekularnej.  Warsza- 
wa 1968:  J.  Stankowski,  A.  Graja  Wstęp  do  elektroniki  ciała 
stałego.  Warszawa  1972. 


Spektroskopia  rezonansów 
magnetycznych 

Marek  Gutowski 


Wyobraźmy  sobie  pewną  substancję  umieszczoną 
w stałym  polu  magnetycznym.  Jeżeli  się  okaże,  że  ta 
substancja  pod  wpływem  przyłożonego  pola  magne- 
tycznego zaczyna  pochłaniać  fale  elektromagnetyczne 
rezonans  pewnych  długości,  zjawisko  nazwiemy  zjawiskiem  re- 
magnetyczny  zonansu  magnetycznego.  Badanie  zależności  pochła- 
niania od  wielkości  indukcji  pola  magnetycznego  B 
i od  energii  padających  fal  elektromagnetycznych  jest 
właśnie  istotą  spektroskopii  rezonansów  magnetycz- 
nych. Mówimy  „rezonansów”,  a nie  „rezonansu”, 
bo  znamy  kilka  rodzajów  tycfr  zjawisk:  rezonans 
jądrowy,  rezonans  elektronowy,  rezonans  ferromag- 
netyczny i in.  Istnieje  jeszcze  jeden  rodzaj  rezonanso- 
wego pochłaniania  energii  w obecności  stałego  pola 
magnetycznego,  a mianowicie  tzw.  rezonans  cyklo- 
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tronowy.  Nie  będziemy  go  tu  omawiać,  ponieważ 
jest  to  z mikroskopowego  punktu  widzenia  zupełnie 
inne  zjawisko. 

Badania  rezonansów  magnetycznych  zostały  zapo- 
czątkowane w 1945  r.  przez  radzieckiego  fizyka 
E.  Zawojskiego.  Do  rozwoju  badań  eksperymental- 
nych przyczynili  się  również  E.  M.  Purcell,  H.  C.  Tor- 
rey,  R.  V.  Pound,  C.  Kittel,  F.  Bloch,  C.  Gorter  i in. 
Dzisiaj  metody  badawcze  wykorzystujące  rozmaite 
rezonanse  magnetyczne  stały  się  silnym  narzędziem 
eksperymentatorów  i badaczy  nie  tylko  w dziedzinie 
fizyki,  ale  również  chemii,  biologii  i medycyny.  Skon- 
struowano przyrządy  pozwalające  określać  parame- 
try materiałów  używanych  w różnych  gałęziach  prze- 
mysłu. 


rezonans 

podwójny 


3 ' a— 

R 


Rys.  11.  Rezonans 
podwójny 


molekularny 

rezonans 

rotacyjny 


Do  sprawy  zastosowań  rezonansów  magnetycznych 
jeszcze  powrócimy.  Teraz  omówimy  samo  zjawisko. 
Najpierw  podamy  krótki  słowniczek  objaśniający 
często  używane  skróty: 

NMR  (JRM)  — jądrowy  rezonans  magnetyczny  (ang. 

nuclear  magnetic  resonance ), 

EPR  (ERP,  ESR)  — elektronowy  rezonans  paramag- 
netyczny (ang.  electron  paramagnetic  resonance ), 
zwany  też  rezonansem  spinowym, 

FMR  (RFM)  — rezonans  ferromagnetyczny  (ang. 
ferromagnetic  resonance). 

Spotyka  się  niekiedy  jeszcze  inne  skróty,  jak  np. 
AFMR,  NQR,  EQR,  ENDOR,  które  oznaczają  ko- 
lejno: rezonans  antyferromagnetyczny,  jądrowy  re- 
zonans kwadrupolowy,  elektronowy  rezonans  kwa- 
drupolowy  i podwójny  rezonans  elektronowo-jądro- 
wy.  Nie  będziemy  się  tu  nimi  zajmować. 


Zjawisko  rezonansu 
magnetycznego 


Zjawisko  rezonansu  magnetycznego  można  ściśle 
opisać  tylko  na  gruncie  mechaniki  kwantowej.  Spró- 
bujemy tu  mimo  to  podać  pewne  analogie  klasyczne, 
przemawiające  do  wyobraźni  i ułatwiające  zrozumie- 
nie istoty  procesu.  Za  rezonansowe  pochłanianie 
energii  odpowiedzialne  są  cząstki  obdarzone  mo- 
mentem magnetycznym.  Mogą  to  być  jądra  atomowe, 
jony  lub  inne  mikroobiekty.  Skąd  się  bierze  moment 
moment  magnetyczny  jakiejś  cząstki?  Wyobraźmy  sobie  na- 
magnetyczny  ładowaną  cząstkę  krążącą  po  zamkniętym  torze. 

Ruch  tej  cząstki  jest  równoważny  z przepływem  prądu 
elektrycznego  w zamkniętej  pętli.  Jak  wiemy,  jednym 
ze  skutków  przepływu  prądu  elektrycznego  jest  wy- 
tworzenie pola  magnetycznego.  Cząstka  krążąca  po 
zamkniętej  orbicie  jest  więc  czymś  w rodzaju  elemen- 
tarnego magnesu.  W mechanice  kwantowej  nie  wy- 
obrażamy sobie,  że  cząstki  krążą  po  ustalonych  orbi- 
tach lub  że  wirują  wokół  jakiejś  osi,  lecz  mówimy, 
że  są  obdarzone  pewnym  momentem  pędu.  Teraz  już 
możemy  odpowiedzieć  na  postawione  pytanie.  Mo- 
ment -magnetyczny  jest  związany  z ładunkiem  elek- 
trycznym cząstki  i z jej  momentem  pędu.  Oznaczmy 
wektor  momentu  magnetycznego  naszej  cząstki 


przez  fi. 

precesja  W zewnętrznym,  stałym  polu  magnetycznym  wek- 

wektora  tor  ^ wykonuje  precesję  wokół  wektora  B — indukcji 
momentu  poja  magnetycznego.  Jest  to  zjawisko  analogiczne  do 
magne-  krążenia  (precesji)  osi  bąka-zabawki  w polu  grawita- 
tycznego  Cyjnym  (rys.  1).  Istotna  różnica  pomiędzy  tymi  zja- 
wiskami polega  na  tym,  że  oś  bąka  może  być  dowol- 


wektor 
momentu 
pędu  T 


Rys.  1.  Porównanie  precesji  wektora  momentu  magnetycznego 
w jednorodnym  polu  magnetycznym  i precesji  bąka-zabawki 
w ziemskim  polu  grawitacyjnym 


nie  nachylona  w stosunku  do  pionu,  a położenie  wek- 
tora i u nie  może  być  dowolne.  Wektor  fi  musi  wyko- 


nywać precesję  w taki  sposób,  aby  rzut  momentu 
pędu  na  kierunek  wektora  B przybierał  jedną  z 
2J-r\  wartości: 

—Jh,  (~J+l)h  ...  (J-l)h,  Jh; 

J jest  tu  tzw.  liczbą  kwantową  momentu  pędu, 
a h — stałą  Plancka  dzieloną  przez  2jc.  Liczba  J 
może  być  całkowita  lub  połówkowa  (0,  1/2 , 1,  ZU, 
2...).  Na  przykład,  jeśli  cząstka  ma  moment  pędu 
równy  zj2hy  J = z/2  (nie  jest  to  ścisłe  powiedzenie. 


Rys.  2.  Możliwe  ustawienia  wektora  momentu  magnetycznego 
scharakteryzowanego  liczbą  kwantową  momentu  pędu  J — */i 
w polu  magnetycznym  i odpowiadające  im  energie 


gdyż  całkowity  moment  pędu  cząstki  opisanej  liczbą 
kwantową  J jest  równy  #j/7(/+l)),  to  możliwe  są 
cztery  ustawienia  wektora  w polu  magnetycznym 
(rys.  2).  Każdemu  ustawieniu  odpowiada  inna  ener- 
gia. Jak  wiadomo,  energia  momentu  magnetycznego 
w polu  magnetycznym  wyraża  się  wzorem 

E = —fxB  = — fiBcosO  ; 

0 oznacza  tu  kąt  pomiędzy  wektorami  fi  i By  czyli 
połowę  kąta  rozwarcia  stożka,  po  którym  się  poru- 
sza wektor  momentu  magnetycznego  fi.  W mecha- 
nice kwantowej  oblicza  się,  że  moment  magnetyczny 
opisany  liczbą  kwantową  J ma  w polu  magnetycznym 
energię 

Ej  = yJhB.  (1) 

Współczynnik  y (tzw.  stosunek  magnctomechaniczny 
lub  giromagnetyczny)  ma  różne  wartości  — w zależ- 
ności od  tego,  jaką  cząstkę  rozpatrujemy.  Jeśli  np. 
elektron  walencyjny,  to  y = ye  = gMB,  jeśli  zaś  jądro 
atomowe,  to  y — ys  — gsf*N-  Magneton  Bohra 
fiB  i magneton  jądrowy  fis  są  elementarnymi  jedno- 
stkami momentu  magnetycznego  odpowiednio  dla 
elektronu  i jądra  atomowego.  Bezwymiarowy  współ- 
czynnik g nazywa  się  współczynnikiem  rozszczepie- 
nia spektroskopowego,  czynnikiem  Landego  lub  po 
prostu  czynnikiem  g.  Jego  wartość  możemy  obliczać 
teoretycznie  lub  otrzymywać  z eksperymentu.  Z re- 
latywistycznej teorii  Diraca  wynika,  że  g swobod- 
nego elektronu  w próżni  równa  się  2,0023. 

Z równania  (1)  widać,  że  różnica  energii  dwóch 

położeń  wektora  fi  (czyli  dwóch  stanów  energetycz- 
nych), różniących  się  liczbą  kwantową  J o jedność, 
wynosi : 

AEj,j-  1 = Ej  — Ej- i = yhB. 

Jeśli  energia  padającego  fotonu  E = hv  = hco  jest 
równa  AEy  to  jest  spełniony  warunek  Bohra  i foton 
może  być  pochłonięty.  Jest  to  podstawowy  warunek 
rezonansu.  Zapiszemy  go  krótko  jeszcze  raz: 

AE  — hco0  = yhB , czyli  to0  = yB.  (2) 
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mentu mag- 
netycznego 


Podkreślmy  przy  tym,  że  B oznacza  indukcję  pola 
magnetycznego,  które  działa  na  nasz  moment  mag- 
netyczny. Nie  zawsze  jest  to  takie  pole,  jakie  przy- 
kładamy do  próbki  z zewnątrz.  Może  się  przecież 
zdarzyć,  że  w naszej  próbce  istnieją  poza  polem 
zewnętrznym  jakieś  wewnętrzne  pola  magnetyczne. 
Musimy  pamiętać,  że  B w naszym  podstawowym 
wzorze  (2)  oznacza  wypadkową  wszystkich  tych 
pól. 

Jest  jeszcze  drugi  warunek  rezonansu,  łatwo  zro- 
zumiały z klasycznego  punktu  widzenia:  składowa 

magnetyczna  b padającej  fali  elektromagnetycznej 
powinna  być  prostopadła  do  wektora  B.  Jeśli  kie- 
runek wirowania  wektora  b będzie  taki  sam  jak  kie- 
runek precesji  wektora  fi  (rys.  3),  to  można  będzie 

przyspieszyć  precesję  wektora  ja,  układ  pochłonie 
energię.  Jest  więc  rzeczą  konieczną,  aby  padająca  fala 
elektromagnetyczna  miała  składową  magnetyczną 
prostopadłą  do  pola  stałego. 

O tym,  jak  się  zachowuje  wektor  momentu  magne- 
tycznego w zewnętrznym  polu  magnetycznym,  może- 
my się  dowiedzieć  rozwiązując  jego  równania  ruchu. 
Nie  będziemy  tu  tego  robić,  napiszemy  tylko  te  rów- 
nania: ^ _ _ 

~df^=  P) 


Są  to  właściwie  trzy  równania,  ponieważ  niewiado- 
mymi są  tu  trzy  składowe  wektora  ja  jako  funkcje 
czasu.  Zapisaliśmy  je  dla  skrócenia  w formie  wekto- 
rowej. Jest  to  dobrze  znane  równanie  mechaniki 
klasycznej  (pochodna  momentu  pędu  układu  jest 
równa  momentowi  sił  zewnętrznych  działających  na 
układ),  z tą  jedynie  różnicą,  że  obie  strony  równania 
pomnożono  przez  y i otrzymano  z lewej  strony  mo- 
ment magnetyczny  zamiast  momentu  pędu.  Można 
się  przekonać,  że  równanie  (3)  opisuje  precesję  wekto- 
ra fi  wokół  wektora  B.  Pamiętamy  jednak,  że  każdy 
rzeczywisty  układ  fizyczny  dąży  do  takiego  stanu, 
w którym  jego  energia  byłaby  możliwie  mała.  W da- 
nym wypadku  oznaczałoby  to,  że  wektor  fi  powinien 

się  w końcu  ustawić  równolegle  do  wektora  B.  Za- 
chowanie jego  winno  być  mniej  więcej  takie  jak  na 
rys.  4,  tzn.  powinien  on  krążyć  po  okręgu  o coraz 
mniejszym  promieniu.  Przebieg  czasowy  zjawiska  jest 
więc  następujący:  1)  moment  magnetyczny  jest  usta- 
wiony równolegle  do  pola  magnetycznego,  2)  po 
pochłonięciu  porcji  energii  występuje  precesja,  3)  ener- 
gia jest  wytracana  (mówimy,  że  następuje  relaksacja) 
w pewnym  charakterystycznym  czasie,  zwanym  cza- 
sem relaksacji.  W obrazie  kwantowym  możemy  to 


Rys.  3.  Wzajemne  ustawienie 
wektora  pola  magnetycznego, 
składowej  magnetycznej  pada- 
jącej fali  elektromagnetycznej 
wywołującej  rezonans  i wek- 
tora momentu  magnet,  cząstki 


Rys.  4.  Klasyczny  obraz  pre- 
cesji wektora  momentu  mag- 
netycznego cząstki,  która  stop- 
niowo traci  energię 
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sobie  wyobrazić  jako  przeskoki  wektora  fi  z jednego 
stożka  precesji  na  drugi.  Klasyczne  równania  ruchu, 
takie  jak  równania  (3),  ale  zawierające  człony  opisują- 
ce relaksację,  nazywają  się  równaniami  ruchu  Blo- 
cha. Podobne  równania  ruchu  podali  niezależnie  F. 
Gilbert  i L.D.  Landau.  Jeśli  na  podstawie  równań  ru- 
chu Blocha  obliczymy  szybkość  pochłaniania  energii 
przez  układ,  otrzymamy  następujące  wyrażenie  zale- 
żne od  częstości  padającej  fali  elektromagnetycznej: 


P(co)  = 


coy/arb2 

1-f -((Q—O)0)2T2 


(4) 


gdzie  b jest  wielkością  składowej  magnetycznej  pada- 
jącej fali  elektromagnetycznej,  która  wywołuje  rezo- 


Rys.  5.  Krzywa  absorpcyjna  rezonansu  magnetycznego 


Rys.  6.  Schemat  aparatury  do  obserwacji  rezonansu  magnetycz- 
nego 


nans.  Jeśli  wykreślimy  tę  krzywą,  otrzymamy  obraz 
taki  jak  na  rys.  5.  Jest  to  dobrze  znana  w fizyce  krzy- 
wa Lorentza.  Jej  szerokość  na  połowie  wysokości 
równa  się  1/t;  q>0  jest  określone  przez  warunek  re- 
zonansu (2). 

Schemat  typowego  układu  do  eksperymentalnego 
badania  rezonansów  magnetycznych  przedstawiony 
jest  na  rys.  6.  Próbka  znajduje  się  w polu  magnetycz- 
nym wytwarzanym  przez  elektromagnes  lub  magnes 
nadprzewodnikowy.  Fale  elektromagnetyczne  wysyła- 
ne z nadajnika  docierają  do  próbki  z lewej  strony,  na- 
stępnie są  pochłaniane,  a ta  część  energii,  która  nie 
została  zaabsorbowana  przez  próbkę,  dociera  do  od- 
biornika. Z odbiornikiem  połączony  jest  oscyloskop 
lub  rejestrator,  który  pozwala  na  zapis  otrzymywa- 
nych krzywych  rezonansowych.  Zwykle  w ekspery- 
mencie łatwiej  jest  zmieniać  stałe  pole  magnetyczne 
niż  częstość  padających  fal  elektromagnetycznych. 
Otrzymujemy  wtedy  na  rejestratorze  zapis  krzywej 
pochłaniania  w funkcji  pola  magnetycznego  przy  usta- 
lonej częstości  fal  elektromagnetycznych.  Często  się 
zdarza,  że  próbka  zawiera  niewiele  momentów  mag- 
netycznych mogących  absorbować  energię  — stosu- 
jemy wówczas  skomplikowane  metody  nadawania 


krzywa 

Lorentza 


rejestrator  x-y 
(automatyczny 
pisak)  lub  oscy- 
loskop 


układ 

ekspery- 

mentalny 


i odbioru  fał  elektromagnetycznych,  dzięki  którym 
możemy  rejestrować  nawet  bardzo  słabe  sygnały  od 
próbki.  Powszechnie  stosowane  są  takie  metody 
spektroskopii  rezonansów  magnetycznych,  które 
pozwalają  obserwować  sygnały  100  tysięcy  razy  słab- 
sze od  szumów.  Nasza  aparatura,  zwana  spektro- 
metrem, daje  wtedy  na  wyjściu  zapis  nie  krzywej  re- 
zonansowej, lecz  jej  pochodnej.  Idea  pomiaru  po- 
zostaje jednak  taka  sama. 

W pierwszych  pracach  nad  rezonansami  magnetycz- 
nymi używano  jako  odbiornika  kalorymetru  (C.  Gor- 
ter  1948).  Pomiar  trwał  długo  i był  obarczony  dużymi 
błędami.  Trzeba  było  przy  rozmaitych  częstościach 
fal  elektromagnetycznych  (lub  wartościach  pól)  mie- 
rzyć temperaturę  i w ten  sposób  punkt  po  punkcie 
określać  kształt  krzywej  absorpcyjnej.  Współczesne 
spektrometry  pozwalają  na  prawie  automatyczne  za- 
pisywanie całej  krzywej  absorpcyjnej,  a sam  pomiar 
trwa  średnio  kilka  minut.  Obecnie  wobec  postępu 
w metodach  fizyki  niskich  temperatur  powraca  się  do 
obserwacji  rezonansów  magnetycznych  przez  pomiar 
temperatury  próbki.  Jest  to  jednak  możliwe  tylko 
w bardzo  niskich  temperaturach,  poniżej  4 K. 


Rezonans  Jądrowy 

Wszystkie  nasze  dotychczasowe  rozważania  pozostaną 
w mocy,  jeżeli  zamiast  liczby  kwantowej  J wpiszemy 
do  wzoru  (1)  liczbę  / — spin  obserwowanego  jądra 
atomowego.  Częstość  fal  elektromagnetycznych  po- 
trzebnych do  wywołania  rezonansu  zależy  oczywiście 
od  przyłożonego  pola  magnetycznego  (wzór  2).  Czę- 
stości rezonansowe  niektórych  jąder  w polu  magne- 
tycznym 1 T podane  są  w tabeli. 


Częstości  rezonansu  jądrowego  w polu  magnetycznym  1T  i 
wartość  spinu  jądrowego  wybranych  jąder 


Jądro 

Częstość 
rezonansowa 
w MHz 

Spin 

(proton) 

42,576 

1/2 

2H  (deuter) 

6,536 

1 

7Li 

16,55 

3/2 

»C 

10,71 

1/2 

J9p 

40,06 

1/2 

»Na 

11,26 

3/2 

127  J 

8,52 

512 

Podane  częstości  pokrywają  zakres  UKF  i fal  krót- 
kich stosowanych  w radiofonii.  Dotyczy  to  oczywiście 
jąder  swobodnych.  Jeśli  badane  jądra  znajdują  się 
w cząsteczkach,  efekt  może  być  na  przykład  taki  jak 
na  rys.  7.  Jest  to  widmo  rezonansu  jądrowego  (NMR) 
jąder  wodoru,  czyli  protonów,  w cząsteczce  alkoholu 


H H 


etylowego.  Zmianę  częstości  rezonansowej  wywołaną  przesunięci  o 
ekranującym  działaniem  chmury  elektronowej  nazy-  chemiczne 
wamy  przesunięciem  chemicznym.  Na  rys.  7 widać 
wyraźnie,  że  atomy  wodoru  zawarte  w cząsteczce  eta- 
nolu można  podzielić  na  trzy  grupy.  Porównanie 
wzoru  strukturalnego  etanolu  i widma  pozwala  w tym 
wypadku  łatwo  określić,  które  jądra  wodoru  w czą- 
steczce alkoholu  są  odpowiedzialne  za  kolejne  maksi- 
ma pochłaniania.  Różne  częstości  rezonansowe  tłu- 
maczą się  oczywiście  tym,  że  lokalne  pole  magnetycz- 
ne działające  na  protony  jest  inne  w każdej  grupie 
i nieco  inne  niż  przyłożone  pole  zewnętrzne.  Takimi 
metodami  rozszyfrowuje  się  strukturę  wielu  związków 
organicznych. 


Zastosowanie  zjawiska  NWIR 

Badanie  rezonansu  magnetycznego  protonów  jest 
szczególnie  ważne  w chemii  organicznej,  ponieważ 
wiele  związków  organicznych  zawiera  w swym  skła- 
dzie wodór.  W ostatnich  latach  rozwinęła  się  również 
spektroskopia  rezonansu  jądrowego  izotopu  węgla 
13C,  pierwiastka  zawartego  w związkach  organicz- 
nych. Badania  tego  rezonansu  są  znacznie  trudniejsze 
niż  spektroskopia  protonów,  gdyż  izotop  13C  stanowi 
tylko  ok.  1,1%  wszystkich  atomów  węgla  w przyro- 
dzie. Z kolei  spektroskopia  rezonansu  jądrowego  izo- 
topu fluoru  19F,  który  stanowi  prawie  100%  fluoru 
w przyrodzie,  jest  utrudniona  z powodu  dosyć  wyso- 
kiej częstości  rezonansowej  i toksyczności  jego 
związków.  W fizyce  ciała  stałego  bada  się  NMR  wielu 
innych  izotopów,  np.  glinu  27 Al,  żelaza  57Fe  i kobaltu 
59Co. 

Zjawisko  NMR  protonów  zawartych  w wodzie  NfttfR  proto- 
zostało  wykorzystane  do  precyzyjnego  pomiaru  pola  nów 
magnetycznego.  Czynnik  y protonów  w wodzie  jest  w wodzie 
znany  z bardzo  wysoką  dokładnością.  Pozwala  to 
określić  wartość  indukcji  pola  magnetycznego  z czę- 
stości rezonansowej  NMR.  Pomiar  pola  tą  metodą 
jest  łatwy  w zakresie  pól  0,1 -1,5  T.  Do  pomiaru  więk- 
szych pól  używa  się  jąder  litu  7Li. 

Zjawisko  NMR  protonów  w wodzie  wykorzystano  miernik  wiB- 
także  w mierniku  wilgotności  materiałów  sypkich,  gotności 
Miernik  taki  pozwala  szybko  i nie  niszcząc  materiału 
określić  z dokładnością  ok.  2%  zawartość  wody  w tro- 
cinach, piasku,  ziarnie  i innych  materiałach.  Pomiar 
może  być  prowadzony  w sposób  ciągły,  np.  na  przesu- 
wającej się  taśmie  w magazynie,  zakładzie  produkcyj- 
nym, w porcie. 


Rys.  8.  Rozkład  gęstości  protonów  w przekroju  strąka  rośliny 
afrykańskiej  okra  otrzymany  metodą  NMR.  Średnica  strąka 
ok.  15  mm 

Metodą  NMR  protonów  w wodzie  można  przepro- 
wadzać ciekawe  badania  w obiektach  biologicznych. 
Jeżeli  obszar  pola  magnetycznego  o takim  rozkładzie 
przestrzennym  indukcji,  przy  którym  warunki  rezo- 

335 


częstość  10 


Rys.  7.  Widmo  NMR  protonów  w cząsteczce  alkoholu  etylowego 


badania 

obiektów 

biologicznych 


WR/8R  w ferro- 
magnetykach 


Rys.  9.  Rozkład  protonów  w płaszczyźnie  przechodzącej  przez 
żołądek  szczura  otrzymany  metodą  NMR 


nansowe  będą  spełnione  tylko  w małym  fragmencie 
próbki,  będziemy  przesuwać,  to  w rezultacie  można 
będzie  otrzymać  obrazy  podobne  do  rys.  8 i 9.  Zare- 
jestrowano oczywiście  wielkość  absorpcji,  podczas 
gdy  pole  i częstość  rezonansowa  były  ustalone.  Tą 
metodą  uzyskano  już  obrazy  tkanek  różnych  roślin, 
pierwsze  obrazy  żywych  małży  w muszlach  i obrazy 
dłoni  ludzkiej. 

Metodą  NMR  badano  też  zanieczyszczoną  wodę 
morską.  Wynikiem  tych  badań  jest  wiedza  na  temat 
procesów  prowadzących  do  samooczyszczenia  wody 
morskiej  z rozlanych  olejów  i ropy  naftowej  oraz 
wpływu  na  te  procesy  takich  czynników  jak  nasło- 
necznienie i falowanie  morza. 

W pewnych  wypadkach  można  obserwować  NMR 
bez  przykładania  zewnętrznego  pola  magnetycznego. 
Dzieje  się  tak  w ferromagnetykach,  a to  dzięki  temu, 
że  wewnątrz  nich  istnieje  już  pole  magnetyczne. 
Szczególnie  interesujące  są  badania  NMR  jąder  znaj- 
dujących się  w ściankach  domenowych,  tj.  obszarach 
rozdzielających  leżące  blisko  siebie  obszary  ferro- 
magnetyka,  tzw.  domeny  magnetyczne,  o różnych 
kierunkach  spontanicznego  namagnesowania  (-> 
Struktura  domenowa  i procesy  magnesowania).  Są  to 
badania  bardzo  trudne  do  interpretacji,  ponieważ 
w ściance  domenowej  wewnętrzne  pole  magnetyczne 
zmienia  swój  kierunek  od  jądra  do  jądra. 


Rezonans  elektronowy 


Rezonans  elektronowy  (EPR)  obserwowano  w gazach, 
cieczach,  szkłach,  półprzewodnikach  i metalach. 
Ważną  klasą  obiektów  badanych  metodą  rezonansu 
elektronowego  są  wolne  rodniki. 

Istota  zjawiska  jest  taka  sama  jak  rezonansu  jądro- 
wego. Podstawową  różnicę  stanowi  pochodzenie 
wektora  momentu  magnetycznego.  W EPR  obserwu- 
jemy rezonansowe  pochłanianie'  energii  przez  układ 
elektronów,  a nie  jąder  atomowych.  Poza  tym  całko- 
wity moment  pędu  elektronu  składa  się  z momentu 
orbitalnego,  wynikającego  z ruchu  elektronu  wokół 
jądra,  oraz  z momentu  spinowego.  Do  opisu  rezonan- 
su elektronowego  używamy  innej  liczby  kwantowej, 
tzw.  spinu  efektywnego  5,  co  oczywiście  powoduje 
pewne  komplikacje.  Ponieważ  magneton  Bohra  jest 


ok.  2000  razy  większy  niż  magneton  jądrowy,  to  i sto-  częstość 
sowane  częstości  fal  elektromagnetycznych  muszą  być  promienio- 
o trzy  rzędy  większe  niż  przy  rezonansie  jądrowym,  wania 
Zwykle  w eksperymentach  EPR  częstość  promienio-  w EPR 
wania  jest  ustalona  i wynosi  ok.  10  GHz  (IG10  Hz), 
a typowy  zakres  pól  magnetycznych  wynosi  0-1  T. 

Stosowane  częstości  mikrofalowe  zmuszają  do  używa- 
nia podzespołów  elektronicznych  typowych  dla  tego 
zakresu  fal:  falowodów,  cyrkulatorów,  rezonatorów, 
tłumików  i specjalnych  mikrofalowych  diod  detekcyj- 
nych oraz  generatorów  mikrofal.  Do  generacji  mi- 
krofal używa  się  lamp  zwanych  klistronami  lub  (w  naj- 
nowszych konstrukcjach)  generatorów  półprzewodni- 
kowych— diod  Gunna  (-►Generacja  mikrofal). 

Czułość  obecnie  używanych  spektrometrów  EPR 
jest  bardzo  wysoka,  pozwala  wykryć  w temperaturze 
pokojowej  5 • 1010  cząstek  paramagnetycznych  w 
próbce. 


Struktura  subtelna  i nadsubtelna  widm  EPR 

Jeśli  liczba  kwantowa  S > V2,  to  poziomy  energetyczne 
elektronu  nie  są  równoodległe.  Widmo  rezonansu 
paramagnetycznego  nie  składa  się  wówczas  z jednej 
linii,  lecz  z kilku.  Zjawisko  polegające  na  występo- 
waniu kilku  linii  rezonansowych  zamiast  jednej  nazy- 
wamy strukturą  subtelną  widma  EPR.  Powinno  być  struktura 
2 5 obserwowanych  linii,  ponieważ  przejścia  pomiędzy  subtelna 
poziomami,  które  nie  są  kolejne,  są  bardzo  mało 
prawdopodobne.  Przykład  widma  ze  strukturą  sub- 
telną pokazany  jest  na  rys.  10. 

W monokryształach  wygląd  widma  zależy  ponadto 
od  orientacji  pola  magnetycznego  względem  osi  kry- 
stalograficznych. To  zjawisko  nosi  nazwę  anizotropii 
widma. 


Rys.  10.  Powstawanie  widma  EPR:  a)  bez  struktury  subtelnej, 
b)  z rozdzielonymi  pikami  struktury  subtelnej 


Często  się  zdarza,  że  jądro  atomowe,  wokół  które- 
go krąży  badany  elektron,  ma  różny  od  zera  spin 
jądrowy.  Energia  elektronu  zależy  wtedy  od  tego,  w ja- 
kim stanie  energetycznym  znajduje  się  aktualnie  mo- 
ment magnetyczny  jądra  atomowego.  Jest  to  zupełnie  struktura 
zrozumiałe,  bo  momenty  magnetyczne  jądra  i elek-  nadsubtelna 
tronu  mogą  oddziaływać  ze  sobą  zupełnie  tak  samo 
jak  małe  magnesy.  W takim  wypadku  liczba  dozwolo- 
nych poziomów  energetycznych  elektronu  wynosi 
(25+1) -(2/+1),  co  oczywiście  wpływa  na  wygląd 
widma;  obserwujemy  większą  liczbę  linii  rezonanso- 
wych. Taką  strukturę  widma  nazywamy  nadsubtelną. 

Przykład  widma  z dobrze  widoczną  strukturą  nadsub- 
telną (i  jednocześnie  subtelną)  pokazany  jest  na  rys.  1 1 . 


336 


absorpcja 


Rysunek  12  wyjaśnia  sposób  powstawania  takiego 
widma.  Z wzajemnej  odległości  linii,  które  są  skład- 
nikami struktury  nadsubtelnej,  można  wnioskować 


Rys.  11.  Widmo  EPR  jonów  Mns+  w apatycie.  Widoczne  są  linie 
należące  do  struktury  nadsubtelnej.  Wąska  linia  w środku  ry- 
sunku pochodzi  od  substancji  wzorcowej  (znacznika  pola  mag- 
netycznego) 


rzut  momentu  pędu 
na  kierunek  pola 
magnetycznego  (w  jedn.fr) 


elektronu  jądra 


% 

% 

_t/2 

-% 
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pele  magnetyczne 

Rys.  12.  Sposób  powstawania  widma  ze  strukturą  nadsubtelną 


o sile  oddziaływań  pomiędzy  momentem  magnetycz- 
nym jądra  i elektronu.  Jeśli  oddziaływanie  będzie 
słabe,  to  ruch  elektronu  będzie  tylko  nieznacznie  za- 
burzony i składowe  struktury  nadsubtelnej  widma 
będą  leżeć  blisko  siebie.  Może  się  zatem  zdarzyć,  że 
obserwacja  pojedynczych  linii  rezonansowych  bę- 
dzie niemożliwa,  a o istnieniu  oddziaływań  nadsub- 
telnych  będzie  świadczyć  tylko  zniekształcona  forma 
linii. 


Kształt  i szerokość  linii  NMR  i EPR 

Szerokość  linii  absorpcyjnej  dla  pojedynczego  mo- 
mentu magnetycznego  zależy  przede  wszystkim  od 
procesów  relaksacji.  Obserwowany  czas  relaksacji 
w różnych  materiałach  waha  się  od  kilku  mikrosekund 
do  kilku  minut  — w zależności  od  temperatury  i roi 
dzaju  próbki.  Pamiętajmy  jednak,  że  w rzeczywistej 
próbce  znajduje  się  bardzo  wiele  momentów  magne- 
tycznych, których  rezonans  obserwujemy  równocześ- 
nie. Może  się  zdarzyć,  że  w próbce  będzie  kilka  ro- 
dzajów momentów  magnetycznych,  rozmaicie  zorien- 
towanych, oddziałujących  ze  sobą  i z otoczeniem. 

Szczególnie  skomplikowana  sytuacja  występuje 
w kryształach.  Najczęściej  współczynnik  ^ zależy  od 
orientacji  pola  magnetycznego  względem  osi  krystalo- 
graficznych; mówimy,  że  w kryształach  g jest  wiel- 
kością tensorową.  Centra  magnetyczne  w krysztale 
mogą  mieć  rozmaite  otoczenia,  czyli  mogą  się  znaj- 
dować w nieco  różnych  warunkach,  np.  wskutek 
istnienia  defektów  sieci  krystalicznej,  lokalnych  na- 
prężeń. Z tego  powodu  każdy  moment  magnetyczny 
ma  nieco  inną  częstość  rezonansową.  Wtedy  zamiast 
„czystych”  linii  rezonansowych  obserwujemy  linie 


poszerzone,  które  są  sumą  wielu  linii  rezonansowych 
jeżących  blisko  siebie.  Ilustruje  to  rys.  13.  Ten  typ 
poszerzenia  krzywych  absorpcyjnych  nazywa  się  po- 


Rys.  13.  Linia  rezonansowa  poszerzona  niejednorodnie 


szerzeniem  niejednorodnym  (niehomogenicznym). 
Identyczny  efekt  może  się  pojawić  przy  niewłaściwym 
działaniu  spektrometru.  Zarejestrujemy  linie  posze- 
rzone, jeśli  pole  magnetyczne  w obszarze  próbki  bę- 
dzie niejednorodne  lub  gdy  nadajnik  będzie  wytwarzał 
jednocześnie  fale  o różnych  częstościach.  Kształt  linii 
poszerzonej  niejednorodnie  nie  jest  lorentzowski,  lecz 
np.  gaussowski  lub  zupełnie  nieregularny,  jak  w wy- 
padku proszków  otrzymanych  z monokryształów. 

Szerokość  naturalna  linii  absorpcyjnych  rezonan- 
su jądrowego  jest  na  ogół  bardzo  mała,  rzędu  ułamka 
Hz.  Zwykle  jednak  obserwowana  szerokość  linii, 
zwłaszcza  w ciałach  stałych,  jest  dużo  większa.  Odpo- 
wiedzialne są  za  to  przede  wszystkim  długozasięgowe 
oddziaływania  dipol-dipol.  Inne  rodzaje  oddziały- 
wań, np.  elektrostatyczne  lub  z drganiami  sieci  kry- 
stalicznej, są  silnie  wytłumione  (ekranowane)  przez 
elektrony  danego  jonu. 

Z inną  sytuacją  spotykamy  się  w badaniach  EPR. 
Tu  szerokość  linii,  a więc  i czas  relaksacji  są  określone 
głównie  przez  oddziaływania  z otoczeniem.  W krysz- 
tałach relaksacja  zachodzi  przy  udziale  drgań  sieci  — 
fononów.  Znamy  trzy  podstawowe  mechanizmy  re- 
laksacji spin-sieć.  Są  to:  relaksacja  Orbacha,  relaksa- 
cja Ramana  i proces  prosty.  Schematyczny  przebieg 
tych  trzech  procesów  relaksacyjnych  ukazuje  rys.  14. 
Jeśli  w procesie  relaksacji  prostej  (rys.  14a)  zamiast 
fononu  wyemitowany  zostanie  foton,  który  z kolei 
może  być  pochłonięty  przez  inny  jon,  wówczas  powie- 
my o relaksacji  spin-spin.  W eksperymencie  można 

£' 

poziomy  | 

wzbudzone  I 

4 

£ fl<0  o I 

fonon 


poziom 

fiw„  _£  podstawowy  n^F-E" 

a)  b> 

Rys.  14.  Schematyczny  przegląd  podstawowych  mechanizmów 
relaksacji  spin-sieó:  a)  relaksacja  prosta,  b)  relaksacja  Orbacha, 
c)  relaksacja  Ramana 

dość  łatwo  odróżnić  wpływ  różnych  procesów  re- 
laksacyjnych na  szerokości  linii.  Czas  relaksacji 
spin-spin  praktycznie  nie  zależy  od  temperatury,  na- 
tomiast prawdopodobieństwo  relaksacji  prostej  jest 
proporcjonalne  do  temperatury  próbki.  Prawdopodo- 
bieństwo relaksacji  typu  orbachowskiego  zależy  od 
temperatury  jak  e"J£:/fcT,  a relaksacji  typu  ramanow- 
skiego  — jak  T7  lub  T9.  Szerokość  linii  jest  proporcjo- 
nalna do  prawdopodobieństwa  relaksacji;  wynika  to 
z relacji  nieokreśloności : AE*  t ~ h,  czyli  ft-Ao-r  ss  h. 
W tym  wzorze  r oznacza  średni  czas  relaksacji, 
uwzględniający  wszystkie  możliwe  mechanizmy  re- 
laksacji. Obliczamy  go  ze  wzoru: 


■‘I  £ 

I foton 


poszerzenie 
linii  absorp- 
cyjnej 


relaksacja 

spira-sieó 
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E”  - fi  (Oq  + E’ 
c) 


22  - Encyklopedia  fizyki  współczesnej 
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czas  1/t  = 1/t  + 1/t  + 1/t  + 1/t  + 1/t, 

relaksacji  relaksacja  relaksacja  relaksacja  relaksacja  inne 

prosta  Orbacha  Ramana  spin-spin 

czyli 


Aco  = Aco  -f-  Aco  -j-  A co  4-  Aco  -f*  A co. 

procesy  relaksacja  relaksacja  relaksacja  inne 
proste  Orbacha  Ramana  spin-spin  mechanizmy 


Wróćmy  jeszcze  na  chwilę  do  wzoru  (4)  określają- 
cego kształt  linii  pochłaniania.  Jest  on  słuszny,  gdy 
moc  padającej  fali  elektromagnetycznej  nie  jest  zbyt 
duża.  Przy  dużej  mocy  padającego  promieniowania 
obserwuje  się  tzw.  nasycenie  rezonansu.  Jest  to  jeszcze 
jeden  z przejawów  kwantowego  charakteru  zjawiska, 
który  krótko  opiszemy. 

Początkowo  wiele  fotonów  zostaje  zaabsorbowa- 
nych i prawie  wszystkie  momenty  magnetyczne  próbki 
są  przeniesione  na  wyższy  poziom  energetyczny,  z któ- 
rego nie  zdążają  powrócić  do  stanu  podstawowego,  nasycenie 
Podstawowy  poziom  energetyczny  jest  więc  prawie  absorpcji  re-  I 
pusty  i nie  ma  momentów  magnetycznych,  które  by  zonansowej  1 
mogły  absorbować  następne  padające  fotony.  Rów- 
nież elektrony,  jony,  kompleksy  jonów  i inne  mikro- 
obiekty,  które  są  na  wyższym  poziomie  energetycznym 
nie  mogą  pochłaniać  energii,  gdyż  następne  dozwolo- 
ne poziomy  energii  leżą  zbyt  wysoko.  Zjawisko  nasy- 
cania absorpcji  rezonansowej  utrudnia  w pewnym 
stopniu  badania,  gdyż  nie  pozwala  na  użycie  fal 
elektromagnetycznych  o zbyt  dużej  intensywności; 
stad  konieczność  używania  spektrometrów  o bardzo 
wysokiej  czułości. 

Wspomnimy  jeszcze  o dającym  podobne  efekty  zakorkowa- 
zjawisku  „zakorkowania  fononowego”  (ang.  phonon  nie  fononowe 
bottle  neck ) lub  „wąskiego  gardła  fononowego”, 
obserwowanym  w EPR.  W bardzo  niskiej  temperatu- 
rze (poniżej  4 K)  relaksacja  może  zachodzić  jedynie 
przez  emisję  fononu  lub  fotonu.  Wszystkie  emitowane 
fonony  mają  tę  samą  energię  równą  ficoQ.  Oznacza  to. 


Ry.s; } 5 : PoIe  rezonansowe  jonu  chromu  Cr3+  w sieci  krystalicznej'  rubinu.  Z prawej  strony  rysunku  — płaszczyzna  krystalograficzna 
w której  przemieszczano  stałe  pole  magnetyczne.  Na  dole  — zależność  dozwolonych  wartości  energii  od  orientacji  zewnętrznego  pola 
magnetycznego  d.a  trzech  różnych  orientacji.  Liczby  1-2  itd.  oznaczają  numery  poziomów  energetycznych,  między  którvmi  zachodzi 
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że  wzbudzany  jest  tylko  jeden  rodzaj  drgań  sieci  kry- 
stalicznej. Zamiana  takiego  uporządkowanego  drga- 
nia sieci  na  drgania  chaotyczne  (cieplne)  trwa  dość 
długo,  niekiedy  czas  relaksacji  jest  rzędu  kilku  minut. 
W niskiej  temperaturze  kryształ  jest  „spokojny”,  jego 
sieć  krystaliczna  praktycznie  nie  drga.  Istnieje  tylko 
jedna  możliwość  odprowadzenia  nagromadzonego 
ciepła:  przez  powierzchnię  kryształu  (rozpad  drgań 
uporządkowanych  na  drgania  termiczne  może  też  za- 
chodzić na  defektach  sieci).  Ilość  drgań  określonego 
rodzaju  jest  jednak  ograniczona,  dlatego  obserwujemy 
taki  sam  efekt  jak  przy  nasycaniu  rezonansu  zbyt  dużą 
mocą  padającego  promieniowania. 


Zastosowania  EPS 

Wiele  zastosowań  EPR  wiąże  się  z fizyką  kryształów. 
Przypuśćmy,  że  dysponujemy  niemagnetycznym  kry- 
ształem, który  jest  domieszkowany  jonami  magnetycz- 
nymi. Mogą  to  być  jony  tytanu,  wanadu,  chromu, 
manganu,  żelaza,  kobaltu,  niklu,  miedzi  lub  ziem 
rzadkich.  Jony  takie  zachowują  się  jak  sondy,  które 
pozwalają  określać  parametry  elektrostatycznego  pola 
krystalicznego  w tym  miejscu  sieci  krystalicznej, 
w którym  się  znajduje  jon,  oraz  badać  możliwe  drga- 
nia sieci.  Wyjaśnimy  to  na  przykładzie  jonów  Cr3+ 
v/  sieci  krystalicznej  rubinu. 

Energia  momentu  magnetycznego  jonu  chromu 
jest  określona  nie  tylko  przez  zewnętrzne  pole  magne- 
tyczne, ale  i przez  pole  krystaliczne.  W konsekwencji 
dozwolone  wartości  energii  jonu  Cr3+  zależą  od  wiel- 
kości pola  magnetycznego  i od  orientacji  tego  pola 
określenie  względem  osi  krystalograficznych.  Wyjaśnia  to  bliżej 
poi®  żeń  rys.  15;  przedstawiono  na  nim  widmo  jonu  Cr3+ 
jonów  w A1203  (rubinie)  we  współrzędnych  biegunowych, 
domieszko-  A.by  otrzymać  taki  rysunek,  należy  wielokrotnie 
wych  powtórzyć  eksperyment  badając  widmo  EPR  w róż- 
nych kierunkach  w krysztale.  Rysunek  ten  ukazuje, 
w jakiej  płaszczyźnie  krystalograficznej  przemieszcza- 
ne było  pole  magnetyczne  podczas  eksperymentu. 
Z rys.  15  widać  ponadto,  jakie  elementy  symetrii  ma 
w sieci  krystalicznej  to  miejsce,  które  zajmuje  jon 
chromu.  Analizując  tego  typu  wyniki  eksperymental- 
ne, można  określać  położenia  wbudowanych  w sieć 
krystaliczną  jonów  domieszkowych.  Jeśli  jony  do- 
mieszkowe wbudowują  się  w różne  położenia  w krysz- 
tale, to  na  podstawie  kilku  nałożonych  widm  EPR 
określanie  można  próbować  określić  symetrię  kryształu  jako 
symetrii  całości.  Jest  to  więc  metoda  uzupełniająca  w stosunku 
kryształu  do  rentgenowskich  badań  strukturalnych. 

Spektroskopia  EPR  znalazła  jeszcze  wiele  innych  za- 
stosowań. Podjęto  np.  udane  próby  określania  za- 
wartości miedzi  w rudach.  Dokładność  pomiaru  wy- 
nosi ok.  5%.  Jonami,  których  rezonans  badano,  były 
jony  Cu++. 

Badając  widmo  EPR  w różnych  warunkach,  można 
wyciągać  wnioski  o defektach  struktury  krystalicznej 
badanie  (dyslokacje,  luki,  atomy  w pozycjach  między węzło- 
defektów  wych,  struktura  mozaikowa,  uszkodzenia  radiacyjne 
struktury  i in.),  których  rozmiary  są  zbyt  małe,  aby  mogły  być 
wykryte  defektoskopem  ultradźwiękowym.  Na  wy- 
gląd widma  mają  również  wpływ  naprężenia  we- 
wnątrz kryształu.  Można  więc  śmiało  powiedzieć,  że 
spektroskopia  EPR  bywa  pożytecznym  narzędziem 
do  badania  jakości  monokryształów. 


Wygląd  widma  EPR  jonów  jakiegoś  pierwiastka  za- 
leży od  wartościowości  tego  jonu.  Fakt  ten  jest  często 
wykorzystywany  przez  technologów  materiałów  mo- 
no krystalicznych  do  weryfikacji  hipotez  o rozmiesz- 
czeniu jonów  domieszki. 

W ostatnich  latach  coraz  większą  karierę  robi  spek- 
troskopia EPR  w badaniach  biologicznych  i bioche- 
micznych. Chodzi  tu  głównie  o badania  krwi  (hemo- 
globina zawiera  w swym  składzie  jony  żelaza)  oraz 
rozmaitych  reakcji  biochemicznych.  Te  ostatnie  ba- 
dania stawiają  szczególnie  wysokie  wymagania  co  do 
stosowanej  aparatury.  Przy  badaniach  reakcji  bio- 
chemicznych, zwłaszcza  z udziałem  wolnych  rodni- 
ków, zachodzi  potrzeba  otrzymywania  do  tysiąca 
widm  w ciągu,  sekundy.  Tylko  w ten  sposób  można 
prześledzić  przebieg  reakcji  i jej  kinetykę.  Wydaje  się, 
że  badania  tego  typu  mogą  być  pomocne  w zwalcza- 
niu raka,  a także  niektórych  chorób  psychicznych. 

Praktyczną  dziedziną  zastosowania  badań  EPR  jest 
burzliwie  rozwijająca  się  elektronika  kwantowa.  Wy- 
niki badań  rezonansu  paramagnetycznego  posłużyły 
konstruktorom  laserów  i maserów  oraz  wzmacniaczy 
o niskim  poziomie  szumów,  używanych  w radio- 
astronomii i telekomunikacji  satelitarnej. 


Rezonans  ferromagnetyczny 


Jest  to  pochłanianie  energii  pola  elektromagnetycz- 
nego przez  próbkę  ferromagnetyczną.  Istotną  różnicą 
w stosunku  do  poprzednio  opisanych  rezonansów  jest 
to,  że  w rezonansie  ferromagnetycznym  (FMR)  pre- 
cesję w polu  zewnętrznym  wykonuje  moment  magne- 
tyczny całej  próbki.  Momenty  magnetyczne  poszcze- 
gólnych cząstek,  z których  się  składa  próbka,  oddzia- 
łują ze  sobą  wzajemnie,  a skutkiem  tego  oddziaływa- 
nia jest  równoległe  ustawienie  wszystkich  momentów 
magnetycznych  w próbce.  Oddziaływania  te  nazywa- 
my wymiennymi.  Ich  natura  jest  czysto  kwantowa, 
nie  mają  one  odpowiednika  klasycznego.  Oddziały- 
wania wymienne  sprawiają,  że  próbka  jest  namagne- 
sowana nawet  w nieobecności  zewnętrznego  pola 
magnetycznego.  Nasz  fundamentalny  wzór  (2)  po- 
zostaje słuszny,  ale  należy  w nim  jakoś  uwzględnić 
pole  magnetyczne  istniejące  w próbce.  Okazuje  się, 
że  warunki  rezonansu  zależą  nie  tylko  od  właściwości 
materiału  próbki,  ale  i od  jej  kształtu.  Dokładne  roz- 
wiązanie można  uzyskać  tylko  w odniesieniu  do  pró- 
bek o kształcie  elipsoidy,  w szczególności  kuli. 
Szczegółowe  obliczenia  dotyczące  tego  problemu 
były  wykonane  po  raz  pierwszy  przez  C.  Kittela. 

Badanie  tego  rezonansu  ma  duże  znaczenie  w tech- 
nice: pozwala  wyznaczać  parametry  materiałów  uży- 
wanych do  budowy  transformatorów  i rdzeni  do  ce- 
wek, materiałów  służących  do  produkcji  pamięci 
maszyn  cyfrowych  oraz  materiałów  przeznaczonych 
na  trwałe  magnesy.  Metodami  FMR  bada  się  rów- 
nież materiały  przeznaczone  do  pracy  w podzespołach 
elektroniki  mikro  falowej  i telewizji  oraz  w projektowa- 
nych układach  pamięci  holograficznej. 

L.  A.  Kazicyna,  N.  B.  Kupletska  Metody  spektroskopowe 
wyznaczania  struktury  związków  organicznych , Warszawa  1974; 
C.  Kittel  Wstęp  do  fizyki  ciała  stałego , Warszawa  1976;  M.  Suff- 
czyński  Prześwietlanie  NMR , Post.  Fiz.  29, 245  (1978);  R.  Wadas 
Biomagnetyzm,  Warszawa  1978;  Encyklopedia  fizyki,  t.  3,  War- 
szawa 1974. 


Zjawisko  Mossbauera 

Andrzej  Hrynkiewicz 

Odkrycie  w 1957  r.  przez  R.  Mossbauera  zjawiska  badawczej,  zwanej  spektroskopią  mossbauerowską  lub 
bezodrzutowej  emisji  i absorpcji  promieniowania  y rezonansową  spektroskopią  promieniowania  y.  Dzięki 
dostarczyło  nauce  nowej,  niezwykle  owocnej  metody  bardzo  wysokiej  energetycznej  zdolności  rozdzielczej 
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rezonansowa  spektroskopia  promieniowania  y po- 
zwoliła wykonać  wiele  precyzyjnych  pomiarów  fizycz- 
nych o podstawowym  znaczeniu  poznawczym  oraz 
stała  się  powszechnie  stosowaną  metodą  w badaniach 
z dziedziny  fizyki  ciała  stałego,  chemii,  fizyki  jądrowej 
i biologii.  Coraz  szersze  jest  również  zastosowanie 
techniczne  zjawiska  Móssbauera,  czego  przykładem 
może  być  jego  wykorzystanie  do  kontroli  względnej 
prędkości  i regulacji  procesu  zbliżania  się  dwóch  po- 
jazdów kosmicznych. 

Pogląd,  że  wiązanie  krystalochemiczne  nie  ma  wpły- 
wu na  przebieg  procesów  jądrowych,  już  dawno  oka- 
zał się  niesłuszny.  Co  prawda  w większości  wypadków, 
badając  procesy  jądrowe,  można  atom  wchodzący 
w skład  związku  chemicznego  traktować  jako  swo- 
bodny, gdyż  energia  wiązania  chemicznego  jest  na  ogół 
zaniedbywalnie  mała  w porównaniu  z energią  nawet 
niskoenergetycznych  przejść  jądrowych.  Jednak  wpływ 
wiązań  chemicznych  i struktury  krystalicznej  na  nie- 
które procesy  jądrowe  dobrze  znano  przed  odkryciem 
zjawiska  Móssbauera.  Przykładami  mogą  być:  za- 
burzenia korelacji  kierunkowych  promieniowania  y 
przez  wewnątrzkrystaliczne  pola  magnetyczne  lub 
elektryczne,  wpływ  struktury  ciał  stałych  na  anihilację 
pozytonów  lub  wpływ  wiązania  chemicznego  na 
prawdopodobieństwo  wychwytu  elektronu  przez 
jądro  atomowe.  Dopiero  jednak  odkrycie  zjawiska 
Móssbauera  pozwoliło  na  badanie  bezpośredniego 
wpływu  wiązań  chemicznych  i struktury  krystalicznej 
na  energię  promieniowania  emitowanego  w przejś- 
ciach jądrowych.  Typowa  zdolność  rozdzielcza  osiąga- 
na w spektroskopii  móssbauerowskiej  jest  rzędu  10" 12, 
co  znaczy,  że  w przypadku  fotonów  promieniowania 
y o energii  100  keV  mogą  być  obserwowane  zmiany 
energetyczne  rzędu  10"7eV.  Tę  wielkość  należy  po- 
równać z charakterystycznymi  energiami  drgań  sieci 
krystalicznej  wynoszącymi  0,01-0,1  eV. 

Aby  wyjaśnić,  na  czym  polega  zjawisko  Móssbaue- 
ra, należy  zacząć  od  omówienia  zjawiska  emisji  i re- 
zonansowej absorpcji  fotonów. 


Rezonansowa  absorpcja  i rozpraszanie 
promieniowania 

Zjawisko  rezonansu  występuje  wówczas,  gdy  pewne- 
mu układowi  dostarczymy  dokładnie  takiej  ilości 
energii,  jaka  jest  potrzebna,  aby  ten  układ  przeszedł 
z niższego  na  wyższy  poziom  energetyczny.  Najczęś- 
ciej mamy  do  czynienia  z przejściem  układu  z poziomu 
podstawowego  na  któryś  z jego  poziomów  wzbudzo- 
nych. Gdy  dany  układ  będziemy  naświetlać  wiązką 
promieniowania  o takiej  długości  fali,  że  energia 
kwantów  promieniowania  będzie  odpowiadać  różnicy 
energii  między  stanem  wzbudzonym  i podstawowym, 
to  zaobserwujemy  absorpcję  promieniowania,  której 
towarzyszy  przechodzenie  układu  do  stanu  wzbudzo- 
nego. Zjawisko  to  nosi  nazwę  absorpcji  rezonansowej. 
Wzbudzony  układ,  wracając  do  stanu  podstawowego 
emituje  promieniowanie  o tej  samej  długości  fali,  lecz 
na  ogół  w innym  kierunku  niż  kierunek  padającej 
wiązki  promieniowania,  czyli  następuje  zjawisko  roz- 
praszania, które  w tym  wypadku  nazywamy  rozpra- 
szaniem rezonansowym. 

Przedstawiony  opis  zjawisk  jest  ścisły  tylko  wów- 
czas, gdy  masa  rozpatrywanego  układu  jest  nieskoń- 
czenie wielka  w porównaniu  z masą  odpowiadającą 
energii  absorbowanych  i rozproszonych  kwantów. 
Jeśli  chodzi  o atomy,  to  warunek  ten  jest  spełniony 
w wystarczająco  dobrym  przybliżeniu,  toteż  w optyce 
atomowej  absorpcja  i rozproszenie  rezonansowe  mogą 
być  zaobserwowane  bez  trudności.  Łatw-o  jest  wyko- 
nać następujące  doświadczenie.  Z lampy  sodow-ej, 
w której  świeci  rozgrzana  para  sodu,  rzucamy  wiązkę 
charakterystycznego  dla  sodu  żółtego  światła  na 
szklane  naczynie  wypełnione  również  parą  sodu  w niż- 
szej temperaturze.  Ponieważ  kwanty  światła  emitowa- 
ne z lampy  przez  pobudzane  w niej  do  świecenia  ato- 
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my  posiadają  energię  właśnie  taką,  jaka  jest  potrzebna 
do  wzbudzenia,  znajdujących  się  w stanie  podstawo- 
wym, atomów  sodu  w naczyniu,  następuje  absorpcja 
rezonansowa  podającego  światła.  Wiązka  światła  zo- 
staje w zasadzie  całkowicie  pochłonięta  w cienkiej 
warstwie  pary.  Pobudzane  atomy  tej  warstwy,  wra- 
cając do  stanu  podstawowego,  rozpraszają  rezonan- 
sowo  światło,  tak  że  warstwa  pochłaniająca  pierwotną 
wiązkę  sama  staje  się  źródłem  intensywnego  żółtego 
promieniowania. 

Analogicznego  zjawiska  można  by  się  spodziewać  absorpcja 
w fizyce  jądrowej.  Można  by  przypuszczać,  że  np.  i rozprosze- 
promieniowanie  y o energii  411  keV  emitowane  przez  nie  rezonan- 
rtęć  198Hg  będzie  silnie  absorbowane  rezonansowo  sowę  w fizy- 
w cienkiej  warstwie  rtęci  umieszczonej  na  drodze  ce  jądrowej 
wiązki  promieni  y.  Tak  jednak  zaprojektowane  do- 
świadczenie nie  daje  oczekiwanego  wyniku.  Aby  wy- 
tłumaczyć, dlaczego  absorpcję  rezonansową  można 
z łatwością  obserwować  w optyce,  a analogiczne  do- 
świadczenie w fizyce  jądrowej  nie  daje  rezultatu,  trzeba 
rozważyć  dokładniej  procesy  emisji  i absorpcji  pro- 
mieniowania a w szczególności  rozpatrzeć  konsek- 
wencje faktu,  że  energia  kwantu  promieniowania  y 
nie  może  być  pominięta  w porównaniu  z masą  emitu- 
jącego go  jądra  atomowego. 


Naturalna  szerokoSć  linii  widmowej 


Fotony  promieniowania  emitowanego  przez  zbiór 
tego  samego  rodzaju  atomów  lub  jąder  nie  mają  jed- 
nakowej, ściśle  określonej  energii.  Jest  to  konsekwen- 
cją zasady  nieoznaczoności  Heisenberga,  która  wiąże 
nieoznaczoność  energii  AE  i czasu  At  wzorem: 

AE-At  — h, 

gdzie  h = 6,6  • 10" 16  eV  • s jest  stałą  Plancka  podzieloną  rozmycie 
przez  2n.  Z zasady  nieoznaczoności  wynika,  że  roz-  energetyczne 
mycie  energetyczne  atomowego  lub  jądrowego  poziomu 
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Rys.  1 . Naturalny  kształt 

linii  widmowej  energia  E 


poziomu  jest  odwrotnie  proporcjonalne  do  jego  śred- 
niego czasu  życia  r.  Rozmyciu  energetycznemu  po- 
ziomu odpowiada  rozmycie  linii  widmowej  emitowa- 
nego promieniowania.  Na  wykresie  przedstawiającym 
zależność  liczby  emitowanych  fotonów  od  ich  energii 
(rys.  1)  linia  widmowa  ma  kształt  krzywej  Lorentza 


N(E)  — const 


r 

(E-£o)*-K/72)2  * 


gdzie  E0  jest  najbardziej  prawdopodobną  energią 
fotonów  emitowanych  w danym  przejściu.  Szerokość 
krzywej  r w połowie  wysokości,  charakteryzująca 
rozmycie  linii  widmowej,  jest  zgodnie  z zasadą  nie- 
oznaczoności związana  ze  średnim  czasem  życia  po- 
ziomu r za  pomocą  wzoru : 

r = */t  (i) 

i nosi  nazwę  naturalnej  szerokości  linii  widmowej. 

W przypadku  atomów  sodu  emitujących  linię  żół- 
tego światła  o długości  fali  589  nm  średni  czas  życia 
t = 1,5*  10-8  s,  a więc  naturalna  szerokość  linii 
wynosi  r = 4,4- 10~8  eV.  W przypadku  promienio- 
wania y rtęci  189Hg  średni  czas  życia  jądra  w stanie 
wzbudzonym  411  keV  r = 2*  10" 11  s i obliczona  z wzo- 
ru (1)  naturalna  szerokość  linii/7  = 3,3- 10"5  eV.  In- 


teresujące  jest  porównanie  w obu  wypadkach  względ- 
nych szerokości  linii  widmowych,  to  jest  stosunków 
szerokości  linii  do  odpowiednich  energii  przejść.  Dla 
atomowego  przejścia  w sodzie  energia  fotonów  pro- 
mieniowania jest  równa  2,1  eV  czyli  r/E  — 2-10"8, 
a dla  jądrowego  przejścia  w rtęci  r/E  = 8- 10“ n. 
Względna  szerokość  linii  jest  miarą  dokładności, 
z jaką  można  by  wyznaczyć  energię  przejść,  gdyby 
doświadczenie  pozwoliło  na  obserwację  naturalnej 
szerokości  linii.  Na  ogół  linia  widmowa  ulega  dodat- 
kowemu, znacznemu  poszerzeniu  wskutek  wielu  zja- 
wisk zachodzących  w badanych  substancjach.  Naj- 
bardziej istotne  dla  dalszych  rozważań  jest  tak  zwane 
poszerzenie  dopplerowskie,  wywołane  ruchem  ciepl- 
nym atomów  emitujących  promieniowanie. 

Dopplerowskie  poszerzenie  linii 
widmowych 

Jeżeli  promieniujący  atom  porusza  się  z prędkością  v 
w kierunku  obserwatora,  to  występuje  efekt  Dopplera 
polegający  na  tym,  że  obserwowana  energia  fotonu 
ulega  zmianie  o 

AE  — Ev/c9 

gdzie  E jest  energią  fotonu  w układzie  związanym 
z poruszającym  się  atomem,  a c prędkością  światła 
= 3-108  m/s. 

W ruchu  cieplnym  atomów  reprezentowane  są 
różne  prędkości  i różne  kierunki  ruchu,  co  prowadzi 
do  poszerzenia  (rozmycia)  linii  widmowej.  Ze  wzros- 
tem temperatury  średnia  prędkość  ruchu  cieplnego 
rośnie  i wywołane  przez  efekt  Dopplera  poszerzenie 
linii  staje  się  coraz  większe.  Poszerzenie  to,  zwane 
temperaturowym,  dla  źródła  gazowego  w temperatu- 
rze bezwzględnej  T może  być  w przybliżeniu  obliczone 
z wzoru 


poszerzenie  gdzie  A:  = 8,62-10-5  eV/K  jest  stałą  Boltzmanna, 
tempera  tu-  a M — masą  emitującego  atomu.  W temperaturze 
rowe  pokojowej  T x 300  K dla  przejść  optycznych  w so- 
dzie D = 3,7-  10“e  «Vt  a dla  przejść  y w rtęci  D = 
= 0,27  eV.  W obu  wypadkach  poszerzenie  tempera- 
turowe wielokrotnie  przewyższa  naturalną  szerokość 
linii. 

Odrzut  spowodowany  emisją  lub  absorpcją 
promieniowania 

Atom  lub  jądro  emitujące  foton  promieniowania 
doznaje  odrzutu,  którego  energia  może  być  obliczona 
z zasady  zachowania  pędu.  Pęd  odrzutu  p musi  być 
równy  pędowi  EJc  emitowanego  fotonu.  Ponieważ 
energia  odrzutu  Er  = pz/2M , więc 


Rys.  2.  Efekt  odrzutu  przy  emisjii  absorpcji  fotonu 


Zgodnie  z zasadą  zachowania  energii  emitowany 
foton  ma  energię  E'  niższą  od  energii  wzbudzenia  £0, 
gdyż  część  energii  przejścia  zostaje  zużyta  na  odrzut 
E'  = Eo—Er.  Podobnie,  w procesie  absorpcji,  atom 
lub  jądro  pochłaniające  foton  również  doznaje  od- 
rzutu, a więc  energia  fotonu,  który  mógłby  być  re- 
zonansowo  zaabsorbowany,  musi  mieć  energię  E" 
wyższą  o Er  od  energii  wzbudzenia  E0.  Jak  stąd  widać,  niedopaso- 
występuje  niedopasowanie  energetyczne  fotonów  emi-  wanie  ener- 
towanych  i absorbowanych  o wartość  2 Er.  Tę  sytuację  getyczne 
przedstawiono  na  rys.  2.  fotonów 


Warunki  obserwacji  absorpcji  rezonansowej 

Jeżeli  przesunięcie  energetyczne  2 Er  linii  emisji  i ab- 
sorpcji jest  mniejsze  od  szerokości  naturalnej  linii,  to 
absorpcja  rezonansowa  może  być  łatwo  zaobserwo- 
wana. Zachodzi  to  w przypadku  przejść  optycznych. 
Dla  sodu  r = 4,4*  10"8  eV  a 2Er  = 2- 10"10  eV  czyli 
r > 2 Er,  co  tłumaczy  pozytywny  rezultat  opisanego 
poprzednio  prostego  doświadczenia  z absorpcją  i rozp- 
praszaniem  rezonansowym  żółtej  linii  w parze  sodu. 

Dla  przejść  y odrzut  jądra  jest  tak  duży,  że  niedo- 
pasowanie energetyczne  2 Er  znacznie  przekracza 
szerokość  naturalną  linii.  Wystarczy  dla  przejścia  y 
w rtęci  porównać  2 Er  = 0,92  eV  i r = 3,3 -10-5  eV. 
Przesunięcie  energetyczne  wskutek  odrzutu  jest  30  000 
razy  większe  od  szerokości  naturalnej  linii.  Nic  więc 
dziwnego,  że  doświadczenia  z promieniowaniem  y , 
przeprowadzone  w sposób  analogiczny  do  doświad- 
czeń z dziedziny  optyki,  nie  mogą  się  udać. 

Od  1950  r.  wykonano  wiele  pomysłowych  ekspery- 
mentów w celu  zaobserwowania  absorpcji  i rozpra- 
szania rezonansowego  promieniowania  y.  We  wszyst- 


Rys.  3.  Poszerzenie  temperaturowe  linii  widmowych  umożliwia 
obserwację  absorpcji  rezonansowej 

kich  tych  doświadczeniach  starano  się  różnymi  meto-  sposoby 
darni  skompensować  przesunięcia  energetyczne  2 Er.  kompensacji 
Jedna  z metod  polegała  na  wykorzystaniu  dopple-  przesunięcia 
rowskiego,  temperaturowego  poszerzenia  linii.  W wy-  energetycz- 
sokich  temperaturach  poszerzenie  temperaturowe  nego 
staje  się  tak  duże,  że  skrzydła  linii  emisji  i absorpcji 
pokrywają  się  w pewnym  stopniu  i obserwacja  absorp- 
cji rezonansowej  staje  się  możliwa.  Prawdopodobień- 
stwo absorpcji  rezonansowej  jest  dane  przez  stosunek 
powierzchni  zakreskowanej  na  rys.  3 do  całkowitej 
powierzchni  linii  widmowej. 

Inna  metoda  skompensowania  przesunięcia  energe- 
tycznego polega  na  nadaniu  źródłu  w aparaturze  po- 
miarowej dużej  prędkości  w kierunku  absorbenta. 

Przy  dostatecznej  prędkości  tego  ruchu,  przesunięcie 
linii  emisji  powstające  wskutek  efektu  Dopplera, 
powoduje  jej  pokrycie  się  z linią  absorpcji  i zjawisko 
rezonansu  może  być  zaobserwowane.  Całkowite 
skompensowanie  niedopasowania  energetycznego  wy- 
maga stosowania  bardzo  dużych  prędkości.  W przy- 
padku 198Hg  jest  to  prędkość  ok.  700  m/s.  Prędkości 
tego  rzędu  realizuje  się  za  pomocą  rotora  o bardzo 
wysokiej  częstości  obrotów,  na  którego  ramionach 
znajdują  się  źródła,  a skolimowana  przez  układ  prze- 
słon ołowianych  wiązka  promieni  y wylatuje  stycznie 
do  obwodu  koła,  po  którym  źródła  się  poruszają. 
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Można  również  do  skompensowania  rozsunięcia 
linii  emisji  i absorpcji  wykorzystać  ruch  jąder  wywo- 
łany przez  odrzut  w jakimś  procesie  jądrowym  bez- 
pośrednio poprzedzającym  emisję  promieniowania  y. 
Takimi  procesami  mogą  być  rozpad  /?,  wychwyt 
elektronu  lub  jakaś  reakcja  jądrowa. 

Odkrycie  zjawiska  bezodrzutowej  emisji  i absorpcji 
promieniowania  y przez  jądra  w kryształach  stwo- 
rzyło zupełnie  nowe  możliwości  badania  absorpcji  re- 
zonansowej promieniowania  y,  wywołało  lawinę  prac 
naukowych  o podstawowym  znaczeniu  w różnych 
dziedzinach  fizyki,  a R.  Móssbauerowi  przyniosło 
nagrodę  Nobla  w 1961  r. 


Zjawisko  bezodrzutowej  emisji  i absorpcji 
promieniowania 

W 1957  r.  R.  Mossbauer  rozpoczął  w Heidelbergu 
doświadczenie  nad  rezonansową  absorpcją  promienio- 
wania y.  Badał  rozpraszanie  rezonansowe  linii  129  keV 
191Ir.  Ponieważ  przesunięcie  energetyczne  2 Er  jest 
w tym  wypadku  w przybliżeniu  równe  poszerzeniu 
temperaturowemu  linii  y w temperaturze  pokojowej, 
linie  emisji  i absorpcji  pokrywały  się  w znacznym 
stopniu  i efekt  rezonansowy  był  obserwowany, 
doświadczę-  Mossbauer  obniżył  temperaturę  źródła  i absorben- 
nie  JVIass-  ta,  spodziewając  się  zmniejszenia  efektu.  Tymczasem 
bauera  rozproszenie  rezonansowe  wzrosło!  Mossbauer  wy- 
tłumaczył ten  zaskakujący  efekt  na  podstawie  znanej 
od  20  lat  teorii  Lamba  wpływu  wiązania  atomów 
w sieci  krystalicznej  na  przekrój  czynny  chwytania 
powolnych  neutronów  i wykazał  w pięknym  ekspery- 
mencie, że  dość  znaczny  ułamek  promieniowania  y 
irydu  nie  wykazuje  przesunięcia  energetycznego,  wy- 
wołanego przez  odrzut  jąder,  ani  też  dopplerowskiego 
poszerzenia  temperaturowego.  Obserwowana  linia  y 
ma  szerokość  naturalną.  Brak  przesunięcia  energe- 
tycznego tłumaczy  się  tym,  że  w pewnej  części  przy- 
padków pęd  odrzutu  atomu  związanego  w sieci  kry- 
stalicznej, towarzyszący  emisji  lub  absorpcji  fotonu  y, 
zostaje  przejęty  przez  cały  kryształ.  Wówczas  we 
wzorze  (2)  na  energię  odrzutu  zamiast  masy  atomu  M 
wystąpi  masa  całego  kryształu.  Nawet  w bardzo 
drobnym  proszku  krystalicznym  poszczególne  ziarna 
zawierają  tak  wielką  liczbę  atomów,  że  energia  odrzutu 
staje  się  zaniedby walnie  mała,  o wiele  mniejsza  od 
naturalnej  szerokości  linii  widmowej.  Zjawisko  emisji 
i absorpcji  można  wtedy  traktować  jako  procesy 
bezodrzutowe.  Dopasowanie  energii  fotonów  emito- 
wanych i absorbowanych  jest  idealne,  a więc  spełnione 
są  warunki  obserwacji  absorpcji  rezonansowej. 

Zniknięcie  poszerzenia  dopplerowskiego  wywoła- 
nego ruchami  termicznymi  atomów  jest  spowodowane 
dużą  częstością  drgań  atomów  w sieci  krystalicznej 
(co  a 1013  s-1).  W ciągu  czasu  życia  wzbudzonego 
stanu  jądrowego  średnia  wartość  składowej  prędkości 
atomu  w kierunku  emisji  fotonu  jest  równa  zeru 
i efekt  Dopplera  pierwszego  rzędu  nie  występuje. 

Wielkość  zjawiska  Móssbauera  zależy  od  prawdo- 
podobieństwa, że  pęd  odrzutu  zostanie  przejęty  przez 
cały  kryształ.  Prawdopodobieństwo  to  może  być  obli- 
czone na  podstawie  określonego  modelu  sieci  krysta- 
licznej. Ponieważ  na  energię  kryształu  składa  się 
energia  ruchów  drgających  atomów  wokół  położeń 
równowagi,  możemy  kryształ  traktować  jako  zbiór 
oscylatorów,  których  częstości  drgań  co  zawarte  są  w 
pewnym  przedziale.  Zmiana  energii  kryształu  polega 
na  tworzeniu  lub  niszczeniu  kwantów  hco  zwanych 
fononami,  czemu  towarzyszy  odpowiednia  zmiana 
liczb  kwantowych  oscylatorów.  Bezodrzutowa  emisja 
lub  absorpcja  fotonu  y zachodzi  wówczas,  gdy  odrzut 
atomu  nie  prowadzi  do  wzbudzenia  sieci  krystalicz- 
nej czyli  do  kreacji  fononów,  a pęd  odrzutu  jest  prze- 
prawdopodo-  jęty  przez  cały  kryształ. 

bieństwo  Prawdopodobieństwo  zjawiska  Móssbauera  można 
zjawiska  określić  przez  podanie  stosunku  liczby  fotonów  y 
Móssbauera  emitowanych  bezodrzutowo  do  całkowitej  liczby  fo- 
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tonów  y.  Ułamek  ten  zwany  czynnikiem  Debye’a-  czynnik 
Wallera,  obi  iczony  na  gruncie  debye’owskiego  modelu  pebye'a-1 
sieci  krystalicznej,  wyraża  się  wzorem  tera 

eiT 

/—{-•£ Mt)7  « 

o 

gdzie  0 jest  temperaturą  Debye’a  danego  kryształu 
związaną  z maksymalną  częstością  drgań  atomów 
coma.x  zależnością  0 = com^jk.  Czynnik  /,  jak  widać 
ze  wzoru  (3),  jest  tym  większy,  im  mniejsza  jest  ener- 
gia odrzutu  jądra,  im  wyższa  temperatura  Debye’a 


Rys.  4.  Zależność  czynnika  Debye’a-Wallera  od  temperatury  dla 
przejść  14,4  kcV  w jądrach  żelaza  67Fe  i 134  keV  w jądrach 
renu  187Re 

i w im  niższej  temperaturze  T przeprowadzany  jest 
eksperyment.  Na  rys.  4 pokazana  jest  zależność  czyn- 
nika Debye’a~Wallera  od  temperatury  dla  przejść 
14,4  keV  w 57Fe  i 131  keV  w 187 Re.  Gdy  wartości  / 
są  małe,  doświadczenie  należy  przeprowadzać  w tem- 
peraturze ciekłego  azotu  lub  nawet  ciekłego  helu. 


Technika  pomiarów  w rezonansowej 
spektroskopii  promieniowania  y 

W celu  zbadania  kształtu  linii  promieniowania  y ko- 
rzystamy z efektu  Dopplera.  Typowa  aparatura 
móssbauerowska  jest  przedstawiona  na  rys.  5.  Składa 

źródto  absorbent  detektor 


się  ona  ze  źródła,  absorbenta  i detektora  promieni  y, 
którym  najczęściej  jest  licznik  scyntylacyjny.  Źródło 
umieszczone  w ruchomym  uchwycie  można  wprawiać 
w ruch  względem  absorbenta  za  pomocą  odpowied- 
niego mechanizmu.  Ruch  źródła  musi  być  jednostaj- 
ny, przy  czym  powinna  być  zapewniona  możliwość 
nadawania  różnych  prędkości.  Gdy  źródło  i absorbent 
mają  identyczną  strukturę  chemiczną  i pozostają 
względem  sobie  w spoczynku,  energie  linii  emisji 
i absorpcji  są  do  siebie  dopasowane,  absorpcja  rezo- 


nansowa  jest  maksymalna  i detektor  rejestruje  naj- 
mniejszą liczbę  fotonów.  Gdy  nadamy  źródłu  pewną 
prędkość  v,  efekt  Dopplera  psuje  dopasowanie  energii 


Rys.  6.  Zależność  liczby  transmitowanych  fotonów  od  względnej 
prędkości  ruchu  źródła  i absorbenta 


o AE  = Evjc.  Absorpcja  rezonansowa  maleje  i de- 
tektor rejestruje  więcej  fotonów  przechodzących 
przez  absorbent.  W ten  sposób  wyznaczając  szybkość 
zliczeń  w zależności  od  prędkości  źródła  N(v)  otrzy- 
mujemy kształt  linii  promieniowania  y (rys.  6),  z tym 
że  ma  ona  podwójną  szerokość  naturalną  ir  w wy- 
niku nakładania  się  linii  emisji  i absorpcji  — każdej 

0 szerokości  naturalnej  r. 

Prędkości  z jakimi  mamy  do  czynienia  w spektro- 
skopii móssbauerowskiej  są  na  ogół  małe.  Przy  energii 
przejścia  y 50  keV  przesunięcie  energii  o naturalną 
szerokość  linii  /"dla  stanu  jądrowego  o średnim  czasie 
życia  10" 10  s odpowiada  prędkości  względnego  ruchu 
źródła  i absorbenta  4 cm/s;  w przypadku  średniego 
czasu  życia  10" 6 s będzie  to  prędkość  4 pm/s. 

Należy  podkreślić,  że  oprócz  jądrowej  absorpcji 
rezonansowej,  promieniowanie  y jest  pochłaniane 

1 rozpraszane  w absorbencie  wskutek  oddziaływania 
z elektronami.  Efekt  Móssbauera  występuje  więc  tym 
silniej,  im  większa  jest  koncentracja  nuklidu  móssbau- 
erowskiego.  W celu  zwiększenia  efektu  stosuje  się 
często  absorbenty  wzbogacone  w badany  izotop. 


Nuklidy  móssfoanerowskie 

Zjawisko  Móssbauera  zostało  dotychczas  zaobserwo- 
wane dla  100  przejść  y w 80-ciu  izotopach  44  pier- 
wiastków chemicznych.  Liczba  ta  jest  ograniczona 
z następujących  względów : 

— Energia  przejścia  y nie  może  przekraczać  ok. 
150  keV,  gdyż  dla  wyższych  energii  emitowanych  fo- 
tonów prawdopodobieństwo  procesu  bezodrzutowe- 
go  staje  się  zbyt  małe,  by  efekt  Móssbauera  mógł  być 
obserwowany. 

— Przejście  y musi  prowadzić  do  stanu  podstawo- 
wego stabilnego  nuklidu  lub  nuklidu  o tak  długim 
czasie  życia,  aby  móc  rozporządzać  dostateczną  ilo- 
ścią materiału  dla  zrobienia  absorbenta. 

— Móssbauerowski  stan  jądrowy  musi  być  osią- 
gany w rozpadzie  promieniotwórczym  macierzystego 
nuklidu  o dostatecznie  długim  czasie  życia  w porów- 
naniu z czasem  trwania  eksperymentu.  żeby  źródło 
promieniowania  y nie  wyczerpało  się  zbyt  szybko. 

— Czas  życia  stanu  móssbauerowskiego  nie  może 
być  zbyt  długi  ponieważ  związana  z tym  bardzo  mała 
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Rys.  8.  Schematy  rozpadów  jąder  żelaza  J7Fe  i cyny  mSn 
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Rys.  7.  Nuklidy,  dla  których  obserwowano  przejścia  mossbauerowskie , na  tle  układu  okresowego 


343 


transmisja 


szerokość  linii  mossbauerowskiej  wymaga  stosowa- 
nia specjalnych  środków  ostrożności,  aby  występu- 
jące w laboratorium  drgania  nie  zniszczyły  warunków 
rezonansu.  To  ogranicza  zbiór  potencjalnych  kandy- 
datów dla  spektroskopii  mossbauerowskiej  do  jąder, 
w których  średni  czas  życia  stanu  wzbudzonego  jest 
krótszy  od  10" 5 s.  Najdłużej  żyjącym  stanem,  dla  któ- 
rego został  dotychczas  przeprowadzony  eksperyment 
mossbauero wski , jest  stan  w «7Zn  o średnim  czasie 
życia  9,3  jis  i o energii  wzbudzenia  dziewięćdziesiąt 
trzy  keV. 

Rysunek  7 przedstawia  układ  periodyczny  pierwia- 
stków z oznaczeniem  przypadków  obserwacji  zjawi- 
ska Móssbauera.  Na  ryś.  8 podane  są  schematy  po- 
ziomów 57Fe  i 11BSn,  których  związki  chemiczne  są 
najczęstszymi  obiektami  badań  spektroskopii  moss- 
bauerowskiej. Oba  te  nuklidy  bardzo  dobrze  speł- 
niają przytoczone  wyżej  cztery  warunki. 


Przesunięcie  i rozszczepienia  linii 
w widmach  móssbauerowskich 


Przesunięcie  izomeryczne  (chemiczne) 
linii  promieniowania  y 

Maksimum  absorpcji  rezonansowej  można  obserwo- 
wać przy  prędkości  v = 0 względnego  ruchu  źródła 
i absorbenta  tylko  wówczas,  gdy  źródło  i absorbent 
mają  identyczną  strukturę  chemiczną  i krystaliczną 
i gdy  znajdują  się  w tej  samej  temperaturze. 

Różne  otoczenia  chemiczne  badanych  jąder  powo- 
dują wzajemne  przesunięcie  linii  emisji  i absorpcji, 
zw.  przesunięciem  izomerycznym.  W tym  wypadku 
maksimum  absorpcji  rezonansowej  można  obserwo- 
wać przy  prędkości  różnej  od  zera.  Przesunięcie  izo- 
meryczne wywołane  jest  różnicą  energii  oddziaływa- 
nia elektrostatycznego  elektronów  z ładunkiem  jądra 
w atomach  źródła  i absorbenta.  Składają  się  na  nie 
dwa  czynniki:  różnica  gęstości  ładunku  elektrycznego 
elektronów  w obszarze  jądra  w źródle  i w absorben- 
cie  oraz  różnica  rozmiarów  jądra  w stanie  wzbudzo- 
nym i podstawowym. 

Rolę  obu  tych  czynników  widać  we  wzorze  na  war- 
tość przesunięcia  izomerycznego : 


Spektroskopia  móssbauerowska  jest  jedyną  metodą 
badawczą  pozwalającą  na  bezpośrednią  obserwację 
przesunięć  izomerycznych  i nadsubtelnej  struktury 
linii  promieniowania  y.  Pozwala  na  to  wyjątkowa 
energetyczna  zdolność  rozdzielcza.  Miarą  jej  jest  sto- 
sunek obserwowanej  szerokości  linii  do  energii  przej- 
ścia. W przypadku  57Fe  stosunek  ten  jest  równy 
3,2  T0~13.  Uwzględniając  fakt,  że  precyzyjna  apara- 
dekładność  tura  móssbauerowska  pozwala  stwierdzić  przesunięcie 
metody  linii  z górą  sto  razy  mniejsze  od  jej  szerokości  natu- 
móssbauero-  ralnej,  otrzymujemy  dokładność  pomiaru  rzędu 
wskiej  10-15,  z czym  nie  może  rywalizować  żaden  inny  po- 
miar w fizyce.  Dobrze  to  zilustruje  następujący  przy- 
kład. Gdyby  udało  się  zmierzyć  odległość  od  Ziemi 
do  Słońca  (1 50  min  km)  z dokładnością  do  1 mm,  to  ta 
dokładność  byłaby  jeszcze  kilkakrotnie  mniejsza  niż 
zdolność  rozdzielcza  osiągana  w spektroskopii 
mossbauerowskiej  związków  Fe.  Zastosowanie  nu- 
klidu móssbauerowskiego  o krótszym  czasie  życia 
stanu  wzbudzonego  (np.  «7Zn)  pozwoliłoby  na  zwięk- 
szenie zdolności  rozdzielczej  jeszcze  o kilka  rzędów 
wielkości. 

Oddziaływanie  jąder  z otoczeniem  w sieci  krysta- 
licznej prowadzi  na  ogół  do  przesunięć,  poszerzeń 
lub  rozszczepień  linii  promieniowania  y.  Przykła- 


dowe, skomplikowane  widmo  móssbauerowskie  po- 
kazane jest  na  rys.  9.  Równocześnie  występowanie 
tych  efektów  w źródle  i absorbencie  bardzo  kompli- 
kuje analizę  widm.  Dla  uproszczenia  interpretacji  zło- 
żonego widma  stosujemy  standardowe  źródła  dające 
pojedynczą,  możliwie  wąską  linię  emisji.  Obserwo- 
wane wówczas  poszerzenia  i rozszczepienia  linii  mo- 
żemy przypisać  wyłącznie  absorbentowi  i wniosko- 
wać z nich  o sytuacji,  w jakiej  się  tam  znajdują  badane 
jądra. 
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<5  = -y-ZeKK-R2p)  [!^a(0)|2-|^(0)I2], 

gdzie  Rw  i Rp  są  średnimi  promieniami  jądra  w sta- 
nach wzbudzonym  i podstawowym,  a kwadraty 
funkcji  falowych  elektronów  |y>a(0)J2  i |^(0)]3 
opisują  gęstości  elektronów  w miejscu  jądra  (czyli 
w „zerze”  układu  współrzędnych)  odpowiednio  dla 
absorbenta  i źródła.  Z jest  liczbą  atomową  danego 
pierwiastka  a e — ładunkiem  elementarnym. 


Warfsubtelna  struktura  linii 
promieniowania  y 


Nadsubtelna  struktura,  czyli  rozszczepienie  na  składowe  linii 
promieniowania  y jest  spowodowane  oddziaływaniem  dipolo- 
wego momentu  magnetycznego  jądra  z polem  magnetycznym  lub 
oddziaływaniem  elektrycznego  momentu  kwadrupolow-ego  jądra 
z gradientem  pola  elektrycznego.  Pomiary  rozszczepienia  linii 
wywołanych  tymi  oddziaływaniami  pozwalają  wyciągnąć  wnioski 
o polach  elektromagnetycznych  działających  na  badane  jądra 
w atomach  danej  próbki  krystalicznej.  Jądro  spełnia  w tym  wy- 
padku rolę  miniaturowej  sondy  umieszczonej  w centrum  atomu. 

W wyniku  oddziaływania  momentu  magnetycznego  jądra 
z polem  magnetycznym  H poziomy  energetyczne  jądra  ulegają 
rozszczepieniu  na  składowe  o energiach  danych  przez  wzór 

tiHm  z 


oddziaływa- 

nie 

magnetyczne 


gdzie  Ea  jest  energią  nierozszczepionego  poziomu,  a mi  — /, 

I—l  -.  — I są  magnetycznymi  liczbami  kwantowymi  jądra  o spi- 
nie /. 

W ogólnym  wypadku  oba  poziomy,  między  którymi  zachodzi 
przejście  y,  są  rozszczepione,  co  z kolei  powoduje  rozszczepienie 
linii  promieniowania  y na  szereg  składowych.  Liczba  składowych 
zależy  od  spinów  jądra  w obu  stanach  i jest  ograniczona  przez 
reguły  wyboru  dla  danego  typu  promieniowania. 

Oddziaływanie  elektrycznego  momentu  kwadrupolowego  ją-  oddziałowa* 
dra  eQ  z gradientem  pola  elektrycznego  eq  również  prowadzi  do  ..  * 

rozszczepienia  poziomów  jądrowych.  Energie  poszczególnych 
składowych,  w przypadku  gradientu  pola  elektrycznego  o sy-  elektryczne 
metrii  osiowej,  wyrażają  się  wzorem 

_ _ _ . 1)] 

4/(2/- 1) 

Liczba  składowych  jest  w tym  wypadku  mniejsza  niż  przy  od- 
działywaniu magnetycznym,  gdyż  podstany  o magnetycznych 
liczbach  kwantowych  —mi  i -fw  mają  tę  samą  energię. 

Rysunek  10  przedstawia  schematycznie  przesunięcie  i roz- 
szczepienie poziomów  jądrowych  S7Fe  wywołane  oddziaływaniem 
jądra  z pow'łoką  elektronową  atomu.  W przypadku  ć7Fe  spiny 
stanu  podstawowego  i wzbudzonego  wynoszą  odpowiednio  / = 

= l/2  i / = */ £,  moment  magnetyczny  w stanie  podstawowym 
jest  dodatni,  a w stanie  wzbudzonym  ujemny.  Liczba  przejść 
jest  ograniczona  regułą  wyboru  Ami  = 0,  ± 1 . W dolnej  części 
rysunku  pokazane  są  w'idma  móssbauerow-skie  odpowiadające 
różnym  przypadkom  oddziaływania. 


Analiza  widma  móssbauerowskiego 

Analizę  widma  móssbauerowskiego  prowadzi  się 
przeważnie  przy  użyciu  elektronowej  maszyny  cyfro- 
wej, stosując  program,  za  pomocą  którego  można 
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Rys.  10.  Przesunięcia  i rozszczepienia  poziomów  jądrowych  B7Fe  wywołane  oddziaływaniem  jądra  z powłoką  elektronową  i otoczeniem 
w sieci  krystalicznej 


określić  położenia  poszczególnych  linii,  ich  szero- 
kości oraz  powierzchnie  opisane  przez  ich  kontury. 
Dostarczone  przez  EMC  dane  są  wykorzystane  do 
obliczania  wielkości  przesunięć  izomerycznych,  roz- 
szczepień linii  na  składowe  w wyniku  ewentualnych 
oddziaływań  nadsubtelnych,  a także  do  wyznaczania 
stosunków  natężeń  poszczególnych  składowych  wid- 
ma. Wszystkie  te  dane  pozwalają  następnie  wyciągać 
wnioski  o oddziaływaniu  badanych  jąder  z powłoką 
elektronową  atomów  i z ich  otoczeniem  w sieci  kry- 
stalicznej. Dla  uzyskania  dodatkowych  informacji 
o tych  oddziaływaniach,  a także  dla  ułatwiania  inter- 
pretacji widma  bardzo  często  pomiary  wykonuje  się 
w różnych  temperaturach,  co  pozwala  prześledzić 
temperaturową  zależność  parametrów  wyznaczonych 
z widm  mossbauerowskich. 


Zastosowanie  spektroskopii 
móssbauerowskeej 


pomiar 
zmiany 

energii 
Et onu  w po- 
lu grawita- 
cyjnym 
Z5en?i 


Wkrótce  po  odkryciu  zjawiska  Mossbauera  wyko- 
nano szereg  pomiarów  o fundamentalnym  znaczeniu 
w fizyce.  Przeprowadzenie  ich  stało  się  możliwe  dzięki 
wyjątkowej  zdolności  rozdzielczej  spektroskopii  móss- 
bauerowskiej.  Do  pomiarów  o podstawowym  zna- 
czeniu można  zaliczyć  pomiar  poprzecznego  efektu 
Dopplera  oraz  prędkości  hipotetycznego  „wiatru 
eteru’’.  Najbardziej  znanym  z nich  jest  przeprowa- 
dzony przez  Pounda  i Rebkę  pomiar  zmiany  energii 
fotonu  w polu  grawitacyjnym  Ziemi.  Kwant  promie- 
niowania, przelatując  między  punktami  o różnych 
wartościach  potencjału  grawitacyjnego,  zmienia  swą 
energię.  Jest  to  tzw.  przesunięcie  ku  czerwieni  obserwo- 
wane w astronomii.  Gdy  foton  spada  w polu  grawi- 
tacyjnym Ziemi,  względny  przyrost  energii  jest  dany 
przez  wzór : 

AE  _ gH 
E “ c2  * 


gdzie  H jest  różnicą  wysokości  przelatywaną  przez 
foton,  a g — wartością  przyspieszenia  ziemskiego. 
Wzór  ten  jest  konsekwencją  przypisania  fotonowi 
E 

masy  — Przy  powierzchni  Ziemi  na  wysokości 
c2 

AE 

jednego  metra  — - = 1,1  -10“ 18.  Doświadczenia 

E 

Pounda  i Rebki,  a następnie  Pounda  i Snidera,  zo- 
stały wykonane  w Uniwersytecie  Harvard  w Stanach 
Zjednoczonych.  Wykorzystali  oni  wieżę,  w której 


między  źródłem  i absorbentem  można  było  uzyskać 
różnicę  poziomów  dwadzieścia  dwa  metry.  Mierzone 
było  przesunięcie  energetyczne  linii  promieniowania 
y 57Fe  dla  fotonów  lecących  w górę  i w dół.  Pomiary 
wymagały  bardzo  wielkiej  precyzji,  gdyż  oczekiwane 
przesunięcie  stanowiło  zaledwie  ok.  1/500  obserwo- 
wanej szerokości  linii.  Wynik  serii  pomiarów,  trwają- 
cych łącznie  kilka  miesięcy, pozwolił  stwierdzić  wys- 
tępowanie efektu,  którego  wielkość,  w granicach  błędu 
około  jednego  procentu,  zgadza  się  z przewidywaniami 
teorii. 

W fizyce  jądrowej  efekt  Mossbauera  pozwolił  fizyka 
w kilku  przypadkach  wyznaczyć  różnicę  rozmiarów  jądrowa 
jądra  w stanie  wzbudzonym  i podstawowym,  a także 
zmierzyć  dipolowe  momenty  magnetyczne,  elektrycz- 
ne momenty  kwadrupolowe  oraz  średnie  czasy  życia 
wielu  stanów  jądrowych. 

Spektroskopia  móssbauerowska  stała  się  rutynową  fizyka  ciała 
metodą  badawczą  i pomiarową  w fizyce  ciała  stałego  stałego 
i chemii.  Trudno  jest  podać  pełną  listę  problemów,  i chemia 
w których  ma  ona  zastosowanie.  Dla  przykładu  moż- 
na wymienić  następujące  problemy: 

— struktura  wiązań  chemicznych  i charakter  wią- 
zań chemicznych, 

— przebieg  reakcji  chemicznych  i rola  katalizato- 
rów, 

— materiały  amorficzne  i zestalone  roztwory, 

— zjawiska  relaksacyjne, 

— przejścia  fazowe  i zjawiska  krytyczne, 

— stopy,  zanieczyszczenia  i defekty  sieci  krysta- 
licznej, uszkodzenia  radiacyjne, 

— rozkłady  ładunków  i momentów  magnetycz- 
nych w ciałach  stałych, 

— struktura  magnetyczna  i przekazywane  oddzia- 
ływania nadsubtelne, 

— struktura  i dynamika  cząsteczek  biologicznie 
czynnych, 

— analiza  minerałów. 

O tym,  jak  szeroki  zakres  ma  spektroskopia  moss- 
bauerowska,  najlepiej  świadczy  fakt,  że  w naukowej 
literaturze  światowej  pojawia  się  rocznie  około  tysiąca 
publikacji  poświęconych  zastosowaniom  tej  metody. 

D.  C.  Champeney  i in.  Phys.Rcv.Lett.  7,  241  (1963);  W.  I.Gol- 
danski  Efekt  Mossbauera  i jego  zastosowania  w chemii , War- 
szawa 1966;  U.  Gonser  Móssbauer  Spectroscopy,  Springer-Ver“ 
lag  1975;  H.  J.  Hay  i in.  Phys.  Rev.Lett.  4, 165  (1960);  A.  Hryn- 
kiewicz Efekt  Mossbauera  i jego  zastosowania  w fizyce  ciała  star 
lego  w:  Cząstki  elementarne,  jądra  atomowe,  promieniotwórczość* 

Warszawa  1967;  A.  Hrynkiewicz,  D.  Kulgawczuk  Spektro- 
skopia móssbauerowska,  Metody  badań  minerałów  i skał,  War- 
szawa 1979;  R.  L.  Móssbauer  Z.  Physik  151, 124(1958);  R.  Y.  Po- 
und,  G.A.  Rebka  Phys.Rev.Lctt.  4,  274,  337  (1960);  A.  Wźrtes 
i in.  Móssbauer  Spectroscopy,  Budapest  1979. 
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KIERUNKI  ROZWOJU  OPTYKI 
Optyka  współczesna 


Adam  Kujawski 

Optyka  jest  bardzo  obszerną  dziedziną  nauk  fizycz- 
nych, a niektóre  jej  zagadnienia  zalicza  się—  ze 
względu  na  ich  odrębność  — również  do  techniki  lub 
medycyny.  W ostatnim  ćwierćwieczu  zakres  badań 
i zastosowań  optyki  uległ  istotnym  przemianom. 
W rezultacie  do  optyki  współczesnej  weszły  zupełnie 
nowe  zjawiska  i zastosowania,  a opis  większości  zna- 
nych zjawisk  optycznych  uzyskał  znacznie  głębszą 
interpretację  fizyczną.  Wydarzeniem  przełomowym  — 
— zarówno  ze  względu  na  zastosowanie,  jak  i poszerze- 
praefom  nie  naszej  wiedzy  o naturze  światła  — stało  się  zbu- 
w optyce  dowanie  lasera,  źródła  światła  o bardzo  wysokim 
stopniu  spójności.  Ten  fakt  zapoczątkował  też  roz- 
wój kierunku  badań,  który  przyjęto  nazywać  elektro- 
niką kwantową. 

Dwa  artykuły  w tym  dziale  są  poświęcone  podsta- 
wowym zjawiskom  fizycznym  zachodzącym  w lase- 
rach i zasadzie  działania  laserów  oraz  właściwościom 
światła  spójnego.  Osobny  artykuł  omawia  wybrane 
spośród  bardzo  licznych  zastosowań  laserów. 

Moc  promieniowania  laserowego  może  o wiele  rzę- 
dów wielkości  przewyższać  moc  źródeł  konwencjo- 
nalnych. Fakt  ten  umożliwił  odkrycie  nowych  zja- 
wisk— nieliniowych  — oraz  znalazł  liczne  zastoso- 
wania. Jednak  w tym  dziale  przede  wszystkim  pod- 
kreśla się  inną  podstawową  cechę  światła  laserowego 
(zarówno  jego  części  widzialnej,  jak  również  bliskiego 
nadfioletu  i bliskiej  podczerwieni) — jego  spójność  — 
i omówieniem  tego  zagadnienia  rozpoczyna  się  cały 
spójność  dział  optyki.  Niewątpliwie  możliwość  uzyskania  nie- 
światta  mai  doskonałej  spójności  należy  do  fundamentalnych 
osiągnięć  zarówno  przy  poszukiwaniu  odpowiedzi, 
jaka  jest  natura  światła,  jak  i ze  względu  na  zastoso- 
wania. Chociaż  pojęcie  spójności  jest  tak  stare  jak 
zjawisko  interferencji,  jego  istotnie  nowe  znaczenie 
zarówno  w klasycznym  (falowym)  jak  i kwantowym 
(korpuskulamym)  opisie  światła  pojawiło  się  dopiero 
po  zbudowaniu  laserów.  To,  że  można  otrzymywać 
światło  spójne  oraz  to,  że  można  wykorzystywać  jego 
różne  właściwości  statystyczne  odgrywa  zasadniczą 
rolę  we  wszystkich  zjawiskach  optycznych  od  fizyki 
atomowej  począwszy,  a na  optycznym  przetwarzaniu 
danych  skończywszy.  Należy  podkreślić,  że  obecnie 
zagadnienie  spójności  obejmuje  nie  tylko  zjawiska 
interferencyjne,  lecz  przede  wszystkim  problemy 
właściwości  statystycznych  światła.  Przykładem  jest 
zagadnienie  opisu  wiązek  światła,  z których  każda 
może  dać  ostre  prążki  w doświadczeniach  interferen- 
cyjnych,  a które  — na  podstawie  doświadczeń  ze 
zliczaniem  fotonów  — mogą  istotnie  różnić  się  od 
siebie,  rozkład  statystyczny  fotonów  może  być  w nich 
zupełnie  różny. 

Wybranym  kierunkom  badań,  z pewnością  mają- 
cym duże  znaczenie  dla  dalszego  rozwoju  nauki  i tech- 
niki, poświęcono  cztery  artykuły.  Dwa  z nich  „Optyka 
nieliniowa”  oraz  „Ultrakrótkie  impulsy  światła”, 
informują  o nowych  zjawiskach  optycznych  i nowych 
technikach  badawczych.  Hasła  „Holografia”  oraz 
„Optyka  fourierowska”  są  poświęcone  dziedzinom, 
które  w oryginalny  sposób  wykorzystują  spójność 
światła  laserowego. 

Łatwiej  zrozumiemy  dlaczego  takie  kierunki  roz- 
woju obrała  optyka  współczesna,  jeśli  sobie  uświa- 
domimy, że  całe  widmo  fal  elektromagnetycznych,  od 
fal  najkrótszych  począwszy  (promieniowanie  y,  czę- 
stości rzędu  102a  Hz)  aż  do  fal  najdłuższych  (fale 
radiowe,  częstości  do  kilku  Hz),  opisuje  teoria  Max- 
wella,  która  mówi  o właściwościach  falowych,  oraz 
teoria  kwantowa,  relacjonująca  właściwości  korpu- 


skularne.  W wypadku  fal  radiowych  energia  fotonu  hv 
jest  bardzo  mała  i teoria  Maxwella  odgrywa  bardzo 
dużą  rolę,  w wypadku  fal  najkrótszych  większa  jest 
rola  teorii  kwantowej.  Jeśli  chodzi  o zakres  optyczny 
(częstości  rzędu  HP-1018  Hz;  część  widzialna  sta- 
nowi wąskie  pasmo  wokół  wartości  1015  Hz),  to 
można  powiedzieć,  że  znajduje  się  on  w środku  wid- 
ma elektromagnetycznego  i obydwa  opisy  teoretyczne 
są  równie  przydatne.  Dla  współczesnej  optyki  charak- 
terystyczne jest  to,  że  z jednej  strony  znaczna  część 
technik  dotyczących  fal  długich,  takich  jakimi  się 
posługuje  radiotechnika  czy  telekomunikacja,  stosuje 
się  obecnie  w części  optycznej  widma,  z drugiej  strony, 
kwantowa  natura  promieniowania  optycznego  uwi- 
dacznia się  w zupełnie  nowy  sposób  w takich  np. 
zjawiskach,  jak  fluorescencja  rezonansowa  i procesy 
Ramana  i Brillouina  wymuszonego  rozpraszania. 

W rezultacie,  dzięki  odkryciu  nowych  zjawisk  i zna- 
lezieniu nowych  metod  eksperymentalnych,  zarówno 
właściwości  falowe  jak  i korpuskulame,  odgrywające 
równorzędną  rolę  w optycznej  części  widma  elektro- 
magnetycznego, są  jeszcze  wyraźniej  zaakcentowane 
i udokumentowane. 

Charakterystyczne  cechy  rozwoju  współczesnej  op- 
tyki można  podkreślić  w trochę  inny  sposób  dwoma 
następującymi  spostrzeżeniami:  Po  pierwsze  — daje  nawiązanie 
się  zauważyć  tendencja  do  tego,  by  większość  osiąg-  do  elektro- 
nięć  elektroniki  współczesnej,  wykorzystującej  mikro-  niki 
fale  i fale  radiowe,  przenieść  na  zakres  optyczny. 

Nazwy  nowo  powstałych  dziedzin,  takich  jak  opto- 
elektronika czy  optyka  zintegrowana,  najlepiej  o tym 
świadczą.  Postęp  i rozwój  obydwu  wymienionych 
dziedzin  jest  zresztą  ściśle  związany  z opanowaniem 
nowych  technologii  wytwarzania  materiałów,  szcze- 
gólnie materiałów  półprzewodnikowych.  Na  specjalną 
uwagę  zasługuje  tutaj  dalsze  wykorzystanie  wyjątko- 
wych własności  fizycznych  złącza  p-n.  Oprócz  dotych- 
czas znanych  przyrządów  elektronicznych,  wykorzys- 
tujących złącze  p-n — jak  np.  diody,  fotoogniwa, 
tranzystory  — pojawił  się  laser  półprzewodnikowy, 
który  dzięki  opanowaniu  technologii  otrzymywania 
heterozłącz  stał  się  jednym  z najważniejszych  elemen- 
tów optycznych  współczesnej  elektroniki. 

Drugie  spostrzeżenie  dotyczy  jeszcze  bliższego  po- 
wiązania optyki  z fizyką  atomową.  Ilustracją  tego 
faktu  jest  pojawienie  się  zupełnie  nowych  metod 
spektroskopii  optycznej  oraz  powstanie  dziedziny  optyka 
zwanej  optyką  kwantową.  Ta  ostatnia  obejmuje  m.in.  kwantowa  • 
problemy  statystyki  fotonów  i roli  właściwości  sta- 
tystycznych światła  w procesach  nieliniowych.  Do  no- 
wych kwantowych  zjawisk  optycznych  należą  zja- 
wiska koherentnego  oddziaływania  światła  z układami 
atomowymi,  jak  np.  echo  fotonowe  i wymuszona 
przezroczystość  ośrodka.  Na  zakończenie  zwróćmy 
uwagę,  że  o tym,  jak  dalece  metody  klasycznej  elek- 
troniki i kwantowego  opisu  promieniowania  elektro- 
magnetycznego połączyły  się  i przeniknęły  wzajemnie 
w zakresie  optycznym  widma  elektromagnetycznego, 
świadczy  również  nazwa  elektronika  kwantowa.  Jest  elektronika 
ona  często  używana  dla  określania  zjawisk  i technik  kwantowa 
laserowych,  które  w większości  można  także  zaliczyć 
do  optyki  współczesnej. 

Wyborem  tematów  w tym  rozdziale  można  było 
objąć  tylko  niektóre  z obecnych  kierunków  rozwoju. 

Tematy  te  ilustrują  fakt,  że  optyka  współczesna  stała 
się  dziedziną  wzajemnie  powiązaną  zarówno  z innymi 
działami  fizyki  (szczególnie  z fizyką  atomową  i fizyką 
ciała  stałego),  jak  i z różnymi  kierunkami  techniki 
(zwłaszcza  z elektroniką  i telekomunikacją). 


Spójność  światła 

Adam  Kujawski 

Rozwój  nauk  fizycznych  pierwszego  ćwierćwiecza 
XX  w.  przyczynił  się  między  innymi  istotnie  do  lep- 
szego rozumienia,  jaka  jest  natura  światła  i jaki  jest 
mechanizm  świecenia  atomów,  z których  zbudowane 
są  źródła  promieniowania  świetlnego.  Odnosi  się  to, 
rzecz  jasna,  do  źródeł  konwencjonalnych,  a więc 
takich,  jak  płomień,  żarówka,  gaz  pobudzony  do 
świecenia  itp.  Źródła  te  obecnie  przyjęto  nazywać, 
i tak  je  dalej  nazywać  będziemy,  źródłami  termicz- 
nymi, w odróżnieniu  od  źródeł  laserowych,  lub 
krótko  — laserów,  które  od  1961  r.  znalazły  się 
w centrum  zainteresowań  naukowych  i technicznych. 
Jedną  z najważniejszych  cech  charakterystycznych  dla 
światła  laserowego,  istotnie  różniących  je  od  światła 
termicznego,  jest  wysoki  stopień  spójności.  Fakt  ten, 
obok  innych  specyficznych  właściwości  wiązki  lasero- 
wej, jest  zawsze  podkreślany  przy  omawianiu  zasady 
działania  lasera  i właściwości  światła  przezeń  wytwa- 
rzanego. światło  spójne  lasera  znalazło  też  liczne  za- 
stosowania w praktyce,  np.  w holografii. 

Problem  czy  dwie  wiązki  światła  są  spójne  (kohe- 
rentne), czy  nie,  jest  problemem  tak  starym,  jak 
badanie  zjawisk  interferencji  światła.  W ciągu  osta- 
tnich dwudziestu  lat  uzyskał  on  zupełnie  nowe  zna- 
czenie i stał  się  ważnym  rozdziałem  badań  w optyce. 
W okresie  przed  zbudowaniem  lasera,  to  znaczy 
w latach  pięćdziesiątych,  a następnie  w okresie  badań 
nowych  zjawisk  optycznych  charakterystycznych  dla 
światła  laserowego,  ukształtowała  się  teoria  spójności 
światła.  Teoria  ta,  posługując  się  odpowiednim  apa- 
ratem matematycznym,  ściśle  opisuje  interferencję, 
zjawiska  w których  gra  rolę  spójność  wyższych  rzę- 
dów, oraz  statystyki  zliczeń  fotonów  dla  światła  ter- 
micznego i laserowego.  Omówimy  tutaj  te  teoretyczne 
i doświadczalne  aspekty  statystycznych  właściwości 
światła,  które  zalicza  się  do  współcześnie  rozumiane- 
go pojęcia  spójności  światła. 

zjawisko  Interferencja  jest  zjawiskiem  charakterystycznym 
interfferencjE  dla  wszystkich  ruchów  falowych.  Właśnie  przy  obser- 
wacji tego  zjawiska  wprowadza  się  pojęcie  spójności 
(koherencji)  ruchów  falowych  biorących  udział  w na- 
kładaniu się  lub,  mówiąc  inaczej,  interferowaniu  ze 
sobą.  Najprostszym  przykładem,  łatwym  do  zaobser- 
wowania jest  nakładanie  się  dwu  fal  rozchodzących 
się  na  powierzchni  wody,  źródłami  fal  mogą  być  na 
przykład  końce  drgających  prętów.  Gdy  drgają  one  ze 
stałą  częstością,  obserwuje  się,  że  w wyniku  nałożenia 
powstaje  regularna  struktura  miejsc,  w których  drga- 
nia się  wygaszają  i wzmacniają,  jak  na  il.  135,  tabl.  33. 
Gdy  jednak  wytwarzane  drgania  mają  różne  częstości 
lub  gdy  wytwarzane  są  w sposób  zupełnie  przypad- 
kowy, powstały  ruch  falowy  nie  wykazuje  cech  regu- 
larności. O falach  omówionych  wyżej  mówimy  odpo- 
wiednio, że  są  spójne  lub  niespójne.  Jest  to  klasyfi- 
kacja uproszczona.  Łatwo  bowiem  można  sobie  wy- 
obrazić przypadki  pośrednie,  w których  fala  wypad- 
kowa powstająca  na  powierzchni  wody  ma  pewne 
cechy  regularności  niezbyt  łatwe  do  obserwacji. 
Zwróćmy  jeszcze  uwagę,  iż  stwierdzenie,  czy  fale  są 
spójne  czy  niespójne  nie  wiązało  się  dotąd  z żadną 
wielkością  mierzalną  i oparte  jest  tylko  na  opisowym 
porównaniu  obrazów  interferencyjnych. 


Spójność  pierwszego  rzędu 


Doświadczenie  interferencyjne,  w którym  nakładają 
się  dwie  fale  świetlne  i którego  idea  jest  taka  sama, 
jak  doświadczenia  z dwiema  falami  na  wodzie,  nosi 
nazwę  doświadczenia  Younga.  Odegrało  ono  bardzo 
ważną  rolę  w rozwoju  poglądów  na  naturę  światła. 


gdyż  w istocie  jest  dowodem  na  falową  naturę  świa- 
tła. Przypomnijmy  krótko  warunki  realizacji  doświad- 
czenia Younga.  Światło  jednobarwne  ze  źródła  Z 
pada  na  dostatecznie  mały  otwór  lub  szczelinę  S9 
a następnie  na  dwie  szczeliny  5X  i S2  w przesłonie. 


Rys.  1.  Światło  wy- 
chodzące ze  szczeliny 
S pada  na  szczeliny  Sr 
i St  i na  ekranie  E 
powstaje  obraz  inter- 
ferencyjny 

tak  jak  ilustruje  to  rys.  1 . Światło  wychodzące  z Sx 
i S2  intereferuje  i daje  na  ekranie  E obraz  interferen- 
cyjny, który  obserwujemy  bezpośrednio  lub  rejestru- 
jemy na  kliszy.  Aby  obraz  ten  był  ostry,  to  znaczy, 
aby  składał  się  z wyraźnych  jasnych  i ciemnych 
prążków,  rozmiary  szczeliny  S muszą  być  dostatecz- 
nie małe.  Powstanie  miejsca  jasnego  lub  ciemnego 
w danym  punkcie  P ekranu  E zależy  od  różnicy  dróg 
S'SlP  i S'S2P9  gdzie  przez  5'  oznaczyliśmy  jakiś 
wybrany  punkt  szczeliny  S (rys.  2).  Gdy  różnica  ta 


jest  równa  parzystej  wielokrotności  połowy  długości 
fali,  mamy  miejsce  wzmocnienia  interferujących  fal 
świetlnych,  a gdy  nieparzystej  wielokrotności  — miej- 
sce wygaszenia.  Powiększanie  rozmiarów  szczeliny  S9 
przy  ustalonej  odległości  od  przesłony,  prowadzi  do 
znikania  prążków.  Wówczas  bowiem  do  danego 
punktu  P docierają  promienie  po  drogach  5//51/> 
i S"S2Py  dając  w ogólności  inny  wynik  interferencji 
niż  dla  promieni  z punktu  S'.  Można  jednak  źródło 
o dowolnie  dużych  wymiarach  (w  istocie  w danym 
wypadku  jest  nim  szczelina  S ) odsunąć  dostatecznie 
daleko  od  przesłony,  tak  że  otrzyma  się  ostry  obraz 
interferencyjny.  Wówczas  drogi  S'S,P  i $"S«P  będą 
z bardzo  dobrym  przybliżeniem  sobie  równe. 

Przy  ustalonych  wymiarach  szczeliny  S i jej  od- 
ległości od  przesłony  stwierdza  się,  że  dla  pewnej 
odległości  szczelin  Ą i S2  i odległości  większych  obraz 
interferencyjny  znika.  Odległość  ta  określa  wymiary 
obszaru  spójności  pola  świetlnego  wychodzącego  ze 
źródła  S i dochodzącego  do  przesłony.  Gdy  St  i S% 
leżą  w obszarze  spójności,  obserwuje  się  prążki  ciem- 
ne i jasne,  a gdy  Sx  i S2  leżą  za  tym  obszarem  — 
prążków  nie  ma.  Wielkość  obszaru  spójności  zależy 
zatem  od  odległości  i wymiarów  źródła,  jakim  w da- 
nym wypadku  jest  szczelina  S.  Aby  lepiej  zilustrować 
powyższe  zależności  podajemy  wybrane  dane  licz- 
bowe, które  uzyskujemy  posługując  się  ścisłą  teorią 
koherencji,  a które  potwierdzają  pomiary.  Dla  źródła 
światła  jednobarwnego  o długości  fali  X — 600  nm, 
którego  średnica  równa  jest  1 mm,  w odległości  20  m 
w płaszczyźnie  równoległej  do  płaszczyzny  źródła 
średnica  obszaru  spójności  wynosi  3,8  mm.  Oznacza 
to  oczywiście,  że  aby  otrzymać  dobry  obraz  interfe- 
rencyjny, szczeliny  Sx  i S2  powinny  być  w odległości 
mniejszej  niż  3,8  mm.  Wprowadzone  tutaj  pojęcie 
obszaru  spójności  wiąże  się  z pojęciem  spójności 
przestrzennej.  Chodzi  o to,  że  wyznaczając  kolejno 
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tego  rodzaju  powierzchnie,  możemy  określić  w prze- 
strzeni obszar  o znanych  powierzchniach,  na  których 
faza  optycznej  fali  elektromagnetycznej  jest  taka  sama. 

Przejdźmy  teraz  do  innego  ważnego  eksperymentu 
interferencyjnego,  który  przeprowadzi!  Michelson. 
Przyrząd,  którym  się  posługiwał,  nosi  obecnie  nazwę 
interferometru  Michelsona.  Za  jego  pomocą  można 
zilustrować  pojęcie  spójności  czasowej.  Schemat  za- 
sadniczy doświadczenia  podany  jest  na  rys.  3.  Za- 


i 


znaczono  na  nim  źródło  światła  jednobarwnego  5, 
wiązkę  światła  dzielącą  się  na  dwie  na  zwierciadle 
półprzepuszczającym  Z,  a następnie  powstałe  wiązki 
odbite  od  zwierciadeł  Zx  i Z2,  które  nakładają  się 
na  siebie  i na  ekranie  mogą  dawać  ostry  obraz  inter- 
ferencyjny. Gdy  odległości  ZZ*  i ZZ2  są  równe, 
powstałe  wiązki  nakładają  się  z takimi  samymi  faza- 
mi. Gdy  jednak  droga  przebywana  przez  światło  w 
jednym  z ramion  interferometru  jest  większa  niż  w 
drugim,  wiązki  są  przesunięte  w fazie  względem 
siebie.  Okazuje  się,  że  istnieje  graniczna  wartość  róż- 
nicy dróg  optycznych  w ramionach  interferometru, 
dla  której  obraz  interferencyjny  znika.  Oznaczymy 
tę  wartość  przez  U.  Nazywa  się  ją  długością  spójności. 
Wprowadza  się  również  czas  spójności  zdefinio- 
wany przez  r = /c/c,  gdzie  c oznacza  prędkość 
światła.  Z dobrym  przybliżeniem  można  przyjąć,  że 
r określa  przedział  czasu,  w jakim  pola  elektromagne- 
tyczne wiązek  świetlnych  mają  tę  samą  fazę.  Jeśli 
więc  doprowadzamy  do  interferencji  dwu  wiązek  po- 
wstałych z jednej,  jak  np.  w interferometrze  Michel- 
sona, i w miejscu  nakładania  się  pola  wiązek  są 
przesunięte  w czasie  o mniej  niż  r,  to  obserwuje  się 
dobry  obraz  interferencyjny.  Dla  światła  pochodzą- 
cego ze  źródeł  termicznych  najdłuższy  osiągalny  czas 
koherencji  jest  rzędu  10“ 8 s,  co  odpowiada  długości 
koherencji  3 m. 

W obydwu  powyższych  doświadczeniach  interfe- 
rencyjnych odnoszących  się  odpowiednio  do  spójności 
przestrzennej  i czasowej,  mieliśmy  do  czynienia  z na- 
kładaniem się  dwu  wiązek  światła.  Oznaczmy  przez 

Ex  i ?2  wektory  natężenia  pól  elektrycznych  wiązek 
nakładających  się  i przyjmijmy  dla  uproszczenia,  że 
kierunki  wektorów  pól  są  tak  samo  skierowane.  War- 
tość natężenia  pola  wiązki  powstałej  w wyniku  nało- 
żenia wynosi  więc  w tym  wypadku  E = Ex+Et. 
Można  wykazać,  że  zaczernienie  obrazu  na  kliszy  za- 
leży od  odpowiednio  uśrednionej  gęstości  energii  pola 
elektrycznego  wiązki.  Istnieją  dwa  zasadnicze  powody 
uśredniania:  1)  częstość  fali  elektromagnetycznej  w 
zakresie  optycznym  jest  rzędu  1010s“1  i klisza  nie  re- 
jestruje zmian  pola  o tak  dużej  częstości;  2)  fazy  pola 
E mogą  się  bardzo  szybko  zmieniać  w sposób  przy- 
padkowy. Drugi  z wymienionych  punktów  wiąże  się 
w istotny  sposób  z mechanizmem  świecenia  atomów 
źródła  i powrócimy  do  niego  dalej. 
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Ponieważ  gęstość  energii  jest  wprost  proporcjonal- 
na do  wielkości  E2,  zaczernienie  zależy  od  wielkości 
I — <£’*>,  gdzie  ostre  nawiasy  oznaczają  uśrednia- 
nie. Mamy  więc 

/=<£*>  = <£J>+<jBJ>+2<£iĄ>. 

Ponieważ  Ix  = <£?>,  h = <£?>,  wiSc 

/ = /1+/a+2<£’x£i>.  (1) 

Ostatni  człon  we  wzorze  (1)  nosi  nazwę  członu  inter- 
ferencyjnego. Przeprowadzenie  uśrednienia,  które 
tutaj  wprowadziliśmy,  wymaga  znajomości  odpo- 
wiednich rozkładów  prawdopodobieństwa.  Można 
też,  przy  odpowiednich  założeniach,  rozumieć  je  jako 
uśrednienie  po  czasie.  Problem  równoważności  obu 
sposobów  uśredniania  oraz  kwestia  kwantowego  opisu 
zjawiska  interferencji  należą  do  współczesnej  teorii 
koherencji  światła.  Dokładniejsza  analiza  wykazuje, 
że  dla  światła  prawie  monochromatycznego  człon  in-  s^opje^ 
terferencyjny  we  wzorze  (1)  jest  proporcjonalny  do  Spó]no§cj 
wielkości  zwanej  stopniem  spójności  interferujących 
wiązek.  Gdy  wiązki  są  niespójne,  stopień  spójności 
równa  się  zeru  i człon  interferencyjny  znika,  dla 
maksymalnej  koherencji  równy  jest  on  jedności.  War- 
tość stopnia  spójności  zawiera  się  w granicach  od  0 
do  1 i możliwe  są  sytuacje,  w których  wiązki  światła 
są  częściowo  spójne.  Stopień  spójności  można  wyzna- 
czyć, mierząc  tak  zwaną  widzialność  prążków,  tj. 
stosunek  (W- /min)  : (/ma?: -f /min  ),  gdzie  W 
i Im in  są  maksymalnymi  i minimalnymi  natężeniami 
prążków  ciemnych  i jasnych  rejestrowanych  na  kliszy 
fotograficznej. 

W ten  sposób  na  podstawie  fotografii  obrazu  in- 
terferencyjnego określa  się,  w jakim  stopniu  wiązki 
interferujące  są  spójne.  Chociaż  poruszone  tutaj  pro- 
blemy spójności  są  przedstawione  pod  wieloma  wzglę- 
dami w bardzo  uproszczony  sposób,  pozwalają  jednak 
uświadomić  sobie,  że  spójność  wiązek  świetlnych  nie 
jest  tylko  opisowym  pojęciem,  lecz  wiąże  się  ściśle 
z wielkościami  mierzalnymi  w eksperymencie. 

Aby  powstał  dobry  obraz  interferencyjny  muszą 
być  spełnione  warunki  dotyczące  obszaru  i czasu 
spójności.  Warunki  te  otrzymujemy  z rozważań  teo- 
retycznych i bezpośrednio  z pomiaru.  Wyjaśnimy  . 
teraz,  jak  wiążą  się  one  z mechanizmem  świecenia 
atomów  źródła.  Zacznijmy  od  źródeł  termicznych,  termi©*n© 
które  ogólnie  mówiąc,  można  scharakteryzować  tak, 
że  atomy  lub  cząsteczki  pobudzane  są  do  świecenia 
w sposób  przypadkowy  i od  siebie  zupełnie  niezależny. 

Dotyczy  to  zarówno  świecenia  ciał  pod  wpływem  pod- 
wyższonej temperatury,  jak  i wskutek  działania  pola 
elektrycznego.  Są  oczywiście  istotne  różnice  w mecha- 
nizmie świecenia  atomów  gazów  i atomów  ciał  sta- 
łych, ale  w jednym  i w drugim  wypadku  emisja 
spontaniczna  (->  Lasery  — podstawy  działania)  od- 
grywa najważniejszą  i prawie  jedyną  rolę.  Czas  trwa- 
nia impulsów  wysyłanych  przez  pojedyncze  atomy  0jag 
świecącego  gazu  wynosi  około  r'  » 10-8  s.  Kształt  faSowy 
takiego  impulsu,  który  będziemy  nazywać  ciągiem 
falowym,  ilustruje  schematycznie  rys.  4.  Ciąg  falowy 
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Rys.  4.  Ciąg  falowy  o skończonym  czasie  trwania  r 


nie  jest  ściśle  monochromatyczny.  Można  go  złożyć 
z wielu  drgań  sinusoidalnych,  których  częstości  leżą 
w pewnym  przedziale  częstości  Av  nazywanym  szero- 
kością spektralną.  Można  udowodnić,  że  pomiędzy 
t'  i Av  zachodzi  związek  Av  « 1/t'.  Ze  związku  tego 
wynika  oczywiście,  że  idealnie  monochromatyczna 


fala,  dla  której  Av  — O miałaby  czas  trwania  t'  nie- 
skończenie długi.  Dla  światła  ze  źródeł  termicznych 
można  osiągnąć  r'  £:  10~8  s,  stąd  Av  x 108s-1,  a po- 
nieważ w zakresie  optycznym  v x 1016s"1,  więc 
Avjv  ^ 10“7.  Jak  się  przekonamy  dalej,  stosunek  ten 
może  być  znacznie  mniejszy  dla  światła  laserowego. 
Wiedząc,  że  światło  źródła  termicznego  powstaje  w 
wyniku  wysyłania  ciągów  falowych  przez  pojedyncze 
atomy,  można  zrozumieć  warunki  obserwacji  obra- 
zów interferencyjnych.  W doświadczeniach  Younga 
faza  drgań  pola  elektrycznego,  powstałego  w wyniku 
nałożenia  się  pól  ciągów  falowych  wysyłanych  przez 
olbrzymią  liczbę  atomów  źródła,  jest  przypadkowa. 
Oznacza  to,  że  zmienia  się  ona  nieregularnie  i chao- 
tycznie. Warunki  doświadczenia  są  jednak  tak  dobra- 
ne, że  zawsze  na  szczelinach  S%  i Sz  pola  są  takie  same 
i ich  fazy  drgań  sobie  równe.  W rezultacie  na  ekranie 
miejsca  pełnego  wygaszania  i wzmocnienia  są  stałe 
w czasie,  jeśli  tylko,  jak  już  dyskutowaliśmy  rozpa- 
trując punkty  S'  i S"  na  rys.  2,  rozmiary  źródła  są 
odpowiednio  małe.  W doświadczeniu  Michelsona 
każdy  ciąg  falowy  dzieli  się  na  zwierciadle  półprze- 
puszczalnym.  Powstałe  nowe  dwa  ciągi  będą  ze  sobą 
interferować,  jeśli  różnica  dróg  optycznych  w ramio- 
nach interferometru  nie  będzie  większa  niż  cr.  Za- 
chodzi to  dla  wszystkich  wysyłanych  ciągów  falowych 
i miejsca  wygaszenia  i wzmocnienia  są  stałe  w czasie. 
Gdy  powyższy  warunek  nie  jest  spełniony,  interferen- 
cja pomiędzy  ciągami  z obydwu  ramion  interferome- 
tru ma  charakter  zupełnie  przypadkowy  i nie  ma  sta- 
łych miejsc  wygaszenia  i wzmocnienia.  Z naszych  roz- 
ważań wynika  również,  że  wielkość  czasu  koherencji 
jest  rzędu  czasu  trwania  ciągu  falowego  r ^ t', 
a stąd  zachodzi  r zs  1 /Av.  Mamy  więc  taką  sytuację, 
że  im  mniejsza  szerokość  spektralna  Av,  tym  większy 
czas  spójności  r.  Oznacza  to  oczywiście,  że  fala  ściśle 
monochromatyczna,  dla  której  Av  = 0,  miałaby  czas 
spójności  nieskończenie  długi.  Możemy  więc  teraz 
wyciągnąć  ważny  wniosek,  że  światło  idealnie  mono- 
chromatyczne jest  całkowicie  spójne.  Znając  mecha- 
nizm świecenia  atomów  w źródle  termicznym,  nie 
możemy  oczekiwać,  że  uda  się  nam  wytwarzać  do- 
wolnie długo  trwające  ciągi  falowe,  gdyż  czas  świece- 
nia atomótf  ma  zawsze  pewną  skończoną  wartość. 
Ponadto  dla  tego  rodzaju  źródeł  brak  jest  nam  ja- 
kiejkolwiek kontroli  aktów  świecenia  atomów,  tak  że 
faza  drgań  pola  świetlnego  zmienia  się  zupełnie  przy- 
padkowo. Zupełnie  inna  sytuacja  jest  w przypadku 
fal  radiowych,  których  źródła  kontrolujemy  w taki 
sposób,  że  wytwarzają  one  drgania  o dokładnie  okre- 
ślonych przebiegach  czasowych.  Zbudowanie  lasera, 
w którym  atomy  promieniują  nie  tylko  w aktach  emi- 
sji spontanicznej,  jak  dzieje  się  to  w źródle  termicz- 
nym, lecz  głównie  w aktach  emisji  wymuszonej,  dało 
światło  źródło  światła  o dużej  spójności  czasowej  i przestrzen- 
laserowe  nej.  Dla  światła  laserowego  jest  możliwe  przeprowa- 
dzenie eksperymentu  Younga  w sposób  bezpośredni, 
przysuwając  obydwie  szczeliny  do  lasera,  jak  ilustruje 
to  rys.  5,  ponieważ  powierzchnia  spójności  jest  znacz- 


monochromatyczne  niż  światło  ze  źródeł  termicznych. 
Stosunek  szerokości  spektralnej  do  częstości  linii  lase- 
rowej może  osiągać  Av/v  & 10" lł.  W otrzymywaniu 
tych  wyjątkowych  właściwości  światła  laserowego 
istotną  rolę  odgrywa  rezonator  optyczny,  wewnątrz 
którego  znajdują  się  atomy  promieniujące. 


Spójność  wyższego  rzędu 


Na  przykładzie  doświadczenia  Younga  i interfero- 
metru Michelsona  zilustrowaliśmy  istotne  różnice  w 
spójności  światła  termicznego  i laserowego.  Różnice 
te,  polegające  na  tym,  że  czas  i obszar  spójności  są 
różne  dla  obydwu  rodzajów  źródeł,  dotyczą  spójności 
pierwszego  rzędu,  a więc  takich  zjawisk,  których  opis 
wymaga  uśrednienia  kwadratów  natężenia  pola  elek- 
trycznego lub  wyrażenia  <£’i£,2>,  które  występuje 
we  wzorze  (1).  W tym  miejscu  nasuwają  się  dwa  py- 
tania : po  pierwsze,  czy  istnieją  inne  różnice  między 
światłem  termicznym  i laserowym,  po  drugie,  w jakich 
doświadczeniach  moglibyśmy  te  różnice  wykryć? 
Pierwsze  doświadczenia  nie  związane  bezpośrednio  ze 
zjawiskiem  interferencji,  w których  można  by  stwier- 
dzić różnice  inne  od  tych,  które  omawialiśmy,  prze- 
prowadzono jeszcze  przed  zbudowaniem  lasera.  Za- 
nim je  krótko  omówimy,  przypomnijmy  zasadę  po- 
miarów średnic  kątowych  gwiazd,  które  po  raz  pierw- 
szy przeprowadzał  Michelson  już  w końcu  ubiegłego 


Rys.  6.  Schemat  in- 
terferometru Michel- 
sona do  pomiaru  śre- 
dnic kątowych  gwiazd. 
Zwierciadła  Z1  i Z4 
można  przesuwać 


stulecia.  Ideę  zasadniczą  ilustruje  rys.  6,  na  którym 
zaznaczono,  w jaki  sposób  światło  gwiazdy  pada  na 
układ  zwierciadeł  i następnie  interferuje.  Rozsuwając 
zwierciadła  i Z2  można  stwierdzić,  że  dla  pewnej 
odległości  między  nimi  obraz  interferencyjny  znika. 
Odległość  ta  określa  wymiary  obszaru  spójności  świa- 
tła gwiazdy.  Na  podstawie  znajomości  średniej  dłu- 
gości fali  światła  padającego  i wymiarów  obszaru  ko- 
herencji ścisła  teoria  pozwala  określić  kąt,  pod  jakim 
widać  odległe  źródło,  a więc  określić  kątową  średnicę 
gwiazdy.  W 1956  r.  Hanbury-Brown  i Twiss  zmody- 
fikowali powyższe  doświadczenie  interferencyjne,  tak 
jak  pokazuje  to  schematycznie  rys.  7.  Światło  gwiazdy 
pada  na  dwa  fotodetektory  umieszczone  w ogniskach 
zwierciadeł  parabolicznych.  Posługując  się  odpowied- 


Rys.  5.  Doświadcze- 
nie Younga  wykazuje 
duży  obszar  spójności 
światła  laserowego 

nie  większa  niż  dla  źródeł  konwencjonalnych.  Jest  to 
konsekwencją  tego,  że  fala  świetlna  wychodząca  z la- 
sera ma  bardzo  mały  kąt  rozbieżności  i w pewnych 
warunkach  może  mieć  tę  samą  fazę  drgań  na  całym 
przekroju  wiązki.  Podobnie  w interferometrze  Michel- 
sona, gdy  źródłem  światła  jest  odpowiedni  laser,  róż- 
nica dróg  optycznych  w obydwu  ramionach  może  się- 
gać nawet  kilku  kilometrów,  a otrzymywany  obraz 
interferencyjny  jest  dobry.  Ten  ostatni  fakt  oznacza 
oczywiście,  że  światło  lasera  jest  znacznie  bardziej 
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Rys.  7.  Światło  gwiazdy  pada  na  zwierciadła  paraboliczne  ZL 
i Z2,  w których  ogniskach  znajdują  się  fotodetektory  Fl  i Ft. 
Prądy  fotoelektryczne  są  wzmacniane  w układach  Wx  i W 2. 
Korelator  K mierzy  uśrednioną  wartość  iloczynu  IJ2 
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nim  układem  elektronicznym,  bada  się  korelacje  sta- 
tystyczne natężeń  fotoprądów,  tzn.  wielkość  <iy2>, 
w zależności  od  odległości.  Ponieważ  natężenia  prą- 
dów ix  oraz  i2  są  odpowiednio  proporcjonalne  do  na- 
tężeń światła  padającego  Ii  = £*  oraz  I2  = E\,  w isto- 
cie w doświadczeniu  można  wyznaczyć  < Ii  Iz>. 
Przyjęto  mówić,  że  eksperyment  Hanbury-Browna 
i Twissa  dotyczy  koherencji  drugiego  rzędu.  Wynika 
to  stąd,  że  dla  spójności  pierwszego  rzędu  w doświad- 
czeniach Younga  i Micheisona  badaliśmy  wyrażenia 
typu  <£*>,  a teraz  badamy  wyrażenia 

typu  (ElEly.  Na  podstawie  zależności  </i'/2>  od 
odległości  między  fotodetektorami  Hanbury-Brown 
i Twiss  zmierzyli  średnicę  gwiazd  o małych  wymiarach 
kątowych  rzędu  0,006"  (i  dostatecznie  dużej  jasności), 
interfero-  co  nie  byłoby  możliwe  przy  wykorzystaniu  tradycyj- 
metria  nego  interferometru  Micheisona.  W ten  sposób  po- 
natężenśowa  wstały  badania  zwane  interferometrią  natężeniową. 

Lata  późniejsze  przyniosły  liczne  modyfikacje  po- 
wyższego eksperymentu,  którego  celem  było  udziele- 
nie odpowiedzi  czy  korelacje  wyższych  rzędów,  a więc 
średnie  wartości  wyrażeń  na  przykład  typu 
są  różne  dla  światła  termicznego  i laserowego.  Aby 
obliczyć  wartość  średnią,  <£/*>  = <£?£!>,  trzeba 
znać  odpowiednie  rozkłady  prawdopodobieństwa. 
W niektórych  przypadkach  ten  sam  wynik  otrzymuje 
się  dokonując  uśrednienia  po  czasie,  gdy  znane  są 
zależności  Ex  i E2  od  czasu.  Wyniki  badań  teoretycz- 
nych i doświadczalnych  wykazują,  że  wiązki  światła 
laserowego  i termicznego  spójne  w sensie  koherencji 
pierwszego  rzędu  (tzn.  dla  każdej  z nich  możemy 
obserwować  ostre  obrazy  interferencyjne)  charaktery- 
zują się  różnymi  wartościami  wyrażeń  typu  <£?££>. 
Oznacza  to,  między  innymi,  że  rozkłady  prawdopo- 
dobieństwa są  różne  dla  światła  termicznego  i lasero- 
wego. Tak  więc  istota  różnic  między  światłem  ter- 
micznym i laserowym  leży  nie  tyle  w różnych  warto- 
ściach czasu  i obszaru  koherencji,  lecz  w ich  właści- 
wościach statystycznych.  Spośród  wszystkich  ekspe- 
rymentów potwierdzających  te  różnice  zbadanie  sta- 
tystyki fotonów  optycznych  należy  do  najbardziej 
oryginalnych  i interesujących.  Omówimy  teraz  zasad- 
niczą ideę  tego  rodzaju  doświadczeń. 


Statystyczne  własności  światła 

Załóżmy,  że  na  fotokatodę  pada  światło  prawie  mo- 
nochromatyczne o szerokości  spektralnej  A\\  tak  jak 
schematycznie  pokazuje  to  rys.  8.  Z praw  zjawiska 


Rys.  8.  Światło  pada 
na  katodę.  Odpo- 
wiedni układ  elektro- 
niczny zlicza  wybite 
elektrony 


zjawisko  fotoelektrycznego  wiemy,  że  fotoprąd  (liczba  elektro- 
foro- nów  wybijanych  z katody  w ciągu  jednostki  czasu) 
elektryce  jest  proporcjonalny  do  natężenia  światła  padającego, 
a więc  do  liczby  fotonów,  które  w ciągu  jednostki 
czasu  padają  na  katodę.  Cały  proces  ma  charakter 
probabilistyczny,  bowiem  zjawiskiem  wybicia  elek- 
tronu z atomu  rządzą  prawa  mechaniki  kwantowej, 
które  pozwalają  obliczać  jedynie  prawdopodobień- 
stwo wybicia  elektronu.  Ponadto  światło  padające 
może  mieć  różne  właściwości  statystyczne,  to  znaczy 
fluktuacje  (statystyczne  odchylenia  od  wartości  śred- 
niej) natężenia  światła  mogą  podlegać  różnym  roz- 
kładom prawdopodobieństwa,  co  może  w różny  spo- 
sób wpływać  na  statystykę  wybijanych  elektronów. 
Oznacza  to,  że  natężenie  prądu  płynącego  w obwodzie 
z fotodetektorem  zmienia  się  w sposób  przypadkowy, 
istotnie  jednak  zależy  od  zmian  natężenia  światła. 

Rozwój  elektroniki  przyniósł  odpowiednio  szybkie 
i czułe  fotomnożniki  oraz  specjalne  układy,  które  po- 
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zwalają  zliczać  fotoelektrony  w ciągu  dostatecznie 
krótkiego  czasu  T.  Jeśli  w odpowiednio  dużej  liczbie 
prób  Ny  powiedzmy  kilkunastu  tysiącach,  stwierdzi- 
my, że  zarejestrowano  lx  razy  nx  fotoelektronów,  to 
prawdopodobieństwo  tego  wydarzenia /?(/*!,  T)  = IJN. 
Przez  p(nuT)  oznaczyliśmy  tutaj  prawdopodobień- 
stwo zarejestrowania  nx  fotoelektronów  w czasie  T. 
Podobnie  prawdopodobieństwo  zarejestrowania  n2 
fotoelektronów  p(n2,  T)  = IJN,  gdzie  l2  oznacza  ile 
razy  spośród  N pomiarów  zliczono  n2  fotoelektronów. 
W ten  sposób  można  wyznaczyć  funkcję  p(ny  T ) dla 
różnych  n . W ścisłej  teorii  dowodzi  się,  że  jeśli  czas  T 
jest  mniejszy  niż  czas  spójności  r l/Av,  to  liczba 
zarejestrowanych  fotoelektronów  n jest  proporcjonal- 
na do  liczby  padających  fotonów.  Tak  więc  istnieje 
możliwość  bezpośredniego  zliczania  fotonów  i bada- 
nia ich  statystyki.  Przeprowadzanie  eksperymentów 
przy  T < r jest  niemożliwe  dla  światła  termicznego, 
dla  którego  t ^ 10“8  s;  nie  jest  to  jednak  trudne  dla 
światła  z lasera  gazowego  pracującego  w sposób  ciągły, 
dla  którego  na  przykład  można  osiągnąć  czas  spójności 
t # 10“ 2 s. 

Można  jednak  otrzymać  światło  termiczne  o dosta- 
tecznie długim  czasie  koherencji  metodą  „psucia  spój- 
ności” światła  laserowego.  Również  światło  z lasera, 
który  świeci  przed  progiem  wzbudzenia  właściwej 
akcji  laserowej,  ma  właściwości  światła  termicznego 
o dostatecznie  długim  czasie  spójności. 

Eksperymenty,  w których  zlicza  się  fotony,  prze- 
prowadzane w latach  sześćdziesiątych  w wielu  ośrod- 
kach badań  optycznych,  należą  do  najważniejszych 
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Rys.  9 . Rozkłady  gęstości  fotonów  w świetle  termicznym  i la- 
serowym, zliczone  w czasie  krótszym  niż  r,  są  różne 


osiągnięć  optyki  kwantowej.  Wykazały  one,  że  p(n,  T) 
dla  T < r jest  różne  dla  światła  termicznego  i lase- 
rowego. Pomiary  ściśle  potwierdziły  wyniki  teorii, 
z której  wynika,  iż  p(n,T)  dane  jest  dla  światła  ter- 
micznego wzorem  zwanym  w fizyce  statystycznej 
wzorem  Bosego-Einsteina,  a p{n,  T ) dla  światła  z la- 
sera gazowego  jednomodowego  określa  wzór  Pois- 
sona.  Nie  podajemy  tutaj  tych  wzorów,  ale  różnicę 
między  nimi  w uproszczony  sposób  ilustruje  rys.  9. 
Różne  statystyki  fotonów  zilustrowane  są  przykła- 
dem losowego  rozrzucenia  punktów  na  osi  czasu. 
W świetle  laserowym  fotony  są  rozłożone  całkowicie 
przypadkowo  i w sensie  statystycznym  równomiernie. 
Dla  światła  termicznego  rozkład  nie  jest  równomierny, 
bowiem  w sensie  statystycznym  pojawiają  się  miejsca 
zgęszczeń  i rozrzedzeń.  Pełna  teoria  opisuje  również 
przypadki  pośrednie,  w których  mamy  do  czynienia 
z nałożeniem  się  światła  termicznego  i laserowego. 
Ten  fakt  został  również  potwierdzony  wynikami  po- 
miarów. 

Omówione  tutaj  doświadczenia  doczekały  się  wielu 
bardzo  różnych  modyfikacji.  Badano  na  przykład 
problem,  jakie  jest  prawdopodobieństwo  warunkowe 
zarejestrowania  fotonu,  jeśli  wcześniej  o czas  At  rów- 
nież zarejestrowano  foton.  Zależność  tego  prawdo- 
podobieństwa od  czasu  At  pozwala  wykapć  istnienie 
różnych  właściwości  światła  termicznego  i laserowego. 
Eksperymenty,  w których  zlicza  się  fotony  są  też 
sprawdzeniem  teorii  działania  lasera  gazowego, 
a w szczególności  progu  akcji  laserowej,  przy  którym 
właśnie  następuje  zmiana  właściwości  statystycznych 
światła. 

Do  aktualnych  problemów  badawczych  należy  wy- 
jaśnienie, dlaczego  zjawiska  optyczne  nieliniowe,  np. 
wytwarzanie  drugiej  harmonicznej,  przejścia  wielofo- 
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tonowe  (->  Optyka  nieliniowa)  zależą  od  właściwości 
statystycznych  światła,  dla  którego  zjawiska  te  obser- 
wujemy. Doświadczenia  wykazały,  że  przebieg  zja- 
wisk nieliniowych  może  być  różny  dla  światła  lase- 
rowego i światła  termicznego.  Trzeba  tutaj  przypo- 
mnieć, że  obserwacja  zjawiska  nieliniowego  wymaga 
dużego  natężenia  światła  padającego  i z tego  powodu 
jest  nim  prawie  zawsze  światło  lasera. 

Można  jednak  zmienić  statystyczne  cechy  światła 
laserowego  na  cechy  światła  termicznego  poprzez 
„psucie  spójności”  wskutek  rozpraszania  na  szorst- 
kich poruszających  się  powierzchniach  lub  poprzez 
wzbudzenie  lasera  do  świecenia  w warunkach  pracy 
z nałożeniem  się  dużej  liczby  niezsynchronizowanych 
modo  w (->  Ultrakrótkie  impulsy  światła).  Tak  otrzy- 
mana wiązka  świetlna  ma  dostatecznie  duże  natęże- 
nie do  wywołania  zjawisk  nieliniowych,  a jednocześnie 
światło  Jest  Podobna  pod  względem  właściwości  statystycz- 
ikwazś-  nyc^  światła  termicznego.  Czasami  nazywa  się  ta- 
terniczce kie  światło  kwazitermicznym.  Okazuje  się,  że  przy 
obserwacji  zjawisk  nieliniowych  skuteczność  światła 
termicznego  jest  większa  niż  światła  laserowego,  np. 
wiązka  św-iatła  laserowego  wytwarza  drugą  harmo- 
niczną słabiej  niż  wiązka  światła  termicznego  o takim 
samym  natężeniu.  W bardzo  uproszczony  i jakościo- 
wy sposób  można  tłumaczyć  to  faktem,  że  fluktuacje 
gęstości  fotonów,  a więc  i fluktuacje  gęstości  mocy 
(mierzonej  w W/cm2),  są  większe  dla  światła  termicz- 
nego, jak  to  schematycznie  ilustruje  rys.  9.  Ponieważ 
zjawiska  nieliniowe  silnie  zależą  od  gęstości  mocy, 
światło  termiczne  o większych  zgęszczeniach  okazuje 
się  bardziej  skuteczne. 

Na  zakończenie  zwróćmy  uwagę  na  ważny  fakt,  że 
badania  zliczeń  fotonów  optycznych  dotyczą  statys- 
tycznych właściwości  światła  z uwzględnieniem  jego 


natury  kwantowej.  Doświadczenia,  w których  liczono 
fotony  wykazały  bowiem,  iż  dwie  prawie  zupełnie 
monochromatyczne  wiązki  światła,  np.  światła  lase- 
rowego i termicznego,  identyczne  pod  względem  moż- 
liwości tworzenia  ostrych  obrazów  interferencyjnych, 
wciąż  istotnie  różnią  się  między  sobą  „strukturą  fo- 
tonową”. We  współczesnym  opisie  wyraża  się  to 
stwierdzeniem,  że  stany  kwantowe  pola  tych  wiązek 
są  różne.  Wytwarzanie  światła  o różnych  właściwo- 
ściach statystycznych  lub,  mówiąc  dokładniej,  o róż- 
nych cechach  kwantowych  zależy  oczywiście  od  tego, 
jak  zbudowane  jest  źródło,  a ściślej  — jaki  jest  me- 
chanizm świecenia  jego  atomów. 

W pierwszej  części  tego  artykułu  przy  omawianiu 
zagadnień  spójności  posługiwaliśmy  się  jedynie  falo- 
wymi cechami  światła,  które  z bardzo  dobrym  przy- 
bliżeniem można  opisać  w ramach  klasycznej  teorii 
fal  elektromagnetycznych  bez  wprowadzania  pojęcia 
fotonu.  Kwantowy  opis  zjawisk,  w którym  spójność  — 
lub  ogólniej  właściwości  statystyczne  — gra  istotną 
rolę,  wymaga  odpowiedniego  aparatu  matematyczne- 
go, jakim  posługuje  się  elektrodynamika  kwantowa. 
Nie  poruszono  tutaj  zupełnie  kwestii  matematycznego 
formalizmu  kwantowej  teorii  koherencji.  Scharakte- 
ryzowano jedynie  te  najważniejsze  wyniki  ekspery- 
mentalne, które  wzbogaciły  naszą  wiedzę  o falowo- 
-korpuskularnej  naturze  światła,  a w szczególności 
istotnie  rozszerzyły  tradycyjne  pojęcie  spójności  wią- 
zek świetlnych  stosowane  przy  opisie  zjawisk  inter- 
ferencyjnych oraz  stały  się  podstawą  wielu  kierunków 
badań  współczesnej  optyki. 

H.  Klejman  Lasery , Warszawa  1974;  J.  L.  Kumontowicz 
Lasery  i optyka  nieliniowa , Warszawa  1969;  A.  Kujawski, 
J.  Mostowski  Promieniowanie  elektromagnetyczne , Warezawa 
1977;  A.  Piekara  Nowe  oblicze  optyki,  Warszawa  1976;  Światło 
(zbiór  artykułów).  Warszawa  1973. 
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W 1960  r.,  po  wieloletnich  próbach,  w kilku  labora- 
toriach świata  uruchomiono  źródła  promieniowania 
optycznego  zupełnie  nowego  typu  — lasery.  Promie- 
niowanie wysyłane  przez  te  źródła  charakteryzuje  da- 
leko posunięta  monochromatyczność,  kierunkowość 
rozchodzenia  się,  spójność  i znaczna  gęstość  mocy 
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Ryś.  1.  Porównanie  charakterystyki  promieniowania:  a)  żarówka 
o temperaturze  włókna  2500  K,  b)  spektralna  lampa  rtęciowa, 
c)  laser  He-Ne  małej  mocy  działający  na  długości  fali  X — 632,8  nm. 
W przypadkach  (a)  i (b)  wiązka  jest  wysyłana  w pełnym  kącie 
bryłowym,  w (c)  rozbieżność  wiązki  wynosi  ułamek  minuty 
kątowej 


wr  porównaniu  z promieniowaniem  otrzymywanym  ze 
źródeł  klasycznych  (rys.  1 i tabela  str.  357). 

Spójność  promieniowania  z lasera  (-►  Spójność 
światła)  jest  tak  wielka,  że  przy  jego  użyciu  można 
wykonać  doświadczenie  Younga,  otrzymując  bez 
wstępnej  szczeliny  piękny  obraz  interferencyjny.  Do- 
świadczenie z interferometrem  Michę Isona  wskazuje 
na  czasy  spójności  rzędu  1 ps  (długość  spójności,  czyli 
różnica  dróg  optycznych  interferujących  wiązek  wy- 
nosi kilkaset  metrów).  W laserach  gazowych  specjal- 
nej konstrukcji  jest  możliwe  uzyskanie  szerokości  linii 
widmowej  około  2 Hz;  odpowiada  to  spójności  przy 
różnicy  dróg  optycznych  150  000  km!  Czynnikami 
ograniczającymi  spójność  promieniowania  są:  nie- 
jednorodność ośrodka,  w którym  się  rozchodzi 
promieniowanie,  i drgania  mechaniczne,  na  które 
narażone  są  poszczególne  elementy  układu  lasero- 
wego. 

Perspektywa  praktycznych  i badawczych  zasto- 
sowań laserów  sprawiła,  że  prace  w tej  dziedzinie 
podjęły  setki  laboratoriów,  a minione  lata  przy- 
niosły olbrzymi  postęp  zarówno  w konstruowaniu 
tvch  urządzeń,  jak  i w zrozumieniu  podstawowych 
procesów  związanych  z ich  działaniem  i wykorzysta- 
niem. Prowadzone  są  prace  nad  objęciem  przez  pro- 
mieniowanie z laserów  coraz  szerszych  obszarów  wid 
mowych  (aż  do  obszaru  rentgenowskiego  włącznie), 
nad  uzyskaniem  coraz  większych  gęstości  mocy  pro- 
mieniowania, coraz  krótszych  impulsów  itp.  Należy 
tu  jednak  podkreślić,  że  wiele  z tych  wymienionych 
właściwości  ma  charakter  przeciwstawny  (np.  bardzo 
silnemu  zwężeniu  spektralnemu  linii  widmowej  towa- 
rzyszy silny  spadek  mocy  promieniowania,  krańco- 
wym zaś  skróceniom  czasu  impulsu  — duże  rozsze- 
rzenie obszaru  widmowego). 
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Najprostszy  układ  kwantowy  — mikroukład  (atom 
lub  cząsteczka),  w którym  mogą  zachodzić  procesy 
absorpcji  i emisji  promieniowania,  ma  dwa  dyskretne 
stany  energetyczne:  stan  podstawowy  1 o energii  Wx 
i stan  wzbudzony  2 o energii  W2t  przy  tym  W2  > Wx. 
Przyjmujemy,  że  przejścia  promieniste  między  tymi 
stanami  są  dozwolone  przez  reguły  wyboru,  a czę- 
stość promieniowania  z nimi  związana  wynosi  v0  = 
= AWjh  = (fV2—  fVdlh(-+  Spektroskopia  atomowa). 
Takie  uproszczenie  można  przyjąć  z dobrym  przybli- 
żeniem dla  każdego  układu  kwantowego  o większej 
liczbie  poziomów,  jeśli  oddziaływanie  wybranych 
dwóch  poziomów  z wszystkimi  pozostałymi  jest  tak 
niewielkie,  że  można  je  pominąć.  W ośrodku  złożo- 
nym z bardzo  wielkiej  liczby  N (w  1 cm3)  identycznych 
mikroukładów  rozkład  obsadzeń  w warunkach  rów- 
nowagi termodynamicznej  między  stan  1 (M)  i 2 (N2) 
jest  opisany  zależnością  NJNt  = erAWl  T (prawo 
Boltzmanna);  k = 1,38- 10"23  J/K  oraz  Nx  > N2. 
Zgodnie  z tym  prawem  w parze  sodu  w temperaturze 
400  K rozkład  obsadzeń  między  stan  podstawowy 
atomów  (35)  i rezonansowy  (3P)  o energii  2,09  eV 
jest  określony  stosunkiem  NJN1  zz  10-27,  w tempera- 
turze zaś  2100  K stosunek  ten  jest  równy  10"5. 
Widać  że  w stanie  równowagi  termodynamicznej  w nie- 
zbyt wysokiej  temperaturze  obsadzenie  wzbudzonych 
stanów  atomowych  jest  znikome. 

W 1917  r.  Einstein,  analizując  wyrażenie  na  roz- 
kład natężeń  w widmie  ciała  doskonale  czarnego,  do- 
szedł do  wniosku,  że  aby  uzyskać  zgodność  opisu  teo- 
retycznego z doświadczeniem,  należy  oprócz  absorpcji 
i emisji  samorzutnej  promieniowania  wprowadzić  po- 
jęcie emisji  wymuszonej  — procesu  symetrycznego 
w stosunku  do  absorpcji  i zależnego- od  natężenia  pro- 
mieniowania znajdującego  się  w obszarze,  w którym 
się  znajduje  atom  wzbudzony;  częstość  promieniowa- 
nia wymuszającego  musi  być  równa  możliwej  częstości 
przejścia  atomu.  Bilans  obsadzeń  stanów  w przypadku 
równowagi  można  zapisać  następująco : 

i?i2Arłw(v)v„v0  = BZ1  iV2  u Mv_v0  + An N2. 

B12  = B21  są  to  współczynniki  Einsteina  absorpcji 
i emisji  wymuszonej,  A21  jest  współczynnkiem  emisji 
samorzutnej,  u(v)v_Vo  jest  gęstością  promieniowania 
o częstości  v0.  Lewa  strona  równości  przedstawia 
więc  (odniesioną  do  1 cm3)  liczbę  procesów  absorpcji 
kwantów  o energii  ńv0,  prawa  — liczbę  procesów  emisji 
wymuszonej  i samorzutnej  łącznie  (rys.  2). 

Z analizy  przeprowadzonej  przez  Einsteina  wynika, 
że  promieniowanie  wymuszone  winno  być  zgodne 
w fazie  i kierunku  rozchodzenia  się  z promieniowa- 
niem wymuszającym  (powinno  być  z nim  spójne). 
Tej  własności  nie  ma  promieniowanie  samorzutne 
o izotropowym  rozkładzie  przestrzennym  i chaotycz- 
nie rozłożonych  fazach  drgania.  W zwykłych  warun- 
kach — wobec  Ni  > N2  i bardzo  niewielkich  gęstości 
mocy  promieniowania  u(y)  w wąskim  przedziale  czę- 
stości obejmującym  v0  — udział  emisji  wymuszonej 
jest  znikomy  i może  być  pominięty. 

Gdy  promieniowanie  (monochromatyczne  i two- 
rzące równoległą  wiązkę)  przechodzi  przez  ośrodek 
pochłaniający,  jego  natężenie  maleje  w miarę  przeni- 
kania promieniowania  w głąb  ośrodka.  Tę  zmianę  na- 
tężenia opisuje  prawo  Lamberta  / = /0  jest 

natężeniem  początkowym,  I — natężeniem  po  prze- 
byciu warstwy  grubości  x , « jest  współczynnikiem 
absorpcji  promieniowania  w ośrodku  (w  ogólności 
x = «(v)  — zależy  on  od  częstości  fali).  W zwykłych 
warunkach  * ~ Nx.  Gdy  jednak  uwzględnimy  istnie- 
nie emisji  wymuszonej  (a  emisję  samorzutną  pominie- 
my, bo  przy  jej  izotropowym  rozkładzie  jej  udział 
w określonym  kierunku  jest  znikomy),  to  wówczas 

x(y)~Ni{\-N2lNi). 


Jeśli  więc  będziemy  powiększali  obsadzenie  stanu 
o większej  energii,  udział  emisji  wymuszonej  będzie 
wzrastał,  a x(v)  będzie  malało.  Gdyby  się  nam  udało 
uzyskać  tak  znaczne  obsadzenie  stanu  2,  by  NJ Nx  > 1 
wówczas  x(y)  stałoby  się  mniejsze  od  zera  i zamiast 
osłabienia  wiązki  nastąpiłoby  jej  wzmocnienie.  Wiąz- 
ka miałaby  przy  tym  właściwości,  jakie  Einstein  prze- 
widział dla  promieniowania  wymuszonego.  Oczywiś-  stan 
cie  nie  ma  tu  sprzeczności  z zasadą  zachowania  ener-  odwrócenia 
gii,  bo  uzyskanie  stanu  odwrócenia  obsadzeń  (tak  obsadzeń 
nazywamy  stan,  w którym  obsadzenie  poziomu 
o wyższej  energii  jest  większe  od  obsadzenia  poziomu 

0 niższej  energii)  wymaga  dostarczenia  energii  na 
przepompowanie  atomów  z 1 do  2.  Łatwo  zauważyć 
(w  równaniu  bilansu  w stanie  równowagi  Bl2  = B21 

1 A21  > 0),  że  pompowanie  w układzie  dwupoziomo- 
wym nie  może  doprowadzić  do  odwrócenia  obsadzeń. 

Jest  to  możliwe  w układach  bardziej  złożonych,  któ- 
rych rozważenie  zaproponowali  Ch.  H.  Townes 
i A.  L.  Schawlow  w 1958  r. 

Zatem  warunki,  jakie  winny  być  spełnione,  by  uzy- 
skać możliwość  wytwarzania  promieniowania  spój- 
nego w ośrodku  czynnym,  są  następujące:  wytworzenie 
w ośrodku  czynnym  stanu  odwrócenia  obsadzeń  (wy- 
starczającego na  to,  by  wzmocnienie  wiązki  przewyż- 
szyło możliwe  straty  jej  natężenia)  oraz  wstępne  na- 
świetlenie ośrodka  czynnego  promieniowaniem  wy- 
muszającym o gęstości  mocy  dostatecznej  na  to,  by 
efektywnie  spowodować  emisję  wymuszoną  w okre- 
ślonym, celowo  wybranym  kierunku.  Pierwszy  wa- 
runek realizuje  się  przez  pompowanie  ośrodka  czyn- 
nego, drugi  — przez  zastosowanie  komory  rezonanso- 
wej (rezonatora). 

Metoda,  którą  się  uzyskuje  stan  odwrócenia  obsa- 
dzeń, nawiązuje  do  technik  stosowanych  i sprawdzo- 
nych w mikrofalowych  generatorach  kwantowych  — 
maserach  (->  Spektroskopia  mikrofalowego  rezonan- 
su rotacyjnego).  Niezbędne  jest  w tym  celu  użycie 
układu  mającego  co  najmniej  3 dyskretne  poziomy 
energetyczne  (rys.  3),  co  jest  typowe  dla  znacznej  licz- 
by substancji  fluoryzujących  (są  to  albo  substancje 
zawierające  centra  utworzone  przez  domieszki  jonów 
metali  w osnowach  krystalicznych  i szkliwach,  albo 
roztwory  barwników  organicznych).  Błysk  lampy  wy- 
ładowczej przenosi  przeważającą  część  centrów  pompowanie 
czynnych  ze  stanu  1 do  3 (absorpcja  promieniowania),  optyczne 
z którego  oprócz  powrotu  promienistego  do  stanu  1 
możliwe  jest  bardzo  szybkie  — w porównaniu  z przej- 
ściem 3 ->  1 — przejście  bezpromieniste  do  stanu  2, 
do  którego  zostaje  przeniesiona  przeważająca  część 
atomów  wzbudzonych  (energia  uwolniona  w przejś- 
ciach bezpromienistych  zamienia  się  w energię  ciepl- 


Rys.  2.  Przejścia  w układzie 
dwupoziomowym 


Rys.  3.  Przejścia  w układzie 
trój  poziomowym 


Rys.  4.  Przejścia  w układzie 
czteropoziomowym 
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ną).  Ze  stanu  2 następuje  przejście  2-^1  (fiuore- 
scencja)  z niewielką  szybkością,  zależną  od  natury 
centrów,  np.  w różowym  rubinie  (domieszka  0,05% 
Cr*  w osnowie  kryształu  A1203),  który  jest  typowym 
materiałem  laserowym,  czas  życia  poziomu  2 wynosi 
3 ms.  W ten  sposób,  przy  dostatecznej  mocy  błysku, 
możliwe  jest  uzyskanie  odwrócenia  obsadzeń  między 
stanami  2 i 1.  Tego  typu  układy  działają  w sposób 
impulsowy.  Efektywność  działania  można  zwiększyć 
przez  zastosowanie  substancji  o układzie  4 poziomów 
(np.  jony  uranu  lub  samaru  w osnowie  kryształu 
fluorytu),  gdyż  w takim  wypadku  fluorescencja  jest 
wywołana  przejściem  między  stanami  3 i 2,  a z dol- 
nego stanu  2 następuje  szybkie  bezpromieniste  przejś- 
cie do  stanu  podstawowego  (rys.  4).  W takim  układzie 
można  uzyskać  stacjonarne  odwrócenie  stanów  3 i 2. 

Ośrodek  czynny  lasera  w postaci  walca  umieszcza 
się  w rezonatorze,  którego  zasadniczą  częścią  jest 
układ  dwóch  zwierciadeł  (płaskich  lub  sferycznych). 
Zwierciadła  zmuszają  promieniowanie  zapoczątko- 
wane w pompowanym  ośrodku  czynnym  do  roz- 
chodzenia się  w nim  wzdłuż  osi  walca  wielokrotnie 
tam  i z powrotem.  Promieniowanie  to  wymusza 
przejścia  promieniste  wzbudzonych  centrów  i w ten 
sposób  się  wzmacnia  (rys.  5).  Jedno  ze  zwierciadeł 
maksymalnie  odbija  padające  na  nie  promieniowanie 
(współczynnik  odbicia  100%)»  drugie  ma 
zdolność  odbijającą  nieco  mniejszą  ( R ~ 55%) 
i niewielką  transmisję  (T » 5%),  co  pozwala  na 
wyprowadzenie  części  promieniowania  na  zewnątrz. 
W rzeczywistości  przy  każdym  odbiciu  zachodzą 
pewne  straty  i wzmocnienie  przez  napompowany 
ośrodek  czynny  winno  być  wystarczająco  duże,  by 
pokryło  zarówno  straty  przy  odbiciu,  jak  i odpływ 
energii  promieniowania  na  zewnątrz  rezonatora. 

Aby  działanie  wymuszające  promieniowanie  było 
jak  największe,  rezonator  winien  być  dostrojony 
do  wzmacnianej  długości  fali  (oprócz  wyjustowania 
zwierciadeł  ściśle  prostopadle  do  osi  rezonatora). 
Dostrojenie  do  rezonansu  jest  wtedy,  gdy  w obszarze 
między  zwierciadłami  rezonatora  zawiera  się  całko- 
wita liczba  połówek  długości  fali  światła:  2L/2  = n. 
Długość  rezonatora  L jest  rzędu  kilkudziesięciu  cm, 
a X jest  ułamkiem  jim,  a więc  liczba  całkowita  n jest 
ogromna  (ok.  10s)  i w szerokości  linii  fiuorescencji 
(wynoszącej  np.  w rubinie  ok.  0,2  nm,  tj.  ok.  100 
GHz,  a w laserze  gazowym  He-Ne  ok.  0,0015  nm, 
tj.  0,8  GHz)  znajdzie  się  przy  określonym  L kilka, 
a czasem  kilkanaście  możliwych  długości  fali  spet- 
niajacych  warunek  rezonansu  (rys.  6),  można  też  dia 
nich  wzbudzić  kilka  lub  kilkanaście  rodzajów  drgań, 
czyli  modów  (łac.  modus  ‘rodzaj,  sposób  ; — ► Ultra- 
krótkie impulsy  światła).  Najsilniej  wzbudzają  się 
drgania  w pobliżu  maksimum  rozkładu  linii  absorp- 
cyjnej (najsilniejsze  wzmocnienie).  Ten  obraz  drgań 
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Rys.  6.  a)  Linia  emisyjna  Ne  (A  = 632,8  nm),  szerokość  dopple- 
rowska  linii  800  MHz,  szerokość  naturalna  linii  10  MHz;  b)  roz- 
kład częstości  rezonansowych  komory  (przyjęto  L — l m);  sze- 
rokości instrumentalne  rezonansów  (ok.  3 MHz)  zależne  są  od 
współczynników  odbicia  zwierciadeł  komory  i dokładności  wy- 
kończenia ich  powierzchni;  c)  oscylacje  wzbudzają  się  tam,  gdzie 
przypada  obszar  maksimum  fiuorescencji,  i mogą  zachodzić  na 
kilku  częstościach  rezonansowych 
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w rezonatorze  jest  bardzo  uproszczony  z powodu 
uwzględnienia  tylko  osiowych  modów  drgania.  Po- 
nieważ w rzeczywistości  drgania  zachodzą  w trójwy- 
miarowym rezonatorze  o symetrii  cylindrycznej, 
obraz  jest  o wiele  bardziej  złożony. 

Przejście  od  fiuorescencji  do  wymuszonej  generacji 
promieniowania  przejawia  się  w skokowej  zmianie 
rozbieżności  wiązki  wysłanej  z ośrodka  czynnego : od 
rozkładu  izotropowego  (równomiernego  we  wszy- 
stkich kierunkach)  do  postaci  niemal  doskonale 
równoległego  promienia.  Przejściu  temu  towarzyszy 
bardzo  silne  zwężenie  linii  widmowej  (rys.  6c). 

Przy  pompowaniu  metodą  impulsową  oscylacje  próg 
ośrodka  czynnego  rozpoczynają  się  z chwilą,  gdy  generacji 
zostaje  przekroczony  próg  generacji  (wzmocnienie 
większe  niż  straty),  a trwają  one  tak  długo,  jak  długo 
pompowanie  utrzymuje  niezbędne  do  tego  odwróce- 
nia obsadzeń.  Natomiast  w układzie  o pompowaniu 
ciągłym  ustala  się  stan  równowagi,  w którym  wzmoc- 
nienie uzyskane  w ośrodku  pompowanym  kompensuje 
straty  (w  które  wliczamy  energię  wyprowadzonej  na 
zewnątrz  wiązki  promieniowania). 


Działanie  wybranych  typów 
laserów 


Mimo  że  od  uruchomienia  pierwszych  laserów  nie 
upłynęło  jeszcze  20  lat,  technika  laserowa  poczyniła 
w tym  czasie  olbrzymie  postępy.  Skonstruowano 
dziesiątki  typów  różnych  laserów,  uzyskano  efekt 
laserowy  w setkach  różnych  ośrodków  czynnych  (ga- 
zowych, ciekłych  i stałych),  a liczba  zidentyfikowa- 
nych przejść  laserowych  wynosi  zapewne  kilkanaście 
tysięcy.  W dalszym  ciągu  artykułu  omówimy  najbar- 
dziej powszechne  typy  laserów,  a mianowicie  lasery 
krystaliczne  — rubinowy  i neodymowy,  laser  gazowy 
He-Ne  i lasery  barwnikowe,  wspomnimy  także  o lase- 
rach chemicznych.  Lasery  półprzewodnikowe  omó- 
wione są  w artykule  „Optoelektronika  półprzewod- 
nikowa”, natomiast  otrzymywanie  impulsów  gigan- 
tycznych oraz  bardzo  krótkich  opisane  jest  w artykule 
„Ultrakrótkie  impulsy  światła”. 


Laser  rubinowy  b neodymowy 

Ośrodek  czynny  lasera  krystalicznego  ma  postać  ośrodki 
cylindrycznego  pręta  o średnicy  ok.  1 cm  i długości  czynne 
do  kilkunastu  cm  ustawionego  między  zwierciadłami.  Saserów 
W laserze  rubinowym  (rys.  7)  osnową  jest  kryształ 
szafiru  (A1203)  domieszkowany  jonami  Cr3+,  w neo- 
dymowym — szkło  lub  kryształy  CaF2,  CaW04, 

YAG  (granat  itrowo-glinowy)  i inne  domieszkowane 
jonami  Nd3-.  Monokryształy  stanowiące  osnowę 
muszą  wykazywać  wielką  doskonałość  struktury. 

Pręty  wycina  się  tak,  że  oś  walca  tworzy  z osią  optycz- 
ną kryształu  określony  kąt,  zadany  warunkami  do- 
świadczenia. Ścianki  czołowe  pręta  są  oszlifowane 
z dokładnością  co  najmniej  2/20,  a nierzadko  pokryte 


elektrody 


Rys.  7.  Schemat  lasera  rubinowego ; strzałki  oznaczają  obieg  gazu 
chłodzącego 
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są  warstwą  odbijającą  tworzącą  rezonator  (w  pew- 
nych typach  doświadczeń  konieczne  jest  jednak  uży- 
wanie zwierciadeł  zewnętrznych). 

Pompowanie  ośrodka  czynnego  prowadzi  się  za 
pomocą  wyładow-czych  lamp  błyskowych  wypełnio- 
nych ksenonem.  Błysk  uzyskuje  się  rozładowując 
przez  lampę  baterię  kondensatorów  o pojemności  od 
kilkuset  do  kilku  tysięcy  pF  przy  napięciu  kilku  kV. 
W celu  jak  najlepszego  wykorzystania  strumienia 
świetlnego  lampie  nadaje  się  kształt  linii  śrubowej 
owijającej  pręt  i dodatkowo  otacza  się  ją  osłoną  po- 
krytą chromem  odbijającym  promieniowanie.  W in- 
nych układach  stosuje  się  oświetlacze  skupiające  na 
pręcie  promieniowanie  wysyłane  przez  podłużną 
lampę  wyładowczą.  Mimo  tych  zabiegów  zaledwie 
drobna  część  energii  elektrycznej  dostarczonej  do 
lampy  zostaje  efektywnie  przemieniona  w energię 
wypromieniowaną  przez  laser  (mniej  niż  0,1%); 
przeważająca  część  energii  zamienia  się  w ciepło,  co 
narzuca  konieczność  silnego  chłodzenia  układu. 

Układ  poziomów  energetycznych  jonu  Cr3+  w ru- 
binie odpowiada  schematowi  z rys.  3.  Korzystną  sy- 
tuację stwarza  okoliczność,  że  absorpcja  promienio- 
wania pompującego  zachodzi  w stosunkowo  szero- 
kim obszarze  widmowym  (poziom  3 należy  zastąpić 
szerokim  ciągłym  pasmem).  Mimo  to,  obszar  widmo- 
wy absorpcji  pokrywa  zaledwie  drobną  część  widma 
wysyłanego  przez  lampę.  Po  przekroczeniu  progu  ge- 
neracji zostaje  wypromieniowany  w błysku  krótszym 
niż  1 ms  impuls  laserowy  odpowiadający  fluorescencji 
i^rubinu  (X  = 694,3  nm).  Przebieg  czasowy  wzbudzo- 
nej akcji  laserowej  jest  na  ogół  bardzo  złożony,  składa 
się  z szeregu  kolejnych  rozbłysków  odpowiadających 
różnym  modom  drgań  rezonatora  (w  miarę  dopom- 
powywania  ośrodka  czynnego  przez  lampę). 

Pompowanie  lasera  neodymowego  zachodzi  w wa- 
runkach dogodniejszych  — wg  schematu  na  rys.  4. 
Wobec  tego,  że  różnica  energii  między  poziomami  2 i 1 
równa  2000  cm-1  (tj.  4-  10“*J)  w temperaturze  poko- 
jowej (300  K)  jest  rzędu  k T,  uzyskanie  odwrócenia 
obsadzeń  między  poziomami  3 i 2 jest  znacznie  łat- 
wiejsze niż  w rubinie,  a ochłodzenie  ośrodka  czynne- 
go do  temperatury  ciekłego  azotu  (77  K)  pozwala  na 
uzyskanie  pracy  ciągłej  tego  lasera  na  długości  fali 
1,05  pm  przy  niezbyt  wysokiej  mocy  (ok.  1 mW) 
Laser  Nd3+  w YAG  pozwala  na  uzyskanie  w impulsie 
olbrzymich  mocy.  W podobny  sposób  jak  laser  neo- 
dymowy działają  lasery,  w których  w różnych  osno- 
wach krystalicznych  centrami  są  jony  metali  ziem 
rzadkich  i uranu. 


Lasery  gazowe 

Odwrócenie  obsadzeń  poziomów  jako  przygotowanie 
do  akcji  laserowej  w gazach  może  być  uzyskane  przez 
wyładowanie  elektryczne.  Ogromne  znaczenie  mają 
wówczas  atomy  w stanach  metatrwałych  (->  Spek- 
troskopia atomowa),  ich  energia  może  być  przekazana 
w zderzeniach  atomom  lub  cząsteczkom  właści- 
wego ośrodka  laserującego.  Tak  jest  właśnie  w lase- 
rze He-Ne,  w którym  ciałem  roboczym  jest  miesza- 
nina helu  i neonu  o ciśnieniu  cząstkowym  helu  ok. 
130  Pa  i neonu  ok.  13  Pa. 

Wyładowanie  elektryczne  prowadzone  w tej  mie- 
szaninie wzbudza  atomy  helu  i neonu  do  różnych  sta- 
nów. Najważniejsze  jednak  dla  uzyskania  akcji  lase- 
rowych jest  wzbudzenie  atomów  helu  do  stanów 
metatrwałych  21S0  (o  energii  20,61  eV)  oraz  2 ZSX 
(o  energii  19,82  eV).  Energia  pierwszego  z wymienio- 
nych stanów  niemal  dokładnie  odpowiada  energii 
wzbudzenia  stanu  3 s«  neonu,  drugiego  — energii 
stanu  2 sz  (rys.  8).  Wobec  tego  wzbudzenie  może  być 
bardzo  efektywne  w zderzeniach  przebiegających 
według  symbolicznych  równań: 

He^SoHNeCPSo)  - He(l150)+Ne(352) 

He(2351)H-Ne(l15'0)  ->  He(l1Ą)+Ne(252). 
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Ten  rodzaj  pompowania  prowadzi  do  bardzo  skutecz- 
nego wytworzenia  nadwyżki  obsadzenia  stanu  3 s2  nad 
3 p4  i 2px  oraz  stanu  ls2  nad  2/?4  i do  możliwości  uzys- 
kania między  nimi  akcji  laserowej. 


He 


Ne 


Rys.  8.  Schemat  wzbudzenia  w laserze  He-Ne  (stosuje  się  skró- 
towe oznaczenia  poziomów  neonu) 
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Rys.  9.  Schemat  lasera  He-Ne 


okienko  ustawione 
pod  kątem  Brewstera 


Budowę  lasera  He-Ne  przedstawia  schematycznie 
rys.  9.  Rura  laserowa  (szklana  lub  kwarcowa)  zam- 
knięta jest  doskonale  płasko-równoległymi  okienkami 
nachylonymi  do  osi  rury  pod  kątem  Brewstera  (w  celu 
minimalizacji  strat  przy  odbiciu);  jej  typowe  wymia- 
ry: długość  — kilkanaście  cm  do  kilku  m,  średnica 
wewnętrzna  — kilka  do  kilkunastu  mm.  Do  rury  wlu- 
towane  są  elektrody,  do  których  przykłada  się  napię- 
cie powodujące  wyładowanie.  Rezonator  tworzą 
zewnętrzne  zwierciadła  (płaskie  lub  sferyczne  w usta- 
wieniu współogniskowym),  z których  jedno  ma  pew- 
ną, niewielką  przepuszczalność,  co  umożliwia  wypro- 
wadzenie wiązki  laserowej  na  zewnątrz. 

Zastosowanie  zwierciadeł  dielektrycznych  o dużej 
zdolności  odbijającej  w wąskim  paśmie  widmowym 
umożliwia  wybór  jednej  z licznych  możliwych  akcji 
laserowych.  Inna  metoda  selekcji  polega  na  zamknię- 
ciu rury  pryzmatem  i takim  ustawieniu  zwierciadła 
rezonatora,  by  wracało  do  rury  tylko  promieniowanie 
o wybranej  długości  fali.  W tych  warunkach  łatwo 
można  otrzymać  jedną  z trzech  bardzo  silnych  akcji 
laserowych  o długościach  fali  Xx  = 3,39  pm,  X2  = 

= 1,15  pm  i X3  = 0,6328  pm.  Liczba  zidentyfikowa- 
nych przejść  w laserze  He-Ne  przekracza  już  70. 

Obejmują  one  obszar  od  0,63  pm  do  pośredniej  pod- 
czerwieni. 

W czasie  trwania  akcji  laserowej  wyładowanie  stale  laser 
podtrzymuje  różnicę  obsadzeń,  otrzymuje  się  zatem  o pracy 
akcję  laserową  o działaniu  ciągłym.  Moc  laserów  tego  ciągłej 
typu  wynosi,  zależnie  od  konstrukcji  i wymiarów, 
od  kilkunastu  do  stu  mW. 

Laser  He-Ne  pracuje  na  ogół  w układzie,  w którym 


jest  wzbudzonych  jednocześnie  wiele  modów.  Często 
jednak  w pracach  badawczych,  zwłaszcza  wówczas, 
gdy  istotne  jest  uzyskanie  wysokiego  stopnia  spójno- 
ści promieniowania,  należy  doprowadzić  laser  do 
pracy  jednomodowej.  Można  to  uzyskać  m.in.  przez 
odpowiednie  skrócenie  lasera.  Rysunek  6 obrazuje 
rozkład  modów  w laserze  metrowym.  Odległość  między 
modami  wynosi  150  MHz.  Można  obliczyć,  że  przy 
skróceniu  lasera  do  10  cm  odległość  sąsiadujących 
modów  wzrośnie  do  1,5  GHz  i w praktyce  można 
oczekiwać  wówczas  wzbudzenia  tylko  jednego  modu. 
Równocześnie  jednak  skrócenie  ośrodka  czynnego 
wywołuje  znaczne  zmniejszenie  wzmocnienia  i moc 
lasera  maleje  (poniżej  100  jiW). 

Baser  Oprócz  laserów  gazowych,  w których  ciałem  robo- 
jonowy  czym  jest  gaz  szlachetny  (lub  mieszanina  gazów  szla- 
chetnych), zbudowano  wiele  typów  laserów  jonowych. 
Lasery  na  jonach  gazu  szlachetnego  (wśród  nich  jest 
szczególnie  ważny  ze  względu  na  zastosowanie  laser 
na  jonach  argonu  Ar+)  pokrywają  swym  promienio- 
waniem obszar  widmowy  od  nadfioletu  do  bliskiej 
podczerwieni.  W każdym  gazie  szlachetnym  (prze- 
ważnie przy  jednokrotnej  jonizacji)  zidentyfikowano 
po  kilkadziesiąt  przejść  laserowych.  Warto  wymienić 
również  lasery  na  jonach  metali  ziem  alkalicznych 
(Mg+,  Ca+,  Ba+,  Sr+),  na  jonach  grupy  kadmu  (Cd+, 
Hg+  i Zn+),  ważne  wreszcie  znaczenie  mają  lasery 
gazowe,  w których  ciałem  roboczym  są  jony  chlorow- 
ców (FI;,  Clt,  Br^,  J^>. 

Na  zakończenie  przeglądu  laserów  gazowych 
wspomnimy  jeszcze  o dwóch,  ważnych  ze  względu 
lasery  na  zastosowanie,  laserach  molekularnych:  azotowym 
molekularne  i na  C02.  Pierwszy,  wzbudzany  wyładowaniem  elek- 
trycznym, pracuje  w bliskim  nadfiolecie  i w obszarze 
promieniowania  widzialnego  (przejścia  zachodzą 
między  wzbudzonym  stanem  elektrono wo-oscylacyjno- 
rotacyjnym  i jednym  ze  stanów  oscylacyjno-rotacyj- 
nych  stanu  elektronowo  nie  wzbudzonego);  drugi  — 
pracuje  zarówno  w sposób  ciągły,  jak  i impulsowy, 
a emituje  promieniowanie  w pośredniej  (9,6-10,6  pm) 
podczerwieni  (przejścia  zachodzą  między  wzbudzony- 
mi stanami  oscylacyjno-rotacyjnymi  elektronowo  nie 
wzbudzonymi).  Dzięki  dużemu  zagęszczeniu  pozio- 
mów molekularnych  sprawność  pompowania  jest 
większa  w laserach  molekularnych  niż  w atomowych 
i jonowych,  a dodatek  azotu  (N2)  do  dwutlenku  węgla 
powiększa  efektywność  pompowania  lasera  na  C02 
przez  przekazywanie  energii  wzbudzenia  oscylacyjne- 
go od  cząsteczek  N2  do  C02  w trakcie  ich  zderzeń. 

Laser  azotowy  służy  do  pompowania  laserów  barw- 
nikowych, a laser  C02  jest  źródłem  promieniowania 
podczerwonego  wielkiej  mocy  (w  pracy  impulsowej 
moc  szczytowa  wynosi  do  50  kW  w impulsach  trwa- 
jących ok.  150  ns  przy  częstości  powtórzeń  400  Hz, 
a w pracy  ciągłej  — 500  W). 


Lasery  barwnikowe 

Opisane  dotąd  lasery  obejmują  wprawdzie  szeroki 
obszar  widmowy,  jednakże  możliwości  ich  przestraja- 
nia  w sposób  ciągły  są  bardzo  ograniczone.  Tymcza- 
sem takie  przestrajanie  jest  warunkiem  licznych  za- 
stosowań laserów  w spektroskopii.  Właściwość  tę 
można  uzyskać  w laserach  barwnikowych,  tj.  takich, 
w których  ośrodek  czynny  stanowi  roztwór  silnie 
fluoryzującego  barwnika  (np.  fluoresceiny,  rodaminy, 
zob.  ii.  12  i 13,  tabl.  4). 

Typowy  układ  poziomów  barwnika  w roztworze 
przedstawia  rys.  10.  Ciągłe  pasma  energetyczne 

50  i Sx  powstały  z układów  poziomów  oscylacyjno- 
rotacyjnych  barwnika  w wyniku  oddziaływań  z czą- 
steczkami rozpuszczalnika.  W zwykłych  warunkach 
obsadzone  są  najniższe  poziomy  pasma  S0y  a pasmo 

51  (fluorescencyjne)  jest  próżne.  Po  wzbudzeniu  (za- 
leżnie od  energii  kwantu  pochłoniętego)  do  jednego 
z wyższych  poziomów  pasma  wzbudzonego  Si  na- 
stępuje najpierw  szybkie  (w  czasie  10-12  s)  bezpromie- 


niste  przejście  do  dna  pasma  Sl9  a następnie,  po 
czasie  rzędu  10~9  s,  emisja  kwantu  fluorescencji  i przej- 
ście do  jednego  z poziomów  oscylacyjno-rotacyjnych 


Rys.  10.  Układ  poziomów  barw- 
nika w roztworze;  S0  i Sx  pasmo 
podstawowe  i fluorescencyjne, 
r0  metatrwały  poziom  trypleto- 
wy 


Rys.  11.  Symetria  zwierciadlana  widm  absorpcji  i fluorescencji 
cząsteczek  barwnika 


Sq.  Z niego  następuje  szybki  powrót  na  dno  pasma 
S0.  W ten  sposób  widmo  absorpcji  (przy  wzbudzeniu 
źródłem  o widmie  ciągłym)  wykazuje  zwierciadlaną 
symetrię  w stosunku  do  widma  fluorescencji  (rys. 

11).  Widać  również,  że  przy  silnym  wzbudzeniu 
cząsteczek  barwnika  można  uzyskać  znaczne  odwró- 
cenie obsadzenia  dna  pasma  Si  względem  górnego 
obszaru  pasma  S0. 

Uzyskanie  akcji  laserowej  w takim  układzie  wyma- 
ga nie  tylko  umieszczenia  kuwety  z roztworem  barw-  warunki 
nika  w rezonatorze  i intensywnego  pompowania  op-  akcji 
tycznego,  lecz  również  wyposażenia  rezonatora  w ele-  laserowej 
ment  rozszczepiający,  który  umożliwia  wybranie  od- 
powiednio wąskiego  pasma  widma  do  zainicjowania 
i podtrzymania  akcji  laserowej  na  określonej  długości 
fali.  Stosuje  się  tu  różne  układy  (rys.  12),  od  pryzmatu 
począwszy,  a na  kombinacji  siatki  dyfrakcyjnej 
schodkowej  z interferometrem  Fabry’ego-Perota 
skończywszy.  Ten  ostatni  układ  pozwala  na  otrzyma- 
nie wiązki  promieniowania  o szerokości  widmowej 
kilku  MHz.  Przestrajanie  następuje  albo  przez  powol- 


wiązka  wyjściowa  światła 
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przestrajanie  ną  zmianę  drogi  optycznej  w interferometrze  (prze- 
lasera  strajanie  precyzyjne),  albo  przez  niewielkie  zmiany 
nachylenia  siatki  (przestrajanie  zgrubne).  Obszar 
przestrajania  wynosi  kilkadziesiąt  nanometrów,  a uży- 
cie zestawu  kilku  barwników  pozwala  na  otrzymanie 
szerokiego  obszaru  widmowego.  Z rys.  11  widać 
również,  że  warunki  uzyskania  promieniowania  la- 
serowego w obszarze  nakrywania  się  widm  absorpcji 
i fluorescencji  są  niekorzystne,  absorpcja  powiększa 
bowiem  straty  w układzie. 

Lasery  barwnikowe  pompuje  się  bądź  lampą  błysko- 
wą (podobnie  jak  laser  rubinowy),  bądź  też  odpowied- 
nio dostrojonym  laserem  argonowym  lub  azotowym. 


Lasery  chemiczne 

Uzyskanie  efektu  laserowego  jest  możliwe  w ukła- 
dach molekularnych,  w których  reakcje  chemiczne 
prowadzą  bezpośrednio  do  powstania  znacznej  liczby 


do  pompy 

{usuwanie  produktów  reakcji) 


Rys.  13.  Schemat  lasera  chemicznego 


swobodnych  wzbudzonych  atomów  lub  cząsteczek. 

Tego  typu  mechanizm  wzbudzenia  daje  duże  szanse 
uzyskania  stanu  odwrócenia  obsadzeń  między  po- 
ziomami atomowymi  lub  molekularnymi. 

Do  chwili  obecnej  jedną  z najlepiej  zbadanych  kom- 
binacji składników  lasera  chemicznego  jest  fluor 
z wodorem  lub  z deuterem.  Schemat  tego  typu  lasera  reakcje  w 
o działaniu  ciągłym  pokazany  jest  na  rys.  13.  W łase-  Easerze 
rze  takim  zachodzą  reakcje  ( Q — energia):  chemicznym 

F24-<2  — 2F  (dysocjacja  cząsteczki  Ifluoru), 

F+D2  = DF*~D  (reakcja  z deuterem  dająca  wzbu- 
dzoną cząsteczkę  DF*), 

DF*+/z/zł'  ->  DF+fa-j-l)^  (emisja  wymuszona  czą- 
steczki DF*). 

Często  do  fluoru  i deuteru  dodaje  się  jeszcze  C02  (jako 
składnik,  który  przejmuje  wzbudzenie  od  fluoru) 
oraz  gazy  szlachetne.  Wówczas  (doświadczenie  pro- 
wadzono przy  stosunku  ciśnień  cząstkowych  Pd2: 

Pf^iPcoziPhc  = 1:1:4:5  i ciśnieniu  całkowitym  p = 

= około  1000  hPa)  wzbudzenie  przekazane  zostaje 
w zderzeniach  cząsteczkom  C02,  które  w akcji  lasero- 
wej wysyłają  promieniowanie  o długości  fali  ok.  10  pm. 

Lasery  chemiczne  nasuwają  jak  dotąd  wiele  trud- 
nych do  rozwiązania  problemów  technologicznych. 

Podczas  reakcji  w obszarze  reaktora  wydziela  się 
bardzo  wiele  ciepła,  które  należy  szybko  odprowa- 
dzić, a poza  tym  dynamika  takiego  układu  bardzo 
się  komplikuje.  Innymi  zagadnieniami  czekającymi  na 
rozwiązanie  są:  proste  i skuteczne  przeprowadzenie 
dysocjacji  składników  reakcji  na  atomy ; uzyskiwanie 
wzbudzenia  molekularnego  do  określonych  grup 
poziomów  oscylacyjno-rotacyjnych  cząsteczki  (naj- 
lepsze by  było  wprowadzenie  układu  laserującego 
w wysokoenergetyczne  stany  oscylacyjne);  objęcie 
akcją  laserową  obszaru  widzialnego  widma.  Próby 
prowadzi  się  w dwóch  kierunkach:  jednym  jest  użycie 
jako  cząsteczek  laserujących  wzbudzonych  tlenków 
metali  z mieszaniny  Me2-f02,  drugim  — poszuki- 
wanie przejść  ze  zmianą  liczby  kwantowej  stanu 
oscylacyjnego  większą  niż  o jeden;  jak  dotąd  próby 
te  nie  dały  pozytywnego  wyniku. 

Bibliografia  -*  Lasery  — zastosowanie. 


Lasery  -■  zastosowanie 

Jacek  Chrostowski 


Po  okresie  pionierskim  lasery  pod  koniec  lat  sześć- 
dziesiątych weszły  w etap  dojrzałych  technologicznie 
konstrukcji  i stały  się  niezastąpionymi  narzędziami 
w pracach  badawczych  oraz  w technice.  W stosunku 
jednak  do  ogromnych  możliwości  pod  tym  względem 
lasery  są  wprowadzane  do  techniki  opornie.  Poza 
badaniami  naukowymi,  w których  się  stały  normal- 
nym narzędziem  pracy,  główne  zastosowanie  znalazły 
one  w obróbce  termicznej  materiałów,  w pomiarze 
odległości  oraz  wytyczaniu  kierunków.  Wykorzystanie 
bardziej  subtelnych  cech  promieniowania  laserowego 
(jak  w telekomunikacji  laserowej)  nie  wyszło  poza 
dziedzinę  wojskowości  lub  kosmonautyki.  (Tabela: 
Porównanie  podstawowych  typów  laserów.) 

W artykule  tym  omówimy  tylko  ważniejsze  lub 
ciekawsze  zastosowania  laserów,  nie  omówione  w in- 
nym miejscu.  Zastosowanie  laserów  w holografii, 
która  się  rozwinęła  w samodzielną  dziedzinę,  oraz 
laserów  półprzewodnikowych  omówione  jest  w artyku- 
łach „Holografia”  i „Optoelektronika  półprzewod- 
nikowa”. Duże  znaczenie,  m.in.  ze  względu  na  prace 
nad  uzyskaniem  kontrolowanej  reakcji  termojądrowej, 
ma  wytwarzanie  impulsów  gigantycznych,  omówione 
w artykule  „Ultrakrótkie  impulsy  światła”.  Nato- 
miast ogólna  zasada  działania  laserów'  i podstawowe 
ich  typy  przedstawione  są  w artykule  „Lasery  — 
podstawy  działania”. 


TeEekomunikacja  optyczna 

Współczesne  systemy  łączności  wykorzystują  fale 
elektromagnetyczne  z zakresu  częstości  radiowych 
i mikrofalowych.  Przez  modulację  jednego  z para- 
metrów fali  nośnej  można  przekazywać  wiele  nieza- 
leżnych sygnałów;  im  większa  jest  częstość  fali  nośnej, 
tym  więcej  niezależnych  sygnałów,  zwanych  kanałami, 
można  przekazać  (tabela)  w jednym  łączu.  (Łą-  kanał 
czem  nazywa  się  zestaw  urządzeń  rozmieszczonych  informacji 
w przestrzeni  od  miejsca,  w którym  informacja  została 
wprowadzona  i zakodowana  w fali  nośnej,  do  miejsca, 
gdzie  została  ona  przekazana  odbiorcy.) 

Idea  zastosowania  promieniowania  optycznego  do 
przenoszenia  informacji  nie  jest  nowa,  sięga  zamierz- 
chłych czasów  (najprostszym  urządzeniem  wykorzys- 
tującym światło  do  przenoszenia  informacji  jest 
lustro,  odbijające  promieniowanie  słoneczne;  taki 
słoneczny  „zajączek”  to  tylko  jeden  kanał  informacji). 

Można  przypuszczać,  że  sprzężenie  elektroniki 
z optyką  spowoduje  przeobrażenia  telekomunikacji 
w niedalekiej  przyszłości  w większym  stopniu,  niż 
kiedyś  zastosowanie  techniki  mikrofalowej  (— ► Opty- 
ka fourierowska). 

Podstawowe  elementy  łącza  optycznego  przedsta- 
wiono na  rys.  1.  Poniżej  omówimy  poszczególne  jego 
elementy. 
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Porównanie  podstawowych  typów  laserów 


Typ  lasera 

Długość 
fali,  nm 

Rodzaj  pracy, 
długość  impulsu 

Energia 

J 

Moc 

W 

Gęstość 
strumienia 
w*  ognisku 
W/cm* 

> Zastosowanie 

Laser  rubinowy 

694,3 

impulsowa 
(30-3  101  ns) 

1-10- 

L03-!09 

I0*-1013 

technologiczne,  spawanie, 
topienie,  wiercenie,  dentys- 
tyka,  biologia 

Laser  neodymowy 

1 060 

ciągła  lub  impulsowa 
(15  ns) 

lO^-lO* 

10-103 

I07-10łi 

telekomunikacja  i laserowe 
układy  śledzące,  kontrolo- 
wane reakcje  jądrowe 

Laser  półprzewod- 
nikowy GaAs 

800-900 

ciągła  lub  impulsowa 
(10=  ns) 

10"5-10-3 

10“3-10 

telekomunikacja 

Laser  barwnikowy 

przestraja- 
ny  w za- 
kresie 
200-800 

ciągła  lub  impulsowa 
(2  — 2*  103  ns),  pompo- 
wany laserem  argono- 
wym lub  azotowym 

zależna 
od  lasera 
pompują- 
cego 

l (ciągła), 
zależna 
od  lasera 
pompują- 

spektroskopia,  rozdzielanie 
izotopów*,  biologia 

Laser  gazowy  He-Ne 

632,8 

ciągła 

— 

io8<3-io--1 

10*- 10* 

metrologia,  interferometria, 
holografia,  geodezja 

Laser  argonowy 
jonowy 

488-514,5 

ciągła  lub  impulsowa 
(103  ns) 

I-IO3  W 

lOMO8 

chirurgia,  spektroskopia 

Laser  azotowy 

337,1 

impulsowa  (10  ns) 

0,01 

10#  W 

10M 

spektroskopia,  reakcje 
fotochemiczne 

Laser  CO, 

10  600 

ciągła  lub  impulsowa 
(10s  — 5*  10*  ns) 

1-103 

I0-104 

10‘-10'5 

laserowe  układy  śledzące, 
chirurgia,  dentystyka,  ob- 
róbka materiałów,  cięcie 
i spawanie  metali,  kontro- 
lowane reakcje  jądrowe,  roz- 
dzielanie izotopów 

Porównanie  maksymalnej  liczby  kanałów  telefonicznych 
i telewizyjnych  transmitowanych  na  różnych  falach  nośnych 


Rodzaj 
fali  nośnej 

Zakres 

częstości 

Wyko- 

rzystane 

Maksymalna 

liczba 

kanałów 

pasmo 

telefo- 

nicznycł 

TV 

Fale  długie 

30  kHz- 
-300  kHz 

10% 

3 

— 

Fale  średnie 

300  kHz- 
-3  MHz 

10% 

25 

— 

Fale  krótkie 

3 MHz- 
-30  MHz 

10% 

200 

— 

UKF 

30  MHz- 
-300  MHz 

10% 

4000 

1 

UHF 

300  MHz- 
-3000  MHz 

10% 

10000 

10 

Mikrofale 

3000  MHz- 
-1012  Hz 

10% 

100000 

100 

Pasmo  optyczne 

5 *1013-10li  Hz 

QJ% 

10* 

10* 

gazowe  mają  dużą  spójność  emitowanego  światła, 
wysoką  stabilność  częstości  (względna  zmiana  czę- 
stości Avjv  jest  rzędu  10-8)  i możliwa  jest  modulacja 
światła  wewnątrz  lasera,  ale  wymagają  delikatnej 
obsługi,  są  mało  sprawne  w przetwarzaniu  energii 
elektrycznej  na  światło  i stosunkowo  szybko  się  psują 
(laser  He-Ne  ma  czas  życia  rzędu  10  000  h,  a laser 
argonowy  — 1000  h).  Moce  wyjściowe  laserów  argo- 
nowych są  rzędu  dziesiątków  watów,  a laserów  C02  — 
kilowatów  (przy  pracy  ciągłej).  Lasery  stałe  (m.in. 
neodymowe)  mogą  pracować  w sposób  ciągły  ze  sto- 
sunkowo dużą  mocą  wyjściową,  lecz  mają  niską  spój- 
ność emitowanego  światła  i nie  mogą  być  modulowane 
wewnętrznie.  Ich  czas  życia  zależy  od  trwałości  lampy 
pompującej  (żywotność  lamp  nie  przekracza  obecnie 
1000  godzin). 

Bardzo  dobre  własności,  zbliżone  do  idealnych, 
zwłaszcza  z uwagi  na  zastosowanie  w telekomunikacji 
dalekiego  zasięgu  i w kosmosie,  ma  laser  neodymowy 
z kryształem  YAG  pracujący  w układzie  zsynchronizo- 
wanych modów,  dający  ciąg  impulsów  pikosekundo- 
wych  w odstępach  rzędu  1 ns.  Lasery  argonowe  emi- 
tujące światło  zielone,  słabo  pochłaniane  przez  wodę 
morską,  mogą  być  zastosowane  w łączności  podwod- 
nej. Do  łączności  naziemnej,  jak  też  i kosmicznej,  la- 
ser gazowy  na  C02  konkuruje  z laserem  YAG,  gdyż 
emitowana  przez  niego  fala  długości  10,6  jim  jest 
słabo  pochłaniana  w powietrzu.  Natomiast  wydaje  się, 
że  ze  względu  na  małe  wymiary  i niskie  koszty  pro- 
dukcji — do  łączności  naziemnej  bliskiego  zasięgu 
najlepsze  będą  lasery  półprzewodnikowe  w układzie 
ze  światłowodami. 

Wektor  natężenia  pola  elektrycznego  promienio-  modulacja 
wania  wychodzącego  z lasera  można  przedstawić  w fali  ciągłej 
postaci : 

E = e£0  sin  (2nvt— fp). 


Rys.  1.  Schemat  blokowy  łącza  optycznego 

laser  jako  Idealne  źródło  światła  do  celów  telekomunikacyj- 
źródło  nych  powinno  mieć  dużą  moc  wejściową,  dużą  spraw- 
światła  ność  przetwarzania  energii,  długą  żywotność,  wysoką 
stabilność  częstości,  dużą  spójność  przestrzenną 
i czasową,  łatwość  modulacji  i wzbudzenia  oraz  małe 
wymiary.  Różne  typy  laserów  w różny  sposób  reali- 
zują te  cechy  idealnego  źródła.  Lasery  półprzewod- 
nikowe mają  małe  moce  i niską  spójność,  za  to  są 
wielkości  łebka  od  szpilki,  a przy  tym  łatwo  modulo- 
wać je  sygnałami  o częstościach  aż  do  1010  Hz  (np. 
przez  modulację  stałego  prądu  zasilania).  Lasery 


gdzie  £0  jest  amplitudą  fali,  v — częstością,  (p  — fazą, 

e — wektorem  polaryzacji,  t — czasem.  Zmieniając 
w takt  przekazywanego  sygnału  amplitudę  E0 , czę- 
stość lub  fazę,  otrzymuje  się  odpowiednio  zmodulo- 
waną falę  elektromagnetyczną.  Promieniowanie  la- 
serowe umożliwia  jeszcze  inny  sposób  modulacji  — modulacja 
modulację  polaryzacji.  Polega  ona  na  tym,  że  w takt  polaryzacji 
sygnału  modulującego  zmienia  się  kierunek  wektora 

e przy  nie  zmienionych  innych  parametrach.  Do  mo- 
dulacji wykorzystuje  się  zmianę  parametrów  ośrod- 
ka, przez  który  przechodzi  światło  (np.  zmianę  współ- 
czynnika pochłaniania  ośrodka,  grubości  środka  czy 


357 


współczynnika  załamania),  wywołaną  zmianą  ze- 
wnętrznego pola  elektrycznego  lub  magnetycznego. 
Najczęściej  wykorzystuje  się  zjawiska  elektrooptycz- 
ne  (rys.  2).  W niektórych  kryształach  (np.  w krysztale 
KH2P04,  zw.  KDP)  pod  wpływem  pola  elektrycznego 
pojawia  się  wymuszona  dwójłomność  (zjawisko  Ker- 
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Rys.  2.  Schemat  elektrooptycznego  modulatora  światła 


ra):  w krysztale  rozchodzą  się  dwie  fale  świetlne 
o różnych  prędkościach  i o polaryzacji  liniowej  wza- 
jemnie prostopadłej.  Różnica  faz  obu  fal  po  opuszcze- 
niu kryształu  zależy  od  przyłożonego  napięcia.  Pro- 
porcjonalność w pewnym  zakresie  różnicy  faz  do  na- 
tężenia pola  elektrycznego  pozwala  zrealizować  mo- 
dulację polaryzacji  lub  amplitudy  wiązki  światła.  Gdy 
różnica  faz  między  obiema  falami  (przy  ich  równym 
natężeniu)  r = rc/2,  fala  na  wyjściu  modulatora  jest 
kołow-o  spolaryzowana,  gdy  r = n,  występuje  pola- 
ryzacja liniowa.  Ustawienie  za  modulatorem  pola- 
roidu  (analizatora)  powoduje  zamianę  modulacji 
polaryzacyjnej  w amplitudową,  Polaroid  przepuszcza 
bowiem  światło  zgodnie  ze  wzorem  1 = /0  sin2(/72), 
jeśli  płaszczyzny  polaryzacji  światła  padającego  i Po- 
laroid u są  wzajemnie  prostopadłe  (/  = natężenie  fali 
opuszczającej  modulator,  /0  — natężenie  fali  pada- 
jącej). Właściwości  kryształów  elektrooptycznych 
pozwalają  na  modulację  światła  laserowego  sygnała- 
mi, których  szerokość  pasma  wynosi  nawet  kilka  ty- 
sięcy MHz. 

Omówiona  wyżej  metoda  polegająca  na  modulacji 
ciągłej  fali  laserowej  ma  kilka  wad.  Mianowicie,  do 
przekazania  informacji  z reguły  nie  jest  potrzebna 
praca  ciągła  lasera,  a urządzenie  impulsowe  jest  bar- 
dziej sprawne  energetycznie.  Sygnały  ciągłe  przekazy- 
wane na  duże  odległości  ulegają  znacznym  zniekształ- 
ceniom, zmieniającym  się  w czasie  i powodującym 
przekłamania  w przekazywaniu  informacji.  Dochodzi 
do  tego  jeszcze  fakt,  że  coraz  powszechniej  informacja 
jest  transmitowana  w postaci  binarnej  (dane  kompu- 
terowe, a naw'et  rozmowy  telefoniczne).  Dlatego  w 
modulacja  systemach  telekomunikacji  optycznej  stosuje  się  mo- 
impulsowo-  dulacje  impulsowo-kodowe.  W systemach  tych  można 
-kodowa  rozróżnić  dwa  etapy:  wytwarzanie  ciągu  impulsów 
(laser  pracujący  w'  specjalnych  warunkach)  i kodo- 
wanie (modulację).  Wytwarzanie  impulsów'  w stałych 
odstępach  czasu  najczęściej  realizuje  się  przez  syn- 
chronizację modów  w laserach  YAG  czy  helowo-neo- 
now-ych.  W laserach  półprzewodnikowych  ciąg  im- 
pulsów można  uzyskać  przez  periodyczną  zmianę 
dobroci  rezonatora,  rówmież  przez  synchronizację 
modów  lub  zmiany  natężenia  prądu  zasilania  (rys.  3). 
Gdy  przez  laser  przepływa  prąd  o natężeniu  trochę 
mniejszym  od  wartości  progowej,  laser  nie  promie- 
niuje spójnie.  Jeśli  w pew-nych  chwilach  spowodujemy 
wzrost  tego  prądu  do  wartości  większej  niż  progowa, 
laser  zacznie  świecić.  Periodyczna  zmiana  prądu  po- 
woduje więc  powitanie  impulsów  światła  spójnego. 
Częstość  powtarzania  impulsów  zależy  od  częstości 
prądu  modulującego.  Zakreskowane  pola  na  rysunku 
odpowiadają  impulsom  światła  wychodzącego  z la- 
sera. 

Drugi  etap  — kodowanie  informacji  — polega  na 
modyfikowaniu  ciągu  impulsów  z lasera  za  pomocą 
zw-ykłych  modulatorów  elektrooptycznych.  Modulacja 
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impuisowo-kodowa  jest  z natury  binarna,  gdyż  rola 
detektora  polega  wyłącznie  na  określeniu,  czy  dany 
impuls  dotarł,  czy  nie  dotarł  do  odbiornika.  Infor- 
macja o amplitudzie  nie  jest  istotna,  co  ma  ogromne 
znaczenie  przy  nie  najlepszych  warunkach  propagacji 
fali  świetlnej  na  Ziemi. 


Podobnie  jak  w modulacji  fali  ciągłej,  w tej  meto-  modidaoje 
dzie  modulacji  również  istnieje  kilka  sposobów  zmia-  PCM-IM, 
ny  parametrów  impulsów'  świetlnych.  Najczęściej  PCM-PM 
stosuje  się  trzy  z nich : modulację  natężenia,  modulację  j ppgu 
polaryzacji  i modulację  położenia  impulsu  (rys.  4a, 
b,  c).  Zasadę  modulacji  impulsowo-kodowej  z mo- 
dulacją natężenia  (tzw.  PCM-IM)  wyjaśnia  iys.  4a. 

Modulator  zatrzymuje  dany  impuls  lub  go  prze- 
puszcza i daje  w odbiorniku  informację  1,  co  ozna- 
cza, że  jest  impuls,  lub  0,  świadcząc,  że  go  nie  ma. 

Przy  modulacji  impulsowo-kodowej  z modulacją 
polaryzacji  (tzw.  PCM-PM)  modulator  przepuszcza 
impuls  bez  zmiany  polaryzacji,  albo  też  zmienia  jego 
polaryzację  o 180°.  Może  to  być  również  zmiana  na 
polaryzację  lewoskrętną  (1)  i praw-oskrętną  (0).  Mo- 
dulacja położenia  impulsu  (PPM)  przesuwa  impuls 
względem  położenia  początkowego.  Możliwe  jest 
rozwiązanie  w postaci  analogowej  (położenie  impulsu 
zmienia  się  w sposób  ciągły)  lub  rozwiązanie,  w któ- 
rym odstęp  między  impulsami  podzielony  jest  na 


Rys.  4.  Zasada  modulacji:  a)  impulsowo-kodowej  z modulacją 
natężenia  (PCM-IM);  b)  impulsowo-kodowej  z modulacją  pola- 
ryzacji (PCM-PM);  c)  położenia  impulsu  (PPM) 


szereg  dyskretnych  przedziałów  czasu.  Jeśli  rozwią- 
zanie jest  takie,  jak  przedstawiono  na  iys.  3,  możliwa 
jest  prosta  modulacja  PPM  przez  modulację  czę- 
stości sinusoidalnego  prądu  (co  odpowiada  przesu- 
nięciu impulsów  światła  na  osi  czasu  względem  sie- 
bie). 

Zasadę  przesyłania  informacji  w ciągu  impulsów 
przedstawia  rys.  5.  Dwie  niezależne  i nformacje  — 
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Rys.  5.  Zasada  zwielokrotniania  informacji  przesyłanej  w jednym 
łączu  optycznym  z wykorzystaniem  modulacji  impulsowo-kodo- 
wej 


przesyłanie 

sygnałów 


słowa  1101  oraz  1011  — przekazywane  są  razem  jako 
jedno  słowo  11011011.  Sygnał  czasowy  w odbiorniku 
pozwala  określić,  czy  dany  impuls  pochodzi  z pierw- 
szego słowa  (rejestracja  danego  impulsu  odpowiada 
ujemnej  części  sinusoidy  na  rysunku)  czy  z drugiego 
(dodatniej  części  sinusoidy). 

Wydaje  się,  że  największym  problemem  w obecnej 
chwili  jest  przenoszenie  informacji  z nadajnika  do 
odbiornika.  Transmisja  w wolnej  przestrzeni  na  dal- 
sze odległości  jest  praktycznie  możliwa  tylko  w prze- 
strzeni kosmicznej  (systemy  łączności  satelitarnej  lub 
międzyplanetarnej).  Atmosfera  ziemska  powoduje 
zniekształcenia  czoła  fali  i duże  straty  mocy;  wyno- 
szą one  — w zależności  od  warunków  atmosferycz- 
nych — ok.  3-8  dB/km  (2-6,31  razy)  przy  deszczu, 
3-10  dB/km  (2-10  razy)  przy  mgle  i 3-20  dB/km 
(2-100  razy)  przy  padającym  śniegu.  Z tego  względu 
nie  stosuje  się  swobodnej  propagacji  fali  na  odległość 
ponad  20  km;  moce  laserów  konieczne  do  zapewnienia 
trwałej  łączności  musiałyby  być  olbrzymie.  Przy 
transmisji  na  większe  odległości  stosuje  się  światło- 


wody, które  zachowują  stałość  parametrów  przez  długi 
czas. 

Światłowody  mogą  być  dwóch  rodzajów.  Jeden  światłowody 
z nich  zawiera  prowadnicę  oraz  ustawione  w niej 
soczewki.  Soczewki  szklane  lub  gazowe  ustawia  się 
tak,  że  odległości  między  nimi  są  równe  podwojonej 
ogniskowej,  dzięki  czemu  wiązka  światła  jest  pro- 
wadzona wzdłuż  osi  światłowodu.  Gdy  soczewki  są 
oddalone  od  siebie  o kilkadziesiąt  metrów,  straty 
wynoszą  ok.  1 dB/km  (1,26  razy).  Światłowody  tego 
typu  są  jednak  drogie  (ze  względu  na  precyzję  usta- 
wienia soczewek)  i mimo  bardzo  dobrych  własności 
ich  zastosowanie  ograniczone  jest  do  małych  odle- 
głości i do  systemów  teletransmisji  o dużych  pojem- 
nościach informacyjnych.  Znacznie  prostsze  i tańsze 
w produkcji  są  światłowody  zbudowane  z włókien 
szklanych  grubości  kilku  mikrometrów  i o małym 
współczynniku  załamania.  Światło  się  odbija  wielo- 
krotnie od  ścianek  włókien  (całkowite  wewnętrzne 
odbicie)  i rozchodzi  ze  stosunkowo  małymi  stratami. 

Splecione  z wielu  takich  cienkich  włókien  giętkie 
przewody  grubości  cienkich  kabli  elektrycznych  mają 
straty  rzędu  kilkunastu  dB/km  (kilkadziesiąt  razy). 

Dla  porównania  podamy,  że  w litym  szkle  straty  mocy 
wynoszą  100  dB/km  (1010  razy). 

Jak  widać,  straty  w światłowodach  są  znaczne  wzmacnia  me 
i porównywalne  ze  stratami  w wolnej  przestrzeni,  sygnału 
Konieczne  jest  więc  wzmacnianie  sygnału  na  drodze 
do  odbiornika.  Najczęstszą  metodą  jest  wstawienie 
na  drodze  zmodulowanej  wiązki  światła  materiału 
laserującego  o odwróconych  obsadzeniach  poziomów 
energetycznych.  Foton,  który  się  dostanie  w obszar 
wypełniony  atomami  wzbudzonymi,  spowoduje  emi- 
sję wymuszoną  określonej  liczby  fotonów  dokładnie 
takich  samych  jak  padający.  W rezultacie  sygnał 
opuszczający  materiał  laserujący  zostanie  wzmocnio- 
ny. 

Po  dotarciu  do  odbiornika  zmodulowany  sygnał 
świetlny  przechodzi  przez  układ  soczewek  zbierają- 
cych oraz  przez  filtr  pasmowy  (dla  zmniejszenia  szu- 
mów), dostrojony  do  częstości  fali  nośnej,  i skupia  się 
na  detektorze.  Rolą  detektora  jest  oddzielenie  sygna- 
łu informacyjnego  od  fali  nośnej.  W paśmie  optycz- 
nym stosowane  są  dwa  rodzaje  detekcji. 

Detekcję  niekoherentną  (bezpośrednią)  stosuje  się  detekcja 
wówczas,  gdy  stosunek  mocy  sygnału  do  mocy  szu-  niekoherent- 
mów  jest  większy  od  jedności.  Polega  ona  na  prze-  na 
tworzeniu  obwiedni  natężenia  wiązki  świetlnej  na 
prąd  elektryczny  w fotopowielaczu  (prąd  fotoelek- 
tronów  jest  proporcjonalny  do  natężenia  padającego 
światła)  lub  w fotodiodzie  półprzewodnikowej  (prąd 
w kierunku  zaporowym  jest  modulowany  padającym 
światłem).  Skończony  czas  przejścia  elektronów 
między  elektrodami  umożliwia  detekcję  sygnałów 
zmiennych  tylko  do  częstości  108  Hz. 

Detekcja  koherentna  (heterodynowa  lub  homody-  detekcja 
nowa)  polega  na  mieszaniu  wiązki  zmodulowanej  koherentna 
z inną,  niezmodulowaną  wiązką  spójną;  jest  stoso- 
wana przy  sygnałach  bardzo  słabych,  na  poziomie 
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niższym  od  poziomów  szumów.  W wyniku  złożenia 
obu  wiązek  — zmodulowanej,  niosącej  sygnał,  i nie 
zmodulowanej  — odtwarzamy  samą  obwiednię  wiąz- 
ki sygnałowej.  Dalszy  proces  rozdzielenia  wielu  sy- 
gnałów niesionych  razem  odbywa  się  metodami  elek- 
tronicznymi. 

Przy  modulacji  impulsowo-kodowej  detektor  daje 
tylko  informację  o dotarciu  danego  impulsu  do  od- 
biornika, a więc  mniejsza  jest  tu  możliwość  przekła- 
mania informacji  w wyniku  zakłóceń.  Inna  jest  w ta- 
kim wypadku  technika  rozdzielania  informacji  z wielu 
kanałów.  Rysunek  6 przedstawia  schemat  układu 
rozdzielającego  poszczególne  kanały  przez  sortowa- 
nie impulsów  przychodzących  w danych  odstępach 
czasu  od  odbiornika.  Deflektorem  (układem  odchy- 
lającym wiązkę  światła)  jest  kryształ,  w którym  pod 
wpływem  fali  akustycznej  lub  napięcia  elektrycznego 
wiązka  światła  zmienia  kierunek  rozchodzenia  się. 


Zastosowania  technologiczne 

Z punktu  wadzenia  zastosowań  technologicznych  bar- 
dzo w-ażną  własnością  wiązki  laserowej  jest  możli- 
wość uzyskiw-ania  olbrzymiej  ilości  energii  w sposób 
kontrolowany;  ponadto  wiązka  laserowa  może  być 
skupiona  do  rozmiarów  poprzecznych  porównywal- 
nych z długością  fali  świetlnej,  tj.  rzędu  1 firn.  Obie 
te  własności  spraw-iają,  że  działanie  wiązki  laserowej 
ogranicza  się  do  małego  obszaru,  miejsca  dalej  poło- 
żone nie  doznają  wpływu  promieniowania. 

Spawanie  polega  na  stopieniu  brzegów  oddziel- 
nych części  materiału  (lub  różnych  materiałów)  i po- 
łączeniu ich  w jedną  całość,  a następnie  — ostudze- 
niu. Palnik  acetylenowy  dostarcza  do  spawanego 
miejsca  1000  W/cm2,  laser  — co  najmniej  kilkaset  ra- 
zy więcej.  Pewną  trudność  przy  spawaniu  laserem 
sprawia  fakt,  że  stopiony  metal  ma  mniejszy  współ- 
czynnik odbicia  światła,  tak  że  w chwili,  gdy  się  ma- 
teriał topi,  następuje  w-zrost  energii  kumulowanej 
w spoinie;  aby  przy  topieniu  uniknąć  odparowania 
materiału,  trzeba  w tym  momencie  zmniejszyć  moc 
lasera,  co  jest  zabiegiem  dość  trudnym. 

Do  spaw-ania  najlepiej  się  nadają  impulsowe  lasery 
neodymowe  i rubinowe.  Szczególnie  wygodne  i celo- 
we jest  użycie  lasera  do  zgrzewania  elementów  przy 
produkcji  układów  scalonych  i innych  urządzeń  o ma- 
łych wymiarach  (il.  136,  tabl.  34).  Odpowiedni  dobór 
czasu  trwania  impulsów  i skupienie  wiązki  na  repe- 
rowanym fragmencie  umożliwiło  dostarczenie  dużej 
energii  na  małym  obszarze  bez  zbytniego  nagrzania 
szkła.  Jest  to  praktycznie  jedyny  sposób  usuwania 
uszkodzeń  w drogich  urządzeniach. 

Lasery  neodymowe  i rubinowa  dostarczają  energii 
tak  dużej  i dobrze  skupionej,  że  możliwe  jest  wykony- 
wanie otworów  w materiałach  bardzo  twardych  (jak 
diament,  różne  ceramiki,  tantal,  wolfram,  molibden), 
których  nie  można  obrabiać  metodami  tradycyjnymi. 
Do  wiercenia  używa  się  takich  samych  układów  la- 
serowych jak  do  spawania,  jedyna  różnica  polega  na 
zwiększeniu  mocy  lasera.  Wiercenie  za  pomocą  lasera 
jest  szczególnie  efektywne  przy  wykonywaniu  otwo- 
rów' bardzo  małych,  trudnych  do  wykonania  inną 
techniką.  Można  w ten  sposób  uzyskiwać  otwory 

0 średnicy  rzędu  1 pm,  przy  czym  stosunek  głębo- 
kości otworu  do  jego  średnicy  w pewnych  materia- 
łach wynosi  20:1. 

Duże  szybkości  cięcia,  niewytwarzanie  kurzu  czy 
opiłków  metalu,  a jednocześnie  względna  cisza  przy 
cięciu  — to  podstawowe  zalety  cięcia  laserem.  Naj- 
lepiej do  tego  celu  nadaje  się  laser  C02  (il.  15,  17, 
tabl.  4).  Schemat  noża  laserowego  przedstawia  rys.  7. 
Przez  odpowiedni  dobór  mocy  lasera  (kilkaset  watów) 

1 prędkości  przesuwu  wiązki  względem  materiału 
uzyskuje  się  tylko  lokalne  odparow-anie  materiału. 
Cięcie  może  się  odbyw-ać  w atmosferze  obojętnego 
azotu  lub  tlenu.  Tlen  w wyniku  egzotermicznej  reakcji 
z materiałem  przyspiesza  obróbkę.  W trakcie  spawa- 
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nia  gaz  wydmuchuje  stopiony  materiał  i zostawia 
ostrą  krawędź  o tak  doskonałych  właściwościach, 
że  nie  ma  potrzeby  wygładzania  jej. 


Noże  laserowe  stosowane  są  głównie  w przemyśle 
lotniczym  i kosmonautycznym,  ale  używa  się  ich 
również  w innych  przemysłach  (cięcie  materiałów  na 
ubrania  lub  tektury  na  pudełka). 

Lasery  impulsowe  sprzężone  z układem  sterującym 
i pomiarowym  stosuje  się  do  kontroli  i wzorcowania 
oporników;  skupiona  wiązka  laserów  odparowuje  lo- 
kalne obszary  materiału  oporowego,  zmieniając  jego 
opór.  Urządzenie  takie  może  wykonać  w zautoma- 
tyzowany sposób  nawet  10  000  kalibracji  na  godzinę 
przy  dokładności  dopasowania  oporu  do  nominalnej 
wartości  nawet  do  0,01%. 

W przemyśle  półprzewodnikowym  lasery  stosuje 
się  do  trasowania.  W jednej  płytce  materiału  półprze- 
wodnikowego wytwarza  się  naraz  bardzo  wiele  ukła- 
dów scalonych,  które  po  wykonaniu  należy  rozdzielić 
i zamknąć  w obudowach.  Rozdzielanie  metodą  tra- 
dycyjną przebiega  w ten  sposób,  że  się  nacina  linie 
diamentem  i łamie  płytkę  na  małe  fragmenty.  Laser 
od  razu  tnie  płytkę  na  części.  Trasowanie  linii  lase- 
rem jest  bardzo  szybkie,  typowa  prędkość  przesuwu 
wynosi  15  cm/s,  a przy  tym  krawędzie  poszczegól- 
nych układów  scalonych  są  ostrzejsze. 


Żyroskop  laserowy 

Żyroskop  jest  to  szybko  obracające  się  ciało  sztywne, 
którego  oś  obrotu  może  zmieniać  sw'oją  orientację 
względem  obudowy  dzięki  odpowiedniemu  zawie- 
szeniu (np.  Cardana).  Przyłożenie  do  osi  żyroskopu 
momentu  sił  powoduje  jego  precesję,  której  prędkość 
kątowa  jest  tym  mniejsza,  im  większy  jest  moment 
pędu  żyroskopu  J = /<*>,  gdzie  / — moment  bezwład- 
ności wirującej  z prędkością  kątowrą  co  masy.  Oś 
szybko  obracającego  się  żyroskopu  niemal  nie  zmienia 
swej  orientacji  pod  wpływem  krótkotrwałych  sił  ze- 
wnętrznych i dzięki  temu  może  służyć  za  czujnik 
zmiany  kierunku  w przestrzeni  poruszającego  się 
urządzenia,  zmiany  prędkości  kątowych  lub  postępo- 
wych. Żyroskopy  używ-ane  są  do  automatycznego 
sterowania  ruchem  rakiet  i samolotów',  do  stabilizacji 
statków  na  morzu  oraz  w nawigacji  samolotów,  stat- 
ków i pojazdów  kosmicznych  (wskaźniki  kursu, 
sztuczny  horyzont,  określanie  stron  świata). 

Żyroskop  laserowy  różni  się  od  tradycyjnych  tym, 
że  nie  ma  wirującej  masy  ani  żadnej  części  ruchomej. 
Zasadę  działania  żyroskopu  laserowego  najlepiej  się 
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zrozumie  po  zapoznaniu  się  z działaniem  interfero- 
metru pierścieniowego  Sagnaca  (1913  r.). 

W interferometrze  pierścieniowym  biernym  światło 
wchodzi  w punkcie  A i przechodzi  przez  płytkę  dzie- 
lącą, by  następnie  w postaci  dwóch  wiązek  obiec  ob- 
wód zamknięty  w przeciwnych  kierunkach  (dla  upro- 
szczenia obwód  jest  przedstawiony  w postaci  koła, 
rys.  8).  Wiązki  łączą  się  ze  sobą  na  płytce  dzielącej. 
Kiedy  interferometr  jest  nieruchomy,  czas  obiegu 
obwodu  przez  oba  promienie  jest  taki  sam  i wynosi 
/ = 2nR!c , gdzie  c jest  prędkością  światła.  Jeżeli  in- 
terferometr obraca  się  wokół  osi  prostopadłej  do  jego 
powierzchni  ze  stałą  prędkością  kątową  czas  obie- 
gu obwodu  koła  przez  oba  promienie  ulegnie  zmianie, 

i b 

1 


Rys.  8.  Interferometr  pierścieniowy  Sagnaca 


gdyż  po  pewnym  czasie  płytka  dzieląca  znajdzie  się 
w punkcie  B i wobec  tego  promień  biegnący  zgodnie 
z kierunkiem  obrotu  przemierzy  dłuższą  drogę  niż  ten, 
który  biegnie  w przeciwną  stronę.  Prędkość  światła 
jest  oczywiście  stała.  Wobec  tego 


2 kR±X±  = ct±y 

gdzie  droga  dodatkowa  przebyta  przez  każdy  z pro- 
mieni wynosi  X±  = RQt±.  Czas  przejścia  obu  fal 
przez  interferometr  wynosi  więc 

27t* 

f±  ~ c^RQ 


Znak  ,,-r"  dotyczy  fali  biegnącej  w kierunku  obrotu, 
a znak  „ — ” — fali  biegnącej  w kierunku  przeciw- 
nym. Różnica  czasów  w pierwszym  przybliżeniu  wy- 
nosi: 


At 


4nQR2 


a różnica  dróg  optycznych: 


AL  = c-At 


4kRH2 

c 


4AQ 

c 


gdzie  A = kR 2 jest  powierzchnią  zakreśloną  przez 
promienie.  Wzór  na  AL  można  stosować  w wypadku 
dowolnej  powierzchni  oraz  ośrodka  o współczynniku 
załamania  różnym  od  jedności.  Za  pomocą  interfero- 
metru pierścieniowego  A.  H.  Michelson  i H.  G.  Gale 
zmierzyli  (1925)  szybkość  obrotu  Ziemi.  Interfero- 
metr miał  kształt  prostokąta  o wymiarach  610  x 335  m, 
a mierzona  różnica  dróg  optycznych  wynosiła 
130  nm,  czyli  bardzo  mało  w porównaniu  z wymia- 
rami interferometru  i długością  fali. 

Trudność  użycia  interferometru  pierścieniowego 
jako  praktycznego  urządzenia  wynika  z jego  bardzo 
małej  czułości.  Użycie  lasera  jako  źródła  zewnętrz- 
nego nic  nie  pomaga.  Sytuacja  ulega  natomiast  ra- 
dykalnej zmianie,  gdy  się  użyje  aktywnego  interfero- 


metru pierścieniowego.  Warunek  wzbudzenia  drgań 
odpowiadających  najniższemu  modowi  poprzecz- 
nemu zarówno  w laserze  liniowym,  jak  i pierścienio- 
wym (rys.  9)  jest  taki  sam:  „na  długości  rezonatora  L 
powinna  się  zmieścić  całkowita  liczba  połówek  fali". 
W laserze  liniowym  poszczególne  rodzaje  drgań  (mo- 
dy) odpowiadają  dwóm  przeciwnie  biegnącym  falom, 
które  w sumie  dają  falę  stojącą.  Amplitudy  i częstości 
fal  biegnących  muszą  być  jednakowe.  Natomiast 
w laserze  pierścieniowym  każdy  mod  poprzeczny  od- 
powiada falom  biegnącym  w przeciwnych  kierunkach, 
są  one  niezależne  w tym  sensie,  iż  mogą  mieć  różne 
częstości  i amplitudy. 

Warunek  wzbudzenia  drgań  można  zapisać  na- 
stępująco: 


gdzie  nr  oznacza  liczbę  modów  (typowe  wartości  m 
wynoszą  105— 1 06).  Małe  zmiany  drogi  optycznej  L 
powodują  różnicę  częstości  między  falami  Av , przy 
czym 

v+-  v_  Av  AL 

v.l.  v 7. 


Gdy  różnica  długości  AL  wywołana  jest  obrotem, 
wówczas  otrzymujemy: 


Ar 


4AQ 

LI 


W wypadku  lasera  w kształcie  trójkąta  o boku 
13,2  cm,  wysyłającego  falę  długości  A = 0,633  pm 
i przy  prędkości  obrotu  10°  na  godzinę  różnica  czę- 
stości wynosi  5,9  Hz.  Częstość  taką  przy  zastosowa- 
niu techniki  heterodynowej  można  dość  łatwo  zmie- 
rzyć. 

Rysunek  10  przedstawia  zasadę  wyprowadzania 
informacji  z lasera  pierścieniowego.  Niewielki  pro- 
cent (przeważnie  mniej  niż  0,1  %)  energii  obu  fal  jest 


7 , , 

ośrodek 
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Rys.  9.  Konfiguracja  laserów:  a)  liniowego,  b)  pierścieniowego 


transmitowany  przez  jedno  ze  zwierciadeł  dielek- 
trycznych na  zewnątrz.  Dzięki  pryzmatowi  dopro- 
wadza się  obie  wiązki  do  interferencji.  Prążki  inter- 
ferencyjne są  miarą  chwilowej  różnicy  faz  między 
biegnącymi  w przeciwnych  kierunkach  falami.  Gdy 
natężenia  obu  fal  są  jednakowe,  a wiązki  wychodzące 
z pryzmatu  prawie  równoległe  (o  rozbieżności  kąto- 
wej c),  rozkład  prążków  dany  jest  wzorem : 

I = 70[1  -r ^ ")s(2 K€  -XjX+Aa>  7-i-<p), 

gdzie  Aoy  = 2kAv  jest  częstością  różnicową,  A — 
długością  fali,  <p  — stałą  fazą.  Gdy  laser  się  nie  obra- 
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Rys.  10. 


ca,  wtedy  Aco  = O i rozkład  prążków  jest  nieruchomy. 
Podczas  obrotowego  ruchu  lasera  prążki  przesuwają 
się  z prędkością  zależną  od  Aco.  Odstęp  między  prąż- 
kami wynosi  / fe , gdzie  e — 2n0,  n — współczynnik 
załamania  światła  w-  pryzmacie,  a kąt  0 — to  odchy- 
lenie kąta  łamiącego  pryzmatu  od  90°.  Kiedy  np. 
0 = 15"  i X = 0,633  jim,  odstęp  między  prążkami 
wynosi  ok.  3 mm.  Jeśli  więc  w miejscu  pojawiania  się 
prążków  ustawi  się  detektor  o wymiarach  znacznie 
mniejszych  od  szerokości  prążka  (np.  fotodiodę  pół- 
przewodnikową), otrzyma  się  bezpośrednio  infor- 
mację o częstości  różnicowej. 

Kierunek  ruchu  prążków  określa  jednocześnie  kie- 
runek obrotu  lasera,  tak  w’ięc  ustawiając  drugi  detek- 
tor w'  odległości  1/4  prążka  od  pierwszego  i łącząc 
oba  detektory  z układem  logicznym,  otrzymamy  tak 
dodatnie,  jak  i ujemne  zliczenia  impulsów.  W ten 
sposób  żyroskop  laserowy  daje  scałkowaną  informa- 
cję cyfrową  w postaci  : 


gdzie  liczba  zliczeń  N = j Ar  dt , a kąt  odchylenia 

o 

t 

od  położenia  początkowego  y = f Q dt.  W poda- 

o 

nym  przykładzie  liczbowym  odnoszącym  się  do  lasera 
He-Ne  jedno  zliczenie  odpowiada  obrotowi  o 1,7 
sekundy  kątowej,  tak  więc  pełny  obrót  o 360°  daje 
0,76  - I O6  zliczeń. 

żyroskop  Żyroskop  laserowy  obejmuje  trzy  inteferometry 
Saserowy  pierścieniowe,  ustawione  w 3 płaszczyznach  prosto- 
padłych do  siebie  (il.  137,  tabl.  35).  Urządzenia  takie 
w chwili  obecnej  rywalizują  jeszcze  z rozwiązaniami 
tradycyjnymi.  Podstawowe  niedogodności  żyroskopu 
laserowego  to:  dość  duża  wielkość  (10 x 5 cm)  w po- 
równaniu z wymiarami  żyroskopu  zwykłego  (8x 
X 4 cm),  zmiany  parametrów  w czasie  (dryfy — nie 
pozwalające  na  razie  na  zastosowanie  żyroskopów 
laserowych  przy  precyzyjnych  pomiarach  kosmicz- 
nych), stosunkowo  krótki  czas  życia  rzędu  5000  h 
pracy. 

Główne  zalety  to:  niski  koszt  produkcji,  duża  szyb- 
kość reakcji,  stabilność  i wytrzymałość  na  duże  przy- 
spieszenia i bardzo  szybkie  obroty,  niezawodność 
(brak  części  ruchomych)  Ze  względu  na  te  zalety 
omów-iona  technika  pomiaru  obrotów  będzie  naj- 
prawdopodobniej stosowana  w nawigacji  i w urzą- 
dzeniach kontrolnych. 


Zastosowanie  w metrologii  i geodezji 

Najprostszym  zastosowaniem  lasera  w'  geodezji  jest 
użycie  go  jako  doskonałej  linijki.  Mała  rozbieżność 
wytyczanie  wiązki  umożliwia  wytyczanie  kierunku  w'  przestrzeni 
kierunków  na  bardzo  dużej  odległości.  Wiązka  lasera  może  np. 

służyć  za  oś  toru  wodnego  w porcie,  ułatwiającą  pro- 
wadzenie statków  o dużej  wyporności  w wąskich  ka- 
nałach; wiązki  używ-anych  do  tego  celu  laserów 
He-Ne  mają  średnicę  kilku  centymetrów'  po  prze- 
byciu jednego  kilometra.  Na  lądzie  promień  lasera 
prowadzi  koparkę  lub  maszynę  górniczą  w kopalni. 


zwierciadła 

półprzepuszczalne 
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Zainstalowany  w postaci  układu  fotodiod  czujnik, 
na  który  pada  promieniowanie  laserowe  pozwala  zdal- 
nie sterować  maszyną  lub  rejestrować  odchylenia  od 
linii  prostej  szybko  i z dużą  dokładnością. 

Przy  pomiarze  odległości  wykorzystuje  się  trady- 
cyjne interferometry  w-ielowiązkowe  z laserem  jako 
źródłem  światła.  Najprostsze  są  interferometry  Mi- 
chel sona  (rys.  11).  Po  opuszczaniu  lasera  wiązka 
światła  pada  na  zwierciadło  półprzepuszczalne  Mly 
gdzie  ulega  podziałowi.  Jedna  z wiązek,  po  odbiciu 
od  A/i,  dochodzi  bezpośrednio  do  punktu  P na  ekra- 
nie, druga  odbywa  dłuższą  drogę  do  zwierciadła  Mz 
i po  odbiciu  dociera  też  do  punktu  P.  Zwierciadło 
M2  jest  przymocowane  do  ruchomego  przedmiotu 
albo  jest  po  prostu  jego  powierzchnią.  W płaszczy- 
źnie ekranu  obserwuje  się  prążki  interferencyjne 
światła  o natężeniu 


Jeśli  w płaszczyźnie  ekranu  ustawimy  mały  detektor  — 
fotodiodę,  to  prąd  płynący  przez  fotodiodę  będzie  się 
zmieniał  wraz  ze  zmianą  odległości  b zgodnie  z po- 
wyższym wzorem.  Maksimum  natężenia  przypadnie 
na  punkty  określone  zależnością 

2\b-a\  = NX9 

gdzie  N jest  liczbą  naturalną.  Ze  wzoru  tego  można 
wyznaczyć  wartość  b,  znając  rząd  interferencji  N.  Me- 
toda powyższa  jest  szczególnie  wygodna  do  pomiaru 
różnicy  odległości,  np.  jest  wykorzystywana  wr  techno- 
logii elektronicznej  do  pomiaru  grubości  cienkich 
warstw,  równej  różnicy  dróg  optycznych  światła  odbi- 
tego od  podłoża  i od  powierzchni  warstwy.  Podstawo- 
wa dokładność  pomiaru  odległości  w interferometrze 
dwuwiązkowym  wynosi  //2,  a w rozbudowanych  in- 
terferometrach, tzw.  kalibratorach  laserowych,,  moż- 
na — przy  użyciu  lasera  helowo-neonowego  — uzy- 
skać pomiar  z dokładnością  ź/300,  czyli  ok.  2 nm. 
Stosowanie  tej  metody  ogranicza  trudność  związana 
ze  zliczaniem  dużej  liczby  N prążków’  (zależnej  od 
b — a),  które  się  przesuwają  w trakcie  pomiaru  na  ekra- 
nie, np.  pomiarowi  grubości  1 cm  odpowiada  zlicze- 
nie 30  000  prążków.  Stąd  też  kalibratory  laserowe  wy- 
posażone są  w małe  komputery  liczące  i analizujące 
ruch  prążków. 

Interferometryczne  kalibratory  laserowa  znajdują 
zastosowanie  np.  w kontroli  jakości  dużych  elemen- 
tów optycznych,  w pomiarach  weryfikacyjnych  wzor- 
ców długości  i grubości,  pomiarach  w'  trakcie  produk- 
cji elementów  mikroelektronicznych,  w bardzo  do- 
kładnym ustawieniu  obrabiarek  (np.  stół  obrabiarki 
można  ustawić  lub  przesunąć  o kilka  metrów  z do- 
kładnością do  1 jim). 

Precyzyjne  pomiary  dużych  odległości  (rzędu  1 km 
i większych)  polegają  na  pomiarze  czasu  przejścia 
impulsu  laserowego  do  elementu  odbijającego  i z po- 
wrotem do  detektora  (il.  138,  tabl.  35).  Czas  ten  po- 
mnożony przez  prędkość  światła  w powietrzu  daje 
podwojoną  odległość  od  obiektu.  Można  także  mierzyć 
różnicę  faz  światła  wychodzącego  i powracającego  do 
detektora. 

Omówimy  tylko  jedną  z metod,  która  stanowi  roz- 
winięcie metody  Fizeau,  użytej  niegdyś  do  pomiaru 
prędkości  światła.  Światło,  które  przeszło  przez  mo- 
dulator (rys.  12)  i zostało  odbite  od  badanego  obiek- 
tu, dotrze  do  detektora,  jeżeli  akurat  modulator  elek- 
trooptyczny  będzie  otwarty  (w-  doświadczeniu  Fizeau 
była  to  przesłona  mechaniczna).  Przez  zmianę  często- 
ści napięcia  modulującego  w modulatorze  można  tak 
dobrać  czas  r między  kolejnymi  zasłonięciami  modu- 
latora, by  światło  wróciło  do  odbiornika,  zatem 

2 Llv  — Arr, 

gdzie  v — prędkość  światła  wr  powietrzu,  liczba  N 
mówi,  ile  razy  modulator  otw-orzył  się  do  momentu  po- 
wrotu impulsu  świetlnego  do  przyrządu.  Mierząc 
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dużych 
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Nr  — całkowity  czas  między  pierwszym  a drugim 
przejściem  impulsu  świetlnego  przez  modulator  (po- 
miar elektroniczny)  — łatwo  jest  obliczyć  odległość 


zwierciadło 

półprzepuszczalne 


fotodetektor 


modulator 


Rys.  12.  Metoda  Fizeau  pomiaru  czasu  przejścia  sygnału 


L dalmierza  od  przedmiotu.  Dokładność  pomiaru  od- 
ległości tą  metodą  na  odcinkach  rzędu  1 km  wynosi 
ALJL  = 10  7— 10~8,  czyli  bezwzględny  błąd  pomiaru 
jest  rzędu  1 pm. 

Jeśli  jedno  ze  zwierciadeł  interferometru  Michel- 
pomier  sona  (rys.  11)  porusza  się  wzdłuż  osi  optycznej  z pręd- 
prędkości  kością  i\  to  natężenie  światła  w płaszczyźnie  ekranu 
zmienia  się  z częstością  v — 2vfX.  Gdy  długość  fali 
ź = 630  nm,  częstość  1000  prążków/s  odpowiada 
prędkości  zwierciadła  0,3  mm/s.  Ruch  prążków  na 
ekranie  oczywiście  oznacza,  że  światło  odbite  od 
zwierciadła  zmienia  wskutek  efektu  Dopplera  czę- 
stość o wartość  2 vfL  Poruszające  się  zwierciadło  moż- 
na zastąpić  przy  odpowiedniej  mocy  lasera  chropowa- 
tą powierzchnią,  a nawet  poruszającym  się  płynem. 
W taki  to  sposób  mierzy  się  od  niedawna  prędkość 
wiatru  w czasie  huraganów. 


Laserowe  układy  śledzące 

Celem  działania  układów  śledzących  jest  określenie 
odległości,  prędkości  i kątów,  tj.  podanie  zupełnej  in- 
formacji o obiektach  ruchomych.  Pojęcie  „układ  śle- 
dzący” jest  jednak  wieloznaczne,  gdyż  wymagania  do- 
tyczące skali  odległości  i czasu  mogą  się  różnić  w zasa- 
dniczy sposób.  Może  być  np.  potrzebna  bieżąca  infor- 
macja o locie  rakiety  czy  samolotu,  a także  wieloletnie 
pomiary  odchyleń  położenia  Księżyca  od  orbity  wokół 
Ziemi.  Przy  śledzeniu  startującej  rakiety  mierzona 
odległośćjest  rzędu  104  m,  a prędkość  kątowa — 105  se- 
kund kątowych  na  sekundę.  Natomiast  pomiary  orbi- 
ty Księżyca  z Ziemi  wymagają  określenia  odległości 
3,8-1 08  m i prędkości  kątowej  14,5  sekundy  kątowej 
na  sekundę.  Również  żądana  dokładność  jest  różna: 
w systemach  obrony  powietrznej  wystarczy  informa- 
cja, czy  dany  obiekt  jest  w pewnej  objętości  przestrzeni 
powietrznej,  przy  kontroli  zaś  lotu  niektórych  sateli- 
tów czy  statków  kosmicznych  odległość  10*  m musi 
być  określona  z dokładnością  do  1 cm.  W wielu  sytua- 
cjach wystarczy  dany  obiekt  uznać  za  punkt  w prze- 
strzeni, gdy  w innych  wymagana  jest  znajomość  kształ- 
tu lecącego  ciała.  Z racji  tak  różnych  wymagań  istnieje 
wiele  odmian  układów  śledzących,  a wszystkie  stano- 
wią bardzo  rozbudowane  urządzenia,  wyposażone 
w wyspecjalizowane  komputery. 

Ogólna  zasada  pracy  układów  laserowych  jest  taka 
układy  sama  jak  układów  radarowych  mikrofalowych:  po- 
laserowe  a miaru  odległości  dokonuje  się  przeważnie  przez  po- 
radarow®  miar  czasu  powrotu  odbitego  od  obiektu  impulsu 
światła;  informacje  o prędkości  uzyskuje  się  przez 
pomiar  zmian  częstości  fali  świetlnej  (efekt  Dopplera). 
Z reguły  układy  te  pracują  w podczerwieni  ze  względu 
na  mniejsze  zakłócenia  atmosferyczne  i niewidzialność 
wiązki  laserowej.  Zaletą  użycia  laserów  jest  zmniej- 
szenie wymiarów  urządzeń,  obniżenie  kosztów,  więk- 
sza dokładność  pomiarów  oraz  utrudnienie  w zakłó- 
caniu pracy  urządzenia  (ważne  przy  zastosowaniu  mi- 
litarnym). Korekta  wyników  pomiarów,  której  ko- 
nieczność narzuca  wpływ  warunków  atmosferycz- 


nych na  prędkość  światła  w powietrzu,  jest  łatwiejsza 
niż  w paśmie  mikrofalowym.  Wadę  użycia  laserów 
stanowią  trudności  w pracy  podczas  padającego  śnie- 
gu lub  deszczu  czy  mgły,  gdyż  wiązka  laserowa  jest 
silnie -tłumiona  w takich  warunkach  atmosferycznych. 
Trudność  sprawia  szybkie  nakierowanie  wąskiej 
wiązki  laserowej  na  cel,  co  wymaga  stosowania  skom- 
plikowanych układów  mechanicznych  „przemiatają- 
cych”  przestrzeń  powietrzną. 

Z tych  to  powodów  zastosowania  laserowych  ukła- 
dów śledzących  dotyczą  dziś  głównie  przestrzeni  ko- 
smicznej ; są  to  pomiary  ruchu  satelitów,  systemy  do 
lądowania  na  Księżycu  i łączenia  pojazdów  kosmicz- 
nych, pomiary  odległości  Księżyca  od  Ziemi.  Z ukła- 
dów bliższych  Ziemi  wymienić  można  układ  ostrze- 
gawczy przed  przeszkodami  dla  helikopterów  oraz  ra- 
dar laserowy  używany  przez  milicję  do  pomiaru  pręd- 
kości samochodów. 

Do  pomiarów  dalekiego  zasięgu  używane  są  przede 
wszystkim  lasery  neodymowe  i CO,.  W układach  bliż- 
szego zasięgu,  jak  w układzie  NASA  (posługiwano  się 
nim  w początkach  lat  siedemdziesiątych  przy  łączeniu 
pojazdów  kosmicznych),  źródłem  światła  jest  zbiór 
diod  laserowych  GaAs,  których  światło  jest  skolimo- 
wane  przez  układ  optyczny.  Możliwości  tych  układów 
ilustruje  tabela. 


Podstawowe  parametry  układów  NASA 


Zasięg 

Wielkość 

' daleki  (3-120  km)  1 

bliski  (0-3  km) 

i 

Dokładność  pomiaru 
odległości 

0,5% 

OJ  m 

Pomiar  prędkości 
obiektu 

50-120  m/s 

0,3-50  m/s 

Dokładność  pomiaru 
prędkości 

0,2% 

0,03  % 

Dokładność  pomiaru 
położenia  kątowego 

0,1° 

0,lfJ 

Dokładność  pomiaru 
prędkości  kątowej 

0,5  mrad/s 

0,05  mrad/s 

Przy  pomiarach  bardzo  dużych  odległości  koniecz- 
ne jest  — w celu  zwiększenia  natężenia  światła  wraca- 
jącego do  odbiornika  — instalowanie  na  badanych 
obiektach  specjalnych  zwierciadeł,  tzw.  retroreflekto- 
rów,  do  odbijania  światła  w kierunku,  z którego  padła 
wiązka.  Wiązka  laserowa  jest  mało  rozbieżna  (kąt  roz- 
warcia jest  nawet  mniejszy  od  1 prąd),  mimo  to  po 
przebyciu  setek  tysięcy  czy  milionów  kilometrów  ma 
znikome  natężenie  i trudno  jest  wyodrębnić  sygnał 
z szumów  (świecenie  gwiazd). 

Takie  właśnie  zwierciadła  zainstalowali  kosmonauci 
amerykańscy  na  Księżycu  podczas  wypraw  „Apolla”. 
Umożliwiły  one  przeprowadzenie  w Lick  Laboratory 
w Kalifornii  pomiaru  odległości  między  Ziemią  i Księ- 
życem. Źródłem  światła  był  laser  rubinowy  dający 
impulsy  o energii  8 J i o czasie  trwania  10  ns.  Aby 
maksymalnie  skupić  wiązkę,  kierowano  ją  na  Księżyc 
przez  120-calowy  teleskop  — na  Księżycu  miała  śred- 
nicę ok.  1600  m.  Każdy  z wysłanych  impulsów  zawie- 
rał 1020  fotonów,  z których  przeciętnie  tylko  25  wra- 
cało do  odbiornika  na  Ziemi.  Odległość  Ziemia-Księ- 
życ  zmierzono  tą  metodą  z dokładnością  do  ±15  cm. 


Zastosowanie  w medycynie  i biołogiń 

W tych  dziedzinach  używa  się  lasera  głównie  dlate- 
go, że  jego  promieniowanie  ma  dużą  gęstość  energii 
skupioną  w małej  objętości.  Najbardziej  przydatne 
do  cięcia  tkanek  (miękkich  i twardych)  są  lasery  C02 
i neodymowe.  Połączenie  lasera  z chirurgicznym  mi- 
kroskopem pozwala  dokonywać  precyzyjnych  zabie- 
gów, m.in.  na  tkance  mózgowej  (np.  odparowywanie 
nowotworów  mózgu).  Wiązka  laserowa  daje  ostro  za- 
rysowane cięcie  z delikatnym  obrzeżem,  głębokość 
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cięcia  można  regulować  przez  zmianę  mocy  lub  energii 
lasera,  krwawienie  jest  blokowane  mikroskrzepami, 
a rany  po  zabiegu  goją  się  szybko. 

koagulator  Jednym  z pierwszych  urządzeń  medycznych,  w któ- 
laserowy  rym  zastosowano  laser  (rubinowy)  jest  koagulator  la- 
serowy (->  Fizyka  medyczna).  Laser  rubinowy  do- 
skonale nadaje  się  do  „przyklejania”  siatkówki  do  na- 
czyniówki (odklejenie  siatkówki  jest  dość  częstym 
uszkodzeniem  oka),  gdyż  wiązka  laserowa  rozchodzi 
się  bez  dużych  strat  w elementach  przezroczystych 
oka,  a jest  silnie  pochłaniana  przez  nabłonek  siatków- 
ki; impuls  lasera,  odpowiednio  skupiony,  wywołuje 
w siatkówce  odczyn  zapalny,  w wyniku  czego  powstaje 
zrost  (il.  16,  tabl.  4).  Laserem  rubinowym  można 
usuwać  tatuaż  lub  zabarwienia  skóry  w miejscach 


różniących  się  współczynnikiem  absorpcji  od  miejsc 
sąsiednich. 

W badaniach  medycznych  i biologicznych  lasery 
służą  m.in.  do  mikropunkcji  komórek  i organelli. 
Głowica  laserowa  sprzężona  z mikroskopem  pozwala 
precyzyjnie  zniszczyć,  a nawet  odparować  dany  frag- 
ment komórki.  Wobec  krótkiego  czasu  ekspozycji  — 
rzędu  0,1  ms  — można  naświetlać  naw'et  poruszające 
się  elementy.  Takim  zabiegom  na  żywych  komórkach 
nie  towarzyszy  upośledzenie  procesów  życiowych,  co 
jest  bardzo  ważne  przy  tego  typu  badaniach. 

J.  Martin  Przyszłość  telekomunikacji , Warszawa  1975;  E.  R. 
Mustiel,  W.  N.  Parygin  Metody  modulacji  światła.  Warszawa 
1974;  H.  Kaczmarek  Wstęp  do  fizyki  laserów , Warszawa  1978; 
H.  Klejman  Lasery  Warszawa  1979;  A.  Piekara  Nowe  oblicze 
o/Jl^Ai.Warszawa  1976;  Światło  (zbiór  artykułów),  Warszawa  1973 


Optyka  nieliniowa 

Andrzej  Graja 

W początkach  lat  pięćdziesiątych  wydawało  się,  że 
podstaw- owe  problemy  optyki  fizycznej  zostały  już 
dostrzeżone  i rozwiązane,  a sama  dziedzina  stanowi 
przykład  nauki  pięknej,  zwartej  i bliskiej  doskonało- 
ści. W tej  idealnej  konstrukcji  pojawiły  się  jednak  rysy, 
gdy  w II  poł.  lat  pięćdziesiątych  teoretycznie  wykazano, 
że  niektóre  własności. materii  mogą  zależeć  od  natęże- 
nia padającego  na  nią  światła.  Okazało  się  mianowi- 
cie, że  polaryzacja  ośrodka  dielektrycznego,  wywoła- 


Rys.  1.  Zależność  polaryzacji  P od  natężenia  przyłożonego  pola 
elektrycznego  E:  a)  dielektryk  liniowy,  b)  dielektryk  nieliniowy. 
Współczynniki  a,  P i y oznaczają  odpowiednio:  makroskopową 
polaryzowalność  liniową,  pola  ryzo  walność  drugiego  rzędu  oraz 
polaryzowalność  trzeciego  rzędu 


na  polem  elektrycznym  fali  świetlnej,  może  wzrastać 
szybciej  aniżeli  proporcjonalnie  (liniowo)  do  natężenia 
zależność  pola;  może  być  kwadratową  lub  wyższego  rzędu  funk- 
poiaryzacjś  cją  tego  natężenia  (rys.  1),  czyli  może  wyrastać  nieli- 
od  natężania  niowo  wraz  z natężeniem  pola.  To  na  pozór  proste 
pola  zjawisko  pociągnęło  za  sobą  całkowitą  przebudowę 
podstaw'  optyki  fizycznej ; trzeba  było  bowiem  znaleźć 
miejsce  na  zjawiska  optyczne,  których  przebieg  zależy 
od  natężenia  promieniowania,  i które  zachodzą  bez 
spełnienia  zasady  superpozycji  fal.  W ten  sposób  na 
początku  lat  sześćdziesiątych  pojawiła  się  nowa  dzie- 
dzina optyki  — optyka  nieliniowa,  obejmująca  obec- 
nie wszystkie  zjawiska  z zakresu  częstości  optycznych 
związane  z nieliniowością  materii,  czyli  zależnością  jej 
własności  od  natężenia  przyłożonego  pola  elektromag- 
netycznego. Początki  optyki  nieliniowej  przypadają 
nieprzypadkow-o  na  okres,  w którym  pojawiły  się 
źródła  światła  zdolne  do  ujawnienia  nieliniowości  ma- 
terii, a więc  do  weryfikacji  wcześniejszych  prac.  Źród- 
łami tymi  były  generatory  kwantowe  światła  czyli 
lasery. 

Aby  zrozumieć,  dlaczego  dopiero  lasery  umożliwiły 
zaobserwowanie  pierwszych  zjawisk  optyki  nielinio- 
wej, porównajmy  wkład  wnoszony  do  całkowitej  po- 
laryzacji ośrodka  przez  pierwsze  dwa  wyrazy  <xE 
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i pE2  występujące  w wyrażeniu  wiążącym  polaryzację 
dielektryka  (->  Dielektryki)  z natężeniem  przyłożo- 
nego pola  elektrycznego  fali  świetlnej  (rys.  2). 


Rys.  2.  Zależność 
składowej  liniowej  Pl 
i nieliniowej  Pnl  pola- 
ryzacji typowego  nie- 
liniowego ośrodka 
dielektrycznego  od  na- 
tężenia pola  elektrycz- 
nego fali  świetlnej 
(uwaga : skala  loga- 
rytmiczna) 


Wyraz  a E opisuje  polaryzację  liniową  Pl  ośrodka, 
natomiast  pE 2 jest  pierwszym  przybliżeniem  polary- 
zacji nieliniowej  P*1.  W polach  elektrycznych  o natę- 
żeniu rzędu  102  V/m  polaryzacja  nieliniowa  ośrodka 
jest  o kilkanaście  rzędów  wielkości  mniejsza  od  jego 
polaryzacji  liniowej  (mała  wartość  współczynnika  p). 
W silnych  polach  elektrycznych  fali  świetlnej  o natę- 
żeniu rzędu  1012  V/m  polaryzacja  nieliniowa  zaczyna 
odgrywać  pewną  rolę,  pozostając  jednak  nadal  mniej- 
szą od  polaryzacji  liniowej.  Nikła  rola  polaryzacji  nie- 
liniowej w szerokim  zakresie  natężeń  przyłożonych 
pól  elektrycznych  jest  związana  z małą  wartością 
współczynnika  fi  w omawianych  materiałach.  Współ- 
czynniki stojące  przy  wyrazach,  w których  natężenie 
pola  elektrycznego  fali  świetlnej  występuje  w jeszcze 
wyższych  potęgach,  są  znacznie  mniejsze  niż  P i dla- 
tego nieliniowość  wyższego  niż  drugiego  rzędu  ujaw- 
nia się  tylko  w polach  najsilniejszych. 

Teoretyczne  rozważania  dotyczące  ośrodków  ani- 
zotropowych, czyli  takich,  których  własności  fizyczne 
uzależnione  są  od  kierunku  obserwacji,  ukazują 
ogromną  różnorodność  zjawisk  nieliniowych  wywo- 
łanych falą  świetlną.  Najprostsze  z tych  zjawisk 
przedstawia  tabela. 

W przeciwieństwie  do  ośrodka  izotropowego,  po- 


mikropunkcje 


polaryzacja 

nieliniowa 


Wybrane  zjawiska  nieliniowe  wywołane  polem  elektro- 
magnetycznym fali  świetlnej  o częstości  co 
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Rys.  3.  Polaryzacja 
w polu  elektrycz- 
nym o natężeniu 
E:  a)  ośrodek  izo- 
tropowy , b)  ośro- 
dek anizotropowy 


laryzującego  się  w kierunku  przyłożonego  pola  elek- 
rycznego  (rys.  3a),  ośrodek  anizotropowy  polaryzuje 
się  w innym  kierunku  (wektor  polaryzacji  nie  jest  rów- 
noległy do  wektora  natężenia  pola  elektrycznego),  co 
można  traktować  jako  polaryzację  w trzech  wzajem- 
nie prostopadłych  kierunkach  (rys.  3b).  Ogólnie,  każ- 
da ze  składowych  pola  elektrycznego  wywołuje  pola- 
ryzację ośrodka  anizotropowego  we  wszystkich  trzech 
kierunkach  układu  współrzędnych  i dla  scharaktery- 
zowania ośrodka  trzeba  podać  dziewięć  liczb.  Taki 
zespół  liczb  tworzy  tensor.  Inaczej  mówiąc,  współ- 
czynnik proporcjonalności  między  wektorem  polary- 
zacji i wektorem  natężenia  pola  nie  jest  liczbą,  lecz 
wielkością  tensorową,  zwaną  tensorem  polaryzowal- 
ności  liniowej.  Podobnie  polaryzacja  nieliniowa  ośrod- 
ka związana  jest  z natężeniem  pola  elektrycznego 
przez  współczynniki  tensorowe,  zwane  tensorami  po- 
laryzowalności  kwadratowej,  sześciennej  lub  wyższego 


Przegląd  kryształów  stasowanych  do  wytwarzania  drugiej 
harmonicznej  światła 


Długość  fali,  nm 

Średnia 

wartość 

Kąt  do- 
| pasowa- 
1 nia  fa- 
! zowego 

Kryształ 

podsta- 

wowej 

drugiej 

harmo- 

nicznej 

elementów 

tensora 

bljk 

długość 
spójno- 
ści, pm 

Kwaśny  fos- 
foran potasu 

694,3 

i 347,1 

1,00 

9,25 

50°, 4 

Kwaśny  arse- 
nian  rubidu 

694,3 

347,1 

0,64 

158 

80° 

KwaŚDy  fos- 
foran amonu 

694,3 

347,1 

1,02 

8,8 

51°, 9 

Siarczan  trój- 
glicyny 

694,3 

347,1 

0,004 

4 

48” 

Tytanian  baru 

1 058,2  ; 

1 529,1 

30 

2,0 

— 

Niobian  litu 
Tellur 

1 058,2  ! 
10  600 

I 529, 1 
5 300 

29 
12  700 

40 

14°,8 

Arsenek  indu 

10  600 

j 5 300 

780 
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tensory  po-  rzędu.  Tensory  polaryzowalności  liniowej  i sześciennej 
laryzowal-  mają  elementy  różne  od  zera  nawet  dla  ciał  izotro- 
ności  powych,  podczas  gdy  tensor  polaryzowalności  kwad- 
ratowej staje  się  zerem  dla  ośrodków  mających  środek 
symetrii. 


Wartości  elementów  tensora  nieliniowej  polaryzo- 
walności optycznej  decydują  o efektywności  zjawisk 
nieliniowych  zachodzących  w rozpatrywanych  ośrod- 
kach. Tensor  polaryzowalności  kwadratowej  bak 
określa  np.  wydajność  wytwarzania  drugiej  harmo- 
nicznej światła  w kryształach.  Kryształy  bardzo  się 
między  sobą  różnią  wartościami  elementów  tego  ten- 
sora, a więc  ich  przydatność  do  podwajania  częstości 
optycznych  jest  zróżnicowana  (tabela). 


Wytwarzanie  drugiej 
harmonicznej  światła 

Wytwarzanie  drugiej  harmonicznej  światła,  czyli  po- 
dwajanie częstości  optycznych  jest  najprostszym 
i najwcześniej  zaobserwowanym  efektem  nieliniowym  druga 
(1961).  Zjawisko  to  może  występować  w kryształach  harmoniczna 
pozbawionych  środka  symetrii ; kryształy  takie  w nor-  światła 
malnych  warunkach  są  dwójlomne.  Jeżeli  pole  elek- 
tryczne fali  świetlnej  padającej  na  nieliniowy  ośrodek 
zmienia  się  periodycznie  z częstością  co  (co  opisuje 
funkcja  sino>/),  to  periodycznie  zmienia  się  również 
składowa  polaryzacji  nieliniowej  ośrodka  zależna  od 
kwadratu  natężenia  pola  elektrycznego  padającej  fali. 

Składową  tę  (rys.  4)  można  przedstawić  jako  sumę 
dwóch  funkcji:  stałej  P0  i zależnej  od  czasu  P 
Taka  prosta  analiza  graficzna  funkcji  opisującej 


Rys.  4.  Analiza  graficzna  funkcji  opisującej  polaryzację  zależną 
od  kwadratu  natężenia  pola  elektrycznego.  Polaryzację  tę  można 
rozłożyć  na  składowe  o częstościach  2 co  i 0 


polaryzację  zależną  od  kwadratu  natężenia  pola 
elektrycznego  padającej  fali  o częstości  co  pokazuje 
więc,  że  w ośrodku  nieliniowym  pojawia  się  składowa 
zmienna,  reprezentująca  polaryzację  o częstości  2 co> 
oraz  składowa  stała,  opisująca  polaryzację  niezmien- 
ną. Pojawienie  się  stałej  polaryzacji  jest  optycznym 
prostowaniem. 

Zarówno  powielanie  częstości  jak  i prostowanie  fal  analogia 
świetlnych  w krysztale  nieliniowym  jest  pełnym  analo-  z diodami 
giem  dobrze  znanych  zjawisk  występujących  w dio-  krystalicz- 
dach  krystalicznych  pod  wpływem  mikrofal  i fal  nymi 
radiowych.  Dzięki  charakterystyce  nieliniowej  detek- 
tora krystalicznego  można  używać  go  nie  tylko  do  pro- 
stowania fal  elektromagnetycznych,  ale  również  do 
mieszania  oraz  powielania  ich  częstości. 

Powróćmy  jednak  do  optyki  i do  składowej  pola- 
ryzacji zmieniającej  się  periodycznie  z częstością  2w. 

Takie  zmiany  polaryzacji  ośrodka  to  nic  innego  jak 
periodyczne  zmiany  makroskopowego  momentu  di- 
polowego, a co  za  tym  idzie  — emisja  promieniowania 
elektromagnetycznego.  Ośrodek  nieliniowy  może 
więc  — pod  wpływem  fali  świetlnej  o częstości  co  — 
stać  się  źródłem  fali  świetlnej  o częstości  2 co.  Innymi 
słowy,  ośrodek  nieliniowy  może  emitować  promienio- 
wanie o częstości  dwukrotnie  większej  niż  częstość 
fali  padającej,  czyli  może  wytwarzać  drugą  harmo- 
niczną światła.  Zjawisko  takie  nie  mieści  się  w kate- 
goriach optyki  liniowej,  można  je  tłumaczyć  jedynie 
oddziaływaniem  nieliniowym  promieniowania  elek- 
tromagnetycznego z ośrodkiem. 

Uproszczony  układ  doświadczalny  służący  do  wy- 
twarzania drugiej  harmonicznej  światła  (rys.  5)  składa 
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się  z silnego  źródła  spójnego  światła  monochroma- 
tycznego jakim  jest  laser  (zwykle  impulsowy),  zestawu 
filtrów  oraz  kryształu  nieliniowego,  spełniającego 


filtr  przepuszczający  (o 


Rys.  5.  Schemat  układu  doświadczalnego  służącego  do  generacji 
drugiej  harmonicznej  światła 


funkcję  generatora  fali  świetlnej  o podwojonej  czę- 
stości. Dla  przykładu,  jeśli  na  kryształ  nieliniowy 
skierować  czerwoną  wiązkę  świetlną  z lasera  rubino- 
wego (długość  fali  źj  = 694,3  nm),  to  otrzymuje  się 
drugą  harmoniczną  niewidzialną  gołym  okiem,  leżącą 
w ultrafioletowej  części  widma  U2  = 347,1  nm).  Na- 
tomiast druga  harmoniczna  światła  emitowanego 
przez  laser  neodymowy  = 1058  nm,  czyli  w zakre- 
sie podczerwieni)  ma  barwę  zieloną  = 529  nm), 
a więc  można  ją  obserwować  wzrokowo. 

W krysztale  nieliniowym  naświetlonym  wiązką  pro- 
mieniowania o częstości  a > pojawia  się  fala  polaryzacji 

0 częstości  2o),  która  jest  źródłem  promieniowania 
świetlnego  o częstości  2 co.  Początkowo,  polaryzacja 

1 wywołana  przez  nią  fala  elektromagnetyczna  są 
w fazach  zgodnych.  Później  jednak  powstaje  między 
nimi  różnica  faz  będąca  wynikiem  różnych  prędkości 
rozchodzenia  się  tych  fal.  Oznacza  to,  że  psują  się  wa- 
runki do  „przepompowywania”  energii  z fali  polary- 
zacji do  fali  drugiej  harmonicznej.  Droga  optyczna 
w krysztale,  potrzebna  do  tego,  by  fazy  fal  harmo- 
nicznej o częstości  2 co  i polaryzacji  o częstości  2 co  róż- 
niły się  o 1 80°  nazywa  się  długością  spójności.  Długość 

długość  spójności  jest  więc  wielkością  charakteryzującą  dłu- 
spój  naści  £°ść  drogi  optycznej,  na  której  następuje  efektywne 
„przepompowywanie”  energii  z fali  polaryzacji  do 
fali  drugiej  harmonicznej.  Jak  widać  z podanego  wy- 
żej przeglądu  kryształów  nieliniowych,  długość  spój- 
ności jest  zwykle  niewielka,  więc  i „przepompowywa- 
nie” energii  w dowolnym  kierunku  kryształu  jest 
małe.  Optymalna  sytuacja  powstałaby  wtedy,  gdyby 
podczas  całej  drogi  optycznej  w krysztale  następowało 
„przepompowywanie”  energii,  tak  jak  to  dzieje  się 
w wypadku  przepuszczalności  promieniowania  przez 
ośrodek  bez  zmiany  jego  częstości.  Okazuje  się,  że  po- 
dobną sytuację  można  urzeczywistnić  w krysztale  nie- 
liniowym w kierunku,  w którym  wektory  falowe  kx 
(dla  promieniowania  o częstości  o>)  i kz  (dla  promie- 
niowania o częstości  2 a>)  spełniają  równanie  k1+kl  = 

= kz.  W kierunku  tym  prędkości  rozchodzenia  się  fal 
o częstościach  a>  i 2 co,  a co  za  tym  idzie  i współczynniki 
załamania  światła  dla  tych  częstości,  muszą  być  jedna- 
kserunek  k°we>  czyli  dopasowane.  Z tego  też  względu  kierunek 
dopasowania  najefektywniejszego  „przepompowywania”  energii 
fazowego  nazywa  się  kierunkiem  dopasowania  fazowego. 

" W krysztale  anizotropowym  kierunek  wyznaczony 
przez  przecięcie  się  powierzchni  współczynnika  zała- 
mania promienia  zwyczajnego  dla  częstości  podstawo- 
wej i promienia  nadzwyczajnego  (elipsoidy  obrotowe) 
oraz  dla  drugiej  harmonicznej  (indeks  2)  czyli  kieru- 
nek, w którym  odpowiednie  współczynniki  załamania 
są  jednakowe,  wyznacza  położenie  kierunku  dopaso- 
wania fazowego.  Przekrój  przecinających  się  po- 
wierzchni współczynników  załamania  typowego  krysz- 
tału nieliniowego,  a mianowicie  kwaśnego  fosforanu 
amonu  (ADP),  przedstawia  rys.  6.  Widać  z niego,  że 
kierunek  dopasowania  fazowego  do  wytwarzania  dru- 
giej harmonicznej  światła  o długości  fali  Ai  = 694,3  nm 
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tworzy  z osią  optyczną  kryształu  kąt  0 bliski  52°. 
Kierunek  dopasowania  do  wytwarzania  harmonicznej 
promieniowania  podczerwonego  z lasera  neodymowe- 


Rys.  6.  Przekrój  przez  powierzchnie  współczynników  załamania 
promienia  zwyczajnego  (kule,  indeks  o)  i nadzwyczajnego  (elip- 
soidy obrotowe,  indeks  e ) dla  częstości  podstawowej  (indeks  /) 
i drugiej  harmonicznej  (indeks  2)  kryształu  ADP.  Kierunek  do- 
pasowania fazowego  tworzy  z kierunkiem  osi  optycznej  krysz- 
tału, czyli  z osią  z,  kąt  9 = 52° 


Rys.  7.  Zależność  mocy  drugiej  harmonicznej  światła  (w  jedno- 
stkach względnych)  od  kąta  odchylenia  osi  wiązki  laserowej  od 
kierunku  dopasowania  fazowego 


go  tworzy  z osią  kryształu  kąt  0 zbliżony  do  42°.  Zna- 
jąc wartości  kąta  dopasowania  fazowego,  można  wy- 
ciąć z badanego  kryształu  próbkę  w ten  sposób,  by  oś 
optyczna  kryształu  tworzyła  kąt  Q z prostą  prostopad- 
łą do  powierzchni  próbki. 

Jak  już  powiedziano,  wytwarzanie  drugiej  harmo- 
nicznej światła  jest  w zasadzie  możliwe  w dowolnym 
kierunku  krystalograficznym,  ale  wydajność  przetwa- 
rzania częstości  jest  wtedy  przeciętnie  tysiąc  razy 
mniejsza  niż  w kierunku  dopasowania  fazowego 
(rys.  7).  W pobliżu  dopasowania  fazowego  zależność 
ta  jest  tym  bardziej  krytyczna,  im  mniejsza  jest  roz- 
bieżność wiązki  promieniowania  podstawowego  i im 
większa  jest  grubość  kryształu  nieliniowego;  zależy 
ona  również  od  jego  jakości  optycznej.  Występowanie 
defektów  sieci  krystalicznej  powoduje  bowiem  powsta- 
wanie w krysztale  naprężeń  i związanych  z nimi  lokal- 
nych zmian  współczynnika  załamania.  Efektem  tego 
jest  poszerzenie  głównego  maksimum  na  krzywej  opi- 
sującej zależność  mocy  drugiej  harmonicznej  od 


orientacji  kryształu.  Tak  więc,  do  wytwarzania  dru- 
giej harmonicznej  światła  winno  używać  się  kryszta- 
łów możliwie  najwyższej  jakości  optycznej. 

Moc  drugiej  harmonicznej  światła  wytwarzanej 
w krysztale  nieliniowym  silnie  zależy  od  mocy  promie- 
niowania podstawowego.  Ponieważ  moc  promienio- 
wania elektromagnetycznego  jest  proporcjonalna  do 
kwadratu  natężenia  pola  elektrycznego  odpowiedniej 
fali  elektromagnetycznej  w wypadku  efektu  kwadra- 
towego, jakim  jest  wytwarzanie  drugiej  harmonicznej 
światła,  przeto  moc  promieniowania  o częstości  2 a> 
winna  zależeć  od  kwadratu  mocy  promieniowania 


moc  promieniowania 
podstawowego  P" 


Rys.  8.  Zależność  wydajności 
wytwarzania  drugiej  i trzeciej 
harmonicznej  światła  w kalcy- 
cie  od  mocy  wiązki  lasera  ru- 
binowego 


podstawowego  o częstości  co.  Zależność  ta  jest  dobrze 
spełniana  w'  szerokim  zakresie  wartości  mocy  promie- 
niowania (rys.  8.). 

metoda  Do  badania  doświadczalnego  zjawiska  wytwarzania 
proszkowa  drugiej  harmonicznej  w monokryształach  próbki 
muszą  być  bardzo  dokładnie  wycięte  z badanego 
monokryształu  i obrobione  z najwyższą  dokładnością 
optyczną.  Niekiedy  jednak  trudności  z otrzymaniem 
odpowiedniej  jakości  i dużych  monokryształów  unie- 
możliwiają pomiary  metodą  tradycyjną.  Stosuje  się 
wówczas  próbkę  z proszku  krystalicznego  o przypad- 
kowo zorientowanych  ziarnach,  których  rozmiary  są 
porównywalne  z długością  spójności  dla  badanego 
materiału.  W niektórych  ziarnach  wytwarza  się  druga 
harmoniczna  w kierunku  dopasowania,  w innych  na- 
tomiast warunek  dopasowania  nie  jest  spełniony.  Wy- 
dajność przetwarzania  częstości  metodą  proszkową 
nie  jest  duża,  ale  za  to  taki  sposób  badania  nielinio- 
wych materiałów  pozwala  uniknąć  trudności  techno- 
logicznych z hodowlą,  orientacją  i obróbką  mono- 
kryształów. Badanie  drugiej  harmonicznej  w sprosz- 
kowanych kryształach  umożliwia  oszacowanie  naj- 
ważniejszych parametrów  charakteryzujących  materiał 
nieliniowy,  a więc  pozwala  określić  jego  przydatność 
w optyce  nieliniowej.  Wygląd  aparatury  służącej  do 
takich  badań  przedstawiono  na  il.  139,  tabl.  35). 
zastosowanie  Duże  zainteresowanie  zjawiskiem  wytwarzania 
do  badania  drugiej  harmonicznej  światła  jest  spowodowane  dwie- 
kryształów  ma  przyczynami : po  pierwsze,  jest  to  metoda  badania 
materii  dostarczająca  nowych  informacji  o niej;  po 
drugie,  jest  to  źródło  spójnego  krótkofalowego  pro- 
mieniowania świetlnego.  Badanie  zjawiska  powielania 
częstości  optycznych  dostarcza  informacji  o zmianach 
struktury  krystalicznej  i mechanizmie  przejść  fazo- 
wych w kryształach  nieliniowych,  a także  informacji 
o ilości  defektów  sieci  krystalicznej,  o ich  symetrii 
oraz  rozkładzie.  Jest  to  metoda  szczególnie  cenna 
w badaniach  kryształów  ferroelektrycznych,  zwłaszcza 
w obszarze  ich  przejścia  fazowego.  Wytwarzanie  dru- 
wytwarzanie  giej  harmonicznej  światła  stanowi  niekiedy  najwy- 
spójnego  godniejszy  sposób  otrzymywania  spójnego  promienio- 
promienio-  wania  krótkofalowego,  a w tym  również  promienio- 
wania wania  ultrafioletowego  o bardzo  dużej  mocy,  potrzeb- 
nych do  badania  optycznych  własności  ośrodków. 


wymuszono 

wytwarzani© 

drugiej 

harmonicznej 


procesy  w śa- 
ł ©fotonowe 


Stwierdzono  poprzednio,  że  elementy  tensora  pola-  poiaryzacja 
ryzowalności  kwadratowej,  opisującego  wytwarzanie  kwadrupo- 
drugiej  harmonicznej  światła,  są  równe  zeru  dla  krysz-  Sowa 
tałów  mających  środek  symetrii.  Jest  to  słuszne  w pier- 
wszym przybliżeniu,  tzn.  wtedy,  gdy  uwzględniamy 
jedynie  polaryzację  dipolową  dielektryka.  Ogólnie,  do 
polaryzacji  dielektryka  dochodzi  jeszcze  przyczynek 
związany  z przestrzennymi  zmianami  pola  elektrycz- 
nego (przyczynek  kwadrupolowy),  który  odgrywa 
rolę  w kryształach  mających  środek  symetrii  oraz 
w ośrodkach  izotropowych.  Ponieważ  polaryzacja 
kwadrupolowa  jest  ok.  tysiąc  razy  słabsza  od  polary- 
zacji dipolowej,  wytwarzanie  drugiej  harmonicznej 
dzięki  mechanizmowi  kwadrupolowemu  jest  niezwy- 
kle mało  skuteczne  i można  je  zaobserwować  tylko 
w niektórych  materiałach  (np.  w kalcycie)  i w szcze- 
gólnych warunkach  doświadczalnych. 

Przyłożenie  dostatecznie  silnego  stałego  pola  elek- 
trycznego do  ośrodka  izotropowego  powoduje  od- 
kształcenie jego  sieci  krystalicznej,  a co  za  tym  idzie  — 
utratę  symetrii.  Wymuszona  w ten  sposób  anizotropia 
ośrodka  umożliwia  wytwarzanie  w nim  drugiej  harmo- 
nicznej światła.  Zjawisko  wymuszonego  wytwarzania 
drugiej  harmonicznej  obserwowano  w niektórych 
kryształach  centrosy metrycznych,  w cieczach  orga- 
nicznych, w roztworach  wielkocząsteczkowych  związ- 
ków organicznych;  obserwowano  je  także  w niektó- 
rych gazach. 

Na  zjawisko  wytwarzania  drugiej  harmonicznej,  po- 
dobnie jak  i na  naturę  światła,  można  również  spoj- 
rzeć nieco  inaczej.  W opisie  kwantowym  zjawisko  pod- 
wajania częstości  jest  najprostszym  przykładem  proce- 
su wielofotonowego.  W elementarnym  akcie  wytwa- 
rzania drugiej  harmonicznej  biorą  bowiem  udział  trzy 
fotony:  dwa  fotony  o jednakowych  energiach  rów- 
nych ha)  oraz  foton  drugiej  harmonicznej  o energii 
2/ko.  Ogólnie,  wynikiem  oddziaływania  dwóch  fal 
świetlnych  o częstościach  a>x  (energia  fotonów  ficox) 
i co2  (energia  /?co2)  w ośrodku  nieliniowym  jest  fala 
o częstości  co3  (energia  spełniająca  zasadę  zacho- 
wania energii  co3  = m1co1±m2(02>  gdzie  mx  i m2  są  licz- 
bami całkowitymi.  Suma  tych  liczb  równa  się  wykład- 
nikowi najwyższej  potęgi  pola  elektrycznego  w rów- 
naniu opisującym  polaryzację  nieliniową  (rys.  Ib). 

Jeśli  ograniczymy  się  do  polaryzacji  kwadratowej, 
a więc  do  wypadku,  gdy  mx+m2  = 2,  uzyskamy  czte- 
ry nieliniowe  zjawiska  optyczne  drugiego  rzędu : 

— wytwarzanie  drugiej  harmonicznej  wiązki  pierw- 
szej o częstości  2cox  (w  tym  wypadku  mx  ==  2,  mz  — 0). 

— wytwarzanie  drugiej  harmonicznej  wiązki  dru- 
giej o częstości  2o>o  (ml  = 0,  m2  = 2). 

— wytwarzanie  wiązki  o częstości  sumacyjnej 

(ox+a>2  (mx  — m2  = 1). 

— wytwarzanie  wiązki  o częstości  różnicowej 
w1  — o)2  (mx  = —mz  = 1). 


Mieszanie  wiązek  świetlnych 

Mieszanie  dwóch  wiązek  światła  monochromatyczne-  układy  doś- 
go  można  przeprowadzić  w układzie  doświadczał-  wiadczaine 
nym,  którego  uproszczony  schemat  przedstawia  rys. 

9.  Wiązki  promieniowania  spójnego  emitowane  przez 
dwa  lasery  są  kierowane  na  kryształ  nieliniowy  po- 
przez odpowiednio  ustawione  zwierciadło  półprze- 
puszczalne.  Zapewnia  się  w ten  sposób  współbieżność 
promieni  ulegających  zmieszaniu  w krysztale  nielinio- 
wym. Pierwsze  doświadczenia  nad  mieszaniem  czę- 
stości optycznych  przeprowadzono  w 1962  r.  z wiąz- 
kami świetlnymi  pochodzącymi  od  dwóch  laserów  ru- 
binowych pracujących  w różnych  temperaturach, 
a więc  nieznacznie  się  różniących  długością  emitowa- 
nej fali.  Później  podobne  doświadczenia  powtarzano 
w innych  warunkach  i z rozmaitymi  materiałami  nie- 
liniowymi. Mieszano  np.  wiązki  promieniowania  spój- 
nego lasera  rubinowego  (A  = 694,3  nm)  i lasera  kry- 
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sta  licznego  emitującego  światło  o długości  fali  ź — 
— 1058,2  nm.  Zdołano  zmieszać  wiązki  promienio- 
wania dwóch  różnych  laserów  gazowych  pracujących 


laser  i 


"i 


I Kryształ 


i’1!' 

,(°Z 

Rys.  9.  Schemat  układu  do  otrzymywania  i rejestracji  optycznych 
częstości  sumacyjnych  i różnicowych 


w odległych  zakresach  widmowych,  np.  wiązkę  pod- 
czerwoną z wiązką  widzialną,  przeprowadzono  rów- 
nież badania  nad  mieszaniem  fal  podczerwonych 
i mikrofal.  Pomyślnym  wynikiem  zakończyły  się  rów- 
nież próby  mieszania  spójnego  promieniowania  lase- 
rowego z promieniowaniem  niespójnym  emitowanym 
przez  klasyczne  źródło  światła. 

Podobnie  jak  w zjawisku  wytwarzania  drugiej  har- 
monicznej światła,  dużą  wydajność  sumowania  czę- 
stości optycznych  otrzymuje  się  jedynie  w kryształach 
nieliniowych  dwójłomnych  zorientowanych  w kie- 
runku dopasowania  fazowego.  Wydajność  przemiany 
częstości  jest  bardzo  czuła  na  niewielkie  nawet  odchy- 
lenie od  kierunku  dopasowania  fazowego.  Znalazło  to 
praktyczne  zastosowanie  w spektrografach  i mono- 
chromatorach  nieliniowych  (rys.  10).  W obydwu  wy- 
padkach współbieżność  promieniowania  laserowego 
o częstości  col  i badanego  światła  o częstościach  cox 
spektrograf  i co2  osiąga  się  dzięki  zastosowaniu  zwierciadła  prze- 
nieliniowy  puszczalnego  dla  promieniowania  laserowego  i silnie 
odbijającego  promieniowanie  analizowane.  W spe- 
ktrografach nieliniowych  (rys.  lOa)  wiązkę  światła 
ogniskuje  się  na  krysztale  nieliniowym.  Dzięki  temu 
promieniowanie  o częstościach  (ol,  <ox  i a>2  rozchodzi 
się  w krysztale  we  wszystkich  kierunkach  wewnątrz 
kąta  bryłowego  a.  Jeśli  kierunki  dopasowania  fazo- 
wego mieszczą  się  w rozbieżności  wiązki,  to  w kierun- 


kach tych  zachodzi  efektywna  generacja  częstości 
sumacyjnych  a>z,4-«i  i c ol+cd2.  W ten  sposób  uzysku- 
je się  kątowe  rozdzielenie  wiązek  o różnych  często- 
ściach. 

W monochromatorach  nieliniowych  (rys.  lOb)  rów- 
noległą wiązkę  światła,  zawierającą  promieniowanie 

0 częstościach  coLy  <ox  i co2 , kieruje  się  wprost  na  krysz- 
tał. Przy  określonej  orientacji  kryształu  mogą  być  mcnochro- 
spełnione  warunki  dopasowania  fazowego  dla  proce-  mator 

su  sumowania  tylko  dwóch  częstości,  np.  coL+co2 , nieliniowy 
a więc  promieniowanie  o takiej  częstości  może  przejść 
przez  kryształ  nieliniowy.  Dostrojenie  do  warunków 
dopasowania  dla  innych  częstości  można  otrzymać 
przez  obrót  kryształu. 

Ze  względu  na  trudności  w otrzymywaniu  spójnego 
promieniowania  ultrafioletowego,  duże  znaczenie 
praktyczne  mają  metody  otrzymywania  wyższych 
harmonicznych  światła.  Otrzymywanie  trzeciej  har- 
monicznej światła  można  zrealizować  dwiema  meto- 
dami. Pierwsza  — to  wykorzystanie  sześciennej  pola- 
ryzowalności  nieliniowych  ośrodków  (polaryzacja  jest 
proporcjonalna  wówczas  do  £3).  Druga  metoda  — to 
podwajanie  częstości,  a następnie  sumowanie  jej  z pro-  trzecia 
mieniowaniem  o częstości  co.  Analiza  skuteczności  harmoniczna 
potrajania  częstości  tymi  dwoma  sposobami  wskazuje  światła 
na  przewagę  ostatniego.  W taki  też  sposób,  zwany 
kaskadowym,  otrzymuje  się  nie  tylko  trzecią  ale 

1 czwartą  oraz  piątą  harmoniczną  światła.  Schemat 
powielania  kaskadowego  częstości  optycznych  przed-  wyższe 
stawia  rys.  11.  Trzeba  podkreślić,  że  wszystkie  meto-  harmoniczne 
dy  prowadzące  do  otrzymania  harmonicznych  zapew-  światła 
niają  wystarczająco  dużą  wydajność  przemiany  czę- 
stości jedynie  w kierunku  dopasowania  fazowego 
właściwym  dla  danego  procesu.  Niestety,  realizacja 
dopasowania  dla  promieniowania  o długości  fali 

krótszej  od  ok.  200  nm  jest  niemożliwa  ze  względu  na 
brak  kryształów  nieliniowych,  mających  odpowiednią 
dwójłomność  w tym  zakresie  widmowym. 


filtr  filtr 


Równoległe  z mieszaniem  i wydzielaniem  częstości  częstości 
sumacyjnych,  zainteresowanie  badaczy  jest  skierowa-  różnicowe 
ne  na  otrzymywanie  częstości  różnicowych  (cox —co2). 

Metody  wydzielania  częstości  różnicowych  są  szcze- 
gólnie ważne  dla  spektrofotometrii  w podczerwieni. 

Przez  niewielkie  przestrojenie  częstości  promieniowa- 
nia widzialnego  czy  też  bliskiej  podczerwieni  można 
otrzymać  promieniowanie  spójne  z pogranicza  dale- 
kiej podczerwieni  oraz  mikrofal.  Zmieszanie  dwóch 
składowych  wiązki  lasera  neodymowego  daie  no.  pro- 
mieniowanie o długości  fali  ok.  0,1  mm,  natomiast 
zmieszanie  składowych  emitowanych  przez  laser  rubi- 
nowy pozwala  otrzymać  impulsy  promieniowania  mi- 
krofalowego o długości  fali  0,34  mm.  W wyniku 
zmieszania  wiązek  stabilizowanych  laserów  gazo- 
wych można  natomiast  otrzymać  promieniowanie 
elektromagnetyczne  o długości  fali  ok.  30  m,  a więc 
należące  do  pasma  częstości  radiowych.  Tak  więc, 
przez  mieszanie  wiązek  laserowych  rozszerza  się 
znacznie  zakres  widmowy  obejmowany  przez  źródła 
promieniowania  spójnego. 


Generatory  parametryczne 

Omówione  wyżej  metody  przemiany  częstości  światła 
spójnego  umożliwiają  otrzymanie  tylko  pewnych, 
ściśle  określonych  wartości  częstości,  które  są  zdeter- 
minowane mechanizmami  zachodzących  procesów. 
Natomiast  w przezroczystych,  optycznie  nielinio- 
wych ośrodkach  może  zachodzić  tzw.  parametryczne 
oddziaływanie  fal  świetlnych,  umożliwiające  płynne 
przestrajanie  częstości  źródeł  spójnych  światła.  W ślad 
za  pracami  teoretycznymi,  wskazującymi  na  możli- 
gene racja  pa-  wość  zbudowania  parametrycznych  generatorów 
rametryczna  światła,  przeprowadzono  w 1965  r.  doświadczenia 
realizujące  ten  pomysł. 

Okazuje  się,  że  w ośrodku  nieliniowym,  w którym 
polaryzacja  jest  kwadratową  funkcją  natężenia  pola 
elektrycznego  fali  świetlnej  ( P ==  <x  E+fiE*),  energia 
fali,  zwanej  pompującą,  o częstości  coP  może  być  prze- 
kazana słabym  drganiom  o częstościach  (ox  i co*  wy- 
stępującym w układzie  jako  składowe  „szumu”  op- 
tycznego. Częstości  te,  zwane  sygnałowymi  muszą 
spełniać  zasadę  zachowania  energii,  którą  można  w 
tym  wypadku  zapisać  w postaci  cop  = ci^-fco*  (waru- 
nek synchronizacji  czasowej).  Silna  fala  pompująca 
o częstości  (op  zmienia  stan  ośrodka,  w którym  się 
rozchodzi.  W krysztale  nieliniowym  zmiany  te  polega- 
ją na  modulacji  przenikalności  elektrycznej;  mamy 
więc  do  czynienia  ze  zmianą  parametru  układu.  Ozna- 
cza to  równocześnie,  że  w takim  ośrodku  nieliniowym 
o zmiennym  parametrze  fale  o częstości  a>x  i co2  n‘e 
rozchodzą  się  niezależnie  od  siebie,  tak  jak  to  byłoby 
w ośrodku  liniowym  o stałych  parametrach,  ale  od- 
działują wzajemnie.  Oddziaływanie  to  jest  maksymal- 
ne wtedy,  gdy  trzy  rozchodzące  się  w ośrodku  Jale 

dopasowanie  spełniają  warunek  dopasowania  fazowego  kP  = 

fazowe  (warunek  synchronizacji  przestrzennej),  gdzie 

jcp,  kx  i X2  oznaczają  wektory  falowe  promieniowania 
o częstościach  odpowiednio  <op,  cox  i <o2.  Przy  spełnie- 
niu tego  warunku  amplitudy  fal  o częstościach  i coz 
parastają  wykładniczo  w polu  fali  pompującej  (oPy 
czyli  ośrodek  o zmiennym  parametrze  staje  się  wzmac- 
niaczem fal  a >x  i coz.  Jeśli  fale  sygnałowe  rozchodzą  się 
w rezonatorze  nastrojonym  na  częstości  cox  i a>2,  to 
może  dojść  do  wzbudzenia  drgań  o tych  właśnie  czę- 
stościach. W ten  sposób  promieniowanie  spójne  po- 
jawia się  jako  wynik  selektywnego  wzmocnienia  nie- 
spójnego spontanicznego  promieniowania  o poda- 
nych wyżej  częstościach,  które  może  występować 
w układzie  jako  „szum”  optyczny. 

Emisja  promieniowania  spójnego  o częstościach 
ojx  i a>2  może  zachodzić  jedynie  wtedy,  gdy  moc  wiązki 
pompującej  przekroczy  wartość  progową  (zależną 
przede  wszystkim  od  dobroci  rezonatora  dla  częstości 
sygnałowych).  W typowych  układach  parametrycz- 
nych gęstość  progowa  mocy  jest  rzędu  1 MW/cm2, 
a więc  można  ją  łatwo  osiągnąć  używając  laserów  im- 
pulsowych. 

Przy  ustalonej  częstości  cop  promieniowania  pompu- 
jącego, częstości  fal  sygnałowych  cox  i co2  — wzmacnia- 
ne bądź  wytwarzane  w układzie  parametrycznym  — 
mogą  być  zasadniczo  dowolne.  Oczywiście  muszą  one 
spełniać  podane  wcześniej  warunki  synchronizacji 

czasowej  (cop  = o)x—a >2)  i przestrzennej  ( kp  = kx—k2)- 
Ten'  ostatni  warunek  dopasowania  przy  ustalonych 
częstościach  a>p,  cox  i a>2  spełniony  jest  w krysztale  ani- 
zotropowym tylko  w ściśle  określonym  kierunku. 
Oznacza  to,  że  orientację  kryształu  można  wykorzy- 
stać do  przestrajania  generatora  parametrycznego, 
przestrajanie  Widać  to  znakomicie,  jeśli  warunek  dopasowania  fa- 
generatora  zowego  jest  zapisany  w postaci  zależności  między 
parametrycz-  współczynnikami  załamania  dla  odpowiednich  czę- 
nego  stości  w kierunku  tworzącym  kąt  d z osią  optyczną 
przez  obrót  kryształu:  np(6)  — x/2  [niĆO+flaOO]-  W praktyce, 

kryształu  przy  zadanej  częstości  pompującej  oPt  wybór  kąta  0 
determinuje  częstości  i w2.  Na  przykład  generator 
parametryczny  (rys.  12)  zbudowany  na  monokrysztale 


niobianu  litu  i pompowany  promieniowaniem  o dłu- 
gości fali  528  nm  (druga  harmoniczna  promieniowania 
lasera  neodymowego)  można  przestrajać  od  ok.  680 
do  2350  nm  przez  niewielki  obrót  kryształu  nielinio- 
wego. Przy  optymalnym  wyborze  struktury  czasowo- 
-przestrzennej  wiązki  promieniowania  pompującego 
oraz  przy  dużej  dobroci  rezonatora,  moc  wiązek  emi- 
towanych przez  optyczne  układy  parametryczne  wy- 
nosi ok.  kilkuset  kW. 


Rys.  12.  Układ  do  przestrajania  i charakterystyka  generatora 
parametrycznego  pracującego  na  krysztale  niobianu  litu.  Prze- 
strajanie można  zrealizować  przez  obrót  nieliniowego  kryształu 
umieszczonego  w rezonatorze  optycznym  o dużej  dobroci  dla 
częstoci  (Ot  i &z 

W innej  metodzie  przestrajania  generatora  parame-  przestrajame 
trycznego  wykorzystuje  się  temperaturową  zależność  przez  zmianę 
współczynnika  załamania  kryształu.  Wynikiem  zmia-  temperatury 
ny  temperatury  jest  przesuwanie  się  położenia  kierun- 
ku dopasowania  dla  danej  pary  częstości  sygnałowych. 

Innymi  słowy,  zmiany  temperatury  nieruchomego 
kryształu  powodują,  że  warunek  dopasowania  w usta- 
lonym kierunku  krystalograficznym  spełniają  coraz  to 
inne  pary  częstości  a)x  i coz.  W generatorze  parame- 
trycznym pracującym  na  krysztale  niobianu  litu  i pom- 
powanym promieniowaniem  o długości  fali  528  nm 
uzyskuje  się  — przy  zmianie  temperatury  kryształu 
od  50°C  do  60°C  — przestrajanie  generatora  w zakre- 
sie od  ok.  970  nm  do  ok.  1150  nm. 

Generator  parametryczny  można  również  płynnie  elektro  - 
przestrajać,  wykorzystując  zależność  współczynnika  optyczna 
załamania  kryształu  od  natężenia  stałego  pola  elek-  metoda 
trycznego  (metoda  elektrooptyczna).  Zależność  ta  jest  przestrajania 
szczególnie  duża  w pobliżu  ferroelektrycznego  przej- 
ścia fazowego  i dlatego  w temperaturze  zbliżonej  do 
temperatury  przejścia  uzyskuje  się  tą  metodą  naj- 
większe przestrajanie  częstości. 

Generatory  parametryczne  emitujące  promieniowa- 
nie spójne  można  przestrajać  w bardzo  szerokim  za- 
kresie widmowym  od  dalekiej  podczerwieni  (powyżej 
25  jim)  do  fioletu  (ok.  300  nm).  Krótkofalową  granicę 
można  oczywiście  obniżyć,  powielając  częstość  fali 
świetlnej  wytwarzanej  przez  układ  parametryczny. 

Tak  więc,  generatory  parametryczne  mogą  być  stoso- 
wane jako  źródła  spójnego  promieniowania  świetlne- 
go o częstości,  którą  można  dokładnie  dostosować  do 
potrzeb  doświadczenia.  Ma  to  szczególne  znaczenie 
w badaniach  optycznych  zjawisk  rezonansowych. 

Samoogniskowanie 
i autokoiimac|a 


Omawiając  nieliniowe  oddziaływanie  światła  z ma- 
terią, w którego  wyniku  następuje  zmiana  częstości 
promieniowania,  zakładaliśmy  milcząco,  że  mamy  do 
czynienia  z falami  płaskimi,  przestrzennie  nieograni- 
czonymi. Założenie  to  przestaje  być  jednak  słuszne, 
gdy  wiązka  świetlna  o ograniczonej  średnicy  rozcho- 
dzi się  w ośrodku  nieliniowym.  W takim  wypadku  na- 
tężenie pola  elektrycznego  fali  świetlnej  zmienia  się 
w płaszczyźnie  prostopadłej  do  kierunku  rozchodzenia 
się,  a płaszczyzna  ta  przestaje  być  powierzchnią  stałej 
fazy. 


24  - Encyklopedia  fizyki  współczesnej 
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Ponieważ  wartość  współczynnika  załamania  n(E) 
ośrodka  nieliniowego  zależy  od  natężenia  pola  elek- 
trycznego fali  świetlnej:  n(E)  = n0-rn2E2+ ...,  zatem 


j samoogniskowanie  j autokolimacja 

Rys.  13.  Samoogniskowanie  i autokolimacja  silnej  wiązki  świetl- 
nej w ośrodku  nieliniowym.  Widać  stopniową  deformację  po- 
wierzchni fazowych  w ośrodku 


wiązka  intensywnego  światła  rozchodzi  się  w obsza- 
rze o zmienionym  współczynniku  załamania,  więk- 
szym od  współczynnika  n0  mierzonego  dla  światła 
o niewielkim  natężeniu.  Ośrodek  nieliniowy  działa 
więc  podobnie  do  soczewki  skupiającej,  koncentrując 
strumień  energii  świetlnej  w pobliżu  osi  wiązki.  Ilu- 
struje to  rys.  13,  na  którym  schematycznie  przedsta- 
wiono ten  mechanizm  ogniskowania  światła. 

Wobec  tego,  że  promień  odchyla  się  w kierunku 
ośrodka  o większym  współczynniku  załamania,  obser- 
wuje się  dodatkowy  wzrost  natężenia  pola  elektryczne- 
go wzdłuż  osi  wiązki,  a co  za  tym  idzie  — wzrost 
samo-  współczynnika  załamania.  W związku  z tym  zjawisko 
ogniskowa-  ogniskowania  samo  się  potęguje,  przyjęto  więc  okre- 
nie  ślaćje  jako  samoogniskowanie  światła. 

Geometryczna  analogia  między  ogniskowaniem 
światła  za  pomocą  soczewki  i samoogniskowaniem 
w ośrodku  nieliniowym  kończy  się  po  skupieniu  wiąz- 
ki. Za  ogniskiem  soczewki  skupiającej  wiązka  świetlna 
staje  się  rozbieżna,  podczas  gdy  światło,  które  uległo 
samoogniskowaniu  rozchodzi  się  dalej  w postaci 
bardzo  cienkiej,  skolimowanej  nici.  Zjawisko  takie, 
auto-  zwane  autokolimacją,  może  wystąpić  w ośrodku  nieli- 
kolimacja  niowym  przy  dostatecznie  dużych  mocach  wiązki 
świetlnej.  Elementarną  analizę  zjawiska  autokolima- 
cji  światła  można  przeprowadzić,  korzystając  z praw 
optyki  geometrycznej  oraz  wspomnianej  wyżej  zależ- 
ności nieliniowej  współczynnika  załamania  od  natęże- 
nia pola  elektrycznego  fali  świetlnej.  Wiązka  świetlna. 
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Rys.  14.  Przechodzenie  wiązki  laserowej  przez  ośrodek  liniowy 
i nieliniowy 


nawet  idealnie  skolimowana,  po  przejściu  przez  prze- 
słonę wykazuje  słabą  rozbieżność  spowodowaną  ugię- 
ciem. Tak  więc,  światło  za  przesłoną  (rys.  14)  wypełnia 
stożek  o rozwartości  Od.  Rozbieżność  dyfrakcyjna 
Od  jest  bardzo  mała,  czyli  stożek  świetlny  praktycznie 
nie  różni  się  od  walca.  Promienie  padające  od  strony 
ośrodka  optycznie  gęstszego,  przechodząc  do  optycz- 
nie rzadszego,  mogą  — przy  dostatecznie  dużych  ką- 
tach padania  — ulegać  całkowitemu  wewnętrznemu 
odbiciu  (rys.  15).  Jeśli  rozbieżność  dyfrakcyjna  Od  jest 
większa  od  kąta  krytycznego  0O,  to  promienie  wycho- 
dzą z wiązki,  natomiast  promienie  o rozbieżności 
mniejszej  od  kąta  krytycznego  wracają  do  środka 
wiązki.  Porównując  rozbieżność  dyfrakcyjną  Od  z war- 
tością kąta  0O,  można  ocenić  wpływ  nieliniowej  re- 
frakcji i dyfrakcji  na  rozchodzenie  się  wiązki  świetlnej 
w ośrodku.  Jeśli  Od  > 60i  to  wiązka  jest  rozbieżna 
(rys.  14b),  przy  tym  rozwartość  jej  stożka  świetlnego 
jest  mniejsza  niż  w ośrodku  liniowym  (rys.  14a).  Jeśli 
Od  = 0O,  to  nieliniowa  refrakcja  kompensuje  dyfrak- 
cję; wiązka  rozchodzi  się  jakby  w optycznym,  cylin- 
drycznym falowodzie  utworzonym  przez  siebie  (rys. 
14c).  To  zjawisko  nazwano  autokolimacją  światła, 
a warunek  Od  = 0o  wykorzystano  do  określenia  kry- 


Rys.  15.  Powstawanie  kanału  autokolimacyjnego  w nieliniowym 
ośrodku.  W obszarze  rozchodzenia  się  wiązki  świetlnej  współ- 
czynnik załamania  wzrasta  do  wartości  n{E ) = n+n.E*  (kąt 
krytyczny  0O  jest  kątem  dopełniającym  do  kąta  całkowitego  we- 
wnętrznego odbicia) 

tycznej  mocy  wiązki  laserowej  niezbędnej  do  jego  wy-  warunek 
wołania.  Okazuje  się,  że  moc  ta  — w wypadku  auto- 
powszechnie  używanych  rozpuszczalników  organicz-  kolimacji 
nych  — nie  jest  zbyt  wysoka  i wynosi  od  kilkunastu 
do  kilkudziesięciu  kilowatów.  Sytuacja  przedstawiona 
na  rys.  14d  występuje,  gdy  Od  < 0o  oraz  gdy  moc 
wiązki  przewyższa  moc  krytyczną.  Promieniowanie 
załamuje  się  w kierunku  osi  wiązki,  powodując  naj- 
pierw samoogniskowanie  światła,  a po  osiągnięciu 
dostatecznie  małej  średnicy  wiązki  rozpoczyna  się 
autokolimacja.  Trzeba  podkreślić,  że  skolimowana 
w ten  sposób  wiązka  ma  średnicę  ok.  50  pm  i nie  jest 
jednorodna.  Składa  się  ona  bowiem  z wielu  bardzo 
cienkich  nici  świetlnych.  Energia  świetlna  zawarta  w 
takiej  nici  może  zostać  po  pewnym  czasie  zużyta  na 
zjonizowanie  molekuł  ośrodka,  w którym  zjawisko 
autokolimacji  zachodzi.  Nić  więc  przestaje  istnieć, 
a na  jej  miejsce  może  się  pojawić  nowa. 

Z makroskopowego  punktu  widzenia  samoogni-  molekularny 
skowanie  i autokolimacja  są  możliwe  dzięki  wzrostowi  mechanizm 
współczynnika  załamania  światła  ośrodka  nieliniowe-  auto- 
go  pod  wpływem  pola  elektrycznego  fali  świetlnej,  kolimacji 
Zastanówmy  się,  jaki  jest  molekularny  mechanizm  po- 
wodujący wzrost  tego  współczynnika.  Trzeba  sobie 
zdać  sprawę,  że  podstawowy  mechanizm  będący  pod- 
stawą omawianych  zjawisk  musi  być  niezwykle  szyb- 
ki, jego  czas  relaksacji  powinien  być  rzędu  najwyżej 
10-12  s.  Wynika  to  z doświadczenia  — stwierdzono 
bowiem,  że  pikosekundowe  impulsy  świetlne,  a więc 
impulsy  o czasie  trwania  ok.  10“12  s,  wywołują  również 
samoogniskowanie  i autokolimację  światła.  Ponieważ 
omawiane  zjawiska  zachodzą  zarówno  w cieczach  jak 
i ciałach  stałych,  podstawowy  mechanizm  winien  się 
stosować  do  obydwu  stanów  skupienia. 

Stwierdzono,  że  zasadniczą  przyczyną  samoogni- 
skowania  i autokolimacji  światła  jest  wzrost  polary- 
zowalności  molekuł  ośrodka  nieliniowego  w polu 
elektrycznym  fali  świetlnej.  Oprócz  tego  podstawowe- 
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go  mechanizmu  pewną  rolę  odgrywają  również  inne 
procesy  molekularne,  a wśród  nich  reorientacja  mo- 
lekuł w polu  fali  świetlnej  i ich  hiperpolaryzowalność. 


Wymuszone  rozpraszanie  światła 


Od  ponad  stu  lat  wiadomo,  że  światło  przechodząc 
przez  ośrodki  mętne,  czyli  niejednorodne  optycznie, 
ulega  bardzo  silnemu  rozpraszaniu.  Z dokładnych  ob- 
serwacji wynika,  że  również  ośrodki  przezroczyste, 
makroskopowo  jednorodne,  mogą  rozpraszać  światło. 
Rozpraszanie  zachodzi  wówczas  np.  na  statystycz- 
nych fluktuacjach  gęstości.  Światło  rozproszone  przez 
układ  atomów  lub  molekuł  nie  pochłaniających  zacho- 
wuje niezmienioną  długość  fali,  a zjawisko  nazywa 
rozpraszanie  się  rozpraszaniem  Rayleigha.  Oprócz  takiego  elastycz- 
RaySeigha  nego  rozpraszania  występuje  często  nieelastyczne  roz- 
praszanie światła,  czyli  zachodzące  ze  zmianą  dłu- 
gości fali.  W świetle  rozproszonym,  oprócz  częstości 
podstawowej  o>,  obserwuje  się  wtedy  częstości  ay+nO 
zw.  częstościami  antystokesowskimi  i częstości  <0— n& 
zwane  stokesowskimi,  przy  czym  O jest  równe  częs- 
tości drgań  oscylacyjnych  lub  rotacyjnych  molekuł 
rozpraszających.  Wiązka  światła  rozproszonego  w 
układzie  molekularnym  niesie  więc  informacje  o tym 
układzie.  Takie  nieelastyczne  rozpraszanie  światła 
rozpraszanie  nazywamy  rozpraszaniem  Ramana  (— ► Spektroskopia 
Ramana  molekularna).  Trzeba  podkreślić,  że  zarówno  rozpra- 
szanie Ramana  jak  i Rayleigha  są  zjawiskami  spon- 
tanicznymi, a więc  rozproszone  promieniowanie  jest 
niespójne,  a samo  zjawisko  nie  ma  progu  energe- 
tycznego. 

Sytuacja  ulagła  radykalnej  zmianie  po  zastosowaniu 
spójnego  promieniowania  laserowego  w badaniach 
rozpraszania  światła.  Uproszczony  układ  doświad- 
czalny umożliwiający  takie  badania  przedstawia  sche- 
matycznie rys.  16.  W rezonatorze  laserowym,  utwo- 
rzonym przez  selektywne  zwierciadła  dielektryczne, 
oprócz  kryształu  aktywnego  i komórki  modulującej 
dobroć  rezonatora  jest  umieszczone  naczynie  wypeł- 


Rys.  16.  Schemat  układu  służącego  do  badania  rozpraszania 
światła  laserowego 


nione  cieczą,  w której  zachodzi  zjawisko  Ramana. 
Natężenie  pola  elektrycznego  fali  świetlnej  w rezona- 
torze takiego  lasera  osiąga  wartości  rzędu  108-1010 
V/m,  a więc  zbliżone  do  natężeń  pól  wewnątrzato- 
mowych.  W tak  silnych  polach  ujawnia  się  już  wpływ 
ruchu  elektronów  na  drgania  całych  molekuł. 

Pojawienie  się  w rezonatorze  laserowym  promienio- 
wania rozproszonego  o częstościach  a>as  i co$t  będą- 
cego wynikiem  spontanicznego  rozpraszania  Ramana, 
wpływa  decydująco  na  przebieg  zjawisk  w rezonato- 
rze. Promieniowanie  to  staje  się  bowiem  czynnikiem 
wymuszającym  dalszą  emisję  promieniowania  rozpro- 
szonego. Fazy  drgań  poszczególnych  molekuł  roz- 
praszających światło  stają  się  jednakowe,  a promie- 
niowanie rozproszone  na  tak  drgających  molekułach 
jest  promieniowaniem  spójnym.  Oznacza  to,  że  spon- 
taniczne, niespójne  początkowo,  rozpraszanie  staje 
się  rozpraszaniem  spójnym.  Tak  przebiegające  zjawi- 
wyrnussorc©  sko  nazywa  się  wymuszonym  rozpraszaniem  Rama- 
rozpraszartie  na.  Warunkiem  wymuszonego  rozpraszania  światła 
Ramana  jest  duża  dobroć  optyczna  rezonatora,  w którym  to 
rozpraszanie  zachodzi.  Obecność  zwierciadeł  dielek- 
trycznych w układzie  doświadczalnym  przedstawio- 
nym na  rys.  16  zapewnia  spełnienie  tego  warunku. 


Prawa  rządzące  rozpraszaniem  światła  wynikają 
z rozważań  nad  zależnością  polaryzacji  ośrodka  od 
natężenia  E pola  elektrycznego  fali  świetlnej.  Jeśli 
wziąć  pod  uwagę  ośrodek  złożony  z molekuł  polaryzo- 
wanych, tzn.  takich,  w których  rozkład  ładunku 
elektrycznego  zależy  od  natężenia  zewnętrznego  pola 
elektrycznego,  to  w polach  o natężeniach  rzędu 
10®— 1010  V/m  polaryzację  opisują  trzy  wyrazy  zależne 
od  natężenia  pola  E.  Dwa  z nich  są  liniowymi  funk- 
cjami E i,  jak  można  wykazać,  opisują  rozpraszanie 
Rayleigha  i Ramana,  trzeci  natomiast  jest  członem 
nieliniowym,  zależnym  od  trzeciej  potęgi  pola  E. 
Człon  ten  opisuje  zjawisko  wymuszonego  rozprasza- 
nia Ramana.  Faza  nieliniowej  składowej  polaryzacji 
jest  określona  jednoznacznie  przez  pole  fali  laserowej. 
Ponieważ  spójne  pole  fali  świetlnej  emitowanej  przez 
laser  działa  na  wszystkie  molekuły,  to  i fazy  drgań  ich 
momentów  dipolowych,  a co  za  tym  idzie  i polaryza- 
cji, będą  równe  fazie  promieniowania  laserowego. 


Rys.  17.  Próg  wymuszonego  rozpraszania  ramanowskiego: 
a)  energetyczny,  b)  optyczny.  Natężenie  promieniowania  sto- 
kesowskiego  /(tu*)  rośnie  wykładniczo  wraz  ze  wzrostem  natę- 
żenia promieniowania  padającego  /(< w).  Wykładniczy  charakter 
ma  również  zależność  7(w«)  od  długości  kuwety  / (do  pewnej 
długości  maksymalnej) 


Wymuszone  rozpraszanie  Ramana  różni  się  pod 
wieloma  względami  od  zwykłego,  spontanicznego  roz- 
praszania światła.  Powyżej  progu  zjawiska  natężenie 
wymuszonego  promieniowania  rozproszonego  /(tu«) 
rośnie  bardzo  szybko  (wykładniczo)  ze  wzrostem  na- 
tężenia światła  padającego  /(a>)  (rys.  17a).  Obecność 
progu  energetycznego  i odmienny  przebieg  zjawiska 
po  jego  przekroczeniu  są  charakterystyczne  dla  efek- 
tów wymuszonych.  Należy  podkreślić,  że  próg  wymu- 
szonego rozpraszania  Ramana  jest  często  zniekształ- 
cony innym  progowym  zjawiskiem  nieliniowym, 
a mianowicie  samoogniskowaniem  światła.  Istnieje 
również  progowa  wartość  drogi  optycznej  promienio- 
wania (rys.  17b)  niezbędna  do  wystąpienia  wymuszo- 
nego rozpraszania  światła.  Stopień  spójności  wymu- 
szonego promieniowania  ramanowskiego  zbliżony 
jest  do  stopnia  spójności  promieniowania  laserowego 
rozpraszanego  na  badanym  układzie  molekularnym. 
O spójności  promieniowania  rozproszonego  świadczą 
nie  tylko  odpowiednie  doświadczenia  interferencyjne, 
ale  również  charakterystyczne  dla  emisji  wymuszonej 
zwężenie  linii  widmowych.  Szerokości  linii  stokesow- 
skich  w spontanicznym  zjawisku  Ramana  wynoszą 
ok.  10  cm-1,  podczas  gdy  w zjawisku  wymuszonym 
ulegają  one  zwężeniu  do  ok.  0,5  cm-1;  jeszcze  węższe 
są  linie  antystokesowskie,  których  szerokość  widmo- 
wa wynosi  ok.  0,05  cm-1. 

W spontanicznym  rozpraszaniu  Ramana  obserwuje 
się  głównie  przejścia,  dla  których  oscylacyjna  liczba 
kwantowa  v zmienia  się  o jedność,  tzn \.  Av  = ±1; 
mało  prawdopodobne  są  natomiast  przejścia  z więk- 
szą zmianą  liczby  kwantowej.  Dlatego  też  natężenie 
spontanicznego  promieniowania  rozproszonego  silnie 
maleje  ze  wzrostem  Av.  Ze  względu  na  anharmo- 
niczność  drgań  molekularnych  poziomy  oscylacyjne 
nie  są  równoległe  (rys.  18a),  a pasma  ramanowskie 
odpowiadające  Av  ^ 1 mają  częstości  różniące  się  od 
dokładnych  wiartości  nadtonów  (rys.  1 8b).  W zjawisku 
wymuszonym  natomiast  natężenia  linii  stokesowskich. 


różnice  mię- 
dzy wymu- 
szonym i 
spontanicz- 
nym rozpra- 
szaniem 
hamana 


371 


dla  których  Av  > 1,  mogą  być  bardzo  duże  i niekiedy 


b) 


-3  -2  -1 


Rys.  18.  Schemat  poziomów  energetycznych  oscylatora  anhar- 
monicznego  (a)  oraz  odpowiadające  mu  widma  rozpraszania 
Ramana  spontanicznego  (b)  i wymuszonego  (c) 


stokesowskie  występuje  również  w najniższych  tempe- 
raturach, a jego  natężenie  rośnie  niekiedy  w miarę 
oziębiania  układu  molekularnego.  Sugeruje  to,  że  wy- 
muszone promieniowanie  antystokesowskie  związane 
jest  z molekułami  w podstawowym  stanie  energetycz- 
nym, a nie  w stanie  wzbudzonym.  W przeciwień- 
stwie do  zjawiska  spontanicznego,  położenia  pasm 
wymuszonego  rozpraszania  Ramana  odpowiadają 
dokładnym  wartościom  częstości  harmonicznych 
(rys.  18c). 

Bardzo  istotna  różnica  w obydwu  zjawiskach  Ra- 
ro2Lv;-ad  kąto-  mana  ujawnia  się  w rozkładzie  kątowym  promienio- 
wy Promie-  wania  rozproszonego.  W zjawisku  spontanicznym 
mowania  roz-  natężenie  promieniowania  rozproszonego  jest  funkcją 
proszonego  ciągłą,  słabo  zależną  od  kąta  obserwacji.  W zjawisku 
wymuszonym  natężenie  składowej  stokesowskiej  jest 
również  funkcją  ciągłą  kąta  obserwacji,  ale  silnie  za- 
leżną od  geometrii  układu  doświadczalnego,  a prze- 
ważająca część  promieniowania  jest  emitowana  w kie- 
runku osi  wiązki  laserowej  w stożku  o niewielkiej 
rozwartości.  Składowa  antystokesowska  zaś  rozchodzi 
się  jedynie  w dokładnie  określonym  kierunku  tworzą- 
cym kąt  0as  z osią  wiązki  laserowej.  Pojawieniu  się 
składowej  antystokesowskiej  towarzyszy  spadek  na- 
tężenia składowej  stokesowskiej  emitowanej  pod  ką- 
tem 0$  związanym  z 0as  prostą  relacją  trygonome- 
tryczną wynikającą  z rys.  19. 


II  stopień 


Rys.  19.  Wymuszone  rozpraszanie  Ramana  jako  proces  cztero- 
fotonowy.  Górna  część  ilustruje  dwustopniowy  charakter  roz-  , 
praszania 


proces  Zjawisko  wymuszonego  rozpraszania  Ramana  jest 
czlerofoto-  procesem  czterofotonowym,  w którym  na  miejsce 
siowy  dwóch  fotonów  światła  laserowego  pojawiają  się  dwa 
nowe  fotony:  stokesowski  i antystokesowski.  To,  że 
charakterystyki  kątowe  promieniowania  rozproszo- 
nego o częstościach  a)S  i coas  są  istotnie  różne,  sugeruje 
odmienny  mechanizm  powstawania  tych  dwóch  pasm. 
Przyjęto  więc  hipotezę,  że  rozpraszanie  wymuszone 
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jest  procesem  dwustopniowym.  Pierwszy  stopień  to 
przemiana  jednego  z fotonów  laserowych  opisywa- 
nych wektorem  falowym  k w foton  stokesowski  opi- 
sywany wektorem  ks.  Częstość  promieniowania  la- 
serowego jest  większa  od  częstości  stokesowskiej 
i dlatego  nie  całą  energię  tego  promieniowania  odnaj- 
dziemy w promieniowaniu  rozproszonym.  Różnica 
energii  zostaje  przekazana  sieci  jako  energia  fononu, 

któremu  przypisujemy  wektor  falowy  kp  (->  Dynami- 
ka sieci  krystalicznej).  Energia  ta  wydziela  się  w końcu 
w postaci  ciepła.  Pierwszy  proces  nie  nakłada  żadnych 
ograniczeń  na  kierunek  emisji  fotonu  stokesowskiego, 
a więc  prowadzi  on  do  emisji  dowolnie  skierowanych 
fotonów  stokesowskich  i odpowiadających  im  fono- 
nów. Drugi  stopień  to  wytwarzanie  fotonu  antysto- 
kesowskiego  z drugiego  fotonu  laserowego  oraz  od- 
powiedniego fononu.  Proces  ten  przebiega  zgodnie 
z zasadą  zachowania  pędu,  którą  można  zapisać  w po- 
staci równania  wektorowego  k+kp  = k^. 

Z powyższego  wywodu  widać,  że  emisja  fotonu  obserwacja 
antystokesowskiego  może  zachodzić  jedynie  pod  ką-  składowej 
tern  0as,  wynikającym  z powyższej  zależności  wekto-  antystoke- 
rowej.  Promieniowanie  antystokesowskie,  rozproszo-  sowskśej 
ne  pod  kątem  0as  względem  osi  wiązki  laserowej,  nie 
może  się  pojawić  w układzie  przedstawionym  na  rys. 

16  ze  względu  na  obecność  zwierciadeł  eliminujących 

ekran 


Rys.  20.  Schemat  układu  doświadczalnego  umożliwiającego 
obserwację  składowej  antystokesowskiej  wymuszonego  rozpra- 
szania Ramana 


fotony  nieosiowe.  Aby  więc  zaobserwować  składowe 
antystokesowskie,  trzeba  komórkę  z cieczą  umieścić 
poza  rezonatorem  laserowym  w nierównoległej  wiązce 
świetlnej.  Prosty  układ  doświadczalny  umożliwiający 
takie  badania  przedstawia  rys.  20.  (Promieniowanie 
jest  rozpraszane  wzdłuż  pobocznie  stożków,  których 
osiowe  przekroje  zaznaczono  na  rysunku.)  Kolejnym 
składowym  antystokesowskim  a>as  = o>+nQ  odpo- 
wiadają stożki  o coraz  to  większej  rozwartości.  Tak 
więc  na  ekranie  ustawionym  prostopadle  do  osi  ukła- 
du doświadczalnego  obserwuje  się  współosiowe  barw- 
ne pierścienie  odpowiadające  poszczególnym  wiązkom 
światła  rozproszonego  (il.  2,  tabl.  1).  Wynikiem  roz- 
praszania światła  w innych  ośrodkach  są  podobne 
obrazy  współśrodkowych  barwnych  pierścieni  o prze- 
sunięciach częstości  charakteryzujących  rozpraszający 
ośrodek. 

W wymuszonym  rozpraszaniu  Ramana  występują 
zarówno  charakterystyczne  cechy  zwyczajnego  roz- 
praszania Ramana  jak  również  i cechy  promieniowa- 
nia spójnego,  emitowanego  przez  lasery.  Emisja  wy- 
muszona w generatorach  kwantowych  możliwa  jest 
dzięki  inwersji  obsadzeń  odpowiednich  poziomów 
energetycznych.  W przypadku  wymuszonego  rozpra- 
szania światła  spójne  wzmacnianie  pola  o częstości 
stokesowskiej  o$  zachodzi  kosztem  osłabienia  pola 
pompującego.  Układ  umożliwiający  takie  wzmacnia- 
nie promieniowania  nie  wymaga  więc  wystąpienia  in- 
wersji obsadzeń  poziomów  energetycznych ; jest  to  za- 
sadnicza różnica  między  laserem  a laserem  ramanow-  laser 
skim.  Laser  ramanowski  jest  przykładem  praktyczne-  ^amanowski 
go  zastosowania  zjawiska  wymuszonego  rozpraszania 
światła.  Jego  znaczenie  polega  przede  wszystkim  na 
tym,  że  częstość  promieniowania  emitowanego  przez 
urządzenie  można  zmienić  łatwo  i w szerokich  grani- 
cach przez  dobór  właściwej  cieczy  rozpraszającej.  Wy- 
muszone rozpraszanie  Ramana  znalazło  zastosowanie 


w laboratoriach  fizykochemicznych  jako  narzędzie 
badań  oddziaływań  wewnątrz-  i między  molekular- 
nych, czyli  jako  metoda  spektroskopowa  znacznie 
czulsza  od  stosowanej  szeroko  klasycznej  spektro- 
skopii ramanowskiej. 


Rozpraszanie  światła  na  fali 
akustycznej 


Wymuszone  rozpraszanie  Ramana  jest  wynikiem  od- 
działywania fal  elektromagnetycznych  z poszczegól- 
nymi molekułami  ośrodka.  Innymi  słowy,  rozprasza- 
nie Ramana  odzwierciedla  własności  pojedynczych 
molekuł.  Jeśli  molekuły  ośrodka  rozpraszającego 
światło  są  uporządkowane  i tworzą  sieć  krystaliczną, 
to  padające  promieniowanie  świetlne  oddziałuje  nie 
tylko  z poszczególnymi  molekułami,  ale  może  wzbu- 
dzić drgania  tejże  sieci,  czyli  falę  akustyczną.  Częstość 
tzw.  gałęzi  optycznej  drgań  sieci  jest  równa  różnicy 
częstości  światła  wzbudzającego  i rozpraszanego, 
rozpraszanie  Rozpraszanie  światła  na  fali  akustycznej  (ultra- 
BriSSouina  dźwiękowej)  rozchodzącej  się  w ośrodku  skondenso- 
wanym nazywa  się  rozpraszaniem  Brillouina.  Zjawi- 
sko staje  się  efektem  wymuszonym,  jeśli  fala  aku- 
styczna, na  której  rozprasza  się  światło,  wzbudzona 
jest  przez  to  samo  promieniowanie. 

Zastanówmy  się,  jaki  jest  fizyczny  mechanizm  roz- 
praszania światła  na  fali  akustycznej.  Rozchodzenie 
się  fal  i ultradźwiękowej  o częstości  cop  w ośrodku  moż- 
na sobie  wyobrazić  jako  rozprzestrzenianie  się  zagęsz- 
czeń i rozrzedzeń  tego  ośrodka  z prędkością  vv.  Od- 
powiada to  periodycznym  zmianom  przenikalności 
elektrycznej  i współczynnika  załamania  światła.  Zmia- 
ny współczynnika  załamania  powodują  częściowo  od- 
bicie padającej  wiązki  o częstości  w2  (wektor  falowy 

k2)  w kierunku  /^(rys.  21).  Tak  więc  fala  akustyczna 


fala 


fala  akustyczna 


Rys.  21.  Odbicie  światła  o częstości  <u2  na  periodycznych  zagęsz- 
czeniach i rozrzedzeniach  ośrodka  spowodowanych  propagacją 
fali  akustycznej  o częstości  coP 


rozchodząca  się  w ośrodku  działa  podobnie  do  siatki 
dyfrakcyjnej  o stałej  ).p  równej  długości  fali  ultra- 
dźwiękowej. Istotna  różnica  między  tymi  dwoma  ele- 
mentami rozpraszającymi  polega  na  tym,  że  „siatka 
akustyczna”  przemieszcza  się.  Oznacza  to,  że  promień 
odbity  doznaje  dopplerowskiego  przesunięcia  często- 
ści prowadzącego  w tym  wypadku  do  obniżenia  czę- 
stości fali  odbitej  (co!  < a>2).  Okazuje  się,  że  różnica 
częstości  promieniowania  padającego  i odbitego  jest 
równa  częstości  fali  akustycznej  (a>2— (ax  =cop).  Fala 
świetlna  oddziałując  z falą  mechaniczną  (akustyczną) 
przekazuje  jej  energię  za  pośrednictwem  efektu  elek- 
trostrykcyjnego.  Obecność  w ośrodku  fali  o częstości 
a>2  może  doprowadzić  więc  do  wzmocnienia  fal  cuj  i mP. 
Jeśli  to  wzmocnienie  wystarcza  na  skompensowanie 
strat  i jeśli  w układzie  występuje  dodatnie  sprzężenie 
zwrotne,  to  wzbudzają  się  drgania  elektromagnetycz- 


ne o częstości  o)X  i akustyczne  o częstości  a>p.  Taka  ge- 
neracja fal  <ox  i cop  nazywa  się  wymuszonym  rozpra- 
szaniem Brillouina. 

Rozchodząca  się  w ośrodku  nieliniowym  fala  ultra- 
dźwiękowa ma  bardzo  dużą  częstość,  zazwyczaj  w gra- 
nicach 10®-1010  s-1.  Zważywszy,  że  prędkość  jej  roz- 
chodzenia się  w ośrodku  skondensowanym  jest  rzędu 
103  m/s,  oznacza  to,  że  jej  długość  wynosi  ok.  10-6  m. 
Jest  to  więc  wielkość  o trzy  rzędy  wielkości  większa 
od  typowych  odległości  międzyatomowych.  Trzeba 
podkreślić,  że  częstość  fali  ultradźwiękowej  jest  jednak 
dużo  mniejsza  od  częstości  fal  świetlnych  i wyno- 
szących w typowych  doświadczeniach  z laserem  rubi- 
nowym ok.  5 - 10~14  s_l. 

Rozpraszanie  Brillouina  można  opisać  kwantowo 
jako  pojawienie  się  fotonu  o częstości  cox  i fononu 
o częstości  ayp  zamiast  fotonu  o częstości  a>2.  W opisie 
korpuskularnym  równanie  a>2  — a)l  = a>p  wyraża  za- 
sadę zachowania  energii,  a obowiązująca  równocześ- 
nie zasada  zachowania  pędu  wymaga,  by  k2  = kt-]-kp. 
Ten  warunek  wektorowy  mówi,  że  emisja  tak  fali 
akustycznej,  jak  i optycznej  rozproszonej  zachodzi 
w ściśle  określonych  kierunkach.  Ponieważ  prędkość 
propagacji  fali  akustycznej  vp  jest  znacznie  mniejsza 

od  prędkości  rozchodzenia  się  światła,  wektory  k2  i kx 
mają  bardzo  zbliżone  długości,  a częstość  w2  bardzo 
nieznacznie  różni  się  od  <wx.  W doświadczeniu  rozpra- 
szanie Brillouina  objawia  się  jako  nadsubtelna  struk- 
tura rozpraszania  Rayleigha.  Obserwowane  doświad- 
czalnie przesunięcia  częstości  dla  wielu  cieczy,  jak  np. 
anilina,  benzen,  toluen  i woda,  są  rzędu  10~l  cm-1, 
a dla  kryształów  są  jeszcze  mniejsze.  Natomiast  pas- 
ma w widmie  ramanowskim  doznają  zmian  częstości 
rzędu  kilkuset  cm'1.  Rozpraszanie  Brillouina  trzeba 
więc  badać  bardzo  precyzyjnymi  metodami  — stosuje 
się  np.  spektrograf  z interferometrem  Fabry’ego-Pe- 
rota. 

Schemat  aparatury  umożliwiającej  rejestrację  wy- 
muszonego rozpraszania  Brillouina  przedstawia  rys. 
22.  Wiązka  spójnego  światła  laserowego  dużej  mocy 
jest  ogniskowana  w badanej  próbce.  Promieniowanie 
rozproszone  w kierunku  wstecznym  kieruje  się  do  in- 
terferometru Fabry’ego-Perota  za  pomocą  zwierciadła 
półprzepuszczalnego  ustawionego  w wiązce  pod  ką- 
tem 45°.  Obraz  pierścieni  interferencyjnych  otrzymuje 
się  na  płycie  fotograficznej  ustawionej  za  długoogni- 
skową soczewką.  Okazuje  się,  że  po  przekroczeniu 
progowej  wartości  mocy  wiązki  laserowej  na  inter- 
ferogramie  pojawiają  się  dodatkowe  pierścienie  odpo- 
wiadające promieniowaniu  rozproszonemu  ze  zmie- 
nioną częstością.  Są  one  przesunięte  w stosunku  do 
pierścieni  interferencyjnych  odpowiadających  wiązce 
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Rys.  22.  Schemat  aparatury  interferometrycznej  do  rejestracji 
wymuszonego  rozpraszania  Brillouina 
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laserowej  o dziesiąte  części  cm-1  w skali  liczb  falo- 
wych. 

Progowa  gęstość  mocy  promieniowania  laserowe- 
go niezbędna  do  wystąpienia  wymuszonego  rozpra- 
szania Brillouina  zależy  przede  wszystkim  od  własno- 
ści sprężystych  ośrodka  rozpraszającego.  W ciałach 
stałych  typowa  wartość  progowej  gęstości  mocy  świa- 
tła wynosi  ok.  1011  W/m2.  Taki  poziom  mocy  zapew- 
niają lasery  pracujące  z modulacją  dobroci  rezonato- 
ra, czyli  wytwarzające  impulsy  „gigantyczne”.  W cie- 
czach, dzięki  występującemu  w nich  zjawisku  samo- 
ogniskowania  światła,  gęstość  mocy  w kanale  auto- 
kolimacyjnym znacznie  przewyższa  progową  wartość 
mocy  wymaganą,  by  wystąpiło  wymuszone  rozprasza- 
nie Brillouina.  Dlatego  też  doświadczalnie  wyznaczo- 
ny próg  rozpraszania  Brillouina  pokrywa  się  z pro- 
giem samoogniskowania. 

Naszkicowany  mechanizm  wymuszonego  rozpra- 
szania Brillouina  prowadzi  do  prostego  związku  mię- 
dzy względnym  przesunięciem  linii  widmowych 
(co!— oą)I oh,  kątem  rozproszenia  i prędkością  fali  ultra- 
dźwiękowej generowanej  w ośrodku  rozpraszającym 
światło.  Prędkość  dźwięku,  wyznaczona  z pomiarów 
rozpraszania  Brillouina,  pozostaje  w znakomitej 
zgodności  z wartością  wyznaczoną  metodami  bezpo- 
średnimi. Jest  to  dodatkowym  argumentem  przema- 
wiającym za  słusznością  modelu  Brillouina. 

Z analizy  warunków  wzmocnienia  fali  akustycznej 
w ośrodku  rozpraszającym  światło  wynika,  że  w nie- 


których układach  molekularnych,  przy  dostatecznie  zwierciadło 
dużej  mocy  padającej  wiązki  świetlnej  o częstości  a>2,  molekularne 
natężenie  światła  przechodzącego  może  spaść  do  zera 
na  końcu  próbki.  Oznacza  to,  że  w wyniku  rozprasza- 
nia Bruillouina  ośrodek  działa  wówczas  jak  całkowi- 
cie odbijające  zwierciadło,  przy  czym  odbite  promie- 
niowanie ma  częstość  przesuniętą  o a>p  względem 
częstości  cł>2  wiązki  padającej.  Zdolność  odbijająca 
takiego  zwierciadła  wzrasta  wraz  ze  wzrostem  natęże- 
nia światła  padającego  od  0 do  1.  Zjawisko  to  bywa 
niekiedy  wykorzystywane  w układach  modulujących 
dobroć  rezonatorów  laserowych. 

Optyka  nieliniowa  jest  młodą,  dynamicznie  się  roz- 
wijającą i bardzo  już  obszerną  dziedziną  optyki  fi- 
zycznej. W tym  krótkim  omówieniu  mogliśmy  zwró- 
cić uwagę  tylko  na  niektóre  zjawiska  związane  z wy- 
mianą energii  między  polami  promieniowania  o róż- 
nych częstościach.  Dokładniejsze  omówienie  tych 
pasjonujących  problemów  można  znaleźć  w licznych 
monografiach  poświęconych  elektronice  kwantowej 
i optyce  nieliniowej. 

S.  A.  Achmanow,  R.  W.  Chochlow  Problemy  nieliniejnoj 
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winter,  F.  Żerni ke  Applied  Nonlinear  Optics,  New  York  1973; 

A.H.  Piekar  a Nowe  oblicze  optyki , Warszawa  1976;  J.  Stan- 
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Ultrakrótkie  impulsy  światła 


Adam  Kujawski 

Od  chwili  zbudowania  w 1960  r.  pierwszego  lasera 
nastąpił  ogromny  rozwój  technik  laserowych,  które 
od  tego  czasu  stale  ulegają  istotnym  przeobrażeniom 
i ulepszeniom.  Przykładem  tego  jest  wynalezienie  me- 
tody wytwarzania  ultrakrótkich  impulsów  światła, 
zbudowanie  laserów  barwnikowych  i innych  o łatwo 
zmiennych  długościach  fali  oraz  zbudowanie  laserów 

0 dużej  mocy.  Omówimy  tutaj  technikę  wytwarzania 
bardzo  krótkich  impulsów  światła  oraz  sposoby  po- 
miarów czasów  ich  trwania.  Wspomnimy  też  o waż- 
niejszych realizowanych  obecnie  zastosowaniach  jak 

1 o poszukiwaniu  zupełnie  nowych  możliwości  zasto- 
sowań. 

Czasy  trwania  impulsów,  wytwarzanych  przez 
pierwsze  lasery  rubinowe,  były  rzędu  10“®  s;  obecnie 
dobrze  opanowana  jest  technika  wytwarzania  impul- 
sów o czasach  trwania  rzędu  10-12  s.  Fakt  skrócenia 
czasu  o sześć  rzędów  wielkości  świadczy  najlepiej 
o postępie  w osiąganiu  możliwie  najkrótszych  impul- 
sów. Podobnie,  gęstość  mocy  ultrakrótkich  impulsów 
obecnie  wytwarzanych  — mierzona  zwykle  w W/cm2 
— jest  o wiele  rzędów'  wielkości  większa  niż  pierwszych 
impulsów  laserowych. 

Opanowano  już  metody  otrzymywania  impulsów, 
które  po  zogniskowaniu  mają  gęstość  mocy  docho- 
dzącą do  101*  W/cm2.  Warto  sobie  uświadomić,  jaka 
jest  długość  impulsu  pikosekundowego,  to  znaczy 
impulsu  o czasie  trwania  r = 10“12  s.  Ponieważ  pręd- 
kość rozchodzenia  się  impulsu  jest  równa  prędkości 
światła,  którą  przyjmujemy  c = 3 1010  cm/s,  to  dłu- 
gość impulsu  / = cr  = 0,3  mm.  Tak  więc  impulsy 
pikosekundowe  są  „pociskami”  świetlnymi  o bardzo 
dużej  gęstości  mocy  promieniowania  elektromagne- 
tycznego. Oddziaływanie  światła  z atomami  i czą- 
steczkami ośrodka,  na  który  pada  tego  rodzaju  „po- 
cisk” świetlny  różni  się  pod  wieloma  względami 
istotnie  od  oddziaływania  wiązki  świetlnej  padającej 
w sposób  ciągły.  Jest  ono  obecnie  przedmiotem  inten- 
sywnych badań  w wielu  laboratoriach  optycznych. 

Przypomnijmy,  że  częstości  fal  świetlnych,  a więc 
częstości  zakresu  widzialnego  widma  elektromagne- 
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tycznego  są  rzędu  1015  s-1.  Jeśli  fala  elektromagne-  fala  świetlna 
tyczna  byłaby  falą  ściśle  monochromatyczną  opisaną 
funkcją  sinus  lub  cosinus,  to  w ustalonym  punkcie 
przestrzeni  wykres  zależności  natężenia  pola  elek- 
trycznego od  czasu  miałby  postać  taką,  jak  na  rys. 
la.  Taka  fala  trwałaby  nieskończenie  długo.  W rze- 
czywistości fale,  które  wytwarzamy,  mają  skończony 
czas  trwania  i nie  są  ściśle  monochromatyczne.  Rys. 

Ib  ilustruje  zależność  natężenia  pola  elektrycznego 
od  czasu  dla  impulsu  świetlnego  o skończonym  czasie 
trwania.  W impulsie  takim  pole  zmienia  się  regular- 
nie z częstością  z dobrym  przybliżeniem  równą 


b) 


t 


Rys.  1.  Zależność  wartości  natężenia  pola  elektrycznego  od  czasu: 
a)  nieskończenie  długo  trwająca  sinusoida,  b)  impuls  o strukturze 
regularnej,  c)  impuls  o strukturze  nieregularnej 


impulsy  częstości  fal  świetlnych.  Jeżeli  częstość  tę  przyjmiemy 
gigantyczne  za  równą  1015  s“\  a czas  trwania  impulsu  za  10”12  s, 
to  łatwo  wywnioskujemy,  że  impuls  zawiera  103  drgań. 
Na  rys.  Ib,  rzeczjasna,  zaznaczono  znacznie  mniejszą 
liczbę  drgań.  Należy  podkreślić,  że  nie  można  do- 
kładnie stwierdzić,  czy  obecnie  wytwarzane  impulsy 
pikosekundowe  mają  strukturę  regularną,  taką  jak  na 
rys.  Ib,  czy  też  drgania  są  nieuporządkowane  i przy- 
padkowe, tak  jak  schematycznie  pokazuje  to  rys.  lc. 

Aby  zrozumieć  zasadę  wytwarzania  ultrakrótkich 
impulsów,  musimy  zacząć  od  krótkiego  wyjaśnienia 
zasady  działania  laserów  dających  impulsy  gigantycz- 
ne. Nazwę  tę  nadano  impulsom,  których  moc  była 
o kilka  rzędów  wielkości  większa  od  mocy  promie- 
niowania zwykłych  laserów.  Urządzenia  takie  powsta- 
ły wkrótce  po  zbudowaniu  pierwszego  lasera  i fakt 
ten  stanowił  istotny  postęp  w rozwoju  elektroniki 
kwantowej.  W laserze,  który  ma  dawać  impulsy  gi- 
gantyczne, akcja  laserowa  nie  może  się  rozwinąć, 
gdyż  ośrodek  czynny  lasera  jest  pompowany  (-*  La- 
sery— podstawy  działania)  przy  jednoczesnym  po- 
psuciu własności  rezonatora  optycznego.  Jest  to  tak 
zwane  przełączanie  dobroci  („dobroć”  — wielkość 
określająca  właściwości  rezonansowe  układu).  Po- 
psucie własności  rezonatora  można  uzyskać  np.  przez 
umieszczenie  komórki  Kerra  wewnątrz,  między 
zwierciadłami.  Najczęściej  jest  to  naczynie  z odpo- 
wiednią cieczą,  którą  może  być  np.  bardzo  czysty  ni- 
trobenzen—jego  zdolność  przepuszczania  światła 
zależy  od  pola  elektrycznego  zewnętrznego,  w którym 
ciecz  się  znajduje.  Gdy  komórka  nie  przepuszcza 
światła,  to  oczywiście  układ  dwu  zwierciadeł  nie  mo- 
że działać  jako  rezonator  optyczny  i ośrodek  aktywny 
może  być  pompowany  bez  wywoływania  akcji  lase- 
rowej. Gdy  energia  zgromadzona  w ośrodku  czyn- 
nym jest  dostatecznie  duża,  działanie  rezonatora  op- 
tycznego przez  odpowiednie  włączenie  komórki  zo- 
staje przywrócone  do  normalnego  stanu  i następuje 
szybki  rozwój  akcji  laserowej.  Prowadzi  to  do  skró- 
cenia impulsu  i powiększenia  jego  mocy.  Metoda  ta 
w różnych  wersjach  i ulepszeniach  jest  szeroko  wyko- 
rzystywana do  uzyskiwania  impulsów  nanosekundo- 
wych  o mocach  rzędu  kilkudziesięciu  megawatów. 


Synchronizacja  modów 


częstości 

własne 


Rys.  2.  Fale  stoją- 
ce elektromagne- 
tyczne w rezonato- 
rze utworzonym 
przez  dwa  nieskoń- 
czone zwierciadła 


Do  istotnego  skrócenia  czasu  trwania  impulsów  i po- 
większenia ich  mocy  przyczyniła  się  technika  zwana 
synchronizacją  medów  (ang.  mode-locking).  Ze 
względu  na  ważność  i oryginalność  tej  metody  omó- 
wimy dokładniej  jej  podstawy  fizyczne.  Każde  z drgań 
własnych  pola  elektromagnetycznego  w rezonatorze 
optycznym  odznacza  się  określoną  częstością.  Aby 
łatwiej  zrozumieć,  jakie  drgania  własne  można  wy- 
twarzać w rezonatorze,  rozważmy  układ  dwóch  płas- 
kich, równoległych  i idealnie  odbijających  zwierciadeł, 
odległość  między  którymi  wynosi  /.  Zakładamy,  że 
wymiary  zwierciadeł  są  nieskończenie  duże.  W obsza- 
rze między  zwierciadłami  może  istnieć  fala  stojąca 
o takiej  długości  2m,  że  na  odcinku  o długości  l mieścić 
się  będzie  całkowita  liczba  połowy  długości  fali  2m/2, 
tzn.  mkm! 2 = /,  gdzie  m — liczba  naturalna,  tak  jak 
schematycznie  ilustruje  to  rys.  2.  Ten  właśnie  związek 
określa  drgania  własne  pola  elektromagnetycznego 
w rezonatorze  jednowymiarowym  płaskim.  Powstanie 
fali  stojącej  można  oczywiście  interpretować  jako  wy- 
nik interferencji  dwu  fal  płaskich  poruszających  się 
w kierunkach  przeciwnych  i odbijających  się  od  zwier- 
ciadeł rezonatora.  Warto  tutaj  przypomnieć,  że  zwią- 
zek mXml2  = /jest  ogólny  i stosuje  się  również  do  wielu 
innych  drgań  własnych  jednowymiarowych  o zupełnie 
różnej  naturze  fizycznej,  np.  do  drgań  powietrza  zam- 
kniętego między  dwiema  ścianami.  Ponieważ  związek 
między  długością  fali  2 i częstością  v dla  fal  elektro- 
magnetycznych w próżni  ma  postać  c = 2v,  więc 


równanie  określające  częstości  drgań  własnych  przy- 
biera postać 

vm  — mc/21.  (1) 

Gdy  rezonator  jest  wypełniony  ośrodkiem  material- 
nym o współczynniku  załamania  n , wówczas  c we 
wzorze  (1)  winno  być  zastąpione  przez  c/n.  Rezonator  rezonator 
płaski  nieskończony,  który  tutaj  omawiamy,  jest  bezstratny 
bezstratny,  to  znaczy  nie  występują  straty  energii  fal 
odbijających  się  od  ścian  rezonatora.  Tego  rodzaju 
idealizacja  oznacza,  że  pola  elektryczne  i magnetyczne 
fali  stojącej  wytworzonej  wewnątrz  rezonatora  istnieją 
tylko  w obszarze  między  zwierciadłami  i energia  pola 
nie  wydostaje  się  poza  ten  obszar.  Rezonatory  wy- 
korzystywane w praktyce  mają  zwierciadła  o wymia-  « 
rach  skończonych;  przykłady  różnych  konfiguracji 
pokazuje  rys.  3.  Rezonatory  takie  nazywa  się  rezona-  g 
torami  otwartymi.  Drgania  pola  elektromagnetyczne-  g 
go,  które  można  wytwarzać  wewnątrz  rezonatorów  ot-  i 
wartych,  są  drganiami  tłumionymi.  Jest  to  wynikiem 
tego,  że  energia  pola  elektromagnetycznego  opuszcza 
obszar  centralny  układu  dwu  zwierciadeł  na  skutek 
takich  przyczyn,  jak  dyfrakcja  na  krawędzi  zwiercia- 
deł, nieidealnie  odbijające  powierzchnie  itd.  O tym, 
jak  szybko  są  tłumione  drgania  w rezonatorze,  decy- 
dują: kształt  (układ  zwierciadeł  wklęsłych  jest  mniej 
stratny)  oraz  odległość  między  zwierciadłami.  Nie 
omawiamy  tutaj  zupełnie  problemu  rozkładu  linii  sił 
pola  elektrycznego  i magnetycznego  drgań  własnych 
rezonatora  optycznego.  Ścisła  teoria  pozwala  na  ich 
wyznaczenie  oraz  wykazuje,  że  wzór  (1),  który  uza-  ^n^r^^r- 
sadnilismy  dla  rezonatora  nieskończonego,  z bardzo  tych : a)  zwierciadła 
dobrym  przybliżeniem  stosuje  się  do  wielu  rezonato-  płaskie,  b)  zwier- 
rów  otwartych  używanych  w praktyce.  Z każdą  siadła  ^uUste,^c) 
częstością  drgań  wyznaczoną  przez  równanie  (1)  wią-  £ui?ste- zwierciadło 
że  się  pewien  charakterystyczny  rozkład  przestrzeń-  płaskie 
ny  linii  sił  pola  elektromagnetycznego  w rezonatorze 
otwartym.  Rozkłady  te  noszą  nazwę  modów  (rodza- 
jów) promieniowania.  Mody,  które  tutaj  omawia-  mody  pra- 
liśmy (por.  rys.  2)  i dla  których  określiliśmy  charakte-  mieniowania 
rystyczne  częstości  własne  wzorem  (1),  nazywają  się 
modami  podłużnymi.  Dotyczą  one  bowiem  drgań 
i rozkładów  pola  wzdłuż  osi  rezonatora.  Dla  innych 
kierunków  rozkłady  pola  i charakterystyczne  czę- 
stości określone  są  w bardziej  złożony  sposób.  Oma- 
wiamy tutaj  jedynie  mody  podłużne,  gdyż  dokładne  mody 
zrozumienie,  czym  one  są,  jest  niezbędne  do  zrozu-  podłużne 
mienia  zasady  wytwarzania  impulsów  pikosekundo- 
wych. 

Ze  wzoru  (1)  wynika,  że  częstość  modu  sąsiedniego 
wynosi  vm+i  = (/»  + l)c/2I  i różnica  częstości  Av  = 

= v*n+i — dana  jest  przez 

Av  = c/2/.  (2) 

Ponieważ  2//c  jest  czasem  przejścia  sygnału  świetlnego 
wewnątrz  rezonatora  od  jednego  zwierciadła  do  dru- 
giego i z powrotem,  różnica  częstości  modów  sąsied- 
nich równa  jest  odwrotności  tego  czasu.  Dla  rezona- 
tora o długości  / = 1 m,  przyjmując  c = 3 -108  m/s, 
otrzymujemy  ze  wzoru  (2)  Av  =150  MHz.  Ośrodek 
czynny  wypełniający  rezonator,  pobudzany  do  świe- 
cenia przez  odpowiednie  „pompowanie”  optyczne 
(-►  Spektroskopia  atomowa),  wysyła  światło,  które 
odbija  się  od  zwierciadeł  rezonatora,  co  w wyniku  in- 
terferencji prowadzi  do  powstania  fali  stojącej  lub,  wzbudzanie 
mówiąc  inaczej,  drgań  własnych  o częstościach  da-  modów 


Rys.  4.  W zakresie  szerokości  widmowej  ov  linii  fluorescencyjnej 
mieści  się  skończona  liczba  częstości  drgań  własnych  rezonatora 
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nych  wzorem  (1).  Linia  widmowa  fluorescencji  ośrod- 
ka czynnego  ma  pewną  skończoną  szerokość  óv,  tak 
że  wzbudzane  są  tylko  te  mody  rezonatora,  których 
częstości  mieszczą  się  w szerokości  linii.  Ilustruje  to 
rys.  4.  Dla  rubinu  szerokość  <5v  « 330  GHz  i stąd 
wynika,  że  w rezonatorze  o długości  / = 10  cm  — 
po  uwzględnieniu  wartości  prędkości  światła  w ru- 
binie — można  wzbudzić  około  380  modów.  Wspom- 
nijmy od  razu,  że  dla  lasera  ze  szkła  neodymowego 
i dla  laserów  barwnikowych  szerokość  linii  fluore- 
scencji dv  jest  znacznie  większa  niż  dla  lasera  rubino- 
wego. Oznacza  to,  że  liczba  modów  wzbudzanych 
w'  rezonatorze  o takich  samych  wymiarach  jest  rów- 
nież odpowiednio  większa.  Ten  fakt  ma,  jak  zaraz 
zobaczymy,  bardzo  ważne  znaczenie  dla  charaktery- 
styki światła  powstającego  w laserze. 

Mody  podłużne  wzbudzane  przez  świecenie  ośrod- 
ka czynnego  są  w ogólności  wzbudzane  niezależnie 
od  siebie.  Oznacza  to,  że  ich  fazy  drgań  nie  pozostają 
w'  żadnej  zależności  między  sobą  i w praktyce  przyj- 
mują wartości  przypadkowe.  Oznaczmy  wartości  na- 
tężenia pola  elektrycznego  m-tego  modu  w jakimś 
określonym  punkcie  przez  Em.  Mamy  wówczas  Em  = 
= Eom  sin  (2nvmt-+-<Pm)y  gdzie  E0m  jest  amplitudą 
drgań,  a q>m  — fazą.  Zakładając  dla  uproszczenia,  że 
wektory  pól  elektrycznych  wszystkich  modów  wzbu- 
dzanych w rozpatrywanym  punkcie  są  tak  samo  skie- 
rowane, otrzymujemy  dla  wypadkowego  natężenia 
E wyrażenie 

N 

E — Eom  sin  (2nvmt-h?m).  (3) 

m 

We  wzorze  (3)  sumowanie  rozciąga  się  po  wszystkich 
wartościach  my  które  odpowiadają  częstościom  vm 
spełniającym  równanie  (1)  i leżącym  w zakresie  czę- 
stości linii  fluorescencyjnej.  Nie  możemy  tutaj  szcze- 
gółowo wyjaśnić  sposobów  obliczania  E na  podsta- 
wie wzoru  (3)  i zależności  E od  wyboru  faz  <pm.  Dwa 
najważniejsze  wypadki  są  następujące:  1)  gdy  fazy 
<Pm  są  różne  i mają  wartości  w ogólności  wybrane 
przypadkowo  (mówimy  wówczas,  że  mody  nakładają 
się  niespójnie),  to  wypadkowe  pole  ma  strukturę  nie- 
regularną, 2)  gdy  wszystkie  fazy  q>m  są  sobie  równe 
(spójne  nałożenie  się  modów),  wówczas  powstałe  pole 
tworzy  regularny  ciąg  miniimpulsów.  Zależność  od 
czasu  natężenia  /,  które  jest  wprost  proporcjonalne 
do  i:2,  ilustrują  odpow-iednio  rys.  5a  i 5b.  W pierw- 
szym wypadku  powstały  impuls  ma  strukturę  chao- 
tyczną, w drugim  tworzy  się  grzebień  zawierający 
impulsy  o znacznie  krótszym  czasie  trwania.  Dokład- 
na analiza  wykazuje,  że  czas  trwania  r pojedynczego 
impulsu  wr  grzebieniu  dany  jest  przez  r ^ l/<5v,  gdzie 
6v  jest  szerokością  linii  fluorescencyjnej  .Tak  więc,  aby 
otrzymać  krótkie  impulsy,  należy  posługiwać  się  la- 
serami, dla  których  <5v  jest  możliwie  duże.  Z tego 
punktu  widzenia  laser  neodymowy  jest  lepszy  niż  ru- 
binowy, gdyż  jego  linia  fluorescencyjna  jest  szersza, 
a jeszcze  lepsze  możliwości  dają  lasery  barwnikowe, 
dla  których  dv  2:  1013  Hz.  Energia  niesiona  przez 
każdy  z miniimpulsów  regularnego  grzebienia,  jak 
na  rys.  5b,  jest  w ogólności  większa  niż  energia  poje- 
dynczego miniimpulsu  tworzącego  się,  gdy  mody  na- 
kładają się  niespójnie  tak,  jak  na  rys.  5a.  W ten  spo- 
sób nie  tylko  powstają  pojedyncze  miniimpulsy,  lecz 
także  w sposób  kontrolowany  uzyskują  one  dostatecz- 
nie dużą  energię.  Warunek  równości  faz  modów  po- 
dłużnych, który  prowadzi  do  utworzenia  ciągu  mini- 
impulsów, nazywa  się  warunkiem  synchronizacji 
modów. 

Jak  praktycznie  zrealizować  synchronizację  mo- 
dów? Pierwszy  sposób  polega  na  umieszczeniu  we- 
wnątrz rezonatora  modulatora,  który  moduluje  na- 
tężenie światła  z częstością  równą  Av , określoną  wzo- 
rem (2).  Prowadzi  to  do  ustalania  się  faz  drgań  mo- 
dów w taki  sposób,  że  ich  wartości  stają  się  prawie 
sobie  równe  i w rezultacie  drgania  własne  nakładają 
się  spójnie.  Teoria  tego  rodzaju  modulacji  jest  dość 
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złożona  i jedynie  dla  pełności  opisu  wspomnieliśmy 
o tej  metodzie.  Drugi  sposób,  szeroko  stosowany 
w praktyce,  polega  na  wstawieniu  do  komory  rezo- 


striektura 

impulsu 


Rys.  5.  Struktura  impulsu  zależy  od  wyboru  wartości  faz  modów 
promieniowania:  a)  struktura  chaotyczna,  b)  regularna 


natora  odpowiedniego  materiału  o nieliniowej  cha- 
rakterystyce pochłaniania  — rys.  6a.  Jest  to  zwykle 
barwnik  organiczny,  którego  przepuszczalność  (trans- 
misja) zależy  od  natężenia  światła  padającego  tak, 
jak  ilustruje  to  rys.  6b.  Zakładamy  tutaj,  że  świecenie 
własne  barwnika,  to  znaczy  jego  fluorescencja,  jak 
i inne  procesy  molekularne  są  bardzo  krótkotrwałe. 

Oznacza  to,  że  ciecz  po  wzbudzeniu  światłem  powraca 
do  stanu  równowagi  niemal  natychmiast.  Warunek 
ten  jest  dobrze  spełniony  w większości  używanych 
układów  wytwarzających  impulsy  pikosekundowe. 

Niemniej  jednak,  stanowi  on  jedno  z ograniczeń  w 
usiłowaniach  osiągnięcia  jeszcze  krótszych,  tzn.  sub- 
pikosekundowych  impulsów  za  pomocą  techniki 
synchronizacji  modów.  Należy  podkreślić,  że  element 
nieliniowy  nie  tylko  zmniejsza  natężenie,  lecz  jedno- 
cześnie skraca  czas  trwania  impulsu. 

Jak  przebiega  akcja  laserowa  w obecności  elementu  działanie 
nieliniowego  wewnątrz  rezonatora?  Rozpatrzmy  laser  elementu 
pracujący  impulsowo.  Na  początku  wzbudzania  nieliniowego 
świecenia  lasera  impulsem  lampy  błyskowej  wzbudza- 
ne mody  podłużne  mają  nieduże  natężenia  i nakładają 
się  przypadkowo  tak,  że  wytwarzane  pole  elektro- 
magnetyczne charakteryzuje  zależność  od  czasu  zilu- 
strowania na  rys.  5a.  Promieniowanie  wewnątrz  re- 
zonatora odbija  się  wielokrotnie  od  jego  zwierciadeł 
i przechodząc  przez  naczynie  z barwnikiem  ulega 


Rys.  6.  Transmisja  nieliniowa:  a)  zależność  transmisji  T (stosu- 
nek natężeń  światła  padającego  i przechodzącego)  od  natężenia 
światła;  b)  kształt,  jak  również  wysokość  impulsu  po  przejściu 
przez  ciecz  o nieliniowej  transmisji  są  zmienione 


częściowemu  pochłanianiu.  Jednocześnie  część  pro- 
mieniowania wychodzi  z lasera  przez  jedno  z pół- 
przepuszczających  zwierciadeł.  W miarę  wzrostu  na- 
tężenia światła  impulsu  wzbudzającego  wytwarzane 
chaotycznie,  miniimpulsy  mają  większe  natężenie 
i nieliniowy  element  układu  zaczyna  pełnić  swoją 
dyskrymina-  właściwą  rolę.  Miniimpulsy  o małych  natężeniach  są 
oja  mini-  silniej  pochłaniane  niż  inne  o natężeniach  więk- 
impulsów  szych,  a te  o dostatecznie  dużych  natężeniach  prze- 
chodzą z małymi  stratami  z jednoczesnym  zmniejsze- 
niem czasu  trwania  (zob.  rys.  6b).  Tego  rodzaju  dy- 
skryminacja prowadzi  do  tego,  że  tylko  impuls  naj- 
silniejszy (czasem  mogą  być  dwa  o takim  samym  na- 
tężeniu) ulega  wzmocnieniu.  Promieniowanie  we- 
wnątrz lasera  jest  teraz  właściwie  pojedynczym  im- 
pulsem odbijającym  się  między  zwierciadłami  i jedno- 
cześnie pompowanym.  Częściowo  opuszcza  on  rezo- 
nator przy  odbiciu  od  zwierciadła  półprzepuszczają- 
cego  i dzieje  się  to  oczywiście  z częstością  równą  od- 
wrotności czasu  przejścia  od  jednego  do  drugiego 
zwierciadła  i z powrotem.  W rezulatacie  cały  duży  im- 
puls wychodzący  z lasera  nie  ma  chaotycznej  struk- 
tury, lecz  składa  się  z ciągu  miniimpulsów  biegną- 
cych jeden  za  drugim  w odstępach  czasu  llnjc.  W taki 
sam  sposób  działa  element  nieliniowy  w przypadku 
lasera  pracującego  w sposób  ciągły.  Dokładniejsze 
rozważania  wykazują,  że  działanie  elementu  nielinio- 
wego opisane  powyżej  jest  równoważne  warunkowi 
równości  faz  modów  nakładających  się,  który  wcześ- 
niej omawialiśmy. 

Rysunek  7 jest  zdjęciem  oscylogramu  impulsu  z la- 
sera neodymowego,  którego  czas  trwania  wynosi  ok. 
500  ns.  Dzięki  synchronizacji  modów  składa  się  on 


Rys.  7.  Oscylogram  impulsu  wytworzonego  w warunkach  syn- 
chronizacji modów  {jeden  miniimpuls  wycięto) 


Otrzymanie  z ciągu  miniimpulsów,  każdy  o czasie  trwania  kilku- 
impulsis  nastu  pikosekund,  biegnących  jeden  za  drugim  w od- 
pikosekun-  stępach  10  ns,  co  zgadza  się  z wartością  obliczoną  na 
dowego  podstawie  wyrażenia  llnjc  przy  / = 150  cm.  Poje- 
dynczy miniimpuls  może  być  wycięty  z grzebienia 
odpowiednio  szybką  migawką.  Dalej  można  go  prze- 
puszczać przez  ciecz  o nieliniowej  transmisji  (zob. 
rys.  6),  co  powoduje  dalsze  jego  skrócenie,  ale 
i zmniejszenie  natężenia.  Natężenie  zwiększa  się 
z kolei  wskutek  przepuszczenia  impulsu  przez  układ 
wzmacniający,  którym  jest  napompowany  ośrodek 


Rys.  8.  Oscylogram  impulsu  (z  wieloma  rozbłyskami)  wytworzo- 
nego bez  synchronizacji  modów 

czynny,  taki  sam  jak  w laserze.  Jeśliby  w laserze  neo- 
dymowym nie  było  komórki  z barwnikiem  nielinio- 
wym, to  impuls  nie  miałby  regularnej  struktury,  ta- 


kiej jak  na  rys.  7,  lecz  kształt  charakterystyczny  dla 
struktury  chaotycznej  pokazany  na  rys.  8. 

Wyjaśniając  zasady  i sposób  realizacji  synchroni- 
zacji modów,  nie  poruszyliśmy  wielu  trudnych  pro- 
blemów eksperymentalnych.  Mimo  ich  złożoności 
uzyskiwanie  impulsów  pikosekundowych  z dobrą 
powtarzalnością  stało  się  osiągnięciem  wielu  labora- 
toriów optycznych  na  świecie. 


Pomiar  czasu  trwania  impulsu 

Problemy  pomiarów  czasów  trwania  impulsów  piko- 
sekundowych pod  wieloma  względami  nie  zostały 
jeszcze  całkowicie  rozwiązane.  Posługiwanie  się  naj- 
szybszymi fotodetektorami  i oscylografami  pozwala  kamera 
na  bezpośrednie  pomiary  czasów  dłuższych  niż  100  ps.  optyczno  - 
W ostatnich  latach  skonstruowano  specjalne  kamery  -elektro- 
optyczno-elektroniczne  (tzw.  streak  ca  me  ras)  pozwą-  niczna 
łające  na  bezpośredni  pomiar  czasów  rzędu  1 ps.  Są 
to  złożone  układy,  które  w dalszym  ciągu  są  przedmio- 
tem licznych  badań.  Rysunek  9 ilustruje  schemat 

kamera 


Rys.  9.  Schemat  ilustrujący  zasadę  działania  ultraszybkiej  kamery 
optyczno-elektroniczncj 


działania  tego  rodzaju  kamery.  Impuls  dzieli  się  na 
dwa,  z których  pierwszy  po  przejściu  przez  szczelinę 
i soczewkę  pada  na  specjalną  fotokatodę,  a drugi  — 
po  zogniskowaniu  — służy  do  włączenia  na  elektro- 
dach napięcia,  które  po  włączeniu  rośnie  w zadany 
sposób.  Elektrony  wyrzucone  z fotokatody  są  od- 
chylane proporcjonalnie  do  wielkości  napięcia,  tak  że 
wybite  w różnych  czasach  padają  w różnych  miej- 
scach ekranu  fosforyzującego.  Fotografia  ekranu 
pozwala  określić  przebieg  czasowy  impulsu  padające- 
go na  fotokatodę. 


impuls  zwierciadło 


Rys.  10.  Schemat  ilustrujący  zasadę  pomiaru  czasu  trwania 
ultrakrótkich  impulsów 


Omówimy  oryginalny,  obecnie  najbardziej  po- 
wszechny sposób  pomiaru,  w którym  wykorzystuje  się 
nieliniowe  zjawisko  fluorescencji  dwufotonowej.  Na 
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natężenie  / 


wykcrzy-  rys.  10  pokazano  schemat  typowego  układu  doświad- 
stanie  czalnego.  Ultrakrótki  impuls  dzieli  się  na  dwa  o jedna- 
fluorescewcji  kowych  natężeniach,  które  następnie  interferują  prze- 
dwu-  chodząc  przez  naczynie  zawierające  odpowiednią 
fotonowej,  ciecz  fluorescencyjną.  Najniższy  stan  wzbudzony  mo- 
lekuł cieczy  odpowiada  energii  wzbudzenia  równej 
energii  dwu  kwantów  światła.  Wzbudzenie  cieczy  do 
świecenia  może  więc  nastąpić  wówczas,  gdy  natężenie 
światła  jest  dostatecznie  duże  (przejścia  wielofotono- 
we,  ->  Optyka  nieliniowa).  W obszarze,  gdzie  się 
spotykają  dwa  impulsy,  wypadkowe  natężenie  jest 
większe  i ciecz  świeci  znacznie  silniej.  Świecącą  ciecz 
fotografuje  się  kamerą  o dużej  zdolności  rozdzielcze 
i na  podstawie  otrzymanego  rozkładu  natężenia 
określa  się  szerokość  impulsu.  Dokładne  wyznaczenie 
szerokości  nie  jest  rzeczą  łatwą  (rys.  11);  ocena  szero- 


A 


Rys.  II.  Rozkład  natężenia  światła  fluorescencji  wzbudzanej 
światłem  o różnym  natężeniu  I w funkcji  położenia  z 


warunków  fizycznych,  w jakich  się  znajdują.  W przy- 
padku gazów  i cieczy  zderzenia  atomów  i cząsteczek 
mogą  prowadzić  do  takich  odkształceń  ich  powłok 
elektronowych,  że  te  atomy  i cząsteczki  pozostają 
we  wzbudzonych  stanach  o wyższej  energii  i mogą 
z kolei  przekazywać  innym  energię  wzbudzenia. 
W ciałach  stałych  ruch  drgający  atomów  lub  cząste- 
czek tworzących  sieć  krystaliczną  może  być  bardzo 
złożony  i niezwykle  szybki.  Śledzenie  i badanie  tego 
rodzaju  zjawisk  wymaga  odpowiedniego  zegara,  któ- 
rego skala  pozwoli  mierzyć  odstępy  czasu  rzędu  piko- 
sekund.  Ultrakrótkie  impulsy  o czasach  trwania  rzędu 
nanosekund  pozwoliły  zbadać  przebieg  wielu  zjawisk 

0 takich  właśnie  czasach  trwania.  Teraz  jednak  w cen- 
trum zainteresowań  są  przebiegi  zjawisk  o pikosekun- 
dowych  skalach  czasu.  Przykładem  jest  świecenie 
fluorescencyjne  o bardzo  krótkim  czasie  trwania,  np. 
materiał  pobudzony  do  świecenia  może  świecić  przez 
okres  10“ 8 s i krócej.  Dotychczasowe,  istniejące  od 
wielu  lat  odpowiednio  szybkie  migawki  i układy  elek- 
troniczne pozwalały  na  badanie  świecenia  o czasach 
trwania  nie  krótszych  niż  10“ 9 s. 

Pole  elektryczne  impulsu  laserowego  rozchodzą- 
cego się  w cieczy  może  tworzyć  w cieczy  krótkotrwałą 
dwójłomność.  Mówiąc  inaczej,  ciecz  nie  mająca  wła- 
sności kryształu  anizotropowego  staje  się  dwójłomna 
w obszarze,  przez  który  przechodzi  fala  świetlna, 

1 może  polaryzować  światło  podobnie  jak  kryształ. 
Na  rys.  12  schematycznie  pokazano,  jak  molekuły 
cieczy  reorientują  się  w polu  fali  świetlnej,  co  zwykle 
prowadzi  do  wzrostu  współczynnika  załamania  w ob- 
szarze fali.  Ponieważ  czas  powrotu  do  stanu  równowa- 
gi (czas  relaksacji)  dla  wielu  cieczy  jest  rzędu  kilku 
pikosekund,  okres  istnienia  obszaru  dwójłomnego,  wy- 
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kości  wiąże  się  istotnie  z pomiarami  kontrastu  (tzn. 
stosunku  różnicy  maksymalnego  i minimalnego  natę- 
żenia świecenia  fluorescencji  do  natężenia  minimalne- 
go). Najmniejsza  wartość  natężenia  świecenia  zależy 
od  tła  (szumu),  na  jaki  nałożony  jest  impuls,  którego 
szerokość  chcemy  mierzyć.  We  wszystkich  wypadkach 
zachodzi  r = yt1/2,  tzn.  czas  trwania  impulsu  jest 
wprost  proporcjonalny  do  połówkowej  szerokości 
(mierzonej  na  połowie  wysokości  maksymalnego  natę- 
żenia) linii  fluorescencyjnej  zarejestrowanej  na  kliszy 
fotograficznej.  Współczynnik  proporcjonalności  za- 
leży od  kształtu  impulsu  (zwykle  y — 1,5)  i nie  może 
być  wyznaczony  przy  użyciu  omawianej  techniki. 


Zastosowanie  ultrakrótkich 
impulsów 


Tak  jak  zmienia  się  sposoby  wytwarzania  i detekcji, 
tak  też  stale  rozszerza  się  zakres  stosowania  ultra- 
krótkich impulsów.  Omówimy  tutaj  jedynie  te  zasto- 
sowania, które  mają  lub  mogą  mieć  szczególne  zna- 
czenie dla  badań  fizycznych.  Przede  wszystkim 
zwrócimy  uwagę  Czytelnika  na  fakt,  że  w ośrodkach 
materialnych  każdego  rodzaju,  a więc  w gazach,  cie- 
czach i ciałach  stałych  zachodzą  procesy,  których 
czas  trwania  lub  częstotliwości  ich  występowania  są 
rzędu  kilku  do  kilkudziesięciu  pikosekund.  Atomy 
i cząsteczki  pozostają  bowiem  w ciągłym  ruchu,  któ- 
rego charakter  i rodzaj  zależy  od  ich  budowy  oraz 
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Rys.  12.  Pole  elektryczne  impulsu  orientuje  molekuły  tak,  że 
wytwarza  się  krótkotrwała  dwójłomność 

optyczna  komórka  Kerra 


zwierciadło  badana  próbka 


analizator 


polaryzator 


kryształ 
impuls  światła  nieliniowy 
podczerwonego 

Rys.  13.  Schemat  wykorzystania  ultrakrótkiej  migawki  do  ba- 
dania świecenia  fluorescencji 
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tworzonego  impulsem  pikosekundowym,  mierzy  się 
czasem  kilku  pikosekund.  Naczynie  z cieczą,  w której 
dwójłomność  jest  wymuszona  przez  silnie  pole 
elektryczne  impulsu  świetlnego,  nazywa  się  optycz- 
ną komórką  Kerra.  Została  ona  wykorzystana  przy 
konstrukcji  ultraszybkiej  migawki,  której  czas  prze- 
puszczania światła  wynosi  około  8 ps.  Tak  szybkie 
zadziałanie  nie  byłoby  możliwe  przy  użyciu  zwykłej 
komórki  Kerra. 

Ultraszybkie  migawki  wykorzystuje  się  np.  do  ba- 
dań krótkich  czasów  świecenia  fluorescencyjnego.  W 
tym  doświadczeniu  (rys.  13)  ultrakrótki  impuls  światła 
podczerwonego  o długości  fali  10,6  pm,  pochodzący 
z lasera  neodymowego,  pada  na  kryształ  nieliniowy 
(np.  KDP),  który  daje  drugą  harmoniczną,  tzn.  po 
przejściu  impulsu  przez  kryształ  pojawia  się  dodatko- 
wo impuls  światła  zielonego  o długości  fali  5,3  pm. 
Odpowiednie  zwierciadło  z filtrem  (opuszczone  na 
rysunku)  przepuszcza  impuls  światła  podczerwonego, 
który  padając  na  naczynie  z dwusiarczkiem  węgla 
(optyczna  komórka  Kerra)  wymusza  dwójłomność 
cieczy  na  czas  8 ps.  Impuls  światła  zielonego  wzbudza 
światło  fluorescencyjne,  które  pada  na  układ  — pola- 
ryzator,  optyczna  komórka  Kerra,  analizator.  Pola- 
ryzator  i analizator  są  ustawione  prostopadle,  tak  że 
gdy  ciecz  nie  jest  dwójłomna,  światło  nie  przechodzi 
do  fotodetektora.  Gdy  impuls  promieniowania  pod- 
czerwonego wymusi  na  krótki  czas  dwójłomność,  kie- 
runek liniowej  polaryzacji  świecenia  fluorescencyjne- 
go ulega  zmianie  i światło  przechodzi  przez  analiza- 
tor do  fotodetektora.  Zmieniając  drogę  optyczną  im- 
pulsu podczerwonego  (przez  przesuwanie  pryzmatu) 
można  otwierać  migawkę  na  8 ps  wcześniej  lub  póź- 
niej, co  pozwala  badać  różne  odcinki  czasów  świece- 
nia fluorescencji  trwających  kilkadziesiąt  pikosekund 
i określać  krzywą  spadku  natężenia.  W ten  sposób 
zbadano  przebieg  świecenia  różnych  związków  orga- 
nicznych i dzięki  temu  określono  podstawowe  właści- 
wości ruchów  oscylacyjno-rotacyjnych  cząsteczek. 

Tego  rodzaju  badania  mają  duże  znaczenie  dla  wie- 
lu zjawisk  fotochemicznych  i biofizycznych,  w których 
światło  inicjuje  bardzo  szybkie  procesy.  Z podobnych 
względów  stosuje  się  także  wzbudzenia  pikosekun- 
dowe  do  badania  drgań  atomów  sieci  krystalicznej  cia- 
ła stałego.  We  wszystkich  tego  rodzaju  eksperymen- 
tach nowe  możliwości  przyniosły  lasery  barwnikowe, 
które  działając  w odpowiednim  układzie  z synchro- 
nizowanymi modami  mogą  być  źródłem  impulsów 
pikosekundowych  o różnych  długościach  fali.  Przy 
tym  mogą  one  być  przestrajane  na  różne  długości  fal 
w sposób  ciągły.  Taka  technika  jest  znacznie  efek- 
tywniejsza (a  nawet  czasami  niezastąpiona)  od  otrzy- 
mywania fa!  o różnych  długościach  za  pośrednictwem 
zjawisk  nieliniowych,  jak  to  już  omawialiśmy  na 
przykładzie  wytwarzania  światła  o barwie  zielonej. 
W rezultacie  wzbudzanie  impulsami  pikosekundo- 
wymi  (również  laserem  pracującym  w sposób  ciągły) 
może  być  bardzo  selektywne.  Oznacza  to,  że  w ukła- 
dach atomowych  i cząsteczkowych  można  badać 
przejścia  między  jakimiś  dwoma  dowolnie  wybranymi 
poziomami  energetycznymi  naświetlając  światłem, 
którego  fotony  mają  energię  dokładnie  równą  róż- 
nicy energii  tych  poziomów.  Stwarza  to  zupełnie  nowe 
możliwości  i wytycza  kierunek  rozwoju  współczesnej 
spektroskopii  optycznej. 

Ultraszybką  migawkę,  wyżej  omówioną,  zastoso- 
wano również  w oryginalnym  doświadczeniu,  w któ- 
rym sfotografowano  impuls  światła.  Rysunek  14  u- 
kazuje  schemat  doświadczenia.  Rysunek  15  ilustruje 
wersję  eksperymentu,  w której  w naczyniu  z cieczą 
fluorescencyjną  poruszają  się  prostopadłe  do  linii 
celowania  obiektywu  dwa  impulsy  pikosekundowe, 
jeden  obok  drugiego.  Gdyby  migawka  została  otwar- 
ta na  okres  dłuższy  niż  8 ps,  zdjęcie  pokazałoby  ciągłą 
linię  świecenia  cieczy.  Otwarcie  na  krótki  czas  po- 
zwala jednak  uchwycić  impuls  w locie.  Aby  stało  się 
to  w odpowiednim  momencie,  zarówno  impulsy  fo- 
tografowane, jak  i impuls  otwierający  migawkę  po- 


chodzący z tego  samego  lasera,  są  przez  odpowiedni 
układ  optyczny  przesuwane  w czasie  względem  siebie. 
W pierwszej  chwili  oglądania  zdjęcia  zadziwia  fakt. 


Rys.  14.  Schemat  układu  do  fotografowania  ultrakrótkiego 
impulsu 


Rys.  15.  Dwa  ultrakrótkie  impulsy  tworzą  obiekt  relatywistyczny; 
a)  oba  impulsy  znajdują  się  na  osi  optycznej  układu ; b)  otrzymane 
zdjęcie 


że  klisza  rejestruje  dwa  impulsy,  mimo  że  wzdłuż  linii 
celowania  „widoczny”  powinien  być  tylko  jeden, 
a drugi  — zasłonięty.  Związane  to  jest  z tym,  że  pręd- 
kość światła  jest  skończona  i do  obiektywu  oraz  na 
kliszę  fotograficzną  dochodzi  jednocześnie  światło 
rozproszone  w cieczy  przez  impuls  pierwszy  i drugi. 

Mówiąc  inaczej,  krótkotrwałe  otwarcie  migawki 
wpuszcza  fotony  pochodzące  od  impulsu  pierwszego 
(w  tym  momencie  nie  jest  już  on  na  osi  optycznej 
obiektywu!)  oraz  fotony  pochodzące  od  impulsu 
drugiego  wysłane  wcześniej,  gdy  nie  był  on  jeszcze 
na  osi  optycznej.  Rejestrowane  na  kliszy  fotony  po- 
chodzące od  pierwszego  i drugiego  impulsu  docierają 
do  niej  jednocześnie  i określają  różne  położenia  źró- 
deł, z których  zostały  wysłane.  Jest  to  prosty  i znako- 
micie ilustrujący  przykład,  że  obserwacja  (fotografia) 
obiektów  poruszających  się  z prędkościami  relaty- 
wistycznymi, tzn.  z prędkościami  bliskimi  lub  równy- 
mi prędkości  światła,  daje  obrazy,  których  kształt 
można  wyjaśnić  tylko  z uwzględnieniem  skończonej 
prędkości  światła.  W omawianym  przykładzie  obiek- 
tem takim  jest  układ  dwóch  impulsów.  Poruszony 
tutaj  problem  został  opracowany  i wyjaśniony  z teo- 
retycznego punktu  widzenia  dużo  wcześniej. 

Innym  ważnym  zjawiskiem,  obok  dwójłomności 
cieczy,  które  może  być  wywołane  silnym  polem  elek- 
trycznym impulsu,  jest  jego  samoogniskowanie.  Zmia- 
na współczynnika  załamania  w obszarze  impulsu  po- 
woduje, że  impuls  rozchodzi  się  w ośrodku  niejedno-  samoognis- 
rodnym,  co  zmienia  jego  kształt  tak,  jak  uczyniłaby  kowanie 
to  soczewka  skupiająca.  Jest  to  w ogólności  złożony  impulsu 
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problem,  dotyczący  również  poprzecznego  kształtu 
impulsu,  którego  tutaj  zupełnie  nie  poruszamy. 

Powiemy  teraz  krótko  o możliwości  zastosowa- 
nia ultrakrótkich  impulsów  do  celów  mikrosyntezy 
jądrowej  (-*  Energia  termojądrowa).  Badania  te  pod- 
jęte w wielu  krajach  — również  i w Polsce  — mają 
mik  rosy  nteza  na  celu  wykorzystanie  dużej  gęstości  energii  impulsu 
jądrowa  lasęrowego  do  wytworzenia  stanu  materii  o bardzo 
wysokiej  gęstości  i temperaturze,  w której  możliwa 
jest  reakcja  syntezy  jąder  lekkich.  Fakt,  że  pojawiło 
się  tego  rodzaju  nowe  podejście  do  problemu  reakcji 
termojądrowych  i że  jest  ono  przedmiotem  badań 
jako  jedno  z możliwych  praktycznych  rozwiązań, 
wynika  z postępu  w wytwarzaniu  i pomiarach  ultra- 
krótkich impulsów  laserowych.  Zasadnicza  idea  jed- 
nego z takich  rozwiązań  polega  na  tym,  że  kropla 
mieszaniny  deuteru  i trytu  zostaje  z wielu  stron  rów- 
nomiernie oświetlona  wysokoenergetycznymi  impul- 
sami laserowymi.  Odrzucenie  zewnętrznej  części  kulki 
(szybkie  wyparowanie)  prowadzi  do  ściśnięcia  reszty 
i wytworzenia  dużej  gęstości,  co  powinno  istotnie  po- 
prawić wydajność  reakcji  termojądrowej.  Z punktu 
widzenia  techniki  ultrakrótkich  impulsów  nie  jest 
najważniejszą  sprawą  ich  bardzo  krótki  C2as  trwania, 
lecz  odpowiedni  profil,  tzn.  specjalny  dobór  krzywej 
wzrostu  i zaniku  natężenia  w czasie.  Również  nie- 
zbędna jest  duża  energia  impulsu.  Pierwsze  impulsy 
nanosekundowe  niosły  energię  rzędu  0,1  J,  obecnie 
takie  impulsy  mogą  nieść  energię  10000  J,  a prowadzi 
się  prace  nad  dalszym  jej  powiększeniem.  W gorącej 
plazmie,  w której  zachodzą  reakcje  termojądrowe, 
ma  się  do  czynienia  z wieloma  bardzo  złożonymi  pro- 
cesami. Informacje  o nich  można  otrzymać  śledząc 
szybko  ich  przebieg.  Tu  również  znajdują  zastoso- 
wanie techniki,  w których  wykorzystuje  się  impulsy 
pikosekunaowe. 

Kończąc  omawianie  zastosowania  ultrakrótkich 


Holografia 

Romuald  Pa  w tuczy  k 

Oko  ludzkie  oraz  wszystkie  przyrządy  służące  do  za- 
pisu obrazów  świetlnych  mogą  rejestrować  tylko 
przedmioty  składające  się  z takich  ośrodków  mate- 
rialnych, które  zaburzają  padające  na  nie  fale  świetlne 
(lub  same  je  emitują)  w sposób  wyróżniający  je  z oto- 
czenia. Zaburzone  lub  wysyłane  przez  przedmiot  pro- 
mieniowanie rozchodzi  się  w określonych  kierun- 
kach, ma  określony  skład  widmowy,  a składowe  fale 
mają  określoną  polaryzację,  amplitudę  i fazę.  Ogól- 
nie mówiąc  — stan  fizyczny  światła  pochodzącego 
od  poszczególnych  fragmentów  przedmiotu  jest  róż- 
ny, wskutek  czego  w przestrzeni  powstają  różnice 
w rozkładzie  natężenia  i składu  widmowego  (barwy) 
światła. 

przedmiot  Jeżeli  ten  rozkład  zostanie  odwzorowany  za  pomo- 
i jego  obraz  c3  układu  optycznego,  to  otrzymany  obraz  może  być 
utrwalony  na  powierzchni  odpowiedniego  materiału 
światłoczułego  (fotografia)  lub  odebrany  przez  od- 
powiedni układ  odbiorczy  (nerw  oczny  w oku,  układ 
elektroniczny  w kamerze  telewizyjnej  itp.).  W każdym 
wypadku  odbiornik  uzyskuje  jednak  tylko  tę  infor- 
mację o przedmiocie,  która  się  przejawia  w rozkładzie 
natężenia  (odbiorniki  typu  czarno-białego  lub  jasno- 
ciemnego)  oraz  barwy  (odbiorniki  do  odbioru  barw- 
nego), natomiast  zostaje  zatracona  informacja  zwią- 
zana z zaburzeniem  fazy  oraz  stanu  polaryzacji  fali 
świetlnej.  Utrata  informacji  o fazie  ma  szczególnie 
istotne  znaczenie,  gdyż  z tym  wiąże  się  utrata  infor- 
macji o sposobie  zaburzenia  fazy  fali  świetlnej  przez 
przedmiot,  a co  za  tym  idzie  — zatraceniu  ulega  trój- 
wymiarowość ze  wszystkimi  jej  atrybutami:  głębią, 
perspektywą  i paralaksą.  Zapisany  w ten  sposób 
obraz  nie  jest  pod  względem  optycznym  równoważny 
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impulsów,  wspomnijmy  jeszcze  o możliwości  wyko-  pompowanie 
rzystania  ich  do  pompowania  układów  atomowych,  w zakresie 
które  byłyby  źródłem  promieniowania  spójnego  w za-  nadfioletu  i 
kresie  dalekiego  nadfioletu  i rentgenowskim.  Problem  renfgeno- 
ten  jest  przedmiotem  bardzo  intensywnych  badań  wskim 
w wielu  ośrodkach  naukowych.  Innym  przykładem 
poszukiwania  zastosowań  jest  możliwość  wykorzy- 
stania impulsu  pikosekundowego  w przełączniku 
optoelektrycznym.  Urządzenie  to  może  włączyć 
układ  elektroniczny  na  czas  kilku  pikosekund,  jak  też 
służyć  tylko  do  ultraszybkiego  włączania  lub  wyłą- 
czania. 

Liczne  i różnorodne  zastosowania  laserów  bardzo 
często  wykorzystują  impulsową  pracę  lasera,  a więc 
krótkie  impulsy  światła.  Ograniczyliśmy  się  do  tych 
aktualnych  problemów  i osiągnięć  dotyczących  im- 
pulsów światła,  których  dalszy  rozwój  z pewnością 
odegra  ważną  rolę  w fizyce  molekularnej,  fizyce  plaz- 
my i fizyce  ciała  stałego.  Szczególną  uwagę  poświęci- 
liśmy impulsom  pikosekundowym.  Wiadomo  już,  że 
techniką  synchronizacji  modo  w uzyskano  impulsy 
o czasach  trwania  krótszych  niż  1 ps.  Ten  zakres  nie 
jest  jednak  w pełni  opanowany.  Z uwagą  więc  śledzi 
się  prace  teoretyczne  i doświadczalne  przewidujące 
uzyskiwanie  impulsów  o czasach  krótszych  niż  1 ps, 
z wykorzystaniem  wymuszonych  zjawisk  rozpraszania 
światła.  Technika  ta  jest  dopiero  w początkowym 
stadium  badań.  Bez  wątpienia  opanowanie  i wykorzy- 
stanie światła  w formie  krótkich  i ultrakrótkich  im- 
pulsów należy  do  jednej  z najciekawszych  i aktualnie 
rozwijanych  technik  laserowych  i ma  duże  znaczenie 
dla  różnych  badań  naukowych. 

R.  R.  Alfano,  S.  L.  Shaplro  Ultrafast  Phcnomcna  in  Liąuids 
and  Solids , Scientific  Amer.,  228,  No.  6,  42  (1973);  M.A.  Duguay 
Light  Photographed  injiight,  Am.  Scientist  59,  551  (1971);  A.  Pie- 
kar a Nowe  oblicze  optyki , Warszawa  1976;  S.  Kaliski  Laserowa 
kompresja  i synteza  termojądrowa  plazmy , Delta  nr  3,  1975;  H. 

Klejman  Lasery , Warszawa  1979. 


z przedmiotem,  gdyż  fale  świetlne  ukształtowane 
przez  obraz  na  ogół  całkowicie  różnią  się  pod  wzglę- 
dem rozkładu  fazy  od  fal  świetlnych  ukształtowanych 
przez  przedmiot  (wynika  to  ściśle  z dyfrakcyjnej 
teorii  odwzorowania  optycznego). 

Aby  więc  odtworzony  obraz  był  optycznie  równo- 
ważny z rejestrowanym  przedmiotem,  oprócz  rozkła- 
du amplitudy  (natężenia)  i barwy  powinien  być  zareje- 
strowany, a następnie  odtworzony  rozkład  fazy  ukształ- 
towanych przez  przedmiot  fal  świetlnych.  Warunek 
ten  spełniają  metody  holograficzne  (grecki  wyraz  hoiographćd 
holographeó  znaczy  pisać  w całości,  nie  skracając). 


Fizyczne  podstawy  holografii 


Dyfrakcyjna  teoria  odwzorowania  optycznego 

Powstanie  holografii  jest  konsekwencją  rozwoju  dy- 
frakcyjnej teorii  odwzorowania  optycznego,  stwo- 
rzonej w zeszłym  stuleciu  przez  E.  Abbego  w celu 
wyjaśnienia  zasad  działania  mikroskopu.  Teoria  ta 
okazała  się  bardziej  uniwersalna  i tłumaczy  również 
działanie  wszystkich  innych  układów,  w których  na- 
stępuje odwzorowanie  przedmiotu  za  pomocą  pól 
falowych  (np.  fal  dźwiękowych,  radiowych,  rentge- 
nowskich czy  fal  przedstawiających  rozchodzenie  się 
cząsteczek  materii  — elektronów,  protonów  itp.). 

Rozpatrzmy  z punktu  widzenia  tej  teorii  najpro- 
stszy przypadek  odwzorowania  optycznego  — od- 
wzorowanie płaskiego  przedmiotu  zaburzającego 


tylko  amplitudę.  Światło  oświetlające  przedmiot  (rys. 
1)  zachowuje  się  tak,  jak  gdyby  przedmiot  składał  się 
z dużej  liczby  nałożonych  na  siebie  siatek  dyfrakcyj- 


ugięcie 

światła 


Rys.  1.  Ugięcie  światia  na  przedmiocie.  Fala  oświetlająca  od- 
działuje z przedmiotem  w taki  sposób,  jak  gdyby  składał  się  on 
z siatek  dyfrakcyjnych  o różnych  częstościach,  z których  każda 
ugina  część  światła  w dwóch  kierunkach  (Ł/f  i Ł/f;  V f i Ł/f) 


nych  amplitudowych.  Dla  każdego  przedmiotu  liczba 
składowych  siatek,  kierunek  prążków  w danej  siatce, 
stała  siatki  oraz  maksymalny  i minimalny  stopień  za- 
burzenia amplitudy  padającej  fali  (głębokość  modu- 
lacji) są  w jednoznaczny  sposób  ustalone. 

Na  każdej  siatce  część  padającej  fali  świetlnej  ulega 
ugięciu  w dwóch  kierunkach,  położonych  symetrycz- 
nie względem  padającej  fali  (uwzględniamy  tylko 
ugięcie  I rzędu).  Kierunki  i kąty  ugięcia  ściśle  zależą 
od  orientacji  prążków  i stałej  siatki,  a amplituda  fal 
ugiętych  — od  głębokości  modulacji.  Tak  więc  każda 
siatka  składowa  przedmiotu  jest  reprezentowana 
przez  parę  fal  o określonej  amplitudzie,  ugiętych 
w określonych  kierunkach.  W miarę  oddalania  się  od 
przedmiotu  rozkład  natężenia  światła  wytwarzany 
przez  te  fale  coraz  bardziej  się  różni  od  rozkładu  na- 
tężenia na  powierzchni  przedmiotu.  W płaszczyźnie 
obserwacji  (leżącej  w pewnej  odległości  od  przedmio- 
tu) rozkład  natężenia  może  być  tak  różny  od  rozkładu 
natężenia  na  powierzchni  przedmiotu,  że  na  jego  pod- 
stawie nie  można  rozpoznać  przedmiotu  (można  się 
o tym  przekonać,  wstawiając  bezpośrednio  w to  miej- 
sce płytę  fotograficzną,  która  po  naświetleniu  nie  da 
obrazu).  Niemniej  jednak,  pole  świetlne  w dalszym 
ciągu  zawiera  całkowitą  informację  o przedmiocie. 


Rys.  2.  Otrzymywanie  obrazu  w układach  optycznych.  Po  przej- 
ściu przez  optyczny  układ  skupiający  (soczewkę)  ugięte  na  przed- 
miocie fale  świetlne  ponownie  nakładają  się  na  siebie  w-  płasz- 
czyźnie obrazowej  i interferując  odtwarzają  obrazy  siatek  skła- 
dowych przedmiotu  czyli  dają  jego  obraz 


która  jest  zakodowana  w postaci  par  fal  o określo- 
nych amplitudach,  padających  na  płaszczyznę  ob- 
serwacji z określonych  kierunków  pod  określonymi 
kątami.  Informacja  o kierunkach  i kątach  padania 
poszczególnych  fal  zostanie  odwzorowana  na  tej 
płaszczyźnie  jako  odpowiedni  rozkład  fazy  (znaczy 
to,  że  utrata  informacji  o rozkładzie  fazy  w świetle 
ugiętym  jest  równoważna  z utratą  informacji  o okre- 
sach i kierunkach  siatek  tworzących  przedmiot). 

Aby  ze  światła  zaburzonego  przez  przedmiot  można 
było  odzyskać  informację  o tym  przedmiocie  (np. 
obraz  przedmiotu),  rozkład  amplitudy  i fazy  należy 
przetransformować  na  rozkład  natężenia  światła 
taki,  jak  w płaszczyźnie  przedmiotu.  Zadanie  to  speł- 
niają różnorodne  układy  optyczne  (soczewki  aparatu 
fotograficznego,  soczewka  w oku,  a w optyce  elektro- 
nowej — układy  wytwarzające  odpowiednią  konfigu- 
rację pól  elektrycznych  i magnetycznych  — soczewki 
magnetyczne;  rys.  2).  Układy  takie  odtwarzają  wier- 
nie tylko  obrazy  przedmiotów  płaskich,  natomiast 
deformują  przestrzennie  obrazy  przedmiotów  trój- 
wymiarowych. Dostępne  fotodetektory  (np.  płyty 
fotograficzne,  siatkówka  oka  itp.)  nie  mogą  wiernie 
zarejestrować  nawet  tych  zdeformowanych  obrazów. 
Wiernie  rejestrują  one  tylko  te  fragmenty  obrazu, 
które  leżą  dokładnie  na  powierzchni  fotodetektorów, 
pozostałe  zaś  fragmenty  są  rejestrowane  z tym  większą 
utratą  informacji,  im  dalej  się  znajdują  od  powierzchni 
fotodetektora. 

Z powyższych  rozważań  wynika,  że  obrazy  powsta- 
ją w dwóch  etapach:  najpierw  światło  dokonuje  ana- 
lizy przedmiotu  i koduje  informację  o jego  własno- 
ściach optycznych  w postaci  amplitudy  i fazy  zabu- 
rzonego przez  przedmiot  pola  świetlnego,  tzw.  pola 
dyfrakcyjnego  (matematycznie  zjawisko  to  opisuje  się 
za  pomocą  tzw.  transformacji  Fouriera),  a następnie 
układ  optyczny  transformuje  to  pole  w rozkład  natę- 
żenia (dokonuje  syntezy  — matematycznie  odpow  iada 
to  odwrotnej  transformacji  Fouriera),  który  może  już 
być  zarejestrowany  przez  dostępne  fotodetektory 
(— v Optyka  fourierowska). 

Gdyby  istniały  sposoby  zapisu  oraz  odtwarzania 
rozkładu  amplitudy  i fazy  pola  dyfrakcyjnego,  czyli 
gdyby  można  było  oddzielić  proces  syntezy  obrazu  od 
procesu  analizy,  to  przy  zachowaniu  pewnych  wa- 
runków stosowane  w obu  tych  procesach  promienio- 
wanie mogłoby  się  różnić  swymi  własnościami.  Po  raz 
pierwszy  ideę  tę  wysunął  w 1920  r.  polski  fizyk  Mie- 
czysław Wolfke,  który  pragnął  ją  wykorzystać  w mi- 
kroskopii rentgenowskiej  i zaproponował  stosowanie 
promieniowania  rentgenowskiego  w procesie  analizy, 
a światła  widzialnego  w procesie  syntezy.  Idea  ta  była 
później  jeszcze  kilkakrotnie  podejmowana,  jednakże 
nie  znalazła  urzeczywistnienia,  ponieważ  nie  było 
metody  zapisu  rozkładu  fazy  i amplitudy  pola  dy- 
frakcyjnego. Problem  udało  się  rozwiązać  dopiero 
twórcy  holografii,  D.  Gaborowi,  w 1948  r. ; do  zapisu 
rozkładu  fazy  i amplitudy  zaproponował  on  zastoso- 
wanie metody  interferencyjnej. 

Istota  metody  interferencyjnej  polega  na  tym,  że  fala 
o nieznanym  rozkładzie  fazowym  jest  nakładana  na 
spójną  z nią  falę  wzorcową  (rys.  3 Spójność  światła). 
W wyniku  interferencji  obu  fal  tworzy  się  przestrzen- 
ny układ  maksimów  i minimów  natężenia  światła  (pole 
interferencyjne).  Na  płaszczyźnie  przecinającej  pole 
interferencyjne  te  minima  i maksima  tworzą  określoną 
strukturę.  W wypadku  światła  monochromatycznego 
w cienkiej  płycie  fotograficznej  jest  ona  rejestrowana 
jako  układ  naprzemiennych  jasnych  i ciemnych  prąż- 
ków interferencyjnych,  a w grubym  ośrodku  światło- 
czułym — jako  układ  jasnych  i ciemnych  powierzchni. 
Dwa  sąsiednie  prążki  (powierzchnie)  o tym  samym  na- 
tężeniu są  zbiorami  punktów,  w których  różnica  faz 
interferującyh  promieni  różni  się  o 2 n (co  w swobod- 
nej przestrzeni  odpowiada  zmianom  różnicy  dróg 
optycznych  interferujących  promieni  o jedną  długość 
fali  użytego  światła).  Jeżeli  kształt  powierzchni  falo- 
wej jednej  z tych  fal  (fali  odniesienia)  jest  znany,  to 
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na  podstawie  obrazu  prążków  (powierzchni)  można 
wyznaczyć  kształt  powierzchni  falowej  drugiej  fali  — 
fali  badanej. 


rodzina  powierzchni 
interferencyjnych  (przekrój) 


Rys.  3.  Przekrój  powierzchni  interferencyjnych  tworzących  się 
w wyniku  interferencji  światła  spójnego  emitowanego  przez  dwa 
źródła  punktowe 

D.  Gabor  udowodnił,  że  jeżeli  do  pola  interferen- 
cyjnego wprowadzi  się  płaską  płytę  fotograficzną  i za- 
rejestruje na  niej  prążki  interferencyjne,  a taki  obraz 
hologram  interferencyjny  (hologram)  oświetli  się  taką  samą  falą 
jak  fala  odniesienia,  to  w wyniku  ugięcia  na  tym  obra- 
zie powstanie  fala  będąca  jak  gdyby  dalszym  ciągiem 
fali  badanej.  Odkrycie  tego  zjawiska  dało  początek 
holografii. 


Obrazy  holograficzne 

fala  Dalsze  badania  wykazały,  że  do  wiernego  odtworze- 
przed-  nia  fali  badanej  (w  holografii  nazywanej  falą  przed- 
miotowa miotową,  gdyż  zazwyczaj  jest  ona  w jakiś  sposób 
ukształtowana  przez  przedmiot)  fala  wzorcowa,  zwa- 
na w holografii  falą  odniesienia,  nie  musi  mieć  po- 
wierzchni falowej  o znanym  kształcie,  jak  również 
obojętny  jest  kąt  pomiędzy  kierunkami  padania  in- 
terferujących  fal  (rys.  4a).  Obie  fale  (przedmiotowa 
i odniesienia)  interferują  między  sobą,  tworząc  prze- 
strzenny układ  maksimów  i minimów'  pola  interferen- 
cyjnego, zarejestrowanych  w hologramie  w postaci 
prążków  (w  cienkim  ośrodku  światłoczułym)  lub  po- 
wierzchni (w  grubym). 

fala  Aby  z hologramu  uzyskać  wierne  odtworzenie  za- 
odtwarzająca  rejestrowanej  fali  przedmiotowej,  fala  odtwarzająca 
musi  być  wierną  „kopią”  fali  odniesienia,  a więc 
musi  padać  na  hologram  z tej  samej  strony,  z tego 
samego  kierunku  i pod  tym  samym  kątem  co  fala 
odniesienia  w czasie  zapisu  (rys.  4b).  Światło  fali  od- 
twarzającej ulega  częściowemu  ugięciu  na  siatce  two- 
rzącej hologram.  (Jeżeli  grubość  materiału  światło- 
czułego jest  odpowiednio  mała,  porównywalna  z od- 
stępem między  prążkami,  to  jej  wpływ  na  ugięcie 
światła  można  pominąć).  Ugięcie  następuje  w dwóch 
różnych  kierunkach  i za  hologramem  oprócz  wiązki 
nieugiętej  powitają  dwie  fale  ugięte.  Jedna  z nich  jest 
jak  gdyby  dalszym  ciągiem  fali  przedmiotowej  i ob- 
serwator ma  wrażenie,  że  ogląda  rzeczywisty  przed- 
miot przez  okienko  o wymiarach  hologramu.  Roz- 
cinając hologram  na  mniejsze  części,  nie  ogranicza  się 
obraz  wielkości  obrazu  zwanego  pierwotnym,  lecz  tylko 
pierwotny  zmniejsza  się  możliwość  zmian  punktu  obserwacji 
(podobnie  jak  przy  zmniejszaniu  wymiarów'  okienka). 
Zmniejszanie  wymiarów  hologramu  dopóty  nie  wpły- 
wa na  jakość  obrazu,  dopóki  są  one  większe  od  wymia- 
rów źrenicy  oka.  Przy  dalszym  zmniejszaniu  jakość 
obrazu  zaczyna  ulegać  pogorszeniu,  następuje  roz- 
mycie konturów,  a przy  wymiarach  porównywalnych 
z długością  fali  światła  użytego  w procesie  analizy  — 
obraz  całkowicie  znika. 


Druga  fala  ugięta  też  zawiera  informację  o przed- 
miocie, jednakże  w bardzo  złożonej  postaci  i,  na  ogół 
biorąc,  informacji  tej  niemożna  wykorzystać.  Sytuacja 


Rys.  4.  Zapisywanie  hologramu  (a)  i odtwarzanie  w świetle  mo- 
nochromatycznym (b).  Na  hologramie  zapisuje  się  obraz  inter- 
ferencyjny utworzony  w wyniku  interferencji  fali  przedmiotowej 
z falą  odniesienia.  Do  odtwarzania  stosuje  się  falę  identyczną 
z falą  odniesienia.  Jedna  z fal  ugiętych  na  hologramie  jest  „prze- 
dłużeniem** fali  przedmiotowej,  dzięki  czemu  odtwarza  obraz 
przedmiotu.  Wtórna  fala  ugięta  na  ogół  nie  daje  wiernego  obra- 
zu (nieoświetlona  ściana  a sześcianu  nie  jest  rejestrowana  na 
hologramie) 

się  zmienia,  gdy  fale  odniesienia  i odtwarzająca  są 
falami  płaskimi  lub  sferycznymi.  Jeżeli  fala  odniesie- 
nia i fala  odtwarzająca  są  falami  płaskimi,  padającymi 
prostopadle  na  powierzchnię  hologramu,  to  druga 
fala  ugięta  tworzy  również  wiemy  obraz  przedmiotu,  obraz 
zwany  wtórnym.  Fala  ta  (w  odróżnieniu  od  fali  wtórny 
pierwszej,  która  się  zachowuje  tak,  jak  gdyby  się  roz- 
chodziła od  obrazu)  zbiega  się  do  obrazu,  a jej  kieru- 
nek ugięcia  jest  przeciwny  do  kierunku  ugięcia  fali 
pierwotnej,  przy  czym  w tym  wypadku  oba  te  obrazy 
są  zwierciadlanym  odbiciem  jeden  drugiego  względem 
płaszczyzny  hologramu.  Obserwator  oglądający  wtór- 
ny obraz  widzi  go  zawieszonym  w przestrzeni  przed 
hologramem,  przy  czym  ten  obraz  ma  odwróconą 
głębię,  jest  więc  obrazem  pseudoskopow-ym.  Źródłem 
światła  tworzącym  oba  obrazy  jest  hologram,  do  oka 
obserwatora  mogą  więc  docierać  tylko  promienie 
rozchodzące  się  w nieskończonym  ostrosłupie,  które- 
go jeden  z przekrojów  stanowi  hologram,  a wierz- 
chołek — oko.  Z tego  względu  obserwator  będzie 
widział  tylko  te  fragmenty  odtworzonych  obrazów', 
które  się  mieszczą  w objętości  tak  wyznaczonego 
ostrosłupa.  Do  obejrzenia  innych  fragmentów  obrazu 
zarejestrowanego  na  hologramie  należy  zmienić 
punkt  obserwacji. 

Jeżeli  po  wykonaniu  hologramu  nie  został  on  po- 
większony lub  pomniejszony,  a fala  odtwarzająca  jest 
identyczna  z falą  odniesienia,  to  pierwotny  obraz  jest 
wierną  kopią  przedmiotu,  natomiast  obraz  wtórny 
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na  ogół  jest  zniekształcony.  Po  przeskalowaniu  holo- 
gramu (powiększeniu  lub  pomniejszeniu),  po  zmia- 
nach kształtu  powierzchni  falowej  lub  też  długości  fali 
odtwarzającej  zniekształceniu  ulegają  oba  obrazy. 
Odtworzone  obrazy  mogą  być  powiększone  lub  po- 
mniejszone, również  położenie  odtworzonych  obra- 
zów w przestrzeni  może  być  inne  niż  przedmiotu, 
powiększenie  Technicznie  najprostszym  sposobem  uzyskania  po- 
lub większonych  (pomniejszonych)  obrazów  jest  zmiana 
pomniejsze-  krzywizny  powierzchni  falowej  fali  odtwarzającej 
nie  obrazu  w stosunku  do  fali  odniesienia  lub  zmiana  odległości 
źródła  fali  odtwarzającej  od  hologramu.  Jeżeli  po 
wykonaniu  hologram  został  powiększony  (dla  holo- 
gramu pomniejszonego  m jest  ułamkiem),  długość 
fali  odtwarzającej  jest  Xc,  a długość  fali  odniesienia 
i przedmiotowej  — Xo  (wiązki  odniesienia  i odtwa- 
rzania są  falami  kulistymi),  to  słuszne  są  następujące 
relacje  między  współrzędnymi  obrazów  (wskaźniki  /) 
i przedmiotu  (wskaźniki  p)  (rys.  5): 


zv 

Zl  1*  - 

kXc  i 

(f-) 

Zc 

m2X0 

(kXcxp  _ kXcXo  *c 

mX0  zp  mX0  z0  zc 


Dla  współrzędnej  y wzór  jest  taki  sam  jak  dla  współ- 
rzędnej x,  należy  tylko  w miejsce  x wstawić  y. 

Gdy  x <ś  z i y z powiększenie  obrazów  Mi  wyno- 
si: 


1 zp  m2^°  zp  9 

Zo  kXc  Zo 

x0y  y<>>  Zo  — współrzędne  źródła  fali  odniesienia, 
xc>  yCy  ze  — współrzędne  źródła  fali  odtwarzającej. 
Wskaźnik  / i współczynnik  k przybierają  wartość  1 dla 
obrazu  pierwotnego  oraz  —1  dla  obrazu  wtórnego. 


Rys.  5.  Wybór  układu  współrzędnych  do  opisu  współzależności 
między  położeniem  poszczególnych  elementów  układu  hologra- 
ficznego; przy  odtwarzaniu  położenie  środka  układu  współrzęd- 
nych oraz  orientacja  układu  nie  ulegają  zmianom 


Obrazy  holograficzne  otrzymywane 
w świetle  niemonochromatycznym 

Z przedstawionych  wyżej  wzorów  wynika,  że  położe- 
nie odtworzonych  obrazów  oraz  ich  powiększenie 
zależą  od  długości  fali  światła  użytego  do  odtwarza- 
nia. Bardziej  szczegółowe  rozważania  prowadzą  do 
wniosku,  że  obrazy  odpowiadające  różnym  długoś- 
ciom fal  będą  poprzesuwane  względem  siebie,  wsku- 
tek czego  przy  odtwarzaniu  hologramów  światłem 
niemonochromatycznym  nastąpi  tęczowe  rozmycie 
odtworzonych  obrazów.  Rozpoznanie  takich  obra- 
zów jest  trudne,  a przeważnie  wręcz  niemożliwe.  Jeżeli 
natomiast  grubość  stosowanego  materiału  światło- 
czułego będzie  dużo  większa  od  odstępu  między  prąż- 


kami rejestrowanymi  na  płaskim  hologramie,  to  prze-  grubość 
strzenny  układ  maksimów  i minimów  pola  interfe-  materiału 
rencyjnego  zostanie  zapisany  w postaci  przestrzeń-  światło- 
nych  naprzemianległych  jasnych  i ciemnych  po-  czułego 
wierzchni  interferencyjnych.  Wskutek  właściwości 
takiej  przestrzennej  struktury  interferencyjnej  holo- 
gram jest  w stanie  odtworzyć  obraz  tylko  w świetle 
o takiej  długości  fali,  jaka  była  użyta  przy  zapisie,  i to 
pod  warunkiem,  że  fala  odtwarzająca  rozchodzi  się 
z tego  samego  kierunku  co  fala  odniesienia.  Przy 
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Rys.  6.  Wykonywanie  i odtwarzanie  hologramów  rekonstruowa- 
nych w świetle  niemonochromatycznym:  a)  hologram  wykonuje 
się  przy  użyciu  wysokospójnego  światła  laserowego,  b)  odtwo- 
rzenie następuje  w świetle  niemonochromatycznym 


oświetleniu  falą  niemonochromatyczną  taki  holo-  obrazy 
gram  sam  wybiera  z wiązki  świetlnej  światło  o właści-  w świetle 
wej  barwie,  dzięki  temu  można  uzyskać  dobrej  jakości  białym 
obrazy  w białym  świetle  punktowej  żarówki  lub  nawet 
w świetle  słonecznym. 

Barwa  i ostrość  odtworzonego  obrazu  tym  bliższe 
są  oryginalnym,  im  grubszy  ośrodek  jest  stosowany 
do  zapisu  hologramu.  Sposób  wykonywania  takich 
hologramów  został  zaproponowany  po  raz  pierwszy 
w 1962  r.  przez  J.  Denisiuka. 

W celu  zapisania  możliwie  dużej  liczby  powierzchni 
falowych  w metodzie  tej  fala  przedmiotowa  i fala 
odniesienia  padają  na  ośrodek  światłoczuły  z prze- 
ciwnych stron  (rys.  6a).  Przy  odtwarzaniu  obrazów 
(rys.  6b)  na  zarejestrowanych  powierzchniach  inter- 
ferencyjnych następuje  wsteczne  ugięcie  światła,  a fale 
ugięte  na  poszczególnych  powierzchniach  interferu- 
ją  między  sobą,  tworząc  jednobarwny  obraz. 


Otrzymywanie  hologramów 

Na  hologramach  rejestrowanych  w cienkich  ośrod- 
kach światłoczułych  odległość  między  sąsiednimi 
prążkami  zależy  od  kąta  zawartego  między  kierun- 
kami padania  interferujących  fal.  W trójwymiaro- 
wych hologramach  nieprzezroczystych  przedmiotów 
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ta  odległość  waha  się  od  ułamka  do  pojedynczych 
mikrometrów,  a w hologramach  przedmiotów  prze- 
zroczystych może  być  nieco  większa  (kilka  mikro- 
metrów). Aby  taki  obraz  interferencyjny  można  było 
zarejestrować,  materiały  światłoczułe  muszą  mieć 
wysoką  zdolność  rozdzielczą  — minimum  2000  linii 
na  mm  (zwykłe  materiały  fotograficzne  mają  ok.  100 
linii  na  mm).  Po  naświetleniu  i wywołaniu  materiału 
światłoczułego  obraz  interferencyjny  zapisany  w po- 
staci złożonej  siatki  prążków  interferencyjnych  można 
zobaczyć  w dużym  powiększeniu  (il.  143,tabl.  37). 
holografia  Przy  wykonywaniu  hologramów  obraz  interferen- 
w świetle  cyjny  musi  być  stabilny  przez  cały  czas  naświetlania, 
iaserowym  Kontrast  obrazu  zależy  od  spójności  stosowanego 
promieniowania  (— ► Spójność  światła)  oraz  od  stanu 
polaryzacji  interferujących  fal.  Uzyskanie  dostatecz- 
nie spójnego  światła  o odpowiedniej  intensywności 
z termicznych  źródeł  praktycznie  jest  niemożliwe, 
dlatego  to  obecny  rozwój  holografii  nastąpił  dopiero 
po  wynalezieniu  laserów  (— ► Lasery  — podstawy  dzia- 
łania) ; za  prawdziwą  datę  narodzin  holografii  można 
uznać  lata  1962-1964,  kiedy  to  E.  N.  Leith  oraz  J. 
Upatnieks  wspólnie  opublikowali  serię  prac  dotyczą- 
cych holografii  w świetle  laserowym. 

Nawet  z zastosowaniem  laserów  stabilny  obraz 
interferencyjny  można  otrzymać  tylko  wtedy,  gdy 
obie  interferujące  wiązki  pochodzą  z jednego  źródła, 
migawka 


Rys.  7.  Schemat  układu  do  holografowania  przedmiotów  prze- 
zroczystych 


Rys.  8.  Schemat  układu  do  holografowania  przedmiotów  nie- 
przezroczystych 
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a różnica  dróg  optycznych  interferujących  promieni 
(mierzona  od  miejsca,  gdzie  wiązka  została  podzie- 
lona, do  miejsca  ich  interferencji  na  powierzchni  ma- 
teriału światłoczułego)  nie  przekracza  długości  spój- 
ności. Warunki  te  spełniają  układy,  których  schematy 
pokazano  na  rys.  7 i 8. 

Ze  względu  na  dobre  parametry  użytkowe  i sto-  lasery  sto- 
sunkowo niską  cenę  w laboratoriach  holograficznych  sowane  w 
najczęściej  są  używane  lasery  heiowo-neonowe  holografii 
(He-Ne).  Ponadto  stosuje  się  lasery  argonowe,  a także 
impulsowe  lasery  rubinowe  lub  z kryształami  YAG 
w układzie  zwiększającym  spójność  wytwarzanego 
przez  nie  promieniowania  (w  wypadku  lasera  YAG 
promieniowanie  podczerwone  jest  zmieniane  metodą 
podwajania  częstości  na  promieniowanie  widzialne; 

— > Optyka  nieliniowa).  Dla  uzyskania  dobrej  jakości 
hologramów  układ  holograficzny  należy  zabezpieczyć 
przed  drganiami  oraz  przed  wpływem  czynników 
zewnętrznych  (zmiany  temperatury,  ciśnienia  i wil- 
gotności powietrza).  Toteż  badania  holograficzne 
często  prowadzi  się  w przystosowanych  do  tego  celu 
pomieszczeniach.  Elementy  układu  holograficznego 
umieszcza  się  na  masywnych  stołach  w sposób  za- 
pewniający dostateczną  sztywność  całego  układu  (il. 

140,  tabl.  36).  Jeśli  przedmiot  holografowany  jest  ze 
swej  natury  niestabilny  (np.  obiekty  żywe),  stosuje  się 
lasery  inpulsowe  o odpowiednio  krótkim  impulsie 
i dużej  energii. 


Zastosowanie  holografii 

Rejestrując  pełną  informację  amplitudowo-fazową 
pola  świetlnego,  holografia  znacznie  wierniej  od- 
zwierciedla rzeczywistość  niż  dotychczasowe  metody 
zapisu  obrazów.  Wskutek  tego  możliwości  jej  zastoso- 
wań są  również  szersze  niż  metod  tradycyjnych,  co 
już  obecnie  można  zauważyć  w nauce  i technice.  Od- 
twarzanie trójwymiarowości  jest  tak  ważną  cechą 
holografii,  że  niewątpliwie  otworzy  jej  drogę  do  za- 
stosowania również  w życiu  codziennym. 


Interferometria  holograficzna 

Holograficzna  metoda  utrwalania  fazy  fali  świetlnej 
nie  tylko  spowodowała  rozwój  dotychczasowych  me- 
tod badań  interferencyjnych,  ale  i przyczyniła  się  do 
powstania  nowych. 

Zjawisko  interferencji  znajdowało  praktyczne  za- 
stosowanie już  przed  wynalezieniem  holografii,  słu- 
żyło do  precyzyjnych  pomiarów  odległości,  kształtu 
powierzchni  płaskich  lub  sferycznych,  jednorodności  interfero- 
materiałów  optycznych  i wielu  innych.  Istota  trądy-  metria  . 
cyjnych  pomiarów  interferencyjnych  polega  na  tym,  tradycyjna 
że  w odpowiednim  układzie  optyemym  światło  emi- 
towane przez  spójne  źródło  dzieli  się  na  dwie  fale 
o dokładnie  znanym,  zazwyczaj  jednakowym  kształ- 
cie powierzchni  falowej.  Jedna  z tych  fal,  zwana  falą 
przedmiotową,  oddziałuje  z badanym  obiektem,  np. 
niejednorodną  płytą  szklaną  (której  jakość  należy 
sprawdzić),  wskutek  czego  ulega  zaburzeniom.  Fala 
ta  nakłada  się  następnie  z powrotem  na  drugą  (nie- 
zaburzoną)  falę  — falę  wzorcową  (rys.  9),  obie  inter- 
ferują,  a w płaszczyźnie  obserwacji  tworzą  obraz  inter- 
ferencyjny, na  podstawie  którego  można  wyciągnąć 
wnioski  o badanym  obiekcie. 

Ponieważ  w zwykłych  interferometrach  każdą  z fal 
kształtują  inne  elementy  układu  optycznego,  to  aby 
uzyskać  łatwe  w interpretacji  obrazy  interferencyj- 
ne—stosowane  elementy  optyczne  muszą  być 
wykonane  z bardzo  wysoką  precyzją,  co  znacznie 
podnosi  koszty  budowy  interferometrów. 

Przed  wynalezieniem  holografii  można  było  pro- 
wadzić badania  interferometryczne  tylko  przedmio- 
tów umieszczonych  w układzie  optycznym,  co  było 


szczególnie  niedogodne  przy  zjawiskach  zmiennych 
i krótkotrwałych.  Holograficzne  utrwalenie  takich 
zjawisk  pozwala  na  prowadzenie  badań  interfero- 


obserwator  ^ 

Rys.  9.  Schemat  działania  dwu  wiązkowego  holograficznego  in- 
terferometru do  badania  jednorodności  przezroczystych  płyt 


b) 


Rys.  10.  Holograficzne  badania  interferencyjne:  a)  wykonanie 
hologramu  obiektu  badanego,  b)  uzyskanie  interferogramu  ho- 
lograficznego — odtworzona  z hologramu  fala  badana  nakłada 
się  na  niezaburzoną  przez  obiekt  falę  przedmiotową 

metrycznych  w warunkach  i w czasie  dogodnym  dla 
eksperymentatora,  przy  czym  do  badań  można  wyko- 
rzystać dowolny  układ  holograficzny,  umożliwiający 
holografowanie  badanego  obiektu.  Aby  przeprowa- 
dzić badanie  interferometryczne,  należy  po  wykonaniu 
hologramu  (rys.  lOa)  usunąć  z układu  badany  obiekt 
i ustawić  gotowy  hologram  dokładnie  w miejscu,  w 
którym  został  wykonany.  Po  oświetleniu  hologramu 
falą  wzorcową  (wolną  od  przedmiotu  falą  przedmio- 
fala  tową)  i falą  odniesienia  za  hologramem  w kierunku 
wzorcowa  rozchodzenia  się  fali  wzorcowej  będą  się  jednocześnie 
i fala  rozchodziły  dwie  fale  świetlne : fala  wzorcowa  oraz 
badana  odtworzona  z hologramu  fala  zawierająca  informację 


o badanym  obiekcie  — fala  badana  (rys.  lOb).  Inter- 
ferując  między  sobą,  wytworzą  one  obraz  interferen- 
cyjny jak  w normalnym  interferometrze.  Ponieważ 
obie  interferujące  fale  kształtuje  ten  sam  układ  optycz- 
ny, to  z obrazu  interferencyjnego  można  wnioskować 
o własnościach  przedmiotu  (obraz  ten  nie  zależy  od 
kształtu  powierzchni  falowej  fali  wzorcowej).  Dzięki 
temu  w interferometrach  holograficznych  można 
znacznie  obniżyć  wymagania  co  do  jakości  używanych 
elementów  optycznych,  a jedynym  istotnym  warun- 
kiem jest  dokładne  ustawienie  hologramu  w miejscu 
jego  wykonania. 

Przy  badaniu  obiektów  o własnościach  optycznych 
stałych  lub  zmieniających  się  powoli  wygodniej  jest  obiekty  o 
zapisać  na  hologramie  falę  wzorcową,  a przedmiot  własnościach 
wprowadzać  do  układu  na  okres  badań.  Taki  układ  stałych 
jest  ścisłym  analogiem  zwykłego  interferometru  dwu- 
wiązkowego. 

Ponieważ  w omówionych  holograficznych  układach 
interferencyjnych  kształt  fali  wzorcowej  nie  odgrywa 
istotnej  roli,  zatem  na  drodze  tej  fali  może  się  znajdo- 
wać dowolny  element  optyczny  z matówką  włącz- 
nie — ważne  jest  jedynie  to,  aby  się  znajdował  w tym 
samym  miejscu  zarówno  w czasie  zapisu  hologramu, 
jak  i w czasie  badań  interferencyjnych.  Dzięki  temu 
możliwe  jest  prowadzenie  badań  różnych  procesów 
zachodzących  w obszarach  ograniczonych  przezro- 
czystymi nieregularnymi  ściankami  lub  ściankami 
o optycznie  niskiej  jakości  (np.  procesów  cieplnych 
w żarówkach  czy  w wysokociśnieniowych  palnikach 
rtęciowych,  procesów  spalania  paliwa  w specjalnie 
przygotowanych  komorach). 

Badanie  obiektów  o zmieniających  się  własno- 
ściach polega  na  porównywaniu  zapisanego  na  holo-  obiekty  o 
gramie  obrazu  obiektu  w początkowym  stanie  fizycz-  własnościach 
nym  z jego  obrazem  w stanie  zmienionym  przez  przy-  zmiennych 
łożenie  określonego  układu  sił,  zmianę  ciśnienia 
wewnątrz  lub  na  zewnątrz  badanego  obiektu,  zmianę 
jego  temperatury,  wprowadzenie  odkształceń  relaksa- 
cyjnych, zmianę  wilgotności  itp. 

Istnieją  dwie  metody  takich  badań.  W pierwszej, 
tzw.  interferometrii  w czasie  rzeczywistym,  hologram  mter- 
badanego  obiektu,  znajdującego  się  w określonym  sta-  f erometria 
nie  fizycznym,  umieszcza  się  w miejscu,  w którym  zos-  w ©zassę 
tał  wykonany,  i przedmiot  pozostawia  się  w miejscu,  rzeczywistym 
w którym  był  holografowany.  Między  falą  odtworzo- 
ną z hologramu  i falą  ukształtowaną  przez  przedmiot 
występuje  interferencja  i na  podstawie  uzyskanego 
obrazu  interferencyjnego  można  uzyskać  informację 

0 zmianach  własności  optycznych  wewnątrz  obiektu 
(w  badaniach  w świetle  przechodzącym)  lub  zmianach 
jego  powierzchni  (zob.  il.  146,  tabl.  39). 

Dwa  stany  tego  samego  obiektu  w dwóch  różnych 
chwilach  można  także  porównać  dokonując  dwukrot-  interfeero- 
nego  naświetlania  płyty  światłoczułej  w tym  samym  metria  dwu- 
układzie  (interferometria  dwuekspozycyjna).  Jeżeli  ekspozycyjna 
się  taki  hologram  oświetli  falą  odtwarzającą,  zo- 
staną odtworzone  dwie  fale  świetlne,  odpowiadające 
dwóm  różnym  stanom  obiektu.  Fale  te  utworzą  obraz 
interferencyjny  umożliwiający  wykrycie  powstałych 
w obiekcie  zmian.  Gdy  mamy  do  czynienia  z szybko- 
zmiennymi  zjawiskami,  do  uzyskania  dwuekspozy- 
cyjnego  interferogramu  stosuje  się  lasery  impulsowe 
dużej  mocy,  umożliwiające  uzyskanie  dwóch  silnych 
błysków  laserowych  w krótkim  odstępie  czasu. 

Obie  metody  służą  do  porównania  dwóch  stanów 
tego  samego  obiektu,  przy  czym  za  ich  pomocą  można 
wykryć  zmiany  zachodzące  nawet  w wiązkach  ukształ- 
towanych przez  silnie  rozpraszający  obiekt,  czego  nie 
można  byłoby  w ogóle  dokonać  metodami  zwykłej 
interferometrii.  Metody  te,  jako  metody  nie  niszczące 

1 umożliwiające  wykrycie  minimalnych  zmian  poło- 
żenia lub  kształtu  obiektów  rozpraszających  znalazły 
zastosowanie  w różnorodnych  badaniach  własności  badanie 
mechanicznych  materiałów  i elementów.  Metoda  materiałów 
dwuekspozycyjna,  szczególnie  z zastosowaniem  lase- 
rów dwuimpulsowych,  jest  użyteczna  również  w wa- 
runkach przemysłowych.  Metody  interferometrii  ho- 
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lograficznej  są  szeroko  stosowane  w przemyśle  rakie- 
towym, lotniczym,  samochodowym,  energetyce  itd. 
Jako  przykład  można  podać  zastosowanie  holografii 
do  wykrywania  wad  w oponach.  W tym  celu  oponę, 
układ  holograficzny  i hologram  umieszcza  się  wew- 
nątrz komory  podciśnieniowej  (il.  141,  tabl.  37).  Na 
hologramie  są  rejestrowane  dwa  stany  powierzchni 
opony  przy  dwóch  różnych  ciśnieniach  otaczającego 
powietrza.  Miejsca  wadliwe  przejawiają  się  w postaci 
zaburzenia  struktury  powstających  prążków  interfe- 
badanie  rencyjnych.  Ponadto  interferometria  dwuekspozycyj- 
drgań  na  z zastosowaniem  laserów  dwuimpulsowych  (il.  142, 
tabl.  37)  służy  do  badań  deformacji  i drgań  elementów 
maszyn  i urządzeń  w czasie  ich  pracy  (badania  drgań 
poszycia  samolotów  i śmigłowców, karoserii  i silników 
samochodowych,  części  obrabiarek  itd.). 

Do  badania  stacjonarnych  drgań  o niewielkiej  am- 
plitudzie stosuje  się  metodę  badań  z uśrednianiem 
obrazu  w czasie  rejestracji,  zwaną  metodą  uśrednia- 
nia czasowego.  Polega  ona  na  tym,  że  naświetlanie 
hologramu  trwa  dłużej  niż  okres  drgań.  Wówczas  na 
hologramie  rejestrują  się  kolejne  obrazy  przedmiotu 
w każdej  fazie  ruchu.  Przy  odtwarzaniu  interferujące 
fale  tworzą  obraz  uśredniony,  na  którym  węzły  drgań 
przejawiają  się  w postaci  jasnych  obszarów  otoczo- 
nych prążkami  o kontraście  zanikającym  w miarę 
wzrostu  aplitudy  drgań  (il.  144,  tabl.  38).  Do  badania 
drgań  o większej  amplitudzie  (powyżej  kilku  mikro- 
metrów) stosuje  się  impulsową  metodę  dwuekspozy- 
cyjną  lub  holograficzną  metodę  stroboskopową.  Ta 
druga  polega  na  tym,  że  przedmiot  i hologram  są 
oświetlane  za  pomocą  krótkotrwałych  błysków  świetl- 
nych padających  w chwilach,  gdy  się  obiekt  znajduje 
w dwóch  ściśle  określonych  fazach  drgań, 
zastosowanie  Interferometria  holograficzna  znajduje  również 
w KfiSJcro-  zastosowanie  w mikroskopii,  służy  także  do  wyzna- 
sfcopii  czania  kształtu  przedmiotów  oraz  do  zwiększania 
czułości  metod  interferencyjnych  (il.  145,  tabl.  38). 


Optyczne  przetwarzanie  i przechowywanie 
informacji 

Różnica  pomiędzy  układami  elektronicznymi  i op- 
tycznymi sprowadza  się  do  tego,  że  w układach  elek- 
tronicznych informacja  jest  przekazywana  i prze- 
twarzana w postaci  sekwencji  impulsów,  natomiast 
w układach  optycznych  jest  ona  przedstawiana  w po- 
staci dwuwymiarowego  rozkładu  natężenia  światła. 


odfiltrowany 

Rys.  11.  Schemat  układu  optycznego  do  analizy  fourierowskiej 
i filtracji  częstości  przestrzennych.  Soczewka  I dokonuje  trans- 
formacji fourierowskiej  przezrocza  i w płaszczyźnie  fourierowskiej 
tworzy  jego  transformatę,  którą  soczewka  II  przetwarza  na  obraz 
obiektu.  Wstawiając  w płaszczyźnie  fourierowskiej  odpowiednie 
filtry  amplitudowo-fazowe  można  modyfikować  obraz  przed- 
miotu tworzony  przez  soczewkę  // 
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Dzięki  tej  właśnie  różnicy  układ  optyczny  może  jed- 
nocześnie przekazywać  i przetwarzać  dużą  ilość  in- 
formacji, co  gwarantuje  dużą  szybkość  działania. 

Specyfika  pracy  układów  optycznych  czyni  je 
szczególnie  przydatnymi  do  realizacji  działań  typu 
mnożenia  funkcji  przez  siebie  oraz  niektórych  prze- 
kształceń całkowych.  Jako  przykład  można  podać,  że 
zwykła  soczewka  skupiająca  wykonuje  w sposób  na- 
tychmiastowy dość  złożoną  operację  z dziedziny  wyż- 
szej matematyki,  a mianowicie  przekształcenie  Fou- 
riera dowolnej  funkcji  dwóch  zmiennych,  reprezento- 
wanej jako  przepuszczalność  przezrocza  (przezrocze 
osłabia  amplitudę  padającej  fali  świetlnej  w sposób 
proporcjonalny  do  wartości  analizowanej  funkcji 
w danym  punkcie).  Jeżeli  się  takie  przezrocze  ustawi 
w przedniej  płaszczyźnie  ogniskowej  soczewki  sku- 
piającej, to  rozkład  amplitudy  i fazy  światła  w tylnej 
płaszczyźnie  ogniskowej  tej  soczewki  będzie  przedsta- 
wiał transformatę  Fouriera  analizowanej  funkcji. 
Ustawiając  za  tą  płaszczyzną  drugą  soczewkę  tak,  aby 
jej  przednia  płaszczyzna  ogniskowa  pokrywała  się 
z tylną  płaszczyzną  ogniskową  pierwszej  soczewki, 
w tylnej  płaszczyźnie  ogniskowej  drugiej  soczewki 
uzyska  się  obraz  przezrocza  (rys.  11). 

Przez  wstawienie  między  soczewkami  w ich  wspól- 
nej płaszczyźnie  ogniskowej  elementu  optycznego 
zaburzającego  amplitudę  i fazę  przechodzącego  świat- 
ła można  w różny  sposób  wpływać  na  obraz  przedmio- 
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Rys.  12.  Holograficzny  układ  do  szyfrowania  i przetwarzania 
informacji:  a)  zapis  hologramu  przedmiotu  (litera  B)  z rozciągłym 
źródłem  wiązki  odniesienia  (litera  A),  b)  odtwarzanie  hologramu 
z użyciem  również  rozciągłego  źródła  wiązki  odtwarzającej. 
Źródło  wiązki  odniesienia  służącej  do  kodowania  obrazu  po- 
winno mieć  możliwie  duże  wymiary  i możliwie  złożoną  strukturę 
amplitudowo-fazową;  natomiast  do  rozpoznawania  obrazów 
używa  się  jako  przedmiotu — punktowego  źródła  światła,  a wów- 
czas w miejscu  prostego  obrazu  tworzy  się  obraz  będący  funkcją 
korelacji  między  rozciągłymi  źródłami  wiązki  odniesienia  i wiązki 
odtwarzającej 
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Rys.  13.  Pamięć  holograficzna:  a)  zapisywanie  mikrohologramu , 
b)  odtwarzanie  i odczytywanie  informacji 


tu  (np.  polepszyć  jego  ostrość,  usunąć  fragment  obra- 
zu; rys.  11).  Elementy  służące  do  tego  celu  nazywają 
się  filtrami  częstości  przestrzennych.  Wykonanie 
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wyszukiwanie  prac  o określonej  tematyce,  zawierają- 
cych określone  słowa-hasła,  jak  holografia,  lasery  itp.). 

Obecnie  produkowane  materiały  fotograficzne  o 
wysokiej  zdolności  rozdzielczej  umożliwiają  groma- 
dzenie dużej  ilości  informacji  na  małych  powierz- 
chniach (duża  gęstość  zapisu  informacji,  przewyższa- 
jąca wszelkie  inne  znane  sposoby  zapisu  — magne- 
tyczne, elektroniczne  itp.). 

W odróżnieniu  od  innych  metod,  w których  zapis 
informacji  ma  lokalny  charakter,  na  hologramie  in- 
formacja o poszczególnych  fragmentach  obrazu  może 
być  zapisana  na  całej  jego  powierzchni;  wskutek  tego 
lokalne  uszkodzenia  hologramu  nie  powodują  straty 
odpowiedniego  fragmentu  obrazu,  lecz  jedynie  spa- 
dek jego  jasności,  proporcjonalny  do  wielkości  usz- 
kodzonej części,  oraz  zmniejszenie  kontrastu. 

Teoretyczna  analiza  wykazuje,  że  holograficznymi 
metodami  na  płaskich  hologramach  można  rejestro- 
wać informację  z gęstością  ok.  8*10®  bitów/cm2,  a z 
użyciem  hologramów  objętościowych  z gęstością 
1012— 1013  bitów/cm3.  W praktyce  na  cienkich  emul- 
sjach fotograficznych  uzyskuje  się  gęstość  zapisu 
104-105  bitów/  mm2  — przy  zapisie  informacji  w 
układzie  binarnym  (w  postaci  ciemnych  lub  jasnych 
kwadratów)  lub  2000  liter  alfabetu  — przy  hologra- 
ficznej rejestracji  tekstu  drukowanego 

Już  obecnie  zbudowano  kilka  urządzeń  do  magazy- 
nowania informacji  w postaci  mikrohologramów 
z zarejestrowanymi  stronami  tekstu,  obrazami  gra- 
ficznymi lub  stronami  zawierającymi  informację  w 
postaci  binarnej  (rys.  13).  Umożliwiają  one  przedsta- 
wienie zarejestrowanej  informacji  w postaci  wizual- 
nej, a niektóre  z nich  mogą  być  również  podłączone 
do  komputerów  jako  zewnętrzna  pamięć  stała. 


Holografia  w technice  audiowizualnej 


filtry  częs-  amplitudowo-fazowego  filtru  zwykłymi  metodami 
tości  prze-  jest  bardzo  pracochłonne.  W niektórych  wypadkach 
strzennych  takie  filtry  można  łatwo  wykonać  metodami  hologra- 
ficznymi. Taką  metodę  zastosowano  np.  do  wyostrza- 
nia zdjęcia  wirusa  fd,  uzyskanego  za  pomocą  mikro- 
skopu elektronowego;  dzięki  temu  po  raz  pierwszy 
wyraźnie  uwidoczniono  strukturę  heliksu  tego  wiru- 
sa, podobną  do  heliksu  cząsteczki  białka  DNA  (ii.  147, 
tabl.  39). 

Jeżeli  do  zapisu  i odtwarzania  hologramu  zastosu- 
jemy układy  optyczne,  w których  źródło  fali  odniesie- 
nia i źródło  fali  przedmiotowej  mają  złożoną  roz- 
ciągłą strukturę,  to  obraz  holograficzny  otrzymany 
przy  odtwarzaniu  falą  świetlną  różniącą  się  od  fali 
odniesienia  będzie  miał  również  złożoną  strukturę, 
szyfrowanie  Obraz  ten  będzie  czytelny,  jeżeli  fala  odtwarzająca 
informacji!  będzie  identyczna  z falą  odniesienia.  Jeżeli  fala  od- 
niesienia będzie  miała  odpowiednio  złożoną  strukturę 
(np.  źródłem  fali  odniesienia  będzie  oświetlona  raa- 
tówka  o zupełnie  przypadkowej  strukturze),  to  od- 
tworzenie obrazu  będzie  możliwe  tylko  w wypadku 
zastosowania  przy  odtwarzaniu  tej  samej  matówki. 
Z teoretycznego  punktu  widzenia  jest  to  idealny  spo- 
sób szyfrowania  informacji  (rys.  12). 

Ten  sam  układ  może  być  wykorzystany  do  optycz- 
nego porównywania  dwóch  obrazów  mających  okre- 
ślone rozkłady  amplitudy  i fazy.  Jako  przedmiot  sto- 
suje się  wówczas  punktowe  źródło  światła,  a porów- 
nywane przedmioty  odgrywają  rolę  odpowiednio  roz- 
ciągłego źródła  fali  odniesienia  i fali  odtwarzającej. 
Przy  otwarzaniu  punktowy  obraz  otrzymuje  się  tylko 
wtedy,  gdy  oba  przedmioty  mają  identyczną  strukturę 
amplitudowo-fazową.  W przeciwnym  razie  odtworzo- 
pamięC  ny  obraz  ma  kształt  rozmytej  plamki,  a stopień  jej 
holograficzna  rozmycia  może  być  miarą  różnic  w porównywanych 
przedmiotach.  Najbardziej  znane  przykłady  zastoso- 
wania holografii  do  tego  celu  — to  identyfikacja  od- 
cisków palców  czy  analiza  grafologiczna  rękopisów. 
Metoda  ta  może  też  służyć  do  automatycznego  po- 
szukiwania określonych  danych  z dużego  zbioru  (np. 


W przyszłości  holografia  znajdzie  niewątpliwie  za- 
stosowanie w dziedzinie  dydaktyki;  trójwymiarowe 
obrazy  holograficzne  zastąpią  z czasem  inne  pomoce 
naukowe  we  wszystkich  wypadkach,  w których  ważne 
będzie  zachowanie  trójwymiarowości,  a demonstracja 
naturalnych  obiektów  nie  będzie  możliwa,  jak  również 
niemożliwe  będzie  zastąpienie  ich  modelami  (np. 
rzadkie  lub  chronione  okazy  fauny  i flory,  jedyne 
w swoim  rodzaju  okazy  geologiczne  lub  wykopali- 
skowe, niepowtarzalne  dzieła  sztuki,  przedmioty 
historyczne  itp.). 

Zarejestrowane  na  cienkim  materiale  światłoczu- 
łym obrazy  holograficzne  muszą  być  odtwarzane  w 
świetle  monochromatycznym,  toteż  odtworzone  obra- 
zy mają  barwę  światła  odtwarzającego  i nie  odzwier- 
ciedlają barwy  przedmiotu.  Tego  typu  hologramy 
mogą  więc  znaleźć  zastosowanie  wówczas,  gdy  barwa 
obrazu  nie  odgrywa  istotnej  roli,  natomiast  ważne  jest 
zachowanie  trójwymiarowości. 

Dalsze  rozpowszechnienie  holografii  do  celów  de- 
monstracyjnych będzie  zależało  od  możliwości  od- 
tworzenia naturalnej  barwy  przedmiotu.  Sposoby 
uzyskiwania  hologramów  barwnych  przedmiotów 
niesamoświecących  są  już  znane  i sprowadzają  się  do 
wykonywania  hologramu  z użyciem  trójbarwnego 
promienia  laserowego,  natomiast  nie  można  na  razie 
uzyskać  w sposób  bezpośredni  hologramów  przedmio- 
tów samoświecących.  W obu  wypadkach  zagadnienie 
to  jest  bardzo  złożone  i wciąż  pozostaje  do  rozwiąza- 
nia wiele  problemów  technicznych  i technologicz- 
nych. 

Po  rozwiązaniu  wszystkich  tych  trudności,  a zwłasz- 
cza po  opanowaniu  techniki  holografowania  żywych 
obiektów  oraz  technologii  odtwarzania  hologramów 
w świetle  nielaserowym,  można  spodziewać  się  po- 
wstania atelier  holograficznych,  w których  można  bę- 
dzie zamawiać  portrety  holograficzne. 

Ponieważ  metodami  holograficznymi  uzyskuje  się 
z płaskiego  interferencyjnego  obrazu  obraz  trójwy- 
miarowy, zdawałoby  się  rzeczą  naturalną  wykorzy- 
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jcino  stanie  holografii  w kinie  i telewizji.  W tym  jednak 
holograficzne  wypadku  dochodzi  dodatkowy  problem  — utrwale- 
nia ruchu.  Ze  względów  technicznych  wydaje  się  mało 
prawdopodobne,  aby  kiedykolwiek  zrealizowano  kino 
lub  telewizję  trójwymiarową  w postaci  szybko  wy- 
mienianych hologramów  wielkości  ekranu.  W kinie 
holograficznym  badania  zmierzają  obecnie  w dwóch 
kierunkach.  Jeden  ze  sposobów  rozwiązania  tego 
zagadnienia  polega  na  tym,  że  za  pomocą  lasera  im- 
pulsowego o odpowiednio  wysokiej  mocy  i odpowied- 
niej częstości  powtarzania  błysków  na  błonie  filmo- 
wej jest  rejestrowana  sekwencja  hologramów  po- 
mniejszonych trójwymiarowych  obrazów  przedmiotu, 
które  przy  odtwarzaniu  są  ponownie  powiększane 
i za  pomocą  specjalnych  ekranów  (wykonanych  rów- 
nież metodami  holograficznymi)  są  odwzorowywane 
w przestrzeni  przed  widownią. 

Innym  rozwiązaniem  są  kina  stereoskopowe.  Są  w 
nich  wyświetlane  dwa  obrazy  — jeden  odpowiada  le- 
wemu, drugi  prawemu  oku  — kierowane  niezależnie 
do  każdego  oka  za  pomocą  ekranów  holograficznych. 
Ekrany  te,  wykonane  w postaci  grubego  hologramu, 
mają  tę  właściwość,  że  rzutowane  na  nie  obrazy  z pro- 
jektora ustawionego  w określonym  punkcie  prze- 
strzeni są  odbijane  na  widownię  w taki  sposób,  że 
można  je  obserwować  tylko  wówczas,  gdy  oko  widza 
trafi  w jedną  z dużej  liczby  stref,  na  które  podzielona 
jest  widownia.  Naprzemianległe  strefy  różnią  się  tym, 
że  do  jednej  trafia  obraz  wyświetlany  z jednego  pro- 
jektora, do  drugiej  — z drugiego.  Odległość  między 
strefami  jest  dobrana  tak,  że  zawsze  jedno  oko  znaj- 
duje się  w jednej  strefie,  drugie  — w drugiej  (rys.  14). 
Jeżeli  więc  projektory  jednocześnie  wyświetlają  dwa 
obrazy  odpowiadające  punktom  widzenia  poszczegól- 
nych oczu,  to  u widza  powstaje  wrażenie  głębi.  Ekrany 
te  muszą  być  wykonane  z bardzo  wysoką  dokładno- 
ścią, co  przy  dużych  ich  wymiarach  jest  poważną 
przeszkodą;  jednak  z czasem  na  pewno  można  ją 
będzie  przezwyciężyć. 

telewizja  Bezpośrednie  zastosowanie  holografii  do  celów 
holograficzna  telewizyjnych  nie  jest  w chwili  obecnej  możliwe  ze 
względu  na  ograniczoną  przepustowość  kanału  te- 
lewizyjnego; nie  może  on  w standardowym  czasie 
0,04  s przekazać  ilości  informacji  niezbędnej  do  uzy- 
skania hologramu.  1 mm2  dobrego  hologramu  zawiera 
mniej  więcej  tyle  informacji,  co  pełny  obraz  telewi- 
zyjny. Aby  tę  informację  można  było  odczytać,  układ 
analizujący  kamery  powinien  mieć  zdolność  rozdziel- 
czą 10-20  razy  wyższą  od  obecnie  stosowanej,  przy 
czym  analizowana  powierzchnia  powinna  być  równa 
powierzchni  ekranu  telewizyjnego.  Aby  zaś  cały  ten 
obraz  można  było  przekazać  przez  układ  telewizyjny 
w odpowiednim  czasie,  jego  przepustowość  powinna 
być  ok.  105  razy  większa  niż  kanałów  stosowanych 
obecnie.  Następnym  problemem  jest  wytworzenie 

projektor  obrazu 

ekran  dla  prawego  oka 


Rys.  14.  Zasada  kina  stereoskopowego  z ekranem  holograficz- 
nym kierującym  do  odpowiedniego  oka  obrazy  wyświetlane  przez 
oddzielnie  projektory 
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hologramu  w odbiorniku  telewizyjnym  z taką  samą 
zdolnością  rozdzielczą  jak  na  wejściu,  a także  odtwo- 
rzenie obrazu  z przekazanego  hologramu.  Na  razie 
zagadnienia  te  nie  zostały  w zadowalający  sposób 
rozwiązane.  Wydaje  się,  że  jedynym  wyjściem  byłoby 
znalezienie  sposobu  redukcji  przekazywanej  infor- 
macji, tym  bardziej,  że  jak  wykazują  badania  — do 
wywołania  pełnego  wrażenia  głębi  wystarczy  ilość 
informacji  najwyżej  10-15  razy  większa  niż  w zwykłym 
obrazie  telewizyjnym. 


Inne  zastosowania 

Znając  matematyczny  opis  kształtu  przedmiotu,  jego 
położenie  w przestrzeni  oraz  położenie  źródła  oświe- 
tlającego przedmiot  i źródła  fali  odniesienia,  można 
obliczyć  rozkład  natężenia  światła  w płaszczyźnie 
hologramu,  a tym  samym  i jego  -zaczernienia.  Taki 
sam  rozkład  zaczernień  płyty  holograficznej  można 
uzyskać  naświetlając  ją  odpowiednio  punkt  po  punk- 
cie. W ten  sposób  można  uzyskać  hologram  obiektu 
realnie  nie  istniejącego,  co  wykorzystuje  się  do  mo- 
delowania kształtu  nowych  wyrobów  z pominięciem 
procesu  wykonywania  modelu  plastycznego.  Zaletą 
holograficznego  modelu  jest  możliwość  przekształceń 
obrazu  przez  zmianę  geometrii  układu  odtwarzają-  modelowaniij 
cego.  Ta  właściwość  znajduje  praktyczne  zastosowa-  holograficzni 
nie  do  modelowania  w polu  widzenia  pilota  trójwy- 
miarowego obrazu  lądowiska  przy  ślepym  lądowaniu 
samolotu. 

Metody  holograficzne  można  także  stosować  do  pomiar 
pomiaru  kształtu  lub  rozkładów  przestrzennych.  Sto-  kształtu 
sując  lasery  impulsowe,  tą  metodą  można  badać  za- 
chowanie się  różnych  obiektów  w ruchu. 

Kiedy  oświetlimy  hologram  falą'  sprzężoną  do  fali 
odniesienia,  to  w miejscu,  w którym  się  znajdował 
przedmiot,  powstanie  jego  wierny  obraz.  Dokładność 
odwzorowania  i zdolność  rozdzielcza  w tym  obrazie 
będą  tym  większe,  im  dokładniej  fala  odtwarzająca 
będzie  oddawała  kształt  fali  odniesienia  oraz  im  więk- 
sza będzie  powierzchnia  hologramu.  Odtworzony 
w ten  sposób  obraz  można  obserwować  bezpośrednio 
na  matówce  lub  fotografować  bez  stosowania  żad- 
nych elementów  optycznych  (zazwyczaj  obniżających 
jakość  obrazu),  wstawiając  płytę  fotograficzną  w 
miejscu  tworzenia  się  obrazu.  Następnie  na  pod- 
stawie tego  obrazu  można  dokładnie  wyznaczyć 
kształt  obiektu. 

Holograficznie  można  także  z wysoką  zdolnością 
rozdzielczą  rzutować  obrazy.  Zarejestrowany  na  ho- 
logramie obraz  o złożonej  drobnej  strukturze  może 
być  rzutowany  na  dowolną  powierzchnię  przez  oświe- 
tlenie hologramu  falą  odtwarzającą  we  wspomniany 
wyżej  sposób.  Ponieważ  zdolność  rozdzielcza  układu 
optycznego  zależy  od  jego  apertury,  czyli  od  stosunku 
wymiarów  poprzecznych  hologramu  do  jego  odleg- 
łości od  obiektu,  to  można  zapewnić  odwzorowanie  zastosowanie 
z dużą  zdolnością  rozdzielczą.  Z tego  względu  metoda  w mikro- 
ta  może  być  przydatna  w mikroelektronice  — do  na-  elektronice 
noszenia  odpowiednich  obrazów  w trakcie  produkcji 
układów  scalonych.  Dodatkowe  zalety  holografii  po- 
legają na  tym,  że  rzutowanie  odbywa  się  w sposób 
bezdotykowy  i że  małe  uszkodzenia  powierzchni  ho- 
logramu nie  mają  istotnego  wpływu  na  jakość  rzuto- 
wanego obrazu. 

Przytoczone  tu  przykłady  zastosowań  holografii 
obejmują  zaledwie  niewielką  ich  część.  Na  wymie- 
nienie zasługują  jej  zastosowania  w technologii  ele- 
mentów optycznych  (do  wykonywania  siatek  dyfrak- 
cyjnych, elementów  ogniskujących,  elementów  optyki 
zintegrowanej,  odchylaczy  wiązek  świetlnych  itd.), 
w mikroskopii  rentgenowskiej  i elektronowej  (meto- 
dami holograficznymi  udało  się  po  raz  pierwszy 
uzyskać  obraz  powłoki  L atomów  neonu  i argonu),  w 
radiolokacji  (wykorzystanie  holografii  umożliwia 
uzyskanie  na  lecącym  samolocie  obrazów  radiolo- 
kacyjnych o zdolności  rozdzielczej  porównywanej 


z uzyskiwaną  w zdjęciach  lotniczych),  w geofizyce 
(holografia  służy  do  obróbki  sejsmogramów),  w to- 
mografii rentgenowskiej  (do  uzyskania  trójwymiaro- 
wych obrazów)  i w wielu  innych  dziedzinach. 

Przedstawiony,  niezupełny  zresztą,  przegląd  zasto- 
sowań holografii  dobitnie  ukazuje,  jak  stosunkowo 
prosta  idea  wywodząca  się  z podstawowych  teorii 
fizycznych  może  doprowadzić  do  ujawnienia  wielkich 
możliwości  technicznych,  inspiruje  do  szukania  moż- 


liwości praktycznego  jej  zastosowania.  Jednocześnie 
na  przykładzie  holografii  widać,  że  wielu  takich  moż- 
liwości jeszcze  nie  wykorzystano,  że  kryją  je  w sobie 
teorie  fizyczne  na  pozór  całkowicie  poznane  i że  do 
ujawnienia  ich  trzeba  nieco  odmiennego  niż  powszech- 
nie przyjęte  — spojrzenia. 

Ą.  Piekara  Nowe  oblicze  optyki , Warszawa  1976;  H.  Royer,  P. 
Śmigielski,  J.CH.  Vienot  Holografia  optyczna,  Warszawa  1975, 
Holografia,  podstawy  fizyczne,  teoria  i zastosowanie,  pr.  zbioro- 
wa, Warszawa  1979. 


Optyka  fourierowska 

Andrzej  G.  Kalestyński 


Wykorzystanie  światła  jako  nośnika  informacji,  a 
układów  optycznych  jako  urządzeń  służących  do  jej 
przetwarzania  charakteryzowało  optykę  od  samych 
jej  początków.  Postęp  w optyce,  który  nastąpił  w osta- 
tnich latach,  jest  związany  z jednej  strony  z pojawie- 
niem się  źródeł  światła  spójnego  — laserów,  z drugiej 
— z nową  metodą  opisu  zjawisk  zachodzących  w op- 
tycznym torze  przesyłania  informacji,  polegającą  na 
zastosowaniu  języka  zaczerpniętego  z telekomunikacji. 
Należy  jednak  pamiętać,  że  owo  wykorzystanie  pojęć 
i opisu  typowego  dla  kanałów  łączności  nieoptycznej 
stało  się  możliwe  dzięki  poprzednim  pracom  i odkry- 
ciom optyków:  E.  Abbego,  J.  Rayleigha,  A.  Michel- 
sona,  M.  Wolfkego  (profesora  Politechniki  War- 
szawskiej), F.  Zernikego,  A.  Mareshala,  N.  Francona, 
D.  Gabora  i in. 

Dopóki  wierność  odwzorowań  optycznych  oce- 
niano okiem,  nie  było  większej  potrzeby  uściślania 
kryteriów  jakości  obrazów  optycznych.  Dopiero  roz- 
wój telewizji,  radiolokacji  oraz  radioastronomii  skło- 
nił do  spojrzenia  na  proces  tworzenia  obrazów  z pun- 
ktu widzenia  teorii  informacji,  która  się  początkowo 
rozwijała  na  gruncie  badania  kanałów  łączności  nie- 
optycznej. Pojawienie  się  i doskonalenie  laserów, 
wydajnych  źródeł  światła  spójnego,  tych  swoistych 
anten  świetlnych,  otworzyło  wielkie  możliwości  przed 
optycznym  przenoszeniem  i przetwarzaniem  danych 
i ich  zbiorów  (czyli  wiadomości)  przy  użyciu  światła 
jako  nośnika  informacji;  podkreślić  trzeba,  że  w pro- 
światlo  jako  cesie  tym  ważne  jest  nie  tylko  otrzymanie  wiernego 
nośnik  obrazu  (ewentualnie  powiększonego  lub  pomniejszo- 
informacji  nego),  lecz  również  jego  odpowiednie  przekształce- 
nie. W optyce  wiadomość  to  po  prostu  obraz.  Prze- 
noszenie i przetwarzanie  wiadomości  w kanałach 
optycznych  można  opisać  za  pomocą  pojęcia  transfor- 
macji optycznej.  Przejście  od  rozkładu  pola  świetlnego 
przedmiotu  do  rozkładu  pola  świetlnego  w obrazie 
dyfrakcyjnym,  wytworzonym  przez  ten  przedmiot, 
jest  przykładem  transformacji  optycznej  pola  świetl- 
nego, zachodzącej  dzięki  zjawiskom  ugięcia  i inter- 
optyczne  ferencji  światła.  Transformacjom  optycznym  ulega 
przetwarza-  światło  przechodzące  przez  rozmaite  ośrodki  natural- 
nie informacji  ne  lub  elementy  optyczne.  Transformacje  Fouriera 
i Fresnela,  odpowiadające  dwóm  typom  zjawisk  dy- 
frakcyjnych — dyfrakcji  Fraunhofera  i dyfrakcji 
Fresnela,  są  podstawą  opisu  większości  procesów 
wytwarzania  obrazów  w przyrządach  optycznych 
zarówno  tradycyjnych,  jak  i całkiem  nowych,  np. 
w komputerach  optycznych  czy  układach  hologra- 
ficznych. Optyka  fourierowska  opisuje  procesy  prze- 
twarzania sygnałów  optycznych  z punktu  widzenia 
transformacji  Fouriera. 


Transformacja  Fouriera  w optyce 

Istotę  transformacji  Fouriera  można  wytłumaczyć  na 
następującym  przykładzie.  Wyobraźmy  sobie,  że 
punktowe  źródło  światła  monochromatycznego  S 
(rys.  1)  znajduje  się  tak  daleko  („w  nieskończoności”), 
że  falę  świetlną,  która  dociera  do  odcinka  AB  prostej 


prostopadłej  do  kierunku  rozchodzenia  się  światła, 
można  uważać  za  falę  płaską.  Obserwator  dysponu- 
jący metodą  pomiaru  natężenia  światła  (wielkości 
związanej  z jego  energią)  i fazy  (wielkości  związanej 
z drogą,  którą  przebywa  fala  świetlna)  stwierdzi,  że 
obie  te  wielkości  są  jednakowe  wzdłuż  całego  odcinka 
AB.  Załóżmy  następnie,  że  źródło  światła  leży  w punk- 


S'w  00  Sw  00 


cie  S , tak  że  odcinek  AB  leży  pod  kątem  if  do  kierunku 
rozchodzenia  się  światła.  Obserwator  i tym  razem 
stwierdzi,  iż  natężenie  światła  na  prostej  AB  jest  je- 
dnakowe. Okaże  się  jednak,  iż  fazy  wyznaczone  np. 
w punktach  O i O'  będą  różne  z powodu  różnicy  dróg 
optycznych  CO' . Wzdłuż  odcinka  AB  faza  zmienia  się 
periodycznie  z okresem  zależnym  od  kąta 

Rozważaną  sytuację  można  odwrócić  i potraktować 
odcinek  AB  jako  źródło  światła  o jednakowym  natę- 
żeniu i jednakowych  fazach  wzdłuż  całej  długości  od- 
cinka AB.  Można  się  spodziewać,  że  wtedy  światło 
o jednakowej  fazie  będzie  się  rozchodziło  w kierunku 
S.  Natomiast  jeśli  faza  będzie  się  zmieniała  wzdłuż 
AB  w określony  wyżej  sposób,  to  światło  o jednako- 
wej fazie  będzie  się  rozchodziło  w kierunku  S\  a nie  S. 
Zatem  istnieje  związek  między  przestrzennym  roz- 
kładem pola  wzdłuż  odcinka  (współrzędna  x)  a roz- 
kładem kątowym  (współrzędna  #).  Jeden  rozkład  pola 
świetlnego  może  być  przekształcony  w drugi  rozkład 
pola  świetlnego  za  pomocą  przekształcenia  Fouriera 

m£m.  «yii 

co  oznacza,  że  funkcja  F(#)  jest  transformatą  Fouriera 
f{x)  i odwrotnie  — funkcja /(jt)jest  transformatą  funk- 
cji F($),  a 7{}  jest  operatorem  przekształcenia 
Fouriera. 

Podobne  rozumowanie  można  przeprowadzić  w 
przypadku  dwóch  zmiennych,  rozpatrując  zamiast 
odcinka  AB  płaszczyznę  prostopadłą  do  kierunku 
S.  Dochodzi  się  wówczas  do  przekształceń: 

f(x,y)  ?>). 

Wyobraźmy  sobie,  że  znamy  pewne  pole  świetlne 
na  płaszczyźnie  x0 , y0,  czyli  znamy  rozkład  natężenia 
pola  i rozkład  jego  fazy  we  wszystkich  punktach  tej 
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płaszczyzny.  Pytamy,  jakie  będzie  pole  świetlne 
w płaszczyźnie  x , y odległej  od  z od  płaszczyzny  x0y  y0 ? 
Otóż  J.  W.  Rayleigh  zaważył,  że  aby  otrzymać  od- 
powiedź na  to  pytanie,  najlepiej  rozłożyć  wyjściowe 
pole  świetlne  na  nieskończony  zbiór  fal  płaskich  roz- 
biegających  się  pod  różnymi  kątami  # i 9?  (->  Ho- 
lografia). Oznacza  to  dokonanie  transformacji  Fou- 
riera i przejście  w opisie  od  współrzędnych  x0yy0  do 
, , ^ współrzędnych  kątowych  # , (p.  Otrzymuje  się  w ten 

kątowe  -oSa  sposób  tzw.  widmo  kątowe  P($,<p)  pola  świetlnego 
świetlne^  danego  w płaszczyźnie  x0>  7o,  czyli  rozkład  amplitud 
y i faz  płaskich  fal  składowych  w zależności  od  kierun- 
ków ich  rozchodzenia  się  określonych  kątami  #,  <p. 
Rozkład  pola  świetlnego  (natężenia  i fazy)  w płasz- 
czyźnie x,  y odległej  o z od  płaszczyzny  wejściowej 
otrzymuje  się  przez  całkowanie  widma  kątowego  wej- 
ściowego pola  świetlnego  po  współrzędnych  kąto- 
wych. Rozkład  pola  świetlnego  na  zbiór  elementar- 
nych fal  płaskich  przypomina  rozkład  drgań  struny 
o unieruchomionych  końcach  na  drgania  składowa 
o częstościach  równych  wielokrotnościom  częstości 
podstawowej  (częstości  harmoniczne).  Funkcję  opi- 
sującą kształt  struny  w danej  chwili  można  przedsta- 
wić w postaci  sumy  drgań  sinusoidalnych,  zwanej 
szeregiem  Fouriera.  W optyce  zwykle  nie  ma  wyróż- 
nionego dyskretnego  zbioru  fal  składowych,  dlatego 
posługujemy  się  całkami,  a nie  szeregami  Fouriera. 

Zamiast  współrzędnych  kątowych  #,  q>  można 
wprowadzić  zmienne  a>x  = 2ncosd'lXy(oy  = 27ccos<?/2, 

, . gdzie  X — długość  fali  świetlnej.  Zmienne  cox , c% 
często s ci  nazywają  się  częstościami  (częstotliwościami)  prze- 
przestrzenne  strzennymi  i odgrywają  rolę  analogiczną  do  częstości 
czasowej cot,  występującej  m.in.  w radiotechnice.  Wid- 
mo kątowe  wyrażone  w zmiennych  coXy  v>y>  czyli 
jP(cox,  coy)  nazywa  się  widmem  częstościowym  prze- 
strzennym pola  świetlnego.  Do  opisu  barwy  fali 
świetlnej  wystarcza  częstość  czasowa,  natomiast  do 
pełnego  opisu  rozchodzenia  się  w przestrzeni  trój- 
wymiarowej sygnałów  optycznych  trzeba  się  jeszcze 
posłużyć  częstościami  przestrzennymi.  Z tego  już 
widać,  że  układy  optyczne  są  sposobniejsze  do  prze- 
twarzania informacji  niż  układy  elektroniczne.  Nie- 
wielka bowiem  zmiana  barwy  w optyce  odpowiada 
modulacji  częstości  (czasowych)  w elektronice,  ale 
tor  modulacja  częstości  przestrzennych  w optyce  nie  ma 
ODtvcznv  żadnego  odpowiednika  w telekomunikacji  nieoptycz- 
^ ^ v nej.  Tor  optyczny  jest  układem  optycznym  składają- 
cym się  z filtrów  częstości  przestrzennych  i modula- 
torów, którymi  są  np. : przestrzeń  swobodna,  soczewki 
sferyczne,  cylindryczne  czy  stożkowe,  siatki  dyfrak- 
cyjne różnych  typów  oraz  najrozmaitsze  przesłony 
umieszczane  w różnych  płaszczyznach  optycznych. 
W torze  (układzie)  optycznym  można  zawsze  rozróż- 
nić wejście  i wyjście,  tzn.  miejsce,  gdzie  się  wprowadza 
dane  (sygnały  optyczne),  oraz  miejsce,  gdzie  się  je  wy- 
prowadza (w  postaci  np.  obrazów  optycznych). 
W wypadku  płaskich  sygnałów  optycznych  mówi  się 
o płaszczyźnie  wejściowej  i wyjściowej. 

Zdolność  rozdzielcza  układu  optycznego,  który 
funkcja  dokonaJ  przetworzenia  wejściowego  sygnału  optycz- 
rozmvcia  nego  w obraz  przedmiotu,  wiąże  się  ściśle  z tzw. 
y funkcją  rozmycia.  Wyjaśnimy  to  pojęcie  na  przykła- 
dzie soczewki  wytwarzającej  obraz  świecącego  punktu. 
Obraz  punktowego  przedmiotu  nigdy  w praktyce  nie 
jest  punktem.  Dyfrakcja  na  skończonej  źrenicy  so- 
czewki, aberracje,  a także  i rozproszenia  powodują, 
iż  obraz  punktu  jest  rozmyty.  Nawet  jeśli  się  posłu- 
żymy np.  soczewką  sferyczną  o dobrze  skorygowa- 
nych aberracjach  (bezaberracyjną)  i całkowicie  usu- 
niemy rozproszenie  w układzie  optycznym,  obraz 
przedmiotu  punktowego  będzie  rozmyty.  Ogólnie 
biorąc,  pole  świetlne  obrazu  przedmiotu  punktowego 
w płaszczyźnie  obrazowej  soczewki  można  opisać  za 
pomocą  zespolonej  funkcji  rozmycia  R(x , y)  == 
= R(xy  y)ei*(x’V).  Kwadrat  modułu  tej  funkcji 

|R(x,y)|2  jest  równy  rozkładowi  natężenia  światła 
obrazu  i można  go  wyznaczyć  doświadczalnie  (rys.  2). 


Funkcja  <p(xyy)  określa  przesunięcie  fazy  między 
przedmiotem  i obrazem.  Jeśli  to  jest  układ  bezaber- 
racyjny,  funkcja  rozmycia  wszystkich  punktów  x0y 


Rys.  2.  Rozmycie  obrazu 
punktowego  źródła  światła. 
Otworek  jest  źrenicą  foto- 
detektora służącego  do  po- 
miaru rozkładu  natężenia 
rozmycia 


y0  przedmiotu  jest  symetryczna,  a funkcja  9?  równa 
jest  zeru.  W rzeczywistych  układach  optycznych,  gdy 
występują  np.  aberracje  poprzeczne,  <p  # 0. 

Obraz  przedmiotu  złożonego,  składającego  się 
z wielu  punktów,  można  opisać  sumując  funkcje  roz- 
mycia wszystkich  punktów.  Zdolność  rozdzielcza 
układu  optycznego  jest  tym  większa,  im  ostrzejsze 
maksimum  ma  funkcja  rozmycia  tego  układu  dla 
przedmiotu  punktowego.  Funkcję  rozmycia  często 
nazywa  się  odpowiedzią  impulsową  układu  optycz- 
nego. 

W procesie  tworzenia  obrazu  ważne  jest  także, 
w jakim  stopniu  kontrast  z przedmiotu  może  być  prze- 
niesiony do  obrazu.  Dwie  linie  szare  przedmiotu 
łatwo  się  zlewają  w obrazie  w jedną,  podczas  gdy 
linię  czarną  sąsiadującą  z białą  ten  sam  układ  optycz- 
ny może  rozdzielić.  Miarą  kontrastu  jest  współczyn- 
nik y — (/max  — /min)/(/max~f~/min),  gdzie  /max  i /min  “ 

natężenie  światła  w najjaśniejszych  i najciemniej- 
szych miejscach  przedmiotu.  Współczynnik  przeno- 
szenia kontrastu  przez  układ  optyczny  można  okre- 
ślić jako  stosunek  kontrastu  obrazu  yobrazu  do  kon- 
trastu przedmiotu  ^przedmiotu! 

H — JVbrazu/yprzed  miotu- 

Okazuje  się,  że  współczynnik  H zależy  od  częstości 
przestrzennych  coXy  coy\  nosi  on  nazwę  funkcji  prze- 
noszenia kontrastu  lub  funkcji  przenoszenia  modu- 
lacji H(coXy  coy). 

Przedmiot  oświetlony,  czyli  sygnał  optyczny  na 
wejściu  układu  optycznego  charakteryzuje  się  także 
rozkładem  fazy.  Zatem  oprócz  przenoszenia  kontrastu 
trzeba  także  brać  pod  uwagę  funkcję  przenoszenia 
fazy,  ¥ = ^((Oz.coy).  Tak  więc  funkcja  H(cox,  coy)  = 
= H(cox,  coy)ei'F(‘c>x,a>v)  jest  pełną  optyczną  funkcją 
przenoszenia  danego  układu  optycznego.  Działanie 
układu  optycznego  można  przeto  opisać  albo  za  po- 
mocą funkcji  przenoszenia  H{coXycoy)y  albo  funkcji 
rozmycia  R(xy  y)y  przy  czym  jedna  z tych  funkcji  jest 
transformatą  fourierowską  drugiej. 

Funkcję  przenoszenia  układu  optycznego  można 
wyznaczyć  z porównania  rozkładu  natężenia  światła 
przedmiotu  i obrazu  (w  wypadku  oświetlenia  niespój- 
nego) lub  rozkładu  amplitud  i fazy  pola  świetlnego 
przedmiotu  i obrazu  (w  wypadku  oświetlenia  spój- 
nego). 

Znajomość  funkcji  przenoszenia  układu  optycznego 
spójnego  lub  niespójnego  umożliwia  wyznaczenie 
sygnału  (obrazu)  na  wyjściu  układu  przy  danym  syg- 
nale na  wejściu. 

Układy  optyczne  różnią  się  nieco  swym  działa- 
niem — zależnie  od  tego,  czy  użyto  źródła  światła 
spójnego  czy  też  niespójnego  (koherentnego  czy  nie- 
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koherentnego).  Chodzi  tu  nie  tylko  o spójność  cza- 
sową, lecz  także  spójność  przestrzenną,  czyli  wystę- 
powanie stałej  różnicy  faz  w całym  przekroju  wiązki 

A Kx) 


Rys.  3.  Rozkład  natężenia  w obrazie  dwóch  źródeł  punktowych, 
leżących  w minimalnej  odległości  rozróżnialnej  (wg  kryterium 
Rayleigha):  źródła  niespójne  (a)  i źródła  spójne  o różnicy  faz  ę?(b) 


dziwne,  jednak  przestrzeń  swobodna  jest  także  filtrem 
częstości  przestrzennych  i jej  funkcja  przenoszenia  nie 
jest  tożsamościowo  równa  jedności,  jak  można  by 
oczekiwać.  W rzeczywistości  moduł  funkcji  przeno- 
szenia jest  następującą  funkcją  a>x,  o)v  (rys.  4a): 

1 1 przy  (col+co*)  ^ kz  = (2k/X)z, 


| H((Oz,u)y)\  — {exp(— zl/o^-ł-eof—  k2  ) 

1 przy  a>*-\-coz  > k\ 

Przestrzeń  swobodna  dla  z > A jest  filtrem  częstości 
przestrzennych ; nie  przepuszcza  ona  częstości  okreś- 
lonych warunkiem  <*>l+<°2y  > odpowiadających 
tzw.  falom  niejednorodnym.  W miarę  wzrostu  z (gru- 
bości warstwy)  moduł  \H(a>x , o>y)\ . coraz  bardziej 
przypomina  walec  (rys.  4b).  Filtrujące  właściwości 


a) 


b) 


Rys.  4.  Moduł  funkcji  przenoszenia  przestrzeni  swobodnej 
w funkcji  częstości  przestrzennych;  a)  odległość  z porównywalna 
z długością  fali  światła  A,  b)  z > A 

przestrzeni  swobodnej,  polegające  na  usuwaniu  fal 
niejednorodnych,  wynikają  z ogólnych  praw  rozcho- 
dzenia się  fal  świetlnych  w przestrzeni  pozbawionej 
ośrodków  materialnych.  Przy  dostatecznie  dużej  war- 
tości z,  sięgającej  do  bliskiej  strefy  dyfrakcji  — strefy 
Fresnela,  funkcję  przenoszenia  przestrzeni  swobodnej 
można  przedstawić  wzorem : 


funkcja 

przenoszenia 

przestrzeni 

swobodnej 


H(cox,o)v)  = exp[( 


-izl2JcHa>l+col)}. 


oświetlającej  przedmiot  na  wejściu  układu  optycz- 
nego (->  Spójność  światła).  Dla  uproszczenia  mówi 
się  o koherentnych  i niekoherentnych  układach  op- 
tycznych. Różnica  między  obu  typami  układów  ujaw- 
nia się  wyraźnie  w ich  zdolności  rozdzielczej.  Rysu- 
nek 3a  przedstawia  rozkład  natężenia  w obrazie  dwóch 
punktów  oświetlanych  światłem  niespójnym,  znaj- 
dujących się  w odległości  minimalnej  wg  kryterium 
Rayleigha  (zgodnie  z tym  kryterium  odwrotność 
zdolności  rozdzielczej,  czyli  minimalna  odległość 
między  dwoma  rozróżnia  Inymi  punktami  Ae  = 
= 1,22 dX/l,  gdzie  d—  odległość  obrazu  od  płasz- 
czyzny soczewki  wyjściowej,  / — średnica  źrenicy 
wyjściowej  układu  optycznego,  zwykle  jest  to  śred- 
nica najmniejszej  soczewki  użytej  w układzie,  X — 
długość  fali).  Na  rys.  3b  pokazano  rozkład  natężenia 
obrazu  owych  dwóch  punktów,  z których  każdy 
oświetlony  jest  światłem  spójnym.  Rozkład  ten  za- 
leży od  różnicy  fazy  światła  w tych  punktach.  Jeśli 
różnica  faz  <p  = 90°,  to  rozkład  jest  taki  jak  przy 
oświetleniu  niespójnym;  jeśli  (p  = 0°,  zdolność  roz- 
dzielcza jest  mniejsza  niż  w przypadku  oświetlenia 
niespójnego,  jeśli  zaś  <p  = 180°,  zdolność  rozdziel- 
cza jest  większa.  Ale  sama  zdolność  rozdzielcza  nie 
decyduje  o tym,  który  typ  oświetlenia  jest  lepszy.  Za- 
lety oświetlenia  spójnego  ujawniają  się  przy  zapisy- 
waniu pełnej  informacji  o sygnale  świetlnym  (ampli- 
tudy i fazy),  przy  filtracji  częstości  przestrzennych  itd. 

Omówimy  dalej  w ujęciu  optyki  fourierowskiej 
dwa  podstawowe  elementy  optyczne : przestrzeń  swo- 
bodną i soczewkę  skupiającą. 


Przestrzeń  swobodna 

Elementem  optycznym  jest  nawet  sama  przestrzeń 
zawarta  między  płaszczyznami  wejściową  x0 , y0 
i wyjściową  xy  y odległymi  o z.  Choć  się  to  wydaje 


Soczewka  skupiająca 

Aby  lepiej  zrozumieć  właściwości  soczewki  jako  swoi- 
stego modulatora  realizującego  przekształcenie  Fou- 
riera, rozpatrzmy  doświadczenie,  w którym  wiązka 
światła  spójnego  oświetla  przeźrocze  leżące  przed 
soczewką  w odległości  równej  np.  jej  odległości  ogni- 
skowej (rys.  5).  W płaszczyźnie  ogniskowej  soczewki 
powstanie  pewien  charakterystyczny  rozciągły  obraz 
(światło  skupiłoby  się  w jednym  punkcie,  gdyby  samą 
soczewkę  oświetlić  bezpośrednio  falą  płaską  i gdyby 
soczewka  ta  miała  wymiary  poprzeczne  nieskończo- 
ne). Ów  rozciągły  obraz  jest  obrazem  Fouriera  przed- 
miotu umieszczonego  na  wejściu  układu  (jest  on 
także  zwany  widmem  Wienera  optycznego  sygnału  widmo 
przedmiotu  wejściowego).  Soczewka  dokonuje  zatem  Wienera 
przekształcenia  Fouriera.  Gdy  światło  trafia  na  swej 
drodze  na  przeszkodę  (przeźrocze),  ulega  ugięciu,  nie 
rozchodzi  się  dalej  w tym  samym  kierunku,  lecz  roz- 
biega się  na  boki  i interferuje,  tworzy  obrazy  inter- 


Rys.  5.  Schemat  działania  soczewki  sferycznej  jako  operatora 
przekształcenia  Fouriera 
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Rys.  6.  Obraz  Fouriera  pola  świetlnego  przedmio- 
towego (tzw.  widmo  Wienera)  powstałego  przez 
oświetlenie  światłem  spójnym  przezrocza  przed- 
stawiającego czarny  kwadrat  z białym  trójkątem 
w środku  (obok) 

ferencyjne,  które  na  pozór  mało  mają  wspólnego 
z przedmiotem.  Obrazy  są  tym  bardziej  kontrastowe, 
wyraźniejsze,  im  światło  ma  większą  zdolność  inter- 
ferowania,  czyli  im  bardziej  jest  spójne  czasowo  i prze- 
strzennie. Fale  świetlne  ugięte  na  przeźroczu  skupiają 
się  po  przejściu  przez  źrenicę  soczewki  i nadal  inter- 
ferują,  tworząc  w płaszczyźnie  ogniskowej  soczewki 
ów  charakterystyczny  obraz  Fouriera  przedmiotu. 
Przyjrzyjmy  się  temu  obrazowi  (rys.  6).  Widzimy,  że 
najwięcej  światła  rozchodzi  się  w kierunkach  bliskich 
osi  układu  optycznego,  a najmniej  — w dużym  odda- 
leniu od  osi.  Punkty  o różnej  jasności  w obrazie 
Fouriera  przedstawiają  skupione  fale  płaskie,  na 
które  można  rozłożyć  pole  świetlne  sygnału  wejścio- 
wego, czyli  w tym  wypadku  — pole  świetlne  ugięte 
na  przeźroczu.  Odpowiadają  one  kierunkom  roz- 
chodzenia się  tych  fal  płaskich,  czyli  odpowiednim 
częstościom  przestrzennym.  Przebieg  zjawiska  mo- 
żemy ująć  krótko  w następujący  sposób:  w wyniku 
ugięcia  światła  na  przeźroczu  powstaje  pole  świetlne, 
którego  energia  dzięki  działaniu  soczewki  skupia  się 
głównie  w zakresie  niskich  częstości  przestrzennych, 
a tylko  niewielka  jej  część  — w zakresie  wysokich 
częstości  przestrzennych;  oznacza  to,  że  w pewnych 
kierunkach  przedmiot  ugina  więcej  światła,  w innych 
mniej.  Obserwowanie  lub  fotografowanie  ogniska  so- 
funkcja  czewki  jest  utrwaleniem  tego  rozkładu  natężenia 
rzenoszenia  światła  w funkcji  częstości  przestrzennych.  Soczewka 
soczewki  odgrywa  rolę  realizatora  przekształcenia  Fouriera. 

Funkcja  przenoszenia  soczewki  skupiającej  ma  postać: 


H(coz,coy)  = A exp  (f/2k)  (co2x  -f  g>*)], 

gdzie  / — ogniskowa  soczewki,  A = const. 

Soczewka  o wymiarach  poprzecznych  nieskończo- 
nych działa  podobnie  jak  gruba  warstwa  przestrzeni 
swobodnej,  taka  że  grubość  warstwy  z sięga  do  da- 
lekiej strefy  dyfrakcji,  zwanej  strefą  dyfrakcji  Fraun- 
hofera.  W obu  wypadkach  sygnał  optyczny  wejścio- 
wy j est  na  wyjściu  przekształcony  w swoją  transfor- 
matę Fouriera  (z  dokładnością  do  stałych  czynników 
teoria  fazowych). 

Abhego  Doniosłe  znaczenie  transformacji  Fouriera  w pro- 
mikroskopu  cesie  tworzenia  obrazu  zostało  po  raz  pierwszy  stwier- 
dzone przez  E.  Abbego  już  w ubiegłym  stuleciu.  Zau- 
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ważył  on,  że  proces  powstawania  obrazu  w mikro- 
skopie jest  dwustopniowy.  Najpierw  soczewka  obiek- 
tywowa wytwarza  pierwotny  obraz  Fouriera  w swojej 
płaszczyźnie  ogniskowej ; w drugim  etapie  — pier- 
wotny obraz  Fouriera  przedmiotu  zostaje  przekształ- 
cony w obraz  optyczny  (odwrotne  przekształcenie 
Fouriera),  który  oglądamy  przez  okular  (rys.  7). 


Rys.  7.  Dwustopniowy  schemat  powstawania  obrazu  w mikro- 
skopie w świetle  spójnym  podany  przez  E.  Abbego  (wg  J.  R.  Meyer- 
Arendt  Wstęp  do  optyki , Warszawa  1977) 


Filtrowanie  częstości  przestrzennych 

Płaszczyzny  w układzie  optycznym,  w których  się  po- 
jawia obraz  Fouriera  pola  świetlnego  przedmiotu, 
umieszczonego  na  wejściu  układu,  nazywa  się  płasz- 
czyznami widmowymi  częstości  przestrzennych.  Uzy- 
skany w płaszczyźnie  widmowej  obraz  Fouriera  syg- 
nału optycznego  można  częściowo  zasłaniać;  taka 
operacja  nosi  nazwę  filtracji  częstości  przestrzennych. 
Problemem  filtracji  częstości  przestrzennych  zajmo- 
wali się  fizycy  już  od  dziesięcioleci.  Jako  przykład 
można  przytoczyć  osiągnięcia  N.  Mareshala  i współ- 
pracowników, którzy  za  pomocą  filtracji  częstości 
przestrzennych  polepszali  obrazy  przekazywane  przez 
fototelegrafię  kopiową  (il.  149,  150,  tabl.  40).  Przesła- 
nianie częściowe  obrazu  Fouriera  wpływa  na  cały 
obraz  przedmiotu,  każdy  bowiem  punkt  obrazu  Fou- 
riera odpowiada  całemu  polu  świetlnemu  przedmiotu. 
Jak  wpływa?  Zależy  to  od  sposobu  filtrowania. 

Powróćmy  jeszcze  do  rys.  7,  ilustrującego  etapy 
powstawania  obrazu  w mikroskopie.  Obraz  przed- 
miotu składającego  się  z pasków  na  przemian  czar- 
nych i przezroczystych  jest  nieostry,  rozmyty.  Dla- 
czego? Rzeczywista  soczewka  ma  skończone  wymia- 
ry poprzeczne  i odgrywa  dwojaką  rolę:  modulatora 
(realizatora  przekształcenia  Fouriera)  i ekranu  czar- 


transformacja 


nego  z otworem  w środku,  czyli  jest  także  dolno- 
przepustowym,  dość  wąskopasmowym  filtrem  czę- 
stości przestrzennych.  Okazuje  się,  że  natężenie  świa- 
tła odpowiadające  niższym  częstościom  przestrzen- 
nym w obrazie  Fouriera  przedmiotu  świecącego  lub 
oświetlonego  wiąże  się  z zarysami  jego  rysunku  czy 
rzeźby,  a natężenie  odpowiadające  najwyższym  czę- 
stościom przestrzennym  — z ostrością  krawędzi  ry- 
sunku. Obcięcie  wyższych  częstości  prowadzi  w obra- 
zie do  rozmycia  krawędzi,  do  zmniejszenia  zdol- 
ności rozdzielczej. 

filtr  Przesłony  umieszczane  celowo  w płaszczyźnie  wid- 
częstości  mcwej  danego  układu  optycznego  nazywamy  filtrami 
przestrzeń-  częstości  przestrzennych  lub  ich  maskami.  Mogą  one 
nych  być  rozmaite  — zależnie  od  celu,  jakiemu  służą.  Do- 
skonałym przykładem  jest  doświadczenie  Abbego- 
Portera,  które  miało  duże  znaczenie  dla  omawianej 
dziedziny  fizyki.  Przedmiot  w postaci  siatki  z kwa- 
dratowymi oczkami  oświetlano  światłem  spójnym 
(ii.  148,  tabl.  40)  W płaszczyźnie  ogniskowej  układu 
optycznego  wstawiano  maskę  filtrującą  obraz  Fou- 
riera — szczelinę  poziomą  lub  pionową,  dzięki  czemu 
otrzymywano  obrazy  składające  się  z pionowych  lub 
poziomych  pasków  czarnych  i białych. 


Modulacja  0 


Jedną  z metod  filtrowania  częstości  przestrzennych 
jest  tzw.  metoda  modulacji  0,  dzięki  której  uzyskuje 
się  zamierzoną  zmianę  odcienia  szarości  fragmentów 
obrazu.  Zasadę  tej  modulacji  wyjaśnimy  na  prostym 
przykładzie  (rys.  8).  Weźmy  pod  uwagę  widok  za- 
wierający różne  elementy,  np.  niebo,  dom,  trawnik 
(na  fotografii  czarno-białej  elementy  te  są  przedsta- 
odcieniami  szarości).  Każdy  element 

trawnik 


— — «***•  dom 

V 

^ niebo 

c) 

Rys.  8.  Modulacja  theta:  a)  widok  wymodelowany  z siatek  dy- 
frakcyjnych zorientowanych  pod  różnymi  kątami  0,  b)  obraz 
Fouriera  tego  modelu,  c)  obraz  wyjściowy  o różnych  odcieniach 
szarości  otrzymanych  dzięki  odpowiedniej  filtracji  częstości 
przestrzennych 

widoku  wykonuje  się  z kawałków  plastykowej  siatki 
dyfrakcyjnej  o prążkach  zorientowanych  pod  róż- 
nymi kątami  0 (stąd  nazwa  metody).  Przez  odpo- 
wiednie przesłanianie  różnych  fragmentów  obrazu 
Fouriera  tak  wymodelowanego  widoku  zmienia  się 
odcień  szarości  elementów.  Jeśli  np.  w końcowym 
obrazie  dom  ma  być  czarny,  to  trzeba  przesłonić  od- 
powiednie maksima  widma  częstości  przestrzen- 
nych domu,  jeśli  zaś  niebo  ma  być  jasne  — trzeba 
przepuścić  cały  jego  obraz  Fouriera.  Ponieważ  mak- 
simum jasności  obrazu  Fouriera,  odpowiadające 
częstościom  przestrzennym  bliskim  0,  czyli  ugięciu 
rzędu  zerowego,  nie  zależy  od  kąta  0,  trzeba  je  w tej 
metodzie  filtrowania  zasłaniać  całkowicie.  Modulację 
0 można  stosować  nie  tylko  w przytoczonej  tu  wersji 
czarno-białej,  lecz  także  w barwnej. 


Komputery  optyczne 

Łatwość  dokonywania  przekształcenia  Fouriera  za 
pomocą  układów  optycznych  wykorzystuje  się  w ko- 
herentnych układach  optycznych  do  przeprowadza- 
nia operacji  matematycznych,  czyli  w komputerach 


optycznych.  Schemat  budowy  komputera  optycznego 
przedstawia  rys.  9.  Właściwą  maszyną  matematyczną 
jest  układ  optyczny  dokonujący  żądanej  operacji  ma- 


Rys.  9.  Schemat  blokowy  komputera  optycznego.  Laser  zaopa- 
trzony jest  w układ  teleskopowy  poszerzający  wiązkę.  Urządzenie 
wejściowe  zmienia  dane  wejściowe  w wejściowe  sygnały  optyczne, 
urządzenie  zaś  wyjściowe  zmienia  wyjściowe  sygnały  optyczne 
w dane  pożądane  dla  odbiorcy 


tematycznej,  zw.  procesorem  optycznym.  Pamięć  ope-  pamięć 
racyjną  stanowi  zbiór  optycznych  filtrów  częstości  optyczna 
przestrzennych,  umieszcza  się  je  w płaszczyźnie  wid- 
mowej. Urządzenie  wyjściowe  służy  do  odbierania 
wyniku  obliczeń  w postaci  obrazów  optycznych, 
także  do  przetwarzania  wyjściowych  sygnałów 
optycznych  na  inne  (np.  elektryczne)  — zgodnie  z za- 
potrzebowaniem odbiorcy.  Rodzaj  użytego  filtru  czę- 
stości przestrzennych  decyduje  o rodzaju  operacji  ma- 
tematycznej przeprowadzanej  przez  dany  komputer 
optyczny.  Jeśli  liczba  kolejnych  operacji  matematycz- 
nych wykonywanych  przez  procesor  optyczny  jest 
znaczna,  trzeba  w odpowiednim  etapie  obliczeń  zmie- 
niać filtry  wstawiane  w płaszczyzny  widmowe  układu. 

Filtry  przechowywane  są  w bloku  pamięci  optycznej. 

Komputery  optyczne  to  wyspecjalizowane  maszyny 
optyczne  przystosowane  do  wykonywania  określo- 
nych operacji  matematycznych.  Jako  przykład  omó- 
wimy komputer  optyczny  służący  do  rozpoznawania 
danych.  Jego  zadanie  polega  na  tym,  aby  ze  zbioru 
sygnałów  podawanych  na  wejściu  komputera  wybrać 
poszukiwany,  czyli  inaczej  mówiąc  — ze  zbioru 
funkcji  wybrać  określoną  (trzeba  np.  zidentyfikować 
linie  papilarne  palca  osobnika  podejrzanego  o zbrod- 
nię na  podstawie  policyjnej  kartoteki  linii  papilar- 
nych kryminalistów,  liczącej  zwykle  wiele  tysięcy 
pozycji).  Wprawdzie  istnieją  elektroniczne  maszyny 
cyfrowe  przystosowane  do  rozpoznawania  danych, 
lecz  takie  zadania  są  dla  nich  pracochłonne  i długo- 
trwałe, podczas  gdy  komputer  optyczny  wykonuje  je 
łatwo  i szybko. 

Typowym  i już  klasycznym  układem  optycznym  do 
rozpoznawania  danych  jest  korelator  optyczny  z do- 


przekształccnia  Fouriera  (II) 
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korelator  pasowanym  filtrem  holograficznym,  zaproponowany 
optyczny  przez  Van  der  Lugta  w 1963  r.  (rys.  10).  Na  wejściu 
Van  der  Lugta  korelatora  podaje  się  za  pomocą  przetwornika  (może 
być  nim  zwykłe  przezrocze)  sygnał  optyczny,  który  na- 
leży porównać  z jakimś  wzorcowym  sygnałem  op- 
tycznym, zapisanym  w pamięci  komputera  w postaci 
dopasowanego  filtru  holograficznego  częstości  prze- 
strzennych. Sygnał  wejściowy  poddawany  jest  naj- 
pierw transformacji  Fouriera  w układzie  soczewek 
sferycznych,  następnie  pole  świetlne,  będące  transfor- 
matą Fouriera  sygnału  wejściowego,  odtwarza  holo- 
gram wzorcowy  (holograficzny  filtr  dopasowany), 
umieszczony  dokładnie  w płaszczyźnie  widmowej 
pierwszego  stopnia  korelatora. 

Holograficzny  filtr  dopasowany  Van  der  Lugta  jest 
rodzajem  hologramu  Fouriera  (— ► Holografia),  na 
którym  zarejestrowano  obraz  interferencyjny  widma 
Fouriera  sygnału  zadanego  i wiązki  odniesienia 
(widmo  Fouriera  jest  rozkładem  amplitudy  i fazy  syg- 
nału optycznego  w funkcji  częstości  przestrzennych, 
a obserwowane  widmo  Wienera  jest  tylko  rozkładem 
otrzymywa-  natężenia  w funkcji  tych  częstości).  Zwykle  do  otrzy- 
nie  filtru  do-  mywania  takich  hologramów  wykorzystuje  się  pierw- 
pasowanego  szy  stopień  korelatora  optycznego  (rys.  11). 

płaszczyzna  hologramu 
i płaszczyzna 
widmowa  sygnału 


Drugi  stopień  korelatora  dokonuje  odwrotnego 
przekształcenia  Fouriera  pola  świetlnego  wiązki  ugię- 
tej na  hologramie.  Powstają  trzy  wiązki  odtworzone  — 
wiązka  zerowa,  rozchodząca  się  w zasadzie  w kierun- 
ku osi  układu,  nie  niosąca  żadnej  pożytecznej  infor- 
macji, oraz  dwie  wiązki  ugięte.  Jedną  z nich  można 
nazwać  korelacyjną,  niesie  ona  informację  o zgod- 
ności (niezgodności)  rozpoznawanych  obiektów.  Dru- 
gą wiązkę  ugiętą  można  nazwać  splotową  (odpowiada 
matematycznej  operacji  zwanej  splotem),  w tym  wy- 
padku nie  odgrywa  ona  roli.  Ugięta  wiązka  korelacyj- 
na niesie  informację  o autokorelacji,  gdy  jest  zgodność 
sygnału  rozpoznawanego  z sygnałem  wzorcowym, 
lub  o korelacji  wzajemnej,  gdy  takiej  zgodności  nie 
ma.  Rozkład  jasności  w ugiętej  wiązce  informacyjnej 
odpowiadający  autokorelacji  cechuje  duża  gęstość 
energii  w środku  obrazu,  w wypadku  obrazów  kore- 
lacji wzajemnej  rozkład  jasności  jest  szeroko  rozmyty. 
Wielkość  natężenia  w środku  obrazu  korelacyjnego 
(mierzonego  za  pomocą  fotodetektora  o małej  śred- 
nicy) świadczy  o identyczności  lub  odmienności  syg- 
nałów porównywanych  i wzorcowych, 
szybkość  Optyczne  komputery  zapewniają  niezwykłą  szyb- 
komputerów  kość  przeprowadzania  operacji  matematycznych  — 
optycznych  niezależnie  od  stopnia  ich  skomplikowania.  Ogranicza 
ją  szybkość  wprowadzania  i wyprowadzania  danych, 
wymiana  masek  filtrujących  częstości  przestrzenne  itp. 
Komputery  optyczne  dokonują  przede  wszystkim 
przekształceń  całkowych,  choć  można  ich  także  użyć 
do  różniczkowania.  Wadą  ich  jest  jeszcze  mała  do- 
kładność obliczeń  (rzędu  1 %)  oraz  ścisła  specjalizacja ; 
każdy  komputer  optyczny  może  wykonywać  tylko 
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określony  rodzaj  obliczeń.  Nie  są  to  maszyny  mate- 
matyczne uniwersalne.  Jaka  jest  ich  przyszłość?  Praw- 
dopodobnie wkrótce  nastąpi  era  maszyn  hybrydo- 
wych — swoistych  połączeń  matematycznych  ma- 
szyn optycznych  i elektronicznych  cyfrowych.  Część 
zadań,  szczególnie  pracochłonnych,  będą  szybko  wy- 
konywały maszyny  optyczne,  a pozostałe  dokładne 
obliczenia  — elektroniczne  maszyny  cyfrowe.  Takie 
hybrydowe  maszyny  już  działają.  Natomiast  w dalszej 
przyszłości,  po  pełniejszym  poznaniu  możliwości  za- 
stosowania światła  spójnego  oraz  dzięki  zminiatury- 
zowaniu koherentnych  układów  optycznych  (co  na- 
leży do  optyki  zintegrowanej),  nastąpi  zapewne  era 
powszechnego  przesyłania  i przetwarzania  danych 
torami  optycznymi.  Cała  telekomunikacja  i maszyno- 
wa technika  liczenia  będą  wyzyskiwały  światło  jako 
główny  nośnik  informacji.  Elektronikę  uzupełni  czy 
nawet  zastąpi  nowa  dziedzina  — fotonika. 


foionika 


Struktura  informacyjna  sygnału  optycznego 

Z punktu  widzenia  optyki  fourierowskiej  można  roz- 
ważać także  strukturę  informacyjną  sygnału  świetl- 
nego. Krótkie  omówienie  tego  zagadnienia  rozpocz- 
niemy od  przypomnienia  zasady  nieokreśloności 
sygnałów  radiowych:  Acot  At  ^ 1,  gdzie  cot  — czę- 
stość czasowa,  t — czas  trwania  sygnału.  Zasadę  tę 
można  rozszerzyć  na  informacyjne  sygnały  optyczne: 


Acox  Ax  ^ 1 


Acoy  -Ay  ^ 1 . 


Zgodnie  z zasadą  nieokreśloności  sygnałów  optycz- 
nych w wypadku  monochromatycznego  pola  świetlne- 
go informacyjną  czt  er  owy  miarową  przestrzeń  o 
współrzędnych  c oXy  x , c%,  y można  podzielić  na  cztero- 
wymiarowe  komórki  o skończonej  objętości  Acox  ■ Ax  • 

• Acoy‘Ay  = 1.  Kształt  takiej  komórki  informacyjnej 
można  wybrać  dowolnie,  zachowując  jedynie  jej  obję- 
tość. Rysunki  12a,  b,  c ukazują  różne  możliwości  wy- 
boru komórek  w przestrzeni  dwuwymiarowej  cox , x. 
Każdej  takiej  komórce  odpowiada  niezależny  po- 
miar amplitudy  i fazy  pola  świetlnego  sygnału.  Za- 
tem struktura  informacyjna  sygnału  optycznego  jest 
dyskretna.  Analiza  problemu  pomiaru  pola  świetlnego 
z punktu  widzenia  teorii  informacji  prowadzi  do 
wniosku,  że  całkowity  pomiar  optyczny,  obejmujący 
pomiar  rozkładu  amplitudy  i fazy  przedmiotu  świe- 
cącego, jest  możliwy  jedynie  przy  oświetleniu  spójnym, 
natomiast  przy  oświetleniu  przestrzennie  niespójnym 


komórka 
informacyjni 
pola 
świetlnego 


Rys.  12.  Diagram  informacyjny:  a)  komórki  elementarne  Ga- 
bora, b)  komórki  elementarne  Fouriera,  c)  komórki  elementarne 
Shannona 


informację  o rozkładzie  fazy  traci  się  bezpowrotnie. 
Liczba  niezależnych  parametrów  (wyników  pomia- 
rów) potrzebnych  do  opisania  pola  świetlnego  w źre- 
nicy wyjściowej  układu  optycznego  równa  się  N przy 
oświetleniu  spójnym  i N 2 przy  oświetleniu  niespój- 
nym; A jest  liczbą  Shannona,  czyli  liczbą  informacyj- 
nych przestrzennych  stopni  swobody: 

N — NxNy  ~ 2 ASX  *C(>xmax  ’ ASy  mCOy  max, 

gdzie  ASX  i ASy  — wymiary  liniowe  obrazu  sygnału 
w kierunku  osi  x i yy  a cox  max,  cov  max  — odpowiednie 


szerokości  pasma  częstości  przestrzennych  przepusz- 
czane przez  rzeczywisty  układ  optyczny  (czynnik 
2 odpowiada  dwóm  niezależnym  stanom  polaryzacji 
światła).  W wypadku  niemonochromatycznego  pola 
świetlnego  liczbę  tę  należy  uzupełnić  dodatkowym 
czynnikiem:  Nt  ~ Acot  ’Ty  gdzie  T — czas  obserwacji. 
Im  mniejsza  jest  liczba  parametrów  potrzebnych  do 
opisania  sygnału  optycznego  przechodzącego  przez 
tor  optyczny,  tym  bardziej  koherentny  jest  układ. 


Perspektywy  optyki  fourierowskiej 

Przedstawione  wyżej  podejście  otwiera  nowe  perspek- 
tywy przed  przetwarzaniem  sygnałów  optycznych. 
Jedną  z możliwości  jest  tzw.  przelewanie  częstości 
przestrzennych.  Całkowita  liczba  informacyjnych 
stopni  swobody  danego  sygnału  i toru  optycznego 
jest  niezmiennikiem,  ale  przy  jej  zachowaniu  można 
np.  zwiększyć  zdolność  rozdzielczą  obrazu  w kierunku 
xy  a zmniejszyć  w kierunku  yf  „przelewając”  częstości 


przestrzenne  z kierunku  y na  kierunek  x.  Ta  możli- 
wość będzie  wyzyskana  zapewne  w telewizji  hologra- 
graficznej,  dla  której  trudną  pod  względem  technicz- 
nym sprawą  jest  przesyłanie  tak  wielkiej  liczby  infor- 
macji, jaką  niesie  hologram.  Ponieważ  aparat  wzro- 
kowy człowieka  wymaga  większej  zdolności  rozdziel- 
czej w poziomie  niż  w pionie,  można  uzyskać  dobre 
dla  oka  obrazy  przez  „przelewanie”  częstości  prze- 
strzennych sygnałów  o zmniejszonej  liczbie  informa- 
cyjnych stopni  swobody. 

W dalszej  przysztosci  naieży  się  spodziewać  wyko- 
rzystania — jako  nośnika  informacji  — pola  elektro- 
magnetycznego o jeszcze  krótszej  fali  — nadfioletu 
oraz  miękkiego  promieniowania  rentgenowskiego, 
czyli  wyzyskanie  tego  zakresu  widma  fal  elektroma- 
gnetycznych, w którym  własności  falowe  promienio- 
wania jeszcze  są  wyraźne.  Przydatność  optyki  fourie- 
rowskiej będzie  wówczas  niewątpliwa. 

A.  Kalestyński  Co  to  są  komputery  optyczne , w „Człowiek 
i nauka”  1977;  J.  R.  Meyer- Arendt  Wstęp  do  optyki.  Warszawa 
1977;  A.  Piekara  Nowe  oblicze  optyki , Warszawa  1976. 


KRIOFIZYKA 


Nadpiynność 

Eugeniusz  Trojnar 

Ciecz  kwantowa 

W ciekłym  helu  w temperaturach  bliskich  zera  bez- 
względnego obserwuje  się  niezwykłe  zjawiska,  trudne 
do  wytłumaczenia  na  gruncie  fizyki  klasycznej.  Zja- 
wiska te  bowiem  są  przejawem  działania  praw  kwan- 
towych, a więc  tych  praw,  które  rządzą  światem  ato- 
mów i cząsteczek.  W ciekłym  helu  prawa  kwantowe 
ciecz  przejawiają  się  w skal1  makroskopowej,  dlatego  taką 
kwantowa  ciecz  nazywamy  cieczą  kwantową. 

W ciałach  o rozmiarach  makroskopowych  zjawiska 
kwantowe  są  przeważnie  zamaskowane  chaotycznymi 
ruchami  cieplnymi  atomów  czy  cząsteczek.  W niskich 
temperaturach,  gdy  zanika  bezładny  ruch  cieplny 
może  dojść  do  wewnętrznego  uporządkowania  sub- 
stancji i wtedy  mogą  się  ujawnić  zjawiska  kwantowe. 
Nadpłynność  jest  właśnie  wynikiem  wysokiego  stopnia 
uporządkowania  wewnętrznego  w ciekłym  helu. 
Uporządkowanie  to  dotyczy  ruchów  atomów  helu, 
a nie  ich  położeń.  Porządkowanie  położeń  atomów 
w przestrzeni  — to  krystalizacja,  a nadpłynny  hel  pod 
względem  uporządkowania  przestrzennego  nie  różni 
się  od  innych  cieczy,  o czym  świadczą  badania  rentge- 
nograficzne. 

Miarą  uporządkowania  układu  jest  jedna  z funkcji 
termodynamicznych,  zwana  entropią,  przy  czym  im 
wyższy  stopień  uporządkowania  układu,  tym  mniejsza 
jest  jego  entropia.  Po  przejściu  ciekłego  helu  w stan 


Rys.  1.  Zależność  en- 
tropii ciekłego  helu 
pod  ciśnieniem  pary 
nasyconej  od  tempe- 
ratury 


nadpłynny  jego  entropia  raptownie  maleje,  co  dowodzi 
wewnętrznego  podporządkowania  się  (rys.  1). 

Hel  jest  jedyną  w przyrodzie  substancją  nie  zamar- 
zającą pod  normalnym  ciśnieniem,  aż  do  temperatury 
zera  bezwzględnego.  Z punktu  widzenia  fizyki  kla- 
sycznej w temperaturze  zera  bezwzględnego  każda 
substancja  powinna  znajdować  się  w stałym  stanie 
skupienia,  gdyż  wszystkie  cząsteczki  powinny  być 
w zupełnym  bezruchu.  Zgodnie  z prawami  fizyki 
kwantowej,  całkowita  utrata  energii  ruchu  cząsteczek 
nie  jest  możliwa;  nawet  w temperaturze  zera  bez- 
względnego cząsteczki  wykonują  pewien  ruch  drga- 
jący, tzw.  drgania  zerowe,  a jeśli  energia  tych  drgań  jest 
wystarczająco  duża,  to  ciało  nie  krystalizuje.  A właś- 
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Rys.  2.  Wykres  stanu  4He. 
U dołu  zamieszczono  dla 
porównania  wykres  stanu 
normalnej  substancji 
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nie  w helu  energia  drgań  zerowych  jest  duża  i jedno- 
cześnie hel — jako  gaz  szlachetny  — odznacza  się 
słabym  oddziaływaniem  mędzy atomowym.  Oba  te 
czynniki  nie  sprzyjają  krystalizacji.  Aby  zestalić  hel, 
należy  zastosować  zwiększone  ciśnienie,  czyli  bardziej 
wykres  zbliżyć  do  siebie  poszczególne  atomy.  Wartość  ciśnie- 
stanu  nia  krystalizacji  zależy  od  temperatury,  co  ilustruje 
helu  zamieszczony  na  rys.  2 wykres  stanu  (wykres  fazowy). 
Górna  krzywa  na  tym  wykresie  jest  krzywą  krystali- 
zacji (topnienia),  czyli  krzywą  równowagi  fazy  stałej 
i ciekłej.  Dolna  krzywa  jest  krzywą  zależności  pręż- 
ności nasyconej  pary  helu  od  temperatury,  czyli  krzy- 
wą równowagi  fazy  ciekłej  i gazowej  — krzywą  skra- 
plania (wrzenia).  Krzywa  skraplania  kończy  się  w 
punkcie  krytycznym  Tkr  = 5,2  K,  /?kr  = 2,16  -105  Pa. 
Dla  normalnych  substancji  obie  te  krzywe  łączą  się 
z sobą  w punkcie  potrójnym,  gdzie  wszystkie  trzy  fa- 
zy — stała,  ciekła  i gazowa  — są  w równowadze  ter- 
modynamicznej . 

Hel  nie  ma  punktu  potrójnego,  ponieważ  krzywa 
wrzenia  nie  przecina  nigdzie  krzywej  krystalizacji. 
Nie  można  więc  helu  zestalić  przez  obniżanie  jego 
temperatury  pod  ciśnieniem  pary  nasyconej.  Aby  hel 
zestalić  w pobliżu  f=0K,  należy  zwiększyć  ciśnienie 
do  24,5  105  Pa. 


Przemiana  lambda 


Krzywą  krystalizacji  helu  z krzywą  skraplania  łączy 
na  wykresie  fazowym  tzw.  linia  lambda,  rozdziela- 
jąca obszar  cieczy  na  dwa  obszary  fazowe:  obszar 
hel  I helu  I (He  I)  i obszar  helu  II  (He  II).  Pod  względem 
własności  fizycznych  hel  I jest  normalną  cieczą,  niczym 
istotnym  nie  wyróżniającą  się  spośród  innych  cieczy. 
Nieco  bardziej  tylko,  niż  inne  ciecze,  przypomina  gaz, 
gdyż  ma  stosunkowo  małą  lepkość  i gęstość, 
hel  II  Hel  II  jest  cieczą  nadpłynną.  Przemiana  fazowa 
zmieniająca  hel  I w hel  II,  zwana  przemianą  lambda, 
zachodzi  pod  ciśnieniem  pary  nasyconej  w tempera- 
turze 7a  = 2,17  K.  Ciśnienie  odpowiadające  tej 
temperaturze  wynosi  0,05-1 06  Pa.  Pod  zwiększonym 
ciśnieniem  temperatura  przemiany  w fazę  nadpłynną 
jest  niższa  i w pobliżu  krzywej  krzepnięcia  wynosi 
1,76  K.  Wartości  ciśnień  i odpowiadających  im  tempe- 
ratur przemiany  lambda  wyznaczają  na  wykresie  fazo- 
wym linię  lambda. 

Przemiana  lambda  jest  innym  rodzajem  przemiany 
fazowej  (przemianą  fazową  II  rodzaju)  niż  np.  skra- 
planie czy  krzepnięcie.  Nie  towarzyszy  jej  oddawanie 
lub  pobieranie  ciepła,  nie  ma  więc  „utajonego”  ciepła 
linia  lambda  przemiany.  Linia  lambda  nie  jest  też  krzywą  równo- 
wagi dwu  faz,  jak  krzywa  topnienia  lub  skraplania, 
gdyż  hel  II  nie  może  istnieć  w równowadze  termodyna- 
micznej z helem  I ; cała  ciecz  — w zależności  od  tem- 
peratury i ciśnienia  — jest  albo  helem  I albo  helem  II. 

Pierwszym  zaobserwowanym  faktem  doświadczal- 
nym wskazującym  na  to,  że  w ciekłym  helu  dokonuje 
się  jakaś  przemiana,  była  zmiana  temperaturowej  za- 


temperatura  T 


Rys.  3.  Zależność  ciepła 
właściwego  ciekłego  he- 
lu od  temperatury 


leżności  przenikalności  elektrycznej,  którą  to  zmianę 
wykrył  w 1927r.  Polak,  Mieczysław  Wolfke,  pracujący 
wtedy  w Lejdzie.  Przypuszczenie  o zachodzącej  prze- 
mianie potwierdziły  pomiary  ciepła  właściwego,  prze- 
prowadzone przez  W.  H.  Keesoma.  Krzywa  zależności 
ciepła  właściwego  (rys.  3)  od  temperatury  w pobliżu 
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Ti  = 2,17  K rozrywa  się  i wygina  ku  górze  tak,  że  jej 
kształt  przypomina  grecką  literę  X (lambda).  Stąd 
pochodzi  nazwa  przemiany  fazowej  zachodzącej 
w ciekłym  helu. 

Fizycy  początkowo  nie  docenili  znaczenia  tego  od- 
krycia i nie  zwrócili  należytej  uwagi  na  zmiany  zacho- 
dzące w ciekłym  helu.  Bez  echa  przeszło  również  spo- 
strzeżenie J.  C.  McLennana  i jego  współpracowników, 
że  gdy  temperatura  helu  spada  poniżej  2,17  K,  ciecz 
nagle  przestaje  wrzeć,  tzn.  pęcherzyki  pary  już  się  nie 
tworzą  w jej  objętości.  Dopiero  w 1938  r.,  a więc 
sześć  lat  po  odkryciu  przemiany  lambda  i trzydzieści 
lat  po  pierwszym  skropleniu  helu  przez  H.  Kamer- 
lingh-Onnesa,  P.  L.  Kapica  w Moskwie  oraz  J.  F.  Allen 
i A.  D.  Misener  w Cambridge  niezależnie  od  siebie 
odkryli  zadziwiającą  zdolność  helu  II  do  przepływania 
niemal  bez  tarcia  przez  bardzo  wąskie  szczeliny  sze-  nadpłynność 
rokości  rzędu  10~5  cm.  Tę  właściwość  helu  II  Kapica  helu  II 
zaproponował  nazwać  nadpłynnością. 


Podstawowe  własności  helu  II 


Objętość  zwykłej  cieczy  przepływającej  w jednostce 
czasu  przez  rurkę  lub  szczelinę  jest  odwrotnie  propor- 
cjonalna do  lepkości  cieczy,  czyli  do  jej  tarcia  we- 
wnętrznego. Lepkość  wody  wynosi  około  10-3  Ns/m2, 
lepkość  helu  I około  10“6  Ns/m2,  a lepkość  helu  II 
mierzona  tą  metodą  może  wynosić  nawet  lO-12  Ns/m2,  lepkość 
a więc  milion  razy  mniej  niż  lepkość  helu  I.  Dla  cieczy  helu  1 1 
zwyczajnych  słuszny  jest  wzór  PoiseuilIe’a : 
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(1) 


gdzie  Kjest  objętością  cieczy  przepływąjącej  w czasie  / 
przez  rurkę  o promieniu  a i długości  / pod  wpływem 
różnicy  ciśnień  Ap;  j?  jest  współczynnikiem  lepkości. 

Dla  helu  II  wyniki  pomiarów  lepkości  metodą 
przepływu  są  niejednoznaczne,  gdyż  zależą  od  średni- 
cy kapilary : im  większa  kapilara,  tym  mniejszą  war- 
tość lepkości  otrzymuje  się  z pomiarów.  Poza  tym 
prędkość  przepływu  przez  wąskie  kapilary  prawie  nie 
zależy  od  różnicy  ciśnień  na  obu  jej  końcach,  chociża 
powinna  być  do  niej  proporcjonalna. 

Można  zastosować  inny  sposób  pomiaru  lepkości: 
Jeżeli  zapełni  się  cieczą  przestrzeń  między  dwoma 
współosiowymi  walcami  i będzie  się  obracać  walec  ze- 
wnętrzny, to  ciecz  pociągana  obracającym  się  walcem 
będzie  oddziaływać  na  walec  wewnętrzny  i starać  się 
go  obrócić  w tym  samym  kierunku  (rys.  4).  Moment 
obrotowy  działający  na  walec  wewnętrzny  jest  miarą 
lepkości  cieczy.  Lepkość  helu  II  mierzona  tą  metodą 
niewiele  różni  się  od  lepkości  helu  I,  a poniżej  1 K jest 
nawet  od  niej  większa.  Tak  więc  dwie  wypróbowane 
metody  pomiaru  lepkości  zastosowane  do  normalnych 
cieczy  dają  takie  same  wyniki,  a zastosowane  do  helu 
II  — wyniki  bardzo  się  od  siebie  różniące.  Pojęcie 
lepkości,  dotyczące  zwykłych  cieczy,  w odniesieniu 
do  cieczy  kwantowej  traci  swój  zwykły  sens. 

Drugą  osobliwością  helu  II  jest  jego  olbrzymie  prze- 
wodnictwo cieplne.  Przewodność  cieplną  « definiuje- 
my zwykle  jako  współczynnik  proporcjonalności 
między  strumieniem  przewodzonego  ciepła  ą i gra- 
dientem temperatury  ATI  Al,  gdzie  AT  oznacza  różnicę 
temperatur  między  punktami  oddalonymi  od  siebie 
o AL  Równanie  przewodnictwa  cieplnego  można  za- 
pisać w postaci : 


1 nić 
sprężysta 


sterko 


Rys.  4.  Układ  do 
pomiaru  lepkości 
metodą  obracają- 
cego się  walca 


przewodnict- 
wo cieplne 
helu  93 
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Znak  „minus”  pochodzi  stąd,  że  strumień  ciepła  prze- 
pływa w kierunku  przeciwnym  do  kierunku  gradientu 
temperatury  (gradient  jest  kierowany  umownie  w stro- 
nę wzrostu  temperatury).  W pewnych  warunkach  x 
helu  II  jest  tysiąckrotnie  większe  niż  x miedzi  i wiele 
milionów  razy  większe  niż  * helu  I.  W kąpieli  nadpłyn- 
nego helu  nie  da  się  wytworzyć  stałej  różnicy  tempera- 


doświadcze- 
nie Kapicy 


tur.  Hel  II  nie  wrze,  ponieważ  do  wytworzenia  się  pę- 
cherzyków pary  wewnątrz  cieczy  potrzebne  są  nie- 
wielkie lokalne  przegrzania  (fluktuacje  temperatury). 
Hel  II  paruje  tylko  z powierzchni  swobodnej. 

Podobnie  jak  pomiary  lepkości,  pomiary  współ- 
czynnika przewodnictwa  cieplnego  helu  II  nie  dają 
jednoznacznych  wyników.  Wartości  x zależą  od  geo- 
metrycznych szczegółów  aparatury  pomiarowej,  poza 
tym  nie  ma  proporcjonalności  między  strumieniem 
ciepła  i gradientem  temperatury.  Największe  wartości 
x uzyskuje  się  wtedy,  gdy  na  końcach  bardzo  wąskiej 
kapilary  wytworzy  się  niewielka  różnica  temperatur. 
Przy  przepływie  helu  II  przez  takie  wąskie  kapilary 
lub  szczeliny  uzyskuje  się  również  najmniejsze  war- 
tości współczynnika  lepkości.  Nasuwa  to  myśl  o związ- 
ku między  tymi  dwoma  zjawiskami.  Najwidoczniej 
transport  ciepła  w helu  II  ma  charakter  konwekcyjny 
i jest  związany  z bezlepkościowym  przepływem  cieczy. 
W przypadku  helu  II  nie  można  więc  mówić  o współ- 
czynniku przewodnictwa  cieplnego  w zwykłym  Zna- 

CZeniU.  . . . U 1 Tf 

Aby  wyjaśnić  proces  przenoszenia  ciepła  w nełu  u, 
przeprowadzono  szereg  doświadczeń.  W jednym  z 
nich,  wykonanym  przez  Kapicę,  małe  naczynie  De- 
wara  w kształcie  kolby  z wąską  szyjką  i z grzejnikiem 
elektrycznym  w środku  zostało  zanurzone  w helu  II. 
Naprzeciw  wylotu  szyjki  umieszczono  niewielką  tar- 
czę zawieszoną  wraz  z równoważącym  ją  ciężarkiem 
na  wadze  skręceń  (rys.  5).  Włączenie  grzejnika  do  ob- 
wodu prądu  powodowało  odchylenie  tarczy.  Po  wyłą- 
czeniu grzejnika  tarcza  wracała  w poprzednie  położe- 
nie. Tarcza  zachowywała  się  więc  tak,  jakby  była 
odpychana  przez  wypływający  z naczynia  strumień 


próżnia^ " 


grzejnik- 


mione,  to  mogłoby  się  poruszać  w kierunku  przeciw- 
nym do  wypływającego  strumienia,  jak  silnik  odrzu- 

towy.  . _ . , 

W innym  tego  typu  doświadczeniu  Kapica  wyko- 
rzystał siłę  odrzutu  wypływającego  strumienia  do 
uruchomienia  urządzenia  przypominającego  po- 


ciekły hel 

Rys.  5.  Układ  Kapicy  do  de- 
monstracji przepływu  skład- 
nika normalnego  helu  II 

cieczy.  Cieczy  w naczyniu  jednak  nie  ubywało,  a Ka- 
pica na  próżno  starał  się  wykryć  strumień  płynący 
w przeciwną  stronę,  tj.  wpływający  do  naczynia  (np. 
po  jego  ściankach).  W cieczy  nadpłynnej  mogą  istnieć 
zatem  dwa  rodzaje  ruchów:  jeden  ruch,  jak  w nor- 
malnej cieczy  lepkiej,  związany  z przekazywaniem 
pędu  ciałom  w niej  zanurzonym,  i drugi  ruch  odbywa- 
jący się  bez  wymiany  pędu  między  cieczą  i ciałem  sta- 
łym. Oczywiście,  gdyby  naczynie  nie  było  unierucho- 


ciekły  hel 


promieniowanie 


Rys.  6.  Młynek  odrzutowy  Kapicy.  Zaciem- 
nione części  młynka  są  wypełnione  ciekłym 
helem 


fontanna  helu 


kąpiel  helowa 

Rys.  7.  Zjawisko  fontannowe  w helu  II 

wszechnie  znany  młynek  Segnera  (rys.  6).  Zgięte  ra- 
miona tego  urządzenia  są  rurkami  prowadzącymi  do 
przestrzeni  zawartej  między  podwójnymi  ściankami 
cylindrycznego  naczynka  ze  szkła.  Młynek  wisi  na 
pionowej  podpórce,  wokół  której  może  się  swobodnie 
obracać.  Całość  jest  zanurzona  w nadpłynnym  helu. 
Jeśli  na  ścianki  młynka,  wyczernione  sadzą  od  strony 
wewnętrznej,  pada  smuga  światła,  to  młynek  się  obra- 
ca. Ruch  obrotowy  młynka  może  trwać  dowolnie 
długo,  gdyż  — podobnie  jak  w poprzednio  opisanym 
doświadczeniu  — cieczy  nie  ubywa  między  ściankami 
młynka.  Młynek  zatrzyma  się  dopiero  po  zaprzestaniu 
naświetlania,  czyli  przerwaniu  ogrzewania  cieczy 
znajdującej  się  między  ściankami  młynka.  Wypływa- 
jący z naczynia  strumień  powstaje  więc  w nagrzewanej 
cieczy  nie  powodując  jej  ubytku. 
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zjawisko 

fontannowe 


zjawisko 

termo- 

mechaniczne 


zjawisko 

mechano- 

kaioryczne 


wyjaśnienie 
doświadcze- 
nia Kapicy 


Podczas  innych  doświadczeń,  przeprowadzonych 
przez  grupę  badaczy  w Cambridge,  okazało  się,  że 
jeśli  do  naczynia,  w którym  ogrzewano  hel  II,  prowa- 
dziła cienka  kapilara  lub  wąskie  szczeliny,  to  ciśnienie 
w tym  naczyniu  wzrastało.  W najbardziej  widowisko- 
wym wariancie  tego  doświadczenia  ciekły  hel  pod 
wpływem  zwiększonego  ciśnienia  wytryskiwał  ku 
górze  w postaci  fontanny  (rys.  7).  Przyrząd  użyty 
w tym  doświadczeniu  składał  się  ze  szklanej  rurki  na- 
pełnionej proszkiem  szlifierskim  i zatkanej  kłębkiem 
waty.  Rurka  była  zanurzona  w helu  II  tak,  że  jej  górny 
koniec  wystawał  nieco  ponad  poziom  cieczy.  Gdy  na 
filtr  proszku  szlifierskiego  skierowano  smugę  światła, 
z górnego  końca  rurki  wytrysnął  strumień  cieczy. 

Mniej  widowiskowa,  lecz  bardziej  przejrzysta  od- 
miana tego  doświadczenia  pokazana  jest  na  rys.  8. 
Dwa  naczynia  zawierające  hel  II  połączone  są  cienką 


Rys.  8.  Szkic  ilustrujący  zjawisko  termomechaniczne  i mecha- 
nokaloryczne 


kapilarą.  Ogrzewanie  cieczy  w jednym  z tych  naczyń 
powoduje  podniesienie  się  jej  poziomu  w tym  naczy- 
niu, natomiast  obniżenie  — w drugim  naczyniu.  Róż- 
nica ciśnień  Ap  odpowiadająca  tej  różnicy  poziomów 
jest  proporcjonalna  do  wytworzonej  różnicy  tempera- 
tur A T.  Zjawisko  to  otrzymało  nazwę  zjawiska  termo- 
mechanicznego. Istnieje  również  zjawisko  odwrotne, 
zwane  zjawiskiem  mechanokalorycznym : jeżeli  w na- 
czyniach połączonych  kapilarą  wytworzy  się  mecha- 
nicznie różnicę  ciśnień,  to  ta  różnica  wywoła  różnicę 
temperatur.  Zależność  między  Ap  i AT  jest  taka  sama 
jak  poprzednio. 

Zakładając  pełną  odwracalność  tych  zjawisk  i trak- 
tując układ  naczyń  jako  maszynę  cieplną,  w której 
dostarczone  ciepło  zamienia  się  w całości  na  pracę 
podnoszenia  cieczy  na  wyższy  poziom,  London  zna- 
lazł następującą  zależność: 

Ap  = qSAT9 

gdzie  q oznacza  gęstość  helu  II,  zaś  S jest  entropią 
właściwą  cieczy  w naczyniu  o wyższej  temperaturze. 
Wyniki  doświadczeń  potwierdziły  słuszność  tego 
wzoru. 


Model  dwupłytowy 

Opisane  powyżej  zjawiska  można  poglądowo  wytłu- 
maczyć posługując  się  tzw.  modelem  dwupłynowym 
wprowadzonym  dla  helu  II  przez  L.  Tiszę.  W tym 
modelu  zakłada  się,  że  hel  II  jest  mieszaniną  dwu  pły- 
nów o różnych  własnościach  fizycznych.  Jeden  ze 
składników  helu  to  ciecz  normalna  podobnie  jak  hel  I; 
drugi  składnik  jest  pozbawiony  lepkości  i ma  równą 
zeru  entropię.  Procentowa  zawartość  składnika  nor- 
malnego zależy  od  temperatury.  W temperaturze  zera 
bezwzględnego  cala  ciecz  jest  nadpłynna.  W tempera- 
turze wyższej  od  zera  pojawia  się  składnik  normalny. 
W miarę  wzrostu  temperatury  udział  składnika  nor- 
malnego zwiększa  się  coraz  bardziej  i w temperaturze 
lambda  cała  ciecz  staje  się  normalna. 

Posługując  się  tym  modelem  możemy  wyjaśnić 
wynik  doświadczenia  Kapicy  następująco.  Ciecz 
ogrzewana  wewnątrz  zanurzonej  kolby  ma  tempera- 
turę wyższą  niż  otaczająca  kąpiel,  a więc  ma  większe 
stężenie  składnika  normalnego.  Hel  II  stara  się  wy- 
równać wszędzie  swój  skład  (podobnie  jak  wyrównuje 


się  w naczyniu  stężenie  roztworu),  dlatego  do  wnętrza 
kolby  wpływa  składnik  nadpłynny  nie  oddziałujący 
ze  ściankami  naczynia  ani  tarczą  wagi  skręceń,  nato- 
miast z kolby  wypływa  strumień  składnika  normalne- 
go i zachowuje  się  jak  zwykła  ciecz.  Jednak,  dopóki 
działa  grzejnik,  do  wyrównania  składu  cieczy  we- 
wnątrz i na  zewnątrz  kolby  nie  dochodzi,  gdyż  pod 
wpływem  ciepła  wydzielonego  w kolbie  dokonuje  się 
tam  ciągła  zamiana  składnika  nadpłynnego  na  nor- 
malny. Jeśli  wlot  do  naczynia  zanurzonego  w helu  II 
jest  bardzo  wąski  lub  zatkany  porowatym  korkiem 
(np.  z proszku  szlifierskiego),  a wewnątrz  naczynia 
temperatura  jest  wyższa  niż  w otaczającej  kąpieli  he- 
lowej, to  składnik  nadpłynny  może  łatwo  do  naczynia 
wpływać,  natomiast  składnik  normalny  przez  taką 
przegrodę  przedostaje  się  z trudnością.  W rezultaćie 
ciśnienie  wewnątrz  naczynia  wzrasta.  Nasuwa  się  tu 
analogia  z ciśnieniem  osmotycznym  wywołanym  róż- 
nicą stężeń  roztworów  (np.  soli)  rozdzielonych  prze- 
grodą przepuszczalną  dla  rozpuszczalnika,  lecz  nie- 
przepuszczalną dla  substancji  rozpuszczonej. 

Jeżeli  po  obu  stronach  porowatej  przegrody  lub 
w dwu  naczyniach  połączonych  cienką  kapilarą  wy- 
tworzymy w helu  II  różnicę  ciśnień,  to  pod  jej  wpły- 
wem przez  przegrodę  lub  kapilarę  będzie  przepływał 
niemal  wyłącznie  składnik  nadpłynny.  Ponieważ  skład- 
nik nadpłynny  nie  przenosi  z sobą  ciepła  (ściślej 
mówiąc,  nie  przenosi  entropii),  temperatura  w tej 
części  naczynia,  do  której  wpływa  składnik  nadpłyn- 
ny, obniża  się. 

Na  gruncie  modelu  dwupłynowego  zrozumiała  staje 
się  także  rozbieżność  wyników  pomiarów  lepkości 
dwiema  różnymi  metodami.  Przy  przepływie  cieczy 
przez  kapilarę  pod  wpływem  różnicy  ciśnień  zasadni- 
czą rolę  odgrywa  pozbawiony  lepkości  składnik  nad- 
płynny, podczas  gdy  obracający  się  walec  pociąga  za 
sobą  lepki  składnik  normalny,  a ten  z kolei  oddziałuje 
na  walec  wewnętrzny. 

Model  dwupłynowy  tłumaczy  także  doskonale 
przewodnictwo  cieplne  helu  II:  nawet  bardzo  mała 
różnica  temperatur  wytworzona  w helu  II  spowoduje 
natychmiastowy  przepływ  składnika  nadpłynnego  w 
kierunku  wyższej  temperatury  i odpływ  w kierunku 
przeciwnym  składnika  normalnego;  w rezultacie  tem- 
peratura się  wyrówna. 

Gęstość  helu  II  jest  sumą  gęstości  obu  jego  składni- 
ków: q = en-fe$.  Wskaźnik  n odnosi  się  do  gęstości 
składnika  normalnego,  wskaźnik  s — do  gęstości 
składnika  nadpłynnego.  Stosunek  g«/o,  czyli  stężenie 
składnika  normalnego,  jest — jak  już  wspominaliś- 
my— rosnącą  funkcją  temperatury.  Przebieg  tej  za- 
leżności wyznaczył  doświadczalnie  E.  Andronikaszwili 
w 1946  r.  Przyrząd,  którym  się  posługiwał  składał  się 
ze  stosu  cienkich  krążków  mikowych,  nasadzonych 
w niewielkich  odstępach  na  wspólną  oś  (rys.  9).  Układ 
krążków  był  zawieszony  na  sprężystej  nici,  mógł  więc 
wykonywać  drgania  skrętne  wokół  swej  osi.  Umiesz- 
czone na  osi  lusterko  umożliwiało  obserwację  ruchu 
drgającego.- 

Okres  r0  drgań  skrętnych  takiego  układu  krążków 
zależy  od  jego  momentu  bezwładności  B0  i stałej  skrę- 
cenia nici  k: 


stężenie 

składnika 

normalnego 


nić 

sprężysta 


Ólusterko 


Po  zanurzeniu  w helu  II  układ  krążków  podczas  drgań 
porywa  z sobą  składnik  normalny,  który  więźnie  mię- 
dzy krążkami,  i moment  bezwładności  układu  zwięk- 
sza się  do  B = 2?0-ri?He  gdzie  BHe  jest  momentem  bez- 
władności cieczy  uwięzionej  między  krążkami  i poru- 
szającej się  wraz  z nimi,  zależnym  od  jej  gęstości. 
Okres  drgań  wyniesie  teraz: 


T = 2k 


V 


B0~h  Bjje 
k 


Składnik  nadpłynny,  jako  pozbawiony  lepkości,  nie 
jest  porywany  przez  poruszające  się  krążki.  Mierząc 


Rys.  9.  Układ  An- 
dronikaszwilicgo  do 
pomiaru  stężenia 
składnika  normal- 
nego helu  II 
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więc  okresy  drgań  układu  w zależności  od  tempera- 
tury można  znaleźć  funkcję  qJq  =f(T).  Wykres  tej 
funkcji  przedstawia  rys.  10. 


Rys.  10.  Zależność  stęże- 
nia składnika  normalne- 
go helu  II  od  tempera- 
tury; (pi+pn)lp  *=  1 


Fale  temperaturowe,  czyli  drugi  dźwięk 

Model  dwupłynowy  nie  tylko  wyjaśniał  większość 
znanych  w tym  czasie  faktów  doświadczalnych  zwią- 
zanych z helem  II,  ale  także  pozwalał  przewidywać 
nowe  zjawiska.  Na  podstawie  tego  modelu  Tisza  prze- 
widział możliwość  występowania  w helu  II  fal  tempe- 
raturowych, zwanych  później  drugim  dźwiękiem. 

W nadpłynnym  helu,  podobnie  jak  w każdej  innej 
cieczy,  mogą  rozprzestrzeniać  się  zwykle  fale  dźwię- 
kowe, polegające  na  drganiach  gęstości  cieczy.  Oba 
składniki  helu  II  poruszają  się  wtedy  jak  jedna  całość 
drgając  w zgodnej  fazie.  Prowadzi  to  do  kolejnych 
zgęszczeń  i rozrzedzeń  cieczy  rozprzestrzeniających 
się  ruchem  falowym.  Prócz  tego  zwykłego  (pierwsze- 
go) dźwięku  w nadpłynnym  helu  możliwy  jest  jeszcze 
inny  ruch  falowy,  kiedy  oba  składniki  drgają  w prze- 
ciwnych kierunkach,  tzn.  z przesunięciem  w fazie  o kąt 


b) 


Rys.  11.  Wyjaśnienie  powstawania  pierwszego  (a)  i drugiego  (b) 
dźwięku  w helu  II  na  podstawie  modelu  dwupłynowego.  Zgęsz- 
czenie  składnika  nadpłynnego  oznaczono  jasnymi  krążkami, 
zgęszczenie  składnika  normalnego  — krążkami  zaczernionymi 


pierwszy  dźwięk 


drugi  dźwięk 


n (rys.  11).  Nie  są  to  więc  drgania  gęstości  cieczy,  lecz 
drgania  stężenia  obu  jej  składników.  Inaczej  mówiąc, 
w obranym  dowolnie  miejscu  w cieczy  zmienia  się 
okresowo  wartość  stosunku  (?«/(?»  tak,  że  suma 
e,-j_£n  = q pozostaje  stała.  Ponieważ  zmiana  stęże- 
nia jednego  ze  składników  jest  równoważna  zmianie 
temperatury,  takie  zaburzenie  rozprzestrzenia  się  jako 
prędkość  fala  temperaturowa.  Prędkość  drugiego  dźwięku  jest 
drugiego  funkcją  temperatury  i jest  mniejsza  od  prędkości 
dźwięku  pierwszego  dźwięku  (rys.  12).  Powyżej  punktu  lambda. 


Rys.  12.  Zależność 
prędkości  pierwszego 
i drugiego  dźwięku  od 
temperatury 


gdy  nie  ma  już  składnika  nadpłynnego,  fala  drugiego 
dźwięku  istnieć  nie  może.  Fala  drugiego  dźwięku  nie 
mogłaby  również  istnieć  w temperaturze  dokładnie 
równej  zeru  bezwzględnemu,  gdyż  wtedy  ciekły  hel 
musiałby  być  w stanie  niewzbudzonym,  każde  zaś 


Rys  13.  Schemat  układu  Pieszkowa  do  pomiaru  prędkości  dru- 
giego dźwięku.  Termometr  2 na  dnie  rury  rezonansowej  służy 'do 
ustalenia  położenia  grzejnika  3.  Aby  w rurze  mogła  powstać  fala 
stojąca,  odległość  grzejnika  od  dna  rury  musi  być  równa  wielo- 
nrvłr>wv  dłllffOŚci  fali 


wzbudzenie  oznacza,  że  temperatura  różni  się  od  zera, 
chociażby  nawet  o niewielką  wartość. 

Prędkość  drugiego  dźwięku  w funkcji  temperatury 
po  raz  pierwszy  zmierzył  W.  Pieszkow  (1944). 
Omówimy  tutaj  późniejszą,  udoskonaloną  wersję 
jego  doświadczenia.  Jako  źródło  drugiego  dźwięku 
służył  grzejnik  elektryczny  o bardzo  malej  bezwład- 
ności cieplnej,  zasilany  sinusoidalnym  prądem  zmien- 
nym. Odbiornikiem  (detektorem)  fal  temperaturo- 
wych był  termometr  oporowy  zasilany  prądem  stałym. 
Zmiany  temperatury  powodowały  zmiany  oporu  ter- 
mometru, a więc  drgania  spadku  napięcia  na  nim,  te 
zaś  łatwo  można  wykryć  i określić  ich  częstość.  Pul- 
sacje  napięcia  na  termometrze  miały  dwukrotnie  wyż- 
szą częstość  niż  zmiany  prądu  w grzejniku,  można  je 
więc  było  odróżnić  od  elektromagnetycznego  tła  po- 
chodzącego od  grzejnika.  Zarówno  grzejnik  jak  i ter- 
mometr nawinięte  były  w postaci  płaskich  spirali 
z bardzo  cienkiego  drutu  i umieszczone  w rurze  rezo- 
nansowej (rys.  13).  Pizy  odpowiednim  położeniu 
grzejnika  drugi  dźwięk  odbijał  się  od  dna  rury  i two- 
rzył falę  stojącą.  Zmieniając  odległość  termometru  od 
dna  rury  można  było  znaleźć  położenia  węzłów  i strza- 
łek tej  fali,  a więc  określić  jej  długość.  Jeśli  znana  jest 
długość  fali  l i częstość  drgań  temperatury  v,  można 
obliczyć  prędkość  drugiego  dźwięku:  u2  = 


uzwojenie 

termometru 


Pełzająca  warstwa  i prędkość  krytyczna 

Warstwa  cieczy  pełzająca  ruchem  nadpłynnym  po  po- 
wierzchni ciała  stałego  — to  jeszcze  jedna  osobliwość 
związana  z helem  II.  Warstwa  taka,  o grubości  rzędu 
10~6  cm,  tj.  około  50  średnic  atomowych,  pokrywa 
każdą  powierzchnię  ciała  stałego  stykającego  się  z he- 
lem II  i porusza  się  po  niej  bez  tarcia  pod  wpływem  siły 
grawitacji  albo  gradientu  temperatury.  Po  ściankach 
kriostatu  z helem  II  wspina  się  więc  do  góry  w kierun- 
ku wzrastającej  temperatury  cienka  nadpłynna  war- 
stwa i stopniowo  wyparowuje  stykając  się  z coraz 
cieplejszymi  ściankami. 


Rys.  14.  Pełzanie  warstwy  helu  II  po  ściankach  naczynia 


Jeżeli  do  kąpieli  z helu  II  wstawimy  pustą  zlewkę  p@łz@nie 
tak,  aby  jej  dno  znalazło  się  poniżej  poziomu  otacza-  warstwy 
jącej  ją  cieczy  (rys.  14),  to  ciecz  pełzając  po  ściankach  helu 
zlewki  będzie  ją  stopniowo  napełniać  aż  do  chwili,  gdy 
wyrównują  się  poziomy  cieczy  wewnątrz  i na  zewnątrz 
zlewki.  Jeśli  teraz  podniesiemy  zlewkę,  to  hel  będzie 
z niej  wypełzać  po  ściankach  aż  do  kolejnego  wyrów- 
nania poziomów.  Jeśli  zaś  wyjmiemy  zlewkę  z helem  II 
z kąpieli,  to  z jej  dna  będą  kapać  krople  cieczy  i zlewka 
opróżni  się.  Tak  więc  He  II  w polu  grawitacyjnym 
zawsze  stara  się  zająć  możliwie  najniższy  poziom. 

Objętość  cieczy  (w  cm3),  którą  przenosi  pełzająca 
warstwa  w ciągu  sekundy  przez  1 cm  długości  obwo- 
du zlewki,  jest  niezależna  od  różnicy  poziomów  cie- 
czy, podobnie  jak  prędkość  przepływu  składnika  nad- 
płynnego w cienkich  kapilarach  jest  niezależna  od 
różnicy  ciśnień.  Nasuwa  się  więc  przypuszczenie,  że 
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prędkość  istnieje  pewna  krytyczna  prędkość  przepływu  ograni- 
krytyczna  czająca  ilość  przepływającej  cieczy.  Przepływ  z pręd- 
kością większą  niż  krytyczna  utraciłby  swój  beztar- 
ciowy  charakter. 

Rys.  15  przedstawia  temperaturową  zależność  ilości 
prcenoszonej  cieczy  przez  1 cm  długości  obwodu  zlew- 
ki w ciągu  sekundy.  W przedziale  temperatur  od  1 do 


Rys.  15.  Prędkość  pełza- 
nia warstwy  helu  II  w 
zależności  od  tempera- 
tury. Na  osi  rzędnych 
naniesiona  jest  objętość 
cieczy  przeniesionej  w 
ciągu  1 s przez  odcinek 
o długości  1 cm  prosto- 
padły do  kierunku  ru- 
chu warstwy 


1,5  K ilość  ta  jest  prawie  niezależna  od  temperatury 
i wynosi  ok.  7,5  10"s  cm3/(cm-s);  przy  grubości 
warstwy  10~6  cm  prędkość  krytyczna  wynosi  75  cm/s. 
Jest  to  wielkość  tego  samego  rzędu,  co  wyniki  pomia- 
rów prędkości  przepływu  przez  cienkie  kapilary. 


Wzbudzenia  elementarne  w helu  U 

Posługując  się  modelem  dwupłynowym  do  wyjaśnie- 
nia własności  helu  II  nie  powinniśmy  zapominać,  że 
model  ten  — to  tylko  poglądowy  sposób  opisu  zjawisk 
występujących  w cieczy  kwantowej.  W rzeczywistości 
hel  II  nie  składa  się  z dwu  cieczy  różniących  się  między 
sobą  własnościami  fizycznymi,  lecz  stanowi  jeden 
układ  złożony  z identycznych  atomów. 

Jedną  z zasad  mechaniki  kwantowej  jest  zasada 
nierozróżnialności  jednakowych  cząstek  układu. 
Zgodnie  z tą  zasadą  wszystkie  atomy  helu  II  zawarte 
w jednym  naczyniu  stanowią  jakby  jedną  gigantyczną 
molekułę,  w której  ruch  jednego  atomu  nie  może  być 
niezależny  od  innych  atomów.  Nadpłynność  jest  zja- 
wiskiem kolektywnym,  właściwym  całemu  zbiorowi- 
sku atomów;  nie  można  mówić  o nadpłynności  po- 
szczególnych atomów.  Nie  ma  więc  żadnych  podstaw, 
aby  niektórym  atomom  helu  II  przypisywać  inne  włas- 
ności niż  pozostałym.  Cała  ciecz  powinna  być  rozpa- 
trywana jako  jedna  całość. 

Autorem  takiego  podejścia  do  zagadnienia  nadpłyn- 
ności helu  II  był  L.  D.  Landau.  Swą  teorię  nadpłyn- 
ności Landau  opracował  w 1941  r.,  a więc  prawie 
w tym  samym  czasie,  kiedy  ukazała  się  publikacja 
Tiszy  dotycząca  modelu  dwupłynowego.  Teoria  Lan- 
daua  przewidywała  również  możliwość  występowania 
drugiego  dźwięku  w helu  II,  przy  czym  jej  wyniki  le- 
piej zgodziły  się  z późniejszymi  danymi  doświadczal- 
nymi, niż  oszacowanie  Tiszy.  A oto  podstawowe  za- 
łożenia teorii  Landaua: 

teoria  W temperaturze  zera  bezwzględnego  ciekły  hel 
nadpłynności  znajduje  się  w stanie  podstawowym,  tzn.  ma  najniższą 
Land&ua  energię.  Jest  to  energia  stanu  podstawowego,  czyli 
energia  drgań  zerowych.  Podobnie  jak  w przypadku 
molekuły  znajdującej  się  w stanie  podstawowym, 
energia  ta  nie  jest  równa  zeru.  W temperaturach  wyż- 
szych od  zera  ciecz  przechodzi  w jeden  ze  swoich  sta- 
nów wzbudzonych.  Oznacza  to,  że  w cieczy  pojawia  się 
jakiś  ruch,  inny  niż  drgania  zerowe.  Jeśli  temperatura 
nie  jest  zbyt  wysoka,  to  ciecz  w stanie  wzbudzonym 
ma  małą  energię  (mierzoną  od  poziomu  energii  stanu 
podstawowego).  Małej  energii  odpowiadają  proste 
rodzaje  ruchów,  np.  lokalne  zgęszczenia  cieczy  prze- 
mieszczające się  w jej  objętości,  czyli  fala  dźwiękowa. 

Każda  fala  dźwiękowa  niesie  z sobą  określoną  ener- 
gię e i pęd  p związane  zależnością: 

e = up , (2) 

gdzie  u jest  prędkością  dźwięku.  Fali  dźwiękowej 
fonony  można  formalnie  przyporządkować  pewną  cząstkę 
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obdarzoną  energią  e i pędem  p.  Cząstka  taka  pod 
nazwą  fononu  jest  dobrze  znana  z teorii  ciała  stałego 
jako  kwant  drgań  sieci  krystalicznej  (kwant  dźwięku). 

O tym,  że  kwanty  niskoenergetycznych  wzbudzeń 
w helu  II  można  utożsamić  z kwantami  wzbudzeń 
elementarnych  w sieci  krystalicznej,  świadczy  jedna- 
kowa temperaturowa  zależność  „sieciowego”  ciepła 
właściwego  i ciepła  właściwego  helu  II  w pobliżu  zera 
bezwzględnego.  Ciepło  właściwe  helu  II,  podobnie  jak 
ciepło  właściwe  sieci  krystalicznej  ciała  stałego,  jest 
proporcjonalne  do  trzeciej  potęgi  temperatury. 

W temperaturach  wyższych  od  0,6  K ciepło  właści-  rotony 
we  C helu  II  odbiega  od  zależności  C ~ r3,  co  świad- 
czy o tym,  że  istotną  rolę  zaczyna  odgrywać  inny  typ 
wzbudzeń  elementarnych.  Te  dodatkowe  wzbudzenia 
Landau  nazwał  rotonami,  wiążąc  je  z elementarnymi 
zawirowaniami  w cieczy  kwantowej.  Rotony  wcześniej 
nie  były  znane  i po  raz  pierwszy  wprowadzono  je  w 
związku  z zagadnieniem  nadpłynności.  Zależność 
pomiędzy  energią  i pędem  rotonu  nie  jest  już  zależ- 
nością liniową. 

Funkcja  charakteryzująca  zależność  energii  od  pędu 
nazywa  się  widmem  energetycznym  układu.  Aby  do- 
pasować widmo  energetyczne  helu  II  do  wyników 
pomiarów  ciepła  właściwego  Landau  zaproponował 
dla  rotonu  następującą  zależność  energii  od  pędu: 

(s 

A oznacza  tu  najmniejszą  wartość  energii,  jaką  może 
mieć  roton  (wtedy  jego  pęd  jest  równy  p0),  p jest  masą 
efektywną  rotonu.  Danym  doświadczalnym  odpowia- 
dają następujące  wartości  A/k  — 8,5  Kfp  — 0,16  mHe, 
p0/k  — 1,9- 108  cm-1  (k  — stała  Boltzmanna,  mHe  — 
masa  atomu  He,  k — stała  Plancka  dzielona  przez  2tt). 

Rys.  16  przedstawia  widmo  wzbudzeń  energetycz- 
nych He  II.  Pogrubionymi  liniami  oznaczono  części 
widma  o największej  koncentracji  wzbudzeń. 


Rys.  16.  Widmo  energetyczne  helu  II.  Zgrubienia  na  krzywej 
wskazują  na  najczęściej  występujące  wzbudzenia 

Fonony  i rotony  (a  także  inne  wzbudzenia  wystę- 
pujące np.  w ciele  stałym)  różnią  się  od  cząstek  ele- 


Rys.  17.  Zmiana  pędu  neutronu  po  rozproszeniu  w helu  II.  Plt 

P i pęd  neutronu  przed  i po  rozproszeniu, p pęd  wytworzonego 
wzbudzenia 


kwazi- 

cząstki 


widmo 
energetyczne 
helu  81 


przepływ 
bez  tarcia 
w teorii 
Landaua 


mentarnych  takich  jak  swobodny  elektron  czy  neutron 
tym,  że  są  nierozłącznie  związane  z ośrodkiem,  w któ- 
rym powstają  i w którym  poruszają  się:  poza  tym 
ośrodkiem  wzbudzenia  samodzielnie  istnieć  nie  mogą. 
W odróżnieniu  od  „zwykłych”  cząstek  elementarnych 
wzbudzenia  energetyczne  nazywamy  kwazicząstkami 
(niby-cząstkami). 

W 1957  r.  R.P.  Feynman  podał  sposób  doświadczal- 
nego wyznaczenia  widma  wzbudzeń  elementarnych 
w helu  II.  Zaproponował  mianowicie,  aby  do  tego  celu 
wykorzystać  rozpraszanie  w ciekłym  helu  wiązki  mo- 
noenergetycznych  neutronów.  Neutron  przechodząc 
przez  hel  II  może  przekazać  cieczy  część  energii  i pędu, 
czyli  może  wytworzyć  w cieczy  wzbudzenie  elementar- 
ne. W wyniku  tego  procesu  neutron  odchyli  się  o kąt 
<P  od  swego  pierwotnego  kierunku  (rys.  17).  Jeżeli  Ex 

i Px  oznaczają  energię  i pęd  neutronu  przed  rozpro- 
szeniem, a Ez  i P2  — po  rozproszeniu,  to  ze  względu 
na  prawo  zachowania  energii  i pędu  można  napisać: 

e = E1  — E2t  1 
p = Pi -Ą,  I 

czyli 

pi  pi 

s — 1 — 2 

2 m 2 m * 

p = Pl-Pl-lP^cosy, 


(4a) 

(4b) 


gdzie  e i p jest  energią  i pędem  wytworzonego  wzbu 
dzenia,  m — masą  neutronu.  Mierząc  Ply  P2  i kąt  y 
można  znaleźć  zależność  energii  e wzbudzenia  od  jego 
pędu  p,  czyli  wyznaczyć  widmo  energetyczne  helu  II. 
Wyniki  pomiarów  potwierdziły  słuszność  propozycji 
Landaua  dotyczącej  kształtu  krzywej  widmowej. 

Prześledzimy  teraz,  jak  teoria  Landaua  tłumaczy 
zjawisko  nadpłynności,  tzn.  przepływu  bez  tarcia. 
Rozpatrzmy  hel  II  w temperaturze  T = OK,  przepły- 
wający przez  kapilarę  z prędkością  v.  Jeśli  ciecz 
doznaje  tarcia  o ścianki  rurki,  jej  energia  kinetyczna 
rozprasza  się  w postaci  ciepła.  Nagrzewanie  się  cieczy 
oznacza  przejście  w stan  wzbudzony.  Ale  układ  kwan- 
towy, jakim  jest  hel  II,  nie  może  zmieniać  swej  energii 
w sposób  ciągły.  Aby  ciecz  kwantowa  mogła  przejść 
ze  stanu  podstawowego  w najbliższy  stan  wzbudzony, 
czyli  zmienić  swą  energię  o e = e(p),  musi  powstać 
wzbudzenie  elementarne,  czyli  kwazicząstka  o energii 
e i pędzie  p.  Energia  i pęd  wytworzonej  kwazicząstki 
są  tu  określone  w układzie  odniesienia  spoczywającym 
względem  cieczy,  a więc  poruszającym  się  względem 
ścian  rurki  z prędkością  v. 

W układzie  odniesienia  obserwatora  związanego 
nieruchomo  ze  ścianami  rurki  energia  wzbudzenia, 

czyli  zmiana  energii  cieczy,  wynosi  s+pvy  zgodnie  ze 
znanymi  z mechaniki  wzorami  transformacyjnymi 
dla  energii  i pędu.  Wartość  tej  zmiany  energii  cieczy 
musi  być  ujemna,  gdyż  dla  obserwatora  nieruchome- 
go względem  ścian  rurki  energia  kinetyczna  cieczy  na 
skutek  tarcia  o ściany  może  się  tylko  zmniejszać.  Ma- 
my więc:  __ 

p v < 0.  (5) 


Wyrażenie  po  lewej  stronie  znaku  nierówności  ma 
najmniejszą  wartość  wtedy,  gdy  wektor  prędkości 

cieczy  7 i wektor  pędu  kwazicząstki  p mają  przeciwne 
zwroty.  Wtedy 

e—pv  < 0, 


czyli 


€ 

v > — . 

P 


(6) 


A więc  minimalna  wartość  prędkości  cieczy  ^min, 
która  jest  konieczna  do  wytworzenia  wzbudzenia  ele- 
mentarnego, nie  może  być  mniejsza  niż  ( e/p)min . Przy 
mniejszych  prędkościach  przepływu  nie  mogą  powstać 
wzbudzenia  w nadpłynnym  helu  i przepływ  będzie  się 
odbywał  bez  tarcia. 


Zauważmy,  że  stosunek  sjp  na  wykresie  zależności 
e od  p jest  tangensem  kąta  a między  osią  odciętych 
a prostą  przechodzącą  przez  początek  układu  i punkt 
o współrzędnych  p,  e.  Najmniejszy  kąt  amin  = 
= (e/p) min  utworzy  styczna  do  krzywej  ey?)w  punkcie 
leżącym  blisko  minimum  na  rotonowej  części  widma 
(na  rys.  16  styczna  ta  jest  oznaczona  linią  przerywa- 
ną). Tangens  najmniejszego  kąta  odpowiada  prędkości 
Vmin  = 60  m/s.  Jest  to  wartość  ok.  sto  razy  większa 
niż  krytyczne  prędkości  przepływu  obserwowane  w 
doświadczeniach.  Powód  tej  rozbieżności  zostanie  wy- 
jaśniony później. 

Aby  mogła  pojawić  się  nadpłynność,  kąt  amin  nie 
może  być  równy  zeru  dla  żadnego  punktu  na  krzywej 
e(p).  Inaczej  mówiąc,  oś  rzędnych  nigdzie  nie  może 
być  styczna  do  krzywej  widma.  Tak  mogłoby  się  zda- 
rzyć, gdyby  np.  widmo  rotonów  miało  postać  opisaną 
nie  wzorem  (3)  lecz  wzorem  e = p2/2m,  jak  widmo 
cząstek  swobodnych,  albo  gdyby  we  wzorze  (3)  nie 
było  wyrazu  A oznaczającego  minimalną  wartość 
dozwolonych  energii  rotonu.  Wartość  A nazywana 
jest  przerwą  energetyczną  w widmie  dozwolonych 
wartości  energii  rotonu. 

Gdyby  kąt  amin  był  równy  zeru,  to  tgamin  = vmin  = 
= 0 i każda  prędkość  przepływu  większa  od  zera  po- 
wodowałaby utratę  nadpłynności,  czyli  nadpłynność 
w ogóle  nie  mogłaby  wystąpić.  Warunek  tgamin  > 0 
nazywa  się  kryterium  Landaua  wystąpienia  nadpłyn- 
ności. 

Rozpatrzyliśmy  przepływ  helu  II  przez  rurkę  w tem- 
peraturze T = 0 K.  W temperaturach  wyższych  od 
zera  ciecz  znajduje  się  w jednym  ze  swoich  stanów 
wzbudzonych.  Zamiast  mówić,  że  ciecz  jest  w w-tym 
stanie  wzbudzonym,  możemy  powiedzieć,  że  w cieczy 
powstało  n elementarnych  wzbudzeń.  W tym  ujęciu 
przejście  cieczy  w kolejny  stan  wzbudzony  jest  równo- 
ważne wytworzeniu  jeszcze  jednej  kwazicząstki. 

Jeśli  temperatura  cieczy  nie  jest  zbyt  wysoka,  to 
koncentracja  wzbudzeń  w cieczy  jest  mała  i wzbudze- 
nia te  można  traktować  jako  niezależne  od  siebie. 
W temperaturach  bliskich  Tx  nie  można  już  zaniedbać 
oddziaływań  wzajemnych  między  wzbudzeniami  i kon- 
cepcja wzbudzeń  elementarnych  staje  się  mało  przy- 
datna. Poniżej  T = 1,8  K możemy  jednak  gaz  wzbu- 
dzeń elementarnych  uważać  za  gaz  doskonały,  tzn. 
możemy  pominąć  oddziaływania  wzajemne  cząstek 
tego  gazu. 

Kiedy  wzbudzeń  jest  dużo,  częściej  się  z sobą  zde- 
rzają, czas  ich  życia  At  określony  wzajemnymi  zderze- 
niami jest  więc  krótki,  a ponieważ  z zasady  nieokreślo- 
ności Heisenberga  wynika,  że  As  At  = hy  to  nieokreś- 
loność energii  As  wzbudzeń  jest  duża,  porównywalna 
z ich  własnymi  energiami  e.  Wtedy  niecelowe  jest  po- 
sługiwanie się  pojęciem  wzbudzeń,  którym  nie  można 
przyporządkować  określonej  energii. 

Ponieważ  wyprowadzając  kryterium  nadpłynności 
nigdzie  nie  wykorzystano  założenia  o nieistnieniu 
wzbudzeń  elementarnych  w cieczy,  kryterium  to  po- 
zostaje słuszne  także  i dla  T > 0.  A więc  przy  pręd- 
kościach przepływu  mniejszych  niż  vmin  nowe  wzbu- 
dzenia tworzyć  się  nie  będą.  Jednak  istniejące  już  w 
cieczy  wzbudzenia  mogą  oddziaływać  ze  ściankami 
naczynia  lub  kapilary.  Zachowują  się  one  jak  cząstecz- 
ki normalnego  gazu,  wymieniają  więc  ze  ściankami 
swą  energię  i pęd.  Gaz  wzbudzeń  elementarnych  od- 
powiada więc  temu,  co  w modelu  dwupłynowym 
nazwaliśmy  składnikiem  normalnym. 


Kwantowane  wiry 

Pozostała  do  wyjaśnienia  sprawa,  dlaczego  obserwo- 
wane krytyczne  prędkości  przepływu  są  prawie  sto 
razy  mniejsze  niż  te,  które  wynikają  z kryterium  Lan- 
daua. Landau  w swej  teorii  uwzględnił  tylko  dwa  ro- 
dzaje wzbudzeń  w helu  II:  fonony  i rotony.  W rzeczy- 
wistości prócz  tych  wzbudzeń  elementarnych  w nad- 
płynnym helu  mogą  tworzyć  się  wzbudzenia  innego 
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26  - Encyklopedia  fizyki  współczesnej 
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Rys.  19.  Orientacja 
wektora  wirowości 
(wektora  prędkości 
kątowej  jądra  wiru) 
względem  wektora 
prędkości  liniowej 


typu,  tzw.  kwantowane  wiry.  Są  to  wzbudzenia  ma- 
kroskopowe — w ruchu  wirowym  bierze  udział  duża 
liczba  atomów  helu.  Energia  wzbudzenia  przypadają- 
ca na  jeden  atom  jest  mała  — do  wytworzenia  wiru 
wystarczają  więc  małe  prędkości  przepływu. 

Krytyczna  prędkość  związana  z wytwarzaniem  ma- 
kroskopowego wiru  jest  odwrotnie  proporcjonalna 
do  średnicy  rurki,  przez  którą  przepływa  hel  II. 
W szerokich  rurkach  prędkość  krytyczna  jest  bardzo 
mała  i dlatego  w takich  rurkach  trudno  jest  obser- 
wować nadpłynność.  Zależność  prędkości  krytycznej 
od  średnicy  rurki  jest  zrozumiała:  im  szersza  rurka, 
tym  łatwiej  może  się  w niej  wytworzyć  makroskopowy 
wir. 

Wiry  tworzą  się  również  w płynach  klasycznych, 
zarówno  w cieczach,  jak  i w gazach.  Są  to  jednak  wiry 
o dużych,  a często  nawet  ogromnych  rozmiarach. 
Wir  w wodzie  można  obserwować  np.  przy  wypusz- 
czaniu wody  z wanny  przez  otwór  odpływowy  w dnie. 
W powietrzu  niekiedy  tworzą  się  wiry  nazywane  trą- 
bami powietrznymi. 

Wir  obraca  się  wokół  pewnej  osi,  która  nie  musi 
być  linią  prostą.  Środkowa  część  wiru,  tzw.  jądro, 
obraca  się  jak  bryła  sztywna,  ze  stałą  prędkością 
kątową  co,  a więc  prędkość  liniowa  vw  cząstek  we- 
wnątrz jądra  wiru  jest  proporcjonalna  do  odległości 
r od  osi  obrotu,  czyli  vw  = or.  Na  zewnątrz  jądra 
ciecz  lub  gaz  wiruje  w ten  sposób,  że  prędkość  li- 


Rys.  18.  Zależność  prędkości  liniowej  v cząsteczek  wirującego 
płynu  od  odległości  r od  osi  wiru;  R promień  jądra  wiru 


niowa  jest  odwrotnie  proporcjonalna  do  odległość7 
od  środka  wiru  vz  — K/r  (rys.  18).  Na  obwodzie  ją- 
dra o promieniu  R obie  prędkości  są  sobie  równe, 
czyli  o)R  = K/R , skąd: 


K = coRK  (17) 

Wielkość  K charakteryzuje  dany  wir  i nazywa  się  na- 
tężeniem wiru.  Często  posługujemy  się  również  po- 
jęciem cyrkulacji  lub  wielkości  od  niej  dwa  razy 
mniejszej  i nazywanej  strumieniem  wirowości.  Stru- 
mień wirowości,  określony  jako  I = nK  = oo  nR2, 
jest  więc  iloczynem  wartości  wektora  wirowości 

co  (czyli  wektora  prędkości  kątowej)  i powierzchni 
poprzecznego  przekroju  jądra.  Wektor  co  jest  równo- 
legły do  osi  wiru,  czyli  prostopadły  do  wektora  v , 
zaś  jego  zwrot  określa  reguła  śruby  prawoskrętnej  : 

jeśli  obracamy  śrubę  w kierunku  v , to  wkręca  się  ona 
w kierunku  co  (rys.  19). 

Strumień  wirowości  jest  stały  wzdłuż  osi  wiru. 
W cieczy  doskonałej,  tj.  pozbawionej  lepkości  i nie- 
ściśliwej, jest  on  również  stały  w czasie,  czyli  wir  nie 
może  się  wytworzyć,  a jeśli  już  istnieje,  to  nie  może 
zniknąć.  Pod  tym  względem  hel  II  nie  może  być  uwa- 
żany za  ciecz  doskonałą. 

Moment  pędu  atomu  helu  krążącego  dokoła  jądra 
wiru  jest  równy  mnevr  (wne  oznacza  masę  atomu 
helu).  Podobnie  jak  w wypadku  elektronu  krążącego 
wokół  jądra  atomowego,  moment  pędu  nie  może 
przybierać  wartości  dowolnej,  lecz  musi  być  krotno- 
ścią h.  Ponieważ  v = K/r,  moment  pędu  atomu  helu 
w wirze  musi  spełniać  warunek:  othcK  = nh,  czyli 
I = n(h/2mtie)>  gdzie  n jest  liczbą  całkowitą.  Wiry  two- 
rzące się  w helu  II  są  więc  skwantowane,  czyli  ich 
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strumień  wirowości  I = rcKjest  całkowitą  krotnością  kwanty 
kwantu  strumienia  równego  h/lm^  = 0,5  • 10-3  cm2/s.  strumienia 
Wiry  w helu  II  można  wytworzyć  przez  wprowa-  wirowości 
dzenie  naczynia  z helem  w ruch  obrotowy.  Włókna 
wirowe  są  wtedy  równoległe  do  osi  obrotu  naczynia 
i rozciągają  się  od  dna  naczynia  do  swobodnej  po- 
wierzchni cieczy.  Wiry  zaczną  się  tworzyć,  gdy  pręd- 
kość kątowa  Q naczynia  przekroczy  pewną  wartość 


Rys.  20.  Zależność 
momentu  pędu  helu 
II  od  prędkości  kąto- 
wej obracającego  się 
naczynia 


jąca 


ciecz 
wirująca 
z naczy- 
niem 


ciecz 


nad- 


płynna 


prędkość  kątowa  naczynia  Q 


krytyczną  QC1  zależną  od  średnicy  naczynia.  W miarę 
wzrostu  Q coraz  więcej  wirów  pojawia  się  w cieczy 
i moment  pędu  L cieczy  wzrasta.  Gdy  Q osiągnie 
drugą  wartość  krytyczną  £C2,  cała  ciecz  będzie  wiro- 
wać jak  ciecz  normalna  i L = MQ,  gdzie  M — masa 
cieczy  (rys.  20). 

Próby  doświadczalnego  potwierdzenia  kwantowa- 
nia wirów  w helu  II  przez  długi  czas  kończyły  się  nie- 
powodzeniem. Dopiero  W.  Vinen  w 1961  r.  wykazał 
istnienie  kwantów  strumienia  wirowości.  Badał  on, 
jak  zachowuje  się  drgająca  struna,  dokoła  której 
istnieje  cyrkulacja  cieczy.  Na  strunę  działa  wtedy  siła 
znana  w hydrodynamice  jako  siła  Magnusa.  Siła  ta 
jest  prostopadła  do  kierunku  wektora  wirowości  i do 
prędkości  struny  względem  niewirującej  cieczy,  tj. 
cieczy  odległej  od  jądra  wiru.  Jest  ona  także  propor- 
cjonalna do  tych  wielkości.  Badania  wykazały,  że 
cyrkulacja  helu  II  dokoła  struny  ma  skwantowane 
wartości. 

Najbardziej  przekonywającego  dowodu  istnienia 
kwantów  strumienia  wirowości  dostarczyli  G.W.  Rey- 
field  i F.  Reif,  którzy  mierzyli  szybkość  poruszania 
się  jonów  helu  w cieczy  nadpłynnej.  Jon  helu  zacho- 
wuje się  jak  obca  cząstka  w helu  II  i podczas  ruchu 
zderza  się  z wzbudzeniami  cieplnymi,  czyli  doznaje 
tarcia.  Celem  doświadczenia  było  wyznaczenie  liczby 
wzbudzeń  elementarnych  jako  funkcji  temperatury. 

Jony  helu  uzyskiwały  prędkość  początkową  w polu 
elektrycznym  i następnie  poruszały  się  w cieczy  nad- 
płynnej. W najniższej  osiągniętej  podczas  tych  do- 
świadczeń temperaturze  T = 0,28  K tarcie  w helu  II 
było  tak  małe,  że  jon  wędrował  bez  zderzeń  kilka 
cm,  ale  już  w T = 0,5  K droga  swobodna  jonu  wy- 
nosiła tylko  10-4  cm. 

Najdziwniejsze  wyniki  uzyskano,  gdy  zwiększono 
natężenie  pola  elektrycznego,  które  nadawało  jonom 
początkową  energię  kinetyczną.  Okazało  się,  że  pręd- 
kość nośnika  ładunku  maleje,  gdy  wzrasta  jego  ener- 
gia. Oznaczało  to,  że  ze  wzrostem  energii  rośnie  masa 
tworu  niosącego  ładunek;  oszacowano,  że  ów  twór 
musi  się  składać  z wielu  tysięcy  atomów  helu.  Nasu-  wir 
wało  się  więc  przypuszczenie,  że  jest  to  makrosko-  makrosko- 
powy wir.  Dalsze  badania  wykazały,  że  jony  helu  powy 
o wystarczająco  dużej  energii  kinetycznej  rzeczywiście 
powodują  tworzenie  się  w helu  II  wirów  w kształcie 
pierścieni,  czyli  podobnych  do  kółek  z dymu  papiero- 
sowego. Oś  takiego  wiru  jest  więc  krzywą  zamkniętą 
(kołem),  a średnica  kółka  wirowego  o energii  50  eV 
wynosi  około  10-4  cm  i rośnie  ze  wzrostem  energii. 

Każdy  z tych  pierścieni  wirowych  niesie  dokładnie 
jeden  kwant  strumienia  wirowości  równy  h/lmn*. 

Tak  więc  kwantowanie,  z którym  zwykle  spotykamy 
się  na  poziomie  mikrokosmosu,  tutaj  zostało  wykryte 
również  w układzie  makroskopowym. 


Koncepcje  dotyczące  kwantowania  wirów  w helu  II 
odegrały  ważną  rolę  w kształtowaniu  się  poglądów 
na  wiry  prądowe  w nadprzewodnikach  II  rodzaju 
w stanie  mieszanym.  Takie  wiry  prądowe  wytwarzają 
skwantowany  strumień  magnetyczny  (-*■  Nadprze- 
wodnictwo). 


Zagadnienia  nadplynnośct  a statystyka 
kwantowa 

Wprowadzając  koncepcję  modelu  dwupłynowego  do 
zagadnienia  helu  II  Tisza  oparł  się  na  teorii  dosko- 
nałego gazu  bozonów,  tj.  cząstek  o spinie  całkowi- 
tym. Nazwa  tych  cząstek  pochodzi  stąd,  że  podlegają 
one  statystyce  Bosego-Einsteina. 

4He  jako  Jądro  atomu  4He,  składające  się  z parzystej  liczby 
gaz  Bosego  cząstek  o spinach  połówkowych,  ma  ogólny  spin 
całkowity;  atomy  4He  są  więc  bozonami.  Oddziały- 
wanie między  atomami  ciekłego  helu  jest  bardzo  słabe, 
ciekły  hel  może  być  więc  w przybliżeniu  potraktowany 
jako  gaz.  W wystarczająco  niskiej  temperaturze  w do- 
skonałym gazie  bozonów  powinna  nastąpić  konden- 
sacja pewnej  części  gazu.  Nie  jest  to  jednak  konden- 
sacja w zwykłym  sensie,  tzn.  skraplanie  lub  krystali- 
zacja, lecz  kondensacja  w „przestrzeni”  pędów.  Inny- 
mi słowy,  pewna  liczba  N0  cząstek  z ogólnej  liczby  N 
bozonów  zawartych  w objętości  V powinna  znaleźć 
się  w stanie  podstawowym,  tj.  najniższym  stanie  ener- 
getycznym z pędem  równym  zeru.  Stosunek  NJN 
jest  funkcją  temperatury.  Przyjmując,  że  masa  cząstki 
gazu  Bosego  jest  równa  masie  atomu  4He,  otrzymuje 
się  dla  temperatury  kondensacji  wartość  3,14  K, 
a więc  bardzo  bliską  temperaturze  lambda.  Zgodność 
jest  bardzo  dobra,  zwłaszcza  jeśli  weźmiemy  pod 
uwagę,  że  ciekły  hel  nie  jest  gazem  doskonałym. 

teoria  Mikroskopową  teorię  niedoskonałego  gazu  bozo- 
Bogolubowa  nów  opracował  N.N.  Bogolubow  w 1947  r.,  posługu- 
jąc się  metodą  drugiego  kwantowania  (-►Teoria 
pola).  W tej  metodzie  istotną  sprawą  jest  dobór  od- 
powiedniego hamiltonianu  (tj.  operatora  energii), 
uwzględniającego  międzycząstkowe  oddziaływanie 
w układzie.  Zakładając  słabość  oddziaływania  i sto- 
sując odpowiednie  przekształcenie  hamiltonianu  Bo- 
golubow otrzymał  widmo  energetyczne  układu  zbli- 
żone do  widma  Landaua,  zwłaszcza  w zakresie  ma- 
łych pędów.  Zwróćmy  uwagę,  że  Landau  w swej 
teorii  nigdzie  nie  korzystał  z założeń  dotyczących 
statystyki  cząstek.  Landau  właściwie  odgadł  kształt 
widma  energetycznego  helu  II,  pasującego  do  danych 
termodynamicznych . 

teoria  Jeszcze  inne  podejście  do  zagadnienia  nadpłynnego 

Feynmana  helu  zaproponował  R.  P.  Feynman.  Korzystając 
z ogólnych  zasad  mechaniki  kwantowej  wprowadził 
on  funkcję  y>0>  opisującą  stan  podstawowy  helu  II. 
Funkcja  y>0  zależy  tylko  od  położeń  atomów  helu  w 
układzie  i bardzo  słabo  zmienia  się  w przestrzeni  od 
cząstki  do  cząstki.  Stany  wzbudzone  opisuje  funkcja 
Ve.  Aby  funkcja  ve  mogła  odpowiadać  faktom  do- 
świadczalnym, musi  spełniać  szereg  warunków.  Na 
przykład  ze  względu  na  statystykę  jąder  4He,  funkcja 
y>E  musi  być  parzysta,  a więc  nie  może  zmieniać  się 
przy  zamianie  atomów  miejscami.  Żądane  warunki 
spełnia  funkcja:  y >e  = 2!f(rj)y 0.  Sumowanie  prze- 
prowadza się  po  wszystkich  atomach  układu,  a /(r/) 
jest  funkcją  tylko  ich  położeń  rj.  Po  podstawieniu 
funkcji  ys  do  równania  Schródingera  i zastosowaniu 
metody  wariacyjnej  Feynman  wykazał,  że  rozwiąza- 
niem, przy  którym  energia  układu  jest  najmniejsza, 
jest  f(rj)  — eWtypn,  zaś  wyrażenie  na  energię  ma 

p i 

postać  e(p)  = 2 mS(jpj’  gdzie  ^ Jest  pędem  wzbudze“ 

nia.  Symbol  S(p ) oznacza  tzw.  czynnik  struktury 
cieczy.  Kształtu  funkcji  S(p)  nie  można  obliczyć  na 
podstawie  ogólnych  rozważań,  ale  można  go  wyzna- 
czyć drogą  analizy  ugięć  promieni  rentgenowskich  w 
cieczy.  Znając  S(p)  można  obliczyć  e(p),  czyli  widmo 


energetyczne  układu.  Otrzymane  w ten  sposób  widmo 
niewiele  różni  się  od  widma  Landaua. 


Nadpłynność  3He 

Związek  pomiędzy  statystyką  kwantową  i nadpłyn- 
nością  jest  wyraźnie  widoczny  w wypadku  lekkiego 
izotopu  helu,  a mianowicie  3He.  Izotop  ten  występuje 
w przyrodzie  jako  nikła  domieszka  4He;  stanowiona 
zaledwie  ok.  10_3%,  nie  wywiera  więc  żadnego  zauwa- 
żalnego wpływu  na  własności  4He.  Z powodu  bardzo 
małej  zawartości  3He  w naturalnych  złożach  wydoby- 
wanie go  stamtąd  jest  nieopłacalne.  3He  otrzymuje  się 
w reakcjach  jądrowych  przez  bombardowanie  ato- 
mów litu  neutronami : 

3 Li  + » -►  ®H  + 4He. 

Powstający  w czasie  tej  reakcji  tryt  (?H)  poprzez  roz- 
pad p przechodzi  w |He;  okres  połowicznego  roz- 
padu wynosi  12  lat. 

Jądro  atomu  iHe,  złożone  z trzech  nukleonów, 
ma  wypadkowy  spin  połówkowy,  czyli  jest  fermio- 
nem. Układ  takich  cząstek  podlega  statystyce  Fer- 
miego-Diraca.  Do  układu  fermionów  stosuje  się 
zasada  Pauliego  orzekająca,  że  w określonym  stanie 
kwantowym  nie  może  znaleźć  się  więcej  niż  jedna 
cząstka  z danego  układu.  W stanie  z najniższą  ener- 
gią nie  może  się  więc  znaleźć  duża  liczba  cząstek,  czyli 
kondensacja  nie  nastąpi.  I rzeczywiście,  oziębiany  aż 
do  3 mK  (0,003  K)  lekki  izotop  helu  nie  przechodzi 
w stan  nadpłynny,  chociaż  opierając  się  na  zasadzie 
odpowiadających  sobie  stanów,  przez  analogię  do 
24He,  można  by  się  spodziewać,  że  dla  2 He  temperatura 
ambda  wyniesie  około  1,5  K. 

Po  opracowaniu  teorii  nadprzewodnictwa  stało 
się  jasne,  że  jeśli  w układzie  fermionów  pomiędzy  po- 
szczególnymi cząstkami  działają  jakieś,  chociażby 
nawet  niewielkie,  siły  przyciągania  dalekiego  zasięgu, 
to  w odpowiednio  niskiej  temperaturze  może  dojść 
do  połączenia  się  fermionów  w pary,  które  będą 
mieć  sumaryczny  spin  całkowity.  Taicie  pary  (tzw. 
pary  Coopera)  nie  są  już  fermionami  i nie  podlegają 
zakazowi  Pauliego,  może  więc  nastąpić  kondensacja. 
Kondensacja  w układzie  elektronów  przewodnictwa 
w metalach  odpowiada  przejściu  w stan  nadprzewod- 
nictwa. Kondensat  elektronowy  może  się  wtedy  po- 
ruszać w metalu  bez  tarcia,  czyli  bez  oporu  elektrycz- 
nego (— ► Nadprzewodnictwo). 

W ciekłym  3He  działają  pomiędzy  poszczególnymi 
atomami  siły  przyciągania  o dalekim  zasięgu.  Są  to 
siły  van  der  Waalsa.  W wystarczająco  niskiej  tempe- 
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Rys.  21.  Wykres  stanu  3He 
w przedziale  najniższych 
temperatur 

raturze  te  słabe  siły  mogą  doprowadzić  do  łączenia 
się  atomów  3He  w pary  analogiczne  do  elektronowych 
par  Coopera  w nadprzewodnikach.  Temperatura, 
w której  3He  przechodzi  w stan  nadpłynny,  zależy  od 
ciśnienia  i zmienia  się  od  0,8  mK  do  2,6  mK  przy 
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zmianie  ciśnienia  od  zera  do  33,5  *105  Pa.  Powyżej 
tego  ciśnienia  3He  zestala  się.  Nadpłynność  3He 
została  doświadczalnie  potwierdzona  dopiero  w ostat- 
nich latach.  Okazało  się  przy  tym,  że  przy  ciśnieniu 
zawartym  w przedziale  (21,2-33,5)  • 105  Pa  3He  ma 
faza  dwie  nadpłynne  fazy,  które  oznaczono  literami  A 
A i B i B (rys.  21).  Jedna  z tych  faz  (faza  A)  wykazuje 
wyraźną  anizotropię  własności  fizycznych.  Przejście 
z fazy  nienadpłynnej  w fazę  A jest  przemianą  fazową 
II  rodzaju  (przemianą  lambda),  przejście  między  fazą 
A i B jest  przemianą  fazową  I rodzaju. 

Położenie  linii  rozdzielających  obszary  poszcze- 
gólnych faz  3He  na  wykresie  stanu  w układzie  ciśnie- 
nie-temperatura  zależy  od  natężenia  H zewnętrznego 
pola  magnetycznego.  Jądra  3He  mają  (ze  względu  na 
nieparzystą  liczbę  nukleonów)  różny  od  zera  moment 
magnetyczny.  Podany  na  rys.  21  wykres  fazowy 
przedstawia  położenie  linii  dla  H = 0.  Ze  wzrostem 
natężenia  pola  linia  rozdzielająca  fazę  normalną  od 
nadpłynnej  przesuwa  się  w stronę  niższych  tempera- 
podatność  tur.  Przy  łączeniu  się  atomów  3He  w pary  ich  jądrowe 
magnetyczna  momenty  magnetyczne  nie  kompensują  się  i dlatego 
3He  nadpłynny  3He  (zwłaszcza  faza  A)  wykazuje  znaczną 
podatność  magnetyczną.  Podatność  magnetyczna 
fazy  A jest  taka  sama,  jak  w fazie  normalnej,  w fazie 
B podatność  maleje  ze  spadkiem  temperatury  (rys. 


Rys.  22.  Zależność 
względnej  podatności 
magnetycznej  ciekłe- 
go 3He  od  tempera- 
tury przy  dwu  róż- 
nych wartościach  ci- 
śnienia. Xn  oznacza 
podatność  magne- 
tyczną 3He  w stanie 
normalnym 


22).  A więc  już  chociażby  ze  względu  na  własności 
magnetyczne  obie  nadpłynne  fazy  3He  różnią  się  od 
helu  II.  Różnice  te  występują  również  przy  badaniu 
innych  własności  fizycznych.  Ze  względu  na  możliwość 
uporządkowania  przestrzennego  pod  wpływem  pola 
magnetycznego  obie  nadpłynne  fazy  3He  można  uwa- 
żać za  ciekłe  kryształy  (->  Ciekłe  kryształy). 

Badanie  własności  3He  w bardzo  niskich  tempera- 
turach jest  trudnym  zadaniem,  toteż  prace  badawcze 
— chociaż  dość  zaawansowane  — nie  dały  jeszcze 
pełnego  obrazu  zagadnienia.  O trudnościach  ekspery- 
mentowania w przedziale  temperatur  rzędu  mil  ikel wi- 
na niech  świadczy  takie  porównanie:  aby  osiągnąć 


punkt  przemiany  lambda  w 4He,  należy  uzyskać 
temperaturę  niższą  ok.  140  razy  od  pokojowej,  na- 
tomiast temperatura  przemiany  3He  w stan  nadpłynny 


będzie  jeszcze  tysiąckrotnie  niższa  niż  temperatura 
przemiany  lambda  4He.  Ponieważ  ciepło  właściwe 
fazy  skondensowanej  w tak  niskich  temperaturach 
jest  znikomo  małe  (rys.  23),  to  nawet  nieznaczne  do- 
pływy ciepła  z zewnątrz  mogą  ogrzać  3He  powyżej 
jego  punktu  przemiany  w stan  nadpłynny. 

Struktura  nadpłynnych  faz  3He  badana  jest  także 
od  strony  teoretycznej.  Przypuszcza  się,  że  fazy  te 
odpowiadają  łączeniu  się  w pary  atomów  3He  znaj- 
dujących się  w stanie  P,  tj.  w stanie  z orbitalnym 
momentem  pędu  7=1.  Modelem  fazy  B jest  model  model  fazy  B 
z izotropową  przerwą  energetyczną  opracowany  przez  i model 
R.  Baliana  i N.  R.  Werthamera,  zaś  model  fazy  A fazy  A 
z anizotropią  przerwy  energetycznej  zaproponowali 
P.  W.  Anderson  i P.  Morel.  Opracowano  sześć  różnych 
typów  modeli  takiej  anizotropowej  fazy.  Który  z tych 
typów  odpowiada  rzeczywistości,  zadecydują  wyniki 
badań  doświadczalnych,  w szczególności  badania  jąd- 
rowego rezonansu  magnetycznego.  Badania  doświad- 
czalne dostarczą  także  materiału,  na  podstawie  które- 
go można  będzie  poznać  widma  energetyczne  nadpłyn- 
nych faz  3He. 

Odrębnym  i dość  obszernym  zagadnieniem,  do 
którego  istotny  wkład  wnieśli  także  polscy  fizycy 
(Z.  Galasiewicz),  jest  nadpłynność  mieszanin  obu 
izotopów  helu:  3He  i 4He.  Taka  mieszanina  może 
być  przykładem  mieszaniny  cieczy  kwantowych  typu 
Fermiego  i typu  Bosego.  Sam  proces  rozpuszczania 
3He  w 4He  jest  procesem  oziębiającym  i dzięki  temu 
ma  ważne  znaczenie  w kriogenice  przy  chłodzeniu 
od  0,5  do  0,05  K.  Dalsze  chłodzenie  odbywa  się  przez 
krystalizację  3He  pod  zwiększonym  ciśnieniem. 

C.  T.  Lane  Nadpłynność , Warszawa  1967;  K.  Mendelssohn 
Na  drodze  do  zera  bezwzględnego  y Warszawa  1970. 


Nadprzewodnictwo 

Eugeniusz  Trojnar 


Nadprzewodnictwo,  czyli  nieskończenie  wielkie  prze- 
wodnictwo elektryczne  odkrył  w 1911  r.  H.  Kamer- 
lingh-Onnes.  Wkrótce  po  udanym  skropleniu  helu 
i osiągnięciu  w ten  sposób  temperatur  rzędu  kilku 
kelwinów  Kamer lingh-Onnes  zajął  się  badaniem 
zmian  oporu  elektrycznego  metali  przy  ich  oziębianiu 
do  niskich  temperatur. 

odkrycie  Wiadomo,  że  opór  czystych  metali  wyraźnie  zależy 
nadp rze wod-  od  temperatury,  przy  czym  w temperaturach  bliskich 
nictwa  pokojowej  zależność  ta  jest  liniowa,  zaś  w niskich 
temperaturach  odbiega  od  liniowości.  W metalach 
zanieczyszczonych  zależność  oporu  od  temperatury 
jest  znacznie  słabsza,  a w niektórych  stopach,  jak 
manganin  czy  konstantan,  opór  od  temperatury  pra- 


wie nie  zależy.  Kamerlingh-Onnes  wybrał  więc  do 
badań  rtęć  jako  metal,  który  w owym  czasie  najlepiej 
można  było  oczyścić  (stosując  kilkakrotną  destylację). 

Ku  jego  zdziwieniu  opór  rtęci,  zamiast  stopniowo  zmie- 
niać się  wraz  z temperaturą,  w pobliżu  T = 4 K nagle 
zmalał  do  niewykry  walnie  małej  wartości.  Później 
okazało  się,  że  czystość  metalu  nie  grała  tu  istotnej 
roli,  gdyż  opór  zanieczyszczonej  rtęci  także  nagle 
znikał  po  oziębieniu  jej  do  T < 4 K.  Od  czystości 
metalu  zależała  tylko  wartość  oporu,  jaką  metal 
wykazywał  przed  przejściem  w stan  nadprzewodni- 
ctwa. 

Zagadnienie,  czy  opór  nadprzewodnika  spada  rze-  opór  nad* 
czy  wiście  do  zera,  czy  tylko  do  skończonej,  chociaż  przewodnika 


warunki 
występowa- 
nia nadprze- 
wodnictwa 


bardzo  malej  wartości,  trudno  rozstrzygnąć  przy 
użyciu  zwykłych  przyrządów  pomiarowych.  Przyrządy 
zawsze  wnoszą  pewien  błąd  do  pomiaru,  nie  możemy 
więc  zmierzyć  wielkości  mniejszej  od  tego  błędu. 
Możemy  jedynie  powiedzieć,  że  sama  wielkość  nie 
przekracza  błędu  pomiaru.  Najdokładniejsza  metoda 
pomiaru  bardzo  małego  oporu  polega  na  wzbudzeniu 
w obwodzie  (np.  w pierścieniu  z nadprzewodnika, 
którego  opór  chcemy  zmierzyć)  prądu  i pomiarze  cza- 
su jego  zaniku.  Jeżeli  obwód  ma  skończony  opór,  to 
natężenie  prądu  będzie  z czasem  maleć,  co  można  wy- 
kryć mierząc  natężenie  pola  magnetycznego  wytwo- 
rzonego przez  ten  prąd.  Takie  doświadczenie  z oło- 
wianym pierścieniem  nadprzewodzącym  przeprowa- 
dził S.  C.  Collins;  po  upływie  dwu  i pół  roku  nie 
stwierdził  on  żadnego  zauważalnego  osłabienia  prądu 
krążącego  w pierścieniu.  Uwzględniając  dokładność 
pomiaru  natężenia  pola  magnetycznego  i indukcyj- 
ności  pierścienia  oszacowano,  że  opór  właściwy  nad- 
przewodzącego ołowiu  nie  mógł  być  większy  niż 
10“ 26  Hm.  Jest  to  niezwykle  mała  wartość,  około 
1017  razy  mniejsza  niż  opór  właściwy  najlepszych 
przewodników  w temperaturze  pokojowej,  jakimi  są 
srebro  i miedź.  Możemy  więc  uważać,  że  opór  nad- 
przewodnika jest  dokładnie  równy  zeru. 


Obraz  kwantowy 

Zjawisko  nadprzewodnictwa,  podobnie  jak  i zjawisko 
nadpłynności  (-►  Nadpłynność),  jest  przejawem  dzia- 
łania praw  fizyki  kwantowej  w skali  makroskopowej. 
Między  tymi  zjawiskami  istnieją  pewne  analogie; 
nadprzewodnictwo  można  potraktować  jako  nadpłyn- 
ność cieczy  złożonej  z naładowanych  cząstek.  Tą 
cieczą  jest  układ  elektronów  przewodnictwa  w me- 
talach. W obu  wypadkach,  zarówno  nadpłynności 
helu  II,  jak  i nadprzewodnictwa,  mamy  do  czynienia 
z możliwością  przepływu  bez  tarcia,  czyli  bez  strat 
energii. 

Nadprzewodnictwo  występuje  tylko  w niskich 
temperaturach.  Najwyższa  dotychczas  notowana  tem- 
peratura, w której  stwierdzono  jeszcze  istnienie  nad- 
przewodnictwa, wynosiła  23,2  K.  Niskie  wartości 
temperatur,  w których  może  pojawiać  się  nadprze- 
wodnictwo, świadczą  o tym,  że  oddziaływanie  wy- 
wołujące to  zjawisko  jest  bardzo  słabe.  W wyższych 
temperaturach  energia  cieplna  kT {k  — stała  Boltz- 
manna,  T — temperatura  bezwzględna)  jest  już  zbyt 
duża  i niszczy  uporządkowanie  nadprzewodzące. 
Energia  oddziaływania  wywołującego  nadprzewod- 
nictwo przypadająca  na  jedną  oddziałującą  cząstkę 
jest  więc  rzędu  £7*,  gdzie  7%  jest  temperaturą  kry- 
tyczną, powyżej  której  nadprzewodnictwo  znika. 

Pomimo  że  możliwość  przepływu  trwałego  prądu 
elektrycznego  bez  strat  odkryto  jeszcze  w 1911  r., 
to  na  wyjaśnienie  istoty  tego  zjawiska  na  podstawie 
mikroskopowych  własności  materii  trzeba  było  po- 
czekać aż  do  1957  r.,  a więc  niemal  pół  wieku.  Ten 
czas  wydaje  się  bardzo  długi,  zwłaszcza  jeśli  porównać 
go  z czasem,  który  upłynął  od  wykrycia  nadpłynności 
(1940  r.)  do  jej  objaśnienia  przez  L.  D.  Landaua 
(1943  r.). 

Nadpłynność  można  było  objaśnić  uwzględniając 
fakt,  że  atomy  helu  są  bozonami  i mogą  występować 
w stanie  kondensacji  Bosego.  Elektrony  przewod- 
nictwa w metalu  są  jednak  fermionami,  podlegają 
więc  regule  zakazu  Pauliego  i duża  ich  liczba  nie 
może  się  kondensować  w jednym  stanie  energetycznym 
z pędem  równym  zeru.  Gdy  jednak  dwa  elektrony 
z przeciwnymi  spinami  i pędami  połączą  się  w parę, 
to  taka  para  będzie  mieć  ogólny  spin  całkowity  i nie 
będzie  już  podlegać  zakazowi  Pauliego. 

Przypuszczenie,  że  elektrony  mogą  łączyć  się  w pa- 
ry, wyraził  R.  A.  Ogg  jeszcze  przed  opracowaniem 
teorii  nadprzewodnictwa,  ale  wydawało  się  ono 
wtedy  (1946  r.)  nieprawdopodobne,  gdyż  trudno  było 
sobie  wyobrazić  elektrony  powiązane  w pary  wbrew 


siłom  odpychania  kulom bowskiego.  Dopiero  H.  Froh- 
lich  w 1950  r.  wskazał  na  rolę,  jaką  w nadprzewodni- 
ctwie gra  oddziaływanie  elektronów  z siecią  krystaiicz-  pary  Coopera 
ną.  Wykrycie  w tym  samym  roku  efektu  izotopowego 
potwierdziło  przypuszczenia  Fróhlicha.  Mechanizm 
tworzenia  się  par  elektronowych  przy  udziale  sieci 
wyjaśnił  L.  Cooper  w 1956  r.,  dlatego  takie  pary 
nazywamy  często  parami  Coopera. 

Pary  elektronów  nie  są  jednak  bozonami  w ścisłym 
znaczeniu.  Doświadczenie  wykazuje,  że  odległość, 
z jakiej  oddziałują  z sobą  elektrony  pary,  jest  znacznie 
większa  niż  średnia  odległość  między  poszczególnymi 
parami.  W takim  układzie,  złożonym  z przenikają- 
cych się  wzajemnie  par  cząstek,  daje  o sobie  znać 
wewnętrzna  struktura  pary,  a więc  fakt,  że  jest  ona 
złożona  z fermionów.  Znajduje  to  odbicie  w widmie 
wzbudzeń  energetycznych  układu  elektronów  nad- 
przewodnika. Kondensat  bozonowy,  jakim  jest  hel  II, 
ma  widmo  wzbudzeń  energetycznych  typu  Bosego, 
tzn.  wzbudzenia  (kwazicząstki)  są  także  bozonami, 
ponieważ  zarówno  fonony,  jak  i rotony  w nadpłyn- 
nym helu  mają  spin  równy  zeru;  takie  kwazicząstki 
mogą  tworzyć  się  pojedynczo.  Natomiast  kwazi- 
cząstki typu  Fermiego  (ze  względu  na  zachowanie 
spinu)  powstają  wyłącznie  parami,  np.  elektron 
i dziura  lub  dwa  wzbudzenia  elektronowe  w wypadku 
rozerwania  pary  Coopera.  Widmo  typu  Fermiego 
charakteryzuje  kondensat  elektronowy.  Wzbudze- 
nia układu  elektronów  w nadprzewodniku  zachowu- 
ją się  jak  elektrony  przewodnictwa  w normalnym 
metalu. 

W wyjaśnianiu  problemu  widma  wzbudzeń  elektro-  elektronowo 
nowych  w nadprzewodnikach  dużą  rolę  odegrały  clopło 
staranne  pomiary  ciepła  właściwego.  Ciepło  właściwe  w|a§0jwe 
układu  elektronów  przewodnictwa  w metalu  normal- 
nym jest  liniową  funkcją  temperatury,  w wypadku  zaś 
nadorzewodnika  elektronowe  ciepło  właściwe  jest 
proporcjonalne  do  e~AlkT.  Taka  zależność  wskazuje 
na  istnienie  przerwy  energetycznej  A (pasma  zabro- 
nionych wartości  energii)  w widmie  wzbudzeń  elek- 
tronowych w nadprzewodniku.  Istnienie  przerwy 
energetycznej  potwierdziły  później  badania  pochłania- 
nia promieniowania  elektromagnetycznego  i ultra- 
dźwięków, oraz  — najbardziej  przekonywająco  — 
zjawiska  tunelowe. 

Mikroskopowa  teoria  nadprzewodnictwa  uwzględ- 
niająca wyniki  dotychczasowych  badań  została  stwo- 
rzona w 1957  w.  przez  J.  Bardeena,  L.  Coopera 
i J.  Schrieffera,  którzy  za  tę  pracę  otrzymali  w 1973  r.  teoria  BCS 
nagrodę  Nobla.  Od  pierwszych  liter  nazwisk  twór- 
ców jest  ona  często  nazywana  teorią  BCS.  Od  czasu 
powstania  teoria  ta  jest  ciągle  rozwijana  i udoskona- 
lana przez  wielu  badaczy.  Obecnie  nauka  o nadprze- 
wodnictwie jest  bardzo  rozbudowaną  dziedziną  fizyki 
współczesnej  i w tym  artykule  możemy  rozpatrzyć 
tylko  niektóre  jej  aspekty. 


Korelacja  w układzie  elektronów 


Elektrony  przewodnictwa  w metalu 

Wyjaśnijmy  teraz  bardziej  szczegółowo  przyczyny 
znikania  oporu  elektrycznego.  W metalach  prąd  elek- 
tryczny jest  to  przepływ  elektronów  przewodnictwa 
(dokładniejsze  omówienie  przewodnictwa  w metalu 
zawiera  hasło  Metale),  tj.  tych  elektronów,  które 
nie  są  związane  z poszczególnymi  atomami,  lecz  są 
wspólne  dla  całej  sieci  krystalicznej.  Często  nazywamy  elektrony 
je  elektronami  swobodnymi,  chociaż  nie  są  one  w pełni  swobodne 
swobodne,  gdyż  — po  pierwsze  — znajdują  się  w zmie- 
niającym się  okresowo  w przestrzeni  potencjale  sieci 
krystalicznej,  a po  drugie  — mogą  przybierać  tylko 
dozwolone,  dyskretne  wartości  energii,  przy  czym  — 
zgodnie  z regułą  zakazu  Pauliego  — ten  sam  poziom 
energetyczny  mogą  zajmować  co  najwyżej  dwa  elek- 
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trony  różniące  się  orientacją  spinu.  W danym  stanie 
kwantowym  może  więc  znaleźć  się  tylko  jeden  eletron 
układu. 

Gęstość  stanów  elektronowych  N,  czyli  liczba  AZ 
stanów  kwantowych  przypadających  na  dany  prze- 
dział energii  AE  w jednym  molu  metalu  (albo  w jed- 
nostce objętości),  jest  funkcją  energii  E.  Gęstość  sta- 
nów definiujemy  jako  N(E)  = AZ(E)/AE . Wykres 
zależności  N od  E dla  pasma  przewodnictwa  jest 
przedstawiony  na  rys.  la.  Ze  względu  na  wygodę 
w późniejszym  posługiwaniu  się  wykresem  oś  energii 
kierujemy  pionowo,  zaś  oś  gęstości  stanów  — po- 
ziomo. 


elektronowych  N(E)  elektronowych  N(E) 

a)  b) 

Rys.  1.  Zależność  gęstości  stanów  elektronowych  w zależności 
od  energii : a)  w metalu  normalnym,  b)  w nadprzewodniku  (dla 
wyrazistości  przerwa  energetyczna  mocno  powiększona).  Czarną 
linią  oznaczono  stany  zajęte  w T > 0 

W temperaturze  T = 0 układ  elektronów  przewod- 
nictwa ma  najniższą  energię.  Elektrony  zajmują 
wszystkie  nisko  leżące  stany,  a najwyższy  z zajętych 
stanów  nazywa  się  poziomem  Fermiego  (£».  Mó- 
wimy, że  układ  elektronów  przewodnictwa  jest 
w swym  stanie  podstawowym  (niewzbudzonym). 
Energia  całego  układu  jest  oczywiście  sumą  energii 
elektronów  we  wszystkich  stanach  zajętych. 

W T > 0 niektóre  elektrony  wzbudzają  się  ter- 
micznie na  wyższe  poziomy  energetyczne  i zwalniają 
stany  pod  poziomem  Fermiego.  Elektrony  te  możemy 
traktować  jako  wzbudzenia  termiczne  układu  elektro- 
nów. Podobnie  można  traktować  zwolnione  stany 
(dziury)  pod  poziomem  Fermiego.  W T > 0 nastę- 
puje więc  rozmycie  poziomu  Fermiego.  Szerokość 
przedziału  rozmycia  jest  rzędu  kT.  W temperaturze 
pokojowej  stanowi  to  około  0,025  eV.  Dla  porów- 
nania podamy,  że  wysokość  poziomu  Fermiego  nad 
dnem  pasma  przewodnictwa  wynosi  kilka  eV  (do 
10  eV). 

Elektrony  zajmujące  niskie  stany  energetyczne  nie 
mogą  zmieniać  swej  energii,  gdyż  wszystkie  sąsiednie 
stany  dozwolone  są  już  zajęte.  Nie  mogą  więc  one 
być  przyspieszane  w polu  elektrycznym,  czyli  nie 
biorą  udziału  w przepływie  prądu.  Pod  wpływem  pola 
mogą  zmieniać  swą  energię  tylko  te  elektrony,  które 
zajmują  stany  w przedziale  rozmycia,  tj.  w pobliżu 
poziomu  Fermiego. 

Elektrony  wzbudzone  termicznie,  podobnie  jak 
i dziury,  są  kwazicząstkami,  bo  ich  własności  zależą 
od  sieci  krystalicznej,  w której  się  poruszają.  Ich  ruch 
w sieci  podlega  prawom  mechaniki  kwantowej  i daje 
się  opisać  funkcjami  falowymi  modulowanymi  z okre- 
sem sieci.  W niezaburzonej,  ściśle  okresowej  sieci 
krystalicznej  fale  elektronowe  powinny  się  rozchodzić 
bez  przeszkód,  czyli  nie  powinny  ulegać  rozproszeniom. 
Opór  elektryczny  nie  może  więc  istnieć  w takiej  sieci. 
Defekty  struktury  i drgania  cieplne  jonów  sieci  za- 
burzają jednak  okresowość  struktury  krystalicznej 
i rozpraszają  fale  elektronowe.  W procesie  rozpro- 
szenia elektrony  przekazują  sieci  energię  nabytą 
w polu  elektrycznym.  Opór  elektryczny  jest  więc  wy- 
nikiem zaburzeń  w okresowości  struktury  krystalicz- 
nej. Ze  spadkiem  temperatury  słabną  drgania  jonów 
sieci  i opór  metali  maleje.  Ta  zaś  część  oporu,  która 


jest  spowodowana  defektami  struktury  lub  domiesz- 
kami obcych  atomów  nie  zależy  od  temperatury  i po- 
zostaje nawet  w najniższych  temperaturach,  jeśli 
metal  nie  przechodzi  w stan  nadprzewodnictwa.  Jest  to 
tzw.  opór  resztkowy  metali. 

Drgania  cieplne  sieci  krystalicznej  są  skwantowane 
a kwanty  drgań  nazywają  się  fononami  (->  Dynamika 
sieci  krystalicznej).  Można  więc  mówić  o rozprosze- 
niach elektronów  na  fononach  jako  o przyczynie  tej 
części  oporu  elektrycznego,  która  zależy  od  tempera- 
tury. Opór  wzrasta  z temperaturą,  gdyż  zwiększa  się 
gęstość  gazu  fononowego  i zderzenia  elektronów  z fo- 
nonami są  częstsze.  W niektórych  metalach  w odpo- 
wiednio niskiej  temperaturze  elektrony  nie  doznają 
rozproszeń  na  fononach  i defektach  sieci.  Wskazówką, 
gdzie  szukać  przyczyny  tego  zjawiska  było  odkrycie 
efektu  izotopowego. 

Efekt  izotopowy  polega  na  tym,  że  różne  izotopy 
tego  samego  pierwiastka  nadprzewodzącego  (np. 
Sn  lub  Hg)  mają  różne  temperatury  przejścia  w stan 
nadprzewodzący  (T*),  przy  czym  dla  danego  pier- 
wiastka zachodzi  przybliżona  zależność:  Tic-^M  = 
= const,  gdzie  M oznacza  masę  atomową  izotopu. 
Okazało  się  więc,  że  dla  nadprzewodnictwa,  które  jest 
zależne  od  układu  elektronów  w metalu,  istotna  jest 
również  masa  jonów  tworzących  sieć  krystaliczną. 
Należy  zatem  uwzględnić  ruch  tych  jonów,  czyli  ich 
drgania.  Przyczyn  nadprzewodnictwa  trzeba  przeto 
szukać  w oddziaływaniu  elektronów  przewodnictwa 
z drganiami  sieci  jonowej,  czyli  z fononami.  Ciekawe, 
że  właśnie  to  oddziaływanie,  którego  wynikiem  jest 
występowanie  oporu  elektrycznego,  w pewnych  wa- 
runkach może  prowadzić  do  jego  znikania.  Tym  moż- 
na wytłumaczyć  fakt,  że  najlepsze  przewodniki  elek- 
tryczności, jakimi  są  srebro,  złoto  czy  miedź,  nie  prze- 
chodzą w stan  nadprzewodnictwa  (przynajmniej  w tym 
przedziale  temperatur,  w którym  były  dotychczas 
przebadane);  oddziaływanie  elektronów  z siecią  jest 
w tych  metalach  zbyt  słabe. 


Pary  Coopera 

Jeśli  w układzie  fermionów  (czyli  cząstek  podlegają- 
cych regule  zakazu  Pauliego)  między  poszczegól- 
nymi cząstkami  działają  siły  przyciągania  dalekiego 
zasięgu,  to  mogą  one  doprowadzić  do  łączenia  się 
cząstek  o przeciwnych  spinach  w pary,  które  mają 
ogólny  spin  całkowity  i nie  podlegają  już  regule  Pau- 
liego. Pary  takie  mogą  więc  utworzyć  kondensat 
cząstek  znajdujących  się  na  tym  samym  poziomie 
energetycznym.  Od  nazwiska  twórcy  tej  koncepcji 
fermiony  związane  w pary  nazywają  się  parami  Coope- 
ra. 

Prowadzące  do  nadpłynności  łączenie  się  cząstek 
w pary  Coopera  wydaje  się  być  powszechnym  zja- 
wiskiem w układach  fermionów.  Proces  ten  zachodzi 
np.  w ciekłym  3He.  Przypuszcza  się,  że  zachodzi  on 
również  w gwiazdach  neutronowych.  Najprawdo- 
podobniej pulsary  należą  do  gwiazd  nadpłynnych. 

Pomiędzy  elektronami  przewodnictwa  w metalu, 
jako  cząstkami  o ładunku  ujemnym,  działają  siły 
wzajemnego  odpychania.  Z powodu  ekranowania 
elektronów  dodatnimi  ładunkami  otaczających  je  jo- 
nów sieci  krystalicznej,  siły  te  mają  krótki  zasięg,  rzędu 
kilku  odległości  międzyatomowych.  Jak  wskazuje 
efekt  izotopowy,  źródeł  dalekozasięgowych  sił  wza- 
jemnego przyciągania  się  elektronów  należy  szukać 
w oddziaływaniu  elekronów  za  pośrednictwem  sieci 
krystalicznej,  tzw.  oddziaływania  elektronowo-fono- 
nowego. 

Przyciągające  oddziaływanie  między  elektronami 
za  pośrednictwem  sieci  możemy  sobie  wyobrazić 
w następujący  sposób.  Elektron  porusza  się  przez  sieć 
i deformuje  ją  na  skutek  oddziaływania  kulombow- 
skiego.  Deformacja  polega  na  zgęszczaniu  dodatnich 
jonów  sieci  w pobliżu  elektronu.  To  zgęszczenie  do- 
datnich jonów  oddziałuje  z kolei  na  inny  elektron. 
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W rezultacie  oba  elektrony  przyciągają  się  wzajemnie 
za  pośrednictwem  sieci.  Zgęszczenie  jonów  oddziały- 
wa na  elektrony  na  znacznie  większe  odległości  niż 
bezpośrednie  oddziaływanie  między  elektronami,  jest 
więc  oddziaływaniem  dalekiego  zasięgu  (rzędu  kilku- 
set lub  kilku  tysięcy  odległości  międzyatomowych). 

Kwantowy  opis  zjawiska  oddziaływania  wzajemne- 
go między  elektronami  poprzez  sieć  jest  następujący. 
Elektron  poruszający  się  w krysztale  wzbudza  ener- 
getycznie sieć  jonową  na  wyższy  poziom,  wytwarza 
więc  kwant  wzbudzenia  sieci,  czyli  fonon.  Ten  fonon 
zostaje  pochłonięty  przez  inny  elektron  i sieć  wraca 
do  poprzedniego  stanu.  Siła  przyciągania  między 
wymiana  elektronami  jest  zatem  siłą  wymiany  fononu.  Siły 
fononów  wymiany  znane  są  w fizyce,  np.  w teorii  jądra  atomo- 
wego, gdzie  siła  przyciągania  się  nukleonów  jest  siłą 
wymiany  mezonu  n. 

Tak  zwane  wirtualne,  krótkożyjące  fonony  wymia- 
ny są  niezależne  od  fononów  — wzbudzeń  cieplnych 
sieci  krystalicznej.  Te  ostatnie  pojawiają  się  tylko 
w T > 0,  natomiast  fonony  wymiany  są  emitowane 
i pochłaniane  przez  elektrony  także  w T x 0. 


Przerwa  energetyczna 

Energia  fononu  nie  może  być  dowolnie  wielka,  gdyż 
długość  fali  dźwięku  rozchodzącego  się  w sieci  kry- 
stalicznej nie  może  być  mniejsza  niż  stała  sieci,  czyli 
odległość  między  sąsiednimi  węzłami  (energia  fo- 
nonu e jest  związana  z długością  fali  dźwiękowej  X 
zależnością : e = hujX  = hv , gdzie  u oznacza  prędkość 
dźwięku,  h — stałą  Plancka,  v — częstość  dźwięku). 
Maksymalna  energia  fononu  £max  = hvm&x  w me- 
talach wynosi  ok.  10-2  eV.  W procesie  łączenia  się 
w pary  Coopera  mogą  więc  brać  udział  tylko  te 
elektrony,  które  mają  energię  mieszczącą  się  w prze- 
dziale o szerokości  hv max  po  obu  stronach  poziomu 
Fermiego.  Jest  to  wąski  przedział  w porównaniu 
z wysokością  Ef  poziomu  Fermiego  nad  dnem  pasma 
przewodnictwa  (£>  « 10  eV). 

Wiązanie  się  elektronów  w pary  prowadzi  do  zmia- 
ny rozkładu  stanów  energetycznych  w pobliżu  po- 
ziomu Fermiego  i do  pojawienia  się  pasma  zabro- 
nionych wartości  energii,  czyli  do  wytworzenia  się 
szerokość  przerwy  w widmie  wzbudzeń  elektronowych  (rys. 
przerwy  lb).  Przerwa  ta  oddziela  stan  podstawowy  od  stanów 
energetycz-  wzbudzonych.  Szerokość  przerwy  energetycznej  nie 
nej  może  być  większa  niż  hv max;  zgodnie  z teorią  BCS, 
w temperaturze  T = 0 jest  ona  równa: 

2J(0)  = 3,52  kn  = 4 Aiwe-1'*,  (1) 

gdzie  k oznacza  stalą  Boltzmanna,  g jest  stałą  ma- 
teriałową zależną  od  wielkości  oddziaływania  elek- 
tron-fonon (V)  i od  gęstości  stanów  elektronowych 
N(Ef)  w normalnym  metalu  w pobliżu  poziomu  Fer- 
miego. Z teorii  wynika,  że  stała  g = VN(Ef ) nie  może 
być  większa  niż  0.5  (na  ogół  bywa  mniejsza). 

Przerwa  energetyczna  w widmie  wzbudzeń  elektro- 
nowych istnieje  również  w izolatorach  i półprzewod- 
nikach, gdzie  oddziela  pasmo  walencyjne  od  pasma 
przewodnictwa.  Tam  jednak  istnienie  przerwy  energe- 
tycznej jest  uwarunkowane  budową  krystaliczną  sub- 
stancji, natomiast  w nadprzewodnikach  przerwa 
energetyczna  powstaje  w wyniku  pojawienia  się  upo- 
rządkowania w układzie  elektronów  przewodnictwa. 
Niszcząc  to  uporządkowanie  (np.  przez  ogrzanie  nad- 
przewodnika powyżej  Tk)  usuwa  się  przerwę  energe- 
tyczna. 

W temperaturze  zera  bezwzględnego  elektrony  nie- 
związane  w pary  zajmują  stany  poniżej  przerwy  ener- 
getycznej; nad  przerwą  stany  są  nieobsadzone.  Wszy- 
stkie pary  Coopera  stanowiące  kondensat  elektro- 
nowy są  w tym  samym  stanie  energetycznym  odpo- 
wiadającym poziomowi  Fermiego.  W T > 0 wzbu- 
dzenia cieplne  powodują  osłabienie  korelacji  między 
elektronami  i rozerwanie  się  części  par.  Układ  elek- 
tronów uzyskuje  więc  dodatkową  energię  wzbudzenia. 


Podobnie  jak  w wypadku  helu  II,  pojawienie  się 
wzbudzeń  energetycznych  w układzie  elektronów 
możemy  potraktować  jako  tworzenie  się  kwazicząstek 
o określonej  energii.  Ponieważ  te  kwazicząstki  za- 
chowują się  tak  samo  jak  elektrony  przewodnictwa, 
nazywamy  je  niekiedy  elektronami  normalnymi. 

Wzbudzenia  elektronowe  zajmują  stany  leżące  nad 
przerwą  energetyczną.  wpływ  tem- 

Do  rozerwania  pary  Coopera  i utworzenia  dwu  - 3ra^ry 
wzbudzeń  elektronowych  potrzebna  jest  energia  rów- 
na szerokości  przerwy,  czyli  wynosząca  2d.  Energia 
o wartości  2 A jest  energią  wiązania  pary.  Ze  wzrostem 
temperatury  coraz  więcej  par  ulega  rozerwaniu  i jed- 


niku  od  temperatury  j / j ^ 

nocześnie  maleje  szerokość  przerwy  energetycznej 
(rys.  2).  Energia  wiązania  pary  jest  tym  większa,  im 
więcej  elektronów  jest  związanych  w pary,  czyli  im 
lepsza  jest  korelacja  między  elektronami.  W T — Tk 
szerokość  przerwy  maleje  do  zera  i wszystkie  pary 
ulegają  rozerwaniu.  . kolektywny 

Tworzenie  się  par  Coopera  jest  zjawiskiem  kolek- 
tywnym,  w którym  bierze  udział  jednocześnie  duża 
liczba  cząsteczek,  dlatego  nie  należy  sobie  wyobrażać 
pary  Coopera  jako  dwóch  wyodrębnionych,  złączo- 
nych ze  sobą  elektronów.  Pojedyncza  para  nie  może 
istnieć,  należy  w zasadzie  mówić  o korelacji  między 
elektronami  o przeciwnych  pędach  i spinach.  Korelacja 
ta  prowadzi  do  obniżenia  energii  układu  o 2 A(T)  na 
każdą  parę  korelujących  z sobą  elektronów.  W miarę 
wzrostu  temperatury  coraz  liczniejsze  wzbudzenia 
cieplne  naruszają  tę  korelację,  maleje  więc  względna 
liczba  par  oraz  energia  wiązania  pary.  W pobliżu 
Tk  proces  ten  przybiera  gwałtowny  charakter.  średnia  od- 

Spróbujmy  jeszcze  oszacować,  jaka  jest  średnia  mję. 

odległość  między  parami  Coopera.  Ponieważ  w 1 cm3  ^ paramjjC 
metalu  jest  około  1022  atomów,  to  — przyjmując  je-  Coopera 
den  elektron  przewodnictwa  na  atom  — otrzymamy 
tyleż  elektronów  przewodnictwa.  W procesie  łączenia 
się  w pary  mogą  brać  udział  tylko  te  elektrony,  któ- 
rych energia  leży  w wąskim  przedziale  w pobliżu 
poziomu  Fermiego,  co  stanowi  około  10-4  ogólnej 
liczby  elektronów  przewodnictwa,  czyli  około  1018 
elektronów  na  1 cm3.  Średnia  odległość  między  para- 
mi wyniesie  więc  około  10-6  cm.  Jest  to  około  sto 
razy  mniej,  niż  wynosi  odległość,  z jakiej  oddziałują 
z sobą  elektrony  pary  (czyli  średni  rozmiar  jednej 
pary).  W zasięgu  korelacji  jednej  pary  mieści  się  wie- 
le innych  korelujących  z sobą  elektronów;  po- 
szczególne pary  nakładają  się  na  siebie  i obraz  poje- 
dynczej pary  zaciera  się. 


Brak  oporu  elektrycznego 

Zastanówmy  się  teraz,  jak  w koncepcji  par  Coopera 
tłumaczy  się  zjawisko  bezoporowego  przepływu  prądu 
elektrycznego  w nadprzewodniku,  czyli  nadpłynność 
w układzie  elektronów.  Pojawienie  się  oporu  elek- 
trycznego oznacza,  że  elektrony  w metalu  ulegają 
rozproszeniu,  czyli  zmieniają  swój  pęd  w zderzeniach 
z fononami  lub  defektami  struktury  krystalicznej. 
W procesie  łączenia  się  w pary  Coopera  uczestniczą 
elektrony  o przeciwnych  pędach,  np.  K i — K,  tak 
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że  sumaryczny  pęd  pary  — gdy  prąd  nie  płynie  — jest 
równy  zeru.  Para  biorąca  udział  w przepływie  prądu 
ma  sumaryczny  pęd  różny  od  zera,  równy  np.  2 P9 
czyli  elektrony  pary  mają  pędy  K+P  i —K+P. 
Gdyby  jeden  z elektronów  pary  uległ  rozproszeniu, 
jego  pęd  zmieniłby  się  o wartość  Q,  wynosiłby  więc 
— K+P+Q\  taki  elektron  nie  mógłby  już  korelować 
z elektronem  o pędzie  K+P,  czyli  para  uległaby 
rozerwaniu.  To  zaś  zwiększyłoby  energię  układu  o 
2 A,  co  jest  dia  układu  niekorzystne  (każdy  układ  stara 
się  mieć  jak  najniższą  energię).  Elektrony  związane 
w parę  nie  biorą  zatem  udziału  w procesie  rozprasza- 
nia, czyli  ich  przepływ  odbywa  się  bez  tarcia. 

Gdyby  jednak  gęstość  prądu  wzrosła  do  takiej 
wartości,  że  energia  kinetyczna  nośników  prądu  nad- 
przewodzącego przekroczyłaby  spadek  energii  wy- 
nikły z korelacji,  to  korelacja  uległaby  zniszczeniu, 
gdyż  przestałaby  być  energetycznie  korzystna.  Gę- 
stość prądu,  przy  której  w nadprzewodnikach  pojawia 
się  opór,  nazywa  się  krytyczną  gęstością  prądu.  Nasu- 
wa się  tu  analogia  z krytyczną  prędkością  przepływu 
helu  II. 


Kwantowanie  strumienia  magnetycznego 

W wyniku  braku  oporu  prąd  elektryczny  wzbudzony 
w zamkniętym  obwodzie  nadprzewodzącym  może 
krążyć  dowolnie  długo  bez  jakichkolwiek  zauważal- 
nych strat.  Taki  trwały  prąd  można  wzbudzić  np. 
w pierścieniu  z nadprzewodnika  w następujący  spo- 
sób : podnosi  się  temperaturę  pierścienia  powyżej  jego 
punktu  przejścia  w stan  normalny  Tjc  i umieszcza  się 
go  w polu  magnetycznym  o liniach  sił  prostopadłych 
do  płaszczyzny  pierścienia;  następnie  obniża  się  tem- 
peraturę do  T < Tk  i usuwa  pole  magnetyczne.  Zmia- 
na zewnętrznego  pola  magnetycznego  wzbudzi  w nad- 
przewodzącym pierścieniu  niezanikający  prąd  elek- 
tryczny, który  — zgodnie  z regułą  Lenza  — przeciw- 
działać będzie  tej  zmianie,  tj.  będzie  podtrzymywać 
stały  w czasie  strumień  magnetyczny  w obszarze  oto- 
czonym przez  pierścień  (prąd  wzbudzony  w stanie 
normalnym  szybko  zanika). 

Pierścień  nadprzewodzący  wraz  z krążącym  w nim 
prądem  jest  układem  stacjonarnym,  czyli  trwałym 
w czasie.  Według  mechaniki  kwantowej,  stany  stacjo- 
narne są  związane  z pewnymi  warunkami  kwanto- 
wymi. Na  przykład  stacjonarne  orbity  elektronów 
w modelu  atomu  Bohra  są  związane  z kwantowaniem 
momentu  pędu  elektronu.  Można  więc  przypuszczać, 
że  w pierścieniu  nadprzewodzącym  możliwe  są  tylko 
pewne  dyskretne  stany  prądowe,  określone  warun- 
kiem kwantowania  jakiejś  wielkości  fizycznej  zwią- 
zanej z prądem  krążącym  w pierścieniu.  Taką  wielko- 
ścią podlegającą  kwantyzacji  jest  strumień  magne- 
tyczny zawarty  w otworze  pierścienia.  Po  raz  pierw- 
szy przypuszczenie  to  wypowiedział  F.  London 
w 1950  r.  Doszedł  on  do  wniosku,  że  strumień  magne- 
tyczny uwięziony  w otworze  nadprzewodzącego  pierś- 
cienia lub  wydrążonego  walca  jest  krotnością  kwantu 
strumienia  równego  &0  = hjq%  gdzie  q jest  ładunkiem 
elektrycznym  nośnika  prądu  nadprzewodzonego. 
London  sądził,  że  nośnikami  prądu  nad  przewodzone- 
go są  pojedyncze  elektrony  (q  = e ),  czyli  że  = 
= 4,14  *10“15  Wb.  Po  opracowaniu  teorii  BCS  wy- 
jaśniło się,  że  kwant  strumienia  magnetycznego, 
zwany  także  fiuksonem,  jest  o połowę  mniejszy,  gdyż 
nośnikami  prądu  nadprzewodzonego  są  pary  Coopera 
(q  = 2e),  a więc  &0  = hJ2e  = 2,07  • 10"15  Wb.  Jest  to 
bardzo  mała  wielkość  w porównaniu  z tymi  wartościa- 
mi strumienia,  z którymi  najczęściej  spotykamy  się 
w praktyce.  Jeśli  założymy,  że  otwór  w nadprzewodni- 
ku, w którym  został  uwięziony  jeden  flukson,  ma  po- 
wierzchnię przekroju  poprzecznego  równą  1 mm2,  to 
gęstość  strumienia  w tym  otworze,  tzn.  indukcja  mag- 
netyczna B,  będzie  równa  10~9  T,  czyli  około  sto 
tysięcy  razy  mniejsza  niż  gęstość  strumienia  ziem- 
skiego pola  magnetycznego.  Tak  słabe  pole  magne- 
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tyczne,  jak  pole  ziemskie,  wystarcza,  aby  po  jego  usu- 
nięciu uwięzić  we  wspomnianym  otworze  106  kwan- 
tów strumienia  magnetycznego.  Zmiana  tego  stru- 
mienia o jeden  lub  kilka  kwantów  byłaby  właściwie 
niewykrywalna. 

Pomimo  tak  małej  wartości,  kwant  strumienia  zo-  pomiar 
stał  jednak  doświadczalnie  zmierzony.  Nadprzewod-  fluksonu 
nikiem,  w którym  uwięziono  strumień  magnetyczny, 
była  cylindryczna  warstewka  ołowiu  o długości 
0,6  mm  naparowana  na  kawałku  kwarcowej  kapilary 
o średnicy  zewnętrznej  10  Jim.  Kwarcową  kapilarę 
z warstewką  ołowiu  zawieszono  za  środkową  jej 


Rys.  3.  Szkice  układu  do 
pomiaru  kwantu  strumie- 
nia magnetycznego 


magnetyczny 

„zamrożony” 


część  na  sprężystej  nitce,  do  której  przymocowano 
malutkie  lusterko  (rys.  3).  Po  zamrożeniu  w nadprze- 
wodniku stałego  strumienia  magnetycznego  przyło- 
żono dodatkowe  słabe  pole  pod  kątem  prostym  do 
rurki  i mierzono  moment  skręcający  wywierany  na 
rurkę  ze  strony  dodatkowego  pola.  Moment  ten  był 
proporcjonalny  do  wielkości  zamrożonego  strumienia. 
Stwierdzono,  że  ten  strumień  jest  zawsze  równy  wielo- 
krotności kwantu  strumienia  magnetycznego  <PQ  = 
= h/2e,  co  było  potwierdzeniem  teoretycznych  prze- 
widywań oraz  koncepcji  dotyczącej  łączenia  się  elek- 
tronów w pary. 

Kwantowanie  strumienia  magnetycznego  jest  jedną 
z podstawowych  własności  nadprzewodników  i od- 
grywa bardzo  ważną  rolę  w stanie  mieszanym  (o  czym 
w dalszej  części  hasła)  oraz  w zjawiskach  Josephsona. 
Analogiczne  zjawisko  kwantowania  wielkości  makro- 
skopowej występuje  w nadpłynnym  helu,  gdzie  kwan- 
tuje się  strumień  wektora  wirowości.  Kwantowanie 
strumienia  magnetycznego  dowodzi  wysokiego  stop- 
nia uporządkowania  w układzie  nośników  prądu 
nadprzewodzonego.  Pary  Coopera  nie  mogą  poru- 
szać się  niezależnie  jedna  od  drugiej;  wszystkie  po- 
ruszają się  zgodnie,  a funkcje  falowe  opisujące  ruch 
tych  par  mają  jednakową  długość  i są  uzgodnione  fa- 
zowo czyli  koherentne  (spójne),  przy  czym  koheren- 
cja obejmuje  cały  obszar  nadprzewodnika. 


Entropia  i energia  swobodna 
nadprzewodnika 

O tym,  że  po  przejściu  w stan  nadprzewodnictwa  zwięk-  zaSeźność 
sza  się  uporządkowanie  w układzie  elektronów  świad-  entropii  od 
czy  również  zależność  entropii  nadprzewodnika  temperatury 
od  temperatury  (rys.  4b).  Poniżej  punktu  przejścia 
w stan  nadprzewodzący  Tk  następuje  szybki  spadek 
entropii.  Wartość  entropii  S układu  elektronów  prze- 
wodnictwa możemy  znaleźć  mierząc  elektronowe 
ciepło  właściwe  C nadprzewodnika  w funkcji  tempera- 
tury i całkując  otrzymaną  zależność: 

T 

f dr = ser) -sco).  (2) 

o 

Na  mocy  trzeciej  zasady  termodynamiki  5(0)  = 0. 


entropia  S ~ ciepło  właściwe  C 


Rys.  4.  Zależność  funkcji  termodynamicz- 
nych układu  elektronów  nadprzewodnika 
od  temperatury:  a)  ciepło  właściwe;  b) 
entropia,  c)  energia  swobodna.  Czarnym 
kolorem  oznaczono  wykresy  funkcji  dla 
fazy  nadprzewodzącej 


Znając  entropię  w podobny  sposób  możemy  obli- 
czyć energię  swobodną: 

T 


/ 


S(J)dT  = G(7)-G(0). 


(3) 


zmniejszyć  się  od  swej  maksymalnej  wartości,  jaką 
ma  w głębi  nadprzewodnika,  do  zera  na  jego  granicy. 

Za  parametr  uporządkowania  możemy  przyjąć  np. 
względną  gęstość  par  Coopera  albo  względną  szero- 
kość przerwy  energetycznej,  tzn.  stosunek  jej  wartości 
lokalnej  do  wartości  w głębi  nadprzewodnika.  Para- 
metr uporządkowania  nie  znika  nagle,  lecz  maleje 
stopniowo  w warstwie  o skończonej  grubości.  Grubość 
tej  warstwy  nazywamy  odległością  korelacji  lub  odległość 
zasięgiem  korelacji  i oznaczamy  literą  Jest  ona  (zasięg) 
w przybliżeniu  równa  odegłości,  z jakiej  oddziałują  koleracji 
z sobą  (korelują)  elektrony  pary. 

Odległość  korelacji  jest  bardzo  ważnym  parame- 
trem charakteryzującym  materiał  nadprzewodnika. 

Dla  czystych  metali  odległość  korelacji  jest  rzędu 
10-4  cm,  a więc  przekracza  około  10  000  razy  od- 
ległość międzyatomową  w krysztale.  Elektrony  nad- 
przewodnika korelują  więc  swe  ruchy  na  stosunkowo 
dużej  odległości.  Domieszki  lub  defekty  w nadprze- 
wodniku zakłócają  korelację  międzyelektronową 
i zmniejszają  odległość  korelacji,  dlatego  stopy  me- 
tali mają  zwykle  mały  zasięg  korelacji  (niekiedy 
sto  razy  mniejszy  niż  czyste  metale). 


Materiały  nadprzewodzące 


Energia  swobodna  w temperaturze  T — 0,  czyli 
G(0)  nie  jest  dla  nas  istotna,  gdyż  interesuje  nas  tylko 
zmiana  energii  swobodnej  po  przejściu  w stan  nad- 
przewodnictwa, czyli  różnica  Gn(T)  — Gs(T)  (znaczki 
n i s odnoszą  się  do  stanu  normalnego  i nadprzewo- 
dzącego). Jak  widać  na  wykresie  rys.  4c,  dla  T < 7* 
stan  nadprzewodzący  jest  stanem  stabilnym,  gdyż 
ma  niższą  energię  swobodną  niż  stan  normalny. 


Energia  kondensacji 

Różnica  energii  swobodnych  w stanie  normalnym 
i nadprzewodzącym,  czyli  Gn(T)—Gs(T)t  jest  funkcją 
temperatury  i nazywa  się  energią  kondensacji.  Jest 
to  właśnie  ta  część  energii,  którą  traci  układ  elektro- 
nów tworząc  kondensat  złożony  z par  Coopera. 
Jak  już  wspominaliśmy,  w pary  łączą  się  nie  wszystkie 
elektrony,  lecz  tylko  te,  które  w stanie  normalnym 
zajmują  przedział  energetyczny  o szerokości  rzędu 
1j2A(T)  w pobliżu  poziomu  Fermiego.  Jeśli  gęstość 
jednoelektronowych  stanów  w tym  przedziale  w nor- 
malnym stanie  oznaczymy  przez  N(Ef)>  to  liczba 
utworzonych  par  wyniesie  ok.  1/iN(EF)A(T)  na 
jednostkę  objętości  nadprzewodnika.  Energia  wiąza- 
energia  nia  jednej  pary  jest  równa  2 A(T),  zatem  energia  kon- 
kondensacji  densacji  w T = 0 wyniesie 

Cn(0)  — Gs(0)  = XUN{EF)A\  0)  (4) 

na  jednostkę  objętości  (albo  na  atom  lub  na  mol  - 
zależnie  od  tego,  jak  określono  N{EF)\  Stanowi  to 
ok.  10~8  eV  na  atom,  czyli  ok.  10"4  J/cm3  (są  to  tylko 
wartości  orientacyjne:  w zależności  od  rodzaju  ma- 
teriału mogą  się  one  wahać  o rząd  wielkości  lub  więcej). 
Jest  to  bardzo  mała  energia  w porównaniu  z energią 
kinetyczną  układu  elektronów  (ok.  10  eV  na  atom) 
lub  z energią  oddziaływania  kulombowskiego.  Mała 
wartość  tej  energii  była  główną  przyczyną  trudności 
przy  opracowywaniu  teorii  nadprzewodnictwa,  gdy 
trzeba  było  rozpatrywać  małą  różnicę  dwu  dużych 
wielkości.  Należało  więc  uwzględnić  tylko  te  efekty 
które  były  istotne  dla  nadprzewodnictwa,  a pozosta- 
łe —jednakowe  dla  obu  stanów  — odrzucić  przy  roz- 
patrywaniu różnicy  ich  energii. 


Odległość  korelacji 

Na  granicy  nadprzewodnika  z materiałem  normalnym 
(lub  z próżnią)  musi  znikać  uporządkowanie  nad- 
przewodzące, a więc  parametr  uporządkowania  musi 


Nadprzewodnictwo  wykazuje  wiele  pierwiastków, 
głównie  metalicznych,  a także  wiele  stopów  i związków 
chemicznych.  Rozmieszczenie  nadprzewodników  w 
układzie  okresowym  pierwiastków  przedstawiono  w pierwiastki 
tabeli  na  następnej  stronie.  Liczby  w tabeli  w rubry- 
kach pierwiastki  oznaczają  temperaturę  przejścia 
pierwiastków  w stan  nadprzewodzący;  litera  p ozna- 
cza nadprzewodnictwo  pod  ciśnieniem,  litera  / — nad- 
przewodnictwo cienkiej  warstwy  osadzonej  z par  da- 
nego pierwiastka  na  podłoże  chłodzone  ciekłym  he- 
lem, litery  a,  p,  y — fazy  krystalograficzne.  Niektóre 
pierwiastki  nadprzewodzą  tylko  pod  zwiększonym 
ciśnieniem  (przechodzą  wtedy  w inną  modyfikację 
krystalograficzną)  lub  w postaci  cienkich  warstw  o nie- 
krystalicznej  strukturze,  uzyskanych  przez zaparowa- 
nie wyjściowego  materiału  na  podłoże  oziębione  cie- 
kłym helem.  Nadprzewodnictwo  takich  warstw  świad- 
czy o tym,  że  struktura  krystaliczna  nie  jest  koniecz- 
nym warunkiem  pojawienia  się  nadprzewodnictwa. 

Nie  są  nadprzewodnikami  metale  ferromagnetyczne 
i metale  pierwszej  grupy  układu  okresowego  (oprócz 
cezu  pod  ciśnieniem).  Wśród  nadprzewodników  spo- 
tyka się  pierwiastki  krystalizujące  w różnych  ukła- 
dach, przy  czym  różne  modyfikacje  krystalograficzne 
tego  samego  pierwiastka  mają  na  ogół  różne  tempera- 
tury przejścia  w stan  nadprzewodnictwa.  Dowodzi  to, 
że  nadprzewodnictwo  nie  jest  cechą  określonych  ato- 
mów, lecz  zależy  od  struktury  sieci  krystalicznej. 

W obecnym  stanie  wiedzy  nie  możemy  przewi- 
dzieć, czy  dany  pierwiastek  może  być  nadprzewod- 
nikiem, czy  nie.  Możemy  tylko  wykluczyć  nadprze- 
wodnictwo ferromagnetyków,  gdyż  silne  wewnętrzne 
pole  magnetyczne  w tych  substancjach  niszczy  upo- 
rządkowanie nadprzewodzące  na  rzecz  uporządko- 
wania magnetycznego.  Nie  ma  jednak  zasadniczych 
przeszkód  dla  pojawienia  się  nadprzewodnictwa  np. 
w metalach  pierwszej  grupy  układu  okresowego.  Być 
może,  temperatury  ich  przejścia  w stan  nadprzewod- 
nictwa są  zbyt  niskie,  niższe  niż  te,  w których  były 
one  badane. 

Obecnie  znamy  38  pierwiastków  i około  tysiąca  stopy 
stopów  i związków,  które  stają  się  nadprzewodnika-  i związki 
mi.  Lista  materiałów  nadprzewodzących  nie  jest 
jeszcze  zakończona,  gdyż  nadal  odkrywane  są  coraz 
to  nowe  nadprzewodniki.  Wśród  związków  nadprze- 
wodzących wiele  jest  takich,  w których  żaden  ze 
składników  z osobna  nie  jest  nadprzewodnikiem  (np. 

CuS).  Wśród  nadprzewodników  spotykamy  nawet 
substancje  organiczne,  jak  np.  anilina  czy  pirydyna, 
w postaci  monomolekulamych  warstw  rozdzielonych 
chalkogenidkami  niektórych  metali. 
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Rozmieszczenie  nadprzewodników  w układzie  okresowym  pierwiastków 
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Nadprzewodnik  w polu 
mag  ^etycznym 

Zjawisko  Meissnera 

Przez  długi  czas  po  odkryciu  nadprzewodnictwa  są- 
dzono, że  nadprzewodnik  to  jedynie  doskonały  prze- 
wodnik, tzn.  przewodnik  pozbawiony  oporu  elek- 
trycznego. Dopiero  w 1933  r.,  a więc  22  lata  po  od- 
odkrycie  znikania  oporu,  W.  Meissner  i R.  Ochsenfeld 

Meissnera  23  P°moc3  małej  ceweczki  pomiarowej  wyznaczyli 
i OchsenfeSda  rozkład  linii  sił  pola  magnetycznego  dokoła  kuli  nad- 
przewodzącej i odkryli  drugą  podstawową  własność 
nadprzewodnika:  linie  sił  pola  zewnętrznego  zawsze 
omijają  nadprzewodzącą  bryłę.  Niezależnie  od  tego, 
czy  pole  magnetyczne  zostało  nałożone  przed  przej- 
ściem w stan  nadprzewodnictwa,  czy  po  przejściu, 
indukcja  magnetyczna  w obszarze  nadprzewodnika 
jest  zawsze  równa  zeru.  Nadprzewodnik  jest  więc  nie 
tylko  doskonałym  przewodnikiem,  ale  także  dosko- 
nałym diamagnetykiem. 

Bryła  substancji,  która  byłaby  tylko  doskonałym 
przewodnikiem,  po  nałożeniu  pola  magnetycznego 
i następnym  oziębieniu  poniżej  temperatury  przejścia 
Tk  w stan  bezoporowy  zachowałaby  to  pole  w swej 
objętości  nawet  po  usunięciu  pola  zewnętrznego,  po- 
dobnie jak  pierścień  nadprzewodzący  lub  wydrążony 
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walec  zachowuje  pole  magnetyczne  w Swym  otworze. 
Zgodnie  z regułą  Lentza,  każda  zmiana  pola  zew- 
nętrznego po  przejściu  bryły  w stan  bezoporowy 
wzbudzałaby  na  jej  powierzchni  trwały  prąd  elek- 
tryczny, podtrzymujący  wewnątrz  bryły  stałą  w czasie 
wartość  indukcji  magnetycznej.  Indukcja  magnetycz- 
na wewnątrz  doskonałego  przewodnika  byłaby  więc 
stale  równa  tej  jej  wartości,  jaka  istniała  w chwili 
przejścia  w stan  bezoporowy. 

Nadprzewodnik  tym  różni  się  od  przewodnika  do- 
skonałego, że  w chwili  przejścia  w stan  bezoporowy 
wypycha  ze  swej  objętości  istniejące  tam  poprzednio 
pole  magnetyczne,  tak  że  B = 0 niezależnie  od  po- 
czątkowej jej  wartości.  Takie  zachowanie  się  nad- 
przewodnika nie  daje  się  wyjaśnić  na  gruncie  elek- 
trodynamiki klasycznej.  Teorię  uwzględniającą  za- 
chowanie się  nadprzewodników  w polu  magnetycz- 
nym, czyli  zjawisko  Meissnera,  opracowali  bracia 
F.  i H.  Londonowie  w 1935  roku. 

Wypychanie  strumienia  magnetycznego  z wnętrza 
nadprzewodzącej  bryły  odbywa  się  w ten  sposób,  że 
w chwili  przejścia  w stan  nadprzewodnictwa  na  po- 
wierzchni nadprzewodnika  wzbudza  się  trwały  prąd 
elektryczny,  który  wytwarza  własne  pole  magne- 
tyczne kompensujące  do  zera  pole  magnetyczne  ist- 
niejące poprzednio  wewnątrz  bryły.  Ten  powierzch- 
niowy prąd  elektryczny  nazywa  się  prądem  Meissnera 
lub  prądem  ekranującym,  gdyż  jak  gdyby  ekranuje 


wypychanie 
pola  magne- 
tycznego 
przez  nad- 
przewodnik 


on  wnętrze  nadprzewodnika  od  pola  zewnętrznego. 
Na  zewnątrz  nadprzewodzącej  bryły  pole  magne- 
tyczne pochodzące  od  prądu  Meissnera  nakłada  się 


Rys.  5.  Nadprzewodnik  w polu  magnetycznym:  A linie  sił  pola 
zewnętrznego  przed  umieszczeniem  w nim  nadprzewodnika, 
B linie  sił  pola  magnetycznego  wytworzonego  przez  prąd  Meis- 
snera po  umieszczeniu  nadprzewodnika  w polu  zewnętrznym, 
C linie  sił  wypadkowego  pola  magnetycznego  powstałego  przez 
nałożenie  pola  prądów  Meissnera  na  pole  zewnętrzne 


stan 
nadprzewod- 
nictwa 


na  pole  pierwotne  i tworzy  wspólne  pole  wypadkowe; 
linie  tego  pola  wypadkowego  opływają  nadprzewo- 
dzącą bryłę. 

Rys.  5 przedstawia  elipsoidalną  bryłę  nadprze- 
wodnika umieszczoną  w jednorodnym  polu  magne- 
tycznym. Widać,  jak  nadprzewodnik  zmienia  to  pole 
zewnętrzne  i powoduje,  że  największa  gęstość  linii  sił 
pola  (czyli  najsilniejsze  pole)  występuje  na  „równiku” 
elipsoidy  (rys.  5c).  Im  większa  długość  elipsoidy 
w kierunku  pola  w porównaniu  z jej  średnicą  równi- 
kową, tym  mniejszy  stopień  zniekształcenia  pola 
zewnętrznego.  Gdy  elipsoida  jest  nieskończenie  długa 
lub  gdy  mamy  nieskończenie  długi  walec  o osi  równo- 
ległej do  linii  sił  pola,  zniekształcenie  pola  zewnętrz- 
nego w ogóle  nie  nastąpi.  Nieskończenie  długi  walec 
nadprzewodzący,  równoległy  do  linii  sił  pola,  wraz 
z prądem  Meissnera  na  jego  powierzchni  możemy 
potraktować  jak  nieskończenie  długi,  gęsto  nawinięty 
solenoid.  Pole  magnetyczne  takiego  solenoidu,  wy- 
tworzone przez  prąd  płynący  w jego  uzwojeniach,  jest 
jednorodne  wewnątrz  solenoidu  i równe  zeru  na 
zewnątrz.  Nieskończenie  długi  solenoid  nie  zaburza 
więc  postronnego  pola  zewnętrznego.  W praktyce  za 
nieskończenie  długi  walec  możemy  uważać  taki  wa- 
lec, którego  długość  jest  bardzo  wielka  w porównaniu 
z jego  średnicą. 

Zjawisko  Meissnera  ma  bardzo  istotne  znaczenie 
z punktu  widzenia  termodynamiki.  Dzięki  temu  zja- 
wisku przejście  w stan  nadprzewodnictwa  jest  przej- 
ściem odwracalnym,  może  więc  być  potraktowane 
jako  przemiana  fazowa.  Stan  nadprzewodnictwa  ce- 
chuje zerowa  wartość  indukcji  magnetycznej  nieza- 
leżnie od  tego,  w jaki  sposób  stan  ten  został  osiągnię- 
ty: czy  najpierw  oziębiono  substancję  do  temperatury 
niższej  od  temperatury  przemiany  w stan  nadprze- 
wodnictwa, a później  przyłożono  pole  magnetyczne, 
czy  też  najpierw  umieszczono  substancję  w polu 
magnetycznym,  a potem  ją  oziębiono.  Stan  nadprze- 
wodnictwa jest  więc  odrębną  termodynamiczną  fazą 
substancji.  Doskonałego  przewodnika  nie  moglibyśmy 
w ten  sposób  traktować,  gdyż  jego  stan  po  utracie 
oporu  zależałby  od  tego,  czy  był  oziębiany  w polu 
magnetycznym,  czy  nie. 


Głębokość  wnikania 

Prąd  Meissnera,  kompensujący  wewnątrz  nadprze- 
wodnika zewnętrzne  pole  magnetyczne,  płynie  po 
powierzchni  nadprzewodnika  w warstwie  o pewnej 
grubości.  W tej  powierzchniowej  warstwie  indukcja 
magnetyczna  jest  różna  od  zera.  Możemy  więc  uwa- 
żać, że  pole  zewnętrzne  wnika  w powierzchniową  war- 


stwę nadprzewodnika  na  pewną  głębokość,  nazywa- 
ną po  prostu  głębokością  wnikania.  . , 

W warstwie  powierzchniowej  indukcja  magnetyczna 
zmienia  się  od  wartości,  jaka  istnieje  na  zewnątrz,  do  głębokość 
zera  w głębi  nadprzewodnika.  Jeśli,  jak  to  wynika  wnikania 
z elektrodynamiki  Londonów,  indukcja  maleje  wy- 
kładniczo ze  wzrostem  odległości  x od  powierzchni, 
czyli  B(x)  = B(0)e~alxy  to  w odległości  * ==  <5  zmaleje 
ona  e » 2,718...  razy  w stosunku  do  tej  wartości,  jaką 
miała  na  powierzchni  próbki.  Odległość  <5  można 
uważać  za  efektywną  głębokość  wnikania,  tj.  taką 
odległość,  do  której  indukcja  nie  zmienia  się  wcale, 
a po  jej  przekroczeniu  (czyli  dla  * > <5)  indukcja  jest 
już  zerem.  Krzywą  wykładniczą  zastępujemy  w ten 
sposób  linią  łamaną  (rys.  6). 


odległość  x 

Rys.  6.  Zależność  lokalnej  indukcji  magnetycznej  JBiok  wewnątrz 
nadprzewodnika  od  odległości  x od  powierzchni  nadprzewodnika 


temperatura  T 

Rys.  7.  Zależność  głębokości  wnikania  pola  od  temperatury 


Głębokość  wnikania  8 zależy  od  temperatury;  gdy  zależność  8 
temperatura  zbliża  się  do  7*,  głębokość  wnikania  od  ..empe- 
rośnie  do  nieskończoności  (rys.  7).  Oznacza  to,  że  ratury 
w miarę  zbliżania  się  do  Th  pole  magnetyczne  stop- 
niowo wnika  coraz  głębiej  w nadprzewodnik  i w chwi- 
li przejścia  w stan  normalny  cała  objętość  nadprze- 
wodnika jest  już  zajęta  przez  pole.  Głębokość  wnika- 
nia w temperaturze  zera  bezwzględnego  80  jest  ważną 
stałą  charakteryzującą  dany  nadprzewodnik.  Po- 
dobnie jak  zasięg  korelacji  f,  głębokość  wnikania  S0 
zależy  od  czystości  materiału,  z tym,  że  80  zwiększa 
się  z koncentracją  domieszek.  Dla  czystych  metali 
80  « 10” 6 cm;  dla  niektórych  stopów  może  być  na- 
wet o dwa  rzędy  większa. 


Odpychanie  nadprzewodnika  przez  pole 
magnetyczne 

Doskonały  diamagnetyzm  jest  przyczyną  wypychania 
nadprzewodnika  z obszaru  najsilniejszego  pola.  Od- 
wrotnie bywa  w przypadku  ferromagnetyków : są  one 
wciągane  w obszar  najsilniejszego  pola  (np.  rdzeń  że- 
lazny jest  wciągany  do  cewki,  w której  płynie  prąd 
elektryczny).  Powszechnie  znane  jest  doświadczenie 
z kulą  nadprzewodzącą  unoszącą  się  nad  pierście- 
niami, w których  krążą  niezanikające  prądy  elektrycz- 
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ne  (wzbudzone  w przeciwnych  kierunkach);  prądy  te 
wytwarzają  pole  magnetyczne  odpychające  nadprze- 
wodzącą kulę.  Rysunek  8 ilustruje  omawiane  zjawis- 


ko, rys.  8b  pokazuje  konfigurację  pola  magnetycznego 
wytworzonego  przez  oba  pierścienie  przed  umieszcze- 
niem nad  nimi  kuli,  rys.  8c  — po  umieszczeniu  kuli 


1nadP™w0fM«j  przez  pole  magnetyczne:  a)  widok  ogólny,  b)  linie  sil  pola  magnetycznego  wytworzonego  przez 
mezamkające  prądy  płynące  w pierścieniach,  c)  linie  sił  po  umieszczenia  kuli  nadprzewodzącej  nad  pierścieniami 
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nad  pierścieniami.  Pole  magnetyczne  utrzymuje  kulę 
równoważąc  siłę  ciężkości. 

Innym  wariantem  takiego  doświadczenia  jest  tzw.  pływający 
pływający  magnes  (rys.  9).  Magnes  sztabkowy  opusz-  magnes 
czony  jest  nad  czaszą  nadprzewodzącą.  Linie  sił  pola 
magnetycznego  pochodzące  od  tego  magnesu  unoszą 
go  nad  czaszą.  Zjawisko  to  tłumaczymy  odpychaniem 
nadprzewodzącej  czaszy  przez  linie  sił  pola  magne- 
tycznego. Jeśli  czasza  jest  sztywno  umocowana 
w kriostacie,  to  siła  odpychania  unosi  magnes. 


Krytyczne  pole  magnetyczne 

Jeśli  natężenie  pola  magnetycznego,  w którym  umiesz- 
czono nadprzewpdnik,  przekroczy  pewną  wartość 


A/cm 


Rys.  10.  Zależność  krytycznych  natężeń  pól  magnetycznych  od 
temperatury  dla  niektórych  pierwiastków  nadprzewodzących 


krytyczną  Hk  — nadprzewodnictwo  zniknie,  aby 
powrócić  znowu,  gdy  natężenie  pola  zmniejszy  się  do 
wartości  H < Hk.  Krytyczna  wartość  natężenia  pola 
magnetycznego  dla  danego  nadprzewodnika  zależy 
od  temperatury  (rys.  10).  Zależność  tę  można  w przy- 
bliżeniu wyrazić  następującym  wzorem: 

Hk(T)  = Hk( 0)[1  -(TITkn  (5) 

wykres  stanu  Wykres  Hk{T)  jest  wykresem  stanu  dla  nadprzewod- 

nadprzewod-  nika.  Krzywa  Hk(T)  rozdziela  ćwierćpłaszczyznę 
nika  T-H  na  dwa  obszary  fazowe : obszar  fazy  nadprzewo- 
dzącej (pod  krzywą)  i obszar  fazy  normalnej  (reszta 
ćwierćpłaszczyzny).  Krzywa  Hk(T)  jest  krzywą  równo- 
wagi fazowej,  tzn.  w stanie  odpowiadającym  punkto- 
wi (jfo,  Ho)  leżącemu  na  krzywej  Hk(T)  mogą  istnieć 
obie  fazy  obok  siebie  w równowadze.  Wynika  to 
stąd,  że  dla  T < Tk  obu  fazom  odpowiadają  różne 
wartości  entropii  (rys.  4b),  a więc  przejście  w stan 
nadprzewodnictwa  w polu  magnetycznym  jest  prze- 
mianą fazową  I rodzaju.  Utajone  ciepło  przemiany 
wynosi  Q = T(Sn-S9 ).  Jeśli  H = 0,  to  przemiana 
zachodzi  w T = Tk  i ciepło  przemiany  jest  wtedy 
równe  zeru,  gdyż  Sn(Tk)  = S8(Tk).  W nieobecności 
pola  magnetycznego  przejście  w stan  nadprzewod- 
nictwa jest  więc  przemianą  fazową  II  rodzaju.  Świad- 
czy o tym  także  kształt  krzywej  zależności  ciepła 
właściwego  od  temperatury  (rys.  5a)  zbliżony  do 
kształtu  litery  A. 


Namagnesowanie  nadprzewodnika 

Jak  widać  na  rys.  5b,  nadprzewodnik  w polu  magne- 
tycznym magnesuje  się,  czyli  przybiera  określony 
moment  magnetyczny.  Jako  diamagnetyk,  nadprze- 
wodnik magnesuje  się  w kierunku  przeciwnym  do 
przyłożonego  poła  magnetycznego,  a więc  jego  mo- 
ment magnetyczny  jest  ujemny.  Oczywiście,  moment 
magnetyczny  nadprzewodnika  pochodzi  od  niezani- 
kających  prądów  Meissnera,  krążących  po  jego  po- 
wierzchni. Jak  wiadomo,  płaska  pętla  prądu  elek- 
trycznego ma  dipolowy  moment  magnetyczny  równy 
M = IAt  gdzie  l jest  natężeniem  prądu  w pętli,  A — 
polem  płaskiej  powierzchni  otoczonej  tą  pętlą.  Na 
moment  magnetyczny  nadprzewodnika  składają  się 
momenty  dipolowe  wszystkich  płaskich  pętli  prądo- 
wych, na  jakie  można  by  podzielić  powierzchniowy 
prąd  Meissnera. 

W ustalonych  warunkach  moment  magnetyczny 
nadprzewodzącej  bryły  jest  proporcjonalny  do  jej 
objętości,  można  więc  posługiwać  się  pojęciem  nama- 
gnesowania, czyli  momentu  magnetycznego  przypa- 
zależność  dającego  na  jednostkę  objętości.  Początkowo  na- 
namagneso-  magnesowanie  wzrasta  liniowo  ze  wzrostem  natężenia 
wania  pola  zewnętrznego,  gdyż  zwiększa  się  gęstość  po- 
od  pola  wierzchniowa  prądów  Meissnera,  ekranujących  wnę- 
trze bryły  od  tego  pola.  Gdy  natężenie  pola  przekroczy 
krytyczną  wartość  Hk>  nadprzewodnictwo  znika  i na- 
magnesowanie spada  do  zera.  Taka  zależność  nama- 
gnesowania od  natężenia  pola  magnetycznego  jest 
typowa  dla  nadprzewodników  i wyróżnia  je  spośród 
innych  materiałów  magnetycznych.  W przeciwień- 
stwie do  namagnesowania,  brak  oporu  elektrycznego 
nie  zawsze  stanowi  wiarygodne  kryterium  nadprze- 
wodnictwa, gdyż  niekiedy  bywa  wynikiem  obecności 
domieszek  materiału  nadprzewodzącego  w nienad- 
przewodzącej  próbce.  Domieszki  te  mogą  utworzyć 
nadprzewodzące  ścieżki,  zwierające  „na  krótko” 
resztę  materiału. 

Zmiana  energii  swobodnej  w polu 
magnetycznym 

Magnesowanie  się  nadprzewodnika  w polu  magne- 
tycznym (czyli  wzbudzanie  prądów  Meissnera) 
zwiększa  jego  energię  swobodną  o 1/2<“o-fiT2  na  jed- 
nostkę objętości.  Ponieważ  zmianę  energii  dG,  spo- 


wodowaną magnesowaniem,  obliczamy  z zależności: 

H o 

dG  = —MdH,  przeto  G(H0)  — G(0)  = — / MdH. 

o 

Dla  nadprzewodnika  w stanie  Meissnera 
czyli  M — —HV;  stąd: 

Gs(H0)  = Gg(0)+'l2fiQH2o  V \ (6) 

gdzie  V jest  objętością  bryły  nadprzewodzącej.  Jeśli 
pominiemy  słaby  paramagnetyzm  (lub  diamagne- 
tyzm) normalnego  metalu  (a  ferromagnetyki  nie  są 
nadprzewodnikami),  to  energia  swobodna  w stanie 
normalnym  nie  będzie  zależeć  od  natężenia  pola  ma- 
gnetycznego, czyli  GniHk)  = Gn( 0). 

Gdy  natężenie  pola  zewnętrznego  osiągnie  wartość  zależność 
Hk , energia  swobodna  w stanie  nadprzewodzącym  energii 
wzrośnie  na  tyle,  że  zrówna  się  z energią  swobodną  swobodnej 

od  poła 


w stanie  normalnym  (rys.  11).  Przy  dalszym  zwiększa- 
niu natężenia  pola  utrzymywanie  stanu  nadprze-  krytyczne 
wodnictwa  byłoby  już  niekorzystne,  gdyż  GS(,H)  > natężenie 
> Gn(H)  dla  H > Hky  dlatego  przy  H = Hk  nad-  pola  magno. 
przewodnik  przechodzi  w stan  normalny.  Krytyczne  tycznego 
natężenie  pola  magnetycznego  Hk  jest  to  takie  natę- 
żenie, przy  którym  gęstości  energii  swobodnych  w obu 
fazach,  normalnej  i nadprzewodzącej,  są  sobie  równe. 

To  stwierdzenie  można  uznać  za  definicję  krytycznego 
natężenia  pola  magnetycznego  Hk.  Mamy  więc: 

Gs(Hk)  = GM+iUtioHlY  = Gn(Hk\ 
a ponieważ  Gn{Hk)  — (7n(0),  to 

G«(0)  - GA 0)  = Va  /*o  Hl  V.  (7) 

Wynika  z tego,  że  w nieobecności  pola  magnetycz- 
nego zmiana  (spadek)  energii  spowodowanej  po 
przejściu  w stan  nadprzewodnictwa  w wyniku  obni- 
żenia temperatury  (czyli  energia  kondensacji)  wynosi 
1Ut*0Hk(T)  na  jednostkę  objętości.  Porównując 
wyrażenia  (4)  i (7)  otrzymujemy  zależność: 

HiĄT)  = A (T)  (N(EF)lMo)'lł-  (8) 


Stan  pośredni 

Jeśli  próbka  nadprzewodnika  nie  jest  walcem  równo- 
ległym do  linii  sił  zewnętrznego  pola  magnetycznego, 
to  próbka  taka  zmienia  w swoim  otoczeniu  rozkład 
linii  sił,  a na  jej  powierzchni  natężenie  pola  nie  wszę- 
dzie ma  jednakową  wartość.  Gdy  nadprzewodnik  ma 
kształt  elipsoidy  obrotowej  skierowanej  osią  symetrii 
wzdłuż  linii  sił  pola  zewnętrznego  (jak  na  rys.  6),  natę- 
żenie pola  ma  większą  wartość  na  równiku  elipsoidy, 
a mniejszą  na  biegunach.  Jeśli  więc  natężenie  pola 
zwiększa  się  z czasem,  to  najwcześniej  krytyczną  war- 
tość osiągnie  ono  na  równiku  elipsoidy  i pas  równi- 
kowy najpierw  powinien  przejść  w stan  normalny. 
Nie  jest  to  jednak  możliwe,  gdyż  wtedy  pole  wniknę- 
łoby w obszar  normalny  i natężenie  pola  zmalałoby 
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tószary  tam  do  wartości  H < Hic  ',  obszar  pasa  równikowego 
normałne  musiałby  więc  odzyskać  nadprzewodnictwo,  a to 
i nadprze-  przywróciłoby  wyjściową  sytuację.  Jedynym  możli- 
wodzące  wym  rozwiązaniem  jest  podział  całej  objętości  próbki 
na  warstwowe  obszary  fazy  normalnej  rozdzielone 


linie  sil  pola  magnetycznego 


obszarami  fazy  nadprzewodzącej  (rys.  12).  Pole  ma- 
gnetyczne przenika  próbkę  poprzez  obszary  normalne. 
Kształt  obszarów  normalnych  wychodzących  na  po- 
wierzchnię próbki  możemy  obserwować  wizualnie 
po  posypaniu  próbki  proszkiem  ferromagnetycznym; 
proszek  osiądzie  na  obszarach  normalnych,  gdyż  tam 
H * 0 (il.  94,  tabl.  24). 

natężenie  Stan,  w Jakim  znajduje  się  próbka  po  podziale  na 
krytyczne  współistniejące  obok  siebie  obszary  fazy  normalnej 
dla  stanu  i nadprzewodzącej,  nazywamy  stanem  pośrednim, 
pośredniego  Natężenie  zewnętrznego  pola  magnetycznego  Hay 
przy  którym  próbka  przechodzi  w stan  pośredni,  za- 
leży od  jej  kształtu  i orientacji  względem  linii  sił,  czyli 
od  współczynnika  rozmagnesowania  D : 


Ha  = Hk{\-D).  (9) 

Dla  kuli  D — 1lz  i Ha  — *l3Hk,  dla  walca  prosto- 
padłego do  pola  Ha  = Va  H* ; walec  równoległy  do 
pola  nie  zmienia  rozkładu  linii  sił  i przechodzi  bez- 
pośrednio w stan  normalny,  gdy  Ha  — Hk. 

Makroskopowe  rozmiary  obszarów  poszczegól- 
nych faz  w stanie  pośrednim  świadczą  o istnieniu  do- 
datniej energii  związanej  z powierzchnią  rozgrani- 
czającą te  obszary ; w przeciwnym  razie  korzystniejszy 
byłby  bardzo  drobny  podział,  gdyż  wtedy  przy  po- 
wierzchni próbki  byłoby  mniejsze  skrzywienie  linii 
sił  pola  przenikającego  przez  obszary  normalne.  W 
miarę  wzrostu  natężenia  pola  od  wartości  Hk{  1 D) 
do  Hk  zwiększa  się  w oróbce  udział  fazy  normalnej 
kosztem  fazy  nadprzewodzącej.  Gdy  natężenie  pola 
osiągnie  wartość  Hk>  obszary  nadprzewodzące  znikają 
zupełnie. 

Wewnątrz  próbki  w stanie  pośrednim  indukcja 
magnetyczna  w obszarach  fazy  nadprzewodzącej  jest 
równa  zeru,  a w obszarach  fazy  normalnej  B = ju0  Hk. 
Indukcja  średnia  dla  całej  próbki,  tj.  uśredniona  po 
całej  objętości  próbki,  wynosi  Bśr  = /*0 gdzie 
xn  jest  częścią  objętości  próbki  zajętą  przez  fazę  nor- 
malną. Bśt  jest  liniową  funkcją  H , czyli  udział  fazy 
normalnej  jest  proporcjonalny  do  H. 
moment  dia-  Moment  diamagnetyczny  próbki  w stanie  pośred- 
magnetyczny  nim  jest  momentem  magnetycznym  nadprzewodzą- 
w stanie  cych  obszarów,  do  których  pole  nie  wnika  (tylko  one 
pośrednim  są  ekranowane  od  pola).  Rys.  13  przedstawia  zależ- 
ności indukcji  średniej  i momentu  magnetycznego  od 
natężenia  pola  zewnętrznego  dla  trzech  próbek  nad- 
przewodnika o różnym  współczynniku  rozmagneso- 
wania. Zauważmy,  że  pole  powierzchni  zawartej  mię- 
dzy krzywą  momentu  magnetycznego  a osią  H jest 
jednakowe  dla  wszystkich  próbek  niezależnie  od  ich 
współczynnika  rozmagnesowania,  jeśli  tylko  mają  one 
jednakową  objętość  i jednakową  wartość  Hk.  Pole 
to  przedstawia  pracę  wykonaną  przy  magnesowaniu 
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próbki,  czyli  wzrost  energii  próbki  po  nałożeniu  pola 
magnetycznego  H > Hk . Wiemy  już,  że  ten  przyrost 
energii  jest  równy  1/2{*oH%  na  jednostkę  objętości 
próbki. 

A 


// 

ii 

fi 


a/  bf  c 

i / 

L i 


Rys.  13.  Zależność  średniej  indukcji  magnetycznej  i namagneso- 
wania od  natężenia  pola  magnetycznego  dla  próbek  nadprzewod- 
nika o różnym  współczynniku  kształtu  D\  a — kula,  D — Ł/3 ; 
b — walec  poprzeczny  do  linii  sil  pola,  D = */*;  c — walec  rów- 
noległy do  linii  sił  pola,  D — 0 


Energia  powierzchniowa  i dwa  typy 
nadprzewodnictwa 


Z granicą  rozdziału  faz  w stanie  pośrednim  związana 
jest  pewna  energia  powierzchniowa.  O jej  wartości 


Rys.  14.  Szkic  ilustrujący  powstawanie  energii  powierzchniowej 
między  fazą  normalną  i nadprzewodzącą 


decyduje  stosunek  wzajemny  obu  charakterystycz- 
nych wielkości  w nadprzewodniku,  tj.  głębokości 
wnikania  S pola  magnetycznego  i zasięgu  korelacji  £. 
Rozpatrzmy,  jakie  jest  pochodzenie  tej  energii. 

Linia  pionowa  na  rys.  14  oznacza  granicę  rozdzie- 
lającą obszar  fazy  nadprzewodzącej  od  obszaru  fazy 
normalnej.  Parametr  uporządkowania  nadprzewo- 
dzącego nie  zmienia  się  nagle  na  tej  granicy,  lecz 
maleje  stopniowo  w miarę  zbliżania  się  do  obszaru 
fazy  normalnej,  przy  czym  odległość,  na  której  na- 
stępuje zmiana  parametru  uporządkowania  od  wartości 
maksymalnej  do  zera  jest  w przybliżeniu  równa  zasię- 
gowi korelacji  £. 

W głębi  fazy  nadprzewodzącej  uporządkowanie 
zmniejsza  energię  swobodną  nadprzewodnika  o ener- 
gię kondensacji,  czyli  o wartość  równą  1/2^> Hi  na 
jednostkę  objętości.  Zmiana  gęstości  energii  (czyli 
energii  na  jednostkę  objętości)  w warstwie  przygra- 
nicznej, wynikająca  z uporządkowania  elektronów 
w układzie,  jest  przedstawiona  na  rys.  14b.  Ponieważ 
stopień  uporządkowania  w warstwie  przygranicznej 
jest  mniejszy  niż  w głębi  obszaru  fazy  nadprzewodzą- 
cej — gęstość  energii  swobodnej  nie  zmniejsza  się 
w tej  warstwie  o 'Un* H%,  a więc  warstwa  ta  wnosi 
efektywny  wkład  do  energii  fazy  nadprzewodzącej, 
wynoszący  1U na  jednostkę  objętości  warstwy, 
czyli  na  jednostkę  powierzchni  granicznej 

(skuteczna  grubość  warstwy  wynosi  £). 

Istnieje  jeszcze  jeden  czynnik  wpływający  na  gęstość 
energii  swobodnej  w warstwie  przygranicznej:  jest 
to  pole  magnetyczne  wnikające  w obszar  fazy  nad- 
przewodzącej na  głębokość  skuteczną  ó.  Pole  mag- 
netyczne o natężeniu  H zwiększa  gęstość  energii 
swobodnej  fazy  nadprzewodzącej  o 1/au0tf2,  ale 
w warstwie  przygranicznej  o grubości  d pole  nie  po- 
woduje wzrostu  gęstości  energii,  gdyż  wnika  w tę 
warstwę.  Jest  to  równoważne  zmniejszeniu  energii 
swobodnej  obszaru  fazy  nadprzewodzącej  o wartość 
na  jednostkę  powierzchni  granicy  rozdziału 
faz  (natężenie  pola  przyjmujemy  tu  za  równe  Hk> 
gdyż  taką  wartość  ma  ona  na  granicy  międzyfazowej 
w stanie  pośrednim;  jest  to  warunek  stabilności  gra- 
nicy). 

W głębi  fazy  nadprzewodzącej  oba  wkłady  w energię 
swobodną  (wkład  od  pola  magnetycznego  i wkład 
od  energii  kondensacji)  znoszą  się  wzajemnie  i gęstość 
energii  fazy  nadprzewodzącej  jest  w stanie  pośrednim 
równa  gęstości  energii  fazy  normalnej,  tak  jak  w polu 

0 natężeniu  krytycznym.  Na  granicy  faz  przeważa 

zwykle  jeden  z wkładów,  gdyż  na  ogół  długości  £ i <5 
nie  muszą  być  sobie  równe  (rys.  14c).  Dodatkowa 
energia  związana  z granicą  rozdziału  faz  jest  więc 
równa  na  jednostkę  powierzchni  gra- 

nicznej. Jeśli  £ > <5,  to  energia  powierzchniowa  jest 

nadprzewod-  dodatnia  i takie  nadprzewodniki  nazywane  są  nad- 
niki  1 typu  przewodnikami  I typu;  jeśli  £ < <5,  to  energia  po- 
wierzchniowa jest  ujemna  i nadprzewodniki  takie 
n&tiprcewod-  należą  do  drugiej  grupy,  czyli  do  nadprzewodników 
niki  II  typu  n typU. 

Nadprzewodnikami  I typu  są  prawie  wszystkie 
pierwiastki  nadprzewodzące  (z  wyjątkiem  Nb,  V i Tc), 
oraz  niektóre  stopy  sporządzone  na  bazie  takich  me- 
tali, jak  In,  Al,  Hg,  Sn,  przez  rozpuszczenie  w nich 
niewielkiej  domieszki  drugiego  składnika.  Większość 
stopów  nadprzewodzących,  a w szczególności  stopy 
na  bazie  metali  przejściowych,  oraz  pierwiastki  Nb, 
V i Tc  należą  do  nadprzewodników  II  typu.  Nad- 
przewodniki obu  typów  różnią  się  między  sobą  pod 
względem  termodynamicznym  i — w związku  z tym  — 
inaczej  zachowują  się  w polu  magnetycznym.  Opisy- 
wane tutaj  dotychczas  własności  magnetyczne  doty- 
czyły nadprzewodników  I typu.  Nadprzewodniki  I 
typu  zostały  najwcześniej  zbadane,  gdyż  stosunkowo 
łatwo  jest  otrzymać  jednorodne  próbki  czystych  me- 
tali. Badania  tych  nadprzewodników  dostarczyły 
informacji,  na  podstawie  których  Bardeen,  Cooper 

1 Schrieffer  opracowali  w 1957  r.  mikroskopową  teorię 
nadprzewodnictwa. 


Nadprzewodniki  II  typa 

Teorię  nadprzewodników  II  typu  opracował  A.  Abri- 
kosow  również  w 1957  r.,  ale  potwierdzające  ją  ba- 
dania doświadczalne  udało  się  przeprowadzić  do- 
piero kilka  lat  później,  gdy  otrzymano  wystarczająco 
jednorodne  próbki  nadprzewodzących  stopów  (teoria 
dotyczyła  tylko  jednorodnych  nadprzewodników). 
Zainteresowanie  nadprzewodnikami  II  typu  wzrosło 
wyraźnie  po  1961  r.,  kiedy  odkryto,  że  niejednorodne 
próbki  tych  nadprzewodników  mogą  przenosić  prąd 
elektryczny  o dużej  gęstości  (rzędu  105  A/cm2)  nawet 
w silnych  polach  magnetycznych  (rzędu  kilku  tesli). 

Teoria  Abrikosowa  opierała  się  na  wcześniejszej 
fenomenologicznej  teorii  Ginzburga  i Landaua,  tj. 
teorii  nie  wnikającej  w przyczyny  nadprzewodnictwa, 
lecz  opisującej  zjawisko  od  strony  makroskopowej. 

Później  Gorkow  wykazał,  że  teoria  ta  wynika  rów- 
nież z teorii  mikroskopowej.  Od  pierwszych  liter 
nazwisk  jej  twórców  teorię  tę  nazywamy  obecnie  toojfia 
teorią  GLAG,  podobnie  jak  teoria  mikroskopowa 
nazywa  się  teorią  BCS.  Teoria  GLAG  podaje  ścisłe 
kryterium  podziału  nadprzewodników  na  dwa  typy: 
jest  nim  wartość  parametru  wprowadzonego  w tej 
teorii,  zwanego  parametrem  «;  jeśli  * < l/|/2,  to 
nadprzewodnik  należy  do  pierwszego  typu,  jeśli 
x>\j^2 — do  drugiego  typu.  Parametr  x jest 
w przybliżeniu  równy  stosunkowi  <$/£. 

Oprócz  nadprzewodników  doskonałych  obu 
wspomnianych  typów  istnieją  nadprzewodniki  nie-  niejecs- 

doskonałe,  czyli  niejednorodne  lub  zdeformowane,  raosrodra®  sub 
Podział  nadprzewodników  na  doskonałe  i niedosko-  ■ orrfto- 
nałe  nie  jest  zbyt  ścisły,  gdyż  w praktyce  prawie  zaw-  wan0 
sze  spotykamy  się  z pewną  niedoskonałością  nad- 
przewodnika. Za  miarę  doskonałości  próbki  nad- 
przewodnika przyjęto  uważać  stopień  odwracalności 
jego  przemiany  fazowej  w polu  magnetycznym.  Ze 
względu  na  zdolność  przenoszenia  prądów  o dużej 
gęstości  niektóre  niedoskonałe  nadprzewodniki  II 
typu  odgrywają  bardzo  ważną  rolę  w zastosowaniach 
praktycznych.  Niektórzy  nazywają  takie  nadprze- 
wodniki nadprzewodnikami  III  typu,  ale  nazwa  ta 
nie  wydaje  się  uzasadniona,  gdyż  nie  chodzi  tu  o jakiś 
nowy  typ  nadprzewodnictwa.  Bardziej  stosowną 
byłaby  nazwa  „twarde  nadprzewodniki”,  nawiązu- 
jąca do  ich  własności  mechanicznych. 


Zachowanie  się  nadprzewodników  li  typu 
w polu  magnetycznym 


Prześledźmy,  jak  zmienia  się  moment  magnetyczny 
M nadprzewodnika  II  typu  ze  zmianą  natężenia 
zewnętrznego  pola  magnetycznego  H (rys.  15).  Dla 
uproszczenia  załóżmy,  że  próbka  ma  współczynnik 
rozmagnesowania  równy  zeru  i nie  zawiera  dziur. 

W słabym  polu  magnetycznym  próbka  nadprze- 
wodnika II  typu  zachowuje  się  tak  samo,  jak  próbka 
nadprzewodnika  I typu,  tzn.  wypycha  całkowicie  ze 
swego  wnętrza  strumień  magnetyczny,  czyli  wykazuje 
pełne  zjawisko  Meissnera.  Gdy  jednak  natężenie  pola 
zewnętrznego  osiągnie  wartość  Hu  i,  czyli  tzw.  pierw- 
szą wartość  krytyczną,  pole  magnetyczne  wnika 
w próbkę  w postaci  pojedynczych  włókien  strumienia. 
Włókien  strumienia  magnetycznego  nie  należy  mylić 
z liniami  sił  pola.  Linie  sił  pola  — to  tylko  formalne 
krzywe,  wzdłuż  których  ustawiają  w polu  swój 
moment  magnetyczny  małe  próbne  dipole.  Gęstość 
linii  sił  pola  jest  umowna,  istotne  jest  tylko,  aby  była 
proporcjonalna  do  gęstości  strumienia.  Włókna  stru- 
mienia magnetycznego  są  natomiast  rzeczywistymi 
nitkokształtnymi  obszarami  nadprzewodnika,  w któ- 
rych jest  skupione  pole  magnetyczne.  Te  włókniste 
obszary  przenikają  próbkę  nadprzewodnika  na 
wskroś.  Każde  takie  włókno  zawiera  jeden  flukson, 
czyli  jeden  kwant  strumienia  magnetycznego.  Lokalna 
gęstość  strumienia  (czyli  lokalna  indukcja  magne- 


pierwsza 

wartość 

krytyczna 


wiófcrca  stsru- 
ml$ns&  pnsag- 
notycziiego 
(fNksoidy) 
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druga 

wartość 

krytyczna 


tyczna)  jest  największa  w środku  włókna  i maleje 
w miarę  wzrostu  odległości  od  środka  (rys.  16). 
Rdzeń  włókna  ma  średnicę  rzędu  2£.  Dookoła  osi 


Rys.  15.  Zależność  śre- 
dniej indukcji  magne- 
tycznej i namagneso- 
wania nadprzewodni- 
ka II  typu  od  natęże- 
nia pola  magnetyczne- 
go 


Rys.  16.  Rozkład  lokalnej  indukcji  magnetycznej  i parametru 
uporządkowania  dokoła  osi  wiru  prądowego  w nadprzewodni- 
ku II  typu 


rdzenia  cyrkulują  prądy  nadprzewodnictwa  o gęstości 
malejącej  ze  wzrostem  odległości  od  rdzenia.  Właśnie 
te  prądy  wytwarzają  pole  magnetyczne  w rdzeniu 
włókna.  Włókno  strumienia  magnetycznego,  zwane 
także  fluksoidem,  jest  więc  włóknem  wirowym  po- 
dobnym do  włókna  wirowego  w cieczy,  z tym  że 
tutaj  wokół  osi  włókna  krążą  elektrony  nadprze- 
wodnictwa a nie  cząsteczki  płynu.  Ponieważ  wektor 
lokalnej  indukcji  i?iok  we  włóknie  strumienia  mag- 
netycznego ma  kierunek  zewnętrznego  pola  magne- 
tycznego H , włókna  nadają  próbce  dodatni  moment 
magnetyczny  zmniejszający  jej  diamagnetyzm. 

W miarę  wzrostu  natężenia  zewnętrznego  pola 
magnetycznego  coraz  więcej  fluksoidów  przenika 
próbkę  nadprzewodnika  i w związku  z tym  coraz 
bardziej  zmniejsza  się  diamagnetyczny  moment 
próbki.  Podobnie  jak  w stanie  czysto  nadprzewodzą- 
cym, ten  diamagnetyczny  moment  jest  momentem 
prądów  Meissnera,  krążących  po  powierzchni  próbki 
w kierunku  odwrotnym  do  kierunku  krążenia  wirów 
prądowych  w poszczególnych  fluksoidach  (rys.  17). 

Gdy  natężenie  zewnętrznego  pola  magnetycznego 
osiąga  drugą  krytyczną  wartość  Hk2 , fluksoidy  gęsto 
wypełniają  próbkę,  rozkład  indukcji  magnetycznej 
po  przekroju  poprzecznym  próbki  staje  się  jedno- 
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rodny  i równy  fi0Hk2  — moment  magnetyczny  próbki 
zmniejsza  się  do  zera  i próbka  przechodzi  w stan 
normalny.  Stosunek  HkJHk\  dla  danego  nadprze- 
wodnika zależy  od  wartości  parametru  x (rys.  18). 
Na  powierzchni  próbki  pozostanie  jednak  jeszcze 
bardzo  cienka  nadprzewodząca  warstwa  o grubości 
rzędu  zasięgu  kolelacji  £.  Warstwa  ta  znika  dopiero 
wtedy,  gdy  natężenie  pola  magnetycznego  osiągnie 
trzecią  wartość  krytyczną  Hk 5 = \JHk2.  W warstwie 
powierzchniowej  może  krążyć  słaby  prąd  nadprze- 
wodnictwa, moment  magnetyczny  tego  prądu  jest 
jednak  zbyt  mały  w porównaniu  z poprzednim  mo- 
mentem magnetycznym  ekranujących  prądów  Meis- 
snera, aby  go  można  było  zmierzyć  tą  samą  metodą. 


Rys.  17.  Prądy  powierz- 
chniowe i skwantowane- 
wiry  prądowe  w próbce 
nadprzewodnika  II  typu 


prądy 

powierzchniowe 
Meissnera 


fluksoidy 


Nadprzewodząca  warstwa  powierzchniowa  ekranuje 
jednak  wnętrze  próbki  od  słabego  zmiennego  pola 
elektromagnetycznego  nałożonego  na  pole  stałe 
H < HkZi  dlatego  można  ją  wykryć  metodą  pomiaru 
indukcji  wzajemnej  dwu  koncentrycznych  cewek, 
wewnątrz  których  znajduje  się  badana  próbka.  War- 
stwa powierzchniowa  zmniejsza  także  opór  elek- 
tryczny próbki,  jeśli  stały  prąd  pomiarowy  jest  wy- 
starczająco słaby,  aby  nie  zniszczyć  nadprzewodni- 
ctwa warstwy.  Nadprzewodnictwo  warstwy  po- 
wierzchniowej utrzymuje  się  do  Hk3  tylko  na  tych 
obszarach  powierzchni  próbki,  które  są  równoległe 
do  linii  sił  pola  zewnętrznego.  W wypadku  istnienia 
składowej  pola  prostopadłej  do  powierzchni  próbki 
nadprzewodnictwo  powierzchniowe  znika,  gdy  łh-2  < 
< H < HkZ • Na  obszarach  powierzchni  próbki  pro- 
stopadłych do  H nadprzewodnictwo  powierzchniowe 
powyżej  Hk2  istnieć  nie  może.  Nie  może  ono  istnieć 
także  wtedy,  gdy  próbka  jest  pokryta  warstwą  nienad- 
przewodzącego  metalu  (np.  warstwą  miedzi). 
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Stan  mieszany 

W polu  magnetycznym  o natężeniu  H większym  od 
pierwszej  wartości  krytycznej  a mniejszym  od  drugiej 
(Hki  < H < Hkd,  próbka  nadprzewodnika  II  typu 
nie 'jest  ani  w stanie  czysto  nadprzewodzącym,  ani  w 
stanie  normalnym.  Nie  jest  też  w stanie  pośrednim, 
gdyż  w objętości  próbki  nie  da  się  wyodrębnić  makro- 
faza  skopowych  obszarów  poszczególnych  faz.  Całą  obję- 
mieszana  tość  próbki  zajmuje  jedna  faza  termodynamiczna, 
która  niezbyt  trafnie  nazywa  się  fazą  mieszaną,  mimo 
iż  nie  jest  ona  mieszaniną  różnych  faz.  Fazę  tę  nazywa 
się  także  fazą  Szubnikowa.  Przemiany  fazowe  zwią- 
zane z przejściem  ze  stanu  nadprzewodzącego  w stan 


mieszany  i ze  stanu  mieszanego  w stan  normalny  przy 
zmianie  natężenia  pola  zewnętrznego  są  przemianami 
II  rodzaju.  Przypominamy,  że  przejście  nadprzewod- 
nika I typu  ze  stanu  nadprzewodzącego  w stan  nor- 
malny w polu  magnetycznym  jest  przemianą  fazową 
I rodzaju.  Wykres  fazowy  dla  nadprzewodnika  II 
typu  jest  przedstawiony  na  rys.  19. 
uporząd-  W monokrystalicznej,  pozbawionej  defektów  prób- 
kowanie ce  nadprzewodnika  II  typu  faza  mieszana  charakte- 
włókien  ryzuje  się  przestrzennie  uporządkowanym  rozkładem 
strumienia  włókien  wirowych  strumienia  magnetycznego  tzw. 
magnetycz-  fluksoidów.  W płaszczyźnie  poprzecznej  do  linii  sił  po- 
nego  la  magnetycznego  siatka  fluksoidów  może  mieć  układ 
trójkątny  lub  kwadratowy.  Ilustracja  95  z tabl.  25 
przedstawia  obraz  trójkątnej  siatki  fluksoidów  otrzy- 
many pod  mikroskopem  elektronowym  przez  Es- 
smanna  i Trauble’a  po  naniesieniu  proszku  ferro- 
magnetycznego na  powierzchnię  próbki  wykonanej 
ze  stopu  ołów-antymon.  Ziarenka  proszku  skupiły 
się  w obszarach  najsilniejszego  pola,  czyli  w miejscach, 
gdzie  rdzenie  wirów  wychodzą  na  powierzchnię 
próbki. 

Podobnie  jak  lokalna  indukcja  magnetyczna,  upo- 
rządkowany przestrzenny  rozkład  w stanie  miesza- 
nym wykazuje  również  parametr  uporządkowania 
nadprzewodzącego  (np.  względna  gęstość  elektronów 
nadprzewodnictwa). 

Zależność  indukcji  średniej  Bśr  (tj.  uśrednionej  po 
całej  objętości  próbki)  od  natężenia  zewnętrznego 
pola  magnetycznego  H jest  przedstawiona  na  rys.  1 5. 
W stanie  Meissnera  pole  nie  wnika  do  próbki  i Bśr  — 
= 0.  Przy  H — HiClBtr  gwałtownie  wzrasta,  co  ozna- 
cza, że  w próbkę  wnika  dużo  fluksoidów.  Dalej  Bśr 
wzrasta  stopniowo  ze  wzrostem  Hy  zależność  Bśr  ( H ) 
nie  jest  jednak  liniowa.  Indukcja  Bśr  jest  proporcjo- 
nalna do  H dopiero  w staaie  normalnym,  tj.  powyżej 
Hkn.  Taka  postać  funkcji  Bśt(H)  dla  nadprzewodni- 
ków II  typu  przypomina  zależność  momentu  pędu 
nadpłynnego  helu  od  prędkości  kątowej  obracającego 
się  naczynia,  w którym  zawarty  jest  ten  hel.  W obu 
tych  wypadkach  w określonych  warunkach  pojawiają 
się  podobne  struktury  wirowe. 

27  -r-  Encyklopedia  fizyki  współczesnej 


Zjawiska  nieodwracalne 

Histereza  magnetyczna 

Proces  namagnesowania  nadprzewodnika  II  typu 
w polu  magnetycznym  jest  procesem  odwracalnym 
tylko  w wypadku  doskonałych  próbek.  Krzywa  na- 
magnesowania M(H)  przebiega  wtedy  w obu  kierun- 
kach jednakowo  i nie  tworzy  pętli  histerezy.  W rzeczy- 
wistości próbki  nadprzewodników  wykazują  pewne 
odstępstwo  od  doskonałości  i namagnesowanie  próbki 
nie  jest  jednoznaczną  fukcją  natężenia  pola  magne- 
tycznego, gdyż  zależy  od  kierunku  zmian  pola 

(rys.  20). 

Defekty  struktury  w próbce  nadprzewodnika  utrud- 
niają ruch  fluksoidów  — zarówno  ich  wnikanie  wpływ 
w próbkę  przy  wzroście  H , jak  i opuszczanie  próbki  defektów 
przy  zmniejszaniu  się  H.  Defekty  mogą  w próbce  stru^t^ry 
tworzyć  lokalne  obszary  o mniejszej  wartości  Hkz\ 
obszary  takie  przechodzą  w stan  normalny  przy  mniej- 
szych wartościach  natężenia  pola  i stanowią  pułapkę 
(studnię  potencjału)  dla  fluksoidów.  Fluksoidy  więzną 


Rys.  20.  Histereza  magnetyczna  niejednorodnego  nadprzewod- 
nika II  typu 

w tych  miejscach,  podobnie  jak  w otworach  w próbce, 
i mogą  je  opuścić  dopiero  pod  naporem  innych  fluk- 
soidów (pomiędzy  fluksoidami  o tym  samym  kierunku 
wektora  wirowości  z małej  odległości  działają  siły 
wzajemnego  odpychania),  albo  pod  wpływem  siły 
oddziaływania  prądu  elektrycznego  na  fluksoidy, 
jeśli  przez  próbkę  taki  prąd  płynie.  Niekiedy  miejsca 
uwięźn*ięcia  opuszcza  naraz  duża  liczba  fluksoidów, 
co  przejawia  się  gwałtowną  zmianą  strumienia 
magnetycznego  w próbce,  czyli  tzw.  skokiem  stru- 
mienia. 

Nieodwracalność  procesu  namagnesowania  nad- 
przewodnika jest  przyczyną  rozpraszania  energii  pola  rozpraszam© 
magnetycznego.  Miarą  strat  energetycznych  podczas  energii 
jednego  cyklu  namagnesowania  jest  wielkość  pola 
powierzchni  ograniczonej  pętlą  histerezy.  W okreso- 
wo zmieniającym  się  polu  magnetycznym  nadprze- 
wodnik II  typu  w stanie  mieszanym  rozprasza  energię 
tego  pola  w postaci  ciepła,  i to  zarówno  wtedy,  gdy 
zmienia  się  zewnętrzne  pole  magnetyczne,  jak  i wtedy, 
gdy  zmienia  się  pole  magnetyczne  pochodzące  od 
prądu  zmiennego  płynącego  przez  nadprzewodnik. 


Krytyczna  gęstość  prądu 

Dla  zastosowań  technicznych  jest  szczególnie  ważne, 
aby  przez  przewód  z nadprzewodnika  można  było 
przepuszczać  bez  strat  prąd  elektryczny  o możliwie 
największym  natężeniu.  W stanie  Meissnera  prąd 
płynie  tylko  po  powierzchni  nadprzewodnika.  Prąd 
stały  o natężeniu  / płynący  przez  drut  o promieniu  r 
wytwarza  na  jego  powierzchni  pole  magnetyczne 
o natężeniu  H = Ijlnr.  Jeśli  natężenie  tego  pola 
osiągnie  wartość  Hku  drut  z nadprzewodnika  II  typu 
przejdzie  w stan  mieszany  i prąd  rozłoży  się  po  całym 
przekroju  przewodu.  Fluksoidy  w próbce  będą  mieć 
postać  zamkniętych  współśrodkowych  pierścieni  ko- 
łowych, zgodnie  z kształtem  linii  sił  pola  magnetycz- 
nego wytworzonego  przez  prąd.  Ponieważ  energia 
włókna  jest  proporcjonalna  do  jego  długości,  fluksoi- 
dy zmniejszają  swą  długość  kurcząc  się  w kierunku 
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kurczenie  się  osi  i znikają  w pobliżu  osi.  Na  ruch  fluksoidów  wpły- 
i znikanie  wa  także  oddziaływanie  między  fluksoidami  i prądem 
fluksoidów  płynącym  przez  próbkę. 

Ruch  włókien  strumienia  magnetycznego  i ich 
znikanie  na  osi  drutu  powoduje  wydzielanie  się  ciepła, 
dlatego  z przepływam  prądu  przez  nadprzewodnik 
w stanie  mieszanym  wiąże  się  rozpraszanie  energii. 
Aby  uniknąć  strat  energetycznych,  należy  w jakiś 
sposób  zatrzymać  poruszające  się  fluksoidy,  np.  przez 
wytwarzanie  w drucie  defektów,  na  których  fluksoidy 
będą  się  zaczepiać.  W ten  sposób  można  przez  drut 
z nadprzewodnika  przepuścić  bez  strat  prąd  stały 
o natężeniu  znacznie  większym  niż  hi  = hzrHki- 
Maksymalny  prąd  stały,  który  może  przepływać  bez 
strat  przez  daną  próbkę  drutu,  nazywamy  prądem 
nasycenia  albo  prądem  krytycznym.  Ponieważ  na- 
tężenie tego  prądu  zależy  od  przekroju  poprzecznego 
drutu,  lepiej  posługiwać  się  pojęciem  krytycznej 
gęstości  prądu  y*.  Krytyczna  gęstość  prądu  stałego 
krytyczna  dla  nadprzewodnika  nie  jest  stałą  materiałową  (jak 
gęstość  np.  Hki),  gdyż  zależy  od  defektów  w strukturze 
prądu  próbki,  czyli  od  sposobu  jej  obróbki. 


Płynięcie  strumienia 

Rozpatrzmy  teraz  bliżej  oddziaływanie  wzajemne 
między  fluksoidami  i stałym  prądem  elektrycznym 
przepływającym  przez  próbkę.  Załóżmy,  że  drut  z 
twardego  nadprzewodnika,  przez  który  płynie  prąd 
stały,  znajduje  się  w zewnętrznym  stałym  polu  mag- 
netycznym skierowanym-  prostopadle  do  osi  drutu 
(w  takich  warunkach  pracuje  większość  uzwojeń 
w urządzeniach  elektrycznych  prądu  stałego)  i że 
natężenie  pola  jest  wystarczające  do  wytworzenia 
w drucie  stanu  mieszanego. 

Prąd  elektryczny  płynący  wzdłuż  drutu  będzie  od- 
działywał na  fluksoidy  siłą  skierowaną  prostopadle 
zarówno  do  kierunku  prądu,  jak  i do  osi  fluksoidu 


dek  napięcia  Uf,  co  jest  równoważne  pojawieniu  się  opór 
oporu  elektrycznego  R / = /«  Uf.  Ponieważ  opór  ten  płynięcia 
jest  wywołany  ruchem  płynięcia  fluksoidów,  nazywa- 


Rys.  22.  Zależ- 
ność napięcia 
indukowanego 
ruchem  fluksoi- 
dów od  natęże- 
nia prądu  i zew- 
nętrznego pola 
magnetycznego 


natężenie  prądu  / — ► 
Hk<H,<H2<Hz<Hk2 


Rys.  21.  Szkic  ilustrujący  ruch  fluksoidów  w nadprzewodniku 
z prądem  w obecności  zewnętrznego  pola  magnetycznego 

(rys.  21).  Pochodzenie  tej  siły,  zwanej  siłą  Lorentza, 
możemy  łatwo  zrozumieć,  jeśli  przypomnimy  sobie, 
że  pole  magnetyczne  oddziałuje  na  poruszające  się 
ładunki  elektryczne  (czyli  na  prąd)  siłą  prostopadłą 
do  linii  sił  pola  i do  kierunku  ruchu  ładunków.  Siła 
ta  jest  siłą  wzajemnego  oddziaływania  prądu  i pola 
poprzeczny  magnetycznego.  Fluksoidy  pod  wpływem  działającej 
ruch  na  nie  siły  Lorentza  będą  się  poruszać  w poprzek 
fluksoidów  drutu.  Nie  jest  to  jednak  ruch  przyśpieszony,  gdyż 
towarzyszy  mu  tarcie,  czyli  lepkość,  pochodząca  od 
prądów  wirowych,  wzbudzonych  w próbce  tymże 
właśnie  ruchem  strumienia  magnetycznego.  Równo- 
waga hamującej  siły  lepkości  i siły  Lorentza  określa 
prędkość  ruchu  fluksoidów. 

Ponieważ  ruch  fluksoidów  związany  jest  z pokony- 
waniem siły  tarcia,  czyli  z wykonywaniem  pracy  przez . 
prąd  elektryczny,  to  wzdłuż  drogi  prądu  wystąpi  spa- 


Rys.  23.  Zależność  krytycznej  gęstości  prądu  w nadprzewodniku 
II  typu  od  natężenia  pola  magnetycznego  prostopadłego  do  kie- 
runku prądu 

my  go  oporem  płynięcia  strumienia  magnetycznego, 
albo  krócej  — oporem  płynięcia. 

Rys.  22  przedstawia  zależność  spadku  napięcia  U 
w nadprzewodniku  II  typu  od  natężenia  przepływa- 
jącego przezeń  prądu.  Dopóki  gęstość  prądu  nie 
osiągnie  wartości  krytycznej  /*,  spadek  napięcia  jest 
równy  zeru.  Wartość  dla  danej  próbki  zależy  od  charaktery* 
natężenia  zewnętrznego  pola  magnetycznego  H,  tyka  nad- 
a także  od  jego  kierunku  względem  drutu.  Zależność  przewodnika 
jk(H)  dla  poprzecznego  pola  magnetycznego  jest  naj-  IB  typu 
ważniejszą  charakterystyką  twardego  nadprzewodnika 
z punktu  widzenia  jego  przydatności  do  celów  prak- 
tycznych. Na  rys.  23  przedstawione  są  dwie  takie  cha- 
rakterystyki dla  tego  samego  materiału:  jedna  dla 
próbki  jednorodnej  i odprężonej,  druga  dla  próbki 
z defektami  struktury  krystalicznej.  Charakterystyki 
takie  podaje  się  zazwyczaj  dla  T = 4,2  K. 

Zjawiska  nieodwracalne  w nadprzewodnikach  od- 
grywają bardzo  ważną  rolę  w zastosowaniach  nad- 
przewodników dla  celów  praktycznych,  szczególnie 
w elektrotechnice.  Niestety,  jak  dotąd,  teoria  nad- 
przewodnictwa nie  obejmuje  zjawisk  nieodwracalnych 
(np.  oddziaływań  fluksoidów  z defektami  struktury 
krystalicznej);  w tym  zakresie  posługujemy  się  jedy- 
nie uproszczonymi  modelowymi  przedstawieniami 
i fenomenologicznym  ujęciem  zagadnienia. 

- 

Zagadnienie  wysokotemperatu- 
rowego nadprzewodnictwa 

Sprawą  doniosłej  wagi,  zarówno  ze  względów  poz- 
nawczych, jak  i praktycznych,  jest  rozstrzygnięcie 
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temperatura 

krytyczna 


wodór 

metaliczny 


zagadnienia,  czy  nadprzewodnictwo  może  występo- 
wać również  w temperaturach  wysokich.  Zagadnienie 
to  można  rozpatrywać  opierając  się  na  teorii  BCS. 
Wyzyskując  zależność  (1)  otrzymujemy,  że  7*  « 

~ (fl)e-1/*.  Symbol  0 oznacza  tutaj  tzw.  temperaturę 
Debye’a,  czyli  temperaturę  charakterystyczną  dla 
wzbudzeń  fononowych.  Temperatura  ta  zależy  od 
budowy  krystalicznej  danej  substancji;  jej  sens  jest 
taki,  że  kd  jest  maksymalną  energią  fononu  w danej 
sieci  krystalicznej.  Parametr  g w wykładniku  potęgi 
jest  iloczynem  stałej  oddziaływania  elektron-fonon- 
-elektron  oraz  gęstości  stanów  na  poziomie  Fermiego 
w stanie  normalnym.  Tk  zależy  więc  od  dwu  paramet- 
rów, z których  jeden  charakteryzuje  samą  sieć  krysta- 
liczną, a drugi  — wielkość  oddziaływania  elektronów 
z tą  siecią.  Oddziaływanie  to  nie  może  być  zbyt  silne, 
gdyż  wtedy  sama  sieć  stałaby  się  niestabilna  i musia- 
łaby przejść  w inną  modyfikację  krystalograficzną 
ze  słabszym  oddziaływaniem.  Parametr  g nie  może 
więc  przybierać  zbyt  dużych  wartości.  Dla  więk- 
szości znanych  nadprzewodników  g < 1j1.  Najwyż- 
szą wartość  g9  bo  ok.  l/z>  ma  ołów,  ale  jego  tempera- 
tura Debye’a  jest  niska  (0  = 95  K)  i dlatego  Tk  dla 
ołowiu  jest  równa  7,2  K.  Czynnik  eksponencjalny 
e~lls  zmniejsza  więc  wartość  0 co  najmniej  o rząd. 
Trzeba  tu  zwrócić  uwagę,  że  dla  tak  dużych  g , jak 
w ołowiu,  wzór  (1)  nie  stosuje  się  ściśle,  gdyż  został 
wyprowadzony  przy  założeniu,  że  g < 1. 

Temperatury  Debye’a  dla  większości  ciał  stałych 
mieszezą  się  w przedziale  10M03  K.  Spośród  nad- 
przewodników najwyższą  temperaturę  Debye’a  (rów- 
ną 990  K)  ma  Be22Rn.  Jednak  gęstość  stanów  elektro- 
nowych w tym  związku  jest  mała  (a  więc  mały  pa- 
rametr g)  i stąd  Tk  — 9,6  K. 

Istnieją  uzasadnione  przypuszczenia  że  zestalony 
wodór  pod  wysokim  ciśnieniem  (rzędu  2,6  Mbar) 
może  przejść  w fazę  metaliczną,  której  temperatura 
Debye’a  wynosiłaby  ok.  3,5*  103  K.  Gdyby  ta  meta- 
liczna faza  wodoru  okazała  się  nadprzewodzącą,  to 
nawet  przy  słabym  oddziaływaniu  elektronowo-fono- 
nowym  temperatura  krytyczna  nie  byłaby  niższa  od 
30  K,  a może  nawet  sięgałaby  200  K w przypadku 
silnego  oddziaływania.  Można  się  spodziewać,  że  na- 
wet po  usunięciu  ciśnienia  metaliczna  faza  zestalone- 
go wodoru  pozostanie  w metastabilnym  stanie.  Takie 
metastabilne  fazy  są  znane;  np.  diament  w niskich 
temperaturach  ma  wyższą  energię  swobodną  niż  grafit. 

Przy  fononowym  mechanizmie  pojawienia  się  nad- 
przewodnictwa niskie  temperatury  przejścia  w stan 
nadprzewodzący  wynikają  z własności  sieci  krystalicz- 
nej, która  pośredniczy  w oddziaływaniu  elektronów 
z sobą.  Dla  uzyskania  wyższych  temperatur  Tk  po- 
trzebne byłoby  oddziaływanie  inne,  znacznie  silniej- 
sze niż  elektronowo-fononowe.  Przypuszcza  się,  że 
nadprzewodnictwo  może  się  pojawić  również  w wy- 
niku przyciągania  się  elektronów  na  skutek  wymiany 


przykład 

Little'a 


wirtualnych  ekscytonów.  Ekscytony  są  elementar-  ekscytony 
nymi  wzbudzeniami  układu  elektronów.  Wzbudzenia 
te  przypuszczalnie  rozchodzą  się  ze  słabym  tłumie- 
niem w ośrodkach  niemetalicznych,  np.  w półprze- 
wodnikach. Zatem,  w celu  utworzenia  par  Coopera 
związanych  siłami  wymiany  ekscytonu  trzeba,  aby 
metal  znajdował  się  w ciasnym  kontakcie  z półprze- 
wodnikiem lub  dielektrykiem,  co  można  osiągnąć 
np.  w układach  warstwowych.  Energia  ekscytonów 
może  być  znacznie  większa  niż  energia  fononów, 
a odpowiadająca  tej  energii  temperatura  charaktery- 
styczna jest  równa  6e  — ftcojk  ^ 104  K,  co  — po 
uwzględnieniu  czynnika  eksponencjalnego  — odpo- 
wiadałoby Tk  = 103  K.  Ekscytonowe  nadprzewod- 
nictwo mogłoby  więc  istnieć  w temperaturze  pokojo- 
wej, a może  nawet  i wyższej. 

Ciekawy  przykład  mechanizmu  prowadzącego  do 
wysokotemperaturowego  nadprzewodnictwa  w cząs- 
teczkach organicznych  podał  W.  A.  Little.  Cząsteczka 
ma  kształt  przewodzącego  łańcucha  z bocznymi  po- 
laryzującymi się  gałęziami.  Elektrony  przewodnictwa 
w łańcuchu  mogłyby  przyciągać  się  wzajemnie  za 
pośrednictwem  polaryzujących  się  odgałęzień  łań- 
cucha. Jest  to  oddziaływanie  kulombowskie,  a więc 
energia  tego  oddziaływania  może  być  duża.  Według 
ocen  Littłe’a,  krytyczna  temperatura  w tym  modelu 
powinna  wynosić  2400  K.  Głównym  zarzutem  wy- 
suniętym przeciw  takiemu  poglądowi  było  stwierdze- 
nie, że  w jednowymiarowym  łańcuchu  nadprzewodni- 
ctwo nie  może  istnieć,  gdyż  fluktuacje  gęstości  elek- 
tronów doprowadziłyby  do  jego  zaniku. 

Ponieważ  przy  ocenie  Tk  korzystaliśmy  z zależności 
wynikającej  z teorii  BCS,  warto  by  się  jeszcze  zasta- 
nowić nad  zakresem  stosowalności  tej  teorii.  Teoria 
BCS  w ogólnym  sformułowaniu  nie  może  uwzględ- 
niać szczegółów  budowy  konkretnej  substancji,  dla- 
tego w poszczególnych  wypadkach  można  otrzymać 
wyniki  odbiegające  nieco  od  przewidywań  tej  teorii. 

Wynika  to  stąd,  że  samo  oddziaływanie  elektronowo- 
fononowe  zależy  od  wielu  czynników,  między  innymi 
od  widma  fononowego  danej  substancj  i oraz  od  ekra- 
nowania elektronów  dodatnimi  jonami.  Oddziały- 
wanie to  nie  zawsze  jest  słabe,  jak  założono  w teorii. 

Istotne  jest  jednak,  że  teoria  BCS  jest  na  tyle  ogólna, 
że  w jej  ramach  można  dokonywać  wielu  uzupełnień 
i poprawek  nie  naruszających  podstaw  samej  teorii. 

Uwzględnienie  zależności  przyciągającego  oddzia- 
ływania między  elektronami  od  szczegółów  budowy 
sieci  itp.  zmienia  postać  wzoru  (1),  wiążącego  Tk 
z temperaturą  charakterystyczną  dla  pośredniczących 
w oddziaływaniu  między  elektronami  wzbudzeń,  nie 
na  tyle  jednak,  aby  można  było  oczekiwać  dla  Tb  war- 
tości znacznie  większych,  niż  wynikające  z tego  wzoru. 

A.  C.  Rose-Innes,  E.  H.  Rhoderick  Nadprzewodnictwo,  War- 
szawa 1973;  L.  Śniadower  Półprzewodniki  nadprzewodzące , 

Post.  Fiz.  23,  157  (1972). 
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Zjawiska  tunelowe  w nadprzewodnikach 


Eugeniusz  Trojnar 

Tunelowanie  elektronów 
normalnych 


Rys.  ----- 
obwodu  do  wyzna- 
czania charaktery- 
styk tunelowych 


Wyobraźmy  sobie  obwód  elektryczny  składający  się 
A ze  źródła  prądu  stałego,  kondensatora  płaskiego, 
v*/  oporników  i mierników,  jak  na  rys.  1 . W normalnych 
warunkach  trudno  oczekiwać,  że  przez  kondensator 
popłynie  prąd  stały.  Jeśli  jednak  odległość  między 
okładkami  kondensatora  zmniejszy  się  do  ok.  5 nm 
to  amperomierz  zarejestruje  przepływ  prądu  przez 
Schemat  kondensator  — mimo  istnienia  warstwy  izolatora 
między  okładkami.  Przepływ  tego  prądu  jest  spowo- 
dowany kwantowym  zjawiskiem  tunelowania  cząstek 


przez  barierę  energetyczną.  Wytłumaczymy  to  zja- 
wisko posługując  się  modelem  elektronowych  po- 
ziomów energetycznych  w metalu. 

Kawałek  metalu  można  rozpatrywać  jako  jamę 
potencjału  dla  elektronów  przewodnictwa.  Elektron, 
aby  wyjść  z metalu,  musiałby  pokonać  siłę  przycią- 
gania go  przez  sieć  jonową,  czyli  wykonać  pracę  wyjś- 
cia. Według  mechaniki  klasycznej  musiałby  mieć  na 
to  wystarczającą  energię. 

Na  rys.  2 przedstawiono  schematy  poziomów  ener- 
getycznych w dwu  zbliżonych  do  siebie  kawałkach 
metalu  (np.  w okładzinach  kondensatora).  Kreski 
poziome  oznaczają  poziomy  energetyczne  zajęte 
przez  elektrony  w temperaturze  7=0K.  Najwyższy 
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poziom  z tych  poziomów  nazywa  się  poziomem  Fermiego. 
Fermiego  Wysokość  kreski  pionowej  ponad  poziomem  Fer- 
miego przedstawia  wartość  pracy  wyjścia  (IV).  Po- 


stany 


b>  u Ef'~£f* 


Rys.  2.  Elektronowe  poziomy  energetyczne  w układzie  złożonym 
z dwu  metali  rozdzielonych  warstwą  izolatora  ( W — praca  wyj- 
ścia): a)  U = 0;  poziomy  Fermiego  Ef  leżą  naprzeciw  siebie; 
b)  przyłożone  napięcie  powoduje  przesunięcie  poziomów  Fermie- 
go względem  siebie  o eU  ( e — ładunek  elek-ironu) 

bariera  między  obu  kawałkami  metalu  istnieje  więc  bariera 
potencjału  energetyczna  nazywana  także  barierą  potencjału.  Aby 
w klasyczny  sposób  pokonać  tę  barierę,  czyli  przejść 
przez  nią,  elektron  musiałby  mieć  energię  co  najmniej 
równą  wysokości  tej  bariery  (czyli  równą  pracy  wyjś- 
cia). 

W temperaturze  T > 0 K niektóre  elektrony  wzbu- 
dzają się  na  wyższe  poziomy,  leżące  ponad  poziomem 
Fermiego,  i wtedy  prawdopodobieństwo  przejścia 
przez  barierę  wzrasta.  W wysokiej  temperaturze  może 
nawet  występować  emisja  elektronów  z metalu  zwana 
termocmisją.  Wzbudzone  elektrony  zwaln;ają  stany 
leżące  poniżej  poziomu  Fermiego  (rys.  3). 

Fizyka  kwantowa  dopuszcza  możliwość  przejścia 
elektronu  przez  barierę  potencjału  także  w tempera- 
turze zbliżonej  do  zera  bezwzględnego,  chociaż  wtedy 


fala  padająca 


stany  zwolnione 
(dziury) 


Rys.  3.  Przenikanie  funkcji  falowej  przez  barierę  potencjału; 
kwadrat  amplitudy  funkcji  falowej  oznacza  prawdopodobień- 
stwo znalezienia  cząstki  w danym  miejscu 
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żaden  z elektronów  nie  zajmuje  wystarczająco  wy- 
sokiego poziomu  energetycznego.  W fizyce  kwanto- 
wej każdej  cząstce  przyporządkowuje  się  określoną 
falę  (stan,  w jakim  znajduje  się  dana  cząstka  jest 
opisany  równaniem  falowym),  przy  czym  kwadrat 
amplitudy  tej  fali  w pewnym  punkcie  przestrzeni 
oznacza  prawdopodobieństwo  znalezienia  tam  cząstki. 

Fala  częściowo  odbija  się  od  bariery,  a częściowo 
przenika  przez  nią,  dlatego  istnieje  różne  od  zera 
prawdopodobieństwo  znalezienia  cząstki  również 
po  drugiej  stronie  bariery  (rys.  3).  Cząstka  przenika  zjawiska 
przez  barierę,  jakby  przechodziła  przez  tunel  w barie-  tunelowe 
rz*e  — stąd  nazwa  takich  zjawisk. 

W praktyce  bardzo  trudno  jest  umieścić  dwa  ka- 
wałki metalu  w małej  (ok.  5 nm)  odległości,  i zarazem 
nie  dopuścić  do  ich  zetknięcia,  dlatego  oba  kawałki 
rozdziela  się  warstwą  izolatora.  Układ  warstwowy 
do  badania  zjawisk  tunelowych  w nadprzewodnikach 
można  wykonać  w następujący  sposób:  na  szklane 
podłoże  naparowuje  się  w próżni  warstwę  nadprze- 
wodzącego metalu  (np.  Pb),  następnie  warstwę  tę 
poddaje  się  działaniu  powietrza,  aby  ją  utlenić  na 
powierzchni  (metal  trudno  utleniający  się  można  po- 
kryć cienką  warstewką  jakiegoś  innego  izolatora), 
a później  naparowuje  się  na  nią  ten  sam  albo  inny 
metal  nadprzewodzący  (np.  Sn). 

Zjawiska  tunelowe  w nadprzewodnikach  można 
podzielić  na  dwa  typy:  tunelowanie jednocząstkowych 
wzbudzeń  (elektronów  normalnych)  i tunelowanie 
elektronowych  par  Coopera  ( -*•  nadprzewodnictwo). 
Tunelowane  elektronowych  par  przewidział  teore- 
tycznie w 1962  r.  B.  D.  Josephson  i dlatego  zjawiska 
związane  z tym  tunelowaniem  noszą  nazwę  zjawisk 
Josephsona.  Za  prace  dotyczące  zjawisk  tunelowych 
w nadprzewodnikach  (i  półprzewodnikach)  B.  Jo- 
sephson, I.  Giaever  i L.  Esaki  otrzymali  w 1973  r. 
nagrodę  Nobla. 

Omówimy  najpierw  tunelowanie  elektronów  nor-  wykresy 
malnych.  Dla  wyjaśnienia  zjawisk  posłużmy  się  ry-  gęstości 
sunkami  podobnymi  do  rys.  2,  z tym  że  teraz  nie  stanów 
będziemy  oznaczać  wysokości  bariery,  natomiast 
obwiedziemy  krzywymi  zakończenia  kresek  obrazu- 
jących zajęte  poziomy  energetyczne.  Długość  tych 


Rys.  4.  Wykresy  gęstości  stanów  dwu  nadprzewodników  rozdzie- 
lonych warstwą  izolatora 


poziomych  kresek  odpowiada  liczbte  stanów  (pozio- 
mów energetycznych)  przypadających  na  jednostko- 
wy przedział  energetyczny,  w którym  leży  dana  kreska. 
W ten  sposób  otrzymamy  wykresy  gęstości  stanów 


elektronowych  N(E)  dla  obu  nadprzewodników  roz- 
dzielonych barierą  (rys.  4). 

przerwa  Po  obu  stronach  poziomu  Fermiego  w nadprze- 
energetyczna  wodnikach  istnieje  pasmo  wzbronionych  wartości 
energii  dla  elektronów,  czyli  tzw.  przerwa  w widmie 
wzbudzeń  elektronowych.  Szerokość  połowy  tego 
pasma  wzbronionego  oznaczamy  grecką  literą  delta 
{A).  Gęstość  stanów  elektronowych  w nadprzewodni- 
> .ku  wzrasta  do  nieskończoności  w miarę  zbliżania  się 

do  górnej  lub  dolnej  krawędzi  przerwy  energetycznej. 

Jeśli  oba  nadprzewodniki  rozdzielone  warstwą 
izolatora  mają  ten  sam  potencjał  elektryczny,  to  ich 


Rys.  5.  Środkowa  część  wykresu  gęstości  stanów  (obwiedziona 
, kółkiem  na  rys.  4)  przy  różnych  warunkach  zewnętrznych. 
Strzałki  niebieskie  wskazują  kierunek  tunelowania  elektronów 


przesunięcie 

poziomów 

Fermiego 


poziomy  Fermiego  leżą  dokładnie  naprzeciw  siebie 
(rys.  5a).  Przyłożenie  napięcia  U do  bariery,  czyli 
połączenie  każdego  z nadprzewodników  z odpowied- 
nim biegunem  źródła  napięcia  stałego,  spowoduje 
przesunięcie  się  poziomów  Fermiego  względem  siebie 
o przedział,  energetyczny  eU  {e  jest  ładunkiem  elek- 
tronu), przy  czym  wyższy  poziom  Fermiego  ma  metal 
połączo.ny  z biegunem  ujemnym  (rys.  5b).  W tempe- 
raturze T > 0 (rys.  5c)  niektóre  stany  powyżej  przer- 
wy energetycznej  są  obsadzone  przez  wzbudzone 
cieplnie  elektrony,  natomiast  część  stanów  poniżej 
przerwy  pozostaje  wblna. 

Prąd  przez  barierę  może  płynąć  tylko  wtedy,  gdy 
naprzeciw  obsadzonych  stanów  po  jednej  stronie 
bariery  są  odpowiednie  wolne  stany  po  drugiej  stro- 
nie. Dopóki  przesunięcie  poziomów  Fermiego  jest 
mniejsze  od  różnicy  połówek  przerw  energetycznych 
A1— A2  (odpowiada  to  napięciu  na  barierze  U > (Ax— 

— A2)‘/e ),  prąd  płynący  przez  barierę  jest  bardzo  słaby, 
gdyż  udział  w nim  biorą  tylko  nieliczne  wzbudzone 
cieplnie  elektrony,  a gęstość  wolnych  stanów  leżących 
naprzeciw  stanów  obsadzonych  jest  niewielka.  Jed- 
nakże gdy  napfęcie  wzrośnie  do  U = {A-^—A^je, 
górne  (albo  dolne  — w zależności  od  polaryzacji 
złącza)  krawędzie  przerw  energetycznych  obu  nad- 
przewodników znajdą  się  naprzeciw  siebie  i prąd 
tunelujących  elektronów  zwiększy  się,  ponieważ  w po- 
bliżu krawędzi  przerwy  energetycznej  gęstość  stanów 
znacznie  wzrasta  (rys..5c).  Dalsze  zwiększenie  napię- 
cia spowoduje  prz-esurfięcie.  się  względem  siebie  gór- 
nych ('albo  dolnych)  krawędzi  przerw  energetycznych 
i w wynilcu  tego  — zmniejszenie  prądu,  gdyż  znów 
zmaleje  gęstość  wolnych  stanów  znajdujących  się 
naprzeciw  stanpw  źajętyćh  .{rys.  4;  (J  >iĄ1—A2)le): 
GjJy  -napięcie  na  barierze  wzrośhie  do  y/artości~ 
U = (di+Atile,  naprzeciw  siebie  znajdą  się  znów. 
krawędzie  przerw  energetycznych,  tym  razem  górna 
i dolna,  i-  prąd  tunelowy  szybko  wzrośnie  (pys.  5d).- 


Przy  dalszym  zwiększaniu  się  napięcia  coraz  więcej 
wolnych  stanów  znajdować  się  będzie  naprzeciw  sta- 
nów zajętych  i prąd  będzie  wzrastał  ze  wzrostem  na.- 
pięcia. 

Charakterystyka  napięciowo-prądowa  I = /(CO  ujemny  opór 
układu  dwu  nadprzewodników  rozdzielonych  cienką  elektryczny 
warstwą  izolatora  wykazuje  więc  obszar  ujemnego 
oporu  różniczkowego  dljdU  w przedziale  napięć  od 


Rys.  6.  Charakterystyka 
prądowo-napięciowa  złą- 
cza tunelowego  dwu  nad- 
przewodników (zależność 
p:«ądu  tunelowego  elektro- 
nów normalnych  od  na- 
pięcia na  złączu) 


napięcie  U ' ’ 

i+4r) 


(Ax-A 2>/e  do  (di-f  A^je  (rys.  6).  Podobną  charaktery- 
stykę mają  półprzewodnikowe  diody  tunelowe,  co 
nasuwa  myśl  o wyzyskaniu  nadprzewodników  jako 
materiału  na  tunelowe  diody  nadprzewodnikowe. 

Ponieważ  »prąd  przy  napięciu  U < (dx— d2)  jes.t 
prądem  wzbudzonych  cieplnie  elektronów,  to  w tem- 
peraturze T = 0 K prąd  ten  nie  popłynie.  Nie  popłynie 
również  gdy  napięcie  U < (dx-f  d2),  ponieważ  w tem- 
peraturze T = 0 K nie  ma  wolnych  stanów  poniżej 
przerwy  energetycznej.  Wysokość  garbu  na  charakte- 
rystyce’/ = /(£/)  zależy  zatem  od  temperatury  (wzra- 
sta wraz  z nią). 

Jeśli  jedna  z okładek  rozpatrywanego  tutaj  konden- 
satora jest  metalem  normalnym  (np.  nadprzewodni- 
kiem powyżej  temperatury  krytycznej  Tk,  tzn.  że  nie 
ma  przerwy  energetycznej  czyli  Az  = 0),  to  — jak 
łatwo  można  sprawdzić  na  odpowiednim  schemacie 
poziomów  energetycznych  — prąd  tunelowy  popłynie, 
gdy  U — A Je,  a charakterystyka  / = /(//)  nie  będzie 
mieć  garbu.  Gładką  charakterystykę  otrzymuje  się 
również  wtedy,  gdy  metale  po  obu  stronach  bariery 
są  tymi  samymi  nadprzewodnikami  (prąd  tunelowy 
popłynie,  gdy  napięcie  osiągnie  wartość  U = 2 A/e, 
ponieważ  teraz  Ax  = A2). 

Dane  otrzymane  z charakterystyk  złącza  tunelo-  zgodność  z 
wego  i dotyczące  szerokości  przerwy  energetycznej  teorią  BCS 
w nadprzewodnikach  oraz  jej  zależność  od  tempera- 
tury potwierdzają  przewidywania  teorii  Bardeena, 

Coopera  i Schrieffera,  dokładniej  omówione  w haśle 
nadprzewodnictwo.  Ale  nie  tylko  te  dane  można 
uzyskać  w wyniku  analizy  pomiarów  prądu  tunelo- 
wego. Pierwsze  i drugie  pochodne  charakterystyk  na- 
pięciowo-prądowych,  czyli  dljdU  i d~IldU2>  mogą 
dać  informacje  o gęstości  stanów  elektronowych  i o 
rozkładzie  widmowym  fononów  w nadprzewodni- 
kach. 


Zjawiska  Josephsona  — tune- 
lowanie par  Coopera 


Jeśli  warstwa  rozdzielająca  dwa  nadprzewodniki  jest 
wystarczająco  cienka,  nie  grubsza  niż  odległość,  z ja- 
kiej oddziałują  z s-obą  elektrony  pary  Coopera  (ok: 
1-^-2  nm),  oprócz  tunelowania  normalnych  elektro- 
nów może  wystąpić  tunelowanie  elektronów  zwią- 
zanych w pary  Coopera.  Oczywiście,  pary  nie  będą 
mogły  tunelować,  gdy  któryś  z nadprzewodników 
układu  kanapkowego  przejdzie  w stan  normalny. 

Dta  zrozumienia  zjawisk  Josephsona  musimy  po- 
służyć się  pojęciem  funkcji  falowej  opisującej  stan 
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kwantowy  cząstki.  Próby  wyjaśnienia  tych  procesów 
oparte  na  modelu  klasycznym  przeważnie  zawodzą. 
Długość  fali  X i częstość  v związane  są  z pędem  p 
i energią  e cząstki  zależnościami: 


funkcja 
fałowa  pary 
Coopera 


X — hjp , s = hv , (1) 


gdzie  Ii  — stała  Plancka. 

Stan  kwantowy  pary  Coopera  można  opisać  funkcją 
falową  w postaci: 


ip  = y0sin2jr 


(2) 


albo,  po  uwzględnieniu  zależności  (1): 


. 2n 

y = YoSin— (px— et). 


(3) 


Dla  uproszczenia  posłużyliśmy  się  tu  falą  płaską  roz- 
chodzącą się  w kierunku  osi  *.  Litera  t oznacza  czas. 
Argument  sinusa:  <p  = 2K(px-et)jh  nazywa  się  fazą 
funkcji  falowej. 

Sens  fizyczny  fazy  funkcji  falowej  jest  dość  trudny 
do  uchwycenia.  Znacznie  łatwiej  trafia  do  wyobraźni 
fizyczna  interpretacja  amplitudy  y0  funkcji  falowej: 
jej  kwadrat  oznacza  prawdopodobieństwo  znalezienia 
cząstki  w danym  miejscu.  Jeśli  są  to  cząstki  nałado- 
wane, jak  pary  Coopera,  to  jest  proporcjonalne 
do  gęstości  ładunku. 

Funkcje  falowe  wszystkich  par  Coopera  w jedno- 
spójnej  bryle  nadprzewodnika  (tzn.  w bryle  pozba- 
wionej otworów,  w których  mógłby  zostać  uwięziony 
strumień  magnetyczny)  mają  jednakową  długość. 
Wynika  to  stąd,  że  wszystkie  pary  mają  jednakowy 
pęd.  Pędy  wszystkich  par  są  równe  zeru,  gdy  przez 
nadprzewodnik  nie  płynie  prąd,  i różne  od  zera,  ale 
jednakowe,  gdy  nadprzewodnik  jest  włączony  do 
obwodu  prądu. 

Funkcje  falowe  par  elektronów  mają  także  zgodną 
fazę  — są  spójne  (koherentne),  przy  czym  spójność 
rozciąga  się  na  cały  obszar  nadprzewodnika.  Jeżeli 
jest  to  nawet  przewód  nadprzewodzący  w uzwojeniu 
elektromagnesu  osiągający  długość  do  kilku  kilome- 
trów, to  funkcje  falowe  par  elektronów  są  spójne  na 
całej  długości  tego  nadprzewodnika. 

Gdy  przez  nadprzewodnik  nie  płynie  prąd,  pęd  par 
Coopera  równa  się  zeru,  a długość  fali  jest  nieskoń- 
czona (pomijamy  tu  kwestię  zaniku  funkcji  falowej  na 
granicy  nadprzewodnika  w obszarze  o grubości  f). 
Oznacza  to,  że  faza  funkcji  falowej  w całym  nadprze- 
różnica  faz  wodniku  jest  taka  sama.  Gdy  prąd  płynie,  pęd  par 
funkcji  Jest  różny  od  zera  i długość  fali  ma  wartość  skończoną, 
fałowych  jednakową  dla  wszystkich  par.  W poszczególnych 
punktach  nadprzewodnika  faza  funkcji  falowej  ma 
wtedy  różną  wartość.  Różnica  faz  w dwu  punktach 
nadprzewodnika  oznacza  więc,  że  między  tymi  punkt- 
tami  przepływa  prąd  par  Coopera.  Różnica  faz  funkcji 
falowych  występuje  również  po  obu  stronach  bariery 
w złączu  Josephsona.  W zjawiskach  Josephsona  od- 
grywa rolę  właśnie  ta  różnica  faz,  a nie  bezwzględne 
wartości  samych  faz. 

Bezwzględna  wartość  fazy  funkcji  falowej  jest  wiel- 
kością bez  znaczenia  dla  zjawisk  fizycznych.  Wybór 
tej  wielkości  jest  zresztą  zupełnie  dowolny,  gdyż  ani 
punkt  początkowy  (zero  na  osi  x),  ani  chwila,  od  któ- 
rej rozpoczynamy  liczenie  czasu,  nie  są  ustalone  z gó- 
ry. Pod  tym  względem  faza  funkcji  falowej  przypo- 
mina potencjał  pola  elektrycznego:  zero  potencjału 
jest  także  umowne.  W zjawiskach  fizycznych  gra  rolę 
różnica  potencjałów  (napięcie),  a nie  sam  potencjał. 
Faza  funkcji  falowej  ma  jeszcze  tę  własność,  znaną 
dobrze  z ruchu  falowego,  że  może  być  określona  (już 
po  wyborze  zera)  z dokładnością  do  2 k.  Fazy  różniące 
się  między  sobą  o całkowitą  wielokrotność  liczby  2n 
(czyli  o 2 nn,  gdzie  n = 1,  2,  3, ...)  są  identyczne.  Bez- 
względna wartość  różnicy  faz  funkcji  falowych  może 
się  więc  zmieniać  od  0 do  2n. 

stały  prąd  Jeśli  na  barierze  w złączu  Josephsona  wytworzy  się 
par  Coopera  stała  w czasie  różnica  faz  funkcji  falowych  (które  nie 
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muszą  być  jednakowe  po  obu  stronach  bariery),  to 
przez  barierę  płynie  stały  prąd  par  Coopera.  Oblicze- 
nia, których  tu  przytaczać  nie  będziemy,  wykazują, 
że  gęstość  prądu  tunelowania  par  j jest  uzależniona 
od  różnicy  faz  y>1— q>2  — O w następujący  sposób: 

j = jk  sin  O (4) 

i może  przybierać  wartości  od  zera  do  jk.  Maksymalna 
wartość  gęstości  prądu  (;*)  wynosi  około  10“ 2 A/cm2, 
a więc  jest  tego  samego  rzędu,  co  gęstość  prądu  tune- 
lowania elektronów  normalnych. 

Bariera  w złączu  Josephsona  zachowuje  się  jak  nad- 
przewodnik, gdyż  prąd  par  Coopera,  przepływający 
przez  nią,  nie  powoduje  spadku  potencjału  elektrycz- 
nego. Gdyby  jednak  (np.  na  skutek  zwiększenia  siły 
elektromotorycznej  w obwodzie  źródła  zasilania)  gę- 
stość prądu  j na  barierze  wzrosła  powyżej  wartości  jk, 
to  na  barierze  pojawi  się  napięcie  U odpowiadające 
przepływającemu  prądowi  i oporowi  danej  bariery 
dla  prądu  tunelowania  elektronów  normalnych.  Prąd 
stały  par  Coopera  przestanie  wtedy  płynąć,  a przez 
barierę  popłynie  prąd  tunelowy  elektronów  normal- 
nych, czyli  na  charakterystyce  I = f (U)  nastąpi  prze- 
skok od  punktu  A do  punktu  B (wzdłuż  linii  przery- 
wanej na  rys.  7).  Zmniejszenie  siły  elektromotorycznej 
w obwodzie  umożliwia  przywrócenie  stałego  prądu 
Josephsona,  przy  czym  przejście  to  następuje  wzdłuż 


Rys.  7.  Charakterystyka 
prądowo-napięciowa  złą- 
cza Josephsona  (dla  prądu 
stałego) 


dolnej  linii  ciągłej,  j k jest  krytyczną  gęstością  prądu 
stałego  dla  złącza  Josephsona,  tj.  maksymalną  gęsto- 
ścią prądu  /,  jaki  może  płynąć  przez  dane  złącze  nie 
powodując  na  nim  spadku  napięcia.  Po  pojawieniu  się 
napięcia  przez  złącze  może  płynąć  prąd  stały  elektro- 
nów normalnych  i zmienny  prąd  Josephsona  (szersze 
omówienie  tego  zjawiska  zawiera  rozdział  Zjawiska 
niestacjonarne). 


Kwanty  strumienia  magnetycznego 

Funkcja  falowa  par  Coopera  nie  zawsze  przedstawia 
falę  płaską  poruszającą  się  w jednym  tylko  kierunku. 
Np.  w nadprzewodniku  niejednospójnym,  czyli 
z otworem,  w którym  może  być  uwięziony  strumień 
magnetyczny,  fala  związana  z parą  Coopera  może 
otaczać  ten  otwór.  Oznacza  to,  że  dokoła  otworu 
może  płynąć  prąd  par  Coopera.  Aby  w dowolnie 
obranym  punkcie  w nadprzewodniku  faza  funkcji 
falowej  zachowała  swą  jednoznaczności,  wzdłuż  krzy- 
wej zamkniętej,  otaczającej  uwięziony  strumień,  musi 
się  ułożyć  całkowita  liczba  długość  fali.  Innymi  słowy, 
po  jednokrotnym  okrążeniu  uwięzionego  strumienia 
faza  funkcji  falowej  może  się  zmienić  tylko  o całko- 
witą krotność  liczby  2tc,  czyli  o 2nnt  gdzie  n jest  liczbą 
całkowitą. 

Prąd  par  Coopera  dokoła  otworu  nie  może  się  więc 
zmieniać  dowolnie,  lecz  tylko  porcjami  takimi,  aby 
każdej  porcji  odpowiadała  zmiana  fazy  funkcji  falo- 
wej o 2tt.  Zatem  i strumień  magnetyczny  w otworze 
musi  się  zmieniać  porcjami,  odpowiadającymi  zmia- 
nom prądu  par  Coopera.  Porcje  (kwanty)  strumienia 


prąd 

tunelowy 

elektronów 

normalnych 


pary  Coopera 
w nadprze- 
wodniku 
z otworem 


magnetycznego  to  znane  nam  już  fluksony  (-*  Nad- 
przewodnictwo), równe  2,07  10~15  Wb.  Zmiana  stru- 
mienia o jeden  kwant  odpowiada  zmianie  fazy  o 2ji. 
Liczba  n jest  równa  liczbie  kwantów  strumienia  uwię- 
zionego w otworze.  Jeżeli  nadprzewodniki  II  rodzaju 
znajdują  się  w stanie  mieszanym,  dotyczy  to  również 
strumienia  magnetycznego  zawartego  w pojedynczym 
flukso idzie.  Doszliśmy  więc  do  wniosku,  że  kwanto- 
wanie strumienia  magnetycznego  jest  również  zja- 
wiskiem, w którym,  oprócz  zjawisk  Josephsona,  od- 
grywa rolę  zmiana  fazy  funkcji  falowej  nośników 
prądu  nadprzewodzącego. 


Wpływ  pola  magnetycznego  na  prąd 
Josephsona 

Rozpatrzmy  przypadek,  kiedy  złącze  Josephsona 
znajduje  się  w zewnętrznym  polu  magnetycznym,  któ- 
rego wektor  indukcji  B jest  skierowany  wzdłuż  płasz- 
czyzny warstwy  izolującej.  Obierzmy  układ  współ- 
rzędnych jak  na  rys  8.  Wtedy  wektor  indukcji  ma 
kierunek  osi  z. 
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Rys.  8.  Złącze  Josephsona  w zewnętrznym  polu  magnetycznym 
(z  układem  współrzędnych) 


Rys.  9.  Obszar  wnikania  pola  magnetycznego  w złącze  Josephso- 
na, gdzie  wektor  B jest  prostopadły  do  płaszczyzny  rysunku, 
6 głębokość  wnikania  w nadprzewodnik,  d grubość  izolatora 


Rys.  9 przedstawia  przekrój  złącza  w płaszczyźnie 

x— y.  Wektor  indukcji  B pola  magnetycznego  wnika 
w cały  obszar  warstwy  izolującej  i częściowo  w nad- 
przewodnik na  głębokość  S.  Strumień  magnetyczny 
przenikający  złącze  wynosi  zatem  0 = B(2S+d)lf 
gdzie  S jest  głębokością  wnikania  pola  w nadprze- 
wodnik, d — grubością  warstwy  izolującej,  / — dłu- 
gością warstwy  w kierunku  osi  x.  Jeśli  pole  w złączu 
jest  jednorodne,  to  różnica  faz  funkcji  falowych  bę- 
dzie się  równomiernie  zmieniać  z odległością  x oscy- 
lując między  wartościami  0i2jt.  Liczba  oscylacji  jest 
równa  liczbie  m kwantów  strumienia  magnetycznego 
Po  mieszczących  się  w złączu,  czyli  m = 0/g?o-  Liczba 
m nie  musi  tutaj  być  liczbą  całkowitą,  ponieważ  złącze 
nie  ze  wszystkich  stron  jest  otoczone  nadprzewodni- 
kiem i strumień  może  znajdować  się  także  poza  złą- 
czem. Rys.  10  przedstawia  rozkład  gęstości  prądu 
Josephsona  j = y*sin©  wzdłuż  płaszczyzny  złącza 


dla  m = 2,5.  Wartość  /*,  podobnie  jak  wówczas,  gdy 
nie  istnieje  pole  zewnętrzne,  jest  maksymalną  warto- 
ścią gęstości  prądu,  który  może  przepływać  przez  dane 
złącze  nie  powodując  pojawienia  się  na  nim  napięcia. 


czyzny  złącza  (oś  x jest  prostopadła  do  wektora  B pola  magne- 
tycznego) 


Maksymalne  natężenie  prądu  par  Coopera  /*,  któ- 
ry może  płynąć  przez  złącze  w polu  o indukcji  B , 
otrzymamy  całkując  wyrażenie  j = jk  sin 6)  = f(x) 
po  całej  czynnej  powierzchni  złącza.  W rozpatrywa- 
nym przypadku  sprowadza  się  to  do  obliczenia  pola 
zawartego  między  sinusoidą  j — f{x)  i osią  x na  od- 
cinku osi  od  0 do  / (rys.  10)  i pomnożeniu  wyniku 
przez  długość  złącza  wzdłuż  osi  z.  Przy  sumowaniu 
pól  garbów  utworzonych  przez  sinusoidę  j = f(x) 
należy  pamiętać,  aby  garbom  leżącym  pod  osią  x, 
czyli  odpowiadającym  ujemnej  wartości  y,  przypo- 
rządkować znak  minus. 

Łatwo  sprawdzić  na  rys.  10,  że  wynik  całkowania 
(dodawania  pól  garbów)  będzie  różny  od  zera  tylko 
wtedy,  gdy  na  długości  / ułoży  się  niejednakowa  liczba 
garbów  nad  osią  x i pod  osią  Maksymalne  natę- 
żenie prądu  h będzie  tym  większe,  im  większe  pole 
między  sinusoidą  i osią  x pozostanie  nieskompenso- 
wane,  tzn.  pozbawione  swego  partnera  z przeciwnym 
znakiem.  Łatwo  też  zauważyć,  że  im  większa  liczba 
fluksonów  znajdzie  się  w obrębie  złącza,  tym  mniejsze 
pole  na  wykresie  j = f(x)  może  pozostać  nieskompen- 
sowane  i tym  słabszy  prąd  Josephsona  może  płynąć 
przez  złącze.  Oczywiście,  prąd  może  płynąć  tylko 
wtedy,  gdy  złącze  zostanie  włączone  w obwód  źródła 
prądu. 

Obliczenia  wykazują,  że  maksymalne  natężenie 
prądu  Josephsona  płynącego  przez  złącze  umiesz- 
czone w polu  magnetycznym  można  przedstawić  na- 
stępującą zależnością  : 


Jk 


sin7i(0/<po) 
(0/?o)  9 


(5) 


gdzie  0 jest  strumieniem  zawartym  w złączu,  <p0  — 
kwantem  strumienia.  Wykres  tej  zależności  przedsta- 
wia rys.  11.  Przekroczenie  natężenia  hc  spowoduje 
pojawienie  się  napięcia  na  złączu  i zanik  stałego  prą- 
du Josephsona.  Im  jest  maksymalnym  natężeniem 
prądu  Josephsona,  który  może  płynąć  przez  złącze  w 
nieobecności  pola  magnetycznego. 

Na  wielkość  strumienia  magnetycznego  w złączu 
możemy  wpływać  zmieniając  natężenie  zewnętrznego 
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pola  magnetycznego.  Z powyżej  przytoczonych  roz- 
ważań i z wzoru  (5)  wynika,  że  za  każdym  razem,  gdy 
strumień  magnetyczny  O w złączu  osiąga  wartość 
równą  całkowitej  wielokrotności  kwantu  strumienia 
<Po*  przez  złącze  nie  może  płynąć  stały  prąd  par  Co- 
opera (może  natomiast  płynąć  normalny  prąd  tunelo- 
wy). Kwant  strumienia  jest  więc  okresem  oscylacji 
maksymalnego  natężenia  h.  stałego  prądu  tunelowego 
par  Coopera  przez  złącze.  Dla  typowego  złącza 
(/~  2- 10~2  cm,  cm,  d<^ó)  okres  ten  w jed- 

nostkach indukcji  magnetycznej  jest  rzędu  10  uT 
(0,1  Gs). 

dyfrakcja  Krzywa  h}lm  = /(tf>M>)  na  rys.  11  przypomina 

na  złączu  krzywą  rozkładu  natężenia  światła  w obrazie  dyfrak- 
Josephsona  cyjnym  otrzymanym  od  jednej  szczeliny.  Na  złączu 
Josephsona  występuje  więc  dyfrakcja  funkcji  falo- 
wych par  Coopera.  Możemy  również  obserwować 
zjawiska  interferencyjne  w dwu  połączonych  złączach 
Josephsona. 


Interferencja  kwantowa 

Zjawisko  interferencji  fal  par  elektronowych  wystąpi, 
jeśli  w obwód  prądu  włączymy  dwa  złącza  Josephsona 
nadprzewod-  połączone  z sobą  równolegle  nadprzewodzącymi  roż- 
ni ko  wy  in-  gałęzieniami.  Schemat  takiego  urządzenia,  zwanego 
terferometr  nadprzewodnikowym  interferometrem  kwantowym, 
kwantowy  przedstawia  rys.  12.  Przyjmijmy  dla  uproszczenia,  że 


b 

Rys.  12.  Pierścień  nadprzewodzący  z dwoma  złączami  Josephsona 
(nadprzewodnikowy  interferometr  kwantowy) 


oba  złącza  są  identyczne,  a pętla  utworzona  z dopro- 
wadzeń nadprzewodzących  ma  oś  symetrii.  Pomińmy 
na  razie  modulację  faz  funkcji  falowych  w samych 
złączach  i rozpatrzmy,  jak  strumień  magnetyczny  za- 
warty w pętli  wpływa  na  maksymalną  wartość  na- 
tężenia prądu  Josephsona  płynącego  przez  złącza. 
Oznaczmy  ten  strumień  przez  Ot',  nie  musi  on  być 
całkowitą  wielokrotnością  fluksonu  $?<>,  ponieważ 
nie  jest  to  strumień  uwięziony  w nadprzewodniku 
(pętla  ma  dwa  złącza  Josephsona,  czyli  dwie  szczeliny 
w nadprzewodzącym  materiale,  przez  które  może 
przenikać  strumień  magnetyczny).  Ze  strumieniem 
magnetycznym  Ot  związany  jest  prąd  elektryczny 
o natężeniu  70  = Ot  TL,  krążący  w pętli  (L  — współ- 
czynnik samoindukcji  pętli).  Prąd  70  będzie  prądem 
nadprzewodzącym,  dopóki  na  barierach  nie  pojawi 
się  napięcie.  Zmiana  fazy  funkcji  falowej  w nadprze- 
wodzącej części  pętli,  spowodowana  przepływem  tego 
prądu,  po  jednokrotnym  okrążeniu  wynosi  2nm,  gdzie 
m jest  liczbą  fluksonów  w strumieniu  magnetycznym 
Ot,  czyli  m — OtI<p0.  Jak  już  wspominaliśmy,  dzięki 
istnieniu  szczelin  (złącz)  w pętli,  liczba  m nie  musi  być 
liczbą  całkowitą. 

Oprócz  cyrkulującego  prądu  70  może  jeszcze  przez 
pętię  płynąć  prąd  7 ze  źródła  zasilania  obwodu.  Ze 
względu  na  symetrię  pętli,  prąd  ten  rozdziela  się  jed- 
nakowo na  obie  jej  części  (.na  rys.  12  górna  i dolna) 
tak,  że  na  każdą  część  .pętli  przypada  i 7.  Prąd  7 
w pętli  jest  prądem  nadprzewodzącym,  jeśli  jego  natę- 
żenie nie  przekroczy  pewnej  wartości  dopuszczalnej. 
Przez  pę*dę  popłyną  więc  następujące  prądy:  prąd  o 
natężeniu  £7— 70  przez  górną  część  pętli  i prąd  o na- 
tężeniu £7+7®  przez  dotną  część.  Zmiany  faz  na  barie- 
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rach  a i b,  odpowiadające  tym  prądom,  wynoszą  0a 
i 0^  Wzory  wiążące  zmiany  faz  z natężeniami  prądów 
Josephsona  mają  postać  zgodną  z zależnością  (4): 


■2 7 70  — 7asin 0a, 
2'7+70  = 7&sin6>&, 


(6) 


gdzie  Ia  i h są  prądami  krytycznymi  dla  barier  a i b. 
Ponieważ  z założenia  bariery  te  są  jednakowe,  to 
la  = Ib  — 7fc. 

Na  całkowitą  zmianę  fazy  funkcji  falowej  w górnej 
części  pętli,  na  drodze  między  punktami  A i B,  składa 
się  zmiana  fazy  0a  na  barierze  a oraz  zmiana  fazy 
w samym  nadprzewodniku  ( A<p)a . Analogicznie  w dol- 
nej części  faza  zmieni  się  o 0b+(A<p)b.  Ze  względu 
na  konieczność  zachowania  jednoznaczności  faz 
w punktach  A i B,  zmiany  w obu  częściach  pętli  mogą 
się  różnić  tylko  o Inn , gdzie  n jest  liczbą  całkowitą  lub 
zerem.  Mamy  więc: 


0a-\-(A(p)a  — 0b-\-(A<p)b-h2nn . 


(7) 


Mimo  symetrii  geometrycznej  względem  prostej 
AB,  zarówno  zmiany  faz  na  barierach,  jak  i zmiany 
faz  w nadprzewodzących  rozwidleniach  pętli  mogą 
być  różne  po  obu  stronach  prostej  AB,  gdyż  w obec- 
ności strumienia  Ot  w obu  częściach  pętli  płyną  prądy 
o różnych  natężeniach;  w jednej  części  pętli  prąd  70 
płynie  zgodnie  z prądem  i 7,  a w drugiej  części  — 
przeciwko  prądowi  i 7.  Na  różne  zmiany  faz  w obu 
częściach  symetrycznej  pętli  wpływa  więc  wartość 
strumienia  Ot  wywołującego  przepływ  prądu  I0. 
Wiemy  już,  że  w nadprzewodzących  częściach  pętli 
przepływ  tego  prądu  spowoduje  zmianę  fazy  o 2 nm, 
czyli  (A<p)a—(A<p)b  = 2nm  = 2k(OtI<p0)- 
Równanie  (7)  możemy  więc  zapisać: 

Oa  — 0b  = — rtj  , (8) 

albo:  = 0b  + Ą±L -Ą.  (9) 

Oznaczając  literą  & wartość  wyrażenia  stojącego  po 
jednej  (którejkolwiek)  stronie  powyższego  równania 
otrzymamy: 


Oa 


! ^ + j"”"  ~W)  OI*aZ  ®b  = 

Po  podstawieniu  tych  zależności  do  równania  (6)  do- 
dajemy je  stronami  i po  odpowiednich  przekształce- 
niach równanie  ma  postać: 


7 = 27*  sin# -cos 


[*(*-■£)]■ 


Ponieważ  zarówno  7jak  i h muszą  mieć  ten  sam  znak, 
to  występujące  tu  funkcje  trygonometryczne  muszą 
być  albo  obie  dodatnie,  albo  obie.  ujemne.  Można 
więc  napisać:  7 = 27Arisin^Mcos[7c(«-^r1V0)]»  albo, 
po  wprowadzeniu  oznaczenia  27*]sin#j  = 7max: 


7 

7max 


COS 


kOt 

<Po 


(10) 


Wykresem  tej  funkcji  jest  krzywa  przedstawiona  na 
rys.  13.  Widzimy,  że  prąd  o maksymalnej  wartości 
natężenia,  nie  powodujący  jeszcze  spadku  potencjału 
(napięcia)  na  złączach,  można  przepuścić  przez  pętlę 
wtedy,  gdy  strumień  magnetyczny  w pętli  jest  całko- 
witą wielokrotnością  fluksonu.  Gdy  zaś  Ot  — 
= (»+ i)9V»  nawet  bardzo  słaby  prąd  spowoduje 
pojawienie  się  napięcia. 

Dkresem  zmian  krytycznego  natężenia  prądu  Jo- 
sephsona dla  pętli,  podobnie  jak  dla  pojedynczego 
złącza,  jest  flukson.  Jednak  z powodu  dużej  powierz- 
chni pętli  w porównaniu  z powierzchnią  przekroju 
poprzecznego  złącza,  dla  pętli  okres  ten  w jednostkach 


indukcji  jest  znacznie  mniejszy.  Jeśli  np.  pętla  ma 
powierzchnię  czynną  równą  1 cm2,  to  zmianie  stru- 
mienia o 1 flukson  odpowiada  zmiana  indukcji  mag- 


Rys.  14.  Zależność  prądu  krytycznego  nadprzewodzącego  inter- 
ferometru kwantowego  od  zewnętrznego  pola  magnetycznego 


netycznej  o 2 10" 11 T.  Rys.  14  przedstawia  wynik  na- 
łożenia się  oscylacji  krytycznego  prądu  Josephsona, 
spowodowanych  zmianami  strumienia  magnetycznego 
w pętli,  na  oscylacje  wywołane  zmianami  strumienia 
w samych  złączach. 

zastosowanie  Na  prąd  Josephsona  w pętli  wpływają  zauważalnie 
mterfero-  zmiany  indukcji  magnetycznej  nawet  sto  razy  mniej- 
metru  sze  od  okresu  tych  zmian.  Za  pomocą  interferometru 
kwantewsgo  kwantowego  można  więc  mierzyć  zmiany  indukcji 
wynoszące  10" 13  T.  Takiej  czułości  nie  osiąga  żaden 
konwencjonalny  miernik.  Dzięki  swej  wysokiej  czu- 
łości na  zmiany  pola  magnetycznego,  nadprzewodzący 
interferometr  kwantowy  służy  również  do  pomiarów 
takich  wielkości  jak  napięcie  lub  natężenie  prądu 
elektrycznego,  przy  czym  jego  czułość  jest  o kilka  rzę- 
dów lepsza  niż  przyrządów  klasycznych. 


Zjawiska  niestacjonarne 

Przepływ  stałego  prądu  Josephsona  przez  złącze  w 
obecności  pola  magnetycznego  i związane  z tym  zjawi- 
ska interferencyjne  są  zjawiskami  ustalonymi  w czasie 
(stacjonarnymi).  Prócz  tych  zjawisk  Josephson  prze- 
widział również  możliwość  przepływu  przez  złącze 
prądu  zmiennego,  co  zostało  później  stwierdzone 


Rys.  15.  Schemat  przejść  tunelowych  Josephsona:  a)  bez  napięcia 
na  złączu  (zjawisko  stacjonarne),  b)  z emisją  fotonu  pod  napię- 
ciem na  złączu  (zjawisko  niestacjonarne).  Pochłonięcie  fotonu 
spowoduje  przejście  w odwrotnym  kierunku  (wbrew  polamo- 
ści  źródła  napięcia) 


doświadczalnie  i nazwane  zmiennoprądowym  albo 
niestacjonarnym  zjawiskiem  Josephsona.  W zjawi- 
skach stacjonarnych  przepływ  stałego  prądu  nadprze- 
wodzącego przez  złącze  nie  powoduje  na  nim  spadku 
potencjału  elektrycznego  (napięcia).  Przepływ  zmien- 
nego prądu  Josephsona  związany  jest  z pojawieniem 
się  napięcia  na  złączu  (rys.  15). 

Jeśli  na  złączu  ustali  się  stałe  w czasie  napięcie  U0y 
to  energia  par  Coopera  przechodzących  prr.ez  złącze 
zmieni  się  o wartość  fii— £2  = ęU<»  gdzie  ą jest  ła- 
dunkiem pary.  Zmiana  energii  powoduje  zmianę  fazy 
= InlhUi-eiP  = ąUćJh  (wynika  to  z zależno- 
ści (3)).  Różnica  faz  po  obu  stronach  złącza  zmienia 
się  więc  w czasie,  a ponieważ  prąd  Josephsona  zależy 
od  różnicy  faz,  będzie  to  prąd  zmienny.  Wyrażenie 
dla  gęstości  prądu  Josephsona  otrzymujemy  podsta- 
wiając w równaniu  (4)  różnicę  faz  & = qU0t/ft : 


Prąd  Josephsona  płynący  przez  łącze  pod  stałym  na- 
pięciem U0  zmienia  się  więc  okresowo  z częstością 
kołową  co  = qUjh.  Stałe  napięcie  na  złączu  Joseph- 
sona może  zatem  generować  prąd  zmienny.  Moc  ta- 
kiego generatora  jest  jednak  bardzo  mała,  gdyż  naj- 
częściej wynosi  około  10" 11  W. 

Między  napięciem  na  złączu  a częstością  oscylacji 
prądu  v = cofln  istnieje  następująca  zależność  liczbo- 

wa:  — =4-  = 483,6  MHz/|iV  (q  = 2e  orasz  h są  sta- 
U,  h 

łymi  uniwersalnymi,  a stosunek  hjq  — <p0  jest  równy 
kwantowi  strumienia  magnetycznego).  Napięcie  U0 
powinno  być  mniejsze  od  U = (Ax  gdyż  przy 

wyższych  napięciach  prąd  Josephsona  szybko  zanika, 
wzrasta  natomiast  prąd  tunelowania  elektronów  nor- 
malnych. Stosowana  na  ogół  wartość  napięcia  U0 


warstwy  cyny  warsjwy  tlenku  cyny 


Rys.  17.  Charakterystyka  prądowo-napięciowa  złącza  przed- 
stawionego na  rys.  16.  Krzywa  1 — charakterystyka  /=/(£/) 
złącza  a — b przy  napięciu  na  złączu  b—c  równym  zeru  {Ute  •*  0); 
krzywa  2 — charakterystyka  1 — złącza  a—b  przy  napięciu 
Ute  * 0 


leży  w przedziale  od  kilku  |iV  do  kilku  mV,  a odpo- 
wiadająca tym  napięciom  częstość  może  dochodzić 
nawet  do  tysiąca  GHz.  Wykrycie  prądów  tak  wielkiej 
częstości  jest  możliwe  dzięki  istnieniu  pola  elektro- 
magnetycznego związanego  z tym  prądem.  Doświad- 
czenia wykazujące  bezpośrednio  istnienie  takiego  po- 
la wykonał  J.  Giaever  w 1964  r.,  używając  do  tego 
celu  dwu  złącz  połączonych  z sobą  wspólną  okładziną 
(rys.  16).  Złącza  wykonano  w sposób  następujący. 
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Na  podłoże  naniesiono  warstwę  cyny  ( a)y  poddano  ją 
długotrwałemu  utlenianiu  na  powierzchni,  aby  wy- 
tworzyć grubą  warstwę  tlenku,  na  nią  na  parowano 
następną  warstwę  cyny  ( b ) z cienką  warstwą  tlenku 
na  powierzchni  i w końcu  na  wierzch  naniesiono 
trzecią  warstwę  cyny  (c).  Warstwa  izolująca  między  a 
i b była  wystarczająco  gruba,  aby  tłumić  prąd  Jo- 
sephsona,  mógł  jednak  przez  nią  przepływać  prąd 
tunelowy  elektronów  normalnych  wtedy,  gdy  do  a i b 
przyłożono  napięcie  U ab  (rys.  17,  krzywa  i).  Charak- 
terystyka I — f(U)  dla  tego  złącza  zmieniła  się  po 
przepuszczeniu  pod  napięciem  Ute  zmiennego  prądu 
Josephsona  przez  warstwę  izolującą  między  b i c 
(krzywa  2).  Na  krzywej  pojawiły  się  schodki  odpowia- 
dające wartościom  napięcia  Uab  = (2A  ± nqUbc)/ey 
gdzie  2 A jest  szerokością  przerwy  energetycznej  dla 
cyny.  Szerokość  poszczególnych  schodków  2 Ubc 
odpowiada  energii  2 eUbc  = tuo  fotonów  emitowa- 
nych przez  złącze  Josephsona  (bc)  i pochłanianych 
w złączu  normalnym  (ab). 

Skok  normalnego  prądu  tunelowego  na  wyższy 
schodek  następuje  za  każdym  razem,  gdy  energia  fo- 
tonów wzrasta  o nową  porcję,  równą  qUbc. 

Złącze  Josephsona  może  być  również  odbiornikiem 
energii  promieniowania  elektromagnetycznego,  wy- 
tworzonego przez  inne  źródło,  np.  generator  mikro- 
falowy. Mikrofalowe  promieniowanie  doprowadza 
się  do  złącza  falowodem.  Okazuje  się,  że  wtedy  oprócz 
zmiennego  prądu  Josephsona  przez  złącze  może  pły- 


napięcie  U 

Rys.  18.  Schodkowa  charakterystyka  I = J\U)  złącza  Josephsona 
w zmiennym  polu  elektromagnetycznym 


nąć  także  stały  prąd  Coopera,  a charakterystyka  na- 
pięciowo-prądowa  napromieniowanego  złącza  jest 
schodkowa,  jak  na  rys.  18. 

Doprowadzenie  do  złącza  promieniowania  mikro- 
falowego o częstości  / = Q!2n  można  potraktować 
jako  przyłożenie  dodatkowego  napięcia  przemiennego 
u = UmCosGt  (oprócz  napięcia  stałego  U0).  Ogólne 
napięcie  wyniesie  więc  U(t)  — U0+umcosi2ty  a po- 
nieważ zmiana  w czasie  różnicy  faz  0 związana  jest 
z napięciem  U(t)  zależnością  dOjdt  = qU(t)/fi , to 
różnica  faz  będzie  równa : 

0 = jrj  U(t)dt=jrU0t+3j£-sinnt+l),  (12) 

gdzie  jest  stałą  całkowania  (różnica  faz  dla  1 — 0). 

Po  podstawieniu  wyrażenia  (12)  do  wzoru  (4)  ot- 
rzymamy równanie  dla  gęstości  prądu  Josephsona  w 
zmiennym  polu  elektromagnetycznym: 

j sinQt+pj.  (13) 

Zmienny  prąd  Josephsona,  o częstości  własnej  co  = 
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= qU0Jhy  jest  więc  modulowany  częstością  Q obcego 
pola  elektromagnetycznego,  czyli  sama  częstość  Jo- 
sephsona co  zmienia  się  w czasie.  Dzięki  tej  modulacji 
prąd  Josephsona  zawiera  wiele  składowych  z różnymi 
częstościami.  Wśród  tych  składowych  mogą  się  zna- 
leźć również  składowe  z częstością  równą  zeru,  co 
odpowiada  stałej  w czasie  składowej  prądu. 

Stałe  składowe  prądu  Josephsona  można  obliczyć  po  stałe  składo- 
rozwinięciu  równania  (13)  w szereg  Fouriera-Bessela.  we  prądu 
Okazuje  się  wtedy,  że  prąd  stały  płynie  każdorazowo,  Josephsona 


^ stały 
^ Josephs 


0,2  - 
0.1  - 
0 - 


napięcie  U 


hv 

q 


ó q 


Rys.  19.  Stałoprądowe  składowe  charakterystyki  I = f(U) 
w niestacjonarnym  zjawisku  Josephsona,  obliczone  z równa- 
nia (13) 


gdy  częstość  josephsonowska  co  = qU0/h  zrówna 
się  z całkowitą  krotnością  częstości  Q pola  elektro- 
magnetycznego. czyli  qUJh  = nQ.  Charakterystyka 
napięciowo-prądowa  powinna  się  więc  składać  z pio- 
nowych kresek,  występujących  w punktach  odpowiada- 
jącym napięciom  na  złączu,  równym  0,  hQjqy  2(kQlq)y 
3 (hOlq)  itd.  (rys.  19).  Różnica  między  charakterystyką 
/ =f(U)  obliczoną  z równania  (13)  i wyznaczoną 
doświadczalnie  (rys.  18)  jest  spowodowana  tym,  że 
w doświadczeniu  obserwujemy  stały  prąd  Josephso- 
na na  tle  prądu  tunelowego  elektronów  normalnych, 
które  także  wzbudzają  się  pod  wpływem  promienio- 
wania elektromagnetycznego. 

Dzięki  opisanym  powyżej  własnościom  złącze 
Josephsona  może  służyć  zarówno  jako  generator  jak 
i detektor  promieniowania  elektromagnetycznego  w 
zakresie  mikrofalowym  i w dalekiej  podczerwieni. 
Innym  sposobem  wyzyskania  złącza  Josephsona  jest 
określenie  absolutnej  jednostki  napięcia  opartej  na 
równaniu  U = hQ/q  na  podstawie  badania  charaktery- 
styki prądu  Josephsona;  dokładność  jej  określenia 
zależy  od  dokładności,  z jaką  znamy  stałe  fizyczne 
e i hy  oraz  od  dokładności,  z jaką  możemy  mierzyć 
częstość  £?/2jc. 

Powyżej  przedstawiono  tylko  niektóre  podstawowe 
zjawiska  związane  z tunelowaniem  par  Coopera. 
Z braku  miejsca  pominięto  np.  rezonansowe  wzbudze- 
nie stałej  składowej  nadprzewodzącego  prądu  własną 
falą  elektromagnetyczną,  powstałą  w złączu  w wyniku 
oddziaływania  słabego  zewnętrznego  pola  magne- 
tycznego (ok.  10" 4 T)  na  zmienny  prąd  Josephsona, 
lub  zjawiska  zachodzące  w pierścieniu  nadprzewo- 
dzącym z jednym  złączem  Josephsona.  Zwłaszcza  te 
ostatnie  zjawiska  mają  ważne  znaczenie  ze  względu 
na  zastosowanie  praktyczne. 

Prąd  Josephsona  może  płynąć  nie  tylko  przez  złą- 
cze z barierą  w postaci  cienkiej  warstwy  izolatora. 
Barierę  może  stanowić  również  warstwa  półprzewod- 
nika albo  normalnego  metalu  (np.  miedzi);  może  być 
nią  również  przewężenie  w samej  warstwie  nadprze- 
wodzącej (mikromostek  Dayema)  albo  kontakt  punk- 
towy nadprzewodników.  Takie  miejsca  w nadprze- 
wodniku, w których  występują  opisane  zjawiska,  na- 
zywają się  słabymi  złączami,  a zespół  tych  zjawisk 
nosi  nazwę  słabego  nadprzewodnictwa. 

Zjawisko  Josephsona  występuje  także  w nadpłyn- 
nym helu.  Słabym  złączem  łączącym  dwa  naczynia 
z ciekłym  helem  II  jest  otwór  o średnicy  ok.  10  pm 
w cienkim  (0,1  mm  grubości)  metalowym  dnie  rury 
wstawionej  do  kriostatu  z helem  II  (rys.  20).  W nor- 
malnych warunkach  poziomy  cieczy  w obu  naczy- 
niach (tj.  w rurze  i w kriostacie)  wyrównują  się.  Jeśli 
jednak  pod  otworem  umieścimy  kwarcowy  generator 


słabe  nad- 
przewodni- 
ctwo 


1,2  K 


generator 

ultradźwięków 

Rys.  20.  Schemat 
aparatury  do  ba- 
dania zjawiska  Jo- 
sephsona w ciekłym 
helu 


zjawisko  ultradźwięków,  to  poziom  helu  II  w rurze  podniesie 
Jos&phsorsa  się  na  wysokość  z spełniającą  zależność:  mgz  — nhv , 
w nad  płyn-  gdzie  m — masa  atomu  helu,  g — przyśpieszenie  ziem- 
nym helu 


Rys.  21.  Zjawisko  Josephsona  w nadpłynnym  helu.  Zależność 
różnicy  poziomów  od  czasu  trwania  doświadczenia.  Strzałka  A 
wskazuje  moment  włączenia  oscylatora,  strzałka  B — chwilę, 
w której  zwiększono  moc  drgań 


skie,  V — częstość  drgań  kwarcu,  n — liczba  całko- 
wita lub  stosunek  dwu  niewielkich  liczb  całkowitych. 

Rys.  21  przedstawia  zależność  różnicy  poziomów 
z od  czasu  trwania  eksperymentu.  Różnica  pozio- 
mów utrzymuje  się  bez  zmian  dopóki  nie  wzrośnie 
moc  oscylatora  kwarcowego;  wtedy  różnica  pozio- 
mów zwiększa  się.  Wykres  przypomina  „schodkową” 
charakterystykę  /=/(C/)  dla  złącza  Josephsona 
w nadprzewodnikach  pod  napięciem  i w zewnętrznym 
polu  elektromagnetycznym.  W helu  II  rolę  napięcia 
odgrywa  różnica  potencjałów  grawitacyjnych  gzy  rolę 
ładunku  — masa  atomu  helu,  rolę  częstości  pola  elek- 
tromagnetycznego — częstość  ultradźwięku.  Można 
oczekiwać  również  innych  analogii  między  zjawiskami 
Josephsona  w nadprzewodnikach  i w nadpłynnym 
helu,  dotychczas  jednak,  ze  względu  na  trudności 
eksperymentalne,  nie  były  one  obserwowane. 

R.  P.  Feynman  i in.  Feynmana  wykłady  z fizyki , t.  3,  War- 
szawa 1974;  J.  Raułuszkiewicz  Zjawiska  tunelowe  w nadprze- 
wodnikach, Post.  Fiz.23,  181  (1972);  A. C.  Rose-Innes,  E.  H.  Rho- 
deRiCK  Nadprzewodnictwo , Warszawa  1973. 


Zastosowanie  nadprzewodnictwa 

Eugeniusz  Trojnar 


Mimo  iż  nadprzewodnictwo  zostało  odkryte  w 191 1 r., 
na  szerszą  skalę  zaczęto  je  stosować  dopiero  od 
1961  r.,  tj.  od  czasu,  kiedy  nauczono  się  wytwarzać 
stopy  i związki  nadprzewodzące  o wysokich  parame- 
trach krytycznych.  Wyniki  badań  nad  zjawiskami 
Josephsona  także  rozszerzyły  zakres  zastosowań  nad- 
przewodnictwa, głównie  w elektronice  i technice  po- 
miarowej. 

Wszystkie  podstawowe  własności  nadprzewodni- 
ków, a więc  brak  oporu  elektrycznego,  doskonały 
diamagnetyzm  oraz  zjawiska  tunelowe  i kwantowanie 
strumienia  magnetycznego  mogą  mieć  zastosowanie 
praktyczne. 

Najbardziej  oczywistą  korzyścią  ze  stosowania 
nadprzewodników  jest  możliwość  uniknięcia  lub 
zmniejszenia  strat  energetycznych  na  ciepło  Joule’a 
w urządzeniach  elektrycznych.  Oczywiście,  w ogól- 
nym rozrachunku  ekonomicznym  należy  uwzględnić 
koszty  utrzymania  tych  urządzeń  w odpowiednio 
niskiej  temperaturze. 

Niekiedy  o celowości  zastosowania  nadprzewod- 
ników w urządzeniach  energetycznych  decyduje  nie 
tylko  zysk  ekonomiczny.  Ważnym  czynnikiem  może 
być  również  możliwość  znacznego  zmniejszenia  roz- 
miarów tych  urządzeń  przy  zachowaniu  tej  samej  mo- 
cy nominalnej.  Ma  to  szczególne  znaczenie  tam,  gdzie 
rozmiary  i ciężar  urządzeń  odgrywają  decydującą 
rolę-  . , 

W technice  pomiarowej  dzięki  stosowaniu  urządzeń 
nadprzewodnikowych  udało  się  polepszyć  czułość 
przyrządów  pomiarowych  o kilka  rzędów,  a więc 
osiągnąć  wyniki,  które  innymi  sposobami  były  nie- 
osiągalne. 

Omówimy  w skrócie  najważniejsze  urządzenia, 
w których  stosuje  się  lub  można  zastosować  nadprze- 
wodniki. Zacznijmy  od  elektromagnesów  nadprze- 
wodnikowych, gdyż  w tej  dziedzinie  nadprzewodniki 
znajdują  obecnie  najszersze  zastosowanie. 


Elektromagnesy 

nadprzewodnikowe 

W zwykłych  elektromagnesach  z uzwojeniem  mie- 
dzianym dla  wzmocnienia  pola  stosuje  się  zazwyczaj 
elektro-  rdzenie  żelazne.  Ten  sposób  jest  skuteczny  tylko  wie- 
rci ag  nesy  dy,  gdy  pole  wytworzone  przez  uzwojenie  jest  słabsze 
zwykłe  od  pola  nasycenia  rdzenia.  W silniejszych  polach 


wkład  od  rdzenia  jest  stosunkowo  niewielki,  dlatego 
stosowanie  rdzeni  staje  się  nieopłacalne.  Najlepsze 
elektromagnesy  rdzeniowe  mogą  wytwarzać  pola 
o indukcji  do  6 T w wąskiej  szczelinie  między  nad- 
biegunnikami  (tj.  w przestrzeni  o objętości  rzędu 
kilku  cm3),  a ciężar  tych  elektromagnesów  sięga  kil- 
ku ton. 

Pola  silniejsze  niż  6 T wytwarzają  bezrdzeniowe 
solenoidy  z uzwojeniem  miedzianym,  chłodzone 
wodą.  Pobierają  one  moc  rzędu  kilku  MW,  przy 
czym  ta  moc  wydziela  się  w uzwojeniu  i musi  być 
odprowadzona  na  zewnątrz  za  pomocą  odpowiednie- 
go systemu  chłodzenia.  Ciężar  miedzianych  uzwojeń 
w takich  elektromagnesach  wynosi  kilkaset  kilo- 
gramów. 

Stosując  nadprzewodnikowe  uzwojenia  w solenoi-  solenoidy 
dach  (ii.  58,  tabl.  16)  można  uzyskać  pola  o indukcji  nadprzewod- 
do  17  T w objętości  roboczej  rzędu  kilkudziesięciu  raikowe 
lub  nawet  kilkuset  cm3,  lub  pola  4 T w objętości  rzędu 
kilku  m3.  Elektromagnes  z uzwojeniem  nadprzewo- 
dzącym nie  rozprasza  mocy,  koszty  jego  eksploatacji 
są  więc  znacznie  niższe  niż  elektromagnesu  z uzwoje- 
niem normalnym,  zwłaszcza  przy  długich  okresach 
pracy.  Po  uruchomieniu  elektromagnesu  nadprze- 
wodnikowego można  końce  jego  uzwojeń  zewrzeć 
krótkim  przewodem  nadprzewodzącym  i trwały  prąd 
w uzwojeniach  może  krążyć  już  po  odłączeniu  źródła 
zasilania.  Ciężar  elektromagnesu  nadprzewodniko- 
wego zależy  od  wielkości  przestrzeni,  w której  wytwo- 
rzone jest  pole.  Jeśli  ta  objętość  wynosi  ok.  200  cm3, 
to  na  uzwojenia  wystarczy  kilka  kilogramów  materia- 
łu nadprzewodzącego.  Duże  elektromagnesy  nad- 
przewodnikowe do  celów  specjalnych  mogą  jednak 
ważyć  kilkaset  lub  nawet  kilka  tysięcy  kilogramów. 

Materiały  na  uzwojenia  elektromagnesów 
nadprzewodnikowych 

Od  nadprzewodników,  z których  wykonuje  się  uzwo- 
jenia elektromagnesów,  wymaga  się  spełnienia  nastę- 
pujących warunków:  1)  muszą  one  mieć  odpowiednio 
wysokie  wartości  drugiego  krytycznego  natężenia 
pola  magnetycznego  Ht2  w temperaturze  pracy,  tj. 
przeważnie  w temperaturze  wrzenia  helu  pod  nor- 
malnym ciśnieniem  (4,2  K)  lub  w nieco  wyższej  tem- 
peraturze w wypadku  chłodzenia  parami  helu.  2)  mu- 
szą przenosić  duże  gęstości  prądu,  rzędu  kilkuset 
A/mm2,  w polu  o natężeniu  zbliżonym  do  Hkz. 

Do  produkcji  drutów  nadprzewodzących  używa  się 
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stop  Nb-Ti  najczęściej  stopu  Nb-Ti,  dla  którego  Hkt  (4,2  K)  = 
= 90  kA/cm,  Tie  — 10  K i gęstość  prądu  nasycenia 
jk  (4,2  K)  = 0*6*  105  A/cm2  w polu  11  = 64  kA/cm 
(rys.  1).  Przewody  na  uzwojenia  elektromagnesów 
przeważnie  wykonane  są  z wiązki  wielu  cienkich  dru- 
tów Nb-Ti,  od  kilku  do  kilkudziesięciu  jim  średnicy, 
skręconych  dookoła  osi  wiązki  (skok  skrętu  ok.  5 mm) 


A/cm2 


Rys.  1.  Zależność 
krytycznej  gęsto- 
ści prądów  jk  od 
natężenia  zewnę- 
trznego pola  ma- 
gnetycznego H±_ 
dla  Nb-Ti  iNb3Sn 
w J = 4,2  K 


Rys.  2.  Zdjęcie  szlifu  poprzecznego  przewodu  nadprzewodniko- 
wego 


i zaprasowanych  w otoczkę  (matrycę)  z normalnego 
metalu,  najczęściej  miedzianą  (rys.  2).  Mała  grubość 
i skręcenie  drutów  nadprzewodzących  zapobiegają 
rozprzestrzeniającym  się  lawinowo  w drucie  skokom 
strumienia  magnetycznego.  Takie  nagłe  zmiany  stru- 
mienia powodują  wydzielanie  się  ciepła,  mogłyby 
więc  doprowadzić  do  lokalnego  przegrzania  prze- 
wodu i do  utraty  jego  nadprzewodnictwa.  Normalny 
metal  matrycy  odgrywa  rolę  termicznego  i elektrycz- 
nego stabilizatora  chroniącego  przewód  przed  skut- 
kami lokalnego  przegrzania.  Materiał  matrycy  ma 
znacznie  lepsze  przewodnictwo  cieplne  i elektryczne 
niż  stop  nadprzew-odnikowy  w stanie  normalnym, 
lepiej  odprowadza  ciepło  do  kąpieli  helowej,  a także 
hamuje  gwałtowne  przeskoki  strumienia  magnetycz- 
nego. 

Ze  stopu  Nb-Ti  wykonuje  się  uzwojenia  dla  elek- 
tromagnesów wytwarzających  pola  o indukcji  do  8 T. 
Do  wytwarzania  silniejszych  pól  (do  17T)  sporządza 
się  elektromagnesy  nawinięte  z taśmy  >jb  z drutu, 
związek  w skład  których  wchodzi  związek  międzymetaliczny 
Nb3Sn  Nb3Sn  wykazujący  własności  nadprzewodzące.  Ma 
on  następujące  parametry  krytyczne : (4,2  K)  = 

= 160  kA/cm,  Tk  = 18  K,  jk  (4,2  K)  = 105  A/cm2 
w polu  ok.  110  kA/cm.  Związek  międzymetaliczny 
Nb3Sn  jest  kruchy  i nie  daje  się  walcować  ani  wy- 
ciągać w druty.  Przewody  z NbsSn  wytwarza  się  me- 
todą dyfuzji  termicznej  cyny  w odpowiednio  przy- 
gotowane druty  lub  taśmy  niobowe. 

Podobne  własności  nadprzewodzące  i mechaniczne 
jak  Nb3Sn  wykazują  związki  V3Ga  i V3Si.  Rozwój 
technologii  wytwarzania  stopów  nadprzewodzących 
może  przynieść  nowe  materiały  na  uzwojenia:  szcze- 
gólnie obiecującym  materiałem  wydaje  się  być  stop 


potrójny  Nbo,79  (AI0p73  Geo.27)o,2i  o parametrach  kry- 
tycznych Hk2  (4,2  K)  = 220  kA/cm,  Tk  = 23  K. 


indukcja  magnetyczna  B0 

Rys.  3.  Zależność  strat  energetycznych  w nadprzewodzącej  cewce 
z Nb-Ti  od  amplitudy  B0  przemiennego  pola  magnetycznego 
o różnej  częstości.  Objętość  uzwojeń  85  cm3 


W projektach  zastosowań  twardych  nadprzewod- 
ników w urządzeniach  pracujących  w zmiennych  po.- 
lach  magnetycznych  należy  liczyć  się  ze  stratami  ener- 
getycznymi w tych  nadprzewodnikach.  Straty  te  są 
wynikiem  ruchu  strumienia  magnetycznego  i nieod- 
wracalności procesu  namagnesowania  (histereza  ma- 
gnetyczna) nadprzewodnika  (rys.  3). 


Laboratoryjne  i przemysłowe  zastosowanie 
elektromagnesów  nadprzewodnikowych 

Elektromagnesy  nadprzewodnikowe  stanowią  obec- 
nie powszechne  wyposażenie  laboratoriów  nauko- 
wych, w których  bada  się  własności  substancji  w sil- 
nych polach  magnetycznych.  Elektromagnesy  o dużej 
jednorodności  pola  stanowią  istotną  część  aparatury 
do  rezonansu  jądrowego  zastępując  stare,  ciężkie 
elektromagnesy  rdzeniowe,  wymagające  w dodatku 
bardzo  stabilnych,  a więc  drogich  źródeł  zasilania 
(stabilność  pola  w elektromagnesach  nadprzewodni- 
kowych uzyskuje  się  w krótkozwartym  reżimie  pracy, 
a wysoką  jednorodność  pola  — przez  specjalne  na- 
winięcie). 

W mikroskopach  elektronowych  można  stosować 
soczewki  magnetyczne  z uzwojeniem  nadprzewodzą- 
cym, co  pozwala  uzyskać  większą  zdolność  rozdziel- 
czą niż  przy  użyciu  zwykłych  soczewek  magnetycz- 
nych. Elektromagnesy  nadprzewodnikowe  wielkich 
rozmiarów  są  wykorzystane  w fizyce  jądrowej  do 
komór  pęcherzykowych.  Np.  magnes  wodorowej  ko- 
mory pęcherzykowej  w Argonne  (USA)  ma  4,8  m 
średnicy  wewnętrznej,  wytwarza  pole  o indukcji  1,8  T 
i zawiera  45  t uzwojeń  nadprzewodzących.  W labora- 
toriach fizyki  wysokich  energii  buduje  się  także  akce- 
leratory cząstek  (np.  synchrotrony)  z dużymi  elek- 
tromagnesami nadprzewodnikowymi. 

Elektromagnesy  nadprzewodnikowe  używane  są 
również  do  badań  plazmy  i,  być  może,  znajdą  szersze 
zastosowanie  w generatorach  magnetohydrodynamicz- 
nych,  jeśli  rozpowszechnią  się  one  w energetyce. 
W energetyce  elektromagnesy  nadprzewodnikowe 
mogą  także  służyć  do  akumulacji  energii  (w  postaci 
energii  pola  magnetycznego),  która  byłaby  wyzyskana 
w godzinach  szczytowego  zapotrzebowania.  Solenoid 
nadprzewodzący  o współczynniku  samoindukcji  L 
może  zmagazynować  w swej  objętości  energię  mag- 
netyczną równą  V2  LP,  gdzie /jest  natężeniem  prądu 


aparatura 
do  rezonansu 

jądrowego 


mikroskop 

elektronowy 


badanie 

plazmy 


akumulacja 

energii 
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krążącego  bez  strat  w uzwojeniach  krótkozwartego 
solenoidu.  Zmagazynowaną  energię  pola  magnetycz- 
nego można  by  w godzinach  szczytu  przetworzyć  na 
energię  prądu  elektrycznego.. 

Obecnie  jednak  powszechną  uwagę  skupiają  dwie 
inne  możliwości  szerokiego,  przemysłowego  zastoso- 
wania elektromagnesów  nadprzewodnikowych : w ma- 
szynach elektrycznych  (silnikach  i prądnicach)  i w 
lewitujących  (unoszących  się)  pociągach. 


Maszyny  elektryczne 

Pierwszymi  maszynami  elektrycznymi,  w których  za- 
stosowano uzwojenia  nadorzewodnikowe,  były  sil- 
nia szyny  na  niki  jednobiegunowe,  lub  jednakobiegunowe,  zwane 
prąd  stały  też  unipolarnymi  lub  homopolarnymi  (rys.  4).  Ru- 


przewody  prądowe 

elektromagnesu  nadprzewodnikowego 


wlew  ciekłego  helu 

odzysk  helu 
gazowego 

przewody 
doprowadzające 
i odprowadzające 
prąd  do  i od  wirnika 

V 


wirnik 


odparowanie  azotu 


kriostat  z magnesem 
nadprzewodnikowym 

(stojan) 

ściana  zewnętrzna 
kriosłatu 


^ cjekły  azot 
^ (płaszcz  azotowy) 


próżnia 


^ciekły  hel 
v magnes 


I nadprzewodnikowy 


^Tfontakty  ślizgowe 
(szczotki) 


tarcze  przewodzące 
Rys.  4.  Silnik  unipolarny 


chomą  częścią  takiego  silnika  jest  okrągła  tarcza  me- 
talowa (albo  bęben)  wirująca  w stałym  polu  magne- 
tycznym wytwarzanym  przez  elektromagnes  nadprze- 
wodnikowy. Siła  napędzająca  wirnik  jest  siłą  oddzia- 
ływania pola  magnetycznego  na  stały  prąd  elektrycz- 
ny płynący  przez  tarczę  wirnika  w kierunku  radialnym 
(albo  w bębnie  po  tworzącej).  Prąd  do  wirnika  dopro- 
wadzają kontakty  ślizgowe. 

Silniki  jednobiegunowe  z uzwojeniem  nadprzewod- 
nikowym odznaczają  się  prostotą  konstrukcji  i ma- 
łymi rozmiarami  przy  stosunkowo  dużej  mocy.  Straty 
energetyczne  są  mniejsze  niż  w silnikach  konwencjo- 
nalnych. Trudnym  zagadnieniem  technicznym  jest  tu 
jednak  problem  kontaktów  ślizgowych,  doprowa- 
dzających prąd  o dużym  natężenki,  gdyż  są  to  silniki 
niskonapięciowe.  Dla  zwiększenia  napięcia  (i  zmniej- 
szenia natężenia  prądu)  stosuje  się  układ  wielu  tarcz 
połączonych  w szereg.  Każdy  silnik  może  być  także 
prądnicą,  jeśli  z kontaktów  będziemy  pobierać  prąd 
w zamian  za  energię  mechaniczną  poruszającą  wirnik. 

Nadprzewodnikowe  maszyny  jednobiegunowe  znaj- 
dują zastosowanie  w przemyśle  chemicznym  do  elek- 
trolizy, w układach  napędzających  pompy  wodne, 
walcarki  lub  młyny  w przemyśle  hutniczym,  górni- 
czym, papierniczym;  dzięki  dobremu  stosunkowi  mo- 
cy do  ciężaru  mogą  także  służyć  do  napędu  statków 
i okrętów. 

maszyny  Nadprzewodzące  uzwojenia  można  także  stosować 
na  prąd  w magneśnicach  maszyn  prądu  przemiennego.  Wirnik 
przemienny  synchronicznej  prądnicy  z uzwojeniem  nadprzewo- 
dzącym, zasilany  prądem  stałym,  wytwarza  stałe  po- 
le magnetyczne,  wirujące  wewnątrz  nieruchomego 


twornika*  (stojana)  i wzbudza  w jego  uzwojeniach  prąd 
przemienny.  Przy  tej  samej  prędkości  wirowania  moc 
prądnicy  jest  proporcjonalna  do  indukcji  magnetycz- 
nej w szczelinie  między  wirnikiem  i stojanem.  W kon- 
wencjonalnych prądnicach  indukcja  sięga  1 T;  dal- 
sze jej  zwiększanie  jest  utrudnione  z powodu  nasyce- 
nia żelaza.  Nadprzewodzące  uzwojenia  wirnika 
umożliwiają  zwiększenie  indukcji  do  4 T bez  zastoso- 
wania żelaznego  rdzenia,  a więc  przy  zmniejszonych 
rozmiarach  i masie  wirnika.  Uzwojenia  stojana  takiej 
prądnicy  wykonuje  się  jednak  z normalnego  metalu, 
tj.  z miedzi,  gdyż  zastosowanie  nadprzewodzących 
uzwojeń  pracujących  w silnym  zmiennym  polu  ma- 
gnetycznym byłoby  związane  ze  znacznymi  stratami 
energetycznymi  w tych  uzwojeniach,  porównywalny- 
mi ze  stratami  w uzwojeniach  miedzianych. 


Unoszone  magnetycznie  pociągi 
(magnetoplany) 

Intensywne  prace  badawcze  dotyczące  pociągów  uno- 
szonych magnetycznie  prowadzą  kraje,  w których 
sprawa  szybkiego  transportu  osób  jest  palącym  za- 
gadnieniem (Japonia,  USA,  RFN).  Prędkość,  jaką 
osiągają  najszybsze  zwyczajne  pociągi,  nie  przekracza 
na  ogół  250  km/h. 

Czynnikami  ograniczającymi  szybkość  pociągu  są. 
wibracje  i słaba  przyczepność  kół  do  szyn.  Tor,  po 
którym  jedzie  szybki  pociąg,  musi  spełniać  ba*rdzo 
wysokie  wymagania  dotyczące  jakości.  Pociąg  uno- 
szący się  nad  torem  pozwala  ominąć  te  trudności. 
Obecnie  przeprowadzane  są  próby  z doświadczalnymi 
pojazdami,  unoszonymi  magnetycznie. 

Przy  małych  prędkościach  pociąg  jedzie  po  torze, 
ale  już  przy  prędkości  90  km/h  unosi  się  nad  torem 


Rys.  5.  Zależność  siły  unoszenia  od  prędkości  magnctoplanu 
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Rys.  6.  Przekrój  poprzeczny  magnetoplanu 
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na  wysokości  około  30  cm  (rys.  5).  W podwoziu  po- 
ciągu umieszczone  są  elektromagnesy  nadprzewodni- 
kowe, których  pole  magnetyczne,  poruszając  się  wraz 
z pociągiem,  wzbudza  prądy  wirowe  w metalowych 
płytach  (lub  cewkach)  ułożonych  na  torze.  Pole  ma- 
gnetyczne tych  prądów  jest  lustrzanym  odbiciem  pola 
elektromagnesów.  Siła  odpychania  między  tymi  po- 
lami jest  siłą  unoszącą  pojazd  (rys.  6). 
silnik  Siłę  napędową,  poruszającą  pociąg  do  przodu,  do- 
li ni  owy  starcza  liniowy  synchroniczny  silnik  elektryczny, 
synchro-  Silnik  ten  jest  właściwie  zwykłym  silnikiem  synchro- 
niczny nicznym  ze  stojanem  rozwiniętym  w linię.  Rolę  jego 
wirnika  spełniają  dodatkowe  boczne  elektromagnesy 
nadprzewodnikowe,  umocowane  sztywno  w pojeździe. 
Stojan  silnika  to  użwojenia  miedziane  lub  aluminio- 
we, ułożone  wzdłuż  torii  pojazdu.  Prąd  elektryczny 
zasilający  silnik  jest  włączany  synchronicznie  z ru- 
chem pojazdu  w obwód  coraz  to  nowych  segmentów 
stojana  znajdujących  się  nieco  przed  pojazdem  i wy- 
łączanych przy  mijaniu  danego  segmentu  przez  po- 
jazd. Biegnące  pole  magnetyczne  wytwarzane  przez 
prąd  w tych  segmentach  pociąga  za  sobą  elektromag- 
nesy boczne  pojazdu,  czyli  wirnik  silnika.  W ten  spo- 
sób pojazd  jest  prowadzony  przez  biegnącą  falę  mag- 
netyczną. Elektromagnesy  silnika,  oprócz  funkcji 
napędowej,  pełnią  jeszcze  funkcję  stabilizatorów,  tj. 
utrzymują  pojazd  nad  środkiem  toru. 

Magneśnicę  silnika  i elektromagnesy  nośne  pojazdu 
zasila  prądnica  umieszczona  w pojeździe  i napędzana 
np.  turbiną  spalinową.  Doświadczalny  pojazd  osiąga 
prędkość  500  km/h,  zabiera  100  pasażerów  z bagażem 
(ok.  10 1)  i waży  35 1 z pełnym  wyposażeniem  i zapasem 
paliwa  na  dwie  godziny  jazdy.  Przy  maksymalnej 
prędkości  pojazd  pobiera  moc  rzędu  kilku  MW;  jest 
ona  w głównej  mierze  zużywana  na  pokonanie  opo- 
rów aerodynamicznych  (ii.  62,  tabl.  16). 


Nadprzewodnikowe  linie 
przesyłowe  (kable) 


Kable  nadprzewodnikowe  mogą  zastąpić  napowietrz- 
ne linie  przesyłowe.  Przesyłanie  wielkich  mocy  nor- 
malnymi liniami  napowietrznymi  wymaga  stosowania 
wysokich  napięć,  lecz  zwiększanie  napięcia  wiąże  się 
ze  wzrostem  strat  energetycznych  na  upływ  i ulot. 

Kable  nadprzewodnikowe  stwarzają  możliwość 
przysyłania  bez  strat  prądu  stałego  lub  przemiennego 
o dużym  natężeniu.  Należy  tylko  liczyć  się  z wydatko- 
waniem energii  na  utrzymywanie  kabla  w niskiej  tem- 
peraturze. Straty  na  odbieranie  doprowadzonego 
z zewnątrz  ciepła  mogą  wynosić  ok.  10  W na  1 km 
długości  kabla. 

kable  prądu  Kable  prądu  stałego  można  wykonać  z twardego 
stałego  nadprzewodnika  II  typu.  Ze  względu  na  koszt  chło- 
dzenia kabla,  jego  zastosowanie  może  być  opłacalne 
dopiero  przy  przesyłaniu  bardzo  dużych  mocy  (po- 
nad 100  MW).  Przy  odpowiednim  doborze  nadprze- 
wodnika, obciążenie  kabla  prądem  stałym  mogłoby 
wynosić  ok.  105  A/cm2. 

Nadprzewodnikowy  kabel  prądu  stałego  włączony 
w istniejący  system  energetyczny  prądu  przemiennego 
wymagałby  zastosowania  przetworników  na  obu 
swych  końcach. 

kable  prądu  Do  przesyłania  bez  strat  prądu  przemiennego  można 
przemień-  użyć  kabla  z nadprzewodnika  I typu  lub  doskonałego 
nego  nadprzewodnika  II  typu  pod  warunkiem,  że  amplitu- 
da natężenia  pola  wytworzonego  przez  prąd  w kablu 
nie  przekroczy  wartości  Hkx  (rys.  7).  Ponieważ  kabel 
musi  pracować  w temperaturze  nie  niższej  niż  4,2  K 
(dalsze  obniżanie  temperatury  wiąże  się  z dużymi 
kłopotami  technicznymi),  mogą  być  użyte  tylko  dwa 
metale:  ołów  i niob  (stopy  na  ogół  mają  małe  war- 
tości Hkl  i trudno  z nich  wykonać  doskonały  nad- 
przewodnik). Prąd  przemienny  w kablu  z nadprze- 
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wodnika  I typu  popłynie  tylko  po  jego  powierzchni, 
dlatego  w takich  kablach  najkorzystniejsze  byłoby 
zastosowanie  cienkiej  warstwy  nadprzewodnika  na- 
niesionej na  nienadprze wodzące  podłoże. 

zewnętrzny  płaszcz 


Rys.  7.  Przekrój  poprzeczny  kabla  nadprzewodnikowego 


Ostatnio  jednak  pojawiają  się  projekty  zastosowa- 
nia w kablach  na  trójfazowy  prąd  przemienny  nad- 
przewodników twardych,  np.  Nb-Ti  lub  Nb3Sn,  gdyż 
kable  z nich  wykonane  bardziej  nadają  się  do  przesy- 
łania dużych  mocy,  a straty  nie  powinny  przekraczać 
0,5%  (kable  pracują  w niezbyt  silnym  polu  własnym). 
Można  by  więc  osiągnąć  sprawność  równą  99,5%, 
czyli  znacznie  większą  niż  w normalnych  liniach  prze- 
syłowych (95%). 

Chłodzenie  kabli  nadprzewodnikowych  o dużej 
długości  jest  jednak  trudnym  problemem  technicz- 
nym, dlatego  wprowadzenie  ich  do  systemów  energe- 
tycznych nie  będzie  chyba  sprawą  najbliższej  przysz- 
łości. Obecnie  stosuje  się  je  raczej  w zamkniętych 
układach  energetycznych,  np.  na  statkach. 


Zastosowanie  nadprzewodników 
w technice  wielkich  częstości 


Opór  powierzchniowy  nadprzewodników 

W stanie  Meissnera  (tzn.  w stanie  czysto  nadprzewo- 
dzącym) nadprzewodnik  w szybkozmiennym  polu 
elektromagnetycznym  wykazuje  różny  od  zera  opór 
powierzchniowy,  gdyż  w T > 0 oprócz  par  Coopera 
istnieją  w nadprzewodniku  elektrony  normalne,  które 
rozpraszają  energię,  podobnie  jak  w metalach  normal- 
nych. Jednak  w nadprzewodnikach  głębokość  wnika- 
nia S pola  elektromagnetycznego  daleko  od  7*  jest 
dużo  mniejsza  niż  grubość  warstwy  naskórkowości 
£skin  w normalnym  metalu  przy  wysokich  częstościach, 
poza  tym  udział  elektronów  normalnych  szybko  ma- 
leje ze  spadkiem  temperatury  poniżej  7*;  oba  te  czyn- 
niki powodują,  że  opór  powierzchniowy  nadprze- 
wodników jest  znacznie  mniejszy  niż  opór  powierz- 
chniowy normalnych  metali. 

Przy  bardzo  wielkich  częstościach,  gdy  energia 
fotonów  pola  elektromagnetycznego  przekracza  sze- 
rokość przerwy  energetycznej  (, hv  ^ 2 A),  opór  po- 
wierzchniowy zwiększa  się  w wyniku  pochłaniania 
energii  pola  na  rozrywanie  par  Coopera  i wzbudzenie 
elektronów  ponad  przerwę  energetyczną.  Rys.  8 
przedstawia  zależność  oporu  powierzchniowego  nad- 


chfodzenie 

kabli 


zależność 
oporu  od 
częstości 
i tempera- 
tury 


przewodnika  od  częstości  pola  elektromagnetyczne- 
go v i od  zredukowanej  temperatury  t — TjTk.  Po- 
nieważ w temperaturze  T = 0 szerokość  przemy 
2A  (0)  = 3,5/c 7* , opór  powierzchniowy  nadprze- 


energia  w jednostkach  kl \ 

Rys.  8.  Opór  powierzchniowy  nadprzewodnika  I typu  (Al) 
w zmiennym  polu  elektromagnetycznym;  Rs  oznacza  opór  po- 
wierzchniowy w stanie  nadprzewodzącym,  Rn  — w stanie  nor- 
malnym 


wodnika  z 7*  s 10  K.  będzie  różny  od  zera  dopiero 
przy  v > 1012Hz.  . , 

Nadprzewodniki  II  typu  w stanie  mieszanym  albo 
nadprzewodniki  niedoskonale,  w które  wnika  pole 
magnetyczne  począwszy  od  niewielkich  wartości  na- 
tężeń, wykazują  w zmiennym  polu  straty  na  histerezę 
i na  prądy  wirowe.  Aby  uniknąć  tych  strat,  w tech- 
nice  wysokich  częstości  stosuje  się  tylko  czyste  nad- 
przewodniki o możliwie  wysokiej  wartości  tempera- 
tury krytycznej  Tk.  Najczęściej  są  to:  niob  7*  = 9 K 
i ołów  Tk  = 7,2  K. 


Przyspieszanie  liniowe 

Nadprzewodnikowe  wnęki  rezonansowe  znajdują 
obecnie  zastosowanie  w liniowych  akceleratorach  na- 
ładowanych cząstek  (np.  elektronów).  Akcelerator 
liniowy  składa  się  z wielu  komór  rezonansowych  po- 
łączonych w szereg  (rys.  9).  Pole  elektromagnetyczne 
w każdej  z wnęk  zmienia  się  okresowo,  a ^ faza  drgań 
pola  w sąsiednich  wnękach  różni  się  o 7i/2.  Nałado- 
wana cząstka,  jeśli  dostanie  się  do  kanału  akcelerato- 
ra, będzie  poddawana  w każdej  wnęce  działaniu  pola  akcelerator 
elektrycznego.  Aby  to  pole  mogło  zwiększać  energię  nadprze- 
cząstki,  musi  ona  trafiać  do  wnęki  w odpowiedniej  wodni ^owy 


linie  pola  elektrycznego 


skupiska 


przyspieszonych  cząstek 

Rys.  9.  Schemat  nadprzewodnikowego  liniowego  akceleratora 

fazie  drgań  pola,  czyli  czas  przelotu  cząstki  od  jednej 
wnęki  do  drugiej  musi  się  równać  1U  okresu  drgań. 

Ponieważ  trudno  jest  zwiększać  stopniowo  często- 
ści drgań  pola  ze  wzrostem  szybkości  cząstki,  działa- 
niu pola  poddawane  są  cząstki  już  przyśpieszone  do 
prędkości  bliskiej  prędkości  światła.  Działanie  akce- 
leratora sprowadza  się  wtedy  do  zwiększania  energii 
cząstki  przez  zwiększenie  masy  relatywistycznej. 


Zastosowanie  doskonałego 
diamagnetyzmu 


Łożyska  beztarciowe 


anomalne 

zjawisko 

naskórko- 

wości 


Wnęki  rezonansowe  wysokiej  dobroci 

Dobrocią  wnęki  rezonansowej  nazywamy  stosunek 
zmagazynowanej  w niej  energii  pola  elektromagne- 
tycznego w ciągu  jednego  cyklu  do  energii  rozpro- 
szonej na  ścianach  wnęki.  Wnęka  miedziana  przy 
częstościach  rzędu  1 GHz  może  w normalnej  tempe- 
raturze mieć  dobroć  Q = 5 104.  Oziębienie  wnęki  do 
temperatury  ciekłego  helu,  chociaż  zmniejsza  opor 
właściwy  czystej  miedzi  kilkaset  razy,  jej  dobroć 
zwiększy  tylko  kilkakrotnie  z powodu  anomalnego 
zjawiska  naskórkowości.  Zjawisko  to  występuje  wte- 
dy, gdy  średnia  długość  / drogi  swobodnej  elektronu, 
od* której  zależy  przewodnictwo  metalu,  staje  się  więk- 
sza od  grubości  warstwy  naskórkowości  4kin  (jest  to 
warstwa,  w którą  wnika  zmienne  pole  elektromagne- 
tyczne). Wtedy  elektrony  poruszające  się  w głąb  me- 
talu nie  mogą  być  przez  pole  przyśpieszone  na  całej 
swej  drodze  między  kolejnymi  zderzeniami  i dla  prze- 
wodnictwa są  właściwie  stracone.  Anomalne  zjawisko 
naskórkowości  ogranicza  więc  zwiększanie  się  prze* 
wodnictwa  powierzchniowego  metali  przy  oziębianiu. 

Inaczej  sprawa  przedstawia  się  w przypadku  ścia- 
nek z nadprzewodnika.  Opór  powierzchniowy,  cho- 
ciaż różny  od  zera  przy  wysokich  częstościach,  jest 
jednak  znacznie  mniejszy  niż  w normalnych  metalach, 
straty  energetyczne  są  nieznaczne  i dobroć  wnęki 
może  sięgać  5-1 09  przy  tej  samej  częstości  1 GHz. 
Dobroć  wnęki  jest  funkcją  częstości;  dla  metalu  nor- 
malnego Q ~ dla  nadprzewodnika  Q ~ l/v.  Jako 
zależność  materiału  na  ściany  wnęki  używa  się  najczęściej  oło- 
dobroci  od  wiu  lub  niobu,  na  ogół  w postaci  cienkiej  warstwy 
częstości  naniesionej  na  miedziane  podłoże. 


Nadprzewodnikowe  łożyska  beztarciowe  działają  na 
zasadzie  unoszenia  nadprzewodnika  przez  pole  ma- 
gnetyczne. Siła  działająca  na  jednostkę  powierzchni 
nadprzewodnika  ze  strony  pola  magnetycznego,  czyli 
ciśnienie  magnetyczne,  wynosi  P = llzUoH*>  H 

natężenie  pola  przy  powierzchni  nadprzewodnika. 

Natężenie  to  nie  może  nigdzie  przekraczać  wartości 
Hki-  Stąd  maksymalna  wartość  P w wypadku  nad- 
przewodnika wykonanego  np.  z niobu  może  wynosić 
15  000  N/m2  w T = 0 lub  11  000  N/m2  w T = 4,2  K. 

Beztarciowe  łożyska  można  by  zastosować  w nad-  nadprzewod- 
przewodnikowych  maszynach  elektrycznych,  np.  mikowy 
w generatorach  prądu  przemiennego.  Dotychczas  żyroskop 
jednak  łożyska  te  znalazły  zastosowanie  jedynie  w 
nadprzewodnikowym  żyroskopie.  Żyroskop  taki  jest 
to  kula  z nadprzewodzącego  niobu  podtrzymywana 
w próżni  przez  pole  magnetyczne  prądów  niezanika- 
jących,  krążących  w dwóch  nadprzewodzących  pier- 
ścieniach. Kula  wiruje  z prędkością  kątową  kilkuset 
obrotów  na  minutę,  praktycznie  bez  strat  energii. 

Oś  obrotu  kuli  można  obserwować  przy  pomocy 
przyrządów  optycznych.  W ruch  obrotowy 
nadprzewodzącą  kulę  wprowadza  się  stycznymi  do 
jej  powierzchni  strumieniami  chłodnego  gazowego 
helu.  Po  nadaniu  kuli  odpowiedniej  prędkości  kąto- 
wej przestrzeń,  gdzie  wiruje  kula,  odpompowuje  się 
do  wysokiej  próżni. 

Ekrany  magnetyczne 

Ponieważ  ani  stałe,  ani  zmienne  pole  magnetyczne 
nie  wnika  w nadprzewodnik  (z  wyjątkiem  cienkiej 


warstwy  powierzchniowej),  można  w nadprzewodzą- 
cej osłonie  utrzymać  przestrzeń  wolną  od  pól  magne- 
tycznych. Najkorzystniejszym  kształtem  dla  takiej 
osłony  (ekranu)  jest  kształt  elipsoidalny,  gdyż  wtedy 
linie  sił  pola  łagodnie  opływają  przeszkodę.  Jeśli  ekran 
nadprzewodnikowy  ma  osłaniać  przestrzeń  roboczą 
od  stałego  pola  magnetycznego,  przed  jego  oziębie- 
niem do  T < Tk  należy  w miejscu,  gdzie  następuje 
oziębianie,  skompensować  możliwie  najdokładniej 
zewnętrzne  pole  magnetyczne,  aby  nie  spowodować 
jego  zamrożenia  wewnątrz  ekranu. 

Nadprzewodnikowe  ekrany  stosuje  się  najczęściej 
do  osłaniania  niskotemperaturowych  części  czułych 
przewodów  pomiarowych  od  wpływu  zewnętrznych 
pól  elektromagnetycznych. 


Zastosowania  w elektronice, 
technice  pomiarowej 
i obliczeniowej 


Galwanometry  i woltomierze 

Pomiar  słabych  napięć  stałych  konwencjonalnymi 
przyrządami  sprawia  wiele  kłopotów  z powodu  sił 
termoelektrycznych,  powstających  w obwodzie  pomia- 
rowym, oraz  szumów  cieplnych  w przyrządach  po- 
miarowych, ograniczających  ich  czułość.  Zastosowa- 
nie nadprzewodników  pozwala  na  uniknięcie  tych 
przeszkód  (siły  termoelektryczne  w stanie  nadprze- 
wodzącym są  równe  zeru,  a szumy  cieplne  w tempera- 
turze ciekłego  helu  są  bardzo  małe).  W przypadku 
zmiennych  napięć,  osłonięcie  niskotemperaturowej 
części  urządzenia  pomiarowego  ekranem  nadprze- 
wodnikowym i zastosowanie  nadprzewodnikowych 
transformatorów  wzmacniających  sygnał  umożliwia 
zmniejszenie  szumów  do  poziomu  nieosiągalnego  tra- 
dycyjnymi metodami. 

galwanometr  Pierwszą  próbą  zastosowania  nadprzewodników 
2 nadprze-  w przyrządach  pomiarowych  było  skonstruowanie 
wodzącą  w 1952  r.  galwanometru  z nadprzewodnikową  cewką, 
cewką  Dzięki  temu  można  było  zmniejszyć  opór  całego  ob- 
wodu do  10-7H.  Aby  przy  tak  małym  oporze  R stała 
czasowa  r przyrządu  nie  przekraczała  sensownej  war- 
tości (t  = LetlR ),  indukcyjność  efektywna  (Let)  ob- 
wodu powinna  być  również  bardzo  mała.  Cewka  mia- 
ła więc  tylko  jeden  zwój,  a indukcja  stałego  pola  gal- 
wanometru wynosiła  zaledwie  10“®  T.  Galwanometr 
miał  stałą  czasową  z = 15  s,  a czułość  prądowa  wy- 
nosiła 10“ 5 A,  co  odpowiada  czułości  napięciowej 
10-7  Cl- 15-5  A = 10-12  V.  Dla  porównania  przytoczy- 
my, że  najczulsze  galwanometry  konwencjonalne  przy 
takiej  samej  stałej  czasowej  mają  czułość  napięciową 
rzędu  10“8  V. 

nadprzewod-  Inny  typ  nadprzewodnikowego  urządzenia  do  po- 
rt iko  wy  niiaru  bardzo  słabych  napięć  stałych  skonstruowano 
przerywacz  w 1955  r.  Jest  to  nadprzewodnikowy  przerywacz  (mo- 
dulator) w niskoomowym  obwodzie  mierzonego  na- 
pięcia, działający  podobnie,  jak  mechaniczny  wibra- 
tor (czoper)  w konwencjonalnych  miernikach  napię- 
cia stałego.  Przerywaczem  jest  cienki  drucik  nadprze- 
wodzący, przechodzący  okresowo  w stan  normalny 
(czyli  przerywający  obwód)  pod  wpływem  pola  mag- 
netycznego, zmieniającego  się  sinusoidalnie  z czę- 
stością 800  Hz.  Działanie  przerywacza  sprowadza  się 
do  zamiany  mierzonego  napięcia  stałego  na  napięcie 
pulsujące,  które  po  wzmocnieniu  nadprzewodniko- 
wymi transformatorami  można  mierzyć  normalnymi 
przyrządami.  Poziom  szumów  własnych  przyrządu 
udało  się  zmniejszyć  do  10-n  V.  Stała  przyrządu  jest 
rzędu  1 s.  Przyrząd  nadaje  się  do  pomiaru  słabych 
sił  elektromagnetycznych  ze  źródeł  z małym  oporem 
wewnętrznym  lub  do  pomiaru  małych  oporów  (opór 
reszty  obwodu,  oprócz  przerywacza,  musi  być  znacz- 
nie mniejszy  od  oporu  przerywacza  w stanie  normal- 
nym). 
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Stosunkowo  niedawno  (1967  r.)  zbudowano  przy- 
rząd z wibrującymi  cewkami  do  pomiaru  napięć  sta- 
łych (rys.  10)  o czułości  do  10~13  V.  Seryjna  wersja 

do  mikrowoftomierza 
napięcia  zmiennego  do  oscylatora 
piezokwarcowego 


pskowolto- 
mierz 
z wibrujący 
cewkami 


próżnia 


__płaszcz  próżniowy 
__,kamerton 
piezokwarc 
zawieszenia  cewek 


ekran  nadprzewodzący 


cewki  pomiarowe 
obwodu  wyjściowego 

\ cewki  drgające 
obwodu  wejściowego 


| do  źródła  mierzonego 
napięcia  stałego 


Rys.  10.  Schemat  nadprzewodnikowego  pikowoltomierza  na  na- 
pięcie stałe,  z wibrującymi  cewkami 


tego  przyrządu  (dostępna  w handlu)  ma  czułość 
10"12  V i stałą  czasową  rzędu  kilku  s.  Para  cewek  nad- 
przewodzących połączona  ze  źródłem  mierzonego 
napięcia  stałego  jest  pobudzona  do  drgań  przez  ge- 
neratory piezokwarcowe,  oscyluje  z częstością  1 kHz 
między  nieruchomymi  nadprzewodzącymi  cewkami 
pomiarowymi  i wzbudza  w nich  napięcie  przemienne, 
a to  zaś  po  wzmocnieniu  może  być  mierzone  kon- 
wencjonalnymi metodami. 

Obecnie  bardzo  często  do  pomiarów  bardzo  sła- 
bych napięć  używa  się  tzw.  nadprzewodnikowych 
interferometrów  kwantowych,  których  działanie 
opiera  się  na  zjawiskach  Josephsona.  Urządzenia  te 
wykorzystuje  się  również  przy  pomiarach  słabych 
zmian  pola  magnetycznego,  dlatego  woltomierze 
działające  na  tej  zasadzie  będą  omówione  łącznie 
z magnetometrami. 


Magnetometry 

Do  pomiaru  bardzo  małych  zmian  pola  magnetycz-  nac$nrze- 
nego  można  wyzyskać  nadprzewodnikowy  interfero-  wodnikowy 
metr  kwantowy  w kształcie  pierścienia  z dwoma  zlą-  interferometr 
czarni  Josephsona.  Zmiany  pola  powodują  zmiany  kwantowy 
prądu  krytycznego  w pierścieniu,  a więc  i zmiany  na-  z dwoma 
pięcia  na  nim,  te  zaś  łatwo  można  zmierzyć.  Taki  zf^czami 
przyrząd  umożliwia  wykrycie  zmian  indukcji  magne- 
tycznej rzędu  10-13  T.  Czułość  przyrządu  można  po- 
lepszyć przez  zastosowanie  transformatora  nadprze- 


transformator 


wzmocnienie  * Lj  L2 

Rys.  11.  Schemat  nadprzewodnikowego  interferometru  kwanto- 
wego z transformatorem  wzmacniającym 


wodnikowego  na  wejściu  (rys.  1 1).  Jeśli  zmiany  pola 
są  większe  niż  okres  zmian  krytycznego  natężenia 
prądu  dla  interferometru  kwantowego  (— ► Zjawiska 


nadprzewod- 
nikowy 
interferometr 
kwantowy 
z jednym 
złączem 


gradiometr 


zastosowanie 

magneto- 

metru 


tunelowe  w nadprzewodnikach),  to  pomiar  tych  zmian 
sprowadza  się  do  liczenia  okresów,  czyli  kwantów 
strumienia  magnetycznego  wchodzących  do  pier- 
ścienia lub  wychodzących  z niego.  Niektórym  bada- 
czom udało  się  takim  przyrządem  naliczyć  aż  2000 
oscylacji  krytycznego  natężenia  prądu. 

Opracowano  również  nadprzewodnikowy  interfero- 
metr kwantowy  z jednym  złączem,  który  pracuje  na 
prądzie  zmiennym  o częstości  radiowej.  Jego  czułość 
jest  tego  samego  rzędu,  co  interferometru  stałoprą- 
dowego  z podwójnym  złączem,  ale  umożliwia  on 
wzmocnienie  sygnału  wyjściowego  w temperaturze 
ciekłego  helu,  a więc  bez  zwiększania  poziomu  szu- 
mów. Wzmocnienie  następuje  przez  sprzężenie  inter- 
ferometru z obwodem  LC,  zanurzonym  w kąpieli 
helowej  (rys.  12).  W obwodzie  tym  płynie  prąd  /0 


Rys.  12.  Schemat  zmiennoprądowego  interferometru  kwantowego 


o częstości  rezonansowej.  Zmiany  strumienia  magne- 
tycznego w obrębie  pierścienia  interferometru  powo- 
dują zmiany  krytycznego  natężenia  prądu  pierście- 
nia i modulują  amplitudę  napięcia  w obwodzie  LC 
z okresem  modulacji  równym  zmianie  strumienia 
o 1 kwant.  Dla  wzmocnienia  sygnału  można  też  zasto- 
sować transformator  nadprzewodnikowy  na  wejściu. 

Odmianą  transformatora  nadprzewodnikowego 
jest  gradiometr  (rys.  13),  służący  do  pomiaru  bardzo 
małych  gradientów  pola  magnetycznego.  Gradiometr 


Rys.  13.  Schemat 
gradiometru 


składa  się  z dwu  jednakowych  cewek  nadprzewo- 
dzących, nawiniętych  w przeciwnych  kierunkach  i po- 
łączonych nadprzewodzącymi  przewodami.  Zmiany 
w czasie  jednorodnego  pola  magnetycznego  nie 
wzbudzają  w gradiometrze  prądu,  ponieważ  prądy 
z obu  cewek  kompensują  się  do  zera.  Różny  od  zera 
prąd  w obwodzie  cewek  popłynie  tylko  wówczas,  gdy 
zajdą  przestrzenne  zmiany  pola  magnetycznego.  Syg- 
nał z cewek  przekazuje  się  do  magnetometru  przez 
sprzężenie  indukcyjne. 

Czułe  magnetometry  służą  do  pomiarów  bardzo 
słabych  zmian  wielkości  magnetycznych.  Mierzy  się 
nimi  podatność  magnetyczną  ciał  w słabych  polach 
magnetycznych  albo  fluktuacje  podatności  magnetycz- 
nej nadprzewodników  w pobliżu  temperatury  prze- 
miany Tk.  Magnetometry  takie  można  stosować  do 
pomiaru  małych  przesunięć  w ciele  magnetycznym 
przy  wykrywaniu  fal  grawitacyjnych.  Podejmowano 
również  z ich  pomocą  próby  wykrycia  kwarków. 
Tego  typu  magnetometr  może  być  także  używany 
w medycynie  i biologii,  np.  do  wykonania  magneto- 
kardiogramu  (tzn.  do  rejestrowania  słabych  zmian 
pola  magnetycznego  wywołanych  pracą  serca)  lub 
do  badania  bioprądów  w żywych  organizmach  za  po- 
średnictwem wytwarzanych  przez  nie  pól  magne-' 
tycznych. 

Magnetometr  można  zamienić  na  woltomierz 
sprzęgając  go  indukcyjnie  z obwodem  mierzonego 
napięcia  (rys.  14).  Napięcie  Ux  wywoła  w obwodzie 


z oporem  R prąd  o natężeniu  /,  który  wytworzy 
w pętli  o indukcyjności  L strumień  magnetyczny  <J>. 
Strumień  <P  przenika  pierścień  magnetometru  i po- 


Rys.  14.  Schemat  woltomierza  nadprzewodnikowego 


woduje  zmianę  krytycznego  natężenia  prądu  pier- 
ścienia (/*),  a więc  zmianę  napięcia  na  pierścieniu  U0. 
Aby  stała  czasowa  przyrządu  była  możliwie  niewielka, 
pętla  powinna  mieć  małą  indukcyjność  (mało  zwo- 
jów). Jeśli  jest  tylko  jeden  zwój,  a czułość  magneto- 
metru jest  równa  dziesiątej  części  fluksonu  (10-16  Wb), 
to  przy  stałej  czasowej  1 s czułość  napięciowa  wynie- 
sie 10-16  V.  Zwykle  nie  udaje  się  osiągnąć  tej  czułości, 
gdyż  szum  napięciowy  na  oporze  R = Ljx  x 10-8  Q 
w temperaturze  T — 4,2  K wynosi  ok.  10~15  V. 


Generatory  a detektory 

Złącze  Josephsona  pod  stałym  napięciem  U gene- 
ruje monochromatyczne  i spójne  promieniowanie 
elektromagnetyczne  w zakresie  mikrofalowym  i w da- 
lekiej podczerwieni,  tj.  w przedziale  częstości  od  5 do 
1000  GHz.  Częstość  promieniowania  v zależy  od  na- 
pięcia ( v = 2 eU/h).  Największa  dotychczas  osiągnię- 
ta moc  promieniowania  wyniosła  10"9  W.  Przypusz- 
cza się  jednak,  że  będzie  można  uzyskać  10-7  W, 
a może  nawet  10~8  W.  Szerokość  linii  może  być 
mniejsza  niż  1 kHz  dla  częstości  10  GHz,  co  stanowi 
mniej  niż  10-7. 

Złącze  Josephsona  może  być  również  detektorem 
promieniowania.  Pochłaniane  promieniowanie  pro- 
wadzi do  wystąpienia  schodków  na  charakterystyce 
prądowo-napięciowej  złącza.  Taki  detektor  jest  rów- 
nocześnie częstościomierzem,  ponieważ  napięcia, 
przy  których  pojawiają  się  schodki,  wynoszą  U — 
= (nhvl2e)t  gdzie  n jest  liczbą  całkowitą.  Czułość 
złącza  dochodzi  do  10~10  W. 

Większą  czułość  (10-13  W dla  v — 70  GHz)  de- 
tektora uzyskuje  się  nie  przy  wyznaczaniu  charaktery- 
styki schodkowej,  lecz  przy  pomiarze  zmiany  maksy- 
malnego natężenia  prądu  Josephsona  pod  wpływem 


temperatura  T 

Rys.  15.  Zmiana  oporu  nadprzewodzącej  cyny  pod  wpływem 
nagrzania  (Rn  opór  w stanie  normalnym) 


promieniowania.  Promieniowanie  periodycznie  prze- 
rywa się  wirującą  przesłoną  i mierzy  się  zmiany  prądu 
miernikiem  czułym  na  fazę. 
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bolometr  Do  detekcji  promieniowania  może  służyć  również 
dp^zewod-  zwykłe  złącze  tunelowe  (-►  Zjawiska  tunelowe  w nad- 
nikowy  przewodnikach  — zjawiska  niestacjonarne),  a także 
zwykły  nadprzewodnikowy  bolometr  w postaci  ta- 
siemki z nadprzewodzącego  materiału.  Tasiemkę  na- 
leży utrzymywać  w temperaturze  odpowiadającej  po- 
łowie przedziału  przejścia  w stan  oporowy  (rys.  15). 
Pochłaniane  promieniowanie  powoduje  wzrost  tem- 
peratury bolometru,  a zatem  i wzrost  jego  oporu. 
Czułość  nadprzewodnikowego  bolometru  może  się- 
gać 10"12  W.  Posługiwanie  się  nim  jest  jednak  utrud- 
nione z powodu  konieczności  utrzymywania  stałej 
temperatury  w kriostacie  w bardzo  wąskim  prze- 
dziale (AT  a 0,001  K). 


Termometr  szumowy 

Szumy  napięciowe  na  oporze  omowym  są  funkcją 
temperatury,  można  je  więc  wyzyskać  do  celów  ter- 
mometrycznych.  Ponieważ  częstość  promieniowania 
Josephsona  jest  związana  z napięciem  na  złączu  za- 
leżnością hv  — 2 eU,  fluktuacje  napięciowe  będą  mo- 
dulować częstość  Josephsona  i wpływać  na  szerokość 
pasma  promieniowania.  Złącze  Josephsona  podłącza 
się  do  źródła  słabego  napięcia  U w szereg  z oporem  R. 
Fluktuacje  napięciowe  na  oporze  R w temperaturze 
T dają  rozmycie  częstości  promieniowania  Josephso- 
na: szerokość  pasma  promieniowania  emitowanego 
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Rys.  16.  Szkic  kriotronu:  a)  zwykłego,  b)  ze  złączem  Josephsona 


przez  złącze  jest  więc  proporcjonalna  do  temperatury 
w skali  bezwzględnej:  Av  = 47tkTR/q>0z,  gdzie  <p0 
jest  kwantem  strumienia  magnetycznego.  Termome- 
trem szumowym  wyznaczono  już  temperaturę  do 
20  mK,  a przypuszcza  się,  że  można  będzie  rozszerzyć 
zakres  do  1 mK. 


Wzorzec  jednostki  napięcia 

Schodkowa  charakterystyka  prądowo-napięciowa  złą- 
cza Josephsona  pobudzonego  promieniowaniem  elek- 
tromagnetycznym albo  stałym  polem  magnetycznym 
może  być  wykorzystana  do  ustalenia  wzorca  jednostki 
napięcia,  opartej  na  stałych  uniwersalnych:  ładunku 
elementarnym  e i stałej  Plancka  h.  Stosunek  tych 
stałych,  ejh , z innych  pomiarów,  nie  związanych  ze 
zjawiskiem  Josephsona,  jest  znany  z dokładnością 
10-6,  zaś  częstość  promieniowania  można  zmierzyć 
z dokładnością  do  ok.  10-8;  to  określa  nam  dokład- 
ność, z jaką  możemy  ustalić  jednostkę  napięcia. 
Doświadczalnie  stwierdzono,  że  stosunek  f//v  = 
= hj(2e)  nie  zależy  od:  materiału,  typu  złącza  (tunelo- 
we, punktowe  lub  inne),  temperatury,  natężenia  pola 
magnetycznego  lub  mocy  promieniowania,  numeru 
schodka  («),  ani  innych  ubocznych  czynników.  Ta 
właśnie  niezależność  od  jakichkolwiek  warunków  do- 
świadczenia predysponuje  złącze  Josephsona  do 
oparcia  na  nim  międzynarodowego  wzorca  jednostki 
napięcia.  Takie  wzorce  napięcia  są  już  stosowane 
w wielu  krajach;  w Polsce  opracowuje  się  taki  wzo- 
rzec na  zlecenie  Głównego  Urzędu  Jakości  i Miar. 


Elementy  maszyn  cyfrowych 

Na  możliwość  wyzyskania  nadprzewodnictwa  w tech- 
nice obliczeniowej  zwrócono  uwagę  jeszcze  w 1956  r. 
po  skonstruowaniu  urządzenia  zwanego  kriotronem 
(rys.  16).  Prąd  sterujący  w obwodzie  wejściowym 
kriotronu  może  — za  pośrednictwem  swego  pola  kriotron 
magnetycznego  — wprowadzać  obwód  wejściowy 
kriotronu  w jeden  z dwu  stabilnych  stanów:  w stan 
bezoporowy  (nadprzewodzący)  i w stan  oporowy. 

Dzięki  temu  kriotron  działa  jako  przerzutnik  i można 
go  zastosować  w układach  logicznych  i komórkach 
pamięci  maszyn  cyfrowych.  Bramkę  w obwodzie 
wyjściowym  kriotronu,  na  której  pojawia  się  lub  znika 
napięcie,  może  być  cienka  warstewka  nadprzewodnika 
albo  — w czulszych  kriotronach  — złącze  Josephsona. 

Opracowano  także  inne  nadprzewodnikowe  ele- 
menty pamięci,  jak  persistor  czy  komórka  Crove’a. 

Elementy  te  wyróżniają  się  małymi  rozmiarami  i ma- 
łym poborem  mocy.  Mimo  tych  zalet,  nadprzewod- 
nikowe elementy  nie  znalazły  dotychczas  tak  szero- 
kiego zastosowania  w maszynach  cyfrowych,  jak  spo- 
dziewano się  początkowo.  Być  może  przeszkodą  jest 
niewygoda  spowodowana  koniecznością  pracy  w ką- 
pieli helowej.  Z oszacowań  ekonomicznych  wynika, 
że  stosowanie  nadprzewodników  jest  korzystne  do- 
piero w dużych  układach  pamięci,  powyżej  stu  mi- 
lionów bitów. 

B.  B.  Goodman  Zastosowania  nadprzewodnictwa , Post.  Fiz.  24, 

371  (1973). 
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Od  czasów  najdawniejszych  człowiek  znajduje  w zie- 
mi dziwne  naturalne  twory  o licznych  płaskich  ścia- 
nach, różnorodnych  prawidłowych  kształtach,  pięk- 
nych barwach  i wspaniałym  połysku.  Już  starożytni 
nazwali  te  twory  kryształami.  Później,  w miarę  do- 
skonalenia narzędzi  badawczych,  gdy  wynaleziono 
soczewkę  i mikroskop,  a następnie,  gdy  odkryto  zja- 
wisko dyfrakcji  promieni  rentgenowskich  na  kryszta- 
łach, oraz  gdy  zbudowano  mikroskop  elektronowy  — 
okazało  się,  że  większość  naturalnych  i otrzymywa- 
nych sztucznie  substancji  w stałym  stanie  skupienia 
zbudowana  jest  z kryształów  lub  krystalitów  nieraz 
bardzo  małych.  Wyrażając  się  ściślej  mówimy  dziś, 
że  te  wszystkie  substancje  są  ciałami  krystalicznymi. 

I tak  np.  agregatami  ziarn  minerałów,  najczęściej 
krystalicznych  są  skały,  a w glebie  znajdują  się  bar- 
dzo małe  kryształy  minerałów  ilastych.  Ciałami  kry- 
stalicznymi są  śnieg,  lód,  ziarna  piasku  oraz  prawie 
wszystkie  rudy  metali.  Z ciał  krystalicznych  składają 
się  naturalne  i sztuczne  materiały  budowlane  (np. 
granit,  wapień,  cement).  Ciałami  krystalicznymi  są 
także  produkty  hutnicze  (metale  i ich  stopy),  więk- 
szość wytworów  przemysłu  chemicznego  (np.  soda, 
mocznik,  saletra,  naftalen)  i większość  środków  far- 
makologicznych (np.  aspiryna,  witaminy,  penicy- 
lina) oraz  niektóre  artykuły  spożywcze  (cukier,  sól 
kuchenna). 

Ciała  krystaliczne  mają  wiele  ciekawych  właściwo- 
ści optycznych,  mechanicznych,  elektrycznych,  mag- 
netycznych, dzięki  którym  wyróżniają  się  spośród 
innych  ciał  w stałym  stanie  skupienia  (tzw.  ciał  bez- 
postaciowych). 

Jedną  z podstawowych  cech  kryształów  jest  ich 
anizotropia,  tzn.  zależność  właściwości  optycznych, 
mechanicznych  czy  elektrycznych  od  kierunku  w kry- 
sztale. Wszystkie  kryształy  wykazują  anizotropię 
twardości  (tj.  mają  różną  twardość  w różnych  kie- 
runkach), rozszerzalności  cieplnej,  przewodnictwa 
cieplnego,  przewodnictwa  elektrycznego.  We  wszy- 
stkich też  kryształach  — - z wyjątkiem  tych,  które  na- 
leżą do  układu  regularnego  — występuje  zjawisko 
podwójnego  załamania  światła.  Wiele  kryształów  ma 
zdolność  skręcania  płaszczyzny  polaryzacji  światła. 
Kryształy  niektórych  substancji  wykazują  piezoelek- 
tryczność  i piroelektryczność.  Ciała  krystaliczne  mają 
ściśle  określoną  temperaturę  topnienia  przy  określo- 
nym ciśnieniu  (gdy  jednocześnie  nie  zachodzi  che- 
miczny rozkład  substancji). 

Wymienione  wyżej  właściwości  ciał  krystalicznych 
wykorzystuje  się  szeroko  w nauce  i technice.  Krysz- 
tały „wkroczyły”  również  do  naszego  życia  codzien- 
nego: bez  specjalnych  kryształów  nie  działałyby  m.in. 
gramofony  elektryczne,  radia  tranzystorowe,  magne- 
tofony, telewizory  czy  nawet  zegarki  (te  „na  kamie- 
niach”). Z niektórych  kryształów  (kwarc,  sól  kamien- 
na) przezroczystych  dla  promieni  nadfioletowych 
wykonuje  się  pryzmaty  stosowane  w spektrografach 
optycznych,  a np.  z kryształu  fluorytu  przezroczyste- 
go w podczerwieni  — soczewki  do  obiektywów  nokto- 
wizorów. Podwójne  załamanie  światła  w kryształach 
kalcytu  wykorzystuje  się  w przyrządach  polaryza- 
cyjnych (np.  pryzmaty  Nicola).  Niektóre  ciała  kry- 
staliczne wykazujące  silną  anizotropię  absorpcji 
światła  służą  do  sporządzania  błon  polaryzujących 
światło  (polaroidów).  Luminescencję  niektórych 
kryształów  wykorzystano  w licznikach  cząstek  joni- 
zujących (liczniki  scyntylacyjne).  Monokryształy  ru- 
binu zastosowano  do  budowy  maserów  i laserów. 
Kryształy  piezoelektryczne  stosuje  się  m.in.  do  wy- 


twarzania ultradźwięków,  do  pomiarów  ciśnień  (np. 
w cylindrach  silników,  w górotworze)  oraz  jako  pod- 
stawowe części  przetworników  elektroakustycznych. 

Kryształy  półprzewodnikowe  (np.  krzem,  german) 
znalazły  zastosowanie  w elektronice.  Kryształy  o wy- 
sokiej twardości  mają  również  różnorodne  zastoso- 
wanie, np.  diamenty  służą  m.in.  do  wyrobu  narzędzi 
wiertniczych  i tarcz  szlifierskich  oraz  do  cięcia  szkła, 
a z rubinów  wykonuje  się  łożyska  (w  precyzyjnych 
przyrządach  pomiarowych,  np.  w busolach  i zegar- 
kach). Kryształy  mające  piękne  barwy  i połysk  służą 
do  wyrobu  klejnotów  i ozdób  (np.  diamenty,  rubiny, 
szafiry,  szmaragdy,  ametysty). 

Współczesna  nauka  i technika  potrzebują  ciągle 
nowych,  o coraz  to  innych  właściwościach,  ciał  kry- 
stalicznych. Na  potrzeby  techniki  nie  wystarczają  już 
kryształy  naturalne,  które  często  są  albo  zbyt  zanie- 
czyszczone różnymi  domieszkami  albo  są  mało  do- 
skonałe ze  względu  na  występujące  w nich  defekty 
budowy.  Stąd  konieczność  sztucznego  otrzymywania, 
jak  mówimy  — „hodowania”  — różnych  monokrysz- 
tałów (->  Otrzymywanie  monokryształów),  czasami 

0 niemal  idealnej  budowie,  często  o nowych,  nie  zna- 
nych dotąd  a nieraz  wprost  zaskakujących  właściwo- 
ściach. 

Cóż  to  jest  więc  ciało  krystaliczne?  Jak  możemy  je 
zdefiniować?  Czym  różni  się  od  innych  tworów  natu-  ciała 
ralnych,  jak  zwierzęta  i rośliny,  czy  też  od  ciał  bez-  krystaliczne 
postaciowych,  ciekłych  lub  gazowych?  Wyżej  użyto 
takich  terminów,  jak  ciało  krystaliczne,  kryształ,  kry- 
stalit, monokryształ.  Czym  te  ciała  różnią  się  między 
sobą? 

Wszystkie  właściwości  kryształów  (a  ogólniej  ciał 
krystalicznych),  łącznie  z ich  postacią  zewnętrzną 

1 symetrią,  są  wynikiem — jak  to  dzisiaj  wiemy  — 
specyficznej  budowy  wewnętrznej  kryształów,  mia- 
nowicie nieskończonego  trójwymiarowego  uporząd- 
kowania atomów  lub  jonów  czy  cząsteczek.  Przykłady 
takiego  uporządkowania  (w  związku  nieorganicznym 
i organicznym)  pokazano  na  rys.  1 i 2. 

Ciekawe,  że  już  pierwsi  badacze  kryształów,  wie- 
dzeni  genialną  intuicją,  starali  się  wytłumaczyć  pow- 
stawanie wysoko  symetrycznych  postaci  kryształów 
i tworzenie  się  płaskich  ścian  — specyficzną  budową 
wewnętrzną.  Potrzebne  im  jednak  były  do  tego  celu 
pewne  podstawowe  cząstki  — elementy,  z których 


Rys.  J.  Uporządkowanie  jonów  talu,  glinu  i fluoru  w komórkach 
elementarnych  TIA1F4  (związek  nieorganiczny) 
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Rys.  2.  Uporządkowanie  cząsteczek  CO(NH2)2  w krysztale  mocz- 
nika (związek  organiczny) 


hipotezy  próbowali  odtworzyć  kryształy.  I tak  np.  J.  Kepler 
wewnętrznej  (1611)  przypuszczał,  że  sześciokątne  płatki  śniegu 
budowy  zbudowane  są  z kulistych  cząstek  wody,  ściśle  sty- 
kry sztabów  kających  się  z sobą,  a R.  Hooke  (1665)  odtworzył 
zewnętrzne  postacie  kryształów  ałunu  i s-oli  kamiennej 
układając  warstwami  jednakowe  kulki  (należy  zau- 
ważyć, że  dzieje  się  to  ok.  150  lat  przed  powstaniem 
teorii  atomistycznej  J.  Dal  tona  — 1803).  Ch.  Huy- 
gens  (1690)  przypisywał  najmniejszym  cząstkom 
kryształów  kalcytu  kształt  elipsoidy  obrotowej.  Rów- 
nież i M.W.  Łomonosow  (1749)  próbował  wytłuma- 
czyć wielościanową  postać  kryształów  prawidłowym 
ułożeniem  w przestrzeni  kulistych  cząstek  elementar- 
nych (korpuskuł).  D.  Guglielmini  (1688)  i R.  J.  Hauy 
(1782)  na  podstawie  obserwacji  łupliwości  kryształów 
wysunęli  przypuszczenie,  że  najmniejsze  cząstki,  z któ- 
rych zbudowane  są  kryształy,  mają  postać  wielo- 
ścianów. 

Dziś  wiemy,  że  podstawowe  elementy,  z których 
zbudowane  są  kryształy  (i  in.  ciała  krystaliczne),  mają 
postać  równoległościanów  (udowodnił  to  teoretycz- 
nie w 1850  r „ A.  Bravais,  a doświadczalnie  potwierdził 
M.  Laue  w 1912  r.),  a one  z kolei  utworzone  są  z ato- 
mów (jonów,  cząsteczek).  Obecnie  ciałem  krystalicz- 
nym nazywa  się  każde  ciało  w stałym  stanie  skupie- 
nia mające  uporządkowaną,  prawidłową  (sieciową) 
budowę  wewnętrzną.  Zależnie  od  warunków  krysta- 
lizacji ciała  krystaliczne  mogą  tworzyć  monokrysz- 
tały lub  ciała  polikrystaliczne.  Ciało  polikrystaliczne 
polikryształ,  (polikryształ)  składa  się  z licznych,  mikroskopowej 
monokryształ  wielkości  kryształów  lub  krystalitów.  Monokryszta- 
łem jest  każdy  pojedynczy,  duży  lub  nawet  bardzo 
mały  kryształ  lub  .krystalit,  nie  wykazujący  zrostów 
i pęknięć  oraz  nie  posiadający  wrostków  innych  sub- 
stancji. 

Jak  już  wspomniano,  naturalne  kryształy,  np.  ru- 
binu, mają  płaskie  ściany,  natomiast  otrzymane 
w piecu  Verneuila  monokryształy  rubinu  mają 
•kształt  gruszki.  Otrzymane  sztucznie  „gruszki  rubi- 
nowe” są  ciałami  krystalicznymi  o takim  samym  skła- 
dzie chemicznym  jak  naturalny  kryształ  rubinu. 
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Wspólną  cechą  łączącą  naturalny  kryształ  rubinu 
i syntetyczną  „gruszkę  rubinową”  — krystalit  — jest 
więc  nie  ich  wygląd  zewnętrzny,  lecz  ich  jednakowa  — 
przy  jednakowym  składzie  chemicznym  — budowa 
wewnętrzna.  Tak  więc  kryształem  nazywa  s*ię  ciało 
w stałym  stanie  skupienia,  o prawidłowej  (sieciowej)  kryształ 
budowie  wewnętrznej  mające  naturalną  postać  wielo-  a krystalit 
ścianową;  natomiast  krystalit,  mający  taką  samą  bu- 
dowę wewnętrzną  jak  kryształ,  ograniczony  jest  do- 
wolną powierzchnią. 


Wewnętrzna  budowa  ciał 
krystaiicznych 

Sieć  przestrzenna 

Podstawowe  jednostki,  z których  zbudowane  są  ciała 
krystaliczne,  mają  kształt  równoległościanów  z w. 
komórkami  elementarnymi  (rys.  3).  W danym  ciele'  komórka 
krystalicznym  wszystkie  komórki  elementarne  są  elementarna 
oczy wiście  jednakowe.  Nieskończony  zbiór  jednako- 
wych komórek  elementarnych,  ułożonych  względem 
siebie  równolegle  i ściśle  wypełniających  przestrzeń 
stanowi  sieć  przestrzenną  (rys.  4).  Mówimy,  że  sieć 


przestrzenna  jest  geometrycznym,  trójwymiarowym  sieć 
schematem  wewnętrznej  budowy  kryształów  (ciał  przestrzenna 
krystalicznych).  Według  tego  schematu  ułożone  są 
w krysztale  wszystkie  atomy,  jony  lub  cząsteczki. 

Oczywiście,  sieć  przestrzenna  jako  pewien  schemat 
jest  pojęciem  abstrakcyjnym  i żadnej  „sieci”  — jako 
takiej  — w rzeczywistym  krysztale  nie  ma. 

Rozmieszczenie  atomów  (jonów,  cząsteczek)  w po-  struktura 
jedynczej  komórce  elementarnej  nazywamy  strukturą  kryształu 
kryształu  (strukturą  ciała  krystalicznego,  strukturą 
krystaliczną).  Natomiast  powtarzające  się  periodycz- 
nie w trzech  wymiarach  przestrzeni  (tj.  wg  schematu 
sieci  przestrzennej),  wypełnione  atomami  (jonami, 
cząsteczkami)  komórki  elementarne  tworzą  sieć  kry-  sieć 
staliczną.  Mówiąc  inaczej:  sieć  przestrzenna  jest  krystaliczna 
„szkieletem”,  który  po  wypełnieniu  w określony  spo- 
sób atomami  (jonami,  cząsteczkami)’  staje  się  siecią 
krystaliczną. 

W sieci  przestrzennej  krawędzie  komórek  elemen- 
tarnych przecinają  się  w punktach  zw.  węzłami  sie-  węzły 
ciowymi.  Węzłami  nazywa  się  też  punkty  na  prostych  sieciowa 


sieciowych  nie  będących  krawędziami  komórek  ele- 
mentarnych (np.  na  środkach  ścian  komórki  ele- 
mentarnej, rys.  14).  Sieć  przestrzenną  można  trakto- 
wać nie  tylko  jako  nieskończony  zbiór  komórek  ele- 
mentarnych, ale  i jako  nieskończony  uporządkowany 
prosta  zbiór  punktów  — węzłów.  Prosta  przeprowadzona 
sieciowa  przez  dwa  dowolne  węzły  jest  prostą  sieciową  (rys. 

5a).  Na  prostej  sieciowej  znajduje  się  nieskończona 
periody  liczba  węzłów  w jednakowych  od  siebie  odległościach, 
identyczności  Odległości  te  nazywamy  periodami  identyczności  (od- 
ległościami translacyjnymi).  Przez  trzy,  nie  leżące  na 
płaszczyzna  jednej  prostej,  węzły  przechodzi  płaszczyzna  sieciowa 
sieciowa  (rys.  5b).  Takich  płaszczyzn  i prostych  można  wybrać 

a)  <* « • « 


Rys.  5.  Prosta  sieciowa  (a)  i płaszczyzna  sieciowa  (b) 


w sieci  przestrzennej  nieskończenie  wiele.  Kształt 
i rozmiary  komórki  elementarnej  określane  są  przez 
stale  tzw.  stałe  sieciowe  (parametry  sieciowe),  którymi  są 
sieciowe  długości  krawędzi  komorki  a>  ó,  c oraz  kąty  a,  /?,  y 
między  tymi  krawędziami  (rys.  3).  Sieć  przestrzenna 
jest  jednoznacznie  określona  przez  jej  komórkę  ele- 
mentarną. Oznacza  to,  że  wystarczy  znać  stałe  sie- 
ciowe., by  móc  odtworzyć  sieć  przestrzenną, 
współrzędne  W sieci  przestrzennej  mamy  do  czynienia  z nie- 
węzła  sieci  skończoną  liczbą  węzłów.  Położenie  (pozycję)  wy- 
branego węzła  określa  się  względem  układu  osi  kry- 
stalograficznych Xy  Y9  Z za  pomocą  współrzędnych 
-xyz  * (rys.  6).  Osie  krystalograficzne  pokrywają  się 
osie  krystalo-  z trzema  nierównoległymi  do  siebie  krawędziami  ko- 
graficzne  morki  elementarnej. 


Sieci  Bravais'go 


Biorąc  pod  uwagę  różne  możliwe  wartości  stałych 
sieciowych  oraz  symetrię  sieci  przestrzennych  można 
układy  krys-  sieci  przestrzenne  podzielić  na  sześć  głównych  typów, 
talograficzne  zwanych  układami  krystalograficznymi  (tab.  str.  447). 

Prócz  sieci  przestrzennych  mających  węzły  tylko 
w narożach  komórek  elementarnych  istnieją  jeszcze 


sieci  — również  spełniające  warunki  wymienione  w ta- 
beli, w których  węzły  występują  także  na  środkach 
ścian  lub  w środku  geometrycznym  komórki  elemen- 
tarnej. Pierwsze  z wymienionych  wyżej  sieci  nazy- 
wają się  sieciami  prymitywnymi,  a pozostałe  — sie- 
ciami centrowanymi.  Istnieje  14  różnych  typów  sieci 
prymitywnych  i centrowanych,  nazywają  się  one  sie- 
ciami Bravais’go  (lub  sieciami  translacyjnymi).  Po- 
dobnie jak  sieci,  również  ich  komórki  elementarne 
nazywa  się  prymitywnymi  lub  centrowanymi  (rys.  7). 
Często  zamiast  mówić  o 14  typach  sieci  Bravais*go 


sieci 

8rava»s'go 

Sieć  trójskośna 


Sieci  jednoskoioe: 


Sieci  tetragonalne: 


prymitywna 
Sieci  rombowe: 


o centrowanej 
podstawie 


prymitywna 


prymitywna 


Sieci  regularne: 


o centrowanej 
podstawie 


o centrowanym 
środku 


prymitywna 


o centrowanym 
środku 


centrowanych 
wszystkich 
ścianach 


Rys.  7.  Komórki  elementarne  14-tu  typów  sieci  Bravais'go 


mówi  się  o 14  typach  komórek  elementarnych.  Cechą 
charakterystyczną  sieci  Bravaisłgo  jest  to,  że  w takiej 
sieci  każda  prosta  sieciowa  jest  równomiernie  obsa- 
dzona węzłami.  Można  ten  warunek  wypowiedzieć 
też  inaczej,  mianowicie:  przesunięcie  całej  sieci  wzdłuż 
dowolnej  prostej  sieciowej  na  odległość  równą  perio- 
dowi identyczności  tej  prostej  (lub  jego  wielokrot- 
ności) prowadzi  zawsze  do  pokrycia  się  sieci  samej  ze 
sobą  (do  nałożenia  się  na  siebie  wszystkich  węzłów). 

Warunek  charakteryzujący  sieć  Bravais’go  speł- 
niany jest  w sieciach  prymitywnych  (symbol  P)  oraz 
w sieciach  o centrowanych  podstawach  (symbol 
B lub  C — zależnie  od  pary  centrowanych  ścian  ko- 
mórki elementarnej),  w sieciach  o centrowanym  środ- 
ku (/),  w sieciach  o centrowanych  wszystkich  ścianach 


romboedryczna 


symbole  sieci 
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d) 

Rys.  10.  Kształt  cząsteczek  adamantanu  (a)  i urotropiny  (b)  oraz  struktury  kryształów  (atomy  wodoru  na  rysunkach  pominięto)  ada- 
mantanu  (c)  i urotropiny  ( d).  Cząsteczka  adamantanu  zbudowana  jest  z 6 grup  CHa  i 4 grup  CH,  w cząsteczce  urotropiny  4 grupy  CH 
zastąpione  są  atomami  azotu  N 


3 33 


Rys.  9.  Współrzęd- 
ne węzłów  cen- 
trowanych sieciach 
Bravais’go  C,  I,  F 
R 
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Każdą  sieć  centrowaną  można  zawsze  rozpatrywać 
jako  sieć  złożoną  z dwu,  trzech  lub  czterech  wstawio- 
nych w siebie  i odpowiednio  przesuniętych  identycz- 
nych sieci  prymitywnych  (rys.  8).  W komórce  o cen- 
trowanych podstawach  mamy  dwie  sieci  prymitywne 
wstawione  w siebie,  przy  czym  węzeł  początkowy 
jednej  z nich  ma  współrzędne  • 000  • , a drugiej  • £J0  • . 
W sieci  typu  / współrzędne  węzłów  początkowych  sieci 
wstawionych  są  -000*  i -i  | (dwie  sieci  wstawio- 
ne wsiebie);  w sieci  typu  F 000-,  -i  i 0«,  i 0 \- 

i -0  i | * (cztery  sieci  wstawione  w siebie);  w sieci 
typu  R — *000 •,  -I fi-  (trzy  sieci  wsta- 

wione w siebie)  (rys.  9). 

Znajomość  typu  sieci  Bravais’go  w danym  krysztale 
daje  pewną  informację  o sposobie  rozmieszczenia 
atomów  w komórce  elementarnej.  Jeżeli  np.  w krysz- 
tale, mającym  sieć  przestrzenną  typu  F,  ugrupowa- 
nie n atomów  znajduje  się  wokół  węzła  -000-,  to  ta- 
kie same  grupy  n atomów  i w takim  samym  położe- 
niu (orientacji)  muszą  znajdować  się  wokół  węzłów 


brawesowskiej  komórce  elementarnej  można  jednak 
zawsze  utworzyć  komórkę  prymitywną,  niecentro- 
waną.  Komórki  prymitywne  utworzone  dla  sieci  cen- 
trowanych (przykłady  takich  komórek  pokazuje 
rys.  11)  zwykle  nie  oddają  rzeczywistej  symetrii 
istniejącej  w sieci. 


Rys.  11.  Przekształcanie  komórek  centrowanych  w prymity- 
wne: a)  komórki  o centrowanych  podstawach  (typ  C);b)  o cen- 
trowanym środku  (typ  /);  c)  o centrowanych  wszystkich  ścia- 
nach (typ  F) 
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* a 0 § ■ , • 0 H • , • 1 2 o • , a w krysztale  o sieci  typu  I iakie 
same  ugrupowania  atomów  i w takiej  samej  orien- 
tacji znajdują  się  wokół  węzłów  -000-  i -iii*. 
Ilustrują  to  dobrze  struktury  dwóch  organicznych 
związków : adamantanu  C:oH16  i urotropiny  (CH2)6Na 
(kształt  ich  cząsteczek  oraz  struktury  utworzonych  z 
nich  kryształów  przedstawia  rys.  10).  Kształt  cząste- 
czek obu  związków  jest  taki  sam,  ale  sieć  przestrze- 
nna kryształu  adamantanu  jest  siecią  regularną  typu 
F,  a kryształu  urotropiny  — regularną  typu  /. 
komórka  W sieci  przestrzennej  kryształu  istnieje  możliwość 
Wignera-  wyboru  równoległościennej  komórki  elementarnej 
Seitza  w różny  sposób.  Zazwyczaj  wybiera  się  ją  tak,  aby 
kształt  jej  ścian  odzwierciedlał  symetrię  sieci,  oraz  aby 
jej  objętość  była  minimalna,  liczba  kątów  prostych 
między  krawędziami  była  maksymalna,  a węzły  znaj- 
dowały się  w położeniach  zgodnych  z jedną  z 14  ko- 
mórek braw'esowskich.  Dla  każdej  sieci  o centrowanej 
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Metodę  wydzielania  symetrycznych  komórek  pry- 
mitywnych we  wszystkich  sieciach  przestrzennych  po- 
dali Wigner  i Seitz.  W celu  utworzenia  takiej  komórki 
dany  węzeł  sieci  przestrzennej  łączy  się  odcinkami 
prostymi  z najbliższymi  węzłami.  Następnie  przez 
środki  tych  odcinków  prowadzi  się  płaszczyzny  do 
nich  prostopadłe  (rys.  12).  Przecinając  się  ze  sobą 
płaszczyzny  te  tworzą  obszar  nazywany  symetryczną 


Rys.  12.  Komórka  elementarna  Bravais*go  ( A ) i komórka  prymi- 
ywna  Wigncra-Seitza  (#)  dwuwymiarowej  sieci  heksagonalnej 


komórką  prymitywną  lub  komórką  Wignera-Seitza 
(przykłady  — rys.  13).  Komórki  te  w sieci  przestrzen- 
nej są  wielościanami,  którymi  można  ściśle,  bez 
przerw,  wypełnić  przestrzeń.  Komórki  Wignera- 
Seitza  dla  regularnych  sieci  typu  P,  I oraz  i7  przedsta- 
wiono na  rys.  13.  Komórki  Wignera-Seitza  znajdują 
zastosowanie  np.  w teorii  stref  Brillouina  (->  Struk- 


Rys.  13.  Komórki  Wignera-Seitza  regularnych  sieci  typu  P,  1 
oraz  F 


tura  elektronowa  ciał  stałych),  w której  pierwszą  strefą 
Brillouina  nazywa  się  komórkę  Wignera-Seitza  utwo- 
rzoną w sieci  odwrotnej  (-*  Krystalografia  rentge- 
nowska). 


Symbole  prostych  i płaszczyzn  sieciowych 

Przez  nieskończoną  liczbę  węzłów  znajdujących  się 
w sieci  przestrzennej  możemy  prowadzić  nieskoń- 
czoną liczbę  prostych  sieciowych  i płaszczyzn  siecio- 
wych. Płaszczyzny  sieciowe  w sieci  przestrzennej  na- 
chylone różnie  w stosunku  do  osi  krystalograficznych 
różnią  się  między  sobą  zasadniczo  sposobem  roz- 
mieszczenia węzłów  i odległościami  od  sąsiednich 
płaszczyzn  sieciowych.  Również  i proste  sieciowe  po- 
prowadzone z początku  układu  osi  współrzędnych 
(osi  krystalograficznych)  są  różne,  np.  węzły  znaj- 
dują się  na  nich  w różnych  odległościach,  a i odle- 
głości między  sąsiednimi  równoległymi  prostymi  są 
różne. 

Weźmy  np.  sieć  krystaliczną  złota  (układ  regularny) 
i wybierzmy  w tej  sieci  komórkę  elementarną  w taki 
sposób,  aby  atomy  złota  znajdowały  się  w narożach 
komórki  i na  środkach  ścian  (rys.  14,  16).  Taki  wy- 
bór komórki  elementarnej  nie  jest  koniecznością,  gdyż 
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Rys,  14.  Przykłady  prostych  sieciowych  w sieci  krystalicznej  złota 


można  ją  wybrać  i tak,  aby  w jej  narożach  nie  znaj- 
dował się  żaden  atom  (np.  jak  na  rys.  10).  Taki  sam 
typ  sieci  ( F ) jak  złoto  mają  też  aluminium,  miedź, 
nikiel  i in. 

wskaźniki  W komórce  elementarnej  złota  atomy  leżące  na 
prostej  prostej  X znajdują  się  w odległości  a od  siebie ; ale  na 
sieciowej  prostej  sieciowej  B atomy  leżą  w odległościach 


<7/2/2,  a na  prostej  D w odległości  a j/3.  Proste  te  są 
więc  różne;  oznaczamy  je  tzw.  wskaźnikami,  tj.  3 licz- 
bami całkowitymi  my  n , p względem  siebie  pierwszy- 
mi, ujętymi  w nawias  kwadratowy:  [ mnp ].  Liczby 
m,  n,  p jednoznacznie  określają  kierunek  prostej  sie- 
ciowej. Wskaźniki  prostej  sieciowej  przechodzącej 
przez  węzeł  -000-  i jakiś  drugi  są  takie  same  jak  wskaź- 


Rys.  15.  Najgęstsze  ułożenia  jednakowych  kul  w przestrzeni, 
a)  najgęściej  upakowana  warstwa  heksagonalna,  b)  najgęstsze 
ułożenie  regularne  (heksagonalne  warstwy  najgęściej  upakowane 
są  równoległe  do  warstwy  kul  zaciemnionych),  c)  najgęstsze  uło- 
żenie heksagonalne  (warstwy  najgęstszego  upakowania  położone 
są  poziomo) 


komórka 

elementarna 

z&ota 
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niki  tego  drugiego  węzła  sprowadzone  do  postaci 
liczb  całkowitych.  Na  przykład  prosta  X przechodzą- 
ca przez  węzeł  000-  i • 100-  ma  symbol  [100],  prosta 
B przechodząca  przez  -000-  i ma  symbol 

[110],y  prosta  C — symbol  [101],  a prosta  D — 
, [111].  W sieci  przestrzennej  wszystkie  proste  siecio- 
we równoległe  do  siebie  mają  jednakowe  wskaźniki, 
struktury  Przypatrzmy  się  teraz  płaszczyznom  sieciowym  wy- 
znaczonym  w strukturze  kryształu  złota  przez  różne 
ułożenia  ugrupowania  atomów.  W krysztale  złota  (miedzi, 
niklu)  wszystkie  atomy  mają  jednakowy  kształt  — 
przyjmujemy,  że  kulisty  — i tworzą  tzw.  strukturę 
najgęstszego  ułożenia  (upakowania;  rys.  15).  W struk- 
turach tego  typu,  jednakowych  rozmiarów  atomy, 
jony  a nawet  cząsteczki  ułożone  są  w sposób  zapew- 
niający możliwie  największe  wypełnienie  przestrzeni 


Rys.  16.  Kryształ 
złota:  a)  struktura 
najgęstszego  upako- 
wania; b>,c)  id)  obsa- 
dzenie atomami  pła- 
szczyzn sieciowych 
(111),  (100)  i (110) 
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Rys.  17.  Położenie  różnych  płaszczyzn  sieciowych  w komórce 
elementarnej 


(100)  i (110).  Położenie  kilku  innych  płaszczyzn  sie- 
ciowych przedstawione  jest  na  rys.  17. 
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(ok.  74%).  Struktury  te  powstają  w wyniku  nakła- 
dania jedna  na  drugą  najgęściej  upakowanych  warstw 
heksagonalnych.  Największe  znaczenie  w teorii 
struktur  kryształów  mają  dwa  najgęstsze  ułożenia  — 
regularne  i heksagonalne.  Najgęstsze  ułożenie  regu- 
larne ma  sieć  Bravais’go  typu  F,  a heksagonalne  — 
typu  P , przy  czym  w komórce  elementarnej  tej  ostat- 
niej sieci  znajdują  się  dwa  węzły  w pozycjach  -000- 
; ,aii, 

• *3  3 « • 

Na  rysunku  16b,  c,  d pokazane  są  trzy  płaszczyzny 
sieciowe  przechodzące  przez  komórkę  elementarną 
kryształu  złota.  Na  tych  płaszczyznach  wyraźnie  wi- 
dać różne  ich  obsadzenie  przez  atomy  złota.  W płasz- 
czyźnie sieciowej  pokazanej  na  rys.  16b  atomy  złota 
tworzą  najgęściej  upakowaną  warstwę;  atomy  w tej 
płaszczyźnie  ściśle  przylegają  do  siebie.  Na  następ- 
nych dwóch  rysunkach  (16c,  d)  wyraźnie  widać,  że 
rozmieszczenie  atomów  w zaznaczonych  płaszczyz- 
nach jest  inne,  a przede  wszystkim  znacznie  luźniejsze 
niż  w pierwszym  wypadku. 

Zauważmy  też,  że  każda  z zaznaczonych  płasz- 
czyzn jest  inaczej  położona  w stosunku  do  osi  kry- 
stalograficznych. Aby  te  płaszczyzny  móc  od  siebie 
odróżniać  i jakoś  „nazywać”  zaopatrujemy  je  w pew- 
symboSe  i ne  symbole.  Oznaczamy  je  symbolami  Millera  (hkl) 
wskaźniki  złożonymi  z trzech  liczb  całkowitych  hy  k,  l (wskaźniki 
Millera  Millera)  względem  siebie  pierwszych. 

Wskaźniki  h , ky  / pokazują,  ile  razy  odcinki  od- 
cięte na  osiach  krystalograficznych  przez  daną  płasz- 
czyznę są  mniejsze  od  periodów  identyczności  wzdłuż 
odpowiednich  osi.  Zgodnie  z tą  definicją  płaszczyzny 
sieciowe  pokazane  na  rys.  16  mają  symbole  (111), 


Rys.  18.  Rzut  sieci  przestrzenne]  na  płaszczyznę  XY  (oś  Z jest 
prostopadła  do  płaszczyzny  rysunku)  z zaznaczonymi  śladami 
niektórych  płaszczyzn  sieciowych  (A£0) 


440 


Wskaźnik  O w symbolu  płaszczyzny  sieciowej  ozna- 
cza, że  płaszczyzna  ta  jest  równoległa  do  związanej 
z tym  wskaźnikiem  osi  krystalograficznej  (np.  wskaź- 
nik h związany  jest  z osią  X itd.).  Jeżeli  płaszczyzna 
sieciowa  przecina  ujemny  zwrot  danej  osi  krystalogra- 
ficznej, to  ujemny  jest  również  odpowiedni  wskaźnik; 
znak  minus”  umieszcza  się  nad  wskaźnikiem,  np. 

(II1) 

Wszystkie  płaszczyzny  sieciowe  równoległe  do  sie- 
bie mają  takie  same  wskaźniki  Millera.  Dla  zespołu 
równoległych  płaszczyzn  sieciowych  określa  się  od- 
ocficgłość  ległość  międzypłaszczyznową  d^ki),  tj.  odległość 
międzyipfesz-  między  dwoma  sąsiednimi  płaszczyznami,  mierzoną 
czyznowa  wzdłuż  prostej  prostopadłej  do  tych  płaszczyzn  (rys. 

18).  Na  rysunku  łatwo  można  zauważyć,  że  im  wyższe 
są  wskaźniki,  tym  sąsiednie  płaszczyzny  znajdują  się 
bliżej  siebie. 


Symetria  kryształów 

Symetria 


Patrząc  na  szlaki  omamentacyjne  pokazane  na  rys. 
19,  intuicyjnie  wyczuwamy,  że  mają  one  jakąś  syme- 
trię, że  są  symetryczne*.  Od  razu  rzuca  się  w oczy 
pewne  uporządkowanie  i powtarzanie  się  podstawo- 
wych ,, wzorów"’  w tych  ornamentach. 

Przyjrzyjmy  się  teraz  np.  uporządkowaniu  atomów 
krz-emu  i tlenu  (rys.  20)  w strukturach  kryształów  nie- 
których krzemianów.  Atomy  krzemu  i tlenu  układają 
się  w tych  kryształach  w pewne  wzory,  powielane 
w nieskończoność.  Wzory  te  wykazują  również  pewną 
symetrię.  Zauważyć  można  łatwo  wyraźne  podobień- 
stwo uporządkowania  z rys.  20a  do  uporządkowania 
w jednowymiarowym  ornamencie  z rys.  19.  Syme- 
tryczne wzory  tworzone  przez  atomy  ( jony,  cząsteczki) 
w kryształach  bywają  różne,  nieraz  bardzo  skompli- 
kowane i bardzo  oryginalne.  Przykład  takiego, 
wprawdzie  o nieskomplikowanej  symetrii,  ale  orygi- 
nalnego wzoru  pokazano  na  rys.  21,  przedstawiają- 
cym symetrię  ułożenia  atomów  w różnych  warstwach 
struktury  kryształu  minerału  — apofyllitu. 

Bardzo  często  symetrię  wykazują  cząsteczki  związ- 
ków chemicznych.  Niekiedy  jest  to  symetria  stosun- 
kowo prosta,  jak  np.  w cząsteczce  mocznika  (rys.  22), 
a niekiedy  złożona  i skomplikowana,  jak  np.  w czą- 
steczkach adamantanu  i urotropiny  (rys.  lOa,  b). 

Symetria  występuje  nie  tylko  w ró.żnych  uporząd- 
kowaniach atomów  (jonów,  cząsteczek)  w ciałach 
krystalicznych  i w samych  cząsteczkach,  nie  tylko 
w różnych  ornamentach,  w budowlach,  dziełach 
sztuki,  sprzętach  codziennego  użytku  (człowiek  — 
sam  na  zewnątrz  ukształtowany  symetrycznie  — lubi 
wytwarzać  przedmioty  symetryczne,  ponieważ  sy- 
metria kojarzy  mu  się  z pięknem  i harmonią  kształ- 
tów i barw),  ale  i w przyrodzie  ożywionej : symetrycz- 
nie— w każdym  razie  na  zewnątrz  — zbudowane  są 
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Rys.  19.  Szlaki  omamentacyjne  o różnej  symetrii 


Rys.  20.  Uporządkowanie  atomów  krzemu  i tlenu  w strukturach 
krzemianów:  łańcuchowych  (a),  wstęgowych  (b) , warstwowych  (c) 


O grupa  OH  O tlen 

potas  €>wapń 

Rys.  21.  Symetria  w krysztale  apofyJlitu  KCaJ^Si^Omk-S  H.O: 
a)  warstwa  utworzona  przez  grupy  krzemot  Jenowe,  b)  warstwa 
utworzona  przez  jony  Ca,  K,  F,  O i OH 
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przeważnie  zwierzęta  i rośliny.  W tych  ostatnich 
przypadkach  czasem  jest  to  taka  symetria,  jaka  wy- 
stępuje w kryształach,  a czasem  inna  (il.  63,  65  i 66, 
tabl.  17). 


Rys.  22.  Cząsteczka  mocznika 
OC(NH„).  Symetria  własna  czą- 
steczki: mm 


Naukę  o symetrii,  jej  rodzajach  i sposobach  okre- 
ślania na  najwyższym  chyba  poziomie  postawili  kry- 
stalografowie, wykrywając  i badając  symetrię  naj- 
pierw zewnętrznych  postaci  kryształów,  a później 
i struktur  kryształów.  Symetria  jest  właściwością  figu- 
ry polegającą  na  tym,  że  przy  określonych  zmianach 
położenia  tej  figury  nowe  położenia  pokrywają  się 
z położeniem  pierwotnym  (tj.  figura  pokrywa  się  sama 
ze  sobą).  O figurze  geometrycznej  wtedy  mówimy,  że 
jest  symetryczna,  gdy  składa  się  z jednakowych,  pra- 
widłowo rozmieszczonych  części. 
sym&tFśa  Jak  w świetle  tych  sformułowań  można  zdefinio- 
krysstałów  wać  symetrię  kryształów?  Jak  już  wiemy,  kryształy 
podczas  swobodnego  wzrostu  otaczają  się  płaskimi 
ścianami.  Naturalne  ściany  kryształu  są  zawsze  rów- 
noległe do  określonych  płaszczyzn  sieciowych  sieci 
krystalicznej.  Ściany  kryształów  przecinają  się  wzdłuż 
linii  prostych  — krawędzi,  którym  w sieciach  krysta- 
licznych odpowiadają  określone  proste  sieciowe.  Trzy 
lub  więcej  ścian  przecinających  się  w jednym  punkcie 
tworzy  naroże  kryształu.  Patrząc  na  rzuty  ortogonal- 
ne kryształów  przedstawione  w tabeli  Makroskopowa 


Rys.  23.  Przykłady  kombinacji  makroskopowych  elementów 
symetrii:  a)  dwukrotna  oś  symetrii  i przechodzące  przez  nią  dwie 
płaszczyzny  symetrii  (kryształ:  topaz),  b)  trójkrotna  oś  symetrii 
i trzy  płaszczyzny  symetrii  (kryształ:  turmalin),  c)  czterokrotna  oś 
symetrii  i cztery  płaszczyzny  symetrii  (kryształ:  rutyl),  d)  sześcio- 
krotna oś  symetrii  i sześć  płaszczyzn  symetrii  (kryształ:  beryl); 
powtarzany  elementami  symetrii  fragment  kryształu  jest  zacienio- 
wany ; osie  i płaszczyzny  symetrii  są  prostopadłe  do  płaszczyzny 
rysunku 


elementy  symetrii  i na  rys.  23  symetrię  zewnętrznych 
postaci  kryształów  można  zdefiniować  jako:  prawid- 
łowe powtarzanie  się]w  przestrzeni  jednakowych  pod 
względem  geometrycznym  i fizycznym  ścian,  krawędzi 
i naroży.  Należy  tu  jednak  podkreślić,  że  symetria 
zewnętrznych  postaci  kryształów  jest  zjawiskiem  wtór- 
nym, wynikającym  z symetrii  atomowej  budowy  dane- 
go kryształu,  tzn.  z symetrii  sieci  przestrzennej  (sieci 
krystalicznej). 
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Podobnie  jak  symetrię  kryształu,  symetrię  sieci 
przestrzennej  (czy  sieci  krystalicznej)  można  określić 
jako  prawidłowe  powtarzanie  się  w przestrzeni  wę- 
złów (atomów,  cząsteczek),  prostych  sieciowych, 
płaszczyzn  sieciowych,  a także  komórek  elementar- 
nych. 

Aby  zrealizować  dowolne  przekształcenie  syme- 
tryczne, posługujemy  się  pewnymi  pomocniczymi 
punktami,  liniami  lub  płaszczyznami  zw.  elementami  elementy 
symetrii.  Elementy  symetrii  służące  do  opisu  prze-  symetrii 
kształceń  symetrycznych,  którym  podlegają  frag- 
menty zewnętrznych  postaci  kryształów,  nazywają  się 
makroskopowymi  elementami  symetrii.  Makrosko-  makrosko- 
powe elementy  symetrii  — do  których  należą  osie  pOW® 
symetrii  zwykłe,  inwersyjne  i przemienne,  środek  sy-  elementy 
metrii  i płaszczyzna  symetrii  — odznaczają  się  tym,  symetrii 
że  wykonanie  za  ich  pomocą  odpowiednich  prze- 
kształceń symetrycznych  doprowadza  figurę  z po- 
wrotem do  położenia  wyjściowego.  W związku  z tym 
mówimy  o nich,  że  są  elementami  symetrii  figur  skoń- 
czonych. Figurami  skończonymi  są  na  przykład  kry- 
stalograficzne wielościany,  tworzące  zewnętrzne  po- 
stacie kryształów. 

W sieciach  przestrzennych  (krystalicznych),  prócz 
makroskopowych  elementów  symetrii,  występują 
strukturalne  elementy  symetrii,  którymi  są:  oś  trans- 
lacji, śrubowe  osie  symetrii  i płaszczyzny  poślizgu. 

Wykonanie  odpowiednich  przekształceń  symetrycz- 
nych za  pomocą  strukturalnych  elementów  symetrii 
nie  doprowadza  przekształcanej  figury  do  położenia  strukturalne 
wyjściowego.  Strukturalne  elementy  symetrii  są  ele-  elementy 
mentami  symetrii  figur  nieskończonych.  Figurami  symetrii 
nieskończonymi  są  np.  ornamenty  z rys.  19,  a także 
sieci  przestrzenne  czy  sieci  krystaliczne. 

Rezultaty  działania  makroskopowych  elementów 
symetrii  można  obserwować  na  tzw.  kryształach  ideal- 
nych nawet  nie  uzbrojonym  okiem,  jeśli  tylko  kryształ 
jest  dostatecznie  duży.  Strukturalne  elementy  symetrii 
ujawniają  się  natomiast  prawie  wyłącznie  w zjawis- 
kach dyfrakcyjnych. 


Makroskopowe  elementy  symetrii 

Jeżeli  w krysztale  (w  jego  sieci  krystalicznej)  istnieje 
taki  punkt,  że  na  dowolnej  prostej  przeprowadzonej 
przez  ten  punkt,  w jednakowej  od  niego  odległości 
znajdują  się  jednakowe  fra  gmenty  kryształu  (sieci  kry- 
stalicznej, sieci  przestrzennej),  to  ten  punkt  jest  środ- 
kiem symetrii  (centrum  symetrii)  kryształu.  Schemat  środek 
działania  środka  symetrii  oraz  rezultaty  przekształceń  symetrii 
względem  środka  symetrii  przedstawione  zostały 
w tabeli  Makroskopowe  elementy  symetrii.  W tabeli 
tej  pokazano  również  symbole  środka  symetrii  sto- 
sowane w krystalografii. 

Gdy  dwie  części  kryształu  (sieci  krystalicznej)  po- 
zostają do  siebie  w takim  stosunku,  jak  przedmiot  płaszczyzna 
do  swego  obrazu  w płaskim  zwierciadle,  to  element  symetrii 
symetrii  łączący  ze  sobą  te  części  nazywa  się  płasz- 
czyzną symetrii. 

Jeżeli  w krysztale  (w  sieci  krystalicznej)  dany  jego 
fragment  powtarza  się  dwa  lub  więcej  razy  (mówimy 
też  w tym  wypadku,  że  fragment  ten  „nakłada  się” 
sam  na  siebie,  lub  że  przekształca  się  sam  w sobie) 
po  obrocie  kryształu  o stale  ten  sam  kąt  wokół  pew- 
nej prostej  i gdy  powtarzające  się  fragmenty  znajdują 
się  stale  w jednakowej  odległości  od  tej  prostej,  to 
prosta  ta  jest  osią  symetrii.  W kryształach  — ze  osj0  symetrii 
względu  na  ich  budowę  sieciową  — mogą  występo- 
wać tylko  osie  symetrii,  wokół  których  ta  sama 
część  kryształu  (sieci)  powtarza  się  co  kąt  a = 180°, 

120°,  90°,  60°  czyli  odpowiednio : 2,  3, 4 i 6 razy.  Tzw. 
krotność  osi  n równa  się  więc  2,  3,  4,  6 (ti  — 360 °/a). 

W związku  z tym  osie  nazywamy  dwu-,  trój-,  cztero- 
i sześciokrotnymi  osiami  symetrii.  W tabeli  przed- 
stawione zostały  schematy  działania  osi  oraz  działa- 
nia osi  na  asymetryczny  czworościan  i na  ściany 
kryształu. 


Makroskopowe  elementy  symetrii 
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Strukturalne  elementy  symetrii  - osie  śrubowe 
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Oprócz  tych  zwykłych  osi  symetrii  w kryształach 
występuje  jeszcze  czterokrotna  oś  inwersyjna.  Jest 
ona  złożonym  elementem  symetrii,  co  polega  na  tym, 
że  dana  część  kryształu  (sieci)  powtarza  sic  dopiero 
po  wykonaniu  dwóch  przekształceń,  mianowicie 
przekształcenia  względem  zwykłej  czterokrotnej  osi 
symetrii  i przekształcenia  względem  środka  symetrii. 
Takie  złożenie  dwóch  przekształceń  symetrycznych 
nazywa  się  ich  iloczynem.  Sposób  dokonywania  prze- 
kształceń względem  osi  inwersyjnej,  schemat  działania 
czterokrotnej  osi  inwersyjnej,  działanie  takiej  osi 
na  czworościan  oraz  działanie  osi  w krysztale  przed- 
stawione zostały  w tabeli. 

Inne  osie,  inwersyjne  poza  osią  4 — a także  tzw. 
osie  przemienne  (będące  wynikiem  złożenia  dwóch 
przekształceń:  względem  osi  symetrii  w-krotnej  i pro- 
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stopadłej  do  nie.i  płaszczyzny  symetrii)  nie  dają  żad- 
nych takich  przekształceń,  których  nie  można  by 
uzyskać  za  pomocą  wymienionych  już  prostych  prze- 
kształceń. 


Strukturalno  elementy  symetrii 

Podstawowym  elementem  symetrii  sieci  przestrzeń-  oś 
nych  jest  oś  translacji.  Przekształcenie  symetryczne  translacji 
względem  osi  translacji  polega  na  równoległym  prze- 
suwaniu punktu  (lub  zbioru  punktów)  o stale  ten 
sam,  ściśle  określony  odcinek  r (rys.  24).  Odcinek 
ten  nazywa  się  odcinkiem  translacji  lub  periodem 
identyczności.  Sieć  przestrzenną,  ten  nieskończony 
zbiór  komórek  elementarnych,  można  zbudować  pod- 


osie 

śrubowe 


Przykłady  działania  niektórych  osi  śrubowych  i płaszczyzn  poślizg 


a>»  8)  ogólny  wygląd  struktury;  b),  d),  f),  h)  rzut  struktury  na  płaszczyznę  ATK;  i),  j)  rzut  na  płaszczyznę  AT  struktury  przedsta- 

wionej w postaci  czworościanów  Si04.  Na  rzutach  zaznaczono  położenia  niektórych  elementów  symetrii : b)  osi  2X,  płaszczyzn  b i c; 
d)  osi  3,;  O płaszczyzn  n\  h)  osi  4,  i 43  oraz  płaszczyzn  d\  i)  osi  62  i 32;  j)  osi  3,.  Pod  nazwą  związku  są  podane  symbole  grupy  prze- 
strzennej struktury.  Liczby  oznaczają  położenia  atomów  (czworościanów)  nad  płaszczyzną  rysunku  wzdłuż  osi  prostopadłej  do  niej 
wyrażone  w ułamkach  odpowiedniego  periodu  identyczności 


Rys.  24.  Tran- 
slacja — prze- 
sunięcie rów- 
noległe wszyst- 
kich punktów 
o jednakowy 
odcinek 


metrii  o właściwy  tej  osi  kąt  a,  fragment  ten  zostaje 
przesunięty  w kierunku  równoległym  do  osi  symetrii 
o pewną,  ściśle  określoną  część  translacji  (stale  taką 
samą),  równą  (pjn)z,  gdzie  p i n są  liczbami  całkowi- 
tymi ip  < tty  np.  w przypadku  czterokrotnej  osi  śru- 
bowej wykonuje  się  kolejne  obroty  o 90°,  którym  to- 
warzyszą przesunięcia  translacyjne  bądź  stale  o V4r, 
bądź  stale  o ł/*r,  albo  też  stale  o zUr  (tab.  Strukturalne 
elementy  symetrii  — osie  śrubowe).  Tak  więc  istnieją 
trzy  czterokrotne  osie  śrubowe,  o trzech  różnych  skła- 
dowych translacyjnych. 

Osie  śrubowe  oznacza  się  symbolem  np.  Nazwa 


tych  osi  (śrubowe)  pochodzi  stąd,  że  pod  działaniem 
takiej  osi  wszystkie  punkty  (fragmenty)  sieci  krysta- 
licznej przesuwają  się  po  liniach  śrubowych  (lewo- 
lub  prawoskrętnych).  W strukturach  kryształów  wy- 
stępuje 11  osi  śrubowych:  osie  śrubowe  prawoskręt- 
ne  — 3l9  4lf  6l9  6Z ; osie  śrubowe  lewoskrętne — 32, 

43,  65  i osie  śrubowe  neutralne  (tj.  bez  wyróżnio- 

nego kierunku  skrętu)  — 2lf  42,  63.  Schematy  dzia- 
łania osi  śrubowych  pokazano  w tabeli  znajdującej  się 
na  str.  444. 

W wyniku  iloczynu  płaszczyzny  symetrii  oraz  trans-  płaszczyzny 
lacji  powstaje  płaszczyzna  poślizgu.  Działanie  jej  po-  poślizgu 
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lega  na  tym,  że  po  wykonaniu  odbicia  zwierciadlane- 
go każdego  fragmentu  struktury  w płaszczyźnie  sy- 
metrii, fragment  ten  zostaje  przesunięty  w kierunku 
równoległym  do  tej  płaszczyzny  o połowę  odpowied- 
niego odcinka  translacji.  Płaszczyznę  poślizgu  ozna- 
cza się  symbolem  a,  b lub  c,  w zależności  od  kierunku 
przesunięcia  (wzdłuż  osi  krystalograficznej  X,  Y 
czy  Z). 

W strukturach  kryształów  występują  również  bar- 
dziej skomplikowane  płaszczyzny  poślizgu,  działa- 
jące w taki  sposób,  że  odbiciu  zwierciadlanemu  to- 
warzyszą dwa  przesunięcia  o xf2  lub  V4  odcinka  transla- 
cji w kierunkach  dwóch  osi  krystalograficznych.  Płasz- 
czyzna poślizgu  typu  n może  mieć  np.  takie  dwie 
składowe  translacyjne:  1l2zx  i 1Uzz,  a płaszczyzna  typu 
d — V4 tx  i V4r z (tz  i r z — odcinki  translacji  wzdłuż 
osi  X i Z;  zob.  tab.  Strukturalne  elementy  symetrii  — 
płaszczyzny  poślizgu  i Przykłady  działania  niektórych 
osi  śrubowych  i płaszczyzn  poślizgu). 


Kombinacje  elementów  symetrii 


Klasy  i układy  krystalograficzne 

Kryształy,  ich  struktury  czy  sieci  krystaliczne  mogą 
mieć  nie  tylko  pojedyncze  elementy  symetrii,  jak  np. 
tylko  środek  symetrii,  tylko  jedną  /i-krotną  oś  sy- 
metrii zwykłą,,  inwersyjną  lub  śrubową,  tylko  jedną 
płaszczyznę  symetrii  lub  płaszczyznę  poślizgu,  ale 
także  różne  kombinacje  (zespoły)  elementów  sy- 
metrii makroskopowych  albo  strukturalnych,  lub 
i makroskopowych  i strukturalnych.  Działanie  róż- 
nych kombinacji  ^-krotnych  osi  symetrii  i płaszczyzn 
symetrii  na  ściany  kryształów,  dające  wyobrażenie 
o kształtach  kryształów  przedstawiono  na  rys.  23. 

Różne  możliwe  w kryształach  kombinacje  makro- 
skopowych elementów  symetrii  przecinających  się  w 
jednym  punkcie  tworzą  klasy  symetrii  kryształów 


Układy  krystalograficzne  i klasy  symetrii 


Układ 

Elementy 

Stałe  sieciowe 

Symbol  klasy  wg 

Wszystkie  ele- 

krystalogra- 
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komórki  de- 
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a)  International  Tablcs  for  X-Ray  Crystallography,  Birmingham  1952.  b)  A.  M.  Schoenflies  — niemiecki  matematyk  (1853-1928)' 
C)S.  Kreutz  — polski  mineralog  i krystalograf  (1883-1941). 

Uwaga:  Lz  oznacza  dwukrotną  oś  symetrii  równoległą  do  krystalograficznej  osi  Z;  Pv  oznacza  płaszczyznę  symetrii  prostopadłą  do  kry- 
stalograficznej osi  Y ; 4/m  oznacza  płaszczyznę  symetrii  prostopadłą  do  czterokrotnej  osi  symetrii. 


klasy  symetrii 
(grupy 
punktowe ) 
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(klasy  krystalograficzne  lub  grupy  punktowe).  Kom- 
binacji takich  istnieje  tylko  32  i grupuje  się  je  w 6 
układów  krystalograficznych.  Kryształy  dowolnego 
związku  chemicznego  można  zawsze  zaliczyć  na  pod- 
stawie ich  symetrii  makroskopowej  do  jednej  z 32  klas 
symetrii.  W tab.  Układy  krystalograficzne  i klasy  sy- 
metrii pokazano  podział  klas  między  układy  krysta- 
lograficzne oraz  podano  elementy  symetrii  i stałe 
sieciowe  charakteryzujące  poszczególne  układy.  Naz- 
wa klasy  pochodzi  od  postaci  prostej  ogólnej  występu- 
jącej w danej  klasie. 

Przy  ujęciu  zagadnienia  symetrii  szerszym  niż  w 
krystalografii,  tj.  przy  uwzględnieniu  istnienia  osi  5-, 
7-,  8-,  ...-krotnych,  liczba  klas  symetrii  staje  się  nie- 
skończona. Łatwo  jest  wtedy  utworzyć  z klas  symetrii 
szeregi,  z których  każdy  kończy  się  klasą  zawierającą 
oś  symetrii  o krotności  nieskończonej  (oo  lub  L^)y 
np.:  1,  2,  3,  4,  5,  6,...  ,oo;  2,  222,  32,  422,52,622, 
. . . , oo2;  m,  mml,  3 m,  4 mm,  5m>  6mmy ...»  oo  mm  itp. 
Klasy  symetrii  (grupy  punktowe),  w których  wystę- 
cjrupy  pują  osie  o krotności  nieskończonej,  nazywają  się  gru- 
graniczne  parni  granicznymi.  Jak  pokazał  P.  Curie,  grup  takich 
jest  siedem;  mają  one  symbole:  oo,  oo2,  oo/m,  oo  mm, 
oofmm,  oooo,  oooo m.  Grupy  graniczne  znajdują  zasto- 
sowania przy  opisywaniu  fizycznych  własności  krysz- 
tałów. 

układy  krys-  Układem  krystalograficznym  nazywa  się  zespół  klas 
tałograficzne  symetrii,  których  elementy  symetrii  powodują  jedna- 
kowe ograniczenia  stałych  sieciowych  (np.  w układzie 
tetragonalnym  obecność  osi  Lx  powoduje  równość 
krawędzi  a i b w komórce  elementarnej  oraz  wymaga, 
by  kąty  a,  p,  y były  kątami  prostymi).  Wszystkie  klasy 
danego  zespołu  można  opisać  przy  użyciu  takiego 
samego  układu  osi  odniesienia  scharakteryzowanego 
przez  stałe  sieciowe. 

Jak  pokazano  w tabeli  (Układy  krystalograficzne 
i klasy  symetrii)  istnieje  sześć  układów  krystalogra- 
ficznych: trójskośny,  jednoskośny,  rombowy,  tetra- 
gonalny,  heksagonalny  i regularny.  Niekiedy  (w  fizyce 
ciała  stałego  i w mineralogii)  heksagonalne  klasy  sy- 
metrii z trójkrotną  osią  symetrii  wydziela  się  jako 
odrębny  układ  — trygonalny,  w którym  komórka 
elementarna  ma  kształt  romboedru  {a  = b = c,  a = 
= p = y 90°).  Z punktu  widzenia  krystalografii 
strukturalnej  nie  jest  to  słuszne,  gdyż  sieć  przestrzenna 
zarówno  w obecności  osi  6,  jak  i osi  3 jest  taka  sama, 
nie  ma  więc  odrębnej  sieci  „trygonalnej”,  a poza  tym 
prymitywną  komórkę  elementarną  o kształcie  rombo- 


kami  (b) 

edru  można  zawsze  przedstawić  (rys.  25)  jako  podwój- 
nie centrowaną  komórkę  heksagonalną  typu  JR.  Tak 
więc  w krystalografii  strukturalnej  rozróżnia  się  6 
układów  krystalograficznych,  łącząc  co  naj wyżej 
klasy  z osią  3 w tzw.  podukład  trygonalny. 


Zewnętrzne  postacie  kryształów 

Jak  już  niejednokrotnie  wspomniano,  kryształy  pod- 
czas swego  wzrostu  dążą  do  otaczania  się  płaskimi 
ścianami.  W rezultacie  powstają  zwykle  wielościano- 
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we  postacie  kryształów,  nieraz  bardzo  oryginalne, 
bardzo  skomplikowane,  a najczęściej  bardzo  ładne. 
Ściany  na  krysztale  nie  tworzą  się  w sposób  dowolny, 
są  one  ściśle  związane  z sieciową  budową  wewnętrzną 
kryształów  i ich  symetrią. 

Zespoły  ścian  na  krysztale  nazywa  się  postaciami 
krystalograficznymi,  wśród  których  rozróżnia  się  po- 
stacie proste  i postacie  złożone. 

Postać  prostą  stanowi  zespół  ścian  symetrycznie 
równoznacznych,  tzn.  związanych  ze  sobą  elementami 
symetrii.  Taki  zespół  ścian  otrzymuje  się  w rezultacie 
poddania  jednej  ściany  działaniu  elementów  symetrii 
danej  klasy  symetrii.  Postaci  prostych  jest  47  (rys.  26). 
Postać  prostą  oznacza  się  symbolem,  którym  są 
wskaźniki  jednej  ze  ścian  tej  postaci  ujęte  w nawias 
klamrowy:  { hkl };  np.  sześcian  oznacza  się  symbolem 
{100},  a ośmiościan:  {111}. 

Postacią  prostą  ogólną  nazywa  się  postać,  której 
ściany  nachylone  są  skośnie  względem  elementów  sy- 
metrii lub  osi  krystalograficznych.  Ściany  postaci 
ogólnej  mają  zawsze  symbol  typu  {hkl),  np.  (321). 
Postacie  proste  szczególne  mają  ściany  prostopadłe, 
równoległe,  albo  nachylone  symetrycznie  względem 
elementów  symetrii  lub  osi  krystalograficznych ; sym- 
bolami takich  ścian  są  np.  (100),  (110),  (111),  (221). 
W każdej  klasie  symetrii  występuje  jedna  postać  pro- 
sta ogólna  {hkl}  i kilka  postaci  prostych  szczególnych, 
np.  {100},  {110},  {hhl}  itd.  Ściany  postaci  prostych 
zamkniętych  (np.  czworościanu,  sześcianu,  podwój- 
nych piramid)  całkowicie  ograniczają  część  przestrze- 
ni, natomiast  ściany  postaci  prostych  otwartych 
(np.  dwuścianu,  słupów,  piramid)  nie  zamykają  prze- 
strzeni. 

Kryształ,  na  którym  występują  ściany  kilku  postaci 
prostych,  ma  postać  złożoną  (rys.  27).  Bardzo  często 
spotykane  są  kryształy,  któp^ch  postać  zewnętrzna 
jest  kombinacją  kilku  czy  kilkunastu  nawet  postaci 
prostych  ogólnych  i szczególnych. 

W klasycznej  nauce  o postaciach  prostych  wystę- 
pują postacie  o jednakowych  nazwach  i jednakowych 
kształtach  (zarysach  ścian),  lecz  różniące  się  syme- 
trią. Wśród  postaci  prostych  istnieje  np.  tylko  jeden 
jednościan  występujący  zarówno  na  kryształach  trój- 
skośnych,  jak  i na  kryształach  jednoskośnych,  rom- 
bowych, tetragonalnych  czy  heksagonalnych.  A.  W. 
Szubnikow  zauważył,  że  chociaż  w geometrii  wystę- 
puje tylko  jeden  sześcian,  to  w krystalografii  jest  ich 
pięć  — o różnej  symetrii,  występujących  w pięciu 
klasach  symetrii  układu  regularnego.  Podobnie  i jed- 
nościan ma  inną  symetrię  w układzie  np.  jednoskoś- 
nym,  a inną  w układzie  rombowym,  tetragonalnym 
czy  heksagonalnym.  Jeżeli  dla  poszczególnych  postaci 
prostych,  występujących  w różnych  klasach  symetrii 
uwzględni  się  symetrię  tych  klas,  to  okazuje  się,  że 
postaci  prostych  jest  nie  47,  lecz  146,  a nawet  193,  gdy 
weźmie  się  jeszcze  pod  uwagę  odmiany  enancjomor- 
ficzne  istniejące  dla  niektórych  postaci  (G.  B.  Bokij). 
Uwzględnienie  przy  charakteryzowaniu  postaci  pro- 
stych elementów  symetrii  grup  przestrzennych  dopro- 
wadziło do  wyprowadzenia  1403  strukturalnych  od- 
mian postaci  prostych  (I.  I.  Szafranowskij).  Dwie 
odmiany  strukturalne  jednej  postaci  prostej  są  różne 
wtedy,  gdy  ich  ściany  różnią  się  elementami  symetrii 
swojej  grupy  przestrzennej.  W ten  sposób  sześcian  ma 
np.  36  odmian  strukturalnych. 

Pełniejszy  opis  kryształów  rzeczywistych  uwzględ- 
niający różne  nieprawidłowości  ich  rozwoju  wymagał 
rozszerzenia  nauki  o postaciach  prostych  w jeszcze 
inny  sposób.  Wprowadzono  w tym  celu  pojęcie  po- 
staci prostej  krawędziowej  i postaci  prostej  wierz- 
chołkowej. W tym  ujęciu  47  krystalograficznych  po- 
staci prostych  nazywa  się  postaciami  ścianowymi. 

Postać  prostą  wierzchołkową  stanowi  zespół  na- 
roży kryształu  otrzymywanych  jedno  z drugiego  za 

Rys.  27.  Przykład  kryształu  o postaci  złożonej:  beryl  — klasa 
symetrii  6/mmm;  postacie  proste:  k podwójna  piramida  dyheksa- 
gonalna,  Intn  podwójne  piramidy  heksagonalne,  o dwuścian,  p 
słup  heksagonalny 
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postacie  pomocą  elementów  symetrii.  Postacie  wierzchołkowe 
proste  mogą  być  płaskie  i przestrzenne.  Postaci  wierzchołko- 
wierzchoł-  wych  płaskich  jest  10,  a przestrzennych  — 47.  Przy- 
kowe  kładem  płaskich  postaci  wierzchołkowych  mogą  być 
zgrubienia  na  końcach  śnieżynek  (rys.  28). 


Rys.  28.  Śnieżynki  — przykłady  postaci  wierzchołkowych 


stacie  Postacią  prostą  krawędziową  nazywa  się  zespół 
oste  kra_  jednakowych  krawędzi  kryształu  wyprowadzonych 
p i A z jednej  krawędzi  za  pomocą  elementów  symetrii 
(W.  I.  Michiejew,  1. 1.  Szafranowskij).  Postaci  krawę- 
dziowych płaskich  jest  27,  a przestrzennych  303. 
Przykładem  postaci  krawędziowych  są  śnieżynki, 
kryształy  cerusytu  oraz  wszystkie  możliwe  złożone 
zbrużdżenia  ścian  kryształów  (rys.  29,  30). 


Rys.  29.  Śnieżynki  — przykłady  postaci  krawędziowych 


Rys.  30.  Zbrużdżenia  ścian  kryształów  — przy- 
kłady postaci  krawędziowych,  a)  sfaleryt,  b)  pi- 
ryt, c)  arsenopiryt 


Między  postaciami  wierzchołkowymi,  krawędzio- 
wymi i ścianowymi  istnieją  wzajemne  powiązania. 
Widoczne  jest  to  np.  na  szkieletowym  krysztale  soli 
kuchennej  o kształcie  piramidalnego  lejka  (tego  ro- 
dzaju kryształy  pływają  na  powierzchniach  słonych 


jezior).  Maleńkie  wierzchołkowe  sześciany  łączą  się  ze 
sobą  podczas  wzrostu  kryształu  i tworzą  krawędziowe 
słupki,  które  nakładając  się  na  siebie  przechodzą  w 
ścianki  wklęsłego  lejka  — piramidki  (rys.  31). 


Kryształy  idealne  i kryształy  rzeczywiste 

kryształ  Na  krysztale  idealnym  wszystkie  ściany  należące  do 
idealny  jednej  postaci  prostej  mają  ten  sam  kształt  i tę  samą 
wielkok  oraz  są  jednakowo  oddalone  od  środka 


kryształu.  Sieć  przestrzenna  idealnego  kryształu  jest 
tworem  jednorodnym,  nie  wykazującym  zakłóceń 
w żadnym  kierunku.  Zewnętrzna  i wewnętrzna  budo- 
wa kryształów,  zarówno  naturalnych  jak  i otrzymy- 
wanych sztucznie  najczęściej  wykazuje  wiele  niedo- 
skonałości i odbiega  znacznie  od  idealnych  modeli 
przedstawianych  przez  teorie  symetrii  i sieciowej  bu- 
dowy kryształów.  Takie  niedoskonałe  kryształy  na- 
zywa się  kryształami  rzeczywistymi.  O tym,  jak  może  kryształ 
wyglądać  zewnętrzna  postać  rzeczywistych  kryszta-  rzeczywisty 
łów  kwarcu  a,  w porównaniu  z kryształem  idealnym, 
daje  pewne  wyobrażenie  rys.  32. 


Rys.  32.  Kwarc  a:  a)  kryształ  idealny,  b)  i c)  kryształy  rzeczywi- 
ste 


Stwierdzono,  że  kryształy  rzeczywiste  zbudowane 
są  najczęściej  z bloków  wielkości  rzędu  10“ 5 cm 
(lub  mniej)  o prawidłowej  budowie  sieciowej,  jednak 
nieznacznie  skręconych  względem  siebie  (rys.  33). 

Kryształ  mający  tego  rodzaju  budowę  wewnętrzną  na-  kryształ 
żywa  się  kryształem  mozaikowym.  mozaikowy 


Rys.  33.  Schemat  mozaikowej  budowy  kryształu 


W budowie  sieci  krystalicznej  występują  lokalne 
zakłócenia  prawidłowości  jej  budowy,  zwane  defekta- 
mi punktowymi.  Zasadniczymi  typami  tych  defek- 
tów są  defekty  Frenkla,  polegające  na  przesunięciu 
atomów  (jonów)  z węzłów  sieci  do  przestrzeni  mię- 
dzywęzłowych (rys.  34).  oraz  defekty  Schottky’ego 
(wakansje),  polegające  na  nieobsadzeniu  przez  atomy 
(jony)  części  węzłów  sieci  (rys.  35). 

Innym  rodzajem  niedokładności  w budowie  sieci 
przestrzennej  kryształów  są  dyslokacje,  będące  defek- 
tami liniowymi.  Dyslokacje  polegają  na  przesunięciu 
części  płaszczyzn  sieciowych  w stosunku  do  innych, 
przy  zachowaniu  spójności  sieci.  Istnieją  dyslokacje 
krawędziowe,  śrubowe  i mieszane.  Jeżeli  jedna  z pła- 


defekty 

punktowe 


Rys.  34.  Defekty 
Frenkla 


Rys.  36.  Dyslokacja  krawędziowa 
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Rys.  37.  Dyslokacja  śrubowa 


dyslokacje  szczyzn  sieciowych  urywa  się  we  wnętrzu  sieci  prze- 
strzennej, to  wewnętrzny  brzeg  tej  płaszczyzny  tworzy 
dyslokację  krawędziową  (rys.  36).  Dyslokacja  śrubowa 
istnieje  w krysztale  wówczas,  gdy  płaszczyzny  siecio- 
we jedynie  w przybliżeniu  są  do  siebie  równoległe 
i połączone  są  ze  sobą  w taki  sposób,  że  sieć  prze- 
strzenna kryształu  stanowi  jakby  jedną  płaszczyznę 
sieciową,  tworzącą  powierzchnię  śrubową  (rys.  37). 
W dyslokacjach  mieszanych  można  rozróżnić  dyslo- 
kacje składowe:  krawędziową  i śrubową. 

Wiele  właściwości  fizycznych  ciał  krystalicznych 
zależy  nie  tylko  od  ich  składu  chemicznego  i ich  struk- 
tury, ale  także  od  istniejących  w nich  rozmaitych  de- 
fektów. Defekty  mają  wpływ  m.in.  na  własności  op- 
tyczne, półprzewodnikowe,  magnetyczne,  elektryczne 
i cieplne  ciał  krystalicznych  oraz  na  ich  wytrzymałość 
mechaniczną,  a także  na  wzrost  kryształów. 


Grupy  przestrzenne 

Różne  możliwe  w strukturach  ciał  krystalicznych 
kombinacje  makroskopowych  i strukturalnych  ele- 
mentów symetrii  tworzą  grupy  przestrzenne.  Tak  jak 
grupy  punktowe  (klasy  symetrii)  charakteryzują  sy- 
metrię zewnętrznych  postaci  kryształów,  tak  grupy 
przestrzenne  charakteryzują  symetrię  struktur  krysz- 
tałów. Istnieje  230  grup  przestrzennych.  Każdy  układ 
krystalograficzny  obejmuje  pewną  liczbę  grup  prze- 
strzennych, podzielonych  z kolei  między  poszczególne 

#••••«  klasy  symetrii. 

Grupy  przestrzenne  opisuje  się  zwykle  za  pomocą 

••••••  tzw.  symboli  międzynarodowych,  składających  się 

• • • ® • z dużej  litery  oznaczającej  typ  sieci  Bravaisłgo,  liczb 

• oznaczających  osie  symetrii  zwykłe,  inwersyjne  lub 
śrubowe  i małych  liter  oznaczających  płaszczyzny  sy- 

• # # # * # metrii  lub  płaszczyzny  poślizgu.  Międzynarodowy  sym- 

• • • • • boi  grupy  przestrzennej  jest  tak  skonstruowany,  że 

• • • • • * na  jego  podstawie  można  wyznaczyć  wszystkie  ele- 

Rys.  35.  Defekty  menty  symetrii  w danej  grupie  przestrzennej  i okre- 
Schottky’ego  * ślić  ich  rozmieszczenie  w komórce  elementarnej. 

Każdej  grupie  przestrzennej  odpowiada  tylko  jedna 
klasa  krystalograficzna,  którą  można  łatwo  wyzna- 
symbole  czy ć dla  danej  grupy  przestrzennej,  zamieniając  w tej 
grup  prze-  ostatniej  wszystkie  osie  śrubowe  i płaszczyzny  poślizgu 
strzennych  na  zwykłe  osie  i płaszczyzny  oraz  przesuwając  równo- 
legle wszystkie  elementy  symetrii  tak,  by  przecinały 
się  w jednym  punkcie.  W podobny  sposób  (zamienia- 
jąc strukturalne  elementy  symetrii  na  makroskopowe 
i odrzucając  symbol  sieci  Bravais’go)  z symbolu  grupy 
przestrzennej  można  uzyskać  symbol  klasy  krystalo- 
graficznej, do  której  dana  grupa  przestrzenna  należy, 
np. : Pcal1  ->  mml  (to  oznacza,  że  grupa  Pcalx  należy 
do  klasy  mml  w układzie  rombowym). 

Każda  grupa  przestrzenna  ma  właściwe  sobie  tzw. 
zespoły  pozycji  symetrycznie  równoznacznych,  czyli 
przestrzenne  układy  punktów  związanych  ze  sobą 
elementami  symetrii.  Każdy  taki  zespół  punktów  po- 
wstaje z jednego  punktu  wyjściowego  (a  więc  mamy 
tu  „rozmnożenie”  punktu)  przez  poddanie  go  działa- 


niu wszystkich  elementów  symetrii  danej  grupy  prze-  liczebność 
strzennej.  Liczba  punktów  znajdujących  się  w jednej  (krotność) 
komórce  elementarnej,  czyli  tzw.  liczebność  lub  krot-  pozycji 
ność  pozycji,  może  być  różna  w różnych  zespołach 
pozycji  danej  grupy  przestrzennej  i jest  zależna  od 
położenia  punktu  wyjściowego  względem  elementów 
symetrii.  W każdej  grupie  przestrzennej  istnieje  jeden 
zespół  pozycji  symetrycznie  równoznacznych  w poło- 
żeniu ogólnym  i kilka  zespołów  pozycji  w położeniach 
szczególnych.  Zwykle  w kryształach  tylko  niektóre 
zespoły  pozycji  danej  grupy  przestrzennej  są  obsadza- 
ne przez  atomy  (jony,  cząsteczki). 

Symetrię  grup  przestrzennych  i zespoły  pozycji  sy- 
metrycznie równoznacznych  przedstawia  się  graficz- 
nie w rzucie  na  jedną  ze  ścian  komórki  elementarnej, 
zwykle  na  płaszczyznę  XY.  Takie  rzuty  dla  trzech 
grup  przestrzennych  należących  do  układu  rombowe- 
go pokazano  na  rys.  38,  39,  40.  Na  rysunkach  tych 
wyraźnie  widać  różnice,  w przestrzennych  ugrupowa- 
niach punktów  i w liczebności  pozycji  ogólnej,  zależne 
od  zmiany  elementów  symetrii  i typu  sieci  Bravais’go 
w obrębie  jednej  klasy  symetrii. 

Badanie  struktury  każdego  ciała  krystalicznego 
rozpoczyna  się  od  wyznaczenia:  jego  stałych  siecio- 
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Rys.  38.  Grupa  przestrzenna  Pca2x  (klasa  symetrii  mm):  a)  Roz- 
mieszczenie elementów  symetrii  w komórce  elementarnej;  wszy- 
stkie elementy  symetrii  są  prostopadłe  do  płaszczyzny  rysunku, 
b)  Zespół  pozycji  symetrycznie  równoznacznych  w położeniu 
ogólnym;  znak  + oznacza,  że  punkt  znajduje  się  nad  płaszczyzną 
rysunku  w odległości  z od  niej;  przecinek  wpisany  w kółko  ozna- 
cza, że  dany  punkt  powstał  w wyniku  odbicia  w płaszczyźnie  sy- 
metrii (zwykłej  lub  poślizgu);  l}2+  przy  punkcie  znaczy,  że  punkt 
znajduje  się  nad  płaszczyzną  rysunku  na  wysokości  z + l/2  odcinka 
translacji  prostopadłego  do  płaszczyzny  rysunku,  liczebność  po- 
zycji ogólnej  4;  współrzędne  punktów:  xyz;  x,y,  V2+z;  llz~x > 
y , V2  + z;  V2 -rX,y,z 
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Rys.  39.  Grupa  przestrzenna  Pba2  (klasa  symetrii  mm):  a)  ele- 
menty symetrii,  b)  zespół  pozycji  symetrycznie  równoznacznych 
w położeniu  ogólnym;  liczebność  pozycji  4;  współrzędne  punk- 
tów: xyz,  xyz;  l!i—x,  lls+y,z ; lfz-i-x,  lfz—y,z 
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Rys.  40.  Grupa  przestrzenna  Iba2  (klasa  symetrii  mm):  a)  ele- 
menty symetrii,  b)  zespół  pozycji  symetrycznie  równoznacznych 
w położeniu  ogólnym ; liczebność  pozycji  8 ; współrzędne  punktów : 


xyz;  xyz;  xtyt1f2+z;  x,y,1l2+z ; ll2+x,ll2-y,z ; ł/2 ~x,1f2+y,z; 
lU  - x,'U  -y,'U + z;  */»■ + xtlfz  +y, »/, + z 
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wych,  liczby  atomów  Gonów,  cząsteczek)  znajdują- 
cych się  w komórce  elementarnej  oraz  grupy  prze- 
strzennej. Bez  znajomości  grupy  przestrzennej  jest 
wręcz  niemożliwe  dalsze  badanie  struktury,  tj.  wy- 
znaczenie pozycji  atomów  w komórce  elementarnej. 
Z kolei  bez  znajomości  współrzędnych  ■ xyz  • atomów 
nie  można  określić  długości  wiązań,  kątów  między 
wiązaniami,  wzajemnej  konfiguracji  atomów  a w re- 
zultacie i kształtu  czy  to  np.  kompleksowego  jonu 
czy  też  całej  cząsteczki. 

Dlaczego  tak  ważne  jest  wyznaczenie  grupy  prze- 
strzennej? Otóż  wydawałoby  się,  że  atomy  czy  zespoły 
atomów  mogą  w komórkach  elementarnych  ciał  kry- 
stalicznych zajmować  miejsca  zupełnie  dowolne,  naj- 
wyżej określone  położeniem  atomu  w cząsteczce. 
Tymczasem  tak  nie  jest.  W komórkach  elementarnych 
atomy  zajmują  miejsca  w określonych  zespołach  po- 
zycji symetrycznie  równoznacznych  i to  najczęściej 
tak,  aby  liczba  atomów  jednego  rodzaju  była  zgodna 
z liczebnością  pozycji.  Tak  więc,  znajomość  grupy 
przestrzennej  ciała  krystalicznego  zmniejsza  nieogra- 
niczoną liczbę  dowolnych  położeń  w komórce  ele- 
mentarnej dla  każdego  z atomów,  do  ściśle  określo- 
nych zespołów  pozycji.  Przy  badaniu  struktury  krysz- 
tału zadanie  sprowadza  się  więc  do  określenia,  który 
zespół  pozycji  zajmowany  jest  przez  dany  rodzaj 
atomów.  W obrębie  danego  zespołu  wystarczy  już 
tylko  wyznaczyć  parametry  x,y9z  dla  jednego  (!) 
atomu.  Współrzędne  pozostałych  atomów  zajmują- 
cych tę  pozycję  dane  są  wówczas  niejako  automatycz- 
nie. Warto  tu  wspomnieć,  że  liczebności  pozycji  są 
nieraz  bardzo  wysokie,  np.  16,  24,  32,  a. w niektórych 
grupach  przestrzennych  układu  regularnego  — 48,  96 
a nawet  192( !).  Należy  zauważyć,  że  mogą  istnieć 
i takie  kryształy,  w których  kilka  różnych  rodzajów 
atomów  może  zajmować  kilka  pozycji  ogólnych  o róż- 
nych parametrach  x,y,z,  a są  i takie  kryształy,  w któ- 
rych atomy  zajmują  wyłącznie  pozycje  szczególne  (np. 
kryształy  Au,  NaCl).  Struktury  różnych  związków 
chemicznych  należące  do  jednej  grupy  przestrzennej 
mogą  więc  różnić  się  między  sobą  rodzajami  i liczbą 
zajętych  przez  atomy  zespołów  pozycji  symetrycznie 
równoznacznych,  a także  wartościami  liczbowymi 
parametrów  x9y9z  punktu  przyjętego  za  wyjściowy 
w danym  zespole  pozycji. 

Zobaczymy  teraz,  jak  realizowane  są  w konkret- 
nych przypadkach  podane  wyżej  definicje  i zależności. 
Rozpatrzmy  w tym  celu  strukturę  związku  chemicz- 
nego o wzorze  CO(NH2)2,  nazywanego  mocznikiem 
lub  karbamidem. 

Mocznik  krystalizuje  w układzie  tetragonalnym, 
w klasie  skalenoedru  tetragonalnego  42m,  w grupie 
przestrzennej  PĄl^.  Kryształy  ograniczone  są  zwykle 
ścianami  czworościanu  tetragonalnego  {111}  i słupa 
tetragonalnego  {110}.  W komórce  elementarnej  o 
krawędziach  a — 5,661  A,  c — 4,712  A znajdują  się 
dwie  cząsteczki  CO(NH2)2.  Cząsteczka  C(XNH2)2 
jest  płaska,  tj.  wszystkie  jej  atomy  leżą  w jednej 
płaszczyźnie.  Symetria  własna  cząsteczki  jest  mm. 
W komórce  elementarnej  należy  w sumie  rozmieścić: 
dwa  atomy  tlenu,  dwa  atomy  węgla,  cztery  atomy 
azotu  i osiem  atomów  wodoru.  Stwierdzono,  że  atomy 
tlenu  zajmują  pozycję  szczególną  o liczebności  2 
o współrzędnych  02  zii0ź(zo  = 0,5998);  atomy  węgla 
zajmują  tę  samą  pozycję,  z tym  tylko,  że  inna  jest 
wielkość  parametru  z (zc  = 0,3308);  atomy  azotu 
zajmują  pozycję  szczególną  o liczebności  4,  o współ- 
rzędnych x,z —x,z;x>7-rx,z;2—  x9x9z ; j + x9x , z (*n  = 
= 0,1419,  zn  = 0,1857).  Atomy  wodoru  zajmują  dwa 
te  same  zespoły  pozycji  co  i atomy  azotu,  oczywiście 
przy  innych  parametrach  x i z (xhi  = 0,2390,  z hi  = 
= 0,2770,  xh2  — 0,1240,  ZH2  = 0,0460).  Jak  widać, 
w krysztale  mocznika  pozycja  ogólna  grupy  prze- 
strzennej wcale  nie  jest  zajęta  przez  atomy. 

Strukturę  mocznika  badano  metodami  rentgeno- 
strukturalnymi,  elektronograficznymi  i neutronogra- 
ficznymi. Dla  znajdujących  się  w komórce  elementar- 
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nej  16  atomów  należało  wyznaczyć  48  parametrów 
x,y,z.  Jednakże  ze  względu  na  symetrię  grupy  prze- 
strzennej, wystarczy  w tej  strukturze  znaleźć  położenia 
tylko  jednego  atomu  tlenu,  jednego  atomu  węgla, 
jednego  atomu  azotu  i dwóch  atomów  wodoru  (czyli 
położenia  tylko  5 atomów  (!);  położenia  pozostałych 
atomów  wynikają  automatycznie  z zespołów  pozycji 
symetrycznie  równoznacznych),  a więc  w sumie  wy- 
znaczenie 15  parametrów  x9y9z.  Jak  się  okazało, 
ze  względu  na  to,  że  atomy  zajmują  pozycje  szczególne 
wystarczające  było  określenie  tylko  8 (!)  parametrów 
(z0,  zc,  xn , zN,  xhi,  zhi,  xhz,  zhz)-  Tak  więc  znajo- 
mość grupy  przestrzennej  zredukowała  liczbę  koniecz- 
nych do  wyznaczenia  parametrów  z 48  do  8.  Położenie 


Rys.  41.  Struktura  mocznika  COCNH^:  a)  Rzut  struktury  na 
płaszczyznę  XY;  zaznaczono  położenie  osi  czterokrotnych  in- 
wersyjnych  w jednej  komórce  elementarnej,  b)  Elementy  symetrii 
grupy  przestrzennej  P42xm 


cząsteczek  mocznika  w komórce  elementarnej  oraz 
usytuowanie  ich  względem  elementów  symetrii  grupy 
przestrzennej  P42xm  pokazane  jest  na  rys.  41.  Na 
podstawie  współrzędnych  xyz  atomów  można  łatwo 
obliczyć  długości  wiązań  między  atomami,  kąty  mię- 
dzy wiązaniami  oraz  określić  kształt  cząsteczki  (rys. 

22).  Cząsteczki  połączone  są  między  sobą  wiązaniami 
wodorowymi : każdy  atom  tlenu  tworzy  cztery  wiąza- 
nia wodorowe  z atomami  azotu  należącymi  do  trzech 
różnych  cząsteczek  (rys.  2). 

Jak  wynika  z opisu  struktury  mocznika,  w komórce 
elementarnej  pewna  liczba  atomów  (5  — w opisywa- 
nym przypadku)  tworzy  swego  rodzaju  zespół  powta- 
rzany elementami  symetrii  grupy  przestrzennej  w ca- 
łej objętości  komórki  elementarnej  (no  i w całym 
krysztale).  Taka  grupa  atomów  nazywa  się  motywem  motyw 
struktury,  a część  komórki  elementarnej,  w której  struktury 
znajduje  się  motyw,  jest  asymetryczną  częścią  ko- 
mórki. Znając  grupę  przestrzenną  danego  ciała  kry- 
stalicznego wystarczy  wyznaczyć  współrzędne  ato- 
mów tylko  w motywie  struktury,  a następnie  można 
powtórzyć  ten  motyw  w całym  krysztale. 

Podobne  zależności  występują  także  w strukturach 
innych  pierwiastków  czy  związków  chemicznych. 


Problemy  krystalografii 
współczesnej 


Przedstawiona  teoria  symetrii  jest  już  dziś  teorią 
klasyczną,  dotyczącą  kryształów  idealnych.  Niewzru- 
szoność  praw  klasycznej  krystalografii  zostaje  poważ- 
nie zachwiana,  gdy  budowa  kryształów  odbiega  od 
idealnej  symetrii  sieciowej.  Przyjmuje  się,  że  w krysz- 
tałach idealnych  każdy  tego  samego  rodzaju  atom, 
pełniący  w strukturze  tę  samą  funkcję,  znajduje  się  w 
jednakowych  warunkach  geometrycznych  i fizycz- 
nych. W rzeczywistości  takie  kryształy  w przyrodzie' 
nie  występują  i bardzo  trudne  jest  ich  otrzymanie 
sztuczne.  Idealny  kryształ  musiałby  być  w zasadzie 
kryształem  nieskończonym,  stwierdzono  bowiem,  że 
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na  powierzchni  kryształu  atomy  układają  się  inaczej 
niż  w jego  wnętrzu. 

W latach  trzydziestych  rentgenostrukturalne  meto- 
dy badania  kryształów  zaczęto  stosować  do  badania 
struktur  biologicznych,  m.in.  kryształów  białek.  I tu 
zaczęły  się  dziać  dziwne  rzeczy,  gdyż  wkrótce  okazało. 
się,  że  metody  klasycznej  krystalografii  są  niewystar- 
czające dla  interpretacji  wyników  tych  badań.  Ogólnie 
przyjmuje  się,  że  kryształami  są  struktury  uporządko- 
wane w trzech  kierunkach  przestrzeni.  Możliwe  są 
jednak  i struktury  uporządkowane  tylko  w jednym 
lub  dwu  wymiarach.  Struktury  takie  nie  podlegają 
ograniczeniom  klasycznej  krystalografii.  Mogą  w nich 
występować  np.  5-  i 7-krotne  osie  symetrii,  a jednost- 
kami strukturalnymi  mogą  być  prócz  atomów,  jonów 
czy  cząsteczek  np.  wirusy  (iL  64,  tabl.  17).  Wiele 
struktur  biologicznych  tworzy  kryształy  dwuwymia- 
rowe. Powierzchniami  dwuwymiarowych  kryształów 
są  otwarte  cylindry  i zamknięte  kule,  na  których  roz- 
mieszczane są  równoważne  cząstki.  Doświadczalnie, 
metodą  dyfrakcji  promieni  rentgenowskich  stwier- 
dzono istnienie  wirusów  mających  postać  kul,  cylin- 
drów oraz  wielościanów. 

W wyniku  badań  rentgenostrukturalnych  okazało 
się,  iż  symetria  hel  iksów  a w białkach  fibrylamych 
nie  mieści  się  w klasycznej  teorii  symetrii  kryształów, 
gdyż  np.  w polipeptydzie  na  jeden  zwój  heliksu  nie 
przypada  całkowita  liczba  grup  aminokwasowych 
(jest  to  sprzeczne  z własnościami  klasycznej  osi  śru- 
bowej). Bywa  np.,  że  18  reszt  aminokwasowych  mieści 
się  w 5 zwojach  heliksu,  co  w sumie  daje  osiemnasto- 
krotną  oś  śrubową  o składowej  translacyjnej  5/is* 
Symbol  takiej  osi:  18s. 

Wirusy  globularne  krystalizują  na  tyle  dobrze,  że 


można  otrzymać  obrazy  dyfrakcyjne  ich  monokry- 
ształów. Kryształy  wirusa  zarazy  pomidorowej  mają 
komórkę  elementarną  w kształcie  sześcianu  (a  = 

= 386  A),  lecz  symetria  tej  komórki  nie  należy  do 
układu  regularnego.  Dla  poszczególnych  cząsteczek 
wirusa j charakterystyczna  jest  symetria  ikosaedru 
i w związku  z tym  nie  mają  one  symetrii  krystalogra- 
ficznej. lkosaedr  (rys.  42)  jest  wielościanem  zbudowa- 
nym z 20  ścian  będących  jednakowymi  równobocz-  Rys.  42.  lkosaedr 
nymi  trójkątami.  W ikosaedrze  istnieje  6 pięciokrot- 
nych osi  symetrii,  10  trójkrotnych  i 15  dwukrotnych 
osi  symetrii.  Taka  symetria  charakterystyczna  jest  dla 
wszystkich  „sferycznych”  wirusów  roślinnych  i nie- 
których wirusów  ssaków. 

Z tych  przykładów  widać,  że  zaistniała  potrzeba 
stworzenia  nowej,  uogólnionej,  rozszerzonej  krystalo- 
grafii, w której  proste  i płaszczyzny  sieciowe  zostałyby 
zastąpione  dowolnymi  krzywymi  i powierzchniami 
pełniącymi  ich  rolę  w strukturach.  Klasyczna  krysta- 
lografia, z jej  prostymi  i płaszczyznami  sieciowymi 
byłaby  szczególnym  przypadkiem  tej  nowej,  uogól- 
nionej krystalografii  (-►  Współczesne  teorie  symetrii 
w krystalografii). 
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G.  B.  Boku,  Kristałiochimija , Moskwa  1971;  M.  J.  Buerger  Ele- 
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Crystallography , Oxford  1961;  G.  Burns,  A.  M.  Glazer  Space 
Groups  for  Solid  State  Scicntists , New  York,  London,  1978;  J. 
Chojnacki  Elementy  krystalografii  chemicznej  i fizycznej,  War- 
szawa  1973;  A.  I.  Kitajgorodskij  Organiczeskaja  knstalłochi- 
nuja , Moskwa  1955;  I.  Kostow  Kristałlografija , Moskwa  1965; 
S.  C.  Nyburg  X-Ray  Analysis  of  Organie  Structures,  NcwYork; 
London,  1941 ; 1. 1.  Szafranowskij  Kristałlografija , 2, 326  (1957), 
1. 1.  Szafranowskij  Lekcii  po  kristalłomorfologii , Moskwa  1968; 
B.  K.  Wa jnsztejn  Sowriemiennaja  kristałlografija, Tom  1 , Moskwa 
1979. 


Otrzymywanie  monokryształów 

Zdzisław  Sołtys 


Duże,  przejrzyste  pojedyncze  kryształy  zawsze  wzbu- 
dzały podziw'  ludzi  symetrią  swojego  kształtu,  zdol- 
nością załamywania  światła  i barwami,  a jeśli  odzna- 
czały się  przy  tym  twardością,  nazywano  je  kamie- 
niami szlachetnymi.  Niektóre  kamienie  szlachetne, 
pojedyncze  kryształy  minerałów,  szczególnie  po  od- 
powiedniej obróbce  'szlifierskiej,  oprawione  w złoto 
lub  platynę  używane  były  i są  jako  cenne  ozdoby. 
Najpiękniejsze  i najdroższe  okazy  kryształów  od  wielu 
wieków  przechowywane  są  w skarbcach  władców, 
w prywatnych  kolekcjach  miłośników  minerałów  lub 
w muzeach. 

Rozwój  nauk  przyrodniczych,  głównie  fizyki  ciała 
stałego,  stworzył  zapotrzebowanie  na  duże  pojedyn- 
cze kryształy  wielu  substancji  nieorganicznych  i orga- 
nicznych. W krótkim  czasie  okazało  się,  że  naturalne 
źródła  są  niewystarczające  lub  w ogóle  nie  istnieją. 
Stan  taki  spowodował  rozwój,  laboratoryjnych  i prze- 
mysłowych metod  wytwarzania  dużych,  pojedynczych 
kryształów  zwanych  monokryształami.  Właściwy 
rozwój  metod  wytwarzania  monokryształów  rozpo- 
czął się  od  czasu  wynalezienia  tranzystora  przed  30 
laty.  Zastosowanie  monokryształów  jako  materiałów 
konstrukcyjnych  głównie  w elektronice,  a także  w in- 
nych gałęziach  techniki,  stało  się  początkiem  tzw.  re- 
wolucji materiałowej  (tabela). 

Obecnie  coraz  mniej  stosuje  się  materiałów  w po- 
staci naturalnej  lub  drobnokrystalicznej  zastępując  je 
monokryształami.  Materiały  monokrystaliczne  odzna- 
czające się  doskonałą  jednorodnością  fizyczną  i che- 
miczną ujawniły  nowe  właściwości,  nic  wykazywane 
przez  te  same  materiały  w postaci  naturalnej  — - za- 
nieczyszczonej lub  drobnokrystalicznej.  (Szczególnie 
interesujące  mogą  okazać  się  właściwości  polimerów 
organicznych  w postaci  monokrystalicznej).  Od  mono- 
kryształów nie  wymaga  się  zewnętrznego  podobień- 


Zastosowanie  niektórych  materiałów  monokrystalicznych 


Zastosowanie 


Monokryształy* 


Przyrządy  półprzewodnikowe : diody 
tranzystory,  układy  scalone 
Lasery  półprzewodnikowe 

Generatory  ze  stabilizacją 
częstotliwości 

Modulatory  i rezonatory  laserowe 
wzmacniacze  parametryczne 

Przetworniki  elektromechaniczne 
(piezoelektryczne) 

Przyrządy  optyczne;  soczewki, 
pryzmaty,  polaryzatory 
Optyka  w podczerwieni: 
soczewki,  pryzmaty 
Przyrządy  luminescencyjne 
Detektory  promieniowania 


Wzmacniacze  ultradźwiękowe 
Wzmacniacze  mikrofalowe 
Podzespoły  mikrofalowe  magnet. 

Elementy  pamięci  maszyn 
cyfrowych 


Si,  Ge,  GaAs 

rubin  AIaOa:Cr, 
CaW04,  CaFs,  GaAs 
kwarc  a-SiOa 


KHcP04,  LiNbOj, 
LiTaOa, 

(Ba,  NaXNb08);l 
kwarc  <x-SiOa,  BaTiOa, 
GaAs,  sól  Seignette’a 
NaK(C4H404)  • 4FTO 
kalcyt  CaCOj,  CaFa, 
SiOa,  NaNOa 
Ge,  Si,  LiF,  KBr 

GaP,  Ga(As,  P),  GaAs 
antracen  C14H,0,  KC1, 
Si,  GaAs,  NaJ:TI, 

Ge:  Li,  NH4H4P04 
CdS 

rubin  AlaOs:Cr 
granaty,  np.  YaFefiOia 
(YIG) 
granat 

EuI>BGdl>1AlacFe4ł50|i 
na  podłożu  granatu 


Monochromatory,  filtry  strumienia 
neutronów 

Materiały  ścierne  i elementy  tnące 


Łożyska  w przyrządach  pomiaro- 
wych i mechanizmach  precyzyjnych 
Klejnoty  i ozdoby 


GdjAljOu 

Cu,  Zn,  stop  0,92  Co  4- 
+ 0,08Fe 

korund  <r-AlaQ,,  szafir 
AL03:Fc,  Ti,  diament  C, 
węglik  krzemu  SiC 
szafir,  korund,  rubiny 

rubiny,  szafiry 


•Zapis  Ala03:  Cr  oznacza,  że  chrom  jest  niewidką  domieszką 
wr  krysztale,  celowo  wprowadzonym  zanieczyszczeniem.  Zapis 
typu  Ga(As,  P)  oznacza,  że  pewna  część  atomów  arsenu  jest 
zastąpiona  przez  atomy  fosforu  w krysztale  arsenku  galu  GaAs. 
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monokrysz- 

tałów 
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stwa  (choć  nie  zawsze)  do  naturalnych  pojedynczych 
kryształów,  ale  za  to  wysokiej  czystości  chemicznej 
(wymagana  dopuszczalna  zawartość  zanieczyszczeń 
czasem  jest  znacznie  poniżej  10-6  %)  oraz  dużej  do- 
skonałości krystalograficznej  (jednolita  sieć  prze- 
strzenna bez  dyslokacji  i innych  defektów  w rozmiesz- 
czeniu atomów  w krysztale,  —►  Budowa  kryształów), 
braku  naprężeń  mechanicznych  itp.  Uzyskiwane  mo- 
nokryształy powinny  zawierać  celowo  wprowadzone 
w żądanej  ilości  domieszki  różnych  atomów  rozmiesz- 
czonych w przestrzeni  monokryształu  równomiernie 
lub  w inny,  z góry  określony  sposób.  Wszystkie  te 
wymagania  spełnia  współczesna  technologia  wytwa- 
rzania monokryształów  rozmaitych  substancji,  mimo 
że  procesy  monokrystalizacji  (wzrostu  monokryszta- 
łów) nie  są  jeszcze  teoretycznie  dobrze  wyjaśnione. 
Umiejętność  „hodowli”  monokryształów  jest  jeszcze 
do  dziś  bardziej  sztuką  niż  nauką. 

Monokryształy  tworzą  się  w procesie  powstawania 
fazy  stałej  (krystalicznej)  z fazy  gazowej  albo  z fazy 
ciekłej  lub  w procesie  przemiany  jednej  fazy  stałej 
w inną.  Powstanie  fazy  stałej  w środowisku  gazowym 
lub  ciekłym  polega  na  wytworzeniu  trwałego  zarodka 
powstawanie  fazy  stałej  i utrzymywaniu  w tym  ośrodku  warunków, 
zarodków  w których  zarodek  ten  może  rosnąć.  Warunkiem  ko- 
niecznym do  wytworzenia  się  zarodków  fazy  stałej 
jest  powstanie  przesycenia  w ośrodku  gazowym  lub 
w roztworze,  a przechłodzenia  — w ośrodku  ciekłym. 
Miarą  przesycenia  jest  różnica  ciśnienia  (stężenia) 
ponad  ciśnienie  (stężenie)  równowagowe  w danej  tem- 
peraturze. Miarą  przechłodzenia  jest  różnica  tempera- 
tury układu  poniżej  temperatury  topnienia  fazy  stałej. 
Im  większe  przesycenie  lub  przechłodzenie,  tym  ła- 
twiej i tym  więcej  powstaje  zarodków  drobnych.  Dla 
uzyskania  kilku  trwałych  i względnie  dużych  zarod- 
ków i ich  dalszego  wzrostu  konieczne  jest  małe  prze- 
sycenie (przechłodzenie). 

W hodowli  monokryształów  bardzo  często,  a w nie- 
których wypadkach  wyłącznie,  wykorzystuje  się  nie 
przypadkowe  powstawanie  zarodków  fazy  stałej  wsku- 
tek przechłodzenia  czy  przesycenia,  lecz  przeprowadza 
się  proces  polegający  na  powiększeniu  objętości  nie- 
zarodź  wielkiego  monokryształu,  zwanego  zarodzią,  umiesz- 
kryształu  czonego  w ośrodku  dostarczającym  materiału  do  jego 
wzrostu.  Zarodzie  otrzymuje  się  z przypadkowo  po- 
wstałych w przesyconym  lub  przechłodzonym  roztwo- 
rze zarodków,  jednakże  tak  kieruje  się  procesem,  aby 
powstało  ich  niewiele.  Często  duże  zarodzie  kształtuje 
się  przez  rozcinanie  lub  szlifowanie  w postać  pręci- 
ków o wybranej  orientacji  krystalograficznej  powie- 
rzchni czołowej  zarodzi.  Wtedy  dalszy  wzrost  zarodzi 
monokryształu  może  odbywać  się  tylko  zgodnie  z tym 
wybranym  kierunkiem. 


Wzrost  monokryształów 
z roztworów  ciekłych 

Proces  wzrostu  monokryształów 
z roztworów  wodnych 

Najstarszą  metodą  otrzymywania  substancji  w postaci 
krystalicznej  jest  hodowla  kryształów  z roztworów 
wodnych.  Tak  otrzymuje  się  sól  kuchenną  z solanek, 
nawozy  sztuczne  itp.  Tak  też  wytwarza  się  cukier, 
pierwszą  drobnokrystaliczną  substancję  otrzymywaną 
przemysłowo  na  wielką  skalę,  a nie  występującą  w 
przyrodzie  w postaci  krystalicznej.  Zwykłe  przemy- 
słowe procesy  krystalizacji  mają  na  celu  wydzielenie 
z roztworu  w maksymalnej  ilości  jednorodnego  pro- 
duktu w postaci  drobnych  kryształów  o prawie  jedna- 
kowych rozmiarach,  zaś  doskonałość  otrzymanych 
kryształów  jest  bez  znaczenia. 

W procesie  wytwarzania  dużych  kryształów  o dużej 
doskonałości  krystalograficznej  z roztworów  ciekłych 
zasadniczo  nie  wykorzystuje  się  spontanicznego  po- 


wstawania zarodków  w roztworze  przesyconym  i ich 
dalszego  wzrostu,  lecz  kontroluje  się  wzrost  kryształu 
na  zarodzi  zawieszonej  w roztworze  o stałym  przesy- 
ceniu (stałe  przesycanie  roztworu  uzyskuje  się  przez 
bardzo  powolne  w miarę  wzrostu  kryształu  ochładza- 
nie roztworu  według  odpowiedniego  programu). 
Szybkość  wzrostu  poszczególnych  płaskich  ścian  kry- 
ształu zawieszonego  w roztworze  zależy  od  wielu 
czynników,  m.in.  od  stężenia,  temperatury,  lepkości 
roztworu,  dyfuzji  substancji  rozpuszczonej  do  rosną- 
cej powierzchni  kryształu,  zawartości  zanieczyszczeń 
oraz  celowo  dodanych  domieszek.  Od  parametrów 
roztworu  zależą  także  kształt  otrzymywanych  krysz- 
tałów i ich  doskonałość.  Na  przykład  podczas  kry- 
stalizacji chlorku  sodowego  NaCł  z czystego  roztworu 
powstają  małe  nieprzejrzyste  kryształy,  ale  dodanie 
0,1%  jonóv.r  Pb2+  do  zakwaszonego  roztworu  NaCl 
powoduje,  że  wr  temperaturze  75°C  otrzymuje  się 
spore  (6x6x6  mm)  przejrzyste  monokryształy  NaCl 
o dużej  doskonałości. 

Najprostszy  sposób  otrzymywania  monokryszta- 
łów polega  na  zawieszeniu  zarodzi  na  nici  (druciku) 
w roztworze  nasyconym  w temperaturze  wyższej  od 
temperatury  otoczenia ; zarodź  ta  podczas  naturalnego 
swobodnego  stygnięcia  roztworu  powiększa  swoje 
rozmiary.  Doskonalsze  kryształy  uzyskuje  się  na  za- 
rodziach  ruchomych.  W krystalizatorze  Holdena 
(rys.  1)  zarodzie  mocowane  są  na  końcach  prętów 
wolframowych  zaciśniętych  w ramionach  obracają- 


cego się  bardzo  powoli  (i  ze  zmianą  kierunku  obrotu) 
mieszadła  zanurzonego  w naczyniu  z roztworem  nasy- 
conym. Delikatne  mieszanie  powoduje  wyrównywanie 
się  stężenia  roztworu  ochładzanego  w sposób  ciągły 
o 0,1-1 ,5°C  na  dobę.  W dużych  przemysłowych  kry- 
stalizatorach  typu  Holdena  otrzymuje  się  np. 
monokryształy  fosforanu  dwuwodoroamonowego 
NH4H2P04  o masie  ok.  20  kg;  czas  wzrostu  takiego 
monokryształu  wynosi  4 miesiące. 

Ogólna  masa  monokryształów  związków  nieorga- 
nicznych i organicznych  hodowanych  na  świecie 
z roztworów  wodnych  w zwykłych  temperaturach 
przekracza  kilkaset  ton  rocznie. 


Proces  wzrostu  monokryształów  z topnika 

W podwyższonych  temperaturach  stopione  sole, 
tlenki,  wodorotlenki  lub  metale  stają  się  rozpuszczal- 
nikami (topnikami)  innych  substancji.  Mieszaninę 
substancji,  która  ma  być  otrzymana  w postaci  mono- 
kryształu, i topnika,  umieszcza  się  w tyglu  odpornym 
na  działanie  stopu  i ogrzewa  się  ją  do  stopienia. 
Skład  mieszaniny  dobiera  się  tak,  aby  uzyskać  w top- 
niku roztwór  nasycony  substancji  krystalizującej. 
Początkowo  tygiel  ochładza  się  powoli  z szybkością 
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hodowla 

tytanianu 

baru 


hodowla 
kwarcu  a 


kilku,  kilkunastu  stopni  na  godzinę.  W pewnym  mo- 
mencie powstaje  przesycenie  i rozpoczyna  się  tworze- 
nie zarodków  a następnie  dalszy  ich  wzrost,  ewentu- 
alnie wzrost  umieszczonej  w tyglu  zarodzi.  Przez  cały 
czas  krystalizacji,  zachodzącej  zwykle  w temperatu- 
rze 800-900°C,  temperaturę  tygla  obniża  się  bardzo 
powoli,  po  czym  ochładza  się  go  szybciej.  Chłodny 
topnik  i kryształy  wymywa  się  z tygla  gorącą  wodą, 
roztworami  kwasów  lub  zasad  w zależności  od  rodza- 
ju kryształów  i rodzaju  topnika,  a następnie  wytwo- 
rzone kryształy  oddziela  się  od  siebie.  Monokryształy 
otrzymane  tą  metodą  mogą  zawierać  pewną  ilość  za- 
trzymanego (okludowanego)  topnika. 

Z roztworów  w topniku  otrzymuje  się  np.  mono- 
kryształy tytanianu  baru  BaTi03ze  stopionego  fluorku 
potasowego  KF  (zakres  temperatury  krystalipcji 
1200-850°C,  szybkość  studzenia  1-5°C  na  godzinę); 
monokryształy  fosforku  galu  GaP  z roztworu  w galu 
(zakres  temperatury  krystalizacji  1200-900°C,  szyb- 
kość studzenia  t°C  na  godzinę). 


Krystalizacja  hydrotermałna 

Dość  dawno  zauważono  że  kwarc,  znany  jako  sub- 
stancja nierozpuszczalna  w wodzie  w temperaturach 
zwykłych,  wykazuje  pewną  rozpuszczalność  w tempe- 
raturach w pobliżu  lub  powyżej  jej  temperatury  kry- 
tycznej (374,2°Q,  szczególnie  jeśli  do  rozpuszczania 


przegroda 


kwarcowy 


korpus  autoklawu 


zarodzie 


głowica,  autoklawu 


Rys.  2.  Autoklaw  do  monokrystalizacji  kwarcu  metodą  hydroter- 
malną 


użyje  się  słabo  zasadowego  roztworu.  Proces  nosi 
nazwę  krystalizacji  hydrotermalnej.  Przebiega  on  w 
grubościennych  stalowych  autoklawach,  pod  ciśnie- 
niem 145  MPa  (rys.  2).  W autoklawie  umieszcza  się 
na  dnie  złom  kwarcowy  o odpowiednim  uziamieniu. 
Następnie  autoklaw  napełnia  się  roztworem  wodoro- 
tlenku sodowego  NaOH  i ogrzewa  w taki  sposób,  aby 
temperatura  dołu  autoklawu  wynosiła  ok.  400CC, 
a temperatura  obszaru  krystalizacji  wynosiła  360°C. 
Monokryształy  kwarcu  rosną  w tych  warunkach  ok. 
6 mm  dziennie  w kierunku  [0001]. 


Monokryształy  kwarcu  wyhodowane  metodą  hy- 
drotermalną  w dużym  autoklawie  w Western  Electric 
Company  pokazane  na  il.  3 (tabl.  1)  mają  masę 
ok.  800  g każdy.  Metodą  hydrotermalną  otrzymuje 
się  i inne  monokryształy,  np.  korundu  a-Al203 
z wodnego  1 molowego  roztworu  węglanu  sodowego 
Na2C03  (temperatura  krystalizacji  405°C,  tempera- 
tura rozpuszczania  435°C),  a kryształy  magnetytu 
Fe304  z 0,5  molowego  roztworu  wodnego  chlorku 
amonowego  NH4C1  (odpowiednie  temperatury  530°C 
i 515°C). 


Wzrost  monokryształów  podczas 
krzepnięcia  substancji  stopionej 


Proces  krzepnięcia  stopionej  substancji  czyli  proces 
krystalizacji  przebiega  pod  warunkiem  odprowadza- 
nia ciepła  z fazy  ciekłej  i rozpoczyna  się  od  powstania 
unoszących  się  w jej  objętości  trwałych  zarodków  fazy 
stałej  (kryształów),  jeżeli  występuje,  przynajmniej  lo- 
kalnie, temperatura  nieco  niższa  od  temperatury  top- 
nienia, tzn.  jeżeli  występuje  lokalnie  przechłodzona 
faza  ciekła.  Dalszy  wzrost  kryształów  na  tych  zarod- 
kach ewentualnie  na  zarodziach  umieszczonych  w 
stopionej  substancji  następuje  w wyniku  umiejsca- 
wiania się  atomów  (jonów,  cząsteczek)  fazy  ciekłej 
w węzłach  sieci  kryształu  na  powierzchni  zarodków 
trwałych  lub  zarodzi.  Proces  taki  może  przebiegać  w 
sposób  naturalny  lub  może  być  sterowany.  Wszystkie 
procesy  otrzymywania  monokryształów  na  skalę  tech- 
niczną są  procesami  sterowanymi.  Stosowana  metoda 
wzrostu  monokryształu  w procesie  przemiany  fazy 
ciekłej  w stałą  zależy  od  właściwości  fizycznych  sub- 
stancji krystalizowanej. 

Monokryształy  otrzymywane  podczas  krzepnięcia 
substancji  roztopionej  mają  zwykle  kształt  prętów  lub 
wydłużonych  bloków.  W temperaturze  krzepnięcia 
substancja  stopiona  ma  dużą  iepKość,  iaK  ze  nie  mogą 
wytworzyć  się  płaskie  powierzchnie  ścian  charaktery- 
styczne dla  substancji  krystalicznych,  uzyskiwanych 
podczas  krystalizacji  z roztworów  lub  powstające  pod- 
czas kondensacji  fazy  gazowej.  Otrzymywane  pręty 
monokrystaliczne  i bloki  są  właściwie  krystalitami, 
jednakże  powszechnie  nazywa  się  je  monokryształami. 
Niemniej  cały  taki  krystalit  — monokryształ  ma  jed- 
nolitą sieć  przestrzenną,  wykazującą  tę  samą  symetrię 
i stałe  sieciowe,  jaką  wykazuje  kryształ  z wykształ- 
conymi ścianami.  Średnice  monokryształów  wytwa- 
rzanych obecnie  wynoszą  od  kilkunastu  a nawet  kilku- 
dziesięciu milimetrów,  a długości  od  kilku  do  kilku- 
dziesięciu centymetrów.  Masa  pojedynczych  bloków 
monokryształów,  np.  krzemu,  dochodzi  do  ok.  20  kg 
(cena  takiego  monokryształu  wynosi  nawet  ponad 
20  tys.  dolarów  za  1 kg).  Wytwarza  się  obecnie  na 
większą  skalę  monokryształy  ponad  50  pierwiastków, 
bardzo  wielu  związków  chemicznych,  a nawet  mono- 
kryształy niektórych  stopów.  W większości  metod 
otrzymywania  monokryształów  podczas  krzepnięcia 
stopionej  substancji  wykorzystuje  się  gotowe  zarodzie. 


Monokrystaiizacja  metodą 
Bridgmana— Stockbargera 

Najpowszechniej  stosowaną  metodą  wytwarzania  za- 
rodków kryształu  we  wstępnej  fazie  procesu  jest  meto- 
da Bridgmana-Stockbargera.  Sterowanie  wzrostem 
zarodków  powstających  w obszarze  gradientu  tem- 
peratury w ampule-tyglu  polega  na  odpowiednim 
ukształtowaniu  dna  tygla.  Tylko  zarodek  ułożony 
równolegle  do  osi  pionowej  może  rosnąć  i wypełnić 
całą  ampułę.  Wszystkie  inne  zarodki  kończą  swój 
wzrost  na  ściance  wydłużonej  części  dna  ampuły-tygla. 
Po  zakończeniu  tej  fazy  tygiel  opuszcza  się  mechanicz- 
nie w dół  Dieca  — w obszar  o niższej  temperaturze  — 
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hodowla 
korundu 
i magnetytu 


postać 
otrzymywa- 
nych mono- 
kryształów 


z prędkością  kilku  milimetrów  na  godzinę  i uzyskuje 
się  ostatecznie  monokryształ  wypełniający  ampułę-ty- 
giel  (rys.  3).  Ampułę  (łódkę)  można  również  umieścić 


Istnieją  liczne  odmiany  metody  Czochralskiego  do- 
stosowane do  właściwości  substancji  (tabela).  Proces 
wyciągania  kryształów  prowadzi  się  w atmosferze 


pokrywa 


przegroda 


uchwyt  metalowy  — 

Rys.  3.  Schemat  urządzenia  do  otrzymywania  monokryształów 
metodą  Bridgmana-Stockbargcra 


piec  // 


granica  faz 


monokryształ 


w piecu  poziomo.  Substancje  łatwo  parujące  lub  roz- 
kładające się  w temperaturze  niższej  niż  temperatura 
topnienia  umieszcza  się  w szczelnie  zespawanych  am- 
pułach,  zwykle  kwarcowych,  ustawionych  poziomo, 
zastosowana®  Metodę  Bridgmana-Stockbargera  stosuje  się  przy 
metody  wytwarzaniu  monokryształów  związków  półprzewod- 
Bridgmana-  nikowych  łatwo  rozkładających  się  poniżej  tempera- 
Stcckbar-  tury  topnienia,  większości  metali  oraz  niektórych 
gera  związków  nieorganicznych  i organicznych  (tabela). 


Przykłady  monokrystałizacj!  metodą  Bridgmana-Stock- 
bargera 


Substancja 

" 

Tempera- 
tura top- 
nienia 
°C 

Gra- 

dient 

tempe- 

ratury 

°C/mm 

Szyb- 

kość 

wzrostu 

(opusz- 

czania 

tygla) 

mm/h 

Mate- 

riał 

tygla 

(ampu- 

ły> 

Atmosfe- 

ra 

Argon  Ar 

- 189,4 

0,5 

60 

szkło 

argon 

Miedź  Cu 
Fluorek  wap- 

1083 

12 

16 

grafit 

azot 

nia  CaFa 

1392 

10 

1 

grafit 

próżnia 

Arsen  As 

814 

(3,6  MPa) 

8 

(pozio- 

my) 

ok.10 

kwarc 

pary  ar- 
senu 
(6  MPa) 

Arsenek 
galu  GaAs 

1238 

(rozkład) 

30 

(pozio- 

L 2LI 

20 

kwarc 

pary  ar- 
senu 

(0,09  MPa) 

ft«onokrystalizacja  metodą  Czochralskiego 

W metodzie  Czochralskiego  również  wykorzystuje  się 
wzrost  monokryształu  na  gotowej  zarodzi  umocowa- 
nej w uchwycie  i stykającej  się  z powierzchnią  sub- 
stancji stopionej.  W miarę  odprowadzania  ciepła  przez 
zaródź  i przez  uchwyt  na  granicy  faz  ciecz-zaródź 
narasta  monokryształ  powoli  unoszony  uchwytem 
zarodzi.  Podczas  obserwacji  tego  procesu  odnosi  się 
wrażenie,  że  monokryształ  jest  wyciągany  z fazy  sto- 
metoda  pionej  znajdującej  się  w tyglu ; stąd  druga  nazwa  me- 
wyciągania  *ody  — metoda  wyciągania  monokryształu  (rys.  4). 

Jeśli  szybkość  krystalizacji  jest  większa  niż  szybkość 
wyciągania,  średnica  powstającego  kryształu  jest  coraz 
większa  i odwrotnie.  Podobny  efekt  uzyskuje  się  w 
wyniku  obniżenia  temperatury  przy  granicy  faz  przez 
obniżenie  temperatury  substancji  stopionej  znajdują- 
cej się  w tyglu.  Natomiast  gdy  szybkości  wyciągania 
i krystalizacji  są  sobie  równe,  a ponadto  uchwyt 
z monokryształem  wprawiony  jest  w ruch  obrotowy, 
to  uzysKujemy  monokryształ  o stałej  średnicy. 
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.uchwyt  zarodzi 


stopiona 

indukcyjna 

w.  cz. 

grafitowy 


wodna 


obrotowego 
i pionowego 


ruchu 


Rys.  4.  Schemat  urządzenia  do  wyciągania  monokryształów  me- 
todą Czochralskiego 


gazu  ochronnego  (argon,  azot,  wodór,  hel),  w próżni 
lub  w układzie  otwartym  na  powietrzu.  Monokrysz- 
tały substancji  rozkładających  się  w pobliżu  tempera- 
tury topnienia  otrzymuje  się  w komorze  pod  odpo- 
wiednim ciśnieniem  par  składników,  mniejszym  lub 
większym  od  ciśnienia  atmosferycznego.  Tygle  do 
topienia  ogrzewane  są  grzejnikami  oporowymi.  Dość 


wlot 

>. 

gazu 


-mechanizm  ruchu 
obrotowego 
i pionowego 


_,-pręt  podnoszący 


^-komora 

kwarcowa 


Przykłady  monokrystalizacji  metodą  Czochralskiego 


Substancja 

Tem- 

pera- 

tura 

Pręd- 

kość 

wycią- 

gania 

cm/h 

Atmosfera, 

warunki 

procesu 

Rozmiary  mono- 
kryształu 

top- 

nienia 

°C 

śred- 

nica 

mm 

dłu- 

gość 

mm 

masa 

kg 

Bizmut  Bi 

271 

3 

próżnia 

75 

180 

German  Ge 

938 

0,6-36 

próżnia, 
tygiel  gra- 
fitowy 

35 

300 

Krzem  Si 

1410 

3-6 

próżnia  lub 
argon 

100 

1000 

20 

Arsenek 

galu 

GaAs 

Wolfram  ian 
wapnia 
CaWO 

1 

1238 

(roz- 

kład) 

1530 

1, 5-3,5 
0,5-2 

ciśnienie  As 
0,09  MPa 
lub  powie- 
rzchnia po- 
kryta 
ochronnie 
stopionym 
boraksem 
i ciśn.  0,09 
MPa  azotu 
powietrze, 
grzanie  prą- 
dami w.cz., 
tygiel 
rodowy 

35 

200 

zastosowanie 

metody 

Czochrał- 

skiego 


wygodne  jest  stosowanie  ogrzewania,  nawet  do  wyso- 
kich temperatur,  za  pomocą  indukcyjnych  prądów 
wielkiej  częstotliwości  (w.cz.).  W wypadku  gdy  topimy 
metale  lub  inne  substancje  przewodzące,  one  same  są 
odbiornikami  energii  wytwarzanej  przez  pole  wielkiej 
częstotliwości  i mogą  zostać  ogrzane  aż  do  stopienia 
w tyglu  z materiału  nieprzewodzącego  prądu  elek- 
trycznego. Jeśli  są  to  substancje  nieprzewodzące,  ty- 
giel kwarcowy  umieszcza  się  w dodatkowym  tyglu 
grafitowym. 

Monokryształy  otrzymane  metodą  Czochralskiego 
odznaczają  się  bardzo  wysoką  doskonałością  krysta- 
lograficzną; niektóre  są  bezdyslokacyjne,  nie  obser- 
wuje się  także  występowania  w nich  naprężeń  mecha- 
nicznych. Ponieważ  podczas  procesu  krzepnięcia  gra- 
nica między  fazą  ciekłą  i stałą  jest  płaska,  mono- 
kryształy otrzymane  tą  metodą  są  szczególnie  przy- 
datne do  produkcji  cienkich  płytek,  które  tnie  się 
z dużego  monokryształu  prostopadle  do  osi  wzrostu. 
Płytki  te  nie  wykazują  niejednorodności  własności 
fizycznych  wzdłuż  promienia. 


Topienie  strefowe 


Monokryształy  pierwiastków  i niektórych  stopów 
o wysokich  temperaturach  topnienia  (ponad  1400°C) 
można  otrzymać  w procesie  topienia  strefowego.  Na 
jednym  końcu  łódki  (tygla)  umieszcza  się  zaródź, 


cewka  indukcyjna 
w.  cz. 


ofikryształ 


a)  ruch  strefy 


zaródź 


monokryształ 


grzejnik  ogólny 


grzejnik  streiy 


ruch  strefy 


stopiona 


c) 


+ 

zasilacz  wysokiego 
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Rys.  5.  Sposoby  wytwarzania  strefy  stopionej  w procesie  mono- 
krystalizacji  a)  w otwartej  łódce  — grzanie  prądami  w.cz.;  b)  w 
zatopionej  ampule  — grzejnik  oporowy  strefy  lub  prądy  w.cz.; 
c)  sposób  beztyglowy  — grzanie  prądami  w.cz. ; d)  sposób  bez- 
tyglowy  — bombardowanie  strefy  elektronami  w próżni 


a w jej  pozostałej  części  materiał  polikrystaliczny. 

Między  zaród zią  i polikryształem  wytwarza  się  łączą- 
cą je  strefę  stopioną  i przesuwa  się  tę  strefę  z pręd- 
kością krystalizacji  w kierunku  od  zarodzi  (rys.  5a  i b). 

W ten  sposób  uzyskuje  się  monokryształ  o przekroju 
poprzecznym  nadanym  przez  kształt  łódki. 

Najbardziej  interesująca  jest  beztyglowa  odmiana  metoda 
tej  metody,  polegająca  na  tym,  że  w czasie  procesu  pływającej 
monokrystalizacji  pręt  polikrystaliczny  i zaródź  znaj-  strefy 
dują  się  w pozycji  pionowej.  Stopioną  strefę  między 
dwoma  odcinkami  „pręta”  utrzymują  siły  napięcia 
powierzchniowego  i jej  grubość  maksymalna  jest 
ograniczona.  W metalach  i substancjach  przewodzą- 
cych prąd  elektryczny  stopioną  strefę  uzyskuje  się  naj- 
częściej za  pomocą  cewki  indukcyjnej  wielkiej  często- 
ści w atmosferze  gazu  ochronnego  lub  przez  bombar- 
dowanie wąskiej  strefy  na  obwodzie  pręta  odpowied- 
nio ukształtowaną  wiązką  elektronów  w próżni  (rys. 

5c  i d).  Otrzymywane  tą  metodą  pręty  monokrysta- 
liczne  mają  przekrój  kołowy,  podobnie  jak  pręty 
otrzymywane  metodą  Czochralskiego.  W zależności 
od  wielkości  napięcia  powierzchniowego  w tempera- 
turze topnienia  na  powierzchni  zewnętrznej  pręta 
mogą  się  zaznaczyć  słabiej  lub  mocniej  ślady  symetrii 
krystalograficznej  w stosunku  do  kierunku  wybranego 
dla  zarodzi.  Na  przykład  dla  kierunku  [111]  wybra- 
nego dla  zarodzi  germanu  przekrój  pręta  mono- 


Przykłady  monokrystalizacji  metodą  pływającej  strefy 


Tem- 

Pręd- 

kość 

przesu- 

wania 

strefy, 

cm/h 

Rozmiary  strefy 

Substancja 

peratu- 
ra top- 
nienia, 
°C 

Sposób 

wytworzeni 

strefy 

! 

średni- 

ca 

mm 

wyso- 

kość 

mm 

Krzem  Si 

1410 

cewką  w.cz 

3 

25 

17 

Nikiel  Ni 

1450 

bombardo- 

wanie 

elektronam 

18 

6 

3 

Tytan  Ti 

1725 

cewką  w.cz 
w atmo- 
sferze 
argonu 

6 

10 

10 

Wofram  W 

3370 

bombardo- 
wanie elek- 
tronami 

18 

3-6 

3-6 

krystalicznego  germanu  wykazuje  wyraźniej  symetrię 
osi  trójkrotnej  [111]  niż  przekrój  pręta  krzemu  (il.  99, 
tabi.  25).  Metoda  topienia  strefowego  beztyglowego 
nosi  nazwę  metody  pływającej  strefy  (tabela). 


Monokrystalizacja  metodą  Verneuila 

Modyfikacją  metody  monokrystalizacji  na  zarodzi 
w temperaturze  krzepnięcia  substancji  jest  metoda 
Verneuila.  Jej  oryginalność  polega  na  dodawaniu 
materiału  w postaci  topiącego  się  proszku  do  kropli 
cieczy  znajdującej  się  na  wierzchołku  wytwarzanego 
monokryształu  (rys.  6).  W pierwszym  rozwiązaniu 
technicznym  Vemeuila  (1902)  służącym  do  otrzymy- 
wania monokryształów  korundu  (a-Al203),  szafiru  korund, 
(A1203:  Ti  i Fe)  i rubinu  (A1203:  Cr)  posługiwano  się  szafiry 
palnikiem  tlenowo-wodorowym  do  wytworzenia  * rubiny 
kropli  i do  topienia  drobnokrystalicznego  tlenku 
glinu  (a-AI203)  z ewentualnymi  domieszkami  lub 
mieszaniny  tlenku  magnezu  MgO  i tlenku  glinu  do 
wytworzenia  monokrystalicznego  spinelu  Mg(AIQ2)2. 
Monokryształy  szafiru,  korundu  czy  rubinu  otrzymy- 
wane tą  metodą  były  z reguły  mało  doskonałe  i pękały 
po  ostudzeniu  wskutek  naprężeń  wywołanych  wystę- 
powaniem dużych  gradientów  temperatury  podczas 
wzrostu  kryształu  będącego  słabym  przewodnikiem 
ciepła.  Sztuczne  rubiny  stosowano  początkowo  głów- 
nie w jubilerstwie,  jako  łożyska  (kamienie)  w ze- 
garkach lub  jako  pryzmaty  do  czułych  wag. 

Dopiero  rozwój  fizyki  i elektroniki  ciała  stałego  po 
II  wojnie  światowej  wpłynął  na  udoskonalenie  metody 
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Verneuila  i otrzymywane  obecnie  tą  metodą  mono- 
kryształy odznaczają  się  lepszymi  właściwościami  niż 
kryształy  naturalne.  Zastosowano  precyzyjne  urzą- 


Rys.  6.  Schemat  urządzenia  do  otrzymywania  monokryształów 
metodą  Yerneuiia 


dzenia  do  sterowania  procesem  wzrostu  i usuwania 
naprężeń  w kryształach  oraz  wprowadzono  kilka  no- 
wych układów  ogrzewania  (palnik  plazmowy,  ogrze- 
wanie prądami  indukcyjnymi  wielkiej  częstotliwości, 
ogrzewanie  zogniskowaną  energią  promieniowania 
zastosowanie  łuku  elektrycznego).  Umożliwiło  to  otrzymywanie 
metody  monokryształów  nie  tylko  korundu,  szafiru  czy  ru- 
Verneuila  binu,  ale  też  i in.  trudno  topliwych  tlenków  jak  ru- 
tylu  TiOa  (temperatura  topnienia  Tt  = 1830°C), 
tlenku  cyrkonu  Zr02  (Tt  — 2700° C),  tlenku  magnezu 
MgO  (Tt  — 2640°C),  tlenku  wapnia  CaO  (Tt  — 
= 2570°C),  tlenku  niklu  NiO  (Tt  = 2090°C)  oraz 
ferrytów  (Tt  - 1200-1800°C). 

Metodą  Verneuila  uzyskano  też  monokryształy 
węglików,  azotków,  borków,  krzemków,  berylków 
metali,  substancji  bardzo  łatwo  utleniających  się 
i bardzo  trudno  topliwych  (Tt  = 2000-4000°C). 
Metodą  Vemeuila  wytwarza  się  obecnie  monokrysz- 
tały ok.  100  substancji. 


Wzrost  monokryształów  przez 
przemianę  w fazie  stałej 

Otrzymywanie  dużych  monokryształów  przez  prze- 
mianę w fazie  stałej  stosuje  się  wtedy,  gdy  zależy  nam 
na  uzyskaniu  monokryształów  o określonym  kształ- 
cie, np.  w postaci  cienkich  taśm,  drutów  o małej 
średnicy,  albo  gdy  ma  być  zachowana  jednorodność 
składu  stopu  lub  rozmieszczenie  atomów  domieszki. 
Jeśli  substancja  podlega  przemianie  fazowej  w fazie 
stałej  między  temperaturą  topnienia  i temperaturą 
pokojową,  metoda  ta  jest  w zasadzie  jedyną  metodą 
otrzymywania  monokryształu  o określonej  strukturze, 
szczególnie,  gdy  substancja  ma  wysoką  temperaturę 
topnienia.  Proces  monokrystalizacji  przez  przemianę 
w fazie  stałej  jest  możliwy  dzięki  naturalnej  iendencji 
każdego  układu  do  uzyskania  minimum  energii  (mo- 
nokryształ ma  mniejszą  energię  niż  polikryształ). 
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Wzrost  monokryształów  substancji  niemetalicz- 
nych przez  przemianę  w fazie  stałej  jest  procesem 
bardzo  złożonym  i zależy  od  wielu  czynników.  Prze- 
ważnie stosuje  się  spiekanie  proszków  sprasowanych  spiekanie 
w kształtki.  Spiekanie  odbywa  się  w temperaturze  proszków 
niewiele  niższej  od  temperatury  topnienia  substancji. 

Uzyskuje  się  zwykle  kilka  (kilkanaście)  kilkumilime- 
trowych ziaren  monokrystalicznych  w objętości 
próbki. 


Monokrystalizacja  przez  wyżarzanie 

W wypadku  metali  poddaje  się  je  najpierw  odkształ- 
ceniu prawie  do  granicy  plastyczności  przez  walco- 
wanie, zgniatanie,  rozciąganie,  kucie,  przeciąganie  itp. 
Nagromadzona  w ten  sposób  w materiale  energia 
wystarcza  do  przemiany  polikrystalicznego  metalu 
lub  stopu  w monokryształ.  W zwykłych  temperatu- 
rach przemiana  taka  jest  bardzo  powolna,  podgrzewa 
się  więc  układ  do  odpowiedniej  temperatury  dla  przy- 
spieszenia przemiany  i wywołania  wzrostu  jednego 
z ziaren  polikryształu  w duże  ziarno  monokrystaliczne 
(lub  kilka  dużych  ziaren)  wypełniające  całą  objętość 
użytej  próbki.  Małe  ziarna  zostają  „pożarte”  przez 
sąsiadujące  z nimi  ziarno  rosnące. 

Proces  monokrystalizacji  przez  wyżarzenie  od- 
kształceń plastycznych  bardzo  często  można  przepro- 
wadzić w aparaturze  takiej  samej  jak  przy  metodzie 
Bridgmana-Stockbargera,  z tym  że  stosujemy  od- 
wrotny gradient  temperatury  w stosunku  do  ruchu 
próbki  w piecu  i oczywiście  nie  używamy  tygla,  gdyż 
przemiana  zachodzi  w fazie  stałej.  Aby  przyspieszyć 
pierwszą  fazę  procesu  (wytwarzanie  zarodków),  cienki 
koniec  próbki  odkształcamy  dodatkowo  przez  zgnia- 
tanie bezpośrednio  przed  wyżarzaniem.  Druty  meta- 
liczne Mo,  W,  Ta,  Nb,  Fe  o średnicach  nawet  do  kilku- 
nastu mm  przeciąga  się  przez  piec  i dodatkowo  pod- 
grzewa się  je  prądem  elektrycznym  w celu  wytwo-  metoda 
rżenia  odpowiedniego  gradientu  temperatury  — me-  Andrade'a 


Rys.  7.  Schemat  urządzenia  do  otrzymywania  cienkich  drutów 
monokrystalicznych  przez  przemianę  w fazie  stałej  (metodą  An- 
drade’a) 

toda  Andrade’a  (rys.  7).  Wymagane  odkształcenia 
powstają  podczas  przeciągania  drutu  w przeciągar- 
kach; stosuje  się  też  dodatkowe  naciąganie  podczas 
wyżarzania. 

Głównymi  wadami  metody  monokrystalizacji  przez 
przemianę  w fazie  stałej  są  trudności  z zarodkowaniem 
i wytworzeniem  tylko  jednego  dobrze  wykształconego 
monokryształu  o żądanej  orientacji. 


Wzrost  monokryształów 
z fazy  gazowej 

W procesie  hodowania  monokryształów  z fazy  gazo- 
wej wykorzystuje  się  zjawisko  sublimacji  i kondensa- 
cji lub  pewien  typ  reakcji  chemicznych.  Proces  może 
być  prowadzony  w zamkniętym  naczyniu  lub  w ukła- 
dzie otwartym  z przepływam  gazu  nośnego  wr  zależ- 
ności od  właściwości  krystalizowanej  substancji, 
układ  Drobnokrystaliczną  substancję,  tzw.  źródło,  z któ- 
zamknięty  rego  mają  powstać  duże  monokryształy,  umieszcza  się 
w ampule,  zwykle  kwarcowej,  wytwarza  się  w niej 
próżnię  lub  napełnia  się  ją  gazem  obojętnym  do  od- 
powiedniego ciśnienia  i zatapia  (rys.  8a).  Ampułę 
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Rys.  8.  Schematy  urządzeń  do  otrzymywania  monokryształów 
z fazy  gazowej  a)  w układzie  zamkniętym  w zatopionej  ampule; 

b)  w układzie  zamkniętym  w komorze  z próżnią  dynamiczną; 

c)  w układzie  otwartym,  w przepływie  gazu  nośnego 


umieszcza  się  w piecu  mającym  dwie  strefy  tempera- 
tury (wyższej  i niższej)  dostosowane  do  właściwości 
substancji  krystalizowanej.  W strefie  źródła  następuje 
sublimacja  (lub  parowanie)  substancji,  a w strefie  mo- 
nokrystalizacji  — kondensacja  jej  pary.  Pomiędzy 
strefą  źródła  i strefą  monokryształu  powstaje  różnica 
ciśnień,  która  utrzymuje  stałe  przesycenie.  Krystali- 
zacja zachodzi  na  zarodku  lub  zarodkach  utworzo- 
nych w najwęższym  miejscu  ampuły  albo  na  zarodzi 
umieszczonej  tam  przed  zatopieniem  ampuły.  Jeśli 
ogólne  ciśnienie  gazu  (prężność  pary)  w ampule  w 
temperaturze  procesu  jest  niewielkie,  o szybkości  pro- 
cesu decyduje  proces  dyfuzji  cząsteczek  pary  (gazu) 
wewnątrz  rury;  przy  większych  ciśnieniach  lub  w razie 


napełnienia  ampuły  gazem  obojętnym  odgrywają  rolę  układ 
procesy  konwekcji.  Odmianą  układu  zamkniętego  z próżnią 
jest  układ  z próżnią  dynamiczną  (rys.  8b)  stosowany  dynamiczną 
do  uzyskiwania  monokrystalicznych  warstw  metali 
i półprzewodników  na  płytkach  podłożowych  umiesz- 
czonych nad  silnie  ogrzanym  źródłem  parującym  w 
próżni  zwykle  rzędu  10" 4 Pa  i lepszej  (tabela). 


Przy  kłady  monokrystalizacji  z fazy  gazowej 
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Mechanizmy  procesu  w obu  układach  zamknię-  układ 
tych  i w układzie  otwartym  (rys.  8c)  są  analogiczne,  otwarty 
jednakże  przepływający  gaz  nośny  przenosi  znacznie 
większe  ilości  pary  parującego  źródła  i szybkość  wzro- 
stu w układzie  otwartym  jest  znacznie  większa,  niż 
w zamkniętej  ampule  czy  w próżni.  Otrzymanie  du- 
żych pojedynczych  kryształów  w metodzie  otwartej 
jest  jednak  trudne.  Znaczne  stężenia  substancji  ułat- 
wiają powstawanie  wielu  nowych  zarodków  podczas 
trwania  procesu,  a utrudniają  wzrost  monokryszta- 
łów na  już  istniejących  zarodkach. 


Wykorzystanie  reakcji  chemicznych 

Substancją  służącą  do  budowy  monokryształu  z fazy 
gazowej  mogą  być  też  produkty  reakcji  chemicznej. 

Jedną  z metod  otrzymywania  mono  krystalicznego 
korundu  a-AI203  jest  wykorzystanie  nieodwracalnej 
reakcji  par  chlorku  glinu  A1CI3  z wodorem  i dwutlen- 
kiem węgla.  Procesy  tego  typu  prowadzi  się  zwykle 
w układzie  otwartym. 

Inną  metodą  wykorzystującą  reakcje  chemiczne  metoda 
do  przenoszenia  substancji  źródła  w obszar  mono-  transportu 
kryształu  jest  sposób  zwany  metodą  transportu  che-  chemicznego 
micznego.  Polega  ona  na  dodaniu  do  układu  niewiel- 
kiej ilości  substancji,  zwanej  transporterem,  która  rea- 
gując z substancją  źródła  wytwarza  wyłącznie  pro- 
dukty gazowe.  W innym  miejscu  układu,  w innej  tem- 
peraturze, produkty  te  reagują  ze  sobą  ponownie 
i wytwarzają  w reakcji  odwracalnej  trwałą  fazę  sta- 


Przykłady  monokrystalizacji  metodą  transportu  chemicz- 
nego w układzie  otwartym  i zamkniętym 
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łą  — monokryształ  substancji  źródła.  Uwalnia  się 
przy  tym  substancja-transporter  przenoszona  przez 
konwekcję  lub  dyfuzję  do  obszaru  źródła — jeśli 
proces  odbywa  się  w układzie  zamkniętym  — lub 
unoszona  przez  gaz  nośny  poza  układ  otwarty.  Me- 
tody transportu  chemicznego  znalazły  zastosowanie 
do  otrzymywania  monokryształów  pierwiastków 
i związków  o niskich  prężn ościach  par  lub  do  związ- 
ków bardzo  łatwo  rozkładających  się  po  ogrzaniu, 
których  utrzymanie  w układzie  zamkniętym  jedno- 
składnikowym (bez  reakcji  chemicznej) jest  niemożliwe 
lub  zbyt  powolne  (tabela). 

Reakcje  transportu  chemicznego,  odwracalne  i nie- 
odwracalne, znalazły  zastosowanie  zarówno  do  wy- 
twarzania dużych  monokryształów,  jak  i tzw.  warstw 
epitaksjalnych.  Są  to  cienkie,  o grubości  kilku  do  kil- 
kudziesięciu mikrometrów,  monokrystaliczne  war- 


stwy „narośnięte”  na  płaskim  podłożu  monokrysta- 
licznym  będącym  zarodzią.  Warstwy  te  powtarzając 
strukturę  podłoża-za rodzi  mogą  mieć  nieco  zmie- 
niany skład  chemiczny  przez  wprowadzanie  do  rosną- 
cej warstwy  niewielkiej  ilości  domieszki.  Na  granicy 
podłoże-warstwa  uzyskuje  się  w ten  sposób  zamie- 
rzony skok  właściwości  substancji  monokryształu. 

Metoda  epitaksjalnej  monokrystalizacji  krzemu  stała  warstwy 
się  podstawą  rozwoju  technologii  krzemowych  ukła-  epitaksjalne 
dów  scalonych  stosowanych  powszechnie  w kalkula- 
torach, komputerach,  coraz  powszechniej  w odbiorni- 
kach radiowych  i telewizyjnych,  a także  w układach 
regulacji  i sterowania  automatycznego  procesów  prze- 
mysłowych (->  Mikroelektronika). 

W.  D.  Lawson  i S.  Nielsen  Otrzymywanie  monokryształów. 

Warszawa  1962;  The  Art  and  Science  of  Growing  Crystals,  J.  J. 

Gilman  (ed.),  London  1963. 


Dyslokacje  w kryształach 

Tadeusz  Figielski 


Dyslokacje  są  liniowymi  defektami  struktury  krysta- 
licznej. Wpływają  one  w zasadniczy  sposób  na  wła- 
sności mechaniczne  ciał  stałych,  również  ważną  rolę 
odgrywają  w materiałach  półprzewodnikowych  stoso- 
wanych w elektronice. 

Zdumiewa  nas  fakt,  że  jeszcze  niedawno  — przed 
wysunięciem  koncepcji  dyslokacji,  gdy  już  została  roz- 
szyfrowana kwantowa  struktura  atomu  — fizycy  nie 
rozumieli,  dlaczego  sztabka  czystego  metalu  jest  pla- 
styczna zaraz  po  jej  wytopieniu,  a staje  się  twarda 
i wytrzymała  po  kuciu  lub  walcowaniu.  Wyrażając 
się  ściślej,  nie  rozumiano,  dlaczego  wytrzymałość 
kryształu  na  ścinanie  jest  o wiele  rzędów  niższa  niż  ta, 
jaką  przewidywała  najprostsza  teoria  plastyczności, 
w której  zakładano,  że  całe  płaszczyzny  atomowe 
kryształu  ślizgają  się  jedne  po  drugich.  Rozwiązanie 
tej  zagadki  dali  trzej  badacze  G.  J.  Taylor,  E.  Orowan 
i M.  Polanyi,  którzy  niezależnie  od  siebie  zapropo- 
nowali w 1934  r.  koncepcję  dyslokacji  w krysztale, 
wektor  Rozważmy  na  początku  pojęcie  dyslokacji  w oś- 
. Burgersa  rodku  ciągłym.  Wyobraźmy  sobie  doskonale  sprę- 
żysty materiał  w postaci  walca,  w którym  wykonano 
nacięcie  wzdłuż  płaszczyzny  ABCD  aż  do  jego  osi 
(rys.  1).  Przemieśćmy  następnie  dwie  przylegające 


Rys.  1.  Dyslokacja  w ośrodku  ciągłym:  a)  krawędziowa,  b)  śru- 
bowa 


Rozróżnia  się  dwa  zasadnicze  typy  dyslokacji: 
dyslokację  krawędziową  (rys.  la),  w której,  wektor 
Burgersa  jest  prostopadły  do  linii  (osi)  dyslokacji  oraz 
dyslokację  śrubową  (rys.  Ib)  — gdy  wektor  Burgersa  dyslokacja 
jest  równoległy  do  osi.  Ogólnie  dyslokacja  może  mieć  krawędzio- 
zarówno  składową  krawędziową,  jak  i śrubową,  czyli  Wa 
może  być  typu  mieszanego.  Przykładem  takiej  dyslo-  i śrubowa 
kacji  jest  dyslokacja  sześćdziesięciostopniowa  wy- 
stępująca w kryształach  o strukturze  diamentu  (rys. 

12;  60°  jest  kątem  między  wektorem  Burgersa  i osią 
dyslokacji). 

Istnieje  ogólne  prawo  ułatwiające  rozpatrywanie 
geometrycznych  zagadnień  związanych  z dyslokacja- 
mi: wektor  Burgersa  musi  być  zachowany  wzdłuż 
całej  linii  dyslokacyjnej.  Z prawa  tego  wynika,  że 
dyslokacja  nie  urywa  się  wewnątrz  kryształu;  może 
ona  kończyć  się  jedynie  na  jego  powierzchniach  lub 
tworzyć  zamknięte  pętle.  (il.  80,  tabl.  21). 

Dyslokacja  krawędziowa  z jednostkowym  wekto- 
rem Burgersa  w najprostszej  sieci  krystalicznej  jest 
równoważna  umieszczeniu  dodatkowej  płaszczyzny 
atomowej  między  dwiema  sąsiadującymi  płaszczy- 
znami krystalicznymi  (rys.  2).  Można  zauważyć,  że 
każdy  atom  na  krawędzi  tej  płaszczyzny  (będącej 


Rys.  2.  Dyslokacja  krawędziowa  w najprostszej  strukturze  kry- 
stalicznej 


części  walca  wzdłuż  płaszczyzny  przecięcia  o wektor 
V.  Ten  rodzaj  zakłócenia,  rozciągający  się  wzdłuż 

linii  AB  (osi),  nazywa  się  dyslokacją,  a wektor  b — 
wektorem  Burgersa  dyslokacji.  W sieci  krystalicznej 
wektor  Burgersa  może  przyjmować  jedynie  pewne 
wartości  dyskretne;  dyslokacja  z najkrótszym  możli- 
dyslokacja  wym  wektorem  Burgersa  nazywa  się  dyslokacją  ied- 
jednostkowa  nostkową. 
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linią  dyslokacji)  ma  mniej  sąsiadów  niż  atom  w sieci 
doskonałej.  A zatem  w kryształach  o wiązaniu  kowa- 
lencyjnym jedno  wiązanie  w każdym  atomie  krawę- 
dziowym jest  wolne;  jest  ono  nazywane  wiązaniem  wiązanie 
wiszącym  i odgrywa  bardzo  ważną  rolę  w elektrono-  wiszące 
wych  własnościach  dyslokacji. 

Rola  pojęcia  dyslokacji  w teorii  plastyczności  jest 
oczywista.  Zamiast  jednoczesnego  przemieszczania 
podczas  deformacji  kryształu  całych  płaszczyzn  ato- 


ruch  mowych,  wystarczy  przemieszczanie  kolejnych  rzędów 
poślizgowy  atomów  znajdujących  się  na  linii  dyslokacyjnej.  Ten 
dyslokacji  rodzaj  ruchu  jest  dobrze  znany  z praktyki  domowej 
np.  ułatwia  przesuwanie  ciężkiego  dywanu  (rys.  3). 


Rys.  3.  Mechanizm  dyslokacji  może  być  użyteczny  przy  przesu- 
waniu ciężkiego  dywanu 


W krysztale  taki  proces  może  być  opisany  przez  ruch 
dyslokacji;  jest  to  ruch  poślizgowy  dyslokacji  zacho- 
dzący w płaszczyźnie  poślizgu.  Uprzywilejowanymi 
płaszczyznami  poślizgu  są  płaszczyzny  krystalogra- 
ficzne o najgęstszym  upakowaniu  atomów, 
ruch  W kryształach  o wiązaniu  kowalencyjnym  naprę- 
przegięcia  żenie  niezbędne  do  wywołania  poślizgu  całej  linii 
dyslokacyjnej  jest  stosunkowo  duże  i wówczas  bar- 
dziej uprzywilejowanym  procesem  może  być  ruch 
dyslokacji  zachodzący  stopniowo  wzdłuż  krótkiego 
jej  odcinka.  Taki  proces  jest  możliwy,  gdy  dyslo- 
kacja zawiera  przegięcie  leżące  w tej  samej  płaszczy- 
źnie poślizgu  i o długości  równej  zazwyczaj  jednost- 
kowemu wektorowi  Burgersa  (rys.  4).  Przegięcie  może 
ślizgać  się  wzdłuż  dyslokacji,  a jego  przemieszczenie 
się  z jednego  końca  dyslokacji  do  drugiego  jest  równo- 
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Rys.  4.  Przegięcie  i 
jego  ruch  wzdłuż  dy- 
slokacji (a,  b,  c),  d) 
podwójne  przegięcie 


Rys.  5.  Przecięcie  się  dwóch  dyslokacji  krawędziowych,  prowa- 
dzące do  wytworzenia  przegięć 


j 
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ważne  przesunięciu  całej  dyslokacji  o jednostkowy 
wektor  Burgersa.  Podwójne  przegięcia  mogą  być 
wzbudzane  spontanicznie  przez  drgania  cieplne  sieci 
(rys.  4d),  jak  również  mogą  być  wytw-arzane  w wyniku 
przecięcia  się  dwóch  dyslokacji  leżących  w różnych 
płaszczyznach  poślizgu  (rys.  5). 

Pod  wpływem  działania  na  kryształ  stałego  ze- 
wnętrznego naprężenia  t dyslokacja  wykonuje  ruch 
poślizgowy  i w końcu  opuszcza  kryształ  pozostawiając 
po  sobie  uskok  — „kwant”  plastycznej  deformacji 
(rys.  6).  Taki  prosty  model  prowadzi  oczywiście  do 
wystąpienia  pewnej  górnej  granicy  stopnia  deformacji 
plastycznej  kryształu,  która  byłaby  określona  gęstością 
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Rys.  6.  Ruch  poślizgowy  dyslokacji  jest  równoważny  deformacji 
plastycznej  kryształu 
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dyslokacji  początkowo  istniejących  w krysztale.  Po- 
nieważ doświadczalnie  nie  obserwuje  się  takiej  gra- 
nicy, należy  wnioskować,  że  podczas  plastycznego 
„płynięcia”  kryształu  działają  pewne  mechanizmy 
wytwarzania  (generacji)  lub  powielania  dyslokacji 
Jednym  z bardziej  znanych  jest  mechanizm  generacji 
Franka-Reada,  który  zachodzi  wówczas,  gdy 
w płaszczyźnie  poślizgu  występują  przeszkody  w ru- 
chu dyslokacji — tzw.  punkty  zaczepienia.  Działa- 
cie tego  typu  mechanizmu  przedstawia  rys.  7. 


Am *B 
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Rys.  7.  Mechanizm  Fran- 
ka-Reada generacji  dyslo- 
kacji. Odcinek  linii  dyslo- 
kacyjnej, unieruchomiony 
między  punktami  A i B 
leżącymi  w płaszczyźnie 
poślizgu,  wygina  się  pod 
wpływem  przyłożonego 
naprężenia,  a następnie 
zamyka  się  wytwarzając 
pętle  dyslokacyjne 


„kwant" 

deformacji 

plastycznej 


rozmnażanie 

dyslokacji 
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Podatność  kryształu  na  działanie  sił  mechanicz- 
nych można  zobrazować  za  pomocą  wykresu,  na 
którym  na  osi  rzędnych  odłożone  jest  działające  na- 
prężenie (np.  siła  rozciągająca  na  jednostkę  przekroju 
poprzecznego  kryształu),  natomiast  na  osi  odcię- 
wspśnartie  tych  — odkształcenie  (np.  względna  zmiana  długości 
się  kryształu).  Przykładowa  zależność  tego  rodzaju 
dyslokacji  przedstawiona  jest  na  rys.  8,  gdzie  można  wyróżnić 


Rys.  8.  Zależność  naprężenia  od  odkształcenia  monokryształu 
metalu 


Dyslokacje  odgrywają  istotną  rolę  w mechanizmie  wzrost 
wzrostu  kryształów.  Na  rys.  10  pokazana  jest  dyslo-  kryształów 
kacia  śrubowa,  której  wyjśoie  na  powierzchnię  sta- 
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Rys.  9.  Wspinanie 
się  dyslokacji  wy- 
wołane dopływem 
luk 


obserwacje 

dyslokacji 


trzy  charakterystyczne  obszary.  W obszarze  1 kryształ 
zachowuje  się  doskonale  sprężyście.  Odkształcenie 
Jest  tu  proporcjonalne  do  naprężenia  i jest  całkowicie 
odwracalne.  W obszarze  2 kryształ  zaczyna  plastycz- 
nie (nieodwracalnie)  „płynąć".  Małe  przyrosty  na- 
prężenia wywołują  duże  zmiany  długości  kryształu. 
Jest  to  obszar,  w którym  zachodzi  intensywny  ruch 
poślizgowy  i rozmnażanie  dyslokacji.  Przy  dalszej 
deformacji  osiąga  się  trzeci  obszar,  w którym  nastę- 
puje utwardzanie  kryształu.  Liczba  dyslokacji  leżą- 
cych w różnych  płaszczyznach  poślizgu  jest  wówczas 
tak  duża,  że  blokują  one  sobie  wzajemnie  możliwości 
ruchu,  utrudniając  deformację  plastyczną. 

Ruch  poślizgowy  dyslokacji  jest  ruchem  zacho- 
wawczym, co  oznacza,  że  nie  towarzyszy  mu  trans- 
port masy.  W wyższych  temperaturach  może  stać  się 
istotny  niezachowawczy  rodzaj  ruchu  dyslokacji, 
który  jest  wywołany  dopływem  lub  odpływem  luk  lub 
atomów  międzywęzłowych;  ruch  taki  nazywany  jest 
wspinaniem  się  dyslokacji  (rys.  9). 

Przez  długi  czas  dyslokacje  były  koncepcją  czysto 
teoretyczną,  zanim  nauczono  się  je  uwidaczniać 
w krysztale.  Pierwszą  i najprostszą  metodą  było  uży- 
cie specjalnych  środków  trawiących,  atakujących  naj- 
bardziej obszary  kryształu,  w których  dyslokacje  wy- 
chodzą na  powierzchnię.  Ilustracja  79  (tabl.  21)  przed- 
stawia jedną  z pierwszych  identyfikacji  jamek  tra- 
wienia na  germanie  z pojedynczymi  dyslokacjami. 
Dyslokacje  są  tu  uszeregowane  liniowo  tworząc  tzw. 
małokątową  granicę  ziaren  (ii.  82,  tabl.  21).  Obecnie 
możemy  oglądać  dyslokacje  wewnątrz  kryształu  sto- 
sując topografię  rentgenowską  lub  — bardziej  szcze- 
gółowo — wykorzystując  elektronową  mikroskopię 
prześwietleniową  (->  Mikroskopia  elektronowa  i il. 
87,  tabl.  22).  Za  pomocą  tej  metody  można  również 
obserwować  dyslokacje  podczas  ich  ruchu.  Badania 
elekt ronomikroskopowe  wykazują,  że  dyslokacje  by- 
wają często  rozszczepione  na  dyslokacje  częściowe 
z ułamkowym  wektorem  Burgersa.  Płaski  defekt  roz- 
ciągający się  między  rozszczepioną  parą  nazywa  się 
błędem  ułożenia. 

Wokół  linii  dyslokacyjnej  istnieje  złożone  pole  na- 
prężeń mechanicznych.  W pobliżu  dyslokacji  krawę- 
dziowej deformacja  sieci  ma  charakter  dylatacji  bądź 
kompresji  w zależności  od  położenia  obszaru  w sto- 
sunku do  płaszczyzny  poślizgu  dyslokacji.  To  pole 
naprężeń  jest  przyczyną  silnego  oddziaływania  dyslo- 
kacji z defektami  punktowymi  i atomami  domieszko- 
wymi w'  krysztale.  W szczególności  domieszki  mogą 
działać  jako  punkty  zaczepienia  dyslokacji,  hamując 
ich  ruch  poślizgowy. 
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Rys.  JO.  Dyslokacja  śru- 
bowa i spiralny  wzrost 
kryształu 


nowi  niewysycający  się  zarodek  szybkiego  wzrostu 
kryształu.  Jego  działanie  polega  na  tym,  że  zewnętrzne 
atomy  łatwo  wbudowują  się  w kryształ  w miejscach, 
gdzie  mogą  się  one  wiązać  z więcej  niż  jednym  ato- 
mem. Gdy  na  powierzchni  kryształu  istnieje  prosty 
stopień  (rys.  11),  mechanizm  szybkiego  wzrostu 
przestaje  działać  po  skompletowaniu  pełnej  warstwy 
atomowej. 


Rys.  11.  Schodek  na 
krysztale  nie  podtrzy- 
muje stałego  szybkiego 
wzrostu  kryształu 


Energia  związana  z naprężeniami  wokół  dyslokacji 
jest  tak  duża,  że  dyslokacja,  w przeciwieństwie  do  de- 
fektów punktowych  (luk  i atomów  międzywęzło- 
wych), nie  może  powstać  samoistnie  w krysztale  w wy- 
niku drgań  cieplnych  atomów;  dyslokacja  nie  jest  więc 
defektem  termodynamicznie  równowagowym.  Wynika 
stąd,  że  dyslokacje  mogą  być  w zasadzie  całkowicie 
usunięte  z kryształu.  Obecnie  tzw.  kryształy  bezdyslo-  krys-ztafy 
kacyjne  półprzewodników  germanu  i krzemu  produ-  bezdysłoka- 
kowane  są  w skali  przemysłowej.  cyjne 


wpływ 
dyslokacji 
na  domiesz- 
kowanie 


bariera 

potencjału 

wokół 

dyslokacji 


W materiałach  półprzewodnikowych  dyslokacje 
wpływają  w sposób  istotny  zarówno  na  procesy  ato- 
mowe jak  i elektronowe.  Wpływ  ten  jest  w zasadzie 
ujemny.  Wzdłuż  dyslokacji  zachodzi  wzmożona  dy- 
fuzja domieszek  psująca  ich  rozkład  przestrzenny 
w przyrządach  półprzewodnikowych.  Dyslokacje 
w sposób  drastyczny  obniżają  czas  życia  mniejszo- 
ściowych nośników  prądu,  działając  jako  efektywne 
centra  rekombinacji  (-*  Fizyka  przyrządów  półprze- 
wodnikowych). Wreszcie  dyslokacje  zapoczątkowują 
lawinowe  przebicie  w złączach  n-p,  obniżając  tym 
samym  wartość  maksymalnego  napięcia  zaporowego, 
przy  którym  mogą  pracować  diody  półprzewodni- 
kowe. Jest  zatem  sprawą  oczywistą,  że  technologowie 
czynią  wielki  wysiłek,  ażeby  uniknąć  dyslokacji 
w materiałach  i strukturach  półprzewodnikowych. 

Fizyka  zjawisk  elektronowych  związanych  z dyslo- 
kacjami w półprzewodnikach  jest  bardzo  interesująca. 
Na  krawędzi  dodatkowej  półpłaszczyzny  atomowej, 
jaką  stanowi  dyslokacja,  zlokalizowane  są  niewysy- 
cone,  „wiszące”  wiązania  chemiczne.  W wypadku 
półprzewodników  atomowych,  germanu  i krzemu,  są 
to  ściśle  ukierunkowane  wiązania  kowalencyjne  (rys. 
12).  Sterczą  one  prostopadle  do  osi  dyslokacji  i są 


Rys.  12.  Dyslokacja  sześćdziesięciostopniowa  w krysztale  o struk- 
turze diamentu 


odległe  od  siebie  jedynie  o kilka  A.  Dodatkowy  elek- 
tron może  być  wychwycony  z pasma  przewodnictwa 
półprzewodnika  na  wiszące  wiązanie,  lub  też  wiszący 
elektron  może  być  przeniesiony  do  pasma.  W pierw- 
szym wypadku  dyslokacja  staje  się  naładowana 


ujemnie,  w drugim  — dodatnio.  Proces  ładowania 
dyslokacji  zachodzi  sportanicznie  aż  do  momentu 
osiągnięcia  równowagi  termodynamicznej  układu. 

Znak  i wielkość  ładunku  na  dyslokacji  zależy  od  ener- 
gii Fermiego  w krysztale.  Ten  ładunek  powoduje  wy- 
tworzenie potencjału  elektrostatycznego  na  dyslokacji. 

Różnica  potencjałów  powstająca  między  linią  dyslo- 
kacyjną a otaczającym  ją  materiałem  odgrywa  za- 
sadniczą rolę  w procesach  rekombinacji  nośników 
prądu  w półprzewodnikach.  Od  niej  zależy  dopływ 
nośników  do  dyslokacji  będących  bardzo  efektyw- 
nymi centrami  rekombinacji. 

Oświetlenie  półprzewodnika  światłem  generują-  foto- 
cym  dodatkowe  nośniki  prądu  zmniejsza  ładunek  plastyczność 
dyslokacji.  Efekt  ten  jest  prawdopodobnie  przyczyną 
obserwowanego  w związkach  półprzewodnikowych 
zjawiska  fotoplastyczności.  Zjawisko  to  polega  na 


Rys.  13.  Zjawisko  fotoplaslyczne  w krysztale  tcllurku  kadmu 
(CdTc).  Naprężenie  niezbędne  do  wywołania  określonej  defor- 
macji plastycznej  wzrasta  przy  oświetleniu  kryształu 


zmianie  efektywnej  ruchliwości  dyslokacji  pod  wpły- 
wem oświetlenia,  co  powoduje  zmianę  twardości 
kryształu  (rys.  13). 

Wiszące  elektrony  wzdłuż  dyslokacji  krawędziowej  dyslokacje  — 
mają  niesparowane  spiny  i związany  z nimi  moment  centra  para- 
magnetyczny. Dyslokacje  są  zatem  centrami  para-  magnetyczne 
magnetycznymi  w krysztale.  Moment  magnetyczny 
pochodzący  od  dyslokacji  został  rzeczywiście  wykryty 
doświadczalnie  przy  badaniu  elektronowego  rezo- 
nansu paramagnetycznego  w krzemie. 

J.  Weertman,  J.  R.  Weertman  Podstawy  teorii  dyslokacji. 

Warszawa  1969. 


Badanie  struktury  kryształów 


Teoria  wewnętrznej  budowy  kryształów,  obejmująca 
teorię  sieciową  A.  Bravais’go  i teorię  grup  przes- 
trzennych J.  S.  Fiodorowa,  A.  Schoenfliesa  i W.  Bar- 
lowa  powstała  w XIX  w. 

Słuszność  tych  teorii  potwierdzono  doświadczalnie 
dopiero  w r.  1912,  gdy  przy  próbach  wyjaśnienia  na- 
tury (fale  czy  cząstki?)  promieniowania  rentgenow- 
skiego M.  von  Laue,  W.  Friedrich  i P.  Knipping 
wykazali,  że  promienie  rentgenowskie  ulegają  dy- 
frakcji na  sieciach  przestrzennych  kryształów.  Rok 
1912  stał  się  rokiem  przełomowym  dla  rozwoju  krysta- 
lografii, gdyż  odkrycie  Lauego,  Friedricha  i Knippin- 
ga  dało  początek  nowym  jej  gałęziom,  związanym  z 
badaniami  rodzajów  sieci  przestrzennych  występują- 
cych w ciałach  krystalicznych  i badaniem  rozmieszczeń 
atomów,  jonów  lub  cząsteczek  w komórkach  ele- 
mentarnych: krystalografii  rentgenowskiej  i analizie 
strukturalnej  kryształów. 

Dwanaście  lat  później,  L.  de  Broglie  sformułował 
hipotezę  o falowym  charakterze  ruchu  cząstek.  Do- 
świadczalnym potwierdzeniem  tej  hipotezy  było  po- 


kazanie w 1927  r.,  przez  C.  I.  Davissona  i L.  H.  Ger- 
mera,  żc  elektrony  ulegają  dyfrakcji  na  sieciach  prze- 
strzennych ciał  krystalicznych,  podobnie  jak  promie- 
nie rentgenowskie.  Pomyślnie  zakończone  doświad- 
czenia nad  dyfrakcją  neutronów  przeprowadzili 
w 1936  r.  P.  N.  Mitchell  i D.  P.  Powells.  Te  dwa  do- 
świadczenia dały  początek  nowym  metodom  badania 
struktury  kryształów:  elektronografii  i neutronogra- 
fii, a pierwsze  z nich  doprowadziło  ponadto  do  skon- 
struowania w 1931  r.  przez  M.  Knolla  i E.  Ruska,  mi- 
kroskopu elektronowego. 


Krystalografia  rentgenowska 

Zygmunt  Trzaska  Durski 

Eksperyment,  który  dał  początek  krystalografii  rent- 
genowskiej, przeprowadzony  w 1912  r.  przez  Lauego, 
Friedricha  i Knippinga  był  niesłychanie  prosty,  zwła- 
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szcza  jeśli  weźmie  się  pod  uwagę  używane  obecnie, 
nieraz  bardzo  skomplikowane,  przyrządy  do  badania 
dyfrakcji  promieni  rentgenowskich  na  kryształach. 
Po  prostu  — na  drodze  wąskiej  wiązki  promieni 
rentgenowskich  ustawione  zostały  kryształ  i klisza 
fotograficzna.  Po  naświetleniu  i wywołaniu  kliszy 
okazało  się,  że  oprócz  śladu  padającej  wiązki  pro- 
mieniowania na  kliszy  pojawiły  się  ślady  wiązek  od- 
chylonych od  kierunku  wiązki  padającej  (tj.  ślady 
wiązek  ugiętych). 


Odbicie  promieni  rentgenowskich 
od  płaszczyzn  sieciowych  kryształu 

Zastanówmy  się  nad  tym,  skąd  w doświadczeniu 
Lauego  wzięły  się  wspomniane  wiązki  ugięte.  Otóż 
wiązki  promieni  odchylone  od  kierunku  biegnącej 
z lampy  wiązki  padającej  powstają  w wyniku  swoiste- 
go odbicia  promieni  rentgenowskich  przez  zespoły 
odbicie  równoległych  do  siebie  płaszczyzn  sieciowych  kry- 
inter-  ształe.  Odbicie  to  ma  szczególny  charakter  i nazywa 
ferencyjne  się  odbiciem  interferencyjnym,  ponieważ  w istocie 
przyczyną  jego  jest  wtórne  promieniowanie  atomów 
(a  właściwie  elektronów),  uporządkowanych  w sieć 
krystaliczną,  na  które  padają  promienie  rentgenow- 
skie. Mianowicie,  każdy  z elektronów  atomów  sieci 
krystalicznej  pod  działaniem  promieniowania  rent- 
genowskiego wykonuje  drgania  w takt  zmian  pola 
elektromagnetycznego  tego  promieniowania,  stając 
się  w ten  sposób  źródłem  promieniowania  wtórnego, 
o takiej  samej  długości  fali  jak  promieniowanie  wzbu- 
dzające, lecz  rozchodzącego  się  w przestrzeni  kuliście. 
Te  fale  wtórne  interferują  ze  sobą  i w pewnych  ściśle 
określonych  dla  danej  sieci  przestrzennej  i danej  dłu- 
gości fali  promieniowania  kierunkach,  ulegają  wzmoc- 
nieniu, co  prowadzi  do  powstawania  tzw.  wzmocnio- 
nych promieni  interferencyjnych,  obserwowanych 
w doświadczeniach  jako  promienie  ugięte  czy  też 
promienie  odbite. 

Kierunek  rozchodzenia  się  wzmocnionych  promie- 
ni interferencyjnych  (promieni  interferencyjnie  odbi- 
równanie  tych)  można  określić  za  pomocą  tzw.  równania  Wul- 
Wulfa-  fa-Bragga.  Według  tego  równania  interferencyjne  od- 
Bragga  bicie  promieni  rentgenowskich  o długości  fali  X od 
płaszczyzny  sieciowej  ( hkl ) (rys.  1)  następuje  tylko 
w takim  kierunku,  określonym  tzw.  kątem  odbłysku 
#<***),  przy  którym  różnica  dróg  AS  = 2d^ki)  sin&thki) 
przebytych  przez  promienie  rentgenowskie  odbite  od 
dwóch  sąsiednich  równoległych  płaszczyzn  siecio- 
wych jest  równa  całkowitej  wielokrotności  długości 
fali  AS  = nX.  Różnica  dróg  AS  jest  sumą  odcinków 
AO  i OB,  o które  promień  2 ma  dłuższą  drogę  niż 
promień  /.  Mówiąc  inaczej  — interferencyjne  odbi- 
cie nastąpi  wtedy,  gdy  na  drodze  AOB  zmieści  się  cał- 
kowita liczba  długości  fal,  czyli  gdy 


nX  — 2d(hki)Sin&(hki). 


Rys.  1.  Ilustracja  równania  Wulfa-Bragga;  promienie  rentge- 
nowskie R padają  na  rodzinę  płaszczyzn  sieciowych  ( hkl)  pod 
kątem  połysku  i zostają  odbite  (/?J  pod  kątem  odbłysku 
= &t) ; ( N — prosta  prostopadła  do  płaszczyzny  (hkt)',  N,  R 
oraz  Rx  leżą  w jednej  płaszczyźnie) 

464 


W równaniu  tym  liczba  n = 1,2,3...  określa  tzw.  rząd 
rząd  odbicia,  czyli  liczbę  długości  fali  mieszczących  odbicia 
się  na  drodze  ABC  (rys.  5).  Z równania  Wulfa-Bragga 
wynika,  że  odbicie  promieni  rentgenowskich  przez 
płaszczyzny  sieciowe  kryształu  ma  charakter  selek- 
tywny, tzn.  występuje  tylko  pod  pewnymi  kątami 
ściśle  określonymi  dla  danej  sieci  krystalicznej  i dla 
danej  długości  fali  promieniowania. 

Każdą  wiązkę  promieni  rentgenowskich  odbitą 
przez  płaszczyzny  sieciowe  można  scharakteryzować 
jej  kierunkiem  rozchodzenia  się  i jej  intensywnością. 

O geometrycznym  rozkładzie  w przestrzeni  kierunków 
odbitych  wiązek  promieni  decydują  symetria  i roz- 
miary komórki  elementarnej.  Liczba,  rodzaje  i wza- 
jemna konfiguracja  atomów  znajdujących  się  w ko- 
mórce elementarnej  wpływają  wyłącznie  na  inten- 
sywność wiązek  odbitych.  W związku  z tym  całość 
badań  struktury  kryształów  za  pomocą  promieni 
rentgenowskich  dzieli  się  na  krystalografię  rentge- 
nowską i analizę  strukturalną  kryształów. 

Krystalografia  rentgenowska  zajmuje  się  badaniem 
geometrycznego  rozkładu  w przestrzeni  kierunków 
wiązek  promieni  rentgenowskich  odbitych  od  płasz- 
czyzn sieciowych  kryształów;  na  podstawie  tego  roz- 
kładu wyznacza  się  symetrię  i stałe  sieciowe  sieci 
przestrzennych.  Badanie  intensywności  wiązek  odbi- 
tych, prowadzące  do  wyznaczania  położeń  (współ-  analiza 
rzędnych)  atomów  w komórce  elementarnej,  jest  pod-  strukturalna 
stawą  analizy  strukturalnej  kryształów  (zob.  rozdział  kryształów 
„Strukturalna  analiza  kryształów”). 

Do  zakresu  krystalografii  rentgenowskiej  należą 
takie  badania  jak:  określenie  układu  krystalograficz- 
nego, klasy  dyfrakcyjnej,  grupy  przestrzennej  (lub 
dyfrakcyjnej)  kryształu,  wyznaczenie  stałych  siecio- 
wych i objętości  komórki  elementarnej,  wyznaczenie 
liczby  atomów  (cząsteczek)  znajdujących  się  w ko- 
mórce elementarnej. 


Doświadczalne  metody  krystalografii 
rentgenowskiej 

W celu  wykonania  sformułowanych  wyżej  zadań 
oraz  przygotowania  danych  wyjściowych  do  struktu- 
ralnej analizy  kryształów  stosowane  są  różne  metody 
doświadczalne.  W metodach  tych  tzw.  obrazy  dy- 
frakcyjne monokryształów  lub  ciał  polikrystalicznych, 
uzyskane  przy  użyciu  promieniowaniarentgenowskiego 
zawierającego  fale  różnych  długości  (promieniowanie 
polichromatyczne)  lub  promieniowania  o jednej  dłu- 
gości fali  (promieniowanie  monochromatyczne),  re- 
jestrowane są  na  błonie  fotograficznej  bądź  też  za 
pomocą  liczników  Geigera-Miillera,  proporcjonal- 
nych lub  scyntylacyjnych. 

Przyrządy  umożliwiające  rejestrowanie  obrazów  kamer/ 
dyfrakcyjnych  na  błonie  fotograficznej  nazywają  się  rentgenów- 
kamerami  rentgenowskimi.  W użyciu  są  różne  typy  skie 
kamer.  Istnieją  kamery  uniwersalne,  pozwalające  na 
wykonywanie  rentgenogramów  różnymi  metodami, 
oraz  kamery  przeznaczone  do  wykonywania  rentge- 
nogramów tylko  jedną  metodą.  Istnieją  kamery  słu- 
żące do  badania  monokryształów  oraz  kamery  do 
badania  ciał  polikrystalicznych,  przy  czym  zarówno 
jedne,  jak  i drugie  konstruowane  są  z przeznaczeniem 
do  badań  w warunkach  normalnej  temperatury  i ciś- 
nienia oraz  do  badań  w warunkach  specjalnych,  np. 
w wysokiej  i niskiej  temperaturze,  pod  wysokim  ciś- 
nieniem, w atmosferze  ochronnej  (w  atmosferze  helu, 
azotu)  itp. 

Aparaty,  w których  położenie  i intensywność  wią-  dyfrakto- 
zek  odbitych  rejestruje  się  za  pomocą  liczników  metry  rent- 
Geigera-Mullera  lub  liczników  scyntylacyjnych,  na-  genewskie 
żywa  się  dyfraktometrami  rentgenowskimi  (il.  77, 

78,  tabl.  20). 

Uzyskiwane  różnymi  metodami  i zarejestrowane  rentgeno- 
na  błonie  fotograficznej  lub  za  pomocą  liczników  gramy 
obrazy  dyfrakcyjne  ciał  krystalicznych  nazywa  się  (dyfrakto- 
rentgenogramami  lub  dyfraktogramami.  Zaczernione  gramy) 


refleksy 


plamki  na  rentgenogramach,  będące  śladami  wiązek 
promieni  rentgenowskich  odbitych  od  płaszczyzn 
sieciowych,  nazywa  się  zwykle  refleksami. 

Przystępując  do  badania  struktury  kryształu,  prze- 
de wszystkim  należy  ustalić  kształt  (tj  symetrię),  typ 
i wymiary  komórki  elementarnej,  a także  liczbę  ato- 
mów czv  cząsteczek,  które  w tej  komórce  należy  roz- 
mieścić.'' Jeżeli  na  podstawie  zewnętrznego  wyglądu 
kryształu  nie  można  wyciągnąć  wniosków  o jego 
symetrii  i przynależności  do  układu  krystalograficz- 
nego, wówczas  wykorzystuje  się  zjawisko  dyfrakcji 
promieni  rentgenowskich,  stosując  tzw.  metodę  Laue- 


symbolem  1 jest  obrazem  asymetrycznym  i powstaje 
zawsze  wtedy,  gdy  w monokrysztale,  równolegle  do 
wiązki  padającej,  nie  znajduje  się  żaden  z wymienio- 
nych wyżej  elementów  symetrii. 


metoda 

Lauego 


g°Metodą  Lauego  bada  się  monokryształ  grubości 
0 05-0  3 mm.  Badany  monokryształ  przykleja  się  (np. 
woskiem,  plasteliną)  do  tzw.  główki  goniometrycznej 
(il.  75,  tabl.  20)  będącej  urządzeniem  umożliw- łającym 
zmianę  nachylenia  monokryształu  względem  padającej 
wiązki  promieni  oraz  przesuwanie  go  w kamerze 
w kierunkach  do  siebie  prostopadłych.  Na  umieszczo- 
ny w kamerze  Lauego  (U.  73,  tabl.  20)  nieruchomy 
monokryształ  pada  wiązka  polichromatyeznyc  , 
równoległych  promieni  rentgenowskich,  wydzielona 
za  pomocą  tzw.  kolimatora  z szerokiej,  rozbieżnej 
wiązki  promieni  rozchodzących  się  od  anody  lampy 
rentgenowskiej.  Wiązka  padająca  po  przejściu  przez 
kolimator  ma  średnicę  ok.  0,5-1 ,0  mm  (rys.  2). 


Rvs  2 Metoda  Lauego;  schemat  otrzymywania  rentgenogramów 
za  pomocą  promieni  przechodzących  Ra  i promieni  wstecznych  Rz 

Otrzymany  obraz  dyfrakcyjny  kryształu  rejestruje 
się  zwykle  na  płaskiej  błonie  fotograficznej  ustawio- 
nej za  monokryształem,  prostopadle  do  kierunku 
wiązki  padającej.  Przy  takim  ustawieniu  błony  foto- 
graficznej mamy  do  czynienia  z metodą  promieni 
przechodzących.  Otrzymane  tą  metodą  rentgenogra- 
. my  nazywa  się  lauegramami  (il.  68,  tabl.  18). 

lauegram  w metodzie  Lauego  błonę  fotograficzną  można 
ustawić  również  między  monokryształem  a lampą 
rentgenowską.  Jest  to  wtedy  metoda  promieni  wstecz- 
nych, którą  można  wykonywać  rentgenogramy  (tzw. 
epigramy)  monokryształów  zupełnie  nieprzeniklrwych 
epigram  dla  stosowanej  wiązki  promieni,  np.  monokryształów 
bardzo  dużych  lub  bardzo  silnie  pochłaniających  pro- 
mieniowanie. . 

Metoda  Lauego  służy  głównie  do  badania  symetrii 
makroskopowej  monokryształów.  Jest  to  możliwe 
dlatego,  że  gdy  w monokrysztale  promienie  biegną 
równolegle  do  dwu-,  trój-,  cztero-  czy  sześciokrotnej 
osi  symetrii  lub  równolegle  do  płaszczyzny  symetrii, 
to  ślady  wiązek  odbitych  od  ułożonych  zgodnie  z sy- 
metrią płaszczyzn  sieciowych  będą  na  rentgenogramie 
odpowiednio  symetrycznie  rozmieszczone  wokół  sia- 
du wiązki  padającej.  Jeżeli  wiązka  padająca  przecho- 
dzi przez  kryształ  równolegle  do  /z-krotnej  osi  symetrii, 
wzdłuż  której  przecina  się  n płaszczyzn  symetrii,  to 
na  rentgenogramie  wokół  plamki  pierwotnej  wystąpi 
symetryczne  ułożenie  refleksów  równocześnie  wzglę- 
dem /z-krotnej  osi  symetrii  i n płaszczyzn  symetrii, 
obrazy  Istnieje  10  różnych  typów  obrazów  Lauego,  tzn. 
Lauego  różnych  symetrycznych  rozmieszczeń  refleksów  na 
rentgenogramach.  Obrazy  te  mają  symetrię:  1,  2,  3, 
4 6,  //z,  2 m,  3/tz,  4 w,  6m  (rys.  3).  Obraz  oznaczony 


Rys.  3.  10  typów  symetrii  lauegramów 


Na  podstawie  rentgenogramów  wykonanych  me- 
todą Lauego  nie  można  jednak  stwierdzić  obecności 
w monokrysztale  środka  symetrii.  W związku  z tym, 
stosując  metodę  Lauego,  nie  można  danego  mono- 
kryształu zaszeregować  do  jednej  z 32  klas  krystalo- 
graficznych (— ► Budowa  kryształów),  tylko  do  jednej  .. 
z 11  klas  dyfrakcyjnych  (klas  Lauego),  obejmujących  * asy 
po  kilka  klas  krystalograficznych  (różniących  się  mię- 
dzy sobą  jedynie  obecnością  lub  brakiem  środka  sy- 
metrii). Jedną  klasę  Lauego  o symbolu  4 jmmm  tworzą 
np.  cztery  klasy  tetragonalne:  4//?im/?7,  422,  4 mm, 

42  m.  Klasy  dyfrakcyjne  oznaczone  są  symbolami:  1, 

2/m,  mmm9  4/m,  4/mmm,  3,  3m,  6/m,  6/mmm,  m 3, 

m3m.  . . . 

Opisana  niżej  metoda  obracanego  kryształu  i jej 
różne  odmiany  wymagają  obracania  badanego  mo- 
nokryształu wokół  pewnej  prostej  sieciowej  (np.  osi 
krystalograficznej  X,  Y lub  Z).  Odpowiednie  usta- 
wienie monokryształu  przeprowadza  się  stosując  me- 
todę Lauego.  Po  wyznaczeniu  w monokrysztale  kie- 
runków osi  krystalograficznych  można  już  stosunko- 
wo łatwo  wykonać  pomiary  długości  krawędzi  ko- 
mórki elementarnej  za  pomocą  metody  obracane- 
go kryształu.  , , . 

W metodzie  obracanego  kryształu  wąska  wiązka  metoda 
(o  średnicy  0, 5-1,0  mm)  równoległych  monochroma-  obracanego 
tycznych  promieni  rentgenowskich  pada  na  mono-  kryształu 
kryształ,  któremu  zwykle  nadaje  się  kształt  walca 
(o  średnicy  0, 1-0,3  mm  i długości  kilku  mm)  lub  kulki 


4^ 


Rys.  4a.  Schemat  metody  obracanego  kryształu;  K prosta  sie- 
ciowa kryształu,  wokół  której  kryształ  jest  obracany 
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(mającej  średnicę  kilku  dziesiątych  mm).  Główkę 
goniometryczną  z przyklejonym  monokryształem 
umieszcza  się  w odpowiedniej  kamerze.  Monokrysz- 
tał podczas  wykonywania  rentgenogramu  jest  obra- 
cany wokół  jednej  z osi  krystalograficznych  lub  wokół 
innej  prostej  sieciowej  o niskich  wskaźnikach.  Oś 
obrotu  monokryształu  jest  prostopadła  do  wiązki 
promieni  padających.  W tych  warunkach  wzmocnio- 
ne promienie  interferencyjne  układają  się  na  powierz- 
chniach stożków  kołowych  ( rys . 4a),  zwanych  stożkami 
stożki  dyfrakcyjnymi,  o wspólnej  osi  będącej  prostą  sie- 
dyfrakcyjne  ciową,  wokół  której  obracany  jest  monokryształ. 

Monokryształ  obracany  jest  w tym  celu*  aby  coraz 
to  inne  jego  płaszczyzny  sieciowe  mogły  się  znaleźć 
w pozycji  odbijającej  promienie  rentgenowskie. 

Zbiór  wiązek  promieni  odbitych  od  płaszczyzn 
sieciowych  danego  monokryształu,  czyli  jego  tzw. 

. f . ° . az  obraz  dyfrakcyjny,  rejestruje  się  najczęściej  na  błonie 
ayrrakcyjny  fotograficznej  zwiniętej  w walec,  umieszczony  współ- 
osiowo z osią  obrotu  kryształu.  Na  tak  wykonanym 
rentgenogramie,  po  jego  rozprostowaniu,  refleksy  uło- 
żone są  wzdłuż  równoległych  do  siebie  prostych,  któ- 
warstwice  re  nazywane  są  warstwicami  (ilustracja  70,  tabl.  19\ 
Warstwice  są  oczywiście  śladami  stożków  dyfrakcyj- 
nych. 

wyznaczanie  Przy  danej  długości  fali  X promieniowania  odle- 
periodu  głość  między  warstwicami  bn  zależy  od  periodu  iden- 
identyczności  tyczności  J tej  prostej  sieciowej,  wokół  której  kryształ 
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nych.  W tym  celu  wykonuje  się  rentgenogramy  przy 
obracaniu  monokryształu  kolejno  wokół  osi  krysta- 
lograficznych Xy  Y,  Z. 

Po  wyznaczeniu  kształtu  i rozmiarów  komórki 
elementarnej  można  wyznaczyć  liczbę  Z atomów 
(cząsteczek)  znajdujących  się  w komórce  elementar- 
nej. Wykonuje  się  to  w następujący  sposób:  Należy 
masę  jednej  komórki  elementarnej  podzielić  przez  wy- 
rażoną w gramach  masę  jednego  atomu  (czy  jednej 
cząsteczki).  Masę  jednej  komorki  elementarnej  znaj- 
duje się  mnożąc  jej  objętość  V przez  gęstość  mono- 
kryształu D.  Masę  jednego  atomu  (cząsteczki)  uzysku- 
je się  przez  pomnożenie  masy  atomowej  (cząsteczko- 
wej) przez  Vi2  masy  atomu  węgla  12C,  wynoszącą 
1,660435  *1 0-24  g.  Ostatecznie  liczbę  Z oblicza  się  ze 
wzoru 


M -1,660435  *10“ 24  ’ 

gdzie  M oznacza  masę  atomową  (cząsteczkową),  V 
jest  wyrażone  w cm3,  a/)w  g/cm3. 

W krystalografii  rentgenowskiej  jednym  z ważniej- 
szych, ale  i trudniejszych  zadań  jest  tzw.  wskaźniko- 
wanie refleksów,  tj.  przypisywanie  poszczególnym 
refleksom  wskaźników  płaszczyzn  sieciowych  odbija- 
jących promienie  rentgenowskie  pod  danym  kątem  #, 
połączone  z ustalaniem  rzędu  odbicia. 

Znajomość  wskaźników  refleksów  jest  niezbędna 
np.  przy  określaniu  grupy  przestrzennej  kryształów 
czy  wyznaczaniu  położeń  atomów  w komórce  ele- 
mentarnej . 

Wskaźnikując  refleksy  uwzględnia  się  fakt,  że  tylko 
ich  część  powstaje  w wyniku  odbicia  promieni  przez 
płaszczyzny  sieciowe  o różnych  odległościach  mię- 
dzy płaszczyznowych.  Wiele  refleksów  powstaje  bo- 
wiem w wyniku  odbicia  promieni  przez  jedną  i tę 
samą  płaszczyznę  sieciową  pod  różnymi  kątami  # — 
spełniającymi  jednak  zawsze  równanie  Wulfa-Brag- 
ga.  Są  to  refleksy  otrzymywane  w różnych  rzędach 
odbicia,  dla  n = 1,2,  3...  Różnica  dróg  promieni  od- 
bitych w rzędzie  pierwszym  (n  = 1)  od  dwóch  sąsied- 
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był  obracany.  J można  obliczyć  stosując  wzór  nX  — 
= J sin  vn>  gdzie  n jest  rzędem  ugięcia  i numerem 
kolejnej  warstwicy,  vn  — kątem  warstwicowym  dla 
/*-tej  warstwicy.  Kąt  yn  wyznacza  się  z zależności 
tgvn  = ón/r,  gdzie  r jest  promieniem  cylindrycznie 
zwiniętej  błony  fotograficznej,  a bn  — odległością 
(w  mm)  między  warstwicą  /j-tą  a zerową. 

Mierząc  wzdłuż  jednej  warstwicy  odległość  / 
(w  mm)  między  każdymi  dwoma  refleksami  symetrycz- 
nie położonymi  względem  śladu  wiązki  padającej 
(rys.  4b),  można  wyznaczyć  braggowski  kąt  #,  co  z kolei 
pozwala  na  obliczenie— z równania  Wulfa-Brag- 
ga  — odległości  międzypłaszczyznowej  d{hki)  tej  ro- 
dziny płaszczyzn  sieciowych,  które  odbijając  promie- 
nie rentgenowskie  utworzyły  dane  refleksy^  Dla  war- 
stwicy zerowej  zachodzi  np.  zależność  : 

/ 4# 

2icr  360°  * 

Odmianami  metody  obracanego  kryształu  są:  me- 
toda kołysanego  kryształu  (w  której  monokryształ 
jest  obracany  nie  stale  o 360°,  lecz  jedynie  tam  i z po- 
wrotem, w pewnym  niewielkim  zakresie  kątów)  oraz 
metody  goniometryczne. 

Ponieważ  na  podstawie  wielkości  kąta  warstwico- 
wego  v można  z łatwością  bezpośrednio  wyznaczać 
periody  identyczności  prostych  sieciowych,  metody 
obracanego  i kołysanego  kryształu  są  podstawowymi 
metodami  określania  rozmiarów  komórek  elementar- 
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nich  płaszczyzn  sieciowych  jest  równa  12,  w rzędzie 
drugim  ( n = 2)  — równa  jest  22,  w rzędzie  trzecim 
(n  = 3)  — 32  itd.  (rys.  5). 

Wskaźnikowane  refleksy  oznacza  się  millerowskimi 
wskaźnikami  h,  k,  l tych  płaszczyzn  sieciowych,  które 
odbijały  promieniowanie,  przemnożonymi  przez  rząd 
odbicia.  Otrzymane  w ten  sposób  liczby  całkowite 
h,  k,  l nazywają  się  wskaźnikami  refleksów.  Nie  mu- 
symboie  szą  być  one  oczywiście  liczbami  pierwszymi  względem 
refleksów  siebie,  a dla  odróżnienia  od  symboli  płaszczyzn  sie- 
ciowych zapisuje  się  je  bez  nawiasu  okrągłego.  Tak 
więc  np.  symbol  444  oznacza  refleks  powstały  w wy- 
niku odbicia  promieni  w rzędzie  czwartym  od  pła- 
szczyzny sieciowej  (111).  Przy  wyznaczaniu  grupy 
przestrzennej  kryształu  czy  do  celu  analizy  struktu- 
ralnej kryształów  wskaźnikuje  się  zwykle  refleksy  na 
rentgenogramach  wykonanych  metodami  gonio- 
metrycznymi.  Można  jednakże  wskaźnikować  re- 
fleksy i na  rentgenogramach  otrzymywanych  metodą 
Lauego  lub  metodami  proszkowymi. 

Wyobraźmy  sobie  kryształ,  w którym  istnieją  różne 
rodziny  płaszczyzn  sieciowych  o jednakowych  lub 
prawie  jednakowych  odległościach  międzyptaszczy- 
znowych.  Jak  się  okazuje,  tego  rodzaju  sytuacja  ma 
duży  wpływ  na  wygląd  rentgenogramu  wykonanego 
niejedno-  metodą  obracanego  kryształu,  gdyż  leżące  na  jednym 
znaczność  stożku  dyfrakcyjnym  promienie  rentgenowskie,  od- 
wskaźniko-  bite  przez  płaszczyzny  sieciowe  o takich  samych  lub 
wania  bardzo  bliskich  wartościach  utworzą  jeden 

refleks  (w  obrębie  jednej  warstwicy  kierunki  promieni 
odbitych  zależą  tylko  od  d(hki)).  W rezultacie  takiego 
nakładania  się  na  siebie  refleksów  niemożliwe  się  staje 
przeprowadzenie  jednoznacznego  ich  wskaźnikowa- 
nia. Oznacza  to,  że  jednemu  refleksowi  można  przy- 
pisać wskaźniki  dwu  lub  nawet  kilku  płaszczyzn  odbi- 
jających. Nie  można  również  określić  intensywności 
nakładających  się  na  siebie  refleksów.  Niejednoznacz- 
ne wskaźnikowanie  refleksów  może  np.  uniemożliwić 
prawidłowe  wyznaczenie  grupy  przestrzennej  bada- 
nego kryształu. 

Nakładania  się  na  siebie  refleksów  można  jednak 
uniknąć  wykonując  rentgenogramy  w specjalny  spo- 
sób. Wykorzystuje  się  przy  tym  fakt,  że  np.  płaszczy- 
zny sieciowe  {hkl)  i {h'k'l')  o bliskich  lub  takich  sa- 
mych odległościach  międzypłaszczyznowych  nie  znaj- 
dą się  podczas  wykonywania  rentgenogramu  metodą 
obracanego  kryształu  w pozycji  odbijającej  równo- 
cześnie, lecz  znajdą  się  w niej  kolejno,  po  obrocie 
kryształu  o pewien  "kąt  <p , tj.  kąt  między  normalnymi 
płaszczyzn  sieciowych  {hkl)  i {h'k'l').  Jeżeli  podczas 
obracania  kryształu  o kąt  przesunięta  zostanie  błona 
fotograficzna,  to  promienie  rentgenowskie  odbite  od 
płaszczyzn  {hkl)  i {h'k'l/)  nie  padną  na  to  samo 
miejsce  błony. 

metody  go-  Metody  goniometryczne  polegają  na  zsynchronizo- 
niometryczne  wanym  z obrotem  kryształu  przesuwaniu  błony  foto- 
graficznej. W metodach  tych  na  jednej  błonie  foto- 
graficznej rejestruje  się  refleksy  należące  tylko  do  jed- 
nej warstwicy;  pozostałe  warstwice  zostają  usunięte 
przez  specjalne  przysłony  (tzw.  blendy  warstwicowe). 
Tak  więc  w metodach  goniometrycznych  refleksy  jed- 
nej warstwicy  zostają  rozłożone  na  całej  powierzchni 
rentgenogramu.  Kamery  rentgenowskie,  za  pomocą 
goniometry  których  uzyskuje  się  tego  rodzaju  dwuwymiarowe 
rentgenów-  „rozwinięcia”  poszczególnych  warstwie,  nazywają  się 
skie  goniometrami  rentgenowskimi.  Najczęściej  stosowa- 
nymi metodami  goniometrycznymi  są  metoda  Weis- 
senberga  i metoda  de  Jonga-Boumana. 
metoda  W metodzie  Weissenberga  skolimowana  wiązka 
Weissenberga  monochromatycznych  promieni  rentgenowskich  pada 
na  obracający  się  wokół  wybranej  prostej  sieciowej 
monokryształ.  Cylindrycznie  zwinięta  błona  foto- 
graficzna, umisezczona  współosiowo  z osią  obrotu 
monokryształu,  przesuwa  się  — tam  i z powrotem 
równolegle  do  osi  obrotu  monokryształu.  Pomiędzy 
kryształem  a błoną  fotograficzną  znajduje  się  cylin- 
dryczna blenda  warstwicowa  ze  szczeliną.  Przez  tę 
szczelinę  promienie  odbite  od  płaszczyzn  sieciowych 


dochodzą  do  błony  fotograficznej.  W kamerze  Weis- 
senberga rozwinięcie  dowolnej  warstwicy  można  uzy- 
skać zmieniając  w określony  sposób  kąt  między  kie- 
runkiem wiązki  padającej  promieni  a osią  obrotu 
kryształu  i ustawiając  odpowiednio  szczelinę  blendy 
warstwicowej.  Wskaźnikowanie  refleksów  na  rent- 
genogramach wykonanych  metodą  Weissenberga  jest 
jednak  dość  skomplikowane,  ponieważ  metodą  tą 
otrzymuje  się  na  rentgenogramach  zniekształcone 
obrazy  płaszczyzn  sieci  odwrotnej  (ii.  69,  tabl.  18 
i il.  76,  tabl.  20).  . , 

Sieć  odwrotna  jest  konstrukcją  ściśle  związaną  siec 
z siecią  przestrzenną  kryształu  i służy  do  rozwiązywa-  odwrotna 
nia  szeregu  zagadnień  krystalografii  rentgenowskiej. 

Sieć  odwrotną  konstruuje  się  prowadząc  z dowolnego 
węzła  „rzeczywistej”  sieci  przestrzennej  — przyjętego 
za  początek  układu  osi  współrzędnych  — normalne 
do  wszystkich  rodzin  płaszczyzn  sieciowych  {hkl) 

(rys.  6).  Wzdłuż  tych  normalnych  zaznacza  się  punk- 
ty (węzły)  znajdujące  się  w odległościach  d*  = n/d{hki) 
od  początku  układu  współrzędnych  {n  jest  liczbą  cał- 
kowitą). Otrzymane  punkty  ułożone  są  w przestrzeni 


Rys.  6.  Konstrukcja  płaszczyzny  X*Z*  sieci  odwrotnej 


periodycznie,  tworząc  trójwymiarową  sieć  nazywaną 
siecią  odwrotną.  Jak  wynika  z samej  konstrukcji, 
płaszczyznom  sieci  rzeczywistej  odpowiadają  węzły 
sieci  odwrotnej.  Wskaźniki  węzłów  sieci  odwrotnej  są 
wskaźnikami  płaszczyzn  sieciowych  pomnożonymi 
przez  liczbę  n.  Osie  sieci  odwrotnej  oznacza  się  sym- 
bolami  X*,  Y*,  Z*,  a jej  parametry  symbolami  a*,  b *, 
c*,  a*,  P*,  y*.  Z konstrukcji  sieci  odwrotnej  wynika 
również,  że 


a*  = — : , D = , C — • 

d(i  00)  “(010)  “(001) 

Sieć  odwrotna  przedstawia  wszystkie  teoretycznie 
możliwe  odbicia  promieni  rentgenowskich  od  płasz- 
czyzn sieciowych  kryształu.  Warstwica  na  rentgeno- 
gramie  otrzymanym  metodą  obracanego  kryształu 
odpowiada  jednej  płaszczyźnie  sieci  odwrotnej. 

Niezniekształcone  obrazy  płaszczyzn  sieci  odwrot-  metoda 
nej  otrzymuje  się  goniometryczną  metodą  de  Jonga-  de  Jonga 
Boumana,  w kamerze  nazywanej  retigrafem  (il.  74,  Boumana 
tabl.  20).  Skolimowana  wiązka  monochromatycznych 
promieni  rentgenowskich  pada  na  obracający  się  mo-  ret  ag  raf 
nokryształ.  Wiązka  padająca  tworzy  z płaszczyzną 
prostopadłą  do  osi  obrotu  monokryształu  kąt  f*  (rys. 

7);  zmieniając  odpowiednio  ten  kąt  można  uzyskać 
rozwinięcie  dowolnej  warstwicy,  tzn.  można  otrzymać 
obraz  dowolnej  płaszczyzny  sieci  odwrotnej,  prosto- 
padłej do  osi  obrotu.  Promienie  odbite  od  płaszczyzn 
sieciowych  kryszt-ału,  leżące  na  powierzchni  jednego 
stożka  dyfrakcyjnego,  docierają  do  błony  fotogra- 
ficznej przez  pierścieniową  szczelinę  w płaskiej  blen- 
dzie warstwicowej.  Płaska  błona  fotograficzna  b , usta- 
wiona prostopadle  do  osi  obrotu  kryształu,  obraca 
się  z tą  samą  prędkością  kątową  i w tym  samym  kie- 
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runku  co  monokryształ.  Osie  obrotu  monokryształu  a 
i błony  fotograficznej  są  do  siebie  równoległe  i prze- 
sunięte względem  siebie  na  odległość  A,  zależną  od 

wiązka  promieni 


Rys.  7.  Metoda  de  Jonga-Boumana:  a)  zasada  metody,  b)  kine- 
matyczny schemat  kamery 


numeru  rozwijanej  warstwicy.  Otrzymywane  rentge- 
nogramy  nazywa  się  rctigramami.  Refleksy  na  reti- 
gramach mają  kształt  litery  x. 

Wskaźnikowanie  refleksów  na  retigramach  jest 
bardzo  łatwe,  polega  na  określeniu  współrzędnych  re- 
fleksów względem  osi  sieci  odwrotnej  (ii.  72,tabl.  19). 

Na  podobnej  zasadzie  oparta  jest  metoda  precesyj- 
na, w której  monokryształ  nie  wykonuje  ruchu  obro- 
towego, lecz  ruch  precesyjny,  tak  że  np.  jedna  z jego 
osi  ( X , Y lub  Z)  obraca  się  wokół  wiązki  promieni  pa- 
dających. tworząc  z nią  stały  kąt. 


Wyznaczanie  grupy  przestrzennej  kryształu 

Może  się  zdarzyć,  że  na  rentgenogramach  po  prostu 
brakuje  niektórych  refleksów  i na  retigramach  wi- 
doczne są  jakby  puste  miejsca.  Mówimy  wtedy,  że 
pewne  refleksy  zostały  wygaszone.  Jeżeli  brakuje 
refleksów  w niektórych,  ściśle  określonych  dla  danej 
płaszczyzny  sieciowej  rzędach  odbicia,  to  mamy  do 
czynienia  z wygaszaniami  systematycznymi.  Wyga- 
szania systematyczne  refleksów  są  powodowane  przez 
centrowane  komórki  elementarne  oraz  przez  struktu- 
ralne elementy  symetrii.  Z wygaszaniami  systema- 
tycznymi refleksów  mamy  do  czynienia  wówczas,  gdy 
w wyniku  odbicia  promieni  rentgenowskich,  np.  od 
płaszczyzny  (110),  powstają  tylko  refleksy  220,  440, 
660,  880, ... , a brak  refleksów  1 10,  330,  550,  770  ...  itp. 

Badanie  wygaszań  systematycznych,  które  wymaga 
uprzedniego  wywskaźnikow-ania  refleksów,  prowadzi 
więc  do  wykrywania  w krysztale  osi  śrubowych 
i płaszczyzn  poślizgu  oraz  ustalania  typu  sieci  Bra- 
vais’go. 

Wygaszania  systematyczne  powodowane  przez  cen- 
trowane komórki  elementarne  nazywają  się  wygasza- 


niami integralnymi.  Powstają  one  dlatego,  że  wskutek  wygaszania 
centrowania  komórki  pojawiają  się  pomiędzy  nie-  integralne 
którymi  płaszczyznami  sieciowymi  „dodatkowe” 


Rys.  8.  Płaszczyzny  sieciowe 
(100),  (110),  (120),  w komór- 
ce elementarnej  sieci  typu  I 
(komórkę  elementarną  i pła- 
szczyzny sieciowe  przedsta- 
wiono w rzucie  prostokąt- 
nym na  płaszczyznę  XY ). 

Liniami  niebieskimi  zazna- 
czono płaszczyzny  „dodat- 
kowe” 

płaszczyzny  (w  porównaniu  z komórką  prymitywną), 
tak  że  dla  pewnych  rzędów  odbicia  różnice  dróg  stają 
się  równe  nie  nX,  lecz  (n/2) X.  W sieci  typu  / dodatkowe 
płaszczyzny  sieciowe  znajdują  się  np.  pomiędzy  płasz- 
czyznami (100)  i (120),  a nie  ma  ich  między  płaszczyz- 
nami (110)  (rys.  8).  Na  rentgenogramach  kryształów 
mających  sieci  typu  / wystąpią  więc  np.  refleksy  002, 

004,  006  ... , 240, 480,  6- 12*0 ... , 1 10, 220, 330, 440 ... . 

Ogólnie:  dla  sieci  typu  1 występują  tylko  te  refleksy, 
dla  których  suma  wskaźników  jest  liczbą  parzystą:  re9u*a 
h+łc-rl  = 2n.  Powyższe  uogólnienie  jest  tzw.  regułą  wygaszań 
wygaszań  dla  sieci  typu  I. 

Typ  sieci  Bravais’go  w krysztale  można  również 
wyznaczyć  bez  wskaźnikowania  refleksów  i badania 
reguł  wygaszań,  po  prostu  mierząc  oprócz  stałych 
sieciowych  a,  b,  c periody  identyczności  prostych  sie- 
ciowych będących  przekątnymi  ścian  komórki  ele- 
mentarnej oraz  period  identyczności  jednej  z prostych 
sieciowych  będących  przekątnymi  przestrzennymi 
komórki  elementarnej. 

Śrubowe  osie  symetrii  powodują  powstawanie  wy-  wygaszania 
gaszań  systematycznych  zwanych  wygaszaniami  seryj-  serYjne 
nymi.  Są  to  wygaszania  dotyczące  refleksów  powsta- 
jących w wyniku  odbicia  promieni  rentgenowskich  od 
płaszczyzny  sieciowej  prostopadłej  do  osi  śrubowej. 

Wygaszania  te  pojawiają  się  dlatego,  że  w wyniku 
działania  /z-krotnej  osi  śrubowej  następuje  jakby 
rozszczepienie  płaszczyzny  sieciowej  prostopadłej  do 
niej  np.  na  n płaszczyzn  (w  porównaniu  z działaniem 
zwykłej  /i-krotnej  osi  symetrii;  rys.  9).  Jeżeli  w sieci 
przestrzennej  istnieje  np.  oś  4t  o kierunku  [001],  to 
refleksy  o wskaźnikach  typu  00/  wystąpią  na  rentgeno- 
gramie  tylko  wtedy,  gdy  / = 4 n (tzn.  refleksy  004, 

008,  00-12...). 


Rys.  9. 'Płaszczyzna  sieciowa  (001)  w komórkach  elementarnych 
sieci  przestrzennych  z czterokrotną  osią  symetrii:  a)  zwykła, 
b)  śrubową  (rzut  prostokątny  na  płaszczyznę  YZ)\  liniami  nie- 
bieskimi zaznaczono  „dodatkowe”  płaszczyzny  (001) 


Trzeci  rodzaj  wygaszań  systematycznych  — wyga-  wygaszania 
szania  pasowe  — powodują  płaszczyzny  poślizgu,  pasowe 
w wyniku  bowiem  działania  tych  ostatnich  także  po- 
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wstają  dodatkowe  płaszczyzny  sieciowe  (rys.  10). 
Jeżeli  np.  w krysztale  występuje  płaszczyzna  poślizgu 
typu  c równoległa  do  (010),  to  refleksy  o wskaźnikach 
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Rys.  10.  Płaszczyzna  poślizgu  c równoległa  do  płaszczyzny  ry- 
sunku powoduje  pojawienie  się  dodatkowych  (linie  niebieskie) 
płaszczyzn  sieciowych  (h0f)r  w stosunku  do  sieci  przestrzennej 
bez  płaszczyzny  poślizgu  (rzut  prostokątny  na  płaszczyznę  X Z) 


typu  hOl  wystąpią  na  rentgenogramach  tylko  wtedy, 
gdy  / = 2n. 

Dla  każdego  rodzaju  sieci  Bravais*go,  osi  śrubowej, 
płaszczyzny  poślizgu  istnieje  ściśle  określona  reguła 
wygaszań  refleksów.  Kombinacje  tych  reguł  dają  pra- 
wa wygaszań  dla  poszczególnych  grup  przestrzennych. 
Prawa  te,  zebrane  w specjalnych  tabelach  (np.  Inter- 
national Tables  for  JT-Ray  Crystallography,  Bir- 
mingham 1952),  umożliwiają  identyfikację  grup 
przestrzennych  (dyfrakcyjnych)  po  przeprowadzeniu 
analizy  wygaszań  refleksów.  Ponieważ  na  podstawie 
wygaszań  nie  można  stwierdzić  obecności  lub  braku 
środka  symetrii  w kiysztale,  a pozostałe  makroskopo- 
we elementy  symetrii  również  nie  wpływają  na  wyga- 
szania, to  niektórych  grup  przestrzennych  nie  można 
od  siebie  odróżnić,  gdyż  grupy  te  dają  jednakowe  wy- 
gaszania. W związku  z tym  dany  kryształ  można  za- 
kwalifikować jedynie  do  jednej  ze  122  grup  dyfrakcyj- 
nych, a nie  do  jednej  z 230  grup  przestrzennych.  Osta- 
tecznego wyboru  grupy  przestrzennej  w obrębie  grupy 
dyfrakcyjnej  można  dokonać  badając  anizotropię  nie- 
których fizycznych  własności  kryształów  (np.  wystę- 
powanie 2jawiska  piezoelektrycznego  lub  piroelek- 
trycznego)  lub  analizując  liczbę  maksimów  na  wykre- 
sie funkcji  Pattersona  (zob.  rozdział  „Strukturalna 
analiza  kryształów”). 


Rys.  11.  Układ  osi  a>,  4>,  w automatycznym  czterokołowym 
dyfraktometrze  do  badania  monokryształów 


Czterokołowy  dyfraktometr  do 
monokryształów 

Najdoskonalszym  obecnie  przyrządem  do  badania 
struktury  kry  ształów  jest  automatyczny  czterokołowy 
dyfraktometr  rentgenowski,  określający  z wielką  pre- 
cyzją położenie  odbitych  wiązek  promieni  oraz  ich 
natężenie.  Dyfraktometr  taki  składa  się  ze  źródła 
promieniowania  rentgenowskiego,  czterokołowego 
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goniometru,  detektora,  urządzenia  pomiarowo-reje- 
strującego  i komputera. 

Monokryształ  przymocowany  do  głó\vki  gomo- 
metrycznej  można  obracać  niezależnie  wokół  czterech 
osi  0,  z,  23  (rys.  11)  za  pomocą  4 kół  (łuków)  urzą- 
dzenia goniometrycznego.  Kryształ  znajduje  się  zawsze 
w punkcie  przecięcia  się  osi  wszystkich  czterech 
kół.  Obroty  kryształu  wokół  osr  co,  0,  % pozwalają 
ustawić  dowolną  jego  płaszczyznę  sieciową  w pozycji 
odbijającej  promieniowanie.  Koło  23  umożliwia  usta- 
wienie detektora  w takiej  pozycji,  przy  której  dany 
promień  odbity  może  zostać  zarejestrowany  (detekto- 
rem jest  zwykle  licznik  proporcjonalny  lub  scyntyla- 
cyjny). Dzięki  licznikom  można  zmierzyć  intensyw- 
ność refleksu  z bardzo  dużą  dokładnością  — ok.  1%. 

Zadaniem  komputera  jest  sterowanie  procesem 
automatycznego  poszukiwania  refleksu  oraz  pomiaru 
jego  położenia  i natężenia,  a także  rejestrowanie  mie- 
rzonych wielkości. 

Niektóre  typy  dyfraktometrów  wymagają  uprzed- 
niego wyznaczenia  stałych  sieciowych  i grupy  prze- 
strzennej badanego  kryształu  (metodami  fotograficz- 
nymi) oraz  wstępnego  zorientowania  kryształu  na  go- 
niometrze.  Inne  typy  — nie  potrzebują  żadnych  wstęp- 
nych wiadomości  o badanym  krysztale  oraz  nie  wyma- 
gają orientowania  kryształu:  same,  sterowane  swoim 
minikomputerem  określają  i mierzą  komórkę  elemen- 
tarną. Istnieją  też  dyfraktometry,  które  ze  zmierzo- 
nych intensywności  od  razu  przygotowują  dane  (zbiory 
wartości  \Fhki\)  do  analizy  strukturalnej. 

Automatyczne  dyfraktometry  do  monokryształów 
(ii.  78,  tabl.  20),  mimo  że  zapewniają  znacznie  większą 
precyzję  i szybkość  pomiarów  niż  metody  fotograficzne, 
nie  są  jeszcze  przyrządami  idealnymi,  zwłaszcza  gdy 
chodzi  o badanie  struktur  kryształów  niestabilnych 
(np.  kryształów  białek)  czy  kryształów  o bardzo  dużych 
krawędziach  komórki  elementarnej.  Zbyt  długi  jest 
bowiem  czas  pomiaru  każdego  refleksu  (wynosi  1 ,5-3 
min)  i czas  poszukiwania  refleksu,  tzn.  odpowiedniego 
orientowania  czterech  osi  goniometru.  Trzeba  wziąć 
pod  uwagę,  że  mierzy  się  nieraz  po  kilka  tysięcy  re- 
fleksów (np.  A.  Korczyński,  M.  Nardelli,  M.  A.  Pellin- 
ghelli  zmierzyli  w r.  1973  przy  badaniu  struktury  krysz- 
tałów HgCV4SC(NH2)2  za  pomocą  dyfraktometru 
AED  Siemensa  intensywność  5785  refleksów’,  z szyb- 
kością 1 pomiar  na  90  s,  nie  licząc  czasu  ustawienia 
przez  przyrząd  płaszczyzn  sieciowych  w pozycji  od- 
bijającej). Przy  badaniu  struktury  kryształów  bia- 
łek—oprócz  konieczności  zmierzenia  wielu  tysięcy 
refleksów  — występuje  dodatkowe  utrudnienie,  zwią- 
zane z rozkładem  chemicznym  tych  kryształów  pod- 
czas pomiarów;  w rezultacie  wielokrotna  wymiana 
kryształów  na  goniometrze  wydłuża  czas  badania. 

Trwające  obecnie  na  świecie  poszukiwania  nowych 
rozwiązań  konstrukcyjnych  dyfraktometrów,  umożli- 
wiających skrócenie  czasu  przeprowadzania  badan 
jednego  kryształu,  idą  w kilku  kierunkach:  w kierun- 
ku przyspieszania  pracy  istniejących  gomometrow, 
np  przez  równoczesne  ustawianie  wszystkich  czterech 
osi  goniometru  czy  zwiększanie  szybkości  obrotu 
monokryształu  (do  1500°/min)  wokół  poszczególnych 
osi;  w kierunku  stosowania  źródeł  promieniowania 
rentgenowskiego  o dużej  mocy  (lampy  rentgenowskie 
z wirującą  anodą),  co  skraca  czas  ustawiania  kryształu 
i detektora  we  właściwej  pozycji  dzięki  powstawaniu 
intensywniejszych  wiązek  odbitych,  oraz  kierunku 
zastosowania  zamiast  jednego  licznika  kilku  liczni- 
ków, mierzących  równocześnie  kilka  wiązek,  tzw. 
„jednoczesnych”  lub  „prawie  jednoczesnych  \ 

Szybkie  pomiary  przeprowadza  się  również  w dy- 
fraktometrach pozycyjnych,  w których  obraz  dyfrak- 
cyjny jest  rejestrowany  przez  mozaikę  liczników,  albo 
w tzw.  dyfraktometrach  energodyspersyjnych,  w któ- 
rych się  stosuje  promieniowanie  polichromatyczne 
i rejestruje  się  równocześnie  wszystkie  rzędy  odbicia 
od  jednej  płaszczyzny  sieciowej.  W pierwszym  wy- 
padku miniaturowe  liczniki  półprzewodnikowe  lub 
proporcjonalne  układa  się  w jedno-  lub  dwuwymiaro- 
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we  mozaiki.  Kryształ  wykonuje  tylko  jeden  obrót 
o 360  , a podczas  tego  obrotu  mierzy  się  wszystkie 
wiązki  odbite  odpowiadające  jednej  płaszczyźnie 
sieci  odwrotnej.  W jednym  z dyfraktometrów  zasto- 
sowano np.  jednowymiarową  mozaikę  liczników  pół- 
przewodnikowych rozmieszczoną  na  luku  180°.  W tej 
mozaice  znajdowało  się  128  liczników  o wymiarach 
3x4  mm.  W takim  dyfraktometrze  uzyskano  prawie 
dziesięciokrotne  skrócenie  czasu  przeprowadzania 
pomiarów  jednego  kryształu.  W innym  dyfrakto- 
metrze zastosowano  4 segmenty  łukowe  mozaiki 
liczników,  a każdy  z nich  zawierał  128  liczników  pro- 
porcjonalnych. Wydajność  takiego  dyfraktometru 
zależy  od  stałych  sieciowych  badanego  kryształu  i wy- 
gaszań  systematycznych  i jest  20-60  razy  większa  niż 
wydajność  dyfraktometru  z jednym  licznikiem. 

W dyfraktometrach  do  monokryształów  stosuje  się 
również  tzw.  wieloniciową  kamerę  proporcjonalną, 
będącą  ^dwuwymiarowym  detektorem  „czułym  na 
pozycję”,  oraz  pozycyjno  czułe  detektory  scyntylacyj- 
ne, przetwarzające  (za  pomocą  ekranu  — konwertora 
polikrystalicznego  ZnS  lub  monokrystalicznego  Nal) 
rentgenowski  obraz  dyfrakcyjny  na  obraz  w świetle 
widzialnym.  Jasność  takiego  obrazu  przetwornik 
elektronooptyczny  wzmacnia  105  razy,  a po  wzmocnie- 
niu obraz  ten  jest  zapamiętywany  w lampie  telewi- 
zyjnej (ikonoskooie)  i dalej  odczytywany  przez 
elektroniczną  maszynę  cyfrową.  Te  ostatnie  dyfrak- 
tometry imitują  w swej  pracy  serię  rentgenogramów 
wykonywanych  metodą  kołysanego  kryształu. 


Metody  proszkowe 

Większość  ciał  stałych  występujących  w przyrodzie 
i wytwarzanych  przez  człowieka  (np.  skały,  metale, 
materiały  ceramiczne  i budowlane)  to  konglomeraty 
drobnych,  mikroskopowej  wielkości  kryształów.  Nie 
występują  tu  tak  duże  kryształy,  by  do  ich  badania 
można  było  zastosować  metodę  obracanego  kryształu 
czy  metodę  Lauego. 

Rentgenostrukturalne  badania  ciał  polikrystalicz- 
nych przeprowadza  się  za  pomocą  metody  opracowa- 
nej przez  Debye’a,  Sherrera  i Hulla  oraz  jej  różnych 
odmian  (takich  jak  metody  ogniskujące  czy  metoda 
dyfraktometryczna) . 

W metodzie  Debye’a-Scherrera-Hulla  wąska  wiąz- 
ka równoległych,  monochromatycznych  promieni 
rentgenowskich  pada  na  preparat  sporządzony  z kry- 
stalicznego proszku.  Preparat  może  mieć  kształt  prę- 
cika o średnicy  ok.  0,3  mm  i długości  2-3  mm.  Wiel- 
kość ziaren  proszku  powinna  być  rzędu  1 pm,  co 
oznacza,  że  w celu  otrzymania  takiego  proszku  nale- 
żałoby np.  sześcienny  monokryształ  o krawędzi  dłu- 
gości 1 mm  podzielić  na  ok.  109  drobnych  krystalitów. 
W takim  preparacie  w odbijaniu  promieni  rentge- 
nowskich biorą  udział  te  płaszczyzny  sieciowe  po- 
szczególnych krystalitów,  które  zupełnie  przypadko- 
wo znajdują  się  w pozycj  i spełniającej  równanie  Wulfa- 
Bragga.  W każdym  krystalicie  odbija  promienie  rent- 
genowskie tylko  jedna  płaszczyzna  sieciowa,  ale  teore- 
tycznie w każdym  krystalicie  może  to  być  inna  płasz- 
czyzna. Ponieważ  w preparacie  jest  praktycznie  nie- 
skończona liczba  krystalitów,  a liczba  płaszczyzn 
sieciowych  odbijających  promieniowanie  jest  ograni- 
czona, to  w wielu  krystalitach  promienie  rentgenow- 
skie będą  odbijane  przez  tę  samą  płaszczyznę  sieciową. 

Płaszczyzny  sieciowe  o tej  samej  odległości  między- 
płaszczyznowej,  ułożone  w preparacie  chaotycznie, 
odbijają  promienie  rentgenowskie  w różnych  kierun- 
kach przestrzeni,  ale  zawsze  pod  tym  samym  kątem 
2#/,**  w stosunku  do  wiązki  padającej.  W rezultacie 
promienie  odbite  w różnych  krystalitach  od  tej  samej 
rodziny  płaszczyzn  sieciowych  (hkl)  leżą  na  powierzch- 
ni stożka  (tzw.  stożka  Debye’a),  którego  osią  jest  pro- 
mień padający.  Dla  każdej  rodziny  płaszczyzn  sie- 
ciowych powstaje  odrębny  stożek  promieni  odbitych 
(rys.  12). 


Obraz  dyfrakcyjny  preparatu  proszkowego  reje- 
struje się  albo  na  płaskiej  błonie  fotograficznej,  albo 
znacznie  częściej  — na  błonie  fotograficznej  zwiniętej 


Rys.  12.  Stożki  promieni  odbitych  w metodzie  Debye’a-Scher- 
rera-HuIla 

w walec.  W pierwszym  wypadku  refleksy  na  rentgeno- 
gramie  mają  kształt  pierścieni  o różnej  intensywności, 
w drugim  — linii  krzywych  wyższego  rzędu  (il.  67, 
tabl.  18).  Dla  danego  refleksu  można  zawsze  wy- 
znaczyć kąt  połysku  3,  obliczyć  wartość  dhki  oraz 
zmierzyć  intensywność.  Obraz  dyfrakcyjny  rejestruje 
się  również  za  pomocą  licznika  Geigera-Mullera  lub 
scyntylacyjnego  w dyfraktometrze  rentgenowskim. 

Metodami  proszkowymi  można  rozwiązywać  nie- 
które  zadania  krystalografii  rentgenowskiej,  jak  np.  metod 
wyznaczanie  stałych  sieciowych  czy  grup  przestrzeń- 
nych.  Jednak  możliwości  stosowania  tych  metod  P " ych 
w krystalografii  rentgenowskiej  czy  w analizie  struktu- 
ralnej kryształów  są  bardzo  ograniczone,  przede 
wszystkim  ze  względu  na  trudności  przy  wskaźniko- 
waniu refleksów.  Wskaźnikowanie  to  jest  stosunkowo 
proste  jedynie  na  rentgenogramach  proszkowych 
kryształów  regularnych,  heksagonalnych  i tetrago- 
nalnych;  natomiast  dla  kryształów  trójskośnych, 
jednoskośnych  i rombowych  wskaźnikowanie  jest  bar- 
dzo trudne,  a w dodatku  często  niejednoznaczne  ze 
względu  na  nakładanie  się  refleksów. 
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Rentgenografia  stosowana 

Metody  proszkowe  znajdują  natomiast  szereg  zasto- 
sowań praktycznych  w chemii,  fizyce,  metalurgii  czy 
geologii  i są  podstawą  tzw.  rentgenografii  stosowanej. 

Do  takich  praktycznych  zastosowań  należą:  jakościo- 
we i ilościowe  określanie  składu  fazowego  substancji  analiza 
(tzw.  analiza  fazowa),  wyznaczanie  wielkości  krysta-  fazowa 
litów,  precyzyjne  pomiary  stałych  sieciowych  (do- 
kładność ich  określenia  może  osiągnąć  10-5— 10~6!), 
wyznaczanie  współczynników  rozszerzalności,  ba- 
danie tekstur,  badanie  naprężeń  wewnętrznych. 

Każda  substancja  krystaliczna  oddziałując  z pa- 
dającymi  na  nią  promieniami  rentgenowskimi  tworzy 
charakteryzujący  ją  jednoznacznie  obraz  dyfrakcyjny. 

Tak  więc  i rentgenogramy  proszkowe  (bo  tylko  na 
nich  zarejestrowany  jest  cały  obraz  dyfrakcyjny)  jed- 
noznacznie charakteryzują  daną  substancję  i to  bez 
względu  na  to,  czy  występuje  ona  jako  czysta  faza, 
czy  jako  składnik  mieszaniny.  Jeśli  badana  substancja 
stanowi  mieszaninę  dwóch  lub  więcej  związków  che- 
micznych (faz),  to  każda  z tych  faz  daje  na  rentgeno- 
gramie  proszkowym  swoje  własne  refleksy.  Analiza  fa- 
zowa pozwala  wykrywać  substancje  krystaliczne  w ta- 
kiej postaci,  w jakiej  występują  one  w danym  prepa- 
racie, a nie  w postaci  jonów  czy  pierwiastków  che- 
micznych wchodzących  w ich  skład.  Tak  więc  np. 
dyfrakcyjna  analiza  fazowa  pozwala  stwierdzić,  że 
w mieszaninie  NaCI  i KBr  występują  chlorek  sodowy 
i bromek  potasowy,  a nie  chlorek  potasowy  i bromek 
sodowy  (analiza  chemiczna  wykazałaby  w takiej  mie- 
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Rys.  13.  Tekstura 
drutu  aluminiowe- 
go; do  osi  drutu 
równoległy  jest  w 
przybliżeniu  kieru- 
nek [111]  krystali- 
tów 


Rys.  14.  Tekstura 
walcowanej  blachy 
stalowej ; do  powie- 
rzchni blachy  jest 
równoległa  płasz- 
czyzna sieciowa 
(100)  krystalitów,  a 
do  kierunku  walco- 
wania — kierunek 
[110] 


szaninie  obecność  jonów  Na+,  K+,  Cl  , Br  , lecz  nie 
wskazałaby,  jak  te  jony  połączone  są  ze  sobą  w ciele 
stałym).  Dyfrakcyjna  analiza  fazowa  pozwala  rozróż- 
niać w prosty  sposób  odmiany  polimorficzne  ciał  kry- 
stalicznych. Można  odróżnić  np.  kalcyt  CaCOs  od 
aragonitu  CaC03  i vaterytu  CaC03  lub  odróżnić  od 
siebie  jedenaście  odmian  Si02. 

Jakościową  analizę  fazową  przeprowadza  się  po- 
równując wartości  dhki  i intensywności  I poszczegól- 
nych refleksów  wyznaczone  z rentgenogramu  prosz- 
kowego badanej  substancji  z wartościami  dhki  i 1 po- 
danymi w tzw.  rentgenograficznym  wzorcu  liczbowym. 
Wzorzec  ten  jest  tabelką,  w której  się  znajdują  war- 
tości dhki  i / otrzymane  z rentgenogramu  proszkowe- 
go substancji  wzorcowej.  Rentgenograftczne  wzorce 
liczbowe  gromadzi  się  w specjalnych  kartotekach,  jak 
np.  kartoteka  Powder  Diffraction  Data,  wydawana 
w USA  przez  JC  PDS  — International  Centre  for 
Diffraction  Data  (dawniej  tzw.  kartoteka  ASTM). 
Odpowiedni  wzorzec  w takiej  kartotece  (liczącej  kilka- 
dziesiąt tysięcy  kart)  wynajduje  się  za  pomocą  specjal- 
nego klucza.  Na  podstawie  rentgenogramu  proszko- 
wego można  jednoznacznie  zidentyfikować  substancję 
— również  w mieszaninie  — znajdując  w kartotece 
odpowiedni  wzorzec. 

Teksturą,  albo  teksturą  krystaliczną,  nazywa  się 
uprzywilejowaną  wzajemną  orientację  przestrzenną 
krystalitów  w materiale  polikrystalicznym.  Tekstury 
powstają  m.in.  podczas  krystalizacji,  odlewania,  ciąg- 
nienia i zgniatania  materiałów.  Występują  np.  we 
włóknach  azbestu,  w drutach  i blachach.  W drutach 
ciągnionych  tekstura  polega  na  ułożeniu  krystalitów 
pewnym  kierunkiem  w przybliżeniu  równolegle  do 
osi  drutu  (rys.  13).  W blachach  walcowanych  krystali- 
ty układają  się  pewnym  kierunkiem  w przybliżeniu 
równolegle  do  kierunku  walcowania  (oznaczonego 
strzałką  na  rys.  14),  a pewną  płaszczyzną  sieciową 
równolegle  do  powierzchni  blachy.  Występowanie 
tekstury  ma  wpływ  — czasem  dodatni,  czasem  ujem- 
ny _ na  wiele  właściwości  materiałów,  m.in.  na  wy- 
trzymałość i na  twardość  metali.  Stąd  duże  znaczenie 
ma  badanie  tekstur  rentgenostrukturalną  metodą 
proszkową.  Występowanie  tekstury  w materiale  poli- 
krystalicznym wpływa  na  wygląd  rentgenogramu 
proszkowego,  albowiem  intensywność  jednych  reflek- 
sów wzrasta,  a innych  maleje  lub  pozostaje  bez  zmia- 
ny. Refleksy  przybierają  kształt  łuków  i układają  się 
wzdłuż  warstwie  (il.  7 lb,  c,  tabl.  19). 

Za  pomocą  metod  proszkowych  można  uzyskać 
wiele  interesujących  danych  o polimerach  organicz- 
nych. Istnienie  w strukturze  polimerów  obszarów 
bezpostaciowych  i krystalicznych  powoduje  występo- 
wanie na  rentgenogramie  proszkowym  rozmytego 
szerokiego  refleksu  od  fazy  bezpostaciowej  oraz  re- 
fleksów charakterystycznych  dla  fazy  krystalicznej 
(il.  71a,  tabl.  19).  Pod  wpływem  np.  rozciągania  próbki 
polimeru  obszary  krystaliczne  bezładnie  w nim  roz- 
łożone mogą  uzyskać  orientację  zależną  od  kierunku 
przykładanych  sił,  czyli  w polimerze  może  zostać  wy- 
tworzona tekstura.  Rentgenogram  proszkowy  stek- 
sturowanego  polimeru  (również  i metalu)  jest  podobny 
do  rentgenogramu  wykonanego  metodą  obracanego 
kryształu  (il.  71,  tabl.  19),  a z takiego  rentgenogramu, 
z odległości  między  warstwicami,  można  wyznaczyć 
jedną  z krawędzi  komórki  elementarnej  kryształu  po- 
limeru. Często  jest  to  jedyna  metoda  uzyskania  stałych 
sieciowych  polimerów,  gdyż  nie  zawsze  można  uzys- 
kać monokryształy  danego  polimeru  o wielkości  od- 
powiedniej do  badań  dyfrakcyjnych. 
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Elektronografia 

Janusz  Leciejewicz 

Odkrycie  dyfrakcji  wiązki  elektronów  w folii  niklowej 
przez  C.  J.  Davissona  i L.  H.  Germera  (1927  r.)  było 
doświadczalnym  potwierdzeniem  hipotezy  L.  de  Bro- 
glie’a  o falowym  charakterze  ruchu  cząstek  (1924  r.). 

Długość  fali  elektronów  A jest  związana  z pędem  elek- 
tronu p zależnością  de  Broglie^ 

A = hjp  = hjmv , 

gdzie:  h — stała  Plancka,  m — masa  spoczynkowa 
elektronu,  v — prędkość  elektronu.  Wyrażając  pręd- 
kość elektronów  przez  przyspieszającą  je  różnicę  po- 
tencjałów U i podstawiając  wartości  liczbowe  na  h i /«, 
otrzymuje  się  zależność 

X = 12,26 l\Tu, 

w której  A wyraża  się  w A a U w V.  W zależności  tej 
nie  uwzględnia  się  relatywistycznego  wzrostu  masy 
elektronu  ze  zwiększaniem  się  jego  prędkości.  Błąd 
w określeniu  A,  związany  z pominięciem  poprawki 
relatywistycznej,  wynosi  2-3%  dla  U rzędu  20-40  kV, 
wzrasta  jednak  do  10%  przy  różnicy  potencjałów 
200  kV. 

Spójne  i sprężyste  rozpraszanie  wiązki  elektronów 
przez  sieć  krystaliczną  prowadzi  do  powstawania  ma- 
ksimów interferencyjnych  (refleksów)  występujących 
pod  kątem  ugięcia  & określonym  prawem  Wulfa- 
Bragga  (zob.  rozdział  „Krystalografia  rentgenow- 
ska”)- Natężenie  ugiętych  wiązek  elektronów  zależy 
od  struktury  krystalicznej  badanej  substancji. 

Wiązka  elektronów  padając  na  atom  ulega  ugięciu 
wskutek  oddziaływania  kulombowskiego  z potem 
elektrostatycznym  atomu.  Pole  to  pochodzi  zarówno 
od  dodatniego  jądra  atomu  jak  i ujemnej  powłoki 
elektronowej.  Dodatni  potencjał  jądra  (proporcjo- 
nalny do  liczby  atomowej  Z)  jest  skupiony  na  małej 
przestrzeni  wokół  jądra,  natomiast  potencjał  ujemny 
pochodzący  od  powłoki  elektronowej,  bardziej  „roz- 
myty”, jest  funkcją  zarówno  liczby  elektronów  jak 
i ich  rozkładu  w powłoce  atomu.  Zatem  wielkość  cha- 
rakteryzująca ugięcie  elektronów  na  atomie  ato- 
mowy czynnik  rozpraszania  elektronów  fe  — zależy 
od  ładunku  jądra  i od  liczby  elektronów.  Zależność 
od  liczby  elektronów  w powłoce  atomu  opisuje  ato- 
mowy czynnik  rozpraszania  promieni  rentgenowskich 
/r,  będący  funkcją  kąta  ugięcia  Ogólnie  można  to 
zapisać: 

fety)  = COnStfZ—  /r(#)]. 

Taka  zależność  fe  od  kąta  ugięcia  & powoduje,  że  ato- 
my o małym  Z (atomy  lekkie)  są  stosunkowo  silnymi 
ośrodkami  rozpraszającymi  elektrony.  Jest  więc  moż- 
liwe określenie  położeń  atomów  lekkich  w obecności 
atomów  z dużym  Z (atomów  ciężkich)  ze  znacznie 
większą  dokładnością  niż  na  to  pozwala  metoda 
dyfrakcji  promieni  rentgenowskich. 

Elektrony  jako  cząstki  obdarzone  ładunkiem  elek- 
trycznym, oddziałują  silnie  z atomami  i są  absorbowa- 
ne. Dlatego  wnikają  do  wnętrza  kryształu  na  niewiel- 
kie głębokości  (przyspieszone  różnicą  potencjałów 
200  kV  wnikają  na  głębokość  1000  A).  Zjawisko  to 
ogranicza  zakres  stosowalności  metody  dyfrakcji 
elektronów  do  preparatów  cienkowarstwowych.  Z 
drugiej  strony  jednak  umożliwia  badanie  struktury 
materiałów  występujących  w postaci  cienkich  warstw, 
nawet  wtedy  gdy  grubości  ich  wynoszą  tylko  500  A. 

Badanie  materiałów  w postaci  warstw  grubości  badanie 
rzędu  mikrometrów  stwarza  konieczność  stosowania  cienkich 
elektronów  przyspieszanych  różnicą  potencjału  50-  warstw 
100  kV.  Elektrony  te  mają  długość  fali  0,055-0,039  A, 
wtedy  braggowskie  kąty  ugięcia  dla  większości  ma- 
teriałów nieorganicznych  nie  przekraczają  3-4°. 

Do  określania  odległości  międzypłaszczyznowych 
dhki  można  użyć  równania  Wulfa-Bragga  («A  — 

= 2dhki  s\n&)  w postaci  przybliżonej.  Ponieważ  kąt 
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określanie  2&  (rys.  1)  jest  bardzo  mały,  można  napisać  2sind  « 
dkki  ~ sin  2#  ^ tg2#  = rnu/L,  a więc 


elektrono* 

gramy 


elektronograf 


gdzie:  rhu  — odległość  między  śladem  ugiętej  wiązki 
a śladem  wiązki  pierwotnej  na  błonie  fotograficznej, 
L — odległość  między  preparatem  a błoną  fotogra- 
ficzną. Przybliżenie  to  wprowadza  błąd  nie  większy 
niż  1%.  Mierząc  różnicę  potencjału  przyspieszającego, 
wyznacza  się  długość  fali  elektronów  A;  L jest  stałą 
aparaturową,  mu  natomiast  mierzy  się  na  tzw.  elek- 
tronogramie  — obrazie  dyfrakcyjnym  zarejestrowa- 
nym na  błonie  fotograficznej. 

Można  wyróżnić  3 grupy  elektronogramów  ciał 
stałych:  1)  Elektronogramy  punktowe  z refleksami 
w postaci  plamek  (ii.  81a,  tabl.  21).  Otrzymuje  się  je, 
gdy  badana  substancja  jest  pojedynczym  kryształem 
lub  składa  się  z oddzielnych  bloków  krystalicznych 
o osiach  w przybliżeniu  równoległych  do  siebie.  Elek- 
tronogramy tego  rodzaju  są  głównie  wykorzystywane 
do  oznaczenia  struktury  krystalicznej  badanej  sub- 
stancji. 2)  Elektronogramy  tekstur  — maksima  dy- 
frakcyjne (refleksy)  mają  postać  łuków  (ii.  81b,  tabl. 
21).  Powstają  one,  gdy  badany  preparat  jest  zbiorem 
bloków  krystalicznych  rozłożonych  w sposób  statys- 
tycznie przypadkowy,  jednakże  mających  określone 
płaszczyzny  równoległe  do  siebie.  Na  jednym  takim 
elektronogramie  występują  prawie  wszystkie  refleksy 
możliwe  dla  danego  typu  struktury.  Refleksy  te  ukła- 
dają się  wg  określonych  reguł,  co  ułatwia  ich  wskaźni- 
kowanie. Na  elektronogramach  tekstur  można  mie- 
rzyć z dużą  dokładnością  natężenia  refleksów.  Z ich 
wartości  wyznacza  się  rozkład  potencjału  elektryczne- 
go w komórce  elementarnej,  a zatem  pozycje  atomów 
w komórce  (zob.  rozdział  „Strukturalna  analiza 
kryształów”).  3)  Elektronogramy  ciał  polikrystalicz- 
nych (badany  preparat  zbudowany  jest  z chaotycznie 
rozłożonych  bloków  krystalicznych),  zawierają  mak- 
sima interferencyjne  w postaci  pierścieni  (ii.  81c,  tabl. 
21).  Rozkład  pierścieni  określa  zbiór  odległości  mię- 
dzypłaszczyznowych  dnu.  Takie  elektronogramy  wy- 
korzystywane są  w badaniach  struktury,  zwłaszcza 
struktury  substancji  o wysokiej  symetrii  krystalogra- 
ficznej, do  wyznaczenia  parametrów  komórki  ele- 
mentarnej, a także  do  wyznaczenia  składu  fazowego 
preparatu. 

Elektronogramy  otrzymuje  się  bądź  przepuszczając 
wiązkę  elektronów  przez  odpowiednio  cienką  folię 
(transmisja),  bądź  przez  odbicie  od  powierzchni  ma- 
teriału. Schemat  układu  do  rejestracji  ugiętych  pro- 
mieni elektronowych  (tzw.  elektronografu)  przedsta- 


za  pomocą  soczewki  elektromagnetycznej.  Preparat 
substancji  badanej  (w  położeniu  transmisji)  jest 
umieszczony  między  soczewką  a błoną  fotograficzną. 
Cały  układ  znajduje  się  w wysokiej  próżni  no-3- 
10-7  Pa). 


W zależności  od  różnicy  potencjału  przyspieszają- 
cego wyróżnia  się  dwie  techniki  dyfrakcyjne.  W pierw- 
szej metodzie  — metodzie  dyfrakcji  elektronów  nisko- 
energetycznych,  tzw.  LEED  (Low  Energy  Electron 
Diffraction)  — elektrony  są  przyspieszane  różnicą 
potencjałów  od  30  do  600  V.  Mała  przenikliwość  po- 
wolnych elektronów  ogranicza  stosowalność  tej  me- 
tody. Przy  tym  jest  konieczne  stosowanie  preparatów 
cienkowarstwowych  o nadzwyczaj  starannie  przygoto- 
wywanej powierzchni  — bez  zanieczyszczeń  i znie- 
kształceń, wymagana  próżnia  — rzędu  10~7  Pa.  Ugięte 
elektrony  są  przyspieszane  dodatnim  potencjałem 
5 kV,  co  ułatwia  znacznie  rejestrację  ugiętych  wiązek. 
Obraz  dyfrakcyjny  otrzymuje  się  w bardzo  krótkim 
czasie,  co  pozwala  na  śledzenie  procesów  zachodzą- 
cych w trakcie  naświetlania.  Metodę  LEED  wykorzy- 
stuje się  w badaniach  rozkładu  jonów  metali  na  po- 
wierzchni katalizatora,  mechanizmu  absorpcji  gazów 
na  powierzchniach,  mechanizmu  powstawania  cien- 
kich warstw  tlenkowych  na  powierzchniach  półprze- 
wodników itd.  Druga  metoda  — to  metoda  dyfrakcji 
elektronów  wysokoenergetycznych,  tzw.  HEED  (High 
Energy  Electron  Diffraction).  Jest  ona  stosowana 
w typowych  elektronografach.  Elektrony  są  przyspie- 
szane różnicą  potencjałów  50  kV  i wnikają  do  bada- 
nego materiału  na  głębokość  do  1000  A.  Większa 
przenikliwość  powoduje,  że  nie  jest  konieczne  tak 
bardzo  staranne  przygotowanie  powierzchni,  jak  przy 
dyfrakcji  elektronów  niskoenergetycznych. 

Metody  elektronografu  pozwalają  na  uzyskanie 
danych  szczególnie  ważnych  do  poznania  własności 
materiałów.  Umożliwiają  określenie  struktury  we- 
wnętrznej kryształów,  tzn.  określenie  rozmiarów  ko- 
mórki elementarnej  kryształu  oraz  ustalenie  pozycji 
atomów  w komórce.  Elektronografia  nadaje  się 
szczególme  dobrze  do  badania  struktury  warstw  po- 
wierzchniowych i ich  zmian  wywołanych  obróbką 
technologiczną,  procesami  utleniania  i azotowania, 
korozją.  Struktura  warstw  powierzchniowych  jest  na 
ogół  różna  od  struktury  wnętrza  materiału  (->  Stany 
powierzchniowe  ciał  stałych).  Bardzo  ważne  wyniki 
uzyskuje  się  z elektronograficznych  badań  warstw 
epitaksjalnych  oraz  badań  naprężeń  wywołanych  de- 
formacją plastyczną.  Metody  dyfrakcji  elektronów  są 
wykorzystywane  powszechnie  w dziedzinie  krystalo- 
grafii submikroskopowej  — do  wyznaczania  wielkości 
i kształtu  mikroziaren  krystalicznych  w stanie  dużego 
rozdrobnienia,  do  określania  orientacji  mikroziaren 
na  granicy  faz,  do  badania  mechanizmu  powstawania 
struktur  przejściowych  na  powierzchniach.  W dziedzi- 
nie krystalografii  submikroskopowej  znaczne  usługi 
oddaje  łączenie  metody  dyfrakcji  elektronów  z mikro- 
skopią elektronową  (zob.  rozdział  „Mikroskopia 
elektronowa”). 


J.  Chojnacki  Metalografia  strukturalna , Katowice  1966; 
B.  K.  Wajnsztejn  Struktur  na  ja  Elektronografi ja,  Moskwa  1956; 
B.  K.  Wajnsztejn,  Sowremiennaja  Krystalografia,  Moskwa  1979! 
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błona  fotograficzna 


Rys.  2.  Schemat  układu  do  rejestracji  ugiętych 
promieni  elektronowych 


wia  rys.  2.  Rozbieżna  wiązka  elektronów  z żarzącej  się 
katody  zostaje  przyspieszona  w polu  elektrycznym 
między  katodą  a anodą.  Wiązka  ta  zostaje  następnie 
zogniskowana  w płaszczyźnie  błony  fotograficznej 


Neutronografia  strukturalna 
i magnetyczna 

Janusz  Lecfejewicz 

Rozpraszanie  neutronów 

Wkrótce  po  odkryciu  neutronu  (J.  Chadwick,  1932  r.) 
Mitchell  i Powells  (1936  r.)  wykonali  doświadczenie 
mające  na  celu  sprawdzenie,  czy  ruch  neutronów  ma 
charakter  falowy,  tzn.  czy  jest  spełnione  równanie  fa- 
lowe de  Broglie*a 

A = /r/mv. 
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metoda 

LEED 


metoda 

HEED 


gdzie:  X jest  długością  fali  neutronu,  h — stałą  Planc- 
ka, m — masą  neutronu,  v — jego  prędkością, 
dyfrakcja  Stwierdzono,  że  neutrony  ze  źródła  radowo-berylo- 
neu tronów  wego  po  przepuszczeniu  przez  warstwę  parafiny  uległy 
odbiciu  od  płaszczyzny  sieciowej  (111)  kryształu 
tlenku  magnezu  pod  kątem  padania  i odbicia  wynika- 
jącym z równania  Wulfa-Bragga  dla  długości  fali 
neutronów  ok.  1 ,6  A.  Doświadczenie  to  miało  charak- 
ter pokazowy.  Wskutek  bardzo  małego  natężenia  wią- 
zek neutronów  ze  źródeł  radowo-berylowych,  zjawisko 
dyfrakcji  neutronów  nie  mogło  być  wykorzystane  do 
badania  struktury  kryształów.  Dopiero  rozpowszech- 
nienie reaktorów  jądrowych  po  1945  r.  umożliwiło 
praktyczne  zastosowanie  dyfrakcji  neutronów  termicz- 
nych do  badań  strukturalnych. 

W oddziaływaniu  z kryształem  swój  charakter  falo- 
wy szczególnie  silnie  przejawiają  neutrony  termiczne. 
Ulegają  one  dyfrakcji  zgodnie  z prawem  Wulfa-Brag- 
ga podobnie  jak  promienie  rentgenowskie  o zbliżonej 
długości  fali  (zob.  rozdział  „Krystalografia  rentge- 
nowska'’)  i elektrony  (zob.  rozdział  „Elektronogra- 
fia").  Zjawisko  dyfrakcji  neutronów  może  być  więc 
wykorzystane  do  określenia  położeń  atomów  w krysz- 
tale, czyli  do  oznaczania  struktury  kryształu. 

Mechanizm  oddziaływania  neutronów  z atomami 
jest  jednak  inny  niż  w wypadku  promieni  rentgenow- 
skich i elektronów,  które  są  rozpraszane  przez  po- 
włokę elektronową  atomu.  Neutrony  są  rozpraszane 
przez  jądra  atomowe.  W procesie  rozpraszania  siły 
działające  między  jądrem  a neutronem  są  bardzo  krót- 
kiego zasięgu  — rzędu  promienia  jądra,  tj.  10"14  m 
(->  Siły  jądrowe).  Jądra  atomowe  są  więc  dla  neutro- 
nów o długości  fali  rzędu  lO"10  m (1  A)  punktowymi 
ośrodkami  rozpraszania. 


Długość  rozpraszania  niektórych  nuklidów 


Nuklid 

Z 

bf  10-14m 

Nuklid 

Z 

Cr 

O 

3 

łH 

j 

-0,378 

Fe 

26 

0,96 

*H 

1 

0,65 

Co 

27 

0,25 

łaC 

6 

0,661 

Ni 

28 

1,03 

N 

7 

0,940 

W 

74 

0,466 

O 

8 

0,577 

Pb 

82 

0,96 

Ti 

22 

-0,34 

23»U 

92 

0,85 

Wg  Acta  Cryst.  A28,  357  (1972) 


cj|  Q Zdolność  jądra  do  rozpraszania  neutronów  termicz- 
roznraszania  n>’ch  charakteryzuje  wielkość  zwana  długością  roz- 
p — • - praszania  b , zależna  od  struktury  danego  jądra.  Tak 
więc  izotopy  tego  samego  pierwiastka  mają  różne  war- 
tości by  a ponadto  zależność  b od  liczby  atomowej 
jest  nieregularna  (tabela).  Dla  niektórych  nuklidów 
(np.  jąder  wodoru  — protonów,  jąder  tytanu)  prze- 
sunięcie fazowe  między  rozproszoną  falą  neutronową 
a falą  padającą  wynosi  0,  a nie  nt  jak  to  jest  przy  roz- 
praszaniu promieni  rentgenowskich  i elektronów. 
Umownie  przyjmuje  się  więc,  że  przy  wartości  zero, 
długość  rozpraszania  ma  mak  ujemny.  Niezależność 
b od  liczby  atomowej  ma  istotne  znaczenie  przy  wyko- 
rzystaniu dyfrakcji  neutronów  w analizie  strukturalnej 
kryształów.  Przede  wszystkim  możliwe  j est  wyznacze- 
nie z jednakową  dokładnością  położeń  atomów  lek- 
kich i ciężkich  (o  małym  i dużym  Z)  występujących 
obok  siebie  w komórce  elementarnej  kryształu.  Przy 
stosowaniu  metod  krystalografii  rentgenowskiej  ato- 
my ciężkie  odgrywają  dominującą  rolę  w procesie  roz- 
praszania. Stąd  oznaczenie  położeń  atomów  lekkich, 
gdy  w komórce  elementarnej  występują  również  ato- 
my ciężkie,  jest  zwykle  obarczone  dużym  błędem, 
wyznaczanie  Wykorzystując  metody  neutronograficzne  można  więc 
położeń  wyznaczyć  z dużą  dokładnością  położenia  atomów 
atomów  (jąder)  wodoru  w substancjach  organicznych,  wodor- 
lekkach  kach  metali  i innych  związkach  zawierających  wodór, 
np.  w hydratach,  wodorotlenkach  itd.  Ponieważ  jądra 
wodoru  rozpraszają  neutrony  w znacznej  mierze  nie- 
spójnie (powstaje  duże  tło),  w neutronograficzne  i 


analizie  strukturalnej  korzystniejsze  jest  stosowanie 
związków  chemicznych,  w których  atomy  wodoru  za- 
stąpione są  atomami  deuteru. 


Neutronografia  strukturalna 

Metody  neutronograficzne  były  i są  stosowane  przy 
weryfikacji  struktur  kryształów  tlenków  metali  cięż- 
kich (np.  tlenków  ołowiu,  tlenków  uranu),  węglików  rozróżnianie 
ciężkich  metali  (np.  węglików  wolframu).  Metodami  atomów 
tymi  można  również  rozróżniać  atomy  o zbliżonych  o zbliżonych 
liczbach  atomowych,  np.  węgla,  azotu  i tlenu.  Jest  Z 
to  szczególnie  ważne  przy  analizie  struktury  substancji 
organicznych.  Atomy  te  są  nierozróżnialne  dla  pro- 
mieni rentgenowskich,  podobnie  jak  atomy  żelaza, 
niklu  i kobaltu  występujące  w ważnych  technicznie 
stopach  i niektórych  materiałach  magnetycznych 
(np.  w ferrytach). 

Natężenie  neutronowych  maksimów  interferencyj- 
nych (refleksów),  podobnie  jak  w dyfrakcji  promieni  natężenie 
rentgenowskich  (zob.  rozdział  „Strukturalna  analiza  refleksów 
kryształów”)  jest  proporcjonalne  do  kwadratu  modu- 
łu amplitudy  struktury  Fnki  (czynnika  struktury): 

Ihkl  ~ \Fhkl\“ * 

N 

Fhki  = Z 

i 

N — liczba  jąder  (atomów)  w komórce  elementarnej 
kryształu,  Xj,  yu  Zj  — współrzędne  /-ego  jądra  w ko- 
mórce, hkl  — wskaźnik  refleksu,  bj  — długość  rozpra- 
szania jądra  /.  Monochromatyzacji  wiązki,  czyli 
wyodrębnienia  wiązki  o bardzo  wąskim  paśmie  dłu- 
gości fali,  dokonuje  się  zwykle  przez  odbicie  wiązki  od 
określonej  płaszczyzny  kryształu  ustawionej  pod  brag- 
gowskim  kątem  w stosunku  do  skolimowanej  wiązki 
polichromatycznej.  Typowymi  monochromatorami 
neutronów  są  monokryształy  miedzi,  cynku  lub  glinu. 
Monochromator  jest  umieszczony  w osłonie  z ołowiu 
lub  żeliwa  otoczonej  następnie  grubymi  osłonami  spo- 
rządzonymi z mieszaniny  boraksu  z parafiną  oraz 
zewnętrzną  osłoną  wodną  (rys.  1).  Osłony  pochłaniają 
promieniowanie  y oraz  rozproszone  przez  monochro- 
mator neutrony  termiczne  i prędkie. 


Rys.  1.  Schemat  dyfraktometru  neutronów 

Przyrząd  do  otrzymywania  widma  neutronów  ugię-  dyfraktometr 
tych  przez  kryształ  nosi  nazwę  dyfraktometru  neu-  neutronów 
tronów  (rys.  1 i ii.  83,  tabl.  21).  Jest  on  skonstruowa- 
ny na  tej  samej  zasadzie  co  dyfraktometr  rentgenow- 
ski. Ze  względu  na  duże  rozmiary  licznika  neutronów 
oraz  znaczny  ciężar  jego  osłony,  dyfraktometr  neu- 
tronów ma  większe  rozmiary  i jest  cięższy  niż  dyfrak- 
tometr rentgenowski.  Obrót  stolika  próbki  dyfrakto- 
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metru  jest  sprzężony  w stosunku  1:2  z ruchem  ramie- 
nia, na  którym  znajduje  się  licznik.  Zapewnia  to  za- 
chowanie równości  kąta  padania  i odbicia  neutronów 
na  próbkę  badaną.  Ruch  stolika  i ramienia  odbywa 
się  zwykle  skokowo,  np.  co  5'  kąta  rozproszenia. 

Do  badań  strukturalnych  wykorzystuje  się  z reguły 
monochromatyczną  wiązkę  neutronów.  Neutrony  po- 
lichromatyczne  wychodzące  na  zewnątrz  reaktora 
przechodzą  zwykle  przez  kolimator  umieszczony  w ka- 
nale reaktora.  Zadaniem  kolimatora  jest  otrzymanie 
wiązki  o określonym  przekroju  i rozbieżności.  Koli- 
mator ten  powoduje  również  obniżenie  tła  instrumen- 
talnego wywołanego  neutronami  prędkimi  i promie- 
niowaniem y.  Strumień  neutronów  monochromatycz- 
nych ze  standardowych  reaktorów  doświadczalnych 
ma  natężenie  o kilka  rzędów  wielkości  mniejsze  niż 
strumień  fotonów  promieni  rentgenowskich  (z  lampy 
rentgenowskiej),  do  badań  neutronograficznych  ko- 
nieczne jest  więc  stosowanie  próbek  stosunkowo  du- 
żych: rzędu  kilkunastu  gramów  (próbki  polikrysta- 
liczne) i kilkunastu  miligramów  (monokryształy). 

Stolik  typowego  dyfraktometru  neutronów  jest 
tak  skonstruowany,  aby  mógł  udźwignąć  ciężar  kilku- 
set kG  — kriostatu,  elektromagnesu  itd.  Ruchy  ze- 
społów dyfraktometru  są  zdalnie  sterowane  a pomiary 
całkowicie  zautomatyzowane. 

Bardzo  prostym  przykładem  wykorzystania  metod 
dyfrakcji  neutronów  do  oznaczania  struktury  krysta- 
licznej pviązku  zawierającego  obok  siebie  atomy 
o dużej  i małej  liczbie  atomowej  jest  monowęglik  wol- 
framu (WC).  Badania  rentgenograficzne  pozwoliły 
ustalić  tylko  położenie  atomów  wolframu.  Są  jednak 
możliwe  aż  3 modele  struktury  WC  różniące  się  poło- 
żeniami atomów  węgla,  ale  dające  prawie  jednakowe 
natężenia  refleksów  rentgenowskich.  W procesie  roz- 
praszania promieni  rentgenowskich  atomy  wolframu 
odgrywają  bowiem  dominującą  rolę,  gdyż  mają  74 
elektrony  a atomy  węgla  tylko  6 elektronów. 

Jak  wynika  z przytoczonej  poprzednio  tabeli,  w pro- 
cesie rozpraszania  neutronów  termicznych  jądra  ato- 
mów węgla  są  silniejszymi  ośrodkami  rozpraszania 
niż  jądra  atomu  wolframu.  Wyniki  badań  neutrono- 
graficznych jednoznacznie  pokazały,  że  monowęglik 
wolframu  ma  strukturę  taką  jak  przedstawiona  na 
rys.  2a  z uporządkowanym  rozkładem  atomów  węgla. 
Proponowane  modele  o strukturze  typu  arsenku  niklu 
(rys.  2b),  czy  też  ze  statystycznie  nieuporządkowanym 
rozkładem  atomów  węgla  (rys.  2c)  są  nie  do  przyjęcia 
ze  względu  na  całkowity  brak  zgodności  między  obli- 
czonymi na  ich  podstawie  natężeniami  refleksów 
neutronowych  a natężeniami  obserwowanymi. 
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Dobrym  przykładem  ilustrującym  wykorzystanie 
dyfrakcji  neutronów  jest  oznaczenie  struktury  związ-  struktura 
ku  organicznego  benzenu.  Jądra  wodoru  mają  ujemną  benzenu 
amplitudę  rozpraszania  b.  Strukturę  C6Hc  wyznaczo- 
no wykorzystując  dane  otrzymane  dla  próbki  mono- 
krystalicznej.  Na  rys.  3 jest  pokazana  fourierowska 
mapa  gęstości  jądrowej,  analogiczna  do  mapy  gęstości 
elektronowej  omówionej  w rozdziale  „Strukturalna 
analiza  kryształów”.  Kontury  zaznaczone  linią  prze- 
rywaną dotyczą  „ujemnej”  gęstości  jądrowej  wynika- 
jącej z faktu,  że  b dla  protonów  ma  znak  ujemny.  Tak 
więc,  dopiero  badanie  neutronograficzne  dostarczyło 
po  raz  pierwszy  bezpośredniej  doświadczalnej  wery- 
fikacji modelu  Kekulego  budowy  cząsteczki  benzenu. 

Metoda  dyfrakcji  neutronów  wykorzystywana  jest 
powszechnie  do  badania  struktury  krystalicznej  za- 
równo związków  nieorganicznych  jak  i organicznych 
i biologicznie  czynnych,  a także  badania  przemian  fa- 
zowych zachodzących  w ferroelektrykach,  przemian 
porządek-nieporządek  w’  metalach,  a ponadto  do  iden- 
tyfikacji składu  fazowego  materiałów. 


Neutronografia  magnetyczna 

Oddziaływanie  momentu  magnetycznego  neutronu 
z momentami  magnetycznymi  jonów  w sieci  kryształu 
prowadzi  do  zjawiska  rozpraszania  neutronów.  W 
substancj  ach  paramagnetycznych  rozproszenie  to  jest 
niespójne  i maleje  ze  wzrostem  kąta  rozpraszania, 
wskutek  zależności  od  magnetycznego  czynnika  ato- 
mowego, określającego  rozkład  niesparowanych  elek- 
tronów warunkujących  moment  magnetyczny  jonów. 

W substancjach  odznaczających  się  uporządkowaniem 
momentów  magnetycznych,  tzn.  o określonej  orienta- 
cji momentów  magnetycznych  w stosunku  do  elemen- 
tów symetrii  kryształu,  czyli  mających  strukturę  mag- 
netyczną, rozpraszanie  magnetyczne  neutronów  jest 
spójne  i sprężyste.  Na  neutron ogramach,  łącznie 
z refleksami  pochodzącymi  od  neutronów  rozproszo- 
nych przez  wszystkie  jądra  w komórce  elementarnej 
kryształu,  występują  magnetyczne  maksima  interfe- 
rencyjne (refleksy  magnetyczne). 

Wykorzystując  magnetyczne  rozpraszanie  neutro- 
nów uzyskuje  się  nieosiągalny  innymi  metodami  bez- 
pośredni wgląd  w konfigurację  momentów  magnetycz- 
nych poniżej  temperatury  Curie  lub  Neela  (-►  Teoria 
magnetyzmu).  Śledząc  zmianę  natężenia  refleksów  natężenie 
magnetycznych  w funkcji  temperatury,  można  wyzna-  refleksu 
czyć  krzywą  namagnesowania,  bowiem  natężenie  refie-  magnetycz- 
ksu  magnetycznego  ljfkl  jest  proporcjonalne  do  kwa-  nego 
dratu  momentu  magnetycznego  jonu: 


Magnetyczna  amplituda  struktury 

M 

y-i 

gdzie:  Pi  = .fm  = 0,2695- 10~12 f) W,  e i m — 

ładunek  i masa  spoczynkowa  elektronu,  y — moment 
magnetyczny  neutronu,  c — prędkość  światła,  //  — 
atomowy  czynnik  magnetyczny  jonu,  [ij  — moment 

magnetyczny  jonu  (w  magnetonach  Bohra),  w — 
wektor  oddziaływania  magnetycznego  wiążący  kieru- 
nek momentu  magnetycznego  jonu  z wektorem  pro- 
stopadłym do  płaszczyzny  odbijającej  ( hkl ) (\q\2  = 
= sin2a,  gdzie  a jest  kątem  między  tymi  kierunkami) 
Xj,  yu  *1  — współrzędne  jonu ; sumowanie  obejmuje 
jony  paramagnetyczne  w magnetycznej  komórce  ele- 
mentarnej, których  jest  M.  Gdy  do  badania  wykorzys- 
tywane są  niespoiaryzowane  neutrony,  tj.  gdy  wszyst- 
kie kierunki  ustawienia  momentów  magnetycznych 
neutronów  są  jednakowo  prawdopodobne,  wtedy  roz- 
praszanie magnetyczne  i jądrowe  są  względem  siebie 
niespójne.  Na  tężenie  refleksu  spowodowanego  rozpra- 
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szaniem  neutronów  przez  jądra  i rozpraszaniem  mag- 
netycznym wyraża  się  zależnością : 

hni  ~ |W+I«I2I^|*. 

W substancjach  antyferromagnetycznych  momenty 
magnetyczne  jonów  w sąsiednich  komórkach  elemen- 
tarnych skierowane  są  antyrównolegle.  Oznacza  to,  że 
wyznaczanie  co  druga  komórka  elementarna  jest  identyczna.  Ele- 
struktury  mentama  komórka  magnetyczna  powstaje  przez  po- 
magn  etycznej  dwojenie  w jednym  kierunku  komórki  krystalogra- 
ficznej. Na  neutron ogramach  pojawiają  się  wtedy  re- 
fleksy od  „nadstruktury  magnetycznej”.  Na  rys.  4 
przedstawione  są  neutronogramy  monoarsenku  uranu 


Rys.  4.  Neutronogramy  monoarsenku  uranu  otrzymane  w tem- 
peraturze 4,2  K,  80  K i 300  K.  Refleksy  magnetyczne  oznaczone 
zostały  literą  M.  Wskaźniki  połówkowe  oznaczają,  że  magne- 
tyczna komórka  jest  podwojona  w jednym  kierunku  w stosunku 
do  komórki  krystalograficznej  (struktura  magnetyczna  A) 

(U As)  wykonane  w temperaturze  4,2  K,  80  K,  300  K. 
Położenia  refleksów  magnetycznych  wskazują,  że 
w 4,2  K występuje  w UAs  uporządkowanie  antyferro- 
magnetyczne prowadzące  do  podwojenia  komórki 
krystalograficznej  w jednym  tylko  kierunku.  Symetria 
komórki  magnetycznej  jest  więc  w temperaturze  4,2  K 
tetragonalna  (struktura  A na  rys.  5).  W temperaturze 
80  K stwierdzono  występowanie  innego  typu  upo- 
rządkowania antyferromagnetycznego  (struktura  B 
na  rys.  5)  — również  o symetrii  tetra gonalnej,  chociaż 
komórka  krystalograficzna  i magnetyczna  ma  wów- 
czas jednakowe  rozmiary.  Mierząc  w funkcji  tempe- 
ratury natężenie  refleksu  magnetycznego  oznaczonego 
wskaźnikiem  M10 V2,  charakterystycznego  dla  struk- 
tury typu  A stwierdzono,  że  zanika  on  nagle  w tempe- 
raturze 66  K (rys.  6).  W tej  samej  temperaturze  poja- 
wia się  refleks  magnetyczny  M100  związany  ze  struk- 
turą magnetyczną  typu  B.  Zanika  on  w temperaturze 
127  K (temperatura  Neela)  — następuje  przejście  do 
stanu  paramagnetycznego.  Można  więc  neutronogra- 
ficznie wyznaczyć  nie  tylko  strukturę  magnetyczną 


Rys.  5.  Struktura  magnetyczna  monoarsenku  uranu  w tempera- 
turze 4,2  K (struktura  magnetyczna  A)  i 80  K (struktura  magne- 
tyczna B).  Kierunki  momentów  magnetycznych  w obu  wypad- 
kach są  równoległe  do  osi  czterokrotnej  — komórka  magnetyczna 
ma  symetrię  tetragonalna 
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Rys.  6.  Zależność  od  temperatury  natężeń  refleksów  magnetycz- 
nych charakterystycznych  dla  struktury  magnetycznej  typu  A 
i typu  B {Ml 00).  W temperaturze  66  K ma  miejsce 
magnetyczna  przemiana  fazowa.  Przejście  do  stanu  paramagne- 
tycznego zachodzi  przy  127  K (punkt  Ncćla) 


w danej  temperaturze,  lecz  również  określić  zakres 
temperatury  stabilności  poszczególnych  faz  magne- 
tycznych. Prowadząc  pomiary  neutronograficzne 
otrzymuje  się  krzywe  namagnesowania  bez  obecności 
zewnętrznego  pola  magnetycznego.  Wyznaczyć  można 
również  wartości  momentu  magnetycznego  w stanie 
uporządkowania  antyferromagnetycznego. 

Zastosowanie  zjawiska  dyfrakcji  magnetycznej  neu- 
tronów umożliwiło  w 1946  r.  pełne  potwierdzenie  mo- 
delu uporządkowania  antyferromagnetycznego  postu- 
lowanego przez  Nećla  jeszcze  w 1934  r.  Doprowadziło 
następnie  do  odkrycia  bardziej  złożonych  typów  upo- 
rządkowania magnetycznego,  w tym  helikoidalnego. 

Natężenie  refleksów  magnetycznych  jest  zależne  od 
kierunku  zewnętrznego  pola  magnetycznego  przyło- 
żonego do  badanej  próbki;  przyłożenie  pola  magne- 
tycznego o kierunku  prostopadłym  do  płaszczyzny  od- 
bijającej prowadzi  do  całkowitego  wygaszenia  roz- 
praszania magnetycznego.  Pozwała  to  na  wyodręb- 
nienie rozpraszania  przez  jądra  od  rozpraszania  mag- 
netycznego, a tym  samym  na  wyznaczenie  struktury 
krystalicznej  substancji  magnetycznej.  Przykładając 
zewnętrzne  pole  magnetyczne  równolegle  do  płasz- 
czyzny rozpraszającej  uzyskujemy  maksymalne  roz- 
praszanie magnetyczne  (] q\ 2 =1). 

Przy  użyciu  wiązki  spolaryzowanych  neutronów 
(tzn.  mających  jednakowy  kierunek  spinów)  rozpro- 
szenie przez  jądra  i rozpraszanie  magnetyczne  są  spój- 
ne względem  siebie.  Metoda  spolaryzowanej  wiązki 
umożliwia  wyznaczenie  z dużą  dokładnością  udziału 
magnetycznego  rozpraszania  w natężeniu  refleksu. 
Jest  więc  wykorzystywana  głównie  do  wyznaczenia 
wartości  magnetycznego  czynnika  atomowego  i war- 
tości momentu  magnetycznego  jonów  paramagnetycz- 
nych tworzących  substancje  ferromagnetyczne. 

G.  E.  Bacon  Neutron  Diffraction,  Oxford  1975;  J.  Chojnacki 
Metalografia  strukturalna , Katowice  1966;  J.  A.  Izjumow,  R.  P. 
Oz  jerów  Magnitnaja  Niejtronografijay  Moskwa  1966.  J.  Lecie- 
jewicz  Zarys  neutronografii  kryształów , Warszawa  1980;  J.  Le- 
Ciejewicz  Wstęp  do  dyfraktometru  neutronów , Warszawa  1979; 
J.  Z.  Nozik,  R.  P.  Ozjerow,  K.  Hennig  Strukturnaja  Niejtro- 
nografija>  Moskwa  1979. 
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Strukturalna  analiza  kryształów 

Zofia  Kosturkiewicz 

Strukturalną  analizą  kryształów  (rentgenowską  ana- 
lizą strukturalną  kryształów)  nazywa  się  zespół  metod 
obliczeniowych  prowadzących  do  uzyskania  szczegó- 
łowego obrazu  rozmieszczenia  atomów  w przestrzeni, 
na  podstawie  analizy  zmierzonych  intensywności  wią- 
zek promieni  rentgenowskich  odbitych  przez  płasz- 
czyzny sieciowe  kryształu.  W celu  określenia  struktury 
całego  kryształu  wystarczy  określić  wymiary  i sy- 
metrię jego  komórki  elementarnej  i wzajemne  rozmie- 
szczenie u tomów  (cząsteczek)  wewnątrz  komórki. 
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Kierunki  rozchodzenia  się  promieni  ugiętych  zależą 
od  wielkości  parametrów  sieciowych  i od  symetrii 
kryształu  (zob.  rozdział  „Krystalografia  rentgenow- 
ska”). Natomiast  natężenia  promieni  ugiętych  zależą 
od  tego,  jakie  atomy  znajdują  się  w poszczególnych 
pozycjach  komórki  elementarnej,  a więc  od  tego  jak 
obsadzone  są  atomami  płaszczyzny  sieciowe  (h/ci). 
pomiar  Dane  o natężeniach  ugiętych  wiązek  promieni  rent- 
intensyw-  genowskich  uzyskuje  się  metodami  fotograficznymi, 
ności  stosując  odpowiednie  kamery  rentgenowskie,  bądź  też 
refleksów  metodami  licznikowymi  w dyfraktometrach  rentge- 
nowskich. Przy  stosowaniu  fotograficznych  metod 
rejestracji  obrazu  dyfrakcyjnego  zaczernienie  re- 
fleksów na  rentgenogramach  ocenia  się  (mierzy)  na- 
stępującymi sposobami:  1)  wizualnie,  porównując 
zaczernienie  refleksów  z kalibrowaną,  wielostopniową 
skalą;  wówczas  błąd  pomiaru  jest  jednak  nie  mniejszy 
niż  10%;  2)  za  pomocą  mikrofotometru,  w którym 
zaczernienie  refleksów  określa  fotokomórka;  3)  auto- 
matycznym mi  kredensy  tometrem,  rejestrującym  zmie- 
rzone przez  fotokomórkę  intensywności  refleksów  na 
taśmie  magnetycznej  w minikomputerze,  z którego 
otrzymuje  się  wydruk  intensywności  refleksów  wraz 
z ich  wskaźnikami;  precyzja  pomiarów  przeprowa- 
dzonych tą  metodą  dorównuje  precyzji  metod  licz- 
nikowych. Metody  licznikowe  pomiaru  natężeń  po- 
legają na  zliczaniu  fotonów  w ugiętej  wiązce  promieni 
za  pomocą  licznika  Geigera-Miillera  lub  licznika  pro- 
porcjonalnego czy  scyntylacyjnego  w dyfraktometrze 
rentgenowskim.  Liczniki  umożliwiają  wielką  precyzję 
pomiarów  intensywności,  błąd  pomiaru  bowiem  nie 
przekracza  1%.  Coraz  większą  popularnością  cieszy 
się  czterokołowy  dyfraktometr  do  monokryształów. 

Według  kinematycznej  teorii  dyfrakcji  promieni 
rentgenowskich  na  kryształach  o budowie  mozaiko- 
wej natężenie  I ugiętej  wiązki  promieni  jest  propor- 
cjonalne do  kwadratu  czynnika  struktury  F : 

hki  — k\Fhki\ 2 

(współczynnik  proporcjonalności  k jest  związany 
m.in.  z absorpcją  promieniowania  przez  kryształ, 
drganiami  cieplnymi  atomów  w krysztale  i polaryza- 
czynnik  cją  promieniowania  rentgenowskiego).  Czynnik  struk- 
strukfury  tury  zależy  z kolei  od  rozmieszczenia  atomów  w ko- 
mórce elementarnej  i jest  dany  wzorem 

Fhki  = % fje%i<-hxi+kyi+lzi\ 

gdzie  xj,  yj , zj  są  współrzędnymi  y-ego  atomu  w ko- 
mórce elementarnej,  wyrażonymi  w ułamkach  dłu- 
czynnik  gości  jej  krawędzi,  zaś  czynnik  atomowy  fj  określa 
atomowy  stosunek  amplitudy  fali  ugiętej  na  y-ym  atomie  do 
amplitudy  fali  ugiętej  przez  pojedynczy  elektron; 
jego  wartość  jest  zależna  od  liczby  atomowej  y-ego 
atomu  oraz  od  braggowskiego  kąta  #. 

Czynnik  struktury  jest  wynikiem  sumowania  j 
amplitud  fal  rentgenowskich  ugiętych  na  / atomach, 
znajdujących  się  w komórce  elementarnej,  w trakcie 
odbijania  tych  promieni  przez  rodzinę  płaszczyzn 
sieciowych  ( hkl ) (rys.  1). 

kąt  Każda  z fal  ugiętych  na  y-ym  atomie  ma  amplitudę 
przesunięcia  proporcjonalną  do  czynnika  atomowego  /}  i kąt 
fazowego  przesunięcia  fazowego  (fazę)  a w stosunku  do  fali 
ugiętej  na  atomie  znajdującym  się  w początku  układu 
współrzędnych.  Ponieważ  różnica  faz  między  pro- 
mieniami rentgenowskimi  odbitymi  od  kolejnych 
równoległych  płaszczyzn  sieciowych  (hkl)  wynosi 
271  (warunek  Wulfa-Bragga),  to  różnica  faz  dla  trans- 
lacji jednostkowych  (parametrów  a , b,  c ) wydłuż  osi 
X,  Y,  Z wynosi  2nh , 2nk,  2k l.  Dla  rodziny  płaszczyzn 
sieciowych  (hkl)  różnica  faz  (przesunięcie  fazowe) 
między  punktem  początkow-ym  układu  osi  współ- 
rzędnych 000  i punktem  x , y,  z (każdy  z tych  dwóch 
punktów  leży  w płaszczyźnie  sieciowej  należącej  do 
rodziny  (hkl)y  rys.  2)  równa  się  sumie  różnic  faz 
pomiędzy  końcami  wektorów  równoległych  do  osi 
i łączących  te  dwa  punkty: 

a = 2n(hx-rky+lz). 


Czynnik  struktury  można  przedstawić  za  pomocą 
jego  modułu  i fazy 

Fhki  = |F*;triexp(/a*jw) 
lub  jako  liczbę  zespoloną 

Fnici  = Ahki  + iB/iki, 

przy  czym  A i B można  przedstawić  (rys.  1)  w postaci 
trygonometrycznej : 

Ahki  = fjCOs2K(hxjJrkyj+łz}), 
i 

Bhki  = ^ //sin  2n(hxj  4-  kyj  + Izj). 
i 

Jeśli  w kryształach  znajduje  się  środek  symetrii, 
to  część  urojona  liczby  zespolonej  staje  się  równa  zeru. 

Gdyby  była  znana  struktura  kryształu,  można  by 
było  obliczyć  czynniki  struktury,  a więc  i intensyw- 
ność wiązek  promieni  rentgenowskich  odbitych  od 
wszystkich  płaszczyzn  sieciowych  kryształu.  W rent- 


Rys.  1.  Czynnik  struktury  /"jako  suma  amplitud  atomowych  fji 
a)  dla  kryształu  niecentrosymctrycznego,  b)  dla  kryształu  centro- 
symetrycznego 


Rys.  2.  Różnica  faz  pomiędzy  punktami  000  i *00  wynosi  2t0\x, 
pomiędzy  *00  i *y0  — 2rr ky  i pomiędzy  xy0  i xyz  — 2 n!z 


476 


cel  analizy  genowskiej  analizie  strukturalnej  kryształów  zadanie 
strukturalnej  jest  jednak  odwrotne:  zmierzone  są  intensywności 
wiązek  odbitych  od  różnych  płaszczyzn  sieciowych, 
czyli  znane  są  moduły  czynników  struktury,  a celem 
analizy  strukturalnej  jest  określenie  struktury  kry- 
ształu. 

Kryształ  można  traktować  jako  obszar  wypełniony 
elektronami  w sposób  okresowy,  przy  czym  okresami 
są  parametry  komórki  elementarnej  a , 6,  c.  Zagęszcze- 
nie elektronów  określa  miejsce  znajdowania  się  atomu. 
Jądra  atomów  są  „nie widoczne”  dla  promieni  rentge- 
nowskich. Za  pomocą  dyfrakcji  promieni  rentge- 
nowskich bada  się  rozkład  chmur  elektronowych. 
Liczba  elektronów  przypadająca  na  jednostkę  obję- 
tości w punkcie  komórki  elementarnej  o współrzęd- 
nych x , y,  z jest  dana  przez  następujące  wyrażenie : 

gęstość  p(xvz)  — -—  V1  V1  V*  F»ne"2,rf(ft*+,;a'+ł*)' 

elektronowa  QK  y ) V 2j  2j  2j 

h,k,l — oo 

gdzie  oipcyz)  jest  gęstością  elektronową  w punkcie 
>•,  z,  a V — objętością  komórki  elementarnej. 
Obliczenie  rozkładu  gęstości  elektronowej  przez 
sumowanie  podanego  wyżej  szeregu  Fouriera  nazywa 
trójwymiaro-  się  w analizie  strukturalnej  trójwymiarową  syntezą 
wa  synteza  Fouriera.  Przeprowadzając  syntezę  Fouriera  komórkę 
Fouriera  elementarną  dzieli  się  na  takie  części  (rys.  3),  jakie 
pozwalają  uniknąć  przeoczenia  jakichkolwiek  ato- 
mów. Np.  komórkę  o wymiarach  10,5  x 10,  4 x 8,0  A 
dzieli  się  odpowiednio  na  40x40  x 30  części,  tak  aby 
gęstość  elektronową  można  było  obliczać  w punktach 
odległych  od  siebie  o ok.  0,25  A.  Taki  podział  ko- 
mórki elementarnej  stwarza  konieczność  sumowania 
szeregu  Fouriera  w 48  tys.  punktów.  Jeśli  dla  badane- 
go kryształu  zarejestrowanych  zostało  tylko  2 tys. 
natężeń  refleksów  (a  rejestruje  się  i 4-6  tys.),  to  obli- 
czenie jednej  syntezy  wymaga  96  min  (I)  sumowań. 
Zwykle  prowadzi  się  obliczenia  tylko  dla  połowy  lub 
czwartej  części  komórki  elementarnej,  w pozostałej 
bowiem  części  komórki  rezultaty  obliczeń  są  powta- 
rzalne w wyniku  operacji  symetrii,  niemniej  ogrom 
obliczeń  spowodował,  że  badania  tego  typu  mogły  się 
rozwinąć  na  szerszą  skalę  dopiero  w erze  komputerów. 

Niekiedy  można  zmniejszyć  ilość  obliczeń  w ten 
sposób,  że  na  podstawie  danych  o natężeniach  reflek- 
sów z jednej  warstwicy  (zawierającej  np.  refleksy 
hkO)  oblicza  się  rzut  gęstości  elektronowej  wzdłuż 
jednej  z osi  krystalograficznych  na  płaszczyznę  pro- 
dwu-  stopadłą  do  tej  osi  (rys.  4 i, 5).  Jest  to  dwuwymiarowa 
wymiarowa  synteza  Fouriera 

synteza  00+ 

Fouriera  = JL 

h,k-~~  30 

(A  jest  powierzchnią  płaszczyzny  rzutu  prostopadłej 
do  osi  Z).  W dwuwymiarowej  syntezie  Fouriera 
oblicza  się  gęstość  elektronową,  np.  w 1600  punktach 
(40x40)  na  podstawie  ok.  200  refleksów  z jednej 
warstwicy  zerowej.  Zmniejsza  to  ilość  obliczeń  do 
320  tys.  sumowań  dla  jednej  syntezy.  Wykonane 
w ten  sposób  dwa  rzuty  wzdłuż  dwóch  osi  dają  obraz 
trójwymiarowy.  Wynik  jest  jednak  mniej  dokładny 
niż  w syntezie  trójwymiarowej.  Syntezy  Fouriera 
mapy  przedstawia  się  graficznie  jako  mapy  gęstości  elektro- 
gęstości  nowej,  na  których  punkty  o jednakowej  gęstości 
elektronowej  elektronowej  łączy  się  liniami  ciągłymi  w warstwice 
(rys.  3 i 5). 

Jednak  nie  pracochłonność  obliczeń  stanowi  naj- 
większą trudność  w badaniach  strukturalnych.  Pod- 
problem  stawową  trudnością  jest  problem  fazowy.  W doświad- 
f azowy  czeniach  otrzymuje  się  intensywności  refleksów  Zhki , 
z których  wyznacza  się  czynniki  struktury,  lecz  nie 
można  określić  kąta  fazowego  a.  Podkreślmy  więc,  że 
doświadczalnie  uzyskuje  się  tylko  IFał-zI  — tj.  wartości 
bezwzględne  czynników  struktury,  a nie  poznaje  się 
ich  kątów  fazowych.  Problem  fazowy  musi  być  roz- 
wiązywany w badaniach  strukturalnych  na  podstawie 


dość  złożonych  analiz.  Obecnie  stosuje  się  głównie  dwa 
sposoby  rozwiązywania  problemu  fazowego.  Są 
nimi  analiza  funkcji  Pattersona  (nazywanej  też  funk- 
cją wektorów  międzyatomowych)  oraz  metody  bez- 
pośrednie, wykorzystujące  statystyczne  zależności 
między  fazami  czynników  strukturalnych.  Dawniej 


Rys.  3.  Fragment  komórki  elementarnej  z uwidocznionym  po- 
działem krawędzi  komórki  elementarnej  na  części  umożliwiające 
lokalizację  atomów 


Rys.  4.  Metoda  rzutu  dwuwymiarowego  — synteza  p(xy) 


Rys.  5.  Obraz  struktury  rozwiązanej  metodą  dwuwymiarowej 
syntezy  Fouriera  p(xy)  (amid  kwasu  4-chlorochinaldynowego) 
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metoda 
prób 
i błędów 


synteza 

Pattersona 


stosowano  jeszcze  metodę  prób  i błędów,  polegającą 
na  tym,  że  odgadywano  przybliżoną  strukturę,  obli- 
czano dla  niej  Fhki  i porównywano  wartości  obliczo- 
nych czynników  struktury  Fc  ze  zmierzonymi  do- 
świadczalnie czynnikami  F0.  Jeśli  czynniki  Fc  i F0 
były  w miarę  zgodne,  uznawano  strukturę  za  rozwią- 
zaną. Metoda  ta  mogła  być  jednak  stosowana  tylko 
do  najprostszych  struktur  kryształów,  w których  ato- 
my lub  jony  zajmują  położenia  szczególne  — w na- 
rożach lub  na  środkach  ścian  czy  krawędzi  komórki 
elementarnej  (jak  np.  w diamencie  i NaCl).  O takim 
rozmieszczeniu  wnioskuje  się  łatwo  np.  na  podstawie 
liczby  atomów  znajdujących  się  w komórce  elementar- 
nej, wielokrotnie  mniejszej  niż  liczba  zdeterminowana 
przez  symetrię  kryształu.  Wówczas  gdy  atomy  znaj- 
dują się  w położeniu  dowolnym,  odgadnięcie  pra- 
widłowej struktury  jest  niemożliwe,  gdyż  zmiana 

0 ułamek  angstrema  położenia  w komórce  elementar- 
nej cząsteczki  nawet  o znanym  kształcie  (a  często 

1 pojedynczego  atomu)  zmienia  drastycznie  wartości 
czynników  struktury,  dając  negatywny  wynik  porów- 
nania F0  i Fc. 

Najczęściej  stosowaną  metodą  rozwiązywania  pro- 
blemu fazowego  jest  synteza  Pattersona.  Polega  ona 
na  tym,  że  do  wzoru  na  gęstość  elektronową  q za- 
miast czynnika  struktury  Fhki  o nieznanym  znaku  lub 


fazie  wstawia  się  uzyskaną  bezpośrednio  w doświad- 
czeniu wartość  Fhki,  której  nie  potrzeba  przypisywać 
znaku  lub  fazy.  Funkcję  Pattersona  w punkcie  uvw 
komórki  elementarnej  określa  więc  wyrażenie 

i +°° 

P(uvw)  = — V yjT  |FAfc!|2e~‘"i("“+*'+'u’) 

lub  w postaci  trygonometrycznej 

+ 00 

P(uvw)=  ! Fhki  i 2 cos  2 jt  (hu  Ą-ku+l w). 

h,k,l=- co 

Rozkład  funkcji  Pattersona,  obliczony  w sposób 
analogiczny  do  opisanego  dla  rozkładu  gęstości  elek- 
tronowej, prezentuje  nie  strukturę,  lecz  położenia 
wektorów  łączących  każde  dwa  atomy  w strukturze 
wektory  (wektorów  międzyatomowych),  poprowadzonych  z 
między-  początku  układu  współrzędnych.  Każdemu  maksi- 
atomowe  mum  na  rozkładzie  funkcji  Pattersona  odpowiadają 
w komórce  elementarnej  kryształu  dwa  atomy 
o współrzędnych  xiy  yiy  z%  oraz  xjy  y}y  Zj.  Tak  więc 
u — Xi—xjy  v = yi—yj,  w = Zi—Zj.  Jeżeli  w komórce 
elementarnej  znajduje  się  A atomów,  to  na  rozkładzie 
funkcji  Pattersona  wystąpi  N(N-l)  maksimów,  często 
nakładających  się  na  siebie. 

Niezależnie  od  symetrii  kryształu,  rozkład  funk- 
cji Pattersona  jest  zawsze  centrosymetryczny,  po- 
nieważ dowolna  para  atomów  może  być  wiązana 
dwoma  równoległymi,  lecz  przeciwnie  skierowanymi 
wektorami.  Syntezę  Pattersona  przedstawia  się  gra- 
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ficznie  jako  mapę  (diagram  wektorowy)  z przepro- 
wadzonymi na  niej  warstwicami  (rys.  7).  W punkcie  diagram 
początkowym  układu  osi  współrzędnych  znajduje  się  wektorowy 
zawsze  silne  maksimum,  którego  wielkość  jest  pro- 
porcjonalna do  sumy  kwadratów  liczb  atomowych 
Zi,Z2, ...,  Ziy  Zj  atomów  tworzących  daną  strukturę: 

Jeśli  wektor  uvw  w tzw.  przestrzeni  Pattersona  łączy 
dwa  atomy  o dużych  liczbach  porządkowych  Zju 
Zj2  silnie  rozpraszające  promieniowanie  (tzw.  atomy 
ciężkie),  to  funkcja  Pattersona  ma  silne  maksimum 
w punkcie  uy  vy  w.  Wielkość  tego  maksimum  jest 
proporcjonalna  do  iloczynu  ZjŁ  • Zj2.  Orientację 
i długość  takiego  wektora  można  z łatwością  odczy- 
tać z mapy  (diagramu)  Pattersona,  co  pozwala  zloka- 
lizować położenia  najcięższych  atomów  w komórce 
elementarnej. 

Rozszyfrowanie  syntezy  Pattersona  polega  na  zna- 
lezieniu struktury,  z której  ta  synteza  powstała. 

Wśród  wielu  maksimów  pattersonowskich  należy 

więc  znaleźć  te,  które  tworzą  motyw  struktury.  Do 

rozszyfrowania  syntez  Pattersona  wykorzystuje  się 

obecnie  głównie  metody  superpozycyjne,  a spośród 

nich  metodę  minimalizacji,  która  w korzystnej  sytua-  metoda 

cji  wydziela  z syntezy  Pattersona  pełny  obraz  struk-  minimalizacji 

tury. 

Funkcję  Pattersona  można  zastosować  do  określe- 
nia symetrii  kryształów.  Analizując  liczbę  maksimów 
na  mapie  Pattersona,  można  stwierdzić  obecność  lub 
brak  środka  symetrii  w krysztale.  Badając  wielkość 
pattersonowskich  maksimów  oraz  skupienia  maksi- 
mów na  pewnych  liniach  lub  płaszczyznach  funkcji 
wektorów  międzyatomowych,  zamiast  122  grup  dy- 
frakcyjnych (zob.  rozdział  „Krystalografia  rentge- 
nowska”) można  jednoznacznie  wyznaczyć  aż  208  (!) 
grup  przestrzennych. 

Jeżeli  w komórce  elementarnej  kryształu  występują 
równocześnie  atomy  ciężkie  i lekkie,  to  z rozkładu 
funkcji  Pattersona  odnajduje  się  zwykle  tylko  współ- 
rzędne xy  y , z atomów  ciężkich.  Współrzędne  te 
pozwalają  na  obliczenie  wartości  czynników  Fhki  dla 
struktury  złożonej  tylko  z tych  atomów.  Tak  obliczo- 
ny zbiór  wartości  Fc  różni  się  oczywiście  od  wartości 
F0  określonych  doświadczalnie  dla  badanej  struktury, 
ale  niemniej  umożliwia  dalsze  postępowanie  polega- 


jące  na  tym,  że  doświadczalnie  uzyskanym  wartoś- 
ciom F0  przypisuje  się  kąty  fazowe  a,  obliczone  dla 
pozycji  x , y , z atomów  ciężkich  i za  ich  pomocą 
oblicza  się  pierwsze  przybliżenie  rozkładu  gęstości 
elektronowej  q(. xyz)  (synteza  Fouriera).  Jeśli  w kryszta- 
metoda  le  występuje  środek  symetrii,  to  część  urojona  wyra- 
kolejnych  żenią  Fhhi  = Ahki+iBhki  równa  się  0 (wtedy  bowiem 
przybliżeń  kąt  fazowy  wynosi  0°  lub  180°,  a jego  cosinus  równa 
się  +1  lub  — 1)  i wówczas  problem  fazowy  sprowadza 
się  do  przypisania  każdej  wartości  \Fhki\  znaku  + 
lub  — . 

Gdy  atom  ciężki  ma  odpowiednio  dużą  liczbę  ato- 
mową w stosunku  do  sumy  liczb  porządkowych  ato- 
mów lekkich,  to  pierwsze  przybliżenie  syntezy  Fourie- 
ra wyjaśnia  niemal  całą  strukturę.  Strukturę  tę  udo- 
kładnia  się  dalej  metodą  kolejnych  przybliżeń  szere- 
gów Fouriera,  polegającą  na  powtarzaniu  opisanej 
wyżej  procedury. 

Najlepszą  metodą  uzyskiwania  bezpośrednich  in- 
formacji o kątach  fazowych  czynników  struktury 
j est  badanie  par  kryształów  izomorficznych.  W jednym 
z tych  kryształów  podstawia  się  na  miejsce  określo- 
nego atomu  — atom  ciężki.  Takie  dwa  kryształy, 
o zbliżonym  składzie  chemicznym,  krystalizujące 
w tej  samej  grupie  przestrzennej  i mające  zbliżone 
rozmiary  komórek  elementarnych  oraz  takie  same 
współrzędne  odpowiadających  sobie-  atomów  — 
nazywają  się  kryształami  izomorficznymi.  Różnica 
intensywności  tych  samych  refleksów  (tj.  refleksów 
o tych  samych  wskaźnikach)  dla  obydwu  kryształów 
pozwala  oznaczyć  kąty  fazowe  (znaki)  czynników 
struktury  Fhki , co  umożliwia  obliczenie  o(xyz). 
metody  Metody  bezpośrednie  oznaczania  kątów  fazowych 
bezpośrednie  (znaków)  są  oparte  na  założeniu,  że  gęstość  elektro- 
nowa w krysztale  nie  jest  nigdy  ujemna  i że  jest  bliska 
zeru  poza  miejscami  znajdowania  się  atomów.  W me- 
todach tych,  za  pomocą  równań  statystycznie  praw- 
dopodobnych ustala  się  zależności  pomiędzy  fazami 
czy  znakami  czynników  struktury. 

Problemu  fazowego  nie  można  rozwiązać  metodą 
prób  i błędów.  Jeżeli  bowiem  dla  danej  struktury 
zmierzono  intensywności  N refleksów,  to  zmieniając 
znak  każdego  kolejnego  czynnika  struktury,  korzy- 
stając ze  wzoru  na  gęstość  elektronową  o(xyz)  można 
obliczyć  2*v  wariantów  rozkładów  gęstości  elektrono- 
wej, przy  czym  tylko  jeden  z nich  będzie  przedstawiał 
prawdziwą  strukturę.  Postępując  w ten  sposób,  dla 
10  refleksów  należałoby  obliczyć  1024  rozkładów, 
dla  20  czynników  struktury  1 048  576  (!)  rozkładów, 
a badając  struktury  kryształów  mierzy  się  intensyw- 
ności dla  ponad  tysiąca  refleksów.  Dla  struktur  nie- 
centrosymetrycznych  liczba  wariantów  byłaby  wprost 
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Rys.  8.  Sposób  przedstawienia  anizotropowych  współczynni- 
ków drgań  termicznych 


nieskończona,  a ich  mechaniczne  obliczanie  byłoby 
pozbawione  sensu. 

Jaki  jest  więc  tok  postępowania?  Na  początku  wy- 
biera się  tylko  najbardziej  intensywne  refleksy  (dwu- 
krotnie silniejsze  od  średniej  arytmetycznej  wszystkich 
intensywności)  i przez  obliczenia  arytmetyczne  wy- 
prowadza się  zależności  między  fazami  lub  znakami ; 
słuszność  tych  zależności  jest  tym  prawdopodobniej- 
sza, im  wyższe  są  wartości  bezwzględne  czynników 
struktury  wchodzących  w relacje.  Dla  struktur  nie- 
centrosymetrycznych  najczęściej  jest  stosowana  na- 
stępująca zależność  między  kątami  fazowymi: 

CtFhkl  ~ C(.Fh'k'lfJrXFłi-Ji'9  k-k't  l-l' 

a dla  struktur  centrosymetrycznych  — zależność  mię- 
dzy znakami  s: 

sFhkl  ~ sFh'k'V’SFh-h',  k-k',l-l'. 

Wynika  stąd,  że  np.  sFzkoo  = sFlW’ sF100y  a więc  wa- 
runek, by  czynniki  struktury  o wskaźnikach  parzys- 
tych — były  dodatnie.  Następny  krok,  po  znalezieniu 
modelu  struktury  na  podstawie  najsilniejszych  reflek- 
sów, polega  na  zastosowaniu  metody  kolejnych  przy- 
bliżeń obliczania  gęstości  elektronowej  przy  korzysta- 
niu już  z pełnego  zbioru  Fhki. 

Metody  bezpośrednie  rozwiązywania  problemu  fa- 
zowego stają  się  coraz  bardziej  popularne,  gdyż  służą 
do  badania  struktur  tych  kryształów,  w których 
wszystkie  atomy  mają  zbliżone  liczby  atomowe,  co 
uniemożliwia  stosowanie  metody  Pattersona. 

Kryterium  poprawności  określenia  struktury  sta- 
nowi wskaźnik  rozbieżności 

X-I\m-\FA\IE\F.U 

Im  mniejszy  jest  wskaźnik  rozbieżności,  tym  większa 
jest  dokładność  rozwiązania  struktury.  Przy  wyzna- 
czeniu intensywności  refleksów  metodami  fotogra- 
ficznymi wskaźnik  rozbieżności  wynosi  ok.  0,1  (10%), 
a przy  stosowaniu  licznikowych  metod  pomiaru  na- 
tężeń refleksów  wartość  jego  zmniejsza  się  do  0,07- 
0,03  (tj.  7-3%).  Po  ustaleniu  na  podstawie  syntez 
Fouriera  przybliżonych  współrzędnych  wszystkich 
atomów,  dalsze  udokładnienie  parametrów  pozycyj- 
nych atomów  oraz  wielkości  drgań  termicznych  ato- 
mów przeprowadza  się  metodą  najmniejszych  kwadra- 
tów. Funkcja,  która  podlega  minimalizacji,  ma  pO- 

ra 

stać  wr(For—Fcr)2>  gdzie  w jest  wagą  statystyczną 

przypisywaną  dokładności  pomiaru  natężenia  po- 
szczególnych refleksów  F0y  a Fc  — czynnikiem  stru- 
ktury Fhki  obliczonym  dla  udokładnianego  modelu 
struktury. 

W najprostszym  modelu  struktury  przyjmuje  się 
występowanie  izotropowych  (tzn.  jednakowych  we 
wszystkich  kierunkach)  drgań  termicznych  atomów 
i dla  każdego  atomu  oblicza  się  tzw.  izotropowe  in- 
dywidualne czynniki  temperaturowe.  Drgania  ter- 
miczne atomów  wzrastają  szybko,  gdy  temperatura 
kryształu  jest  bliska  temperaturze  topnienia  i powo- 
dują zmniejszenie  intensywności  refleksów  ze  wzro- 
stem kąta  odbłysku  £.  Zależność  czynnika  atomowego 
/ od  izotropowego  czynnika  temperaturowego  B 
wyraża  wzór  / = /0e”-B<sind/A>*  (2  — długość  fali  pro- 
mieniowania rentgenowskiego). 

Ruchy  termiczne  atomów  można  analizować  do- 
kładniej, opisując  je  za  pomocą  elipsoidy  trójosiowej, 
której  osie  określają  wielkości  drgań  atomu  w trzech 
prostopadłych  do  siebie  kierunkach.  Zależność  czyn- 
nika atomowego  / od  anizotropowego  czynnika 
temperaturowego  wyraża  wzór 

f = /oe-^U»M22fc8^2+&12ftfc+&2SW+63l'^)# 

Sześć  składowych  tensora  drgań  anizotropowych 
ba  określa  wymiary  półosi  elipsoidy  oraz  orientację 
półosi  względem  przyjętego  układu  osi  współrzęd- 
nych. Ten  sposób  przedstawiania  ruchów  termicz- 
nych atomów  ilustruje  rys.  8. 
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zdolność 

rozdzielcza 


Ostatnie  stadium  analizy  stanowi  obliczenie  od- 
chyleń standardowych  dla  współrzędnych  x , y,  z ato- 
mów, ocena  błędów  przypadkowych  i systematycz- 
nych popełnionych  przy  pomiarze  natężeń  refleksów. 
Na  podstawie  współrzędnych  wszystkich  atomów 
oblicza  się  długości  wiązań,  kąty  walencyjne,  określa 
wzajemne  ułożenie  cząsteczek  lub  innych  elementów 
strukturalnych  w krysztale. 

Analiza  strukturalna  daje  obraz  struktury  uśred- 
nionej w czasie.  Wielkości  drgań  termicznych  „widzi- 
my” jako  wielkość  rozmycia  położenia  atomu.  Meto- 
dami analizy  strukturalnej  określono  struktury  za- 
równo o budowie  najprostszej  (np.  metali),  jak  i naj- 
bardziej złożonej  (białka  i tRNA). 

G.  H.  Stout,  L.  H.  Jensen,  X-ray  Structurc  Detcrmination , 
Toronto  1969. 


Mikroskopia  elektronowa 

Tadeusz  Warmiński 

Mikroskopia  elektronowa  jest  skrótowym  określe- 
niem szerokiego  zespołu  zagadnień  badawczych  i kon- 
strukcyjnych związanych  z coraz  powszechniejszym 
wykorzystaniem  w naukach  przyrodniczych,  medycz- 
nych i technicznych  grupy  przyrządów  elektronowo- 
optycznych  zwanych  mikroskopami  elektronowymi. 
Ich  wspólną  cechą  charakterystyczną  jest  zdolność 
do  projekcji  na  ekranie  i rejestracji  powiększonych 
obrazów  badanych  przedmiotów  (próbek  lub  prepa- 
ratów) przy  wykorzystaniu  jako  źródła  oświetlenia 
skolimowanej  wiązki  elektronów  o energii  od  kilku- 
set eV  do  kilku  MeV.  Skonstruowanie  pierwszego 
mikroskopu  elektronowego  typu  transmisyjnego 
(M.  Knoll  i E.  Ruska.  1931  r.),  który  powstał  przez 
analogię  z prześwietleniowym  mikroskopem  optycz- 
nym, było  logiczną  konsekwencją  doświadczalnego 
potwierdzenia  natury  falowej  elektronu  (C.  J.  Da- 
visson,  L.  H.  Germer,  G.  P.  Thomson,  1927  r.).  Zgod- 
nie z teorią  Abbego  należało  oczekiwać  wysokiej 
zdolności  rozdzielczej  takiego  mikroskopu,  ponieważ 


próbki  wypełnia  się  wówczas  sygnałami  elektrono- 
wymi i elektromagnetycznymi,  zaznaczonymi  sche- 
matycznie na  rys.  1 . Każdy  z nich  niesie  określonego 
typu  informację  o strukturze  materiału  próbki  (w  sen- 
sie przestrzennym  lub  energetycznym),  dotyczącą 


wiązka 

elektronów 

i 


obszaru  oddziaływań.  Wybór  rejestrowanego  sygnału 
określa  zakres  dostępnych  informacji  (tabela);  bio- 
log może  być  zainteresowany  innego  typu  obrazem 
mikroskopowym  aniżeli  fizyk  czy  metalurg. 


Zależność  informacji  od  wyboru  sygnału 


Prędkości,  masy  i długości  fali  elektronu  w zależności  od  Treść  informacji 


jego  energii  (/w0  — masa  spoczynkowa) 

Morfologia 


W,  eV  ! 

1 

1 v,  m/s 

i 

vfc  | 

|wx  103X,kg 

mfmB 

2,  A 
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1 
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9,11 
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12,3 

10 
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Krystalografia 

102 
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9,11 
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1,32 
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1,86* 107 
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9,13 

1,0020 

0,386 

10* 

5,83- 107 

0,19 

9,29 

1,0196 
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Wiązania  chemicz- 

105 

1,6410* 

0,55 

10,9 

1,196 

0,0369 

ne 

10* 

2,83- 10* 

0,94 

26,9 

2,96 

0,00868 

Własności  elektro- 

107 

2,99- 10* 

0,999 

187,8 

20,6 

0,00118 

magnetyczne 

Rodzaj  sygnału 


wszystkie  sygnały  z wyjątkiem  promieni 
rentgenowskich  i elektronów  Augera 
promienie  rentgenowskie,  katodolumines- 
cencja,  elektrony  odbite  i elektrony  Auge- 
ra 

elektrony  odbite,  elektrony  przechodzące 
(transmitowane)  przez  próbkę,  elektrony 
wtórne,  promienie  rentgenowskie 
elektrony  Augera,  promienie  rentgenow- 
skie 

elektrony  wtórne,  elektrony  absorbowane 
w próbce,  siła  elektromotoryczna 


wysokoenergetycznym  elektronom  odpowiadają  dłu- 
gości fali  znacznie  krótsze  aniżeli  w wypadku  światła. 

Czynnikiem  znacznie  ograniczającym  zdolność  roz- 
dzielczą soczewek  elektromagnetycznych  (niezależnie 
od  zjawiska  dyfrakcji  elektronów)  jest  zła  zdolność 
ogniskowania  wiązek  elektronów  biegnących  pod 
kątem  a do  osi  optycznej.  Dopuszczalne  wartości  tego 
kąta  nie  przekraczają  zazwyczaj  lO^-lO  4 rad. 
Osiągalne  zdolności  rozdzielcze  współczesnych  mi- 
kroskopów elektronowych  wynoszą  2-3  A i są 
porównywalne  z graniczną  rozdzielczością  soczewki 
magnetycznej  wynikającą  z rozważań  teoretycznych 
(S  = 0,4c«a3 +0,6 U/sina;  cs  — współczynnik  aber- 
racji sferycznej).  Jest  to  niewątpliwa  przewaga  mi- 
kroskopu elektronowego  nad  optycznym,  którego 
zdolność  rozdzielcza  nie  przekracza  2000  A 

W ostatnim  dziesięcioleciu  okazało  się  jednak,  że 
nie  tylko  możliwość  uzyskiwania  bardzo  wysokich 
powiększeń  rozstrzyga  o atrakcyjności  mikroskopów 
elektronowych.  Przyjrzyjmy  się  efektom  odaziałjwa- 
nia  skolimowanej  wiązki  elektronów  z próbką  ma- 
terii, zazwyczaj  ciała  stałego.  Przestrzeń  wokół 


Stosując  odpowiedni,  różny  dla  różnych  sygnałów, 
system  generacji  i detekcji  wybranego  sygnału  otrzy- 
muje się  obraz  mikroskopowy  lub,  inaczej,  mapę 
stanowiącą  czasoprzestrzennie  uporządkowany  zapis 
jego  intensywności.  Podstawowym  warunkiem  wła- 
ściwego odczytu  obrazu  mikroskopowego  jest  zna- 
jomość procesów  fizycznych  zachodzących  w próbce 
podczas  bombardowania  jej  wysokoenergetycznymi 
elektronami.  Na  szybki  rozwój  mikroskopii  elektro- 
nowej miał  więc  niewątpliwy  wpływ  znaczny  postęp 
w zakresie  fizyki  ciała  stałego,  gazów,  elektronów 
i promieniowania  rentgenowskiego.  Trzeba  pamiętać, 
że  z punktu  widzenia  mikroskopii  elektronowej  są 
ważne  nie  tylko  procesy  elastycznych  rozproszeń 
elektronów  w próbce,  ale  również  rozproszeń  nie- 
elastycznych, prowadzących  do  zmniejszenia  ich 
pierwotnej  energii.  Straty  energii  dzielą  się  statystycz- 
nie w następujący  sposób:  w energię  termiczną  zostaje 
przekształcone  średnio  95%  utraconej  energii,  w ener- 
gię promieniowania  rentgenowskiego  (ciągłego  i cha- 
rakterystycznego) — ok.  1%,  elek4rony  reemitowane 
(wtórne,  odbite  i Augera)  unoszą  4%  energii. 
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elektronu 

Augera 


E próżni 


• Eh 

• Ei 

— K 4 


Jonizacja  atomów  elektronami  lub  promieniami  rentgenow- 
skimi powoduje  powstawanie  luk  na  wewnętrznych  powłokach 
elektronowych-  Elementarnym  procesem  relaksacji  jest  zapełnie- 
nie luki  na  poziomie  energetycznym  Ei  przez  elektron  z niższej 
energetycznie  powłoki  Ej.  Różnica  energii  E\j  może  opuścić  atom 
unoszona  przez  foton  charakterystycznego  promieniowania 
rentgenowskiego,  ale  także  w postaci  bezpromienistej  (emisja 
elektronu  Augera).  Elektron  Augera  wyrzucony  z powłoki  (lub 
podpowłoki)  Eh  ma  energię  Ei  — Ej  — Eh,  która  podobnie  jak 
energia  fotonu  jest  wielkością  charakteryzującą  atom  danego 
pierwiastka  chemicznego.  Relaksacja  atomu  przez  emisję  elek- 
tronu Augera  jest  pośrednim,  ale  nie  końcowym,  procesem  pro- 
wadzącym do  stanu  równowagi  elektrycznej,  ponieważ  pozosta- 
wia atom  podwójnie  zjonizowany  z lukami  na  poziomach  Ej 
oraz  Eh.  Wydajność  każdego  z dwóch  wzajemnie  konkurencyj- 
nych procesów  określają  liczbowo  współczynniki  prawdopodo- 
bieństwa zwane  wydajnością  fluorescencyjną  i wydajnością  pro- 
cesu Augera,  a w sumie  równe  jedności.  Wydajność  fluorescen- 
cyjną można  zapisać  w postaci  ilorazu  zawierającego  w liczniku 
sumę  fotonów  wszystkich  linii  promieniowania  rentgenowskiego 
danej  serii,  emitowanych  statystycznie  w jednostce  czasu,  a w mia- 
nowniku liczbę  luk  na  poziomie  Ei  generowanych  w tym  samym 
czasie.  Na  przykład  dla  serii  K iloraz  ten  ma  postać: 


•I 


(nk)j 

N* 


nk<x  + nk0  + ... 
Nk 


1 

Istnieje  wyraźna  zależność  wydajności  od  liczby  atomowej  pier- 
wiastka Z.  Stwierdzono,  że  pod  względem  wydajności  proces 


Zależność  wydajności  procesu  Augera  od  liczby  atomowej  Z 


Augera  dominuje  w pierwiastkach  lekkich  (Z  < 15)  zjonizowa- 
nych  na  powłoce  K oraz  w'e  wszystkich  pierwiastkach  mających 
luki  na  dalszych  powłokach.  Czynnikiem  ograniczającym  dotych- 
czasowy rozwój  spektroskopii  elektronów  Augera  w wypadku 
ciała  stałego  jest  konieczność  stosowania  wysokiej  próżni.  Dla 
większości  pierwiastków  energie  elektronów  Augera  mają  war- 
tości od  50  do  2000  eV,  co  określa  maksymalną  grubość  war- 
stwy powierzchniowej  próbki  poddawanej  analizie  na  ok.  10-15  A. 
Czystość  powierzchni  jest  więc  w spektroskopii  Augera  sprawą 
bardzo  istotną.  Taka  czystość  jest  nieosiągalna  w otoczeniu  ga- 
zów resztkowych  o ciśnieniu  wyższym  niż  10“*  Pa. 

tworzenie  Obecnie  istnieją  dwa  systemy  tworzenia  obrazu 
obrazu  mikroskopowego,  niezależnie  od  wyboru  sygnału, 
mikroskopu-  W systemie  konwencjonalnym  zakłada  się  równoczes- 
wego  ne  oświetlenie  względnie  szeroką  wiązką  elektronów 
(kilka  pm)  całego  pola  obserwacji,  przedstawianego 
w obrazie  mikroskopowym.  Tym  samym  wszystkie 
elementy  obrazu  mikroskopowego  powstają  również 
równocześnie  i,  pomijając  możliwe  zmiany  próbki  w 
trakcie  obserwacji,  proces  tworzenia  obrazu  nie 
jest  w tym  systemie  funkcją  czasu.  W systemie 
skaningowym  wiązka  elektronów  „omiata’’  ob- 
szar obserwacji  w sposób  dokładnie  taki  sam,  jak 
w lampie  kineskopowej,  która  zazwyczaj  spełnia 
funkcję  czytnika  w układzie  detekcyjnym  mikroskopu 
elektronowego.  Ruch  wiązki  elektronowej  po  próbce 
jest  zsynchronizowany  z ruchem  plamki  świetlnej 
poruszającej  się  po  ekranie  lampy  kineskopowej. 
Zasada  systemu  skaningowego  polega  na  rozbiciu 
obszaru  obserwacji  na  drobne  części  składowe  i ko- 
lejnym ich  odwzorowywaniu  w obrazie  mikroskopo- 
wym, przy  czym  każdej  części  odpowiada  tylko  jeden 
element  obrazu.  System  zakłada  czasowo  przestrzenną 
korelację  przekazu  informacji  między  próbką  i czyt- 
nikiem obrazu  (ekranem  lampy  kineskopowej,  sa- 
mopisem  X-Y  itp.).  Zdolność  rozdzielcza  w systemie 
skaningowym  zależy  od  stopnia  kolimacji  wiązki 
elektronowej  oświetlającej  próbkę,  ale  także  od  geome- 
trycznych rozmiarów  mikroobszaru,  wewnątrz  któ- 


rego jest  generowany  określony  sygnał  (tabela). 
Wysoką  rozdzielczość  uzyskuje  się,  gdy  wiązka  elek- 
tronów jest  możliwie  silnie  skolimowana.  Przy  zasto- 


Zestawienie  osiągalnych  wartości  zdolności  rozdzielczej 
w systemie  skaningowym 


<5,  A 

Rodzaj  sygnału 

1-10 

elektrony  transmitowane  przez  próbkę 

5 -10* 

elektrony  Augera 

10* 

elektrony  wtórne 

5 *10*-10* 

elektrony  odbite 

10‘-10‘ 

elektrony  absorbowane  w próbce 

10*-5  104 

promieniowanie  rentgenowskie 

10M04 

katodoluminescencja 

sowaniu  termoemisyjnych  katod  wolframowych 
i dwu-  lub  trójstopniowego  układu  ogniskowania 
przekrój  wiązki  elektronów  o natężeniu  10-12  A 
wynosi  80-100  A,  natomiast  przy  zastosowaniu  bar- 
dzo jasnych,  samoogniskujących  wyrzutni  polowo- 
emisyjnych  (autoemisja  z katody  ostrzowej)  można  go 
zmniejszyć  do  kilkunastu  A. 

W określonego  rodzaju  detektorach  istnieje  ścisła 
współzależność  pomiędzy  liczbą  różnych  elementów 
obrazu  mikroskopowego,  czasem  jego  rejestracji  i naj- 
mniejszą dopuszczalną  wartością  prądu  sygnału  elek- 
tronowego. Stosując  jako  detektor  fotopowielacz  mo- 
żna np.  zarejestrować  obraz  złożony  z 106  elementów 
w czasie  100  s przy  prądzie  sygnału  2,6-1 0-12  A 
Omiń  = 2,6-10-18«/f,  gdzie  n — liczba  elementów, 
t — czas  rejestracji). 

Obydwa  wymienione  systemy  są  stosowane  w kon- 
trukcji  różnego  typu  mikroskopów  elektronowych, 
których  nazwy  zawierają  specyfikację  systemu  oraz 
ewentualnie  podstawowego  rejestrowanego  sygnału. 
W ostatnich  latach  produkowane  są  coraz  bardziej 
skomplikowane  układy,  swego  rodzaju  kombajny 
elektronowo-optyczne,  z przeznaczeniem  do  kom- 
pleksowych badań  mikroskopowo-spektroskopowych, 
którym  trudno  znaleźć  właściwą  nazwę  i dlatego  są  one 
oznaczane  wyłącznie  symbolami  (np.  HP-5,  HP-51, 
BS-350). 


Transmisyjny  mikroskop  elektronowy 
(TEM) 

Jest  to  historycznie  pierwszy  i jednocześnie  najbar- 
dziej rozpowszechniony  typ  mikroskopu  elektrono- 
wego (ii.  88,  tabl.  22).  TEM  pracujący  w systemie 
konwencjonalnym  (CTEM)  jest  najbardziej  zbliżony 
do  mikroskopu  optycznego.  Zasadniczym  elementem 
CTEM  jest  soczewka  elektromagnetyczna  obiektywu, 
której  zasadę  działania  wyjaśnia  rys.  2.  Jej  pole  dzia- 


Rys.  2.  Zasada  działania  soczewki  obiektywu  w mikroskopie 
transmisyjnym;  AB  płaszczyzna  dyfraktogramu,  CD  płaszczyzna 
obrazu  mikroskopowego 


zdolność 
rozdzielcza 
w systemie 
skaningo- 
wym 


TEM 

w systemie 
konwencjo- 
nalnym 
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łania  to  obszar  pomiędzy  próbką  i diafragmą,  zwaną 
aperturą  obiektywu.  Wiązka  elektronów  oświetlająca 
próbkę  jest  ograniczona  przez  aperturę  kondensora 
do  średnicy  1-5  pm.  Powiększenie  soczewki  obiekty- 
wu wynosi  kilkaset.  Po  przejściu  przez  tę  soczewkę 
elektrony  tworzą  dwa  obrazy:  wzór  dyfrakcyjny 
(elektronogram)  w płaszczyźnie  ogniskowania  AB 
oraz  obraz  mikroskopowy  w płaszczyźnie  CD  (od- 
ległość pomiędzy  płaszczyznami  AB  i CD  wynosi 
5 cm).  Wzór  dyfrakcyjny  i obraz  mikroskopowy 
sprzężone  są  transformatą  Fouriera  (przy  założeniu 
braku  aberracji).  Po  powiększeniu,  zazwyczaj  dwu- 
stopniowym (soczewka  zw.  pośrednią  i soczewka 
projektora  tworzą  układ  odpowiadający  okularowi 
w mikroskopie  optycznym),  każdy  z tych  obrazów  mo- 
że być  zarejestrowany  na  ekranie  fluorescencyjnym 
(pokrytym  luminoforem)  albo  na  kliszy  fotograficz- 
nej. 

TEM  TEM  pracujący  w systemie  skaningowym  (STEM) 
w systemie  nie  zawiera  soczewek  tworzących  obraz  między  prób- 
skaningo-  ką  i detektorem  obrazu  — zazwyczaj  fotopowiela- 
wym  czem  (rys.  3).  Obniża  to  negatywny  wpływ  strat 


energii  elektronów,  przez  co  z równą  wyrazistością 
w STEM  można  oglądać  próbki  2-5  razy  grubsze 
aniżeli  w CTEM.  Teoretycznie  STEM  i CTEM  po- 
winny dawać  identyczne  obrazy  mikroskopowe, 
w praktyce  jednak  zdolność  rozdzielcza  STEM  — 
ograniczona  średnicą  sondy  (wiązki  elektronowej)  — 
jest  nie  mniejsza  niż  5 A.  Zaletą  STEM,  szczególnie 
istotną  w zastosowaniach  w biologii  i medycynie,  jest 
elektroniczna  regulacja  kontrastowości  obrazu  i mo- 
żliwość pracy  przy  bardzo  małym  prądzie  wiązki 
(10“10-10“12  A,  w porównaniu  z 10"  MO*"7  A dla 
CTEM).  Wielkość  prądu  wpływa  z kolei  na  osiągalną 
w TEM  zdolność  rozdzielczą  (tabela). 

Obydwa  systemy  TEM  umożliwiają  tworzenie 
obrazów  mikroskopowych  w polu  jasnym  i w polu 
obrazy  w polu  ciemnym.  Otrzymuje  się  je  odpowiednio  przez  wy- 
odrębnienie wiązki  centralnej  lub  jednego  z bocznych 
ctemnym  maksimów  dyfrakcyjnych  (refleksów).  Obserwacja 
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w polu  jasnym  odpowiada  patrzeniu  na  przedmiot 
pod  światło,  co  nie  zawsze  sprzyja  dobrej  widoczno- 
ści. Z kolei  obserwacja  przedmiotu  w świetle  roz- 
proszonym, czyli  w polu  ciemnym,  przy  jednoczesnej 


Zeleżność  zdolności  rozdzielczej  od  rodzaju  próbki  (TEM) 


Rodzaj  próbki 

Doza  krytyczna  mc 

Graniczna 
zdolność 
rozdzielcza 
<5min  = 

= 50l\/me 

A/cm* 

elektro- 

nów/A* 

Kryształy  nieorganiczne 

0,1-10 

I0*-104 

5-0,5  A 

Substancje  organiczne 

10-3-1 

1-1 03 

10-1  A 

Żywa  materia 

10-3-10-* 

io-6-io-» 

1-0,1  pm 

możliwości  zmian  konfiguracji  oko-przedmiot-źródło 
światła,  pozwala  na  znacznie  bardziej  precyzyjną 
analizę  jego  struktury  (w  wypadku  mikroskopii  elek- 
tronowej bardziej  istotna  jest  struktura  niejednorod- 
ności wnętrza  aniżeli  powierzchni  próbki). 

W mikroskopii  elektronowej  duże  znaczenie  ma  od-  preparatyka 
powiędnie  przygotowanie  próbki.  Przy  zazwyczaj  sto-  próbek 
sowanych  wiązkach  elektronowych  o energii  100  keV 
próbki  muszą  mieć  grubość  nie  większą  niż  1000  A. 

Preparatyka  próbek  jest  tematem,  który  stanowi  sa- 
moistną dziedzinę  wiedzy  fizykochemicznej.  Próbki 
dzielą  się  na  dwie  zasadnicze  grupy:  repliki  powierz- 
chni i cienkie  folie  materiału  stanowiącego  przedmiot 
badań  mikroskopowych.  Repliki,  otrzymywane  przez  reD,iki 
pokrycie  próbki  cienką  warstewką  dobrze  przylega- 
jącej substancji  (np.  naparowanie  węglem),  po  od- 
dzieleniu od  podłoża  i odpowiedniej  dalszej  obróbce 
(cieniowanie,  czyli  naparowanie  pod  kątem  ciężkim 
metalem)  umożliwiają  otrzymanie  obrazu  mikrosko- 
powego topografii  powierzchni  próbki  z rozdzielczo- 
ścią do  20  A.  Pewne  rodzaje  replik,  zwane  ekstrak- 
cyjnymi, umożliwiają  bezpośrednią  obserwację  drob- 
nych wydzieleń  (mikroobszarów  o innych  własnoś- 
ciach fizykochemicznych)  pochodzących  z próbki. 

W ostatnim  dziesięcioleciu  znaczenie  replik  zma- 
lało, w wyniku  upowszechnienia  skaningowych  me- 
tod przetwarzających  na  obraz  mikroskopowy  sygna- 
ły elektronów  odbitych  i wtórnych  emitowanych 
z powierzchni  próbek  litych.  Wzrosła  natomiast  li- 
czebność i wyrafinowanie  technik  służących  otrzymy- 
waniu cienkich  folii.  Próbki  do  badań  fizycznych  czy  c|enkje 
inżynierii  materiałowej  otrzymuje  się  przez  polero- 
wanie  chemiczne,  elektrochemiczne,  trawienie  jonowe 
lub  walcowanie.  Preparaty  biologiczne  tnie  się  na 
cienkie  próbki  za  pomocą  ultramikrotomu.  Proble- 
mem jest  w tym  wypadku  zabezpieczenie  delikatnej 
tkanki  preparatu  przed  uszkodzeniem  w wyniku 
cięcia  lub  odwodnienia.  Podstawowymi  składnikami 
próbek  organicznych  są  pierwiastki  lekkie,  dające 
znikomy  kontrast.  Kontrast  od  różnych  strukturalnie 
części  próbki  można  polepszyć  nasycając  próbkę 
substancjami  zawierającymi  pierwiastki  ciężkie  (np. 

Os).  Nasycenie  ciężkimi  pierwiastkami  stanowi  ana- 
logię do  barwienia  preparatów  organicznych  przy 
obserwacji  w mikroskopie  optycznym. 

W dziedzinie  badań  biologicznych  i medycznych  fcac|aflje 
wykorzystuje  się  TEM  do  poznania  biologii  komórek,  oboektów 
w szczególności  budowy  jądra  komórkowego,  cyto-  biologicznych  i 
plazmy  i błony  komórkowej  (-►  Błony  komórkowe. 

Molekularne  podstawy  skurczu  mięśnia).  Ustalenie 
ilości  i rodzajów  występujących  w nich  organelli 
w powiązaniu  z możliwością  określenia  ich  funkcji 
chemicznych  dało  podstawę  pogłębienia  wiedzy  o fun- 
kcjonowaniu tkanek.  Wiele  obiektów  biologicznych 
ma  dostatecznie  małe  rozmiary,  aby  je  bezpośrednio 
obserwować  w TEM,  np.  bakterie  i wirusy.  Ich  cechą 
specyficzną  jest  zachowanie  określonego  typu  sy- 
metrii przestrzennej.  Doskonalenie  jakości  zdjęć 
właśnie  tego  typu  obiektów  oraz  zastosowanie  kom- 
putera i holografii  umożliwiło  rozwój  mikroskopowej 
metody  badań  zw.  trójwymiarową  rekonstrukcją. 

Trójwymiarowa  rekonstrukcja  cząsteczek  dostarcza 


dziś  pełnej,  przestrzennej  informacji  o budowie  we- 
wnętrznej i kształcie,  na  przykład  wirusa  z rozdziel- 
czością 10  A. 

badania  W dziedzinie  inżynierii  materiałowej  za  pomocą 
materiałowe  TEM  uzyskano  bezpośredni  dowód  istnienia  defek- 
tów sieci  krystalicznej,  dyslokacji  i błędów  ułożenia 
(il.  87,  tabl.  22).  Zrozumienie  znaczenia  dyslokacji 
w procesie  deformacji  plastycznej  materiałów,  szcze- 
gólnie blokowania  ich  ruchu  przez  drobne  wydzielenia 
stało  się  podstawą  oceny  własności  sprężystych  wielu 
metali  i stopów.  Możliwość  łatwego  aparaturowego 
przejścia  od  wzoru  dyfrakcyjnego  do  obrazu  mikro- 
skopowego została  wykorzystana  do  identyfikacji 
struktury  wydzieleń  w materiałach  wieloskładniko- 
wych. Obecnie  jest  możliwe  przy  zastosowaniu  mi- 
kro-mikrodyfrakcji  określenie  struktury  wydzielenia 

0 średnicy  200  A.  W tym  kontekście  duże  znaczenie 
ma  zastosowanie  TEM  do  badania  przemian  fazo- 
wych. W fizyce  półprzewodników  poznanie  geometrii 
dyslokacji  pozwoliło  w kilku  wypadkach  (Si,  ZnTe) 
na  pełniejsze  wyjaśnienie  własności  elektronowych 

1 optycznych  tych  materiałów  (-*  Dyslokacje  w kry- 
ształach). 

Za  pomocą  TEM  o dużej  rozdzielczości  i przy  za- 
stosowaniu komputera  można  — z obrazu  mikro- 
skopowego płaszczyzn  sieciowych  — wnioskować 
o strukturze  sieci  krystalicznej  materiału  (defektach 
itp.).  Innym  zadaniem  mikroskopii  wysokorozdziel- 
czej jest  obserwacja  pojedynczych  atomów  i cząste- 
czek. Operując  analogią  optyczną  zauważenie  obiektu 
o rozmiarach  atomu  (3-4  A)  z odległości  30  cm  odpo- 
wiada sytuacji,  w której  chcemy  dostrzec  kulkę  szkla- 
ną o średnicy  0,03  mm  z odległości  30  km.  Obraz 
atomów  ciężkich  pierwiastków  (U,  Th)  uzyskano  (la- 
ta. 1969-70)  zarówno  w CTEM  (w  ciemnym  polu), 
jak  również  w STEM. 

badania  Ważnym  kierunkiem  zastosowań  TEM  są  badania 
„in  situ"  „in  situ”,  w których  próbka  jest  poddawana  progra- 
mowanym zmianom  (przez  chłodzenie,  grzanie,  pod- 
świetlanie, rozciąganie)  wewnątrz  kolumny  mikro- 
skopu. Do  grupy  mikroskopów  specjalnie  przystoso- 
wanych do  takich  badań  należy  niewątpliwie  zaliczyć 
HVEM  wysokonapięciowy  TEM  (HVEM),  pracujący  przy 
napięciu  przyspieszającym  elektrony  od  1 do  3 MV. 
Elektrony  o takich  wysokich  energiach,  poza  zwiększo- 
ną przenikliwością  (próbki  mogą  mieć  grubość  ok. 
104  A),  powodują  powstawanie  defektów  radiacyj- 
nych. Relatywistyczne  elektrony  o energii  większej 
niż  krytyczna  wartość  Wm m po  przeniknięciu  powło- 
ki K atomu  w sieci  krystalicznej  powodują  jego  wy- 
bicie w położenie  międzywęzłowe.  W ten  sposób  po- 
wstaje para  defektów  typu  Frenkla  — luka  oraz  atom 
międzywęzłowy  (tabela).  Defekty  radiacyjne  bada 
się  dla  celów  poznawczych  i aplikacyjnych  w pół- 
przewodnikach i materiałach  reaktorowych.  Głów- 


Defekty  radiacyjne  generowane  wysokoenergetycznymi 
elektronami  (HVEM) 


Wybity  atom 

Napięcie  kry-1 
tyczne,  kV  | 

Wybity  atom 

Napięcie  kry- 
tyczne, kV 

H 

2-3 

O w MgO 
(kryształ) 

330 

C w substancjach 
organicznych 

25-30 

j Mg  w MgO 
(kryształ) 

480 

Si  w krzemianach 

40 

* Metale 

(kryształy) 

100-1500 

nym  atutem  HVEM  jest  przyspieszenie  tempa  pro- 

Scesów  takich,  jakie  zachodzą  w akceleratorach  linio- 
wych i reaktorach,  procesów,  które  prowadzą  do  two- 
rzenia agregatów  defektów  punktowych  wpływają- 
cych na  zmianę  własności  materiałów.  Przy  ustalonej 
gęstości  prądu  elektronowego  skupienie  ich  w plamkę 
o średnicy  ok.  10~12  m2,  zamiast  na  powierzchni 
10-4  m2,  powoduje  przyspieszenie  generacji  defektów 
w proporcji  czasu  jak  1 min  do  200  lat. 


Odbiciowy  mikroskop  elektronowy  (REM) 

Mikroskopy  należące  do  tej  i do  dwóch  dalszych  grup 
stosuje  się  wyłącznie  do  obserwacji  powierzchni  próbek 
litych.  W systemie  konwencjonalnym  wykorzysty- 
wane są  elektrony  o wysokiej  energii,  rozproszone  na 
próbce  pod  małymi  kątami  (rys.  4).  Zasadniczym 
czynnikiem  ograniczającym  zdolność  rozdzielczą  jest 


Rys.  4.  Zasada  działania  mikroskopu  odbiciowego 


aberracja  chromatyczna,  którą  zmniejsza  się  pęzez 
stosowanie  małych  kątów  0X  i 02.  Czynnikiem  pogar- 
szającym zdolność  rozdzielczą  przy  małych  apertu- 
rach  jest  rozmycie  dyfrakcyjne.  Zdolność  rozdzielcza 
nie  przekracza  300  A (0i  = 2°,  02  = 23°).  Problemem 
jest  również  mała  jasność  obrazu.  Przetworniki  elek- 
tronooptyczne  dają  rozwiązanie  tylko  pozorne,  po- 
nieważ ze  swej  strony  pogarszają  zdolność  rozdziel- 
czą. Konwencjonalny  REM  wykorzystuje  się  głównie 
do  badań  związanych  z dyfrakcją  wysokoenergetycz- 
nych elektronów  (HEED),  stanowiących  cenne  źródło 
informacji  o strukturze  krystalicznej  cienkiej  warstwy 
powierzchniowej.  Inne  jego  zastosowanie  — to  stereo- 
metria,  korzystająca  z kontrastowych  i długich  cieni 
od  nierówności  topograficznych. 

REM  pracujący  w systemie  skaningowym  (ŚREM, 
często  skrótowo  oznaczany  symbolem  SEM)  tworzy 
obraz  powierzchni  próbki  wykorzystując  sygnały 
elektronów  odbitych,  wtórnych,  absorbowanych 
i katodoluminescencji,  a w szczególnych  wypadkach 
również  elektronów  Augera  (konieczna  próżnia  co 
najmniej  10~6  Pa).  Wiązka  elektronów  oświetlająca 
próbkę  pada  na  nią  na  ogół  pod  dowolnym  (zazwy- 
czaj 90°),  ale  stałym  kątem.  Tylko  w badaniach  orien- 
tacji krystalograficznej  powierzchni  stosuje  się  zmien- 
ny kąt  wejścia  elektronów  do  próbki.  Ze  względu  na 
silną  kolimację  pierwotnej  (oświetlającej)  wiązki 
elektronów  ŚREM  ma  dużą  głębię  ostrości  (rys.  5). 
Dlatego  nadaje  się  specjalnie  do  badania  kruchych 
próbek  o złożonym  kształcie,  często  spotykanych 

zdolność  rozdzielacza 


105  104  103  102  A 


Rys.  5.  Zależność  głębi  ostrości  od  powiększenia  dla  mikrosko- 
pów optycznych  i mikroskopu  elektronowego  typu  ŚREM 
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w Siologii  i w mikroelektronice.  Zdjęcia  mikroskopo- 
we wykonane  w świetle  elektronów  odbitych  (il.  85a, 
tabi  22)  ujawniają  nie  tylko  nierówności  powierzchni 
rozdzielanie  (kontrast  topograficzny),  ale  także  jej  skład  che- 
obrazów  to-  miczny  (kontrast  kompozycyjny).  Istnieje  możliwość 
pograficz-  rozdzielenia  obrazów  topograficznych  i kompozycyj- 
nych i kom-  nych.  W badaniu  półprzewodników  jest  istotna  moż- 
pozycyjnych  liwość  przetwarzania  na  obraz  mikroskopowy  prądu 
wywołanego  absorbowaną  wiązką  elektronów,  w 
w szczególności  siły  elektromotorycznej  (il.  85b). 
Jeśli  próbka  ma  złącze  p-n,  prąd  ten  indukuje  do- 
datkowe przewodnictwo  elektryczne,  którego  roz- 
kład przestrzenny  dostarcza  informacji  o własnoś- 
ciach elektronowych  półprzewodnika,  takich  jak 
droga  dyfuzji  i czas  życia  nośników  mniejszościo- 
wych. Na  koniec  katodoluminescencja  (il.  85c) 
obserwowana  w materiałach  organicznych  i nie- 
których półprzewodnikach  (np.  CdS,  ZnS,  GaAs, 
CdTe)  jest  czuła  na  zanieczyszczenia  i defekty  sieci. 


Emisyjny  mikroskop  elektronowy  (EEM) 

W tej  grupie  mikroskopów  lita  próbka  spełnia  funkcję 
katody,  tzn.  emitera  elektronów  tworzących  obraz. 
Wymuszenie  emisji  elektronów  może  nastąpić  w wy- 
niku podwyższenia  temperatury  próbki  (termoemi- 
sja),  bombardowania  elektronami  lub  jonami  (emisja 
wtórna  i jonowo-elektronowa),  oświetlenia  (fotoemi- 
sja)  lub  działania  silnego  pola  elektrycznego  (auto 
emisja).  Układ  elektronowo-optyczny  formowania 
obrazu  w EEM  jest  podobny  jak  w CTEM.  Zdolność 
rozdzielcza  S zależy  od  rozmycia  energetycznego 
~A  W elektronów  i od  pola  elektrostatycznego  E przy 
powierzchni  próbki  (S  = 0,6  J W/E),  a także  od  ro- 
dzaju emisji  (200  A przy  termoemisji  i T — 2800  K, 
E=  3-10*  V/m;  500-1000  A przy  emisji  jonowo- 
elektronowej;  800  A przy  fotoemisji;  1000  A przy 
emisji  wtórnej).  W warunkach  termo-  i fotoemisji 
zasadniczym  czynnikiem  tworzenia  kontrastu  jest 
lokalna  wartość  pracy  wyjścia  elektronów  z próbki, 
zastosowanie  EEM  znalazł  zastosowanie  w fizyce  metali  przy 
EEM  badaniu  zdolności  emisyjnej  katod,  w analizie  prze- 
mian fazowych  w badaniach  „in  situ”  wzajemnego 
oddziaływania  jonów  z materią  (obserwacja  równo- 
czesnego trawienia  jonowego  i utleniania  próbki)  itp. 


projektor  Przykładem  prostego  EEM  jest  projektor  elektro- 
elektronowy  nowy  pokazany  na  rys.  6.  Zazwyczaj  jest  to  kolba 
szklana  (wewnątrz  pokryta  w przedniej  części  lumino- 
forem), w którą  są  wtopione:  metalowe  ostrze  o pro- 
mieniu krzywizny  10M04  A (katoda)  oraz  otaczający 
je  metalowy  pierścień  (anoda).  Ciśnienie  w kolbie  wy- 
nosi 10~8-10-9  Pa.  Przyłożenie  do  anody  napięcia 
dodatniego  rzędu  kilku  kV  powoduje  powstanie  przy 
powierzchni  ostrza  pola  elektrostatycznego  109-1010 
V/m,  które  wystarcza  do  wywołania  autoemisji. 
Powiększenie  M = R/r{5,  gdzie  R — odległość  między 
katodą  i ekranem,  r — promień  krzywizny  ostrza 
(nagrzewanie  ostrza  powoduje,  że  jego  czubek  ulega 
zaokrągleniu),  fi  — współczynnik  zniekształcenia 
obrazu.  Na  ogół  M = 200  tys.  Zdolność  rozdzielczą 
projektora  elektronowego  (ok.  25  A)  ogranicza  wy- 
stępowanie składowej  prędkości  elektronów  stycznej 
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do  powierzchni  ostrza  oraz,  w mniejszym  stopniu,  zastosowanie 
dyfrakcja  elektronów.  Mikroskopy  tego  typu  wy-  projektora 
korzystuje  się  do  badania  autoemisji  z metali  trudne 
topliwych  i półprzewodników,  badania  zjawiska  ad- 
sorpcji i chemisorpcji  oraz  wyznaczania  pracy  wyjścia 
z różnych  płaszczyzn  sieciowych  w monokryształach. 

Zwierciadlany  mikroskop  elektronowy  (ME M) 

W mikroskopie  zwierciadlanym  lub  inaczej  w zwier- 
ciadle elektronowym  elektrony  oświetlające  powierz- 
chnię litej  próbki  nie  stykają  się  z nią  bezpośrednio. 

Zasadniczym  jego  elementem  jest  obiektyw  imersyjny, 
utworzony  z próbki  i cylindrycznej  diafragmy  (rys. 

7).  Pomiędzy  próbką  (podaje  się  na  nią  ujemne  napię- 


Rys.  7.  Zasada  działania  zwierciadlanego  mikroskopu 
elektronowego 


cie  V0=  10-30  kV)  i diafragmą  (uziemiona)  istnieje 
silne  pole  elektrostatyczne  E0,  które  przekazuje  elek- 
tronom tworzącym  obraz  mikroskopowy  informacje 
o próbce.  Szczególne  znaczenie  ma  kształt  tzw.  zero-  zerowa  po- 
wej  powierzchni  ekwipotencjalnej,  to  jest  powierzchni,  wierzchnia 
na  której  następuje  zahamowanie  i zawrócenie  elek-  ekwipoten- 
tronów  w kierunku  ekranu  fluorescencyjnego.  Wy-  cjalna 
boru  zerowej  powierzchni  dokonuje  się  przez  przyło- 
żenie do  katody  napięcia  o kilka  do  kilkunastu  woltów 
wyższego  niż  do  próbki.  Próbka  przekazuje  zerowej 
powierzchni  ekwipotencjalnej  szczegóły  topografii 
swojej  powierzchni  oraz  dodatkowo  kształt  wystę- 
pujących na  niej  pól  elektrostatycznych  i magnetycz- 
nych. Poprzeczna  (względem  osi  optycznej)  geome- 
tryczna zdolność  rozdzielcza  nie  przekracza  1000  A 
(przy  E0  = 5-10*  V/m).  Najważniejszym  parametrem 
decydującym  o atrakcyjności  MEM  jest  jednak  nie 
geometryczna,  ale  napięciowa  zdolność  rozdzielcza, 
określająca  wykrywalną  składową  zmiany  pola  elek- 
trycznego w kierunku  równoległym  do  powierzchni 
próbki.  Stwierdzono,  że  nie  przekracza  ona  wartości 
6-107  V/m2.  Dzięki  wysokiej  czułości  napięciowej 
MEM  znalazł  zastosowanie  w badaniu  elektrycznie  zastosowanie 
aktywnych  elementów  powierzchni  półprzewodników  MEM 
(np.  złącz  p-n9  il.  86,  tabl.  22),  ferroelektryków,  a tak- 
że materiałów  magnetycznych.  Na  specjalne  podkreś- 
lenie zasługuje  przydatność  MEM  do  badań  fizycz- 
nych, czego  przykładem  jest  obserwacja  zmian  prze- 
wodnictwa elektrycznego  powierzchni  kryształu  krze- 
mu w wyniku  wymuszonej  migracji  zawartych  w jego 
sieci  krystalicznej  domieszek  atomów  obcych. 


Analityczny  mikroskop  elektronowy  (EMA) 

przestrzenny  Mikroskopy  tego  typu  służą  do  przedstawienia  w ob- 
rozkład  razie  mikroskopowym  przestrzennego  rozkładu  wy- 
pierwiastka  branego  pierwiastka  chemicznego,  stanowiącego 
składnik  materiału  próbki.  Zazwyczaj  osiąga  się  taki 
obraz  (il.  84,  tabl.  22)  przez  sprzężenie  TEM  lub 
REM  z odpowiednim  spektrometrem,  który  analizuje 
widmo  charakterystycznego  promieniowania  rentge- 
nowskiego, elektronów  transmitowanych  przez  prób- 
kę, ewentualnie  elektronów  Augera.  Procesy  emisji 
kwantu  charakterystycznego  promieniowania  rent- 


genowskiego i elektronu  Augera  o określonej  energii 
są  wzajemnie  konkurencyjne.  Pierwszy  dominuje 
w atomach  pierwiastków  ciężkich,  drugi  — lekkich. 
Dobór  spektrometru  (w  wypadku  elektronów  Augera 
jest  to  również  specjalnego  typu  ŚREM)  powinien 
zależeć  od  oczekiwanego  składu  chemicznego  próbki. 

Z.  Bojarski  Mikroanalizator  rentgenowski,  Katowice  1971; 
I.  Goldstein  H.  Yakowitz  (red.)  Practica  Scanning  Electron 
Microscopy,  New  York  1975;  P.  B.  Hirsch  i in.  Electron  Micro - 
scopy  of  Thin  Crystals,  London  1971 ; D.  B.  Holt  i in.  (ed.)  Quan- 
titative  Scanning  Electron  Microscopy , London  1974;  J.  Kozu- 
bowski  Metody  transmisyjnej  mikroskopii  elektronowej , Kato- 
wice 1975. 


Osiągnięcia  krystalografii  białek 

Tadeusz  Bartczak 


Największe  osiągnięcia  analizy  strukturalnej  kryszta- 
łów i krystalochemii  w ostatnich  dziesięciu  latach 
wiążą  się  z tzw.  krystalografią  białek.  W obecnej 
chwili  rentgenowska  analiza  strukturalna  białek  sta- 
nowi jedyną  metodę,  za  pomocą  której  można  uzys- 
kać precyzyjne  dane  strukturalne,  tzn.  przestrzenne 
współrzędne  atomów. 

Biopolimery  takie  jak  białka  są  bardzo  delikatnym 
i trudnym  obiektem  badań.  Po  pierwsze  — już  próby 
wyhodowania  kryształów  dostatecznie  dużych  (wy- 
miary liniowe'^  0,3  mm)  wymagają  zastosowania 
nowoczesnych  technik  eksperymentalnych  rozległej 
wiedzy  biochemicznej,  wykonania  setek  doświad- 
czeń i nierzadko  kończą  się  niepowodzeniem.  Po 
drugie  — kryształy  biopolimerów  są  zwykle  o wiele 
nieuporząd-  bardziej  nieuporządkowane  niż  kryształy  zbudowane 
kowanie  z małych  cząsteczek  organicznych.  Znaczy  to,  że  czą- 
statyczne  steczki,  grupy  lub  łańcuchy  atomów  mogą  być  różnie 
i termiczne  zorientowane  w tej  samej  części  komórki  elementar- 
nej. Takie  nieuporządkowanie  nosi  nazwę  nieuporząd- 
kowania  statycznego  i powoduje  duże  trudności 
eksperymentalne.  W kryształach  biopolimerów  ob- 
serwuje się  ponadto  nieuporządkowanie  całych 
cząsteczek  spowodowane  drganiami  termicznymi  ato- 
mów. Jak  wiadomo,  ok.  50%  objętości  kryształów 
białek  zwykle  stanowi  woda.  Te  cząsteczki  wody 
mogą  być  mocno  związane  z powierzchnią  cząsteczki 
białka  albo  luźno  utrzymywane  w przestrzeniach 
pomiędzy  sąsiednimi  cząsteczkami  białka.  Otoczenie 
przez  „poduszkę”  wody  powoduje,  że  cząsteczki 
biopolimeru  są  luźniej  ulokowane  w sieci  krystalicz- 
nej i dlatego  zdoine  są  do  wykonywania  dużych  drgań 
termicznych. 

Wreszcie  wielkie  rozmiary  kryształów  białek  (ty- 
powy okres  identyczności  komórki  elementarnej 
100  A w porównaniu  z przeciętnym  okresem  iden- 
tyczności 10  A dla  kryształu  małej  cząsteczki  orga- 
nicznej) powoduje,  że  trzeba  zmierzyć  i przetworzyć 
ogromną  liczbę  interferencji. 

Te  specyficzne  cechy  kryształów  białek  spowodo- 
wały, że  metody  ich  badania  za  pomocą  promieni 
rentgenowskich  wyodrębniły  się  w oddzielną  dzie- 
dzinę badań:  krystalografię  białek.  Opracowanie 
wielu  specyficznych  technik  badawczych  i metod 
obliczeniowych  umożliwiło  pomyślne  zbadanie  wielu 
struktur  białkowych  i dlatego  stanowi  największe 
osiągnięcie  analizy  strukturalnej  i jedno  z najwięk- 
szych osiągnięć  nauki  ostatnich  lat.  Dyfrakcja  pro- 
mieni rentgenowskich  umożliwiła  realizację  jednego 
z podstawowych  celów  biologii  molekularnej:  in- 
terpretację funkcji  biologicznej  poprzez  poznanie 
własności  fizycznych  i chemicznych  struktur  biolo- 
gicznych. Wstępnym  warunkiem  fizykochemicznej  in- 
terpretacji procesów  życiowych  jest  poznanie  struk- 
tury odpowiednich  komponentów  życia  na  poziomie 
atomowym.  Krystalografia  rentgenowska  jest  jedyną 
znaną  metodą  dostarczającą  tych  informacji  w sposób 
kompleksowy. 


Rozwój  krystalografii  białek 

Krystalografia  białek  rozwinęła  się  raptownie  w ostat- 
nich kilkunastu  latach,  dzięki  rozwojowi  elektronicz- 
nej techniki  obliczeniowej  i nowoczesnych  metod 
pomiaru  intensywności  promieniowania  rentgenow- 
skiego ugiętego  na  krysztale  (stosuje  się  tzw.  automa- 
tyczne, czterokołowe  dyfraktometry  monokrysta- 
liczne).  Pierwsze  eksperymenty  wykonane  były  przez 
J.  Bemala  i D.  Crowfoot  w 1934  r.  w Cambridge  na 
krysztale  pepsyny,  metodą  rejestracji  na  błonie  foto- 
graficznej. Uświadomiły  one  badaczom  fundamen- 
talny fakt,  że  wielkie  cząsteczki  biologiczne  są  upo- 
rządkowane w sieć  krystaliczną  i że  ich  struktury 
można  wobec  tego  określić  metodami  dyfrakcji  rent- 
genowskiej. Z tego  okresu  pochodzi  anegdota  o tym, 
jak  D.  Crowfoot  — późniejsza  laureatka  nagrody 
Nobla,  pedałowała  na  rowerze  do  laboratorium, 
w środku  nocy,  przez  uśpiony  Oxford,  aby  jeszcze 
raz  upewnić  się,  że  kryształ  insuliny  naprawdę  ugiął 
promieniowanie,  co  poprzedniego  dnia  zarejestrowała 
na  błonie  fotograficznej.  Historia  ta  dobrze  ilustruje 
wielkie  podniecenie,  jakie  opanowywało  badaczy 
w tamtych  czasach,  po  otrzymaniu  każdego  udanego 
rentgenogramu  białka.  Wspomniane  kryształy  pep- 
syny otrzymano  w Uppsali  w sposób  zupełnie  przy- 
padkowy z roztworu,  który  stał  w spokoju  przez  kilka 
tygodni.  Ilustruje  to  sposób,  w jaki  wybierano  obiekty 
do  badań  we  wczesnych  latach  rozwoju  krystalografii 
białek.  Badano  nie  te  białka,  które  były  najważniejsze 
z punktu  widzenia  ich  znaczenia  biologicznego,  ale 
te,  które  były  łatwo  dostępne  i które  można  było 
łatwo  wykrystalizować.  Upłynąć  musiało  następnych 
35  lat,  zanim  metody  krystalografii  białek  rozwinęły 
się  na  tyle,  żeby  można  było  ogłosić  drukiem  opis 
struktury  insuliny. 

W krystalografii  białek  tzw.  „problem  fazowy”  izomorficzne 
(->  Strukturalna  analiza  kryształów)  jest  szczególnie  pochodne 
trudny  ze  względu  na  złożoną  budowę  tych  cząste-  białek 
czek.  Trudności  te  pokonał  M.  von  Perutz  wraz  ze  z atomem 
współpracownikami  w laboratorium  L.  Bragga  ciężkim 
w Cambridge.  Wykazali  oni,  że  tzw.  „ciężki  atom”, 
np.  atom  rtęci,  można  wprowadzić  do  kryształu  białka 
bez  zakłócenia  sposobu  ułożenia  atomów  w krysztale, 
otrzymując  kryształ  pochodnej  izomorficznej,  który 
wykazuje  znaczne  i możliwe  do  zarejestrowania  zmia- 
ny intensywności  promieni  ugiętych.  Metoda  ta  do- 
prowadziła w 1960  r.  do  ustalenia  po  raz  pierwszy 
struktury  białka  — mioglobiny  przez  J.C.  Kendrew 
i współpracowników. 


Ograniczone  możliwości  krystalografii 
białek 

W krystalografii  białek  analiza  strukturalna  uwień- 
czona sukcesem  stanowi  dopiero  punkt  wyjściowy 
do  wielu  doświadczeń  mających  na  celu  wyświetlenie 
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ich  funkcji  biologicznych.  Należy  tu  wspomnieć 
o trudnościach  występujących  w badaniu  funkcji, 
jakie  spełniają  białka.  Po  pierwsze  białko  musi  być 
wykrystalizowane,  ażeby  w ogóle  można  je  było  ba- 
dać za  pomocą  dyfrakcji  promieni  rentgenowskich. 
Powstaje  problem,  czy  krystalizacja  białka  zmienia 
jego  strukturę?  Na  szczęście  odpowiedź  może  być 
przecząca,  jeśli  przyjmiemy,  że  struktura  w krysztale 
reprezentuje  trwałą  konformację  równowagową  czą- 
steczki. Siły,  które  utrzymują  cząsteczki  białka  w sieci 
krystalicznej,  są  o wiele  słabsze  niż  te  siły,  które  rzą- 
dzą strukturą  samego  białka  wskutek  mniejszej  liczby 
wpływ  kry-  kontaktów  międzyatomowych  między  cząsteczkami 
stalizacji  na  białka  niż  w obrębie  samej  cząsteczki.  Zatem  duże 
konformację  zmiany  konformacyjne  nie  są  prawdopodobne.  Nie- 
kiedy te  same  białka  wyizolowane  z różnych  orga- 
nizmów zwierzęcych  czy  roślinnych  lub  w ogóle  to 
samo  białko  wykrystalizowane  w bardzo  różniących 
się  warunkach  miało  struktury  bardzo  podobne.  Ma- 
łych różnic  konformacyjnych  pomiędzy  białkiem  kry- 
stalicznym a tym  samym  białkiem  w roztworze  nie 
można  wykluczyć,  chociaż  znany  jest  również  fakt, 
że  pewne  białka  zachowują  swoją  aktywność  biolo- 
giczną w krysztale.  W sytuacji,  kiedy  brakuje  infor- 
macji strukturalnych  na  temat  białek  w roztworach, 
musimy  akceptować  strukturę  krystaliczną  jako  punkt 
wyjściowy  do  interpretacji  zachowania  się  tej  czą- 
steczki w roztworze. 

Metoda  rentgenograficzna  jest  w swej  istocie  sta- 
tyczna, a procesy  biologiczne  są  w swej  istocie'' dyna- 
miczne. Eksperyment  rentgenograficzny,  który  wy- 
maga określonego  czasu  na  jego  przeprowadzenie, 
zwykle  kilku  dni,  dostarcza  obrazu  cząsteczki,  który 
jest  uśredniony  w tym  czasie.  Nie  można  za  pomocą 
jedynie  metody  rentgenograficznej  oznaczyć  struktur 
przejściowych  przyjmowanych  przez  cząsteczkę  białka 
w trakcie  spełniania  jej  funkcji  biologicznej.  Wyciąga- 
nie prawidłowych  wniosków  wymaga  ścisłej  współ- 
pracy z innymi  dyscyplinami  nauki.  Metody  magne- 
tycznego rezonansu  jądrowego  stale  ulepszane  stwa- 
rzają największe  szanse  badania  takich  struktur 
przejściowych. 


Etapy  badania  strukturalnego 
białek  krystalicznych 

Badanie  struktury  białka  składa  się  zwykle  z ośmiu 
etapów:  krystalizacja,  przygotowanie  izomorficznych 
pochodnych  z atomem  ciężkim,  zmierzenie  i zareje- 
strowanie intensywności  promieni  rentgenowskich 
ugiętych  na  krysztale  białka,  przetwarzanie  tych  da- 
nych w postać  nadającą  się  do  obliczeń,  określenie 
położeń  atomów  ciężkich,  obliczanie  faz,  interpretacja 
map  gęstości  elektronowej  i uściślenie  danych  doty- 
czących otrzymanych  współrzędnych  atomowych, 
krystalizacja  Krystalograf  musi  nie  tylko  wykrystalizować  białko, 

ale  także  wyhodować  kryształ  pokaźnych  rozmiarów. 
Jest  to  konieczne,  ponieważ  intensywności  promieni 
ugiętych  na  krysztale  są  mniej  więcej  proporcjonalne 
do  objętości  kryształu,  a odwrotnie  proporcjonalne 
do  objętości  krystalograficznej  komórki  elementarnej, 
która  nie  może  być  mniejsza  od  jednej  podjednostki 
białka.  Dla  białek  o masie  cząsteczkowej  poniżej 
50  000  daltonów,  kryształ  o wymiarach  liniowych 
0,1  mm  dałby  prawdopodobnie  obraz  dyfrakcyjny 
pozwalający  na  wydedukowanie  podstawowych  da- 
nych komórki  krystalograficznej.  Aby  pomyślnie 
wykonać  analizę  z wysoką  rozdzielczością,  konieczny 
jest  kryształ  o wymiarach  liniowych  co  najmniej 
0,3  mm.  Dla  białek  o większej  masie  cząsteczkowej 
wymagane  wymiary  są  większe.  Aby  zastosować  me- 
todę neutronograficzną  potrzebne  są  kryształy  o wy- 
miarach liniowych  3 mm  nawet  dla  najmniejszych 
białek.  Jedynie  metodami  mikroskopii  elektronowej 
można  badać  bardzo  małe  kryształy. 

Krystalizacja  białek  jest  zadaniem  bardzo  trudnym, 
gdyż  wiele  białek  jest  dostępnych  w bardzo  ma- 
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łych  ilościach.  W ostatnich  latach  rozwinięto  szereg 
nowych  metod  krystalizacji,  co  pozwala  na  wybór 
białek  do  badań  na  bardziej  racjonalnych  podsta- 
wach. 

Krystalizuje  się  białko  oczyszczone,  wyizolowane 
z odpowiedniego  materiału  biologicznego.  Trzeba  się 
starać,  aby  w miarę  możliwości  białko  pozostawało 
w postaci  biochemicznie  aktywnej.  Należy  zbadać 
zależność  rozpuszczalności  od  pH,  mocy  jonowej, 
rozpuszczalników  organicznych  i temperatury,  z 
uwzględnieniem  zależności  już  określonych  przez 
badania  biochemiczne.  Aby  zobrazować  skalę  trud- 
ności, z jakimi  spotykają  się  badacze  przytoczymy 
pracę  F.  Lynena  i współpracowników  nad  krystali- 
zacją syntetazy  kwasu  tłuszczowego  — wieloenzymo- 
wego  kompleksu  składającego  się  z siedmiu  białek 

0 całkowitej  masie  cząsteczkowej  2,3  x 106  daltonów. 

W preparacie,  który  przechowywano  przez  15  mie- 
sięcy w temperaturze  4°C,  zaobserwowano  obecność 
mikrokryształów.  Następnie  zmieniano  warunki  kry- 
stalizacji w sposób  systematyczny  w innych  prepara- 
tach, do  których  wprowadzano  te  mikrokryształy 
jako  zarodki  krystalizacji.  Ustalono  w ten  sposób 
optymalne  warunki,  w których  udało  się  wyhodować 
kryształy  w postaci  słupów  heksagonalnych  o wymia- 
rach liniowych  0,1  mm  w ciągu  2 dni. 

Nawet  jeżeli  udaje  się  wyhodować  kryształy,  to 
często  warto  kontynuować  badania  nad  innymi  wa- 
runkami krystalizacji,  w których  uda  się  może  otrzy- 
mać odmianę  polimorficzną  bardziej  odpowiednią 
do  badań  rentgenograficznych.  Tak  np.  praca  nad 
otrzymaniem  kryształów  chymotrypsynogenu  trwała 
przez  całe  lata,  na  skutek  otrzymywania  nieodpo- 
wiedniej odmiany  kryształów.  Otrzymano  dziesięć 
różnych  odmian  krystalicznych  enzymu  allosterycz- 
nego,  asparginianu  transkarbamylazy  (masa  czą- 
steczkowa 300  000  daltonów).  Odmianę  najbardziej 
odpowiednią  do  badań  znaleziono  przez  przypadek. 

Również  insulina  wykazuje  polimorfizm  postaci  kry- 
stalicznych. Odmiana  rombowa  otrzymywana  przy 
pH  < 7 jest  nietrwała  w temperaturze  pokojowej, 
trwała  jest  natomiast  odmiana  romboedryczna  wykry- 
stalizowana przy  pH  = 6,3. 

Wspomnieć  trzeba  nadto,  że  kryształy  białek  różnią 
się  jeszcze  i tym  od  kryształów  mniejszych 'cząsteczek 
organicznych,  że  zawierają  znaczną  ilość  ciekłego 
rozpuszczalnika  (rys.  1). 

Metoda  izomorficznego  podstawienia  została  po  metoda  izo- 
raz  pierwszy  zastosowana  przez  J.  M.  Robertsona  morficznego 

1 I.  Woodwarda  w 1937  r.  w ich  analizach  ftalocyja-  podstawienia 
nin/ 

Kryształy  białka  zawierają  duże  kanały  wypełnione 
roztworem  macierzystym.  Często  jest  możliwe  przy- 
łączenie ciężkiego  atomu  do  powierzchni  białka 
w ten  sposób,  że  nie  zakłóca  on  struktury  molekular- 
nej ani  krystalicznej,  ale  zajmuje  położenie  w jednym 
z tych  kanałów.  Wzdłuż  nich  atomy  ciężkie  dyfundują 
w głąb  natywnych  kryształów  białka.  Jeśli  atom  ciężki 
wykazuje  wystarczającą  „gęstość  elektronową”,  to 
zaobserwuje  się  zmiany  w obrazie  rentgenograficz- 
nym.  Na  przykład  wprowadzenie  atomu  rtęci,  który 
ma  80  elektronów,  do  białka  o masie  cząsteczkowej 
24  000  daltonów  powoduje  średnią  zmianę  inten- 
sywności o 40%.  Możliwe  do  interpretacji  mapy 
gęstości  elektronowej  kompleksu  nukleaza-inhibitor 
uzyskano  używając  tylko  jednej  pochodnej  izomor- 
ficznej, otrzymanej  przez  wprowadzenie  stosunkowo 
lekkiego  atomu  jodu  — zawierającego  46  elektro- 
nów. Większe  białka  wymagają  cięższych  atomów 
i stosuje  się  jony  kompleksowe  metali,  takie  jak 
[Ta6Clj2]2+,  [W6C18]4+  i inne.  Każdy  z czynników 
struktury  (-*  Strukturalna  analiza  kryształów)  po- 
chodnej zawierającej  atom  ciężki,  oznaczanych  jako 
/>/,  jest  wektorową  sumą  udziałów  białka  F i atomu 

ciężkiego  /.  Zatem  Fh  = F-h/.  Pierwszym  krokiem 
w analizie  jest  określenie  położenia  atomu  ciężkiego. 

Można  to  osiągnąć  za  pomocą  syntezy  Pattersona, 


w której  stosuje  się  jako  współczynniki  różnice 
(|F//|  — |F|)2.  Cząsteczki  białek  krystalizują  w nie- 
centrosymetrycznych  grupach  przestrzennych  (-> 
Kryształy),  jednak  pewne  dwuwymiarowe  rzuty 
funkcji  Pattersona  są  zwykle  centrosymetryczne. 
Ułatwia  to  bardzo  określenie  współrzędnych  atomu 
ciężkiego  na  takich  rzutach,  ponieważ  fazy  są  równe 
0 lub  180°  a wobec  tego  czynniki  struktury  przyjmują 
wartości  -f  jF|  lub  — |F|. 

Zwykle  nie  wystarcza  analizowanie  jednej  pochod- 
nej z atomem  ciężkim  i wymagane  jest  otrzymanie 
dwu  lub  więcej  takich  pochodnych.  Alternatywną 
metoda  ano-  metodą  określania  faz,  która  wymaga  zastosowania 
malnego  tylko  jednej  pochodnej  z atomem  ciężkim,  jest  wy- 
rozpraszania  korzystanie  zjawiska  anomalnego  rozpraszania. 

W normalnych  warunkach  obowiązuje  prawo  Frie- 
dela:  F{hkl)  = F(Jtkf)9  nawet  jeżeli  struktura  jest  nie- 
centrosymetryczna.  Oznacza  to,  że  niemożliwe  jest 
rozróżnienie  pomiędzy  dwiema  strukturami  enan- 
cjomerycznymi  (tzn.  mającymi  się  do  siebie  tak  jak 
przedmiot  i jego  odbicie  w lustrze,  albo  jak  dłoń  prawa 
w stosunku  do  lewej).  Jeśli  jednak  długość  fali  pro- 
mieniowania pierwotnego  jest  bardzo  zbliżona  do 
tzw.  progu  absorpcji  któregoś  atomu  w strukturze, 


Rys.  1.  Ułożenie  heksamerów  insuliny  w krysztale  romboedrycz- 
nej  insuliny  2-cynkowej.  Kryształ  składa  się  w istocie  z dwu  faz: 
stałej  składającej  się  z cząsteczek  białka  stykających  się  w kilku 
miejscach  i tworzących  otwartą  sieć  i wypełnionej  przez  fazę 
ciekłą.  Cząsteczki  rozpuszczalnika  przylegające  do  cząsteczek 
białka  wykazują  często  wysoki  stopień  uporządkowania  i są  po- 
wiązane silnymi  wiązaniami  wodorowymi  z powierzchniowymi 
grupami  polarnymi  białka.  Natomiast  rozpuszczalnik  wewnątrz 
dużych  kanałów,  które  mogą  mieć  szerokość  do  2 mm,  jest  nie- 
uporządkowany, tak  jak  to  bywa  w zwykłych  cieczach  (wg  Blun- 
della) 


wtedy  fala  ugięta  wykazuje  anomalne  przesunięcie 
fazy,  które  nieco  wyprzedza  fazę  normalną.  Powo- 
duje to  różnicę  intensywności  pomiędzy  refleksami 


Rys.  2.  Schemat  sposobu  wiązania  pochodnej  rtęci  z mioglobi- 
ną.  Dolna  część  okręgu  wyobraża  grupę  hemową.  Symbole 
w kółkach  oznaczają  aminokwasy  i ich  położenie  w łańcuchu 
polipeptydowym  (wg  H.  C.  Watsona  i in.) 

(h!d)  i (hkł).  D.M.  Blow  i M.G.  Rossmann  wykorzy- 
stali tę  metodę  do  analizy  hemoglobiny  i jej  pochodnej 
zawierającej  4 cząsteczki  HgCl2.  Na  rys.  2 jest  poka- 
zany schemat  wiązania  pochodnej  rtęci  z mioglobiną. 

Metoda  fotograficzna  ma  tę  wielką  zaletę,  że  re-  pomiar  inten- 
jestruje  się  przy  jej  użyciu  wielką  liczbę  promieni  sywności 
ugiętych  w jednym  eksperymencie,  ale  potem  trzeba  promieni 
zmierzyć  intensywność  każdej  plamki  na  wywołanej  ugiętych 
błonie  fotograficznej,  co  jest  zadaniem  żmudnym  krysztale 
i ogromnie  pracochłonnym.  Ta  wada  metody  foto-  białka 
graficznej  była  jednym  z powodów,  dla  których  zbu- 
dowano aparaty  do  bezpośredniego  pomiaru  inten- 
sywności promieni  ugiętych  metodą  rejestracji  licz- 
nikowej. Są  to  automatyczne  czterokołowe  dyfrakto- 
metry monokrystaliczne  sterowane  komputerami. 

Komputer  służy  do  obliczania  położeń  kątowych  kry- 
ształu i licznika  scyntylacyjnego  i przestawiania  ich 
w położenia  umożliwiające  zmierzenie  następnego 
refleksu.  Metoda  ta  wymaga  oddzielnego  zbadania 
każdego  maksimum  dyfrakcyjnego  i dlatego  zebranie 
danych  o intensywności  około  10  000  promieni  ugię- 
tych zajmuje  zwykle  kilka  dni.  W ciągu  tego  czasu 
kryształ  białka  podlega  naświetlaniu,  co  powoduje 
jego  nieodwracalne  uszkodzenie  radiacyjne.  Stanowi 
to  jeden  z głównych  problemów  dyfraktometrii  rent- 
genowskiej i zmusza  krystalografa  do  opracowania 
takiej  strategii  zbierania  danych  o intensywności  pro- 
mieni ugiętych,  która  pozwoli  zbierać  je  z żądaną  do- 
kładnością, a jednocześnie  zminimalizuje  czas  ekspo- 
zycji kryształu  w wiązce  promieni  rentgenowskich. 

W ostatnich  latach  starano  się  zaradzić  trudnościom 
badawczym  przez  opracowanie  nowych  aparatów 
i urządzeń  pomiarowych.  Skonstruowano  automa- 
tyczne mierniki  stopnia  zaczernienia  (gęstości  op- 
tycznej) plamek  na  rentgenogramach,  tzw.  densy- 
tometry i dyfraktometry  przystosowane  do  jedno- 
czesnej rejestracji  intensywności  trzech  do  pięciu 
refleksów,  co  oczywiście  skraca  całkowity  czas  po- 
miaru trzy  do  pięciu  razy.  Opracowano  także  nowe 
rodzaje  kamer  fotograficznch. 

Omówimy  jeszcze  krótko  etap  interpretacji  map  interpretacja 
gęstości  elektronowej  (map  Fouriera),  pomijając  po-  map 
zostałe  etapy  jako  zbyt  specjalistyczne.  Należy  tu  wy  gęstości 
jaśnić  pojęcie  rozdzielczości.  Najmniejsza  odległość  elektronowej 
r,  która  może  być  rozróżniona  na  obrazie  uzyskanym 
za  pomocą  promieni  rentgenowskich,  jest  określona 
przez  wyrażenie : 

r OJldm  = 0,712/2sin  0(max), 
gdzie  sin  0(max)  oznacza  maksymalną  wartość 
sin  6 (0  — kąt  odbłysku  Bragga)  dla  refleksów  uży- 


tych  do  obliczenia  sum  Fouriera,  a dm  jest  odpo- 
wiednią minimalną  odległością  międzypłaszczyznową. 
Możliwa  do  osiągnięcia  rozdzielczość  dla  kryształów 
białek  jest  ograniczona  przez  wyżej  wspomniane  nie- 
uporządkowanie statyczne  i termiczne.  W praktyce 
rozdzielczość  krystalografii  białek  przyjęło  się  podawanie  nominal- 
mapv  nej  rozdzielczości  mapy  gęstości  elektronowej  jako 
dmy  tzn.  minimalnej  odległości  międzypłaszczyzno- 
wej,  dla  której  wartości  czynników  struktury  F są 
włączone  w szeregi  Fouriera.  Terminy  „rozdzielczość 
6 A”  (tzn.  niska)  i „rozdzielczość  2,0  A”  (tzn.  wyso- 
ka) użyte  przy  podawaniu  danych  oznaczają,  że  dane 
dyfrakcyjne  zostały  zebrane  do  granicy  tej  właśnie 
od  ległości  międzypłaszczyznowej . 

Po  rozwiązaniu  problemu  fazowego  można  obliczyć 
syntezę  Fouriera  i wykreślić  mapę  gęstości  elektro- 
nowej, na  której  krystalograf  stara  się  zidentyfikować 
położenie  atomów.  Gdy  cząsteczki  są  małe,  mapa  gę- 
stości elektronowej  może  być  obliczona  przy  wysokiej 
rozdzielczości  1 A lub  nawet  wyższej  i interpretacja 
takiej  mapy  jest  zupełnie  prosta.  Wspomniane  już 
nieuporządkowanie  w krysztale  białek  może  być  tak 
duże,  iż  najlepsza  możliwa  rozdzielczość  wyniesie  je- 
dynie 2 lub  3 A.  Zwykle  można  zidentyfikować  głów- 
ny łańcuch  polipeptydowy,  gdy  rozdzielczość  wyno- 
si 3 A,  ale  nie  pozwala  ona  na  rozróżnienie  pojedyn- 
czych atomów. 

Przy  rozdzielczości  2 A jest  możliwe  zidentyfiko- 
wanie raczej  grup  niż  indywidualnych  atomów.  Jeżeli 
jest  znana  szczegółowa  struktura  chemiczna  białka, 
tj.  kolejność  aminokwasów  wzdłuż  łańcucha  polipep- 
tydowego,  wtedy  odpowiednie  łańcuchy  boczne  można 
szybko  rozpoznać.  Jeśli  taka  wstępna  budowa  che- 
miczna jest  znana  tylko  częściowo  albo  nie  znana 
wcale,  wtedy  jest  konieczne  zidentyfikowanie  poszcze- 
gólnych aminokwasów  wprost  z mapy  gęstości  elek- 
tronowej. Cztery  aminokwasy:  tryptofan,  fenyloala- 
nina,  tyrozyna  i histydyna  posiadają  aromatyczne 
łańcuchy  boczne,  które  można  zwykle  łatwo  rozpo- 
znać. Tryptofan  wyróżnia  się  swoimi  rozmiarami, 
a fenyloalanina  jest  zwykle  ulokowana  w obszarach 
hydrofobowych  białka.  Polarny  charakter  tyrozyny 
i histydyny  sugeruje,  że  są  one  najprawdopodobniej 
ulokowane  w obszarach  hydrofitowych.  Aminokwasy 
zawierające  siarkę  są  zwykle  łatwo  rozróżnialne  z po- 
wodu rozmiarów  atomu  siarki. 

Wiele  innych  aminokwasów  można  grupować  wg 
ich  kształtu.  Walina  i treonina  odgałęziają  się  od  ato- 
mu Q,  podczas  gdy  leucyna,  kwas  asparaginowy 
i asparagina  odgałęziają  się  od  atomu  Cy  itd.  Uwagi 
powyższe  ilustrują  sposób,  w jaki  wiedza  chemiczna 
może  być  spożytkowana  w tego  rodzaju  rozważa- 
niach. Interesującym  przykładem  takiej  analizy  może 
być  interpretacja  mapy  gęstości  elektronowej  wyko- 
struktura  nana  przez  W.  N.  Lipscomba  i współpracowników 
karboksy-  Harvard  University  w trakcie  ich  pracy  nad  strukturą 
peptydazyA  enzymu  trawiennego  karboksypeptydazy  A.  Znano 
kolejność  aminokwasów  w kilku  fragmentach  en- 
zymu, ale  brakowało  pewnych  części  i nie  była  znana 
kolejność  fragmentów.  W.N.  Lipscomb  zapropono- 
wał na  podstawie  badań  rentgenograficznych  kom- 
pletną kolejność  dla  307  reszt  aminokwasowych. 
Nieco  później  biochemik  H.  Neurath  opublikował 
kolejność  aminokwasów  w tym  enzymie,  określoną 
metodami  chemicznymi.  Porównanie  wyników  wy- 
kazało, że  fragmenty  zostały  poprawnie,  co  do  ko- 
lejności, ulokowane  na  mapie  gęstości  elektronowej, 
ale  liczba  znanych  fragmentów  wynosiła  214  na  ogólną 
liczbę  307  aminokwasów.  W.N.  Lipscomb  oznaczał 
pozostałe  93  reszty  i okazało  się,  że  zidentyfikował 
on  60%  z nich  (tj.  56  reszt)  poprawnie.  37  niepopraw- 
nie określonych  reszt  wynikało  z pomylenia  waliny 
z treoniną,  leucyny  z kwasem  asparaginowym  i pew- 
nych innych  błędów.  Zatem  identyfikacja  łańcuchów 
bocznych  aminokwasów  nie  jest  w żadnym  razie 
jednoznaczna  i trzeba  w rozważaniach  brać  po  uwagę 
czynniki  stereochemiczne,  otoczenie  miejscowe  i wiele 
innych  aspektów. 


Interesujące  jest  badanie  struktury  papainy  — pro- 
teazy  roślinnej,  dla  której  chemicy  błędnie  określili  ko- 
lejność aminokwasów,  a co  można  było  poprawić  do- 
piero po  przestudiowaniu  mapy  gęstości  elektronowej. 

Interpretację  map  gęstości  elektronowej  przepro- 
wadza się  za  pomocą  porównywania  w specjalnych 
urządzeniach  (rys.  3)  modeli  zbudowanych  w skali 


źródło  światła  zwierciadło  półprzepuszczalne 
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Rys.  3.  Urządzenie  optyczne  do  porównywania  modelu  moleku- 
larnego z mapami  Fouriera  gęstości  elektronowej:  a)  lustro  pod 
kątem  45°  do  map  gęstości  elektronowej,  b) lustro  równoległe  do 
map  gęstości  elektronowej  (wg  T.  L.  Bundella,  L.  N.  Johnsona) 


2 cm/A  z otrzymanym  obrazem  gęstości  elektrono- 
wej. Urządzenie  takie,  znane  wśród  krystalografów  skrzynka 
pod  popularną  nazwą  skrzynki  albo  pudła  Richardsa,  Richardsa 
zaprojektował  F.M.  Richards  z Yale  University. 

Arkusze  z przezroczystego  materiału  z narysowanymi 
na  nich  cięciami  trójwymiarowej  mapy  gęstości  elek- 
tronowej Jnontuje  się  pionowo  w zaciemnionej  części 
urządzenia.  Następnie  oświetla  się  wybrane  cięcie 
mapy  albo  jego  część  i pozorny  obraz  oświetlonego 
obrazu  rzuca  się  za  pomocą  półprzepuszczalnego 
lustra  na  obszar,  w którym  odbywa  się  budowanie 
modelu.  Można  w ten  sposób  studiować  określoną 
część  mapy,  a budowanie  modelu  jest  bardzo  ułat- 
wione dzięki  porównaniu  z pozornym  obrazem 
gęstości  elektronowej. 

Rozwinięto  również  metody  komputerowe,  które 
umożliwiają  jednoczesną  projekcję  mapy  i modelu 
na  monitorze  (odmiana  kineskopu  telewizyjnego). 

Pozwala  to  na  konstruowanie  precyzyjnego  i stereo- 
chemicznie uzasadnionego  modelu  łańcucha  polipep- 
tydowego.  Niedogodnością  jest  tutaj  przedstawienie 
trójwymiarowej  struktury  w postaci  dwuwymiarowe- 
go obrazu. 

Lista  analiz  strukturalnych  białek  globularnych 
opublikowanych  w literaturze  naukowej  do  1976  r. 
liczy  około  90  pozycji  (w  tym  m.in.  48  enzymów, 

7 globin,  14  układów  redoksowych,  5 hormonów,  8 
immunoglobin).  Liczba  zbadanych  białek  jest  niższa, 
gdyż  wiele  zespołów  pracowało  nad  takimi  samymi 
obiektami.  Analizy  te  są  wynikiem  wytężonej  pracy 
dużych  zespołów  uczonych  przy  zaangażowaniu 
znacznych  środków  materialnych.  Uzyskano  je  w sto- 
sunkowo krótkim  czasie  — w ciągu  ośmiu  lat,  poczy- 
nając od  roku  1968. 
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hemoglobina 


Przykładowe  analizy  bratek 


Przez  lata  hemoglobina  była  obiektem  szczególnego 
zainteresowania  chemików,  biochemików  i fizjolo- 
gów. To  łatwo  dostępne  białko  stanowiące  główny 
składnik  czerwonych  ciałek  krwi  (il.  115,  tabl.  28),  jest 
niezwykle  ważne  pod  względem  fizjologicznym,  ponie- 
waż zapewnia  transport  tlenu  z płuc  arteriami  do  tka- 
nek i transport  C02  żyłami  z powrotem  do  płuc.  He- 
moglobina ssaków  jest  złożona  z czterech  podjednostek 
(->  Białka),  które  są  parami  identyczne.  Każda  jedno- 
stka zawiera  1 atom  Fe  usytuowany  w środku  grupy 
hemowej,  zawierającej  pierścień  porfirynowy  (rys.  4). 

W.  Conant  stwierdził  już  w 1926  r.,  iż  żelazo  pozo- 
staje w postaci  dwuwartościowych  jonów  żelazawych 
podczas  odwracalnego  pobierania  tlenu,  natomiast 
w roztworze  bez  białka,  żelazo  grupy  hemowej  utlenia 
się  raptownie  do  stanu  trójwartościowego.  Krzywa 
wiązania  tlenu  do  hemoglobiny  ma  charakterystyczny 
kształt  esowaty,  który  pokazuje,  że  powinowactwo  do 
tlenu  zależy  od  liczby  cząsteczek  tlenu  już  związanych. 
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Rys.  4.  Grupa  hemowa  jest  zasadniczym  składnikiem  hemoglo- 
bin, cytochromów  i enzymów,  takich  jak  kataliza  i peroksydaza 
(wg  T.  L.  Bundella,  L.  N.  Johnsona) 


Powinowactwo  do  tlenu  zależy  również  od  stężeń  in- 
nych metabolitów,  takich  jak  jony  wodorowe  i fosfo- 
rany organiczne,  które  nie  są  związane  z substratem. 


Rys.  5.  Porównanie  różnych  struktur  mioglobin  i hemoglobin 
pokazujące  pofałdowanie  charakterystyczne  dla  mioglobin.  To 
pofałdowanie  jest  względnie  stałe  dla  ssaków,  owadów  i globin 
wyizolowanych  z pierścienic.  Pokazane  są  tylko  atomy  a węgla: 
a)  łańcuch  a hemoglobiny  końskiej,  b)  łańcuch  fi  hemoglobiny 
końskiej,  c)  mioglobina  kaszalota.  d)  hemoglobina  minogi  mor- 
skiej, e)  hemoglobina  gatunku  Chironomus , f)  hemoglobina  ga- 
tunku Glycera  (wg  Love’a) 


Hemoglobina  stawia  zatem  szczególne  problemy ; po 
pierwsze,  w jaki  sposób  otoczenie  białkowe  kontroluje 
własności  atomu  żelaza,  i po  drugie,  jak  związanie 
tlenu  przez  jedną  z grup  hemowych  wpływa  na  po- 
winowactwo do  tlenu  sąsiedniej  grupy  hemowej.  Ba- 
dania strukturalne  dostarczyły  odpowiedzi  na  te  py- 
tania. Analiza  hemoglobiny  i spokrewnionych  z nią 
białek  monomerycznych  wykazała,  że  hem  jest  umiesz- 
czony w hydrofobowej  kieszeni  na  powierzchni  białka, 
zapewniającego  środowisko  o niskiej  stałej  dielek- 
trycznej, w którym  nasycenie  tlenem  jest  faworyzo- 
wane, a utlenianie  zachodzi  trudno.  Odwracalne  łą- 
czenie się  tlenu  z grupą  hemową  powoduje  zmianę 
stanu  elektronowego  żelaza  — przejście  z wysoko- 
spinowego  stanu  paramagnetycznego  do  niskospino- 
wego  stanu  diamagnetycznego. 

M.  von  Perutz  w swoich  badaniach  rentgenogra- 
ficznych  hemoglobiny  wykazał,  że  te  współdziałające 
efekty  są  wyzwalane  przez  niewielkie  ruchy  atomu 
żelaza  względem  pierścienia  porfirynowego,  które 
mają  miejsce  w trakcie  pobierania  tlenu  i towarzyszą 
zmianie  stanu  spinowego  żelaza.  Te  przesunięcia  ato- 
mu żelaza  są  przenoszone  do  innych  części  cząsteczki, 
tak  że  więzy  trzymające  białko  w stanie  dezoksy  (od- 
tlenionym)  zostają  rozluźnione  i dzięki  temu  następna 
podjednostka  może  łatwiej  pobrać  tlen. 

Strukturalne  badania  białek  rozszerzyły  naszą  wie- 
dzę o procesach  ewolucji.  Stwierdzono  m.in.,  że  lizo- 
zym  ludzki  i kurzy,  cytochromy  c:  koński,  makreli 
i tuńczyka  oraz  hemoglobiny:  ludzka,  końska,  owa- 
dzia, minogi  morskiej  i ochotki  tworzą  szereg  homo- 
logiczny, tzn.  że  rozwinęły  się  one  ze  wspólnego  przod- 
ka — enzymu.  Badania  strukturalne  wykazują,  że 
zmiany  aminokwasów,  szczególnie  w obszarze  miejsca 
aktywnego,  mają  mały  wpływ  na  strukturę.  Szereg 
struktur  hemoglobin  i mioglobin  pokazany  jest  na  rys. 
5.  Ogólna  struktura  i umieszczenie  hemu  zostały  w 
wysokim  stopniu  zachowane  w trakcie  ewolucji. 

C.  C.  F.  Blake  Adv.  in  Protein  Chem.  23,  59  (1968);  D.  M. 
Blow,  T.  A.  Steitz  Am.  Rev.  of  Biochem.  39,  63  (1970);  T.  L. 
Blundell,  L.  N.  Johnson  Protein  Crystałography , New  York 
1976;  J.  P.  Glusker,  K.  N.  Trueblood  Zarys  rentgenografii 
kryształów , Warszawa  1977;  D.  Sherwood  Crystals.  X-rays  and 
Proteins,  London  1976. 


Kryształy  ciekłe 

Antoni  Adamczyk 

W artykule  wykorzystano  materiały  udostępnione  przez 
prof  Mariana  Mięso  wieża.  Za  zgodę  na  ich  wykorzy- 
stanie autor  składa  prof.  Mięsowiczowi  serdeczne  po- 
dziękowanie. 


Ciekłe  kryształy,  odrębny  stan  materii 

Ciekłe  kryształy  są  oryginalnym  rodzajem  cieczy,  któ- 
rej cechą  wyróżniającą  jest  anizotropia  własności  fi- 
zycznych. Przez  anizotropię  rozumiemy,  jak  zwykle, 
zależność  przebiegu  zjawiska,  tzn.  zależność  mierzo- 
nej wielkości  fizycznej  od  kierunku,  w którym  wyko- 
nujemy pomiar  lub  od  kierunku  działania  czynnika 
wywołującego  zjawisko.  Anizotropia  — typowa  cecha 
wielu  kryształów,  nigdy  nie  występuje  w cieczach. 
Wyjątkiem  są  ciekłe  kryształy,  nazywane  z tego  po- 
wodu także  cieczami  anizotropowymi  lub  mezo- 
morficznymi  (o  budowie  pośredniej  między  cieczami 


a kryształami).  Ciekłe  kryształy  powstają  po  stopieniu 
pewnych  substancji  krystalicznych  lub  wtedy,  gdy  w 
rozpuszczalniku  o zdecydowanie  określonym  typie 
rozpuszczalności  (polarnym  lub  niepolarnym)  rozpuś- 
cimy substancję  wykazującą  obydwa  typy  rozpuszcza- 
lności, czyli  tzw.  substancję  amfifilową.  W pierwszym 
wypadku  ciekłe  kryształy  nazywamy  termotropowymi, 
w drugim  zaś  — liotropowymi.  Tak  termotropowe, 
jak  i liotropowe  ciekłe  kryształy  przechodzą  do  stanu 
zwykłej  cieczy  izotropowej  po  podgrzaniu  ich  do  od- 
powiedniej temperatury.  W chwili  obecnej  największe 
znaczenie  praktyczne  mają  ciekłe  kryształy  termotro- 
powe i do  nich  tylko  ograniczymy  nasz  przegląd. 

W trakcie  ogrzewania  kryształu  substancji  mogącej 
posiadać  fazę  mezomorficzną  powstaje  najpierw  ciekły 
kryształ,  a następnie  w wyższej  temperaturze  przecho- 
dzi on  w stan  cieczy  izotropowej.  Przedział  temperatu- 

Fazy  upadku  kropli  ciekłego  kryształu  na  powierzchnię  tej  samei 
substancji 
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ry,  w którym  istnieje  faza  mezomorficzna,  czyli  prze- 
dział między  temperaturą  powstania  ciekłego  kryszta- 
łu i temperaturą  jego  przejścia  w ciecz  izotropową,  za- 
leży od  rodzaju  substancji  i może  wynosić  bądź  uła- 
mek stopnia,  bądź  też  kilkadziesiąt,  a nawet  100  stop- 
ni. W czasie  ochładzania  takiej  substancji  z cieczy  izo- 
tropowej powstaje  najpierw  ciekły  kryształ,  który  przy 
dalszym  ochładzaniu  ulega  zwykłej  krystalizacji. 
Temperatury  wymienionych  przejść  fazowych,  zare- 
jestrowane w czasie  ogrzewania  i w czasie  chłodzenia, 
na  ogół  nie  pokrywają  się  ze  sobą.  Może  się  również 
zdarzyć,  że  po  stopieniu  kryształu  powstaje  od  razu 
ciecz  izotropowa  i dopiero  w czasie  jej  ochładzania 
pojawia  się  faza  mezomorficzna  (zawsze  poniżej  tem- 
peratury topnienia).  Takie  przejście  do  stanu  mezo- 
morficznego,  występujące  tylko  w czasie  chłodzenia, 
przejście  nosi  nazwę  przejścia  monotropowego.  Przez  wiele  lat 
monotro-  po  odkryciu  ciekłych  kryształów  znano  tylko  substan- 
powe  cje,  których  temperatura  przejścia  fazowego  w stan 
mezomorficzny  była  znacznie  wyższa  od  temperatury 
pokojowej,  zwykle  powyżej  100°C.  Dopiero  w ostat- 
nich latach  udało  się  otrzymać  substancje,  które  wy- 
stępują w stanie  mezomorficznym  już  w temperaturze 
pokojowej,  a nawet  w niższej.  Odpowiednio  dobrane 
mieszaniny  mogą  być  ciekłymi  kryształami  w tempe- 
raturze — 50°C,  inne  natomiast  pozostają  ciekłymi 
kryształami  jeszcze  w temperaturze  +300°C. 

Ciekłe  kryształy  znalazły  liczne  zastosowania  w róż- 
nych dziedzinach  nauki  i techniki.  Same  jednak  włas- 
ności tych  niezwykłych  cieczy  stanowią  pole  bardzo 
atrakcyjnych  prac  badawczych. 


Trochę  historii 


Chemiczne  własności  substancji  ciekłokry- 
stalicznych i ich  struktura  molekularna 

Istotną  cechą  substancji,  które  mogą  występować  jako  wydłużony 
ciekłe  kryształy,  jest  wydłużony  kształt  ich  molekuł,  kształt 
tak  jak  to  widać  na  przykładach  przedstawionych  na  molekuł 
rys.  1.  U dołu  rys.  1 zamieszczono  schemat  budowy 


o 


p-azoksyanizol  (PAA) 


4-n-  butylo-  N-  (4  -metoksybenzylideno)  - anilina  (MBBA) 
CN 

oktylocyjanodwufenyl  (OCB) 


Rys.  1.  Wzory  strukturalne  kilku  prostych  molekuł  substancji 
ciekłokrystalicznych  i ogólny  schemat  ich  budowy 


badanie  włas- 
ności optycz- 
nych, elek- 
trycznych i 
magnetycz- 
nych 


Ciekłe  kryształy  zostały  odkryte  już  w 1888  r.  przez 
austriackiego  botanika  F.  Reinitzera,  który  zaobser- 
wował pod  mikroskopem  polaryzacyjnym  istnienie 
cieczy  wykazujących  dwójłomność  optyczną.  W rok 
później  O.  Lehmann  stwierdził,  że  oryginalna  ciecz 
jest  nowym  stanem  materii  i nazwał  tę  ciecz  ciekłym 
kryształem. 

Historia  rozwoju  badań  ciekłych  kryształów  notuje 
trzy  okresy  rozkwitu.  Pierwszy  okres  to  lata  wkrótce 
po  ich  odkryciu.  Substancjami  tymi  zajmowali  się 
wtedy  głównie  chemicy.  Przeprowadzono  syntezy  wie- 
lu nowych  związków  chemicznych,  mających  fazy  me- 
zomorficzne  i obserwowano  prawidłowości  przemian 
fazowych. 

Następny  okres  — to  dwudziestolecie  międzywojen- 
ne, kiedy  to  pojawiły  się  m.in.  prace  G.  Friedela  na 
temat  własności  optycznych  ciekłych  kryształów. 
W wyniku  tych  prac  G.  Friedel  zaproponował,  do  dziś 
obowiązujący,  podział  na  ciekłe  kryształy  nematyczne, 
smektyczne  i cholesterolowe.  Wtedy  także  badano 
własności  elektryczne  i magnetyczne  ciekłych  kryszta- 
łów i znaleziono  m.in.  tak  ważną  dla  obecnych  zasto- 
sowań łatwość  orientowania  się  tych  substancji  w ze- 
wnętrznych polach  elektrycznych  i magnetycznych. 
Warto  wzmiankować,  że  w owym  okresie  w Polsce 
(Kraków)  intensywnie,  jak  na  owe  czasy,  rozwijały 
się  badania  nad  ciekłymi  kryształami.  Mamy  tu  na 
myśli  pionierskie  badania  M.  Jeżewskiego  nad  prze- 
nikatnością  elektryczną  ciekłych  kryształów  oraz  ba- 
danie ich  przewodnictwa  elektrycznego  i wpływu  na 
nie  pola  elektrycznego  i magnetycznego  (M.  Jeżewski, 
M.  Mięsowicz).  O polskich  pracach  nad  anizotropią 
lepkości  ciekłych  kryształów  będzie  mowa  dalej. 

Obecny  okres  rozkwitu,  trwający  od  ok.  10  lat,  wią- 
że się  z szerokim  zastosowaniem  ciekłych  kryształów 
w technice  i ze  zrozumieniem  roli  tych  substancji  w or- 
ganizmach żywych.  Szeroko  bada  się  i stosuje  własno- 
ści optyczne  i elektrooptyczne  ciekłych  kryształów, 
bada  się  także  ich  udział  w procesach  biologicznych. 
Dotychczas  zsyntezowano  ok.  7 tys.  związków  ciekło- 
krystalicznych i ciągle  pojawiają  się  doniesienia  o od- 
kryciu nowych  takich  substancji,  a nawet  całych  ich 
grup. 


częściej  spotykanych  związków  ciekłokrystalicznych. 
Zwykle,  chociaż  nie  jest  to  sztywna  reguła,  molekuła 
taka  składa  się  z dwu  pierścieni  benzenowych,  połą- 
czonych ze  sobą  bezpośrednio  lub  za  pośrednictwem 
środkowej  grupy  atomów  X i przeciwległe  (w  położe- 
niu para-)  przyłączonych  grup  końcowych  Y i Y'. 
Spotyka  się  także  bardziej  skomplikowaną  budowę 
molekuł.  Jako  przykład  mogą  służyć  popularne  estry 
cholesterolu,  np.  pelargonian  cholesterylu,  którego 
wzór  strukturalny  jest  przedstawiony  na  rys.  2. 


Rys.  2.  Wzór  strukturalny  molekuły  cholesterolowego  ciekłego 
kryształu  — pelargonianu  cholesterylu 


Wydłużenie  molekuł  substancji  mezomorficznych, 
czyli  stosunek  długości  molekuł  do  ich  szerokości,  wy- 
nosi 6 i więcej.  Na  przykład,  długość  molekuły  p- azo- 
ksyanizolu  z rys.  1 wynosi  2 nm,  zaś  jej  szerokość  — 

0,3-0,4  nm. 

Pod  względem  struktury  ciekłe  kryształy  dzielimy 
na  trzy  zasadnicze  typy : 

ciekłe  kryształy  nematyczne,  w których  molekuły  struktura 
pozostają  względem  siebie  równoległe  i nie  mają  żad-  nematyczna 
nych  dodatkowych  ograniczeń  we  wzajemnym  przesu- 
waniu się  (rys.  3a); 

ciekłe  kryształy  smektyczne,  w których  równoległe  struktura 
względem  siebie  molekuły  są  rozmieszczone  warstwa-  smektyczna 
mi,  zaś  długie  osie  tych  molekuł  pozostają  prostopadłe 
lub  nieco  nachylone  względem  tych  warstw  (rys.  3b); 

ciekłe  kryształy  cholesterolowe,  w których  moleku- 
ły są  także  rozmieszczone  warstwowo,  ale  w ten  spo- 
sób, że  ich  długie  osie,  pozostając  wzajemnie  równo- 
ległe, są  jednocześnie  równoległe  do  warstw.  Wszyst- 
kie molekuły  z warstwy  następnej  są  skręcone  o pe-  struktura 
wien  stały  kąt  względem  molekuł  leżących  w warstwie  cholestero- 
poprzedniej  (rys.  3c).  Wynikiem  takiego  skręcenia  jest  Iowa 
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struktura 

śrubowa 


Rys.  3.  Struktura  ciekłych  kryształów:  a)  typ  nematyczny, 
b)  typ  smektyczny,  c)  typ  cholesterolowy 

swoista  struktura  śrubowa  o niesłychanie  ciekawych 
własnościach  optycznych. 

Każdy  z tych  trzech  typów  struktur  rozpada  się  na 
kilka  rodzajów,  różniących  się  szczegółami  w upo- 
rządkowaniu molekuł.  Tak  więc,  wyróżnia  się  trzy 
rodzaje  nematyków,  dwa  rodzaje  cholesterolowych 
ciekłych  kryształów  i kilkanaście  rodzajów  smekty- 
ków. 

Geneza  słowa  „nematyk”  bierze  początek  od  grec- 
kiego itema  — 'nić’.  Nazwa  struktury  nematycznej  zo- 
stała wyprowadzona  od  charakterystycznych,  ruchli- 
wych nici  widocznych  pod  mikroskopem  i będących 
zaburzeniami  struktury.  Smektyki  wzięły  nazwę  od 
greckiego  słowa  smektos  — 'mydlany’,  ponieważ  ich 
mętność  i lepkość  przypomina  stężone  roztwory  myd- 
ła. Nazwa  cholesterolowych  ciekłych  kryształów  po- 
chodzi od  estrów  cholesterolu,  u których  ten  typ 
struktury  po  raz  pierwszy  zaobserwowano. 


Niektóre  substancje  mają  więcej  niż  jedną  fazę  cie- 
kłokrystaliczną. Jest  to  tzw.  polimezomorfizm.  Istnie- 
ją substancje,  w których  występuje  kilka  faz  smek- 
tycznych,  u innych  występuje  najpierw  faza  smektycz- 
na,  zaś  w wyższych  temperaturach  — nematyczna  lub 
cholesterolowa  itd.  W toku  ogrzewania  substancji 
faza  smektyczna,  jeżeli  występuje  w ogóle,  to  wystę- 
puje zawsze  jako  pierwsza,  zaś  fazy  nematyczna  i cho- 
lesterolowa pojawiają  się  dopiero  w wyższych  tempe- 
raturach i poprzedzają  przejście  substancji  do  stanu 
cieczy  izotropowej.  W substancjach  jednoskładniko- 
wych fazy  nematyczna  i cholesterolowa  nawzajem  się 
wykluczają,  tzn.,  że  jeżeli  w jakiejś  substancji  wystę- 
puje faza  cholesterolowa,  to  tej  substancji  nie  można 
przeprowadzić  do  fazy  nematycznej  w drodze  zmian 
temperatury. 


Temperatury  przejść  fazowych  kilku  substancji  ciekło- 
krystalicznych (w  °C) 


Substancja 

Tk-n 

Tk-s 

Ts-c/ij 

j Ts-n 

Tn-i 

Tch-i 

p-azoksyanizol  (PAA) 

118 



i 

135 

___ 

4-/i-butylo-Ar-(4-me- 
toksybenzylideno)- 
anilina  (MBBA) 

22 

47 

pciargonian  cho- 
lesterylu  (CN) 

— 

74 

81 

— 

— 

93 

oktylocyjanodwufc- 
nyl  (OCB) 

21 

32 

40 

40 

Poniżej  przedstawiono  tabelę  zawierającą  tempera- 
tury przejść  fazowych  kilku  popularnych  substancji 
ciekłokrystalicznych.  Obok  nazwy  każdej  z nich 
umieszczono,  zwyczajowo  używane,  skróty  ich  nazw 
angielskich.  Temperaturę  przejścia  z fazy  stałej  do  fazy 
nematycznej  oznaczono  przez  Tk~n,  z fazy  nematycz- 
nej do  izotropowej  przez  Tn-i9  z fazy  stałej  do  smek- 
tycznej  przez  Tk-s>  z fazy  smektycznej  do  cholestero- 
lowej przez  Ts-cHy  z fazy  smektycznej  do  nematycz- 
nej przez  Ts-n  oraz  z fazy  cholesterolowej  do  izotro- 
powej przez  Tch-i . Kreska  w kolumnie  oznacza,  że 
odpowiednie  przejście  fazowe  nie  występuje  w danej 
substancji. 


Model  domenowy  a model  ośrodka  ciągłego 
(model  continuum) 

Anizotropowe  własności  ciekłych  kryształów  wynika- 
ją ze  wzajemnie  równoległego  ustawienia  się  wydłu- 
żonych molekuł.  Jest  intuicyjnie  oczywiste,  że  grupa 
równoległych  względem  siebie  molekuł  będzie  miała 
inne  własności  wzdłuż  długich  osi  molekuł,  inne  zaś 
w kierunku  osi  krótkich.  W dużej  objętości  ciekłego 
kryształu  kierunek  uporządkowania  molekuł  ma  cha- 
rakter jedynie  lokalny.  Można  więc  przyjąć  hipotezę, 
że  molekuły  tworzą  ziarniste  skupiska  (domeny)  i kie- 
runek uporządkowania  molekuł  w sąsiednich  dome- 
nach jest  różny.  Na  podstawie  danych  doświadczal- 
nych obliczono,  że  liczba  jednakowo  zorientowanych 
molekuł,  tworzących  hipotetyczną  domenę,  jest  rzędu 
106.  Rozmiary  domen  są  więc  porównywalne  z dłu- 
gością fali  świetlnej  i dlatego  światło  przechodzące 
przez  warstwę  ciekłego  kryształu  jest  silnie  rozpra- 
szane. Ten  mechanizm  może  tłumaczyć  istnienie  męt- 
ności charakterystycznej  dla  wszystkich  ciekłych  kry- 
ształów. 

Molekuły  w cieczach  mają  dużą  swobodę  przemiesz- 
czania się  w przestrzeni,  mogą  więc  bardzo  łatwo 
przechodzić  z jednej  domeny  do  drugiej.  Ta  wymiana 
molekuł  powoduje,  że  granice  domen  są  silnie  roz- 
myte. Wydaje  się  zatem,  że  bardziej  odpowiednim 
modelem  nematycznego  ciekłego  kryształu  jest  model 
ośrodka  ciągłego  (model  continuum).  W tym  modelu 
kierunek  uporządkowania  molekuł  zmienia  się  w spo- 
sób ciągły  w przestrzeni,  mimo  że  nadal  zostaje  za- 
chowane dalekie  uporządkowanie  między  tymi  mole- 
kułami. „Dalekie”  znaczy  tutaj  rozciągające  się  na  od- 


połimezo- 

morfizm 


przejścia 

fazowe 


model 

domenowy 
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ległości  duże  w porównaniu  z rozmiarami  samych  mo- 
lekuł. Różnicę  między  modelem  domenowym  i mo- 
delem continuum  widać  ze  szkiców,  przedstawionych 
na  rys.  4.  Wiele  zjawisk  optycznych  i hydrodynamicz- 


model  domenowy 


model  ciągły 


Rys.  4.  Model  domenowy  i model  ośrodka  ciągłego  (continuum) 


nych  świadczy  o poprawności  raczej  modelu  conti- 
nuum, chociaż  na  gruncie  modelu  domenowego  łatwo 
można  wytłumaczyć  kolektywny  charakter  oddziały- 
wania ciekłego  kryształu  z polami  elektrycznymi 
i magnetycznymi.  Chodzi  o to,  że  energia  oddziały- 
wania pojedynczej  molekuły  z polem  jest  o kilka  rzę- 
dów wielkości  za  mała,  aby  móc  przeciwdziałać  nisz- 
czącemu działaniu  ruchów  termicznych.  Jeżeli  jednak 
przyjąć,  że  pole  działa  nie  na  jedną  molekułę,  lecz  na 
cały  ich  zbiór  zawarty  w domenie,  to  już  można  wy- 
jaśnić, dlaczego  orientujące  działanie  wywierają  pola 
o stosunkowo  niewielkich  natężeniach  (zob.  niżej). 

Równoległe  uporządkowanie  molekuł,  charaktery- 
styczne dla  ciekłych  kryształów,  nie  jest  idealne.  Drga- 
nia termiczne  molekuł  powodują  odchylenia  od  rów- 
noległości i jedynie  średni  kierunek  ich  długości  osi 
pozostaje  niezmieniony.  Ten  średni  kierunek  oznacza 

się  za  pomocą  wektora  n o długości  jednostkowej, 
zwanego  dyrektorem  (od  ang.  direction  — 'kierunek'). 
Im  wyższa  jest  temperatura  ciekłego  kryształu,  tym 
większa  amplituda  drgań  molekuł  i tym  gorsze  upo- 
stcpieó  rządkowanie.  Stopień  tego  uporządkowania  można 
uporządfco-  wyrazić  liczbowo  za  pomocą  tzw.  parametru  upo- 
waraia  rządkowania  S.  Dla  nematyków: 

= f <3  cos2#— 1>. 

Znak  < > oznacza  uśrednienie  względem  wszystkich 
molekuł,  należących  do  zbioru  o jednakowej  orienta- 
cji. Kąt  0 jest  utworzony  między  dyrektorem  n i dłu- 
gą osią  jednej  wybranej  molekuły.  Gdy  uporządko- 
wanie znika  (jak  w cieczach  izotropowych),  czyli  gdy 
każda  wartość  kąta  0 jest  jednakowo  prawdopodob- 
na, to  średnia  wartość  cos20  = l/z  i parametr  S = 0. 
Dla  idealnego  uporządkowania  0 jest  zawsze  równe 
zeru  i parametr  S = 1.  W nematykach,  w zależności 
od  temperatury,  S ma  wartość  od  ok.  0,4  do  ok.  0,7. 


Tekstury  molekularne 

Teksturą  nazywamy  sposób  ułożenia  krystalitów  w 
materiale  polikrystalicznym,  ułożenie  włókien  w ma- 
teriale kompozytowym  itd.  W wypadku  ciekłych 
kryształów  przez  teksturę  rozumiemy  sposób  prze- 
strzennego ustawienia  długich  molekuł  w cienkiej 
warstwie  ciekłokrystalicznej.  Jest  to  zatem  tekstura 
molekularna.  Tekstur  molekularnych  w ciekłych 
kryształach  jest  wiele  rodzajów;  tutaj  wspomnimy  je- 
dynie o kilku  najważniejszych  z punktu  widzenia  za- 
stosowań ciekłych  kryształów. 

Jeżeli  w cienkiej  warstwie  nematyka,  zawartej  mię- 
dzy dwiema  powierzchniami  szkła  lub  innego  ma- 
teriału stałego,  długie  osie  molekuł  leżą  równolegle 


do  obu  powierzchni  ograniczających  i ponadto,  gdy 
wszystkie  molekuły  mają  jednakowy  kierunek,  to  ta- 
kie uporządkowanie  nosi  nazwę  tekstury  planarnej. 
Z tekstury  planarnej  można  łatwo  otrzymać  teksturę 
skręconego  nematyka  (ang.  twisted  nemalics).  W tym 
celu  obie  płytki,  między  którymi  znajduje  się  warstwa 
planarnie  zorientowanego  nematyka,  należy  skręcić 
względem  siebie  o 90°.  Po  takim  obrocie  kierunek  mo- 
lekuł przylegających  do  jednej  powierzchni  tworzy  kąt 
prosty  z kierunkiem  molekuł  leżących  na  drugiej  po- 
wierzchni. Nematyk  w głębi  warstwy  zostanie  zdefor- 
mowany w sposób  ciągły  z wytworzeniem  układu 
śrubowego,  zupełnie  podobnego  do  struktury  chole- 
sterolowej (ćwierć  skoku  śruby).  Opisana  tekstura  jest 
obecnie  najczęściej  stosowana  w układach  elektro- 
optycznych. 

Prostopadłe  ustawienie  molekuł  względem  po- 
wierzchni ograniczających  warstwę  ciekłego  kryształu 
nosi  nazwę  tekstury  homeotropowej.  Teksturę  tę 
można  wytworzyć  w nematykach  i smektykach. 

Tekstura,  która  występuje  tylko  w cholesterolo- 
wych ciekłych  kryształach  i która  jest  niezbędna,  jeśli 
chcemy  wykorzystać  oryginalne  własności  optyczne 
i termooptyczne  tych  substancji,  nosi  nazwę  tekstury 
planarnej  Grandjeana.  Molekuły  w warstwie  chole- 
sterolowej o tej  teksturze  pozostają  stale  równoległe 
do  powierzchni  ścianek  ograniczających,  zaś  ich  kie- 
runek w przestrzeni  ulega  zmianie  zgodnie  ze  spon- 
tanicznym skręceniem  śrubowym  struktury  choleste- 
rolowej. Innymi  słowy,  tekstura  Grandjeana  to  takie 
uporządkowanie,  w którym  oś  linii  śrubowej  jest 
zawsze  prostopadła  do  płaszczyzny  podłoża. 

Wreszcie  ostatnią  teksturą,  o której  tutaj  wspomni- 
my, jest  tekstura  konfokalna,  tworzona  przez  smekty- 
ki  i cholesterolowe  ciekłe  kryształy.  Substancje  e 
wskutek  warstwowej  budowy  mają  tendencję  do  gru- 
powania się  w makroskopowe  bryłki  o dość  skompli- 
kowanych kształtach.  Kształt  tych  bryłek  wynika  ze 
współogniskowego  '(konfokalnego)  połączenia  elips 
i hiperbol  i stąd  nazwa  tej  tekstury.  Cienka  warstwa 
ciekłego  kryształu,  w której  została  wytworzona  tek- 
stura konfokalna,  ma  mleczne,  silne  zmętnienie,  zni- 
kające, gdy  ciekły  kryształ  zostanie  przeprowadzony 
w dowolną  inną  teksturę. 
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Niektóre  zagadnienia  optyki  ciekłych 
kryształów 

Ciekłe  kryształy  są  cieczami  dwójłomnymi  optycznie. 

Znaczy  to,  że  ich  współczynnik  załamania  światła  za- 
leży od  kierunku  drgań  wektora  elektrycznego  fali 
świetlnej  względem  osi  optycznej  cienkiej  warstwy 
ciekłego  kryształu.  Stanowi  to  curiosum,  ponieważ 
żadne  inne  ciecze  nie  wykazują  dwójomności,  jeżeli 
nie  są  poddane  specjalnym  działaniom  deformującym. 

Kiedy  dwie  płytki  szklane,  między  którymi  znaj- 
duje się  cienka  warstwa  planarnie  zorientowanego 
nematyka,  umieścimy  między  dwoma  skrzyżowanymi  ^ °fłn0»c 
polaroidami,  to  początkowo  ciemne  pole  widzenia  zo-  ® 
stanie  silnie  rozjaśnione.  Rozjaśnienie  to  jest  najwięk-  K ' ys2tas0W 
sze  wtedy,  gdy  kąt  między  osią  polaroidu  a kierun- 
kiem uporządkowania  molekuł  w nematyku  jest  rów- 
ny 45°,  najmniejsze  — gdy  kąt  ten  jest  równy  zeru. 

Gdy  warstwę  nematyka,  umieszczoną  między  wspom- 
nianymi płytkami  szklanymi,  zorientujemy  homotro- 
powo,  to  pole  widzenia  pozostanie  ciemne  bez  wzglę- 
du na  obroty  płytki.  Widać  więc,  że  warstwa  zorien- 
towanego nematyka  ma  własności  optycznie  takie,  jak 
płytka  wycięta  z kryształu  jednoosiowego.  Oś  optycz- 
na jest  równoległa  do  warstwy  zorientowanej  planar- 
nie i prostopadła  do  warstwy  o teksturze  homotropo- 
wej,  czyli  jest  zawsze  równoległa  do  kierunku  długich 
osi  molekuł  w nematyku. 

Współczynnik  załamania  wiązki  światła  spolaryzo- 
wanego, w której  drgania  wektora  świetlnego  są  rów- 
noległe do  osi  optycznej,  nazywamy  współczynnikiem 
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nadzwyczajnym  i oznaczamy  symbolem  ne.  Gdy  drga- 
nia wektora  świetlnego  są  prostopadłe  do  osi  optycz- 
nej, to  załamanie  wiązki  określa  współczynnik  zwy- 
czajny, oznaczany  n0.  Kryształ  jest  dodatni  optycznie, 
gdy  ne—rio  > 0.  Nematyki  i smektyki  są  właśnie  kry- 
ształami optycznie  dodatnimi.  Ujemne  optycznie  są 
tylko  cholesterolowe  ciekłe  kryształy.  Na  rysunku  5 


Rys.  5.  Zależność  współczynników  załamania  rte  i n0  w PAA  od 
temperatury 

przedstawiono  zależność  współczynników  załamania 
nematyka  od  temperatury.  Widać,  że  ze  wzrostem 
temperatury,  gdy  maleje  parametr  uporządkowania  S , 
maleje  również  anizotropia  optyczna. 

Niezwykłe  własności  optyczne  mają  cholesterolowe 
ciekłe  kryształy.  Rozmieszczenie  molekuł  w tych  sub- 
stancjach na  linii  śrubowej  powoduje,  że  mają  one  bez- 
konkurencyjną w całej  przyrodzie  skręcalność  płasz- 
aktywność  czyzny  drgań  światła  spolaryzowanego  (aktywność 
optyczna  optyczną).  Jeżeli  w innych  substancjach  aktywnych 
optycznie  płaszczyzna  drgań  światła  obraca  się  o kilka, 
a najwyżej  o kilkanaście  stopni  na  1 mm  drogi,  to  na 
tej  samej  drodze  w cholesterolowych  ciekłych  kryszta- 
łach płaszczyzna  drgań  ulega  skręceniu  nawet  o kilka- 
dziesiąt tysięcy  stopni.  Ponadto  skręcalność  ta  może 
być  łatwo  sterowana  przez  zewnętrzne  oddziaływania 
termiczne,  chemiczne,  elektryczne,  magnetyczne  i me- 
chaniczne. 

Piękne  zabarwienie,  tak  charakterystyczne  dla  cho- 
lesterolowych ciekłych  kryształów,  jest  wywołane 
odbicie  przez  zjawisko  selektywnego  odbicia  światła  od  ich 
światła  powierzchni.  Długość  skoku  śruby  cholesterolowej  jest 
porównywalna  z długością  fali  światła  i padające  na 
warstwę  cholesterolową  światło  białe  odbija  się  w po- 
staci wiązki,  która  padając  na  ekran  daje  obraz  tęczy. 
Barwa  światła  selektywnie  odbitego  zależy  od  kąta 
padania  światła  białego  i od  kąta  obserwacji.  Selek- 
tywne odbicie  ma  więc  charakter  odbicia  Bragga  i jest 
podobne  do  odbicia  promieni  rentgenowskich  od 
zwykłych  kryształów.  Barwy  światła  odbitego  selek- 
tywnie są  jaskrawe  i czyste  tylko  wtedy,  gdy  warstwa 
odbijająca  ma  teksturę  grandjeanowską. 

Ze  śrubową  strukturą  cholesterolowych  ciekłych 
kryształów  wiąże  się  również  zjawisko  tzw.  dichro- 
izmu kołowego.  Polega  ona  na  tym,  że  w warstwie 
dich  roizm  ciekłego  kryształu,  mającego  teksturę  planarną  Grand- 
jeana,  światło  może  rozchodzić  się  tylko  w postaci 
wiązki  spolaryzowanej  kołowo.  Skrętność  polaryza-' 
cji  kołowej  jest  przeciwna  do  skrętności  śruby  chole- 
sterolowej, tzn.  że  jeżeli  śruba  cholesterolowa  jest 
lewoskrętna,  to  przechodzące  przez  warstwę  światło 
jest  spolaryzowane  kołowo  prawoskrętnie  i odwrotnie. 
Jak  wiadomo,  światło  spolaryzowane  liniowo  można 
rozłożyć  na  dwie  składowe  o przeciwnej  polaryzacji 
kołowej.  Dzięki  temu  wiązka  światła  liniowo  spolary- 
zowanego, padająca  na  warstwę  cholesterolowego 
ciekłego  kryształu,  zostanie  podzielona  na  dwie  wiązki 


kołowo  spolaryzowane  o przeciwnych  skrętnościach, 
przy  czym  jedna  z nich  przechodzi  przez  ciekły  krysz- 
tał, druga  zaś  zostaje  całkowicie  odbita. 


Anizotropia  diamagnetyczna  i dielektryczna. 

Anizotropia  przewodnictwa  elektrycznego 

Ciekłe  kryształy  są  diamagnetykami  wykazującymi 
anizotropię  diamagnetyczną  wynikającą,  w głównej 
mierze,  z istnienia  w ich  molekułach  pierścieni  benze- 
nowych. Diamagnetyzm  pierścienia  benzenowego  ma 
szczególne  własności : elektrony  walencyjne,  tworzące 
wiązanie  typu  n między  atomami  węgla  mają  swobodę 
ruchu  w obszarze  całego  pierścienia,  który  dzięki  temu 
może  być  przyrównany  do  pętli  wykonanej  z nadprze- 
wodnika. W takiej  pętli  zewnętrzne  pole  magnetyczne 
indukuje  silny  prąd,  którego  własne  pole  jest  skiero- 
wane przeciwnie  do  pola  indukującego.  Pierścień  ben- 
zenowy ma  tendencję  do  „uciekania”  z pola,  czyli  do 
ustawiania  się  tak,  aby  strumień  pola  zewnętrznego 
przez  jego  płaszczyznę  był  minimalny.  Pierścień  ben- 
zenowy przyjmuje  więc  położenie  równoległe  do  linii 
sił  pola.  Taką  właśnie  orientację  względem  pola  przyj- 
mują wszystkie  ciekłe  kryształy,  złożone  z molekuł 
zawierających  pierścienie  benzenowe. 

Anizotropię  diamagnetyczną  ciekłych  kryształów  anizotropia 
opisujemy  ilościowo  przez  podanie  różnicy  podatno-  diamagne- 
ści  magnetycznych Ax  = %w  ~Xj->  8dzie  X\\ « X±.  oznaczają  tyczna 
podatności  magnetyczne  ciekłego  kryształu,  w którym 
molekuły  są  zorientowane  — odpowiednio  — równo- 
ległe i prostopadłe  do  linii  sił  pola  magnetycznego. 

W ciekłych  kryształach  wartości  A%  są  rzędu  10“7.  Ze 
wzrostem  temperatury  wszystkie  cechy  anizotropowe 
ciekłych  kryształów  zanikają,  maleje  także  anizotro- 
pia diamagnetyczna  (rys.  6) 


Rys.  6.  Zależność  podatności  magnetycznej  PAA  od  temperatury 


Rys.  7.  Zależność  przenikał nośc i elektrycznej  PAA  od  tempe- 
ratury 
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anizotropia  Ciekłe  kryształy  wykazują  również  anizotropię  di- 
dielektryczna  elektryczną,  tzn.  ich  przenikalność  elektryczna,  gdy 
molekuły  są  ustawione  równolegle  do  kierunku  po- 
miarowego pola  elektrycznego  (g,,),  jest  zawsze  inna, 
niż  przenikalność  elektryczna  (e±)  próbki,  w której 
molekuły  są  ustawione  prostopadle  do  kierunku  pola. 
Anizotropia  dielektryczna  Aa  = g„—  a±  maleje  ze 
wzrostem  temperatury  (rys.  7).  Wartość  anizotropii 
Ae,  a nawet  i jej  znak,  zależą  także  od  częstości  pola 
elektrycznego. 

Molekuły  w ciekłych  kryształach  mają  z reguły  nie- 
zerowy  trwały  elektryczny  moment  dipolowy.  Gdy 
wektor  momentu  dipolowego  jest  skierowany  prosto- 
padle względem  długiej  osi  molekuły,  to  ciekły  krysz- 
tał w polu  o małej  częstości  wykazuje  ujemną  anizo- 
tropię dielektryczną,  czyli  Aa  = g„  -gj_  < 0.  Takimi 
substancjami  są  np.  PAA  i MBBA  (rys.  1).  I odwrot- 
nie, kiedy  wektor  momentu  dipolowego  jest  równo- 
legły do  długiej  osi  molekuły,  to  ciekły  kryształ,  jak 
np.  OCB,  ma  dodatnią  anizotropię  dielektryczną,  czyli 
g||  gj_  ^ 0- 

Ujemna  anizotropia  dielektryczna  jest  z reguły  nie- 
wielka, zazwyczaj  mniejsza  od  jedności,  natomiast 
wartość  Aa  w ciekłych  kryształach  o dodatniej  anizo- 
tropii dielektrycznej  może  dochodzić  nawet  do  20. 

Każdy  układ  fizyczny  osiąga  stan  równowagi  wtedy, 
gdy  jego  energia  swobodna  jest  możliwie  najmniejsza. 
Jeżeli  np.  krawędzie  okładek  kondensatora  powietrz- 
nego zetkniemy  z powierzchnią  dielektryka  ciekłego, 
to  po  przyłożeniu  do  okładek  napięcia  elektrycznego 
zauważymy,  że  ciecz  dielektryczna  jest  wciągana  nlię- 
dzy  okładki.  Kondensator  „pije”  tę  ciecz  tym  obficiej, 
im  większa  jest  przenikalność  elektryczna  cieczy  i im 
większe  jest  natężenie  pola  w kondensatorze.  Przy 
stałym  ładunku  na  okładkach  kondensatora  jego 
energia  będzie  odwrotnie  proporcjonalna  do  wartości 
przenikalności  elektrycznej  cieczy  wprowadzonej  mię- 
dzy okładki. 

Jeżeli  teraz  przestrzeń  między  okładkami  wypełnimy 
cieczą  anizotropową  dielektrycznie  i do  kondensatora 
przyłożymy  napięcie,  to  — dzięki  "tendencji  układu  do 
obniżania  swej  energii  swobodnej  — ciecz  przyjmie 
taką  konfigurację,  aby  pole  „widziało”  jej  największą 
przenikalność  elektryczną.  Zatem  ciekły  kryształ 
o ujemnej  anizotropii  dielektrycznej  ustawia  się  w po- 
lu elektrycznym  tak,  że  długie  osie  molekuł  są  prosto- 
padłe do  linii  sił  pola,  powstaje  tekstura  planarna. 
Z kolei  długie  osie  molekuł  w ciekłych  kryształach 
o dodatniej  anizotropii  dielektrycznej  przyjmują  poło- 
żenie równoległe  do  linii  sił  pola  elektrycznego  (tek- 
stura homeotropowa). 

Taki  sposób  orientowania  się  ciekłych  kryształów 
w polu  elektrycznym  jest  bardzo  często  zaburzany 
przez  przepływ  prądu  jonowego,  któremu  towarzyszą 
dektrohydrodynamiczne,  często  bardzo  burzliwe 
przepływy  ciekłego  kryształu.  Przepływy  elektro- 
hydrodynamiczne,  towarzyszące  prądowi  jonowemu 
orientacja  mogą  powodować  orientację  długich  osi  molekuł  zaw- 
molekuł  sze  w kierunku  wektora  natężenia  pola  elektrycznego, 
w polu  niezależnie  od  znaku  anizotropii  dielektrycznej.  Fakt, 
elektrycznym  że  stałe  pole  elektryczne  orientuje  molekuły  nematyka 
o ujemnej  anizotropii  dielektrycznej  równolegle  do 
kierunku  linii  sił  (a  nie  prostopadle,  jak  nakazywałyby 
reguły  elektrostatyki)  zaobserwowany  już  został  w wy- 
żej wymienionych  pracach  M.  Jeżewskiego  i M.  Mię- 
sowicza. 

Uporządkowanie  warstwy  ciekłego  kryształu  przez 
zewnętrzne  pole  elektryczne  lub  magnetyczne  jest 
osiągalne  dopiero  wtedy,  gdy  natężenie  pola  orientu- 
jącego przekroczy  pewną  wartość  progową.  Ta  war- 
tość progowa  zależy  od  wielkości  anizotropii  diamag- 
netycznej  i dielektrycznej,  od  wielkości  odpowiednich 
współczynników  sprężystości  ciekłego  kryształu  i od 
grubości  jego  warstwy.  Jeżeli  tę  grubość  oznaczymy 
przez  d , to  wartości  progowe  natężeń  pola  magnetycz- 
nego Ht  i pola  elektrycznego  Et  spełniają  przybliżone 
zależności  Htd  = Cx  oraz  Etd  = C2,  gdzie  Cx  i C2  są 
stałymi  zależnymi  od  rodzaju  ciekłego  kryształu. 
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Przewodnictwo  elektryczne  ciekłych  kryształów  ma,  przewodnic- 
prawie  wyłącznie,  charakter  jonowy ; ich  przewodność  two 
o zawarta  jest  przeważnie  w przedziale  od  10“ 8 do  elektryczne 
lO^D^cm-1.  Jak  łatwo  się  domyśleć,  również  i prze- 
wodnictwo elektryczne  ma  w ciekłych  kryształach 
charakter  anizotropowy.  Jeżeli  przez  cr,,  oznaczymy 
przewodność  próbki,  w której  jony  poruszają  się  rów- 
nolegle do  kierunku  długich  osi  molekuł,  zaś  przez 
o!  przewodność  uwarunkowaną  ruchem  jonów  w kie- 
runku prostopadłym  do  tych  osi,  to  stwierdzamy,  że 
w nematykach  zawsze  cr,,  > <x±.  Stąd  wniosek,  że  jony 
napotykają  mniejszy  opór,  jeżeli  ich  ruch  jest  zgodny 
z kierunkiem  długich  osi  molekuł.  Dla  określonego 
nematyka  stosunek  obu  przewodności  jest  zazwyczaj 
bliski  1,5  i niewiele  zależy  od  ich  wartości. 

W smektykach  relacja  między  przewodnościami  jest 
odwrotna.  W tych  ciekłych  kryształach  ruch  jonów 
jest  łatwiejszy  wzdłuż  warstw  smektycznych,  a nie 
wzdłuż  długich  osi  molekuł  (jak  pamiętamy,  molekuły 
w smektykach  są  prostopadłe  lub  prawie  prostopadłe 
do  warstw).  Wobec  tego  w smektykach  przewodność 
elektryczna  on  < <r± . 


Orientacja  molekuł  na  granicy  ciekły 
kryształ-ciało  stałe 

Ciekłe  kryształy  są  jedynymi  substancjami,  których 
własności  optyczne  mogą  być  radykalnie  zmieniane 
już  przez  słabe  oddziaływania  powierzchniowe.  Ich 
ciekłość,  dalekie  uporządkowanie  molekularne  i ani- 
zotropia optyczna  powodują,  że  dokładnie  odwzoro- 
wują one  stany  powierzchni  ciał  stałych  i pozwalają  te 
stany  wizualizować.  Ta  zdolność  ciekłych  kryształów 
została  wykorzystana  do  wytwarzania  określonych 
tekstur  molekularnych,  głównie  w cienkich  warstwach 
wchodzących  w skład  elementów  elektrooptycznych. 

Odpowiednia  obróbka  powierzchni  szkła,  półprze- 
wodnika czy  metalu  może  spowodować,  że  molekuły 
ciekłych  kryształów  będą  przyjmowały  położenie  rów- 
noległe do  tych  powierzchni  i będą  leżały  w wyznaczo- 
nym kierunku  lub  też  będą  do  tych  powierzchni  pro-  wytwarzanio 
stopadłe.  W pierwszym  wypadku  wytwarzamy  tekstu-  tekstury 
rę  planarną,  w drugim  zaś  — homeotropową.  planarnej 

Teksturę  planarną  można  uzyskać  przez  jednokie- 
runkowe polerowanie  powierzchni  ciał  stałych  papie- 
rem, tkaniną  itp.  lub  przez  ukośne  napylanie  warstw 
dielektryków  i metali.  Mikrorowki,  powstające  na  po- 
wierzchniach w czasie  polerowania  lub  też  wydłużone 
wysepki  substancji  napylanych  ukośnie  ustawiają  mo- 
lekuły ciekłego  kryształu,  naniesionego  na  tak  przy- 
gotowaną powierzchnię,  w kierunku  równoległym  do 
kierunku  polerowania  lub  napylania.  Molekuły  kon- 
taktujące się  z powierzchnią  stałą  pociągają  za  sobą 
molekuły  z wnętrza  warstwy  ciekłokrystalicznej  tak,  wytwarzanie 
że  jednorodnie  zorientowana  warstwa  może  mieć  tekstury  ho- 
grubość  nawet  1 mm.  meotropowej 

Aby  wytworzyć  teksturę  homeotropową  należy 
spowodować,  aby  pierwsza  warstwa  molekuł,  kon- 
taktująca się  z powierzchnią  ciała  stałego,  przyjmowa- 
ła względem  tej  powierzchni  położenie  prostopadłe. 

W tym  celu  na  powierzchnię  stałą  nanosi  się  bardzo 
cienką  warstewkę  substancji  o wydłużonych  mole- 
kułach, mających  na  jednym  końcu  grupę  polarną, 
pn.  warstewkę  lecytyny  lub  odpowiedniego  detergen- 
tu. Grupa  ta  wiąże  się  z powierzchnią  podłoża,  reszta 
zaś  molekuły  wystaje  prostopadle  nad  powierzchnią. 

Molekuły  ciekłego  kryształu  naniesionego  na  tak  przy- 
gotowaną powierzchnię  ustawiają  się  równolegle  do 
molekuł  warstwy  inicjującej,  tworząc  teksturę  homeo- 
tropową. 

Ciekłokrystaliczne  urządzenia  elektrooptyczne  dzia- 
łają głównie  na  zasadzie  deformowania  za  pomocą 
pola  elektrycznego  tekstury  ciekłego  kryształu,  na- 
rzuconej przez  opisane  oddziaływania  powierzchnio- 
we. Po  ustaniu  działania  pola  te  same  oddziaływania 
powierzchniowe  przywracają  pierwotną  teksturę  war- 
stwie ciekłego  kryształu. 
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Rys.  8.  Położenie 
molekuł  nematyka 
względem  porusza- 
jącej się  płytki  przy 
wyznaczaniu  trzech 
współczynników  le- 
pkości 


Anizotropia  lepkości.  Trzy  główne 
współczynniki  lepkości  nematyków 

Pomiary  wpływu  orientacji  molekuł  w ciekłych  kry- 
ształach na  współczynniki  lepkości  tych  substancji 
prowadzone  były  już  dawno.  Stosowano  wtedy  trady- 
cyjne metody  wiskozymetryczne.  Badano  m.in.  wpływ 
silnego  pola  magnetycznego,  o indukcji  rzędu  1 T,  na 
prędkość  przepływu  cieczy  nematycznych  przez  rurki 
kapilarne  o średnicy  ok.  0,1  mm.  Wyniki  tych  ekspe- 
rymentów, wskutek  wadliwego  doboru  warunków, 
były  jednak  negatywne:  włączanie  pola,  prostopadłe- 
go do  osi  przepływu,  nie  zmieniało  prędkości  cieczy 
w kapi larze.  Jeszcze  w r.  1934  twierdzono,  że  orienta- 
cja molekuł  nie  ma  wpły  wu  na  współczynnik  lepkości. 

W 1933  r.  w Krakowie  M.  Mięsowicz  podjął  syste- 
matyczne badania  własności  Teologicznych  ciekłych 
kryształów.  Wysunął  rewolucyjną  wówczas  ideę  ani- 
zotropii lepkości  tych  substancji,  a następnie  w opra- 
cowanym przez  siebie  bardzo  pomysłowym  i oryginal- 
nym eksperymencie  wykrył  tę  anizotropię  i zmierzył 
odpowiednie  współczynniki  lepkości.  Zastosował  spe- 
cjalną technikę  pomiaru,  której  nowość  polegała  na 
przyjęciu  prostokątnej  geometrii  przepływu  i na  za- 
stosowaniu bardzo  małych  gradientów  prędkości. 
Zbudowano  urządzenie,  w którym  cienka  płytka 
szklana  (0,1  mm)  o powierzchni  kilku  cm2  była  zawie- 
szana w ciekłokrystalicznym  PAA  lub  /7-azoksyfene- 
tolu.  Płytka  mogła  wykonywać  bardzo  powolne  wa- 
hania w płaszczyźnie  pionowej  (rys.  8).  Z wielkości 
tłumienia  wahań  można  było  wyznaczyć  odpowiednie 
współczynniki  lepkości.  Badana  ciecz  była  orientowa- 
na przez  zewnętrzne  pole  magnetyczne.  W odróżnie- 
niu od  poprzednich  rezultatów  stwierdzono  bardzo 
silny  wpływ  pola  magnetycznego  na  lepkość  obu  ciek- 
iych  kryształów.  Określono  trzy  różne  współczynniki 
lepkości : r jŁ  — gdy  molekuły  leżały  wzdłuż  poruszają- 
cej się  płytki,  ij2  — gdy  były  ustawione  do  niej  prosto- 
padle, i — gdy  leżały  w poprzek  tej  płytki.  Z pomia- 
rów dla  PAA  (w  temperaturze  122°C)  uzyskano  war- 
tości: r}1  = 2,4  m-Pa-s,  rj2  — 9,2  m-Pa-s,  rj3  — 3,4  m* 

• Pa  • s.  Jak  widać,  anizotropia  współczynnika  lepkości 
jest  bardzo  duża  (vJVi  ~ 4).  Okazało  się,  że  jest  naj- 
większą ze  wszystkich  anizotropii.  Poprzednio  obser- 
wowany brak  efektu  przy  przepływie  przez  cienkie 
kapilary  w porównaniu  z tymi  rezultatami  był  do- 
wodem silnej  orientacji  powodowanej  przez  przepływ 
z gradientem  prędkości. 

W ostatnich  latach  została  stworzona  ogólna  hydro- 
dynamika teoretyczna  ciekłych  kryształów,  oparta  na 
modelu  continuum.  W równaniach  tej  hydrodynami- 
ki występuje  sześć  współczynników  Lesliego.  Za  ich 
pomocą  można  wyrazić  trzy  współczynniki  lepkości 
Mięso  wieża,  bo  tak  są  nazywane  w literaturze  współ- 
czynniki rjlt  i a także  inne  współczynniki  lepkości 
występujące  przy  skomplikowanych  deformacjach 
ciekłych  kryształów. 


Kilka  zagadnień  dynamiki 

W ostatnich  latach  (po  1965  r.)  okazało  się,  że  wiele 
ciekawych  zjawisk  z fizyki  ciekłych  kryształów  można 
opisać  ilościowo  przy  użyciu  przedstawionej  wyżej 
anizotropii  lepkości.  Chodzi  tu  o szeroki  zakres  zja- 
wisk, w których  rolę  odgrywają  ruchy  molekularne, 
w tym  głównie:  rozpraszanie  światła;  anizotropia 
absorpcji  i anizotropia  prędkości  fal  ultradźwięko- 
wych; orientacja  przez  ruch  cieczy;  orientacja  przez 
przepływ  prądu  elektrycznego;  przewodnictwo  ciepl- 
ne; dyfuzja  i samodyfuzja. 

Ze  względu  na  ograniczone  ramy  tego  artykułu,  dla 
przykładu  zajmiemy  się  tylko  zjawiskiem  rozprasza- 
nia światła  oraz  zjawiskiem  samody fuzji, 
rozpraszanie  Niedawno  stwierdzono,  że  rozpraszanie  światła  na 
światła  ciekłych  kryształach  nematycznych  daje  wiele  cieka- 
wych informacji  na  temat  ich  struktury.  Okazało  się 
także,  co  jest  pewną  niespodzianką,  że  badanie  roz- 


praszania światła  potwierdza  zasadnicze  założenia 
hydrodynamiki  ciekłych  kryształów.  Ruch  termiczny 
molekuł  powoduje  wystąpienie  fluktuacji  wektora 
uporządkowania  (dyrektora),  te  zaś  — dzięki  istnie- 
niu anizotropii  optycznej  ciekłych  kryształów  — dają 
silne  ropraszanie  i depolaryzację  światła.  Fluktuacje 

wektora  orientacji,  będącego  funkcją  położenia  r 
i czasu  t,  możemy  zapisać  w prosty  sposób: 

n{r , 0 = n<)+ón(r,t). 

Odchylenie  Ón(r , /),  jest  właśnie  miarą  fluktuacji  i ma 
silny  wpływ  na  natężenie  światła  rozpraszanego  pod 
określonym  kątem.  Schemat  aparatury  do  pomiaru  pomiary 
natężenia  światła  rozproszonego  użytej  w Laborato-  rozpraszania 
rium  w Orsay  jest  przedstawiony  na  rys.  9.  światła 


fotopowielacz 


- polaryzator 


analizator 


laser 


JM-+4- 


pryzmat  odchylający 


Rys.  9.  Aparatura  do  pomiaru  rozpraszania  światła  w ciekłych 
kryształach  (Laboratorium  Orsay).  Źródłem  światła  jest  laser: 
fotopowielacz  rejestruje  natężenie  światła  rozproszonego  pod 
określonym  kątem 


Pomiary  rozpraszania  światła  pozwoliły  znaleźć 
w niezależny  sposób  wartości  współczynników  rjly  rjn 
i ł?3.  Z pomiarów  tych  wynikają  interesujące  wnioski 
na  temat  struktury  cieczy  nematycznych,  które  przede 
wszystkim  pozwalają  poddać  w wątpliwość  słuszność 
modelu  domenowego  nematyków. 

Nie  będziemy  zajmować  się  tutaj  szczegółowo  za- 
gadnieniem absorpcji  fal  ultradźwiękowych  w ciekłych 
kryształach.  Zwrócimy  tylko  uwagę,  że  badania  te, 
przeprowadzone  przy  częstościach  rzędu  kilku 
MHz,  dały  w wyniku  takie  same  wartością,  rj2  i 
jakie  zostały  otrzymane  wcześniej  metodami  w zasa- 
dzie statycznymi.  Mechanizm  przekazywania  pędu 
między  molekułami  jest  zatem  identyczny  w bardzo 
szerokim  zakresie  częstości. 

Samodyfuzja  jest  szczególnym  rodzajem  dyfuzji,  samodyfuzja 
w której  jedne  molekuły  ulegają  przemieszczeniu  w nematy- 
wśród  innych  molekuł  tej  samej  substancji.  W Krako-  kach 
wie,  w zespole  kierowanym  przez  J.  Janika  i od  dawna 
specjalizującym  się  w badaniach  strukturalnych  i w fi- 
zyce molekularnej,  podjęto  intensywne  prace  nad  za- 
gadnieniem ciekłych  kryształów.  W szczególności  ze- 
spół zajął  się  problemem  samodyfuzji  w nematykach. 

Do  badań  samodyfuzji  zastosowano  metodę  kwazi- 
elastycznego  rozpraszania  neutronów.  Wiązka  powol- 
nych neutronów  o określonej  energii,  wysyłanych  np. 
przez  reaktor  jądrowy,  po  rozproszeniu  na  badanej 
próbce  daje  tzw.  linię,  której  rozmycie  zależy  od  nie- 
uporządkowanych ruchów  molekuł  w próbce.  Zgod- 
nie z opisem  teoretycznym,  dyfuzja  prostopadła,  w 
której  molekuły  przemieszczają  się  prostopadle  do 
kierunku  orientacji,  opisywana  współczynnikiem  D± , 
jest  powolniejsza  od  dyfuzji  równoległej  ze  współczyn- 
nikiem dyfuzji  Z>„,  w której  molekuły  przemieszczają 
się  równolegle  względem  siebie.  Zespół  J.  Janika 
stwierdził  doświadczalnie,  że  istotnie  zachodzi  za- 
leżność Z>„  > D±. 


495 


Zastosowanie  ciekłych 
kryształów 


Hh 


1 |H 

Rys.  10.  Dyna- 
miczne rozprasza- 
nie światła  w nema- 
tykach.  Analogicz- 
ny efekt  występuje 
także  przy  orienta- 
cji molekuł  prosto- 
padle do  po- 

wierzchni elektrod 


Niezwykłe  zainteresowanie,  jakie  budzą  obecnie  ciekłe 
kryształy,  jest  spowodowane  ich  przydatnością  w wie- 
lu gałęziach  nauki  i techniki.  Prace  oryginalne  i arty- 
kuły przeglądowe  na  temat  własności  i zastosowań 
ciekłych  kryształów  ukazują  się  w książkach  i czaso- 
pismach z dziedziny  fizyki,  elektroniki,  chemii,  biolo- 
gii, farmacji,  medycyny,  techniki  materiałowej  itd. 

Jak  dotychczas,  szerokie  zastosowania  znalazły 
prawie  wyłącznie  nematyki  i cholesterolowe  ciekłe 
kryształy,  chociaż  ostatnio  prowadzi  się  badania  rów- 
nież nad  zastosowaniem  smektyków. 

Przede  wszystkim  wykorzystuje  się  egzotyczne  po- 
łączenie w ciekłych  kryształach  anizotropii  optycznej 
i cech  ciekłości,  dzięki  którym  dają  się  one  łatwo 
orientować  lub  deformować  pod  wpływem  najróżno- 
rodniejszych oddziaływań  zewnętrznych. 

W odczytnikach  stosowanych  w zegarkach  elektro- 
nicznych, minikalkulatorach,  ekranach  radarowych 
z pamięcią,  elektrooptycznych  urządzeniach  pamię- 
ciowych itd.  wykorzystuje  się  różnorodne  zjawiska 
elektrooptyczne.  Początkowo  do  tych  celów  wykorzy- 
stywano zjawisko  dynamicznego  rozpraszania  światła 
(rys.  10).  Między  dwie  płytki  szklane,  pokryte  przewo- 
dzącymi warstwami  tlenku  cyny  Sn02  lub  tlenku  indu 
ln203,  wprowadzano  cienką  warstwę  nematyka  o gru- 
bości ok.  30  pm.  Nematyk  był  zorientowany  homeo- 
tropowo  lub  planarnie  i był  zupełnie  przezroczysty. 
Kiedy  do  elektrod  przykładano  napięcie,  to  płynący 
prąd  jonowy  burzył  pierwotne  uporządkowanie  i war- 
stwa nematyka  stawała  się  mleczno  biała.  Gdy  war- 
stwa tlenkowa  na  jednej  z elektrod  była  wytrawiona 
w kształcie  siedmiosegmentowego  pola  numerycznego, 
jak  na  rys.  11,  to  po  przyłączeniu  napięcia  do  odpo- 
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Rys.  11.  Siedmiosegmentowe  pole  cyfrowe,  stosowane  w odczyt- 
nikach  ciekłokrystalicznych 


wiednich  segmentów  otrzymywano  zobrazowanie  żą- 
danej cyfry  w postaci  mlecznej  figury  na  przezroczy- 
stym tle.  Jednakże  w czasie  działania  odczytnika  tego 
typu  przebiegają  szkodliwe  procesy  elektrochemiczne, 
powodujące  stopniowy  rozkład  chemiczny  ciekłego 
kryształu,  toteż  obecnie  technikę  dynamicznego  roz- 
praszania prawie  całkowicie  zarzucono. 

W późniejszych  rozwiązaniach  odczytników  ma- 
teriał i kształt  elektrod  pozostały  w zasadzie  bez 
zmian,  zmienił  się  jednak  sposób  oddziaływania  na 
ciekły  kryształ.  Obecnie  prawie  wyłącznie  stosuje  się 
elektrostatyczne  sterowanie  warstwą  ciekłego  kryszta- 
łu. Przewodzącą  warstwę  tlenkową  oddziela  się  od 
ciekłego  kryształu  bardzo  cienką  powłoką  napylone- 
go dielektryka,  co  eliminuje  przepływ  prądu  jonowe- 
go, ale  nie  przeszkadza  we  wnikaniu  pola  elektrycz- 
nego do  wnętrza  warstwy  ciekłego  kryształu.  W tak 
uformowanych  komórkach  wykorzystuje  się  w zasa- 
dzie cztery  efekty  elektrooptyczne  lub  ich  modyfika- 
cje: 


1)  Komórkę,  w której  nematyk  o ujemnej  anizotro-  elektrosta- 
pii  dielektrycznej  jest  zorientowany  homeotropowo  tyczne 
przez  oddziaływania  powierzchniowe,  umieszcza  się  sterowanie 
między  skrzyżowanymi  polaroidami.  Przed  przyłoże- 
niem napięcia  pole  widzenia  jest  ciemne.  Włączenie 

napięcia  do  odpowiednich  segmentów  powoduje  ich 
rozjaśnienie  (nematyk  o ujemnej  anizotropii  dielek- 
trycznej orientuje  się  prostopadle  do  linii  sił  pola  elek- 
trycznego). 

2)  Między  skrzyżowanymi  polaroidami  umieszcza 
się  komórkę  zawierającą  warstwę  planarnie  zoriento- 
wanego nematyka  o dodatniej,  tym  razem,  anizotropii 
dielektrycznej.  Ponieważ  molekuły  takiego  nematyka 
orientują  się  równolegle  do  kierunku  pola  elektrycz- 
nego, to  jednorodne  i jasne  początkowo  pole  widze- 
nia ulega  zaciemnieniu  po  włączeniu  napięcia. 

3)  Jeżeli  w komórce  umieszczonej  jak  w punkcie  2) 
wytworzymy  teksturę  skręconego  nematyka,  która  ma 
własność  skręcania  o 90°  płaszczyzny  drgań  światła 
spolaryzowanego,  to  pole  widzenia  między  skrzyżowa- 
nymi polaroidami  będzie  początkowo  jasne.  Po  włą- 
czeniu napięcia  molekuły  nematyka  orientują  się  rów- 
nolegle do  kierunku  pola,  tekstura  śrubowa  skręcone- 
go nematyka  zostaje  zniszczona  i zamieniona  w teks- 
turę homeotropową.  Znika  zdolność  skręcania  płasz- 
czyzny drgań  i pole  widzenia  ulega  zaciemnieniu. 

Opisany  efekt  jest  obecnie  najczęściej  wykorzystywa- 
ny w konstrukcjach  odczytników  ciekłokrystalicz- 
nych. 

4)  Pod  działaniem  pola  elektrycznego  zachodzi  indu- 
kowana przemiana  fazowa  cholesterolowego  ciekłego 
kryształu  w nematyk.  Jeżeli  warstwa  cholesterolowa 
o dodatniej  anizotropii  dielektrycznej  i teksturze  kon- 
fokalnej  zostanie  poddana  działaniu  pola  elektrycz- 
nego, to  molekuły,  dążąc  do  ustawienia  się  równo- 
legle względem  kierunku  pola,  wytworzą  teksturę 
homeotropową,  a tym  samym  cholesterolowy  ciekły 
kryształ  ulegnie  przemianie  w nematyk.  Mleczna  bia- 
łość warstwy,  wywołana  istnieniem  tekstury  konfo- 
kalnej,  zniknie  i warstwa  będzie  zupełnie  przezroczy- 
sta tak  długo,  jak  długo  będzie  działało  pole  sterujące. 

Odczytniki  ciekłokrystaliczne,  których  działanie 
oparte  jest  na  opisanych  efektach  elektrooptycznych, 
nadają  się  szczególnie  dobrze  jako  układy  pośredniczą- 
ce między  mikrominiaturowymi  urządzeniami  elektro- 
nicznymi a człowiekiem.  Ich  sterowanie  odbywa  się 
na  drodze  elektrostatycznej  przy  napięciach  rzędu  kil- 
ku woltów  i praktycznie  bezprądowó,  mogą  więc 
współpracować  z układami  logicznymi  bez  użycia 
wzmacniaczy. 

Cenną,  z punktu  widzenia  zastosowań,  własnością  zdolność 
ciekłych  kryształów  jest  ich  zdolność  orientowania  orientowania 
molekuł  innych  substancji.  Jeżeli  substancja  rozpusz-  innych 
czona  w ciekłym  krysztale  ma  wydłużone  molekuły,  molekuł 
to  zostaną  one  zorientowane  zgodnie  z kierunkiem 
molekuł  ciekłego  kryształu.  Ten  efekt  jest  wykorzysty- 
wany do  orientacji  długich  molekuł  w czasie  ich  bada-  , 

nia  metodami  spektroskopii  EPR  i NMR  (-*  Spektro- 
skopia rezonansów  magnetycznych),  do  tworzenia 
polimerów  o zorientowanym  usieciowaniu  oraz  w 
chromatografii  gazowej  do  rozdzielania  stereoizome- 
rów  wielu  substancji.  Uporządkowane  roztwory  sub- 
stancji o długich  molekułach  można  przeprowadzić 
w stan  stały  bez  naruszenia  uporządkowania  ciekło- 
krystalicznego. Dokonuje  się  tego  przez  gwałtowne 
oziębienie  roztworu  do  temperatury  ciekłego  azotu, 
w której  następuje  zamrożenie  stanu  orientacji. 

Bardzo  ciekawe  zastosowanie  znalazł  efekt  wzajem-  ciekłe 
nego  oddziaływania  orientującego  między  ciekłym  ferromag- 
kryształem  i bardzo  drobnymi  ziarnami  ferromagne-  netyki 
tyka.  Koloidalne  mieszaniny  ciekłego  kryształu  i roz- 
pylonego magnetytu  mają  własności  ciekłego  ferro- 
magnetyka.  Ciecze  takie  dają  się  namagnesować,  są 
przyciągane  przez  magnes  itd. 

Łatwość  zmiany  orientacji  molekularnej  w ciekłych 
kryształach  została  wykorzystana  do  badań  stanu  po- 
wierzchni ciał  stałych.  Niektóre  ciekłe  kryształy  mają 
zdolność  spontanicznego  tworzenia  tekstur  homeo- 
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badania  tropowych,  czyli  ich  molekuły  samorzutnie  przyjmują 
powierzchni  położenie  prostopadłe  do  powierzchni  ciał  stałych.  Je- 
żeli taka  powierzchnia  ma  obszary  o innym  ładunku 
elektrycznym  czy  o innym  składzie  chemicznym,  to 
tekstura  homeotropowa  zostanie  w tych  obszarach  za- 
burzona. Zaburzenie  to  łatwo  wykrywać  przez  obser- 
wację warstwy  ciekłego  kryształu  w świetle  spolaryzo- 
wanym. 

efekt  Kerra  Spośród  efektów  optycznych  w nematykach  należy 
jeszcze  wymienić  efekt  Kerra,  czyli  pojawienie  się 
dwójłomności  optycznej  w cieczach  pod  działaniem 
pola  elektrycznego  o dużym  natężeniu.  Substancje 
nema tyczne  w temperaturze,  w której  znajdują  się  w fa- 
zie izotropowej,  mają  bardzo  dużą  stałą  Kerra.  Stero- 
wanie elementami  elektrooptycznymi,  działającymi 
na  zasadzie  efektu  Kerra  jest  jednak  utrudnione  przez 
konieczność  stosowania  wysokich  napięć. 

Długość  skoku  linii  śrubowej  w strukturze  chole- 
sterolowej, decydująca  o barwie  światła  selektywnie 
odbitego,  zależy  w istotny  sposób  od  temperatury, 
składu  chemicznego  ciekłego  kryształu,  od  działania 
pól  elektrycznych  i magnetycznych,  a także  od  oddzia- 
termografia  ływaó  mechanicznych.  Stwarza  to  pole  do  wielu  za- 
stosowań, przede  wszystkim  w termografii. 

Można  komponować  mieszaniny  cholesterolowych 
ciekłych  kryształów  tak,  aby  barwa  selektywnego  od- 
bicia pojawiała  się  w ściśle  określonej  temperaturze, 
a ponadto  można  regulować  zakres  temperatur,  w ja- 
kim barwa  powinna  zmienić  się  od  czerwonej  do  fio- 
letowej. Można  np.  uzyskać  taką  mieszaninę,  aby 
barwa  czerwona  przypadała  w temperaturze  34°C,  zaś 
barwa  fioletowa  w 36°C.  Jeżeli  taką  mieszaniną  po- 
kryjemy fragment  skóry  człowieka,  np.  rękę,  to  otrzy- 
mamy barwną  mapę  rozkładu  temperatury  na  skórze, 
jak  to  pokazano  na  il.  24  (tabl.  8).  Można  wytwo- 
rzyć mieszaniny,  w których  przedział  między  pojawie- 
niem się  barwy  czerwonej  i fioletowej  wynosi  zaledwie 
0,5 °C.  Warstwy  takich  czułych  termicznie  mieszanin 
stosuje  się  do  budowy  noktowizorów,  do  otrzymywa- 
nia hologramów  w zakresie  podczerwieni  i mikrofal, 
do  wykrywania  defektów  materiałów,  do  badań  mo- 
deli lotniczych  itd. 

Barwa  selektywnego  odbicia  zależy  także  od  obec- 
ności w powietrzu  par  wielu  substancji  organicznych. 
Fakt  ten  wykorzystuje  się  do  wykrywania  zanieczysz- 
czeń toksycznych  powietrza,  do  analizy  zapachów 
(sztuczny  nos)  itp. 

Wymienione  zastosowania  stanowią  tylko  przykła- 
dy najpopularniejsze.  Z nowszych  zastosowań  może- 
my tutaj  jedynie  zasygnalizować  wykorzystywanie 
ciekłych  kryształów  do  budowy  laserów  cieczowych, 
do  konstrukcji  światłowodów  i filtrów  optycznych,  do 
wykonywania  siatek  dyfrakcyjnych  i do  badań  topo- 
grafii powierzchni  ciał  stałych  metodą  interferencji 
światła  w cienkich  warstwach  cholesterolowych  ciek- 
łych kryształów. 


Ciekłe  kryształy  w strukturach 
biologicznych 


Zjawisko  życia  jest  niezaprzeczalnie  najbardziej  skom- 
plikowanym zespołem  procesów  fizycznych  i chemicz- 
nych przebiegających  w ośrodkach  ciekłych.  Wielu 
z tych  elementarnych  procesów  fizykochemicznych 
jeszcze  nie  znamy,  podobnie  jak  często  nie  znany,  czy 
nawet  obecnie  nie  przeczuwany,  jest  charakter  łańcu- 
cha związków  przyczynowo-skutkowych  między  tymi 
procesami. 

Znaczna  część  substancji,  z których  zbudowane  śą 
organizmy  żywe,  ma  strukturę  ciekłokrystaliczną  i dla- 
tego bez  ciekłych  kryształów  życie  w ogóle  nie  byłoby 
możliwe.  W żywych  komórkach  ciekłe  kryształy  wystę- 
pują przede  wszystkim  jako  elementy  strukturalne 
błon  biologicznych,  ale  także  jako  roztwory  wydłużo- 
nych makromolekuł  i wirusów. 


Ciekłe  kryształy  są  cieczami,  w których  molekuły 
są  w znacznym  stopniu  względem  siebie  uporządko- 
wane, i dlatego  obecność  struktur  ciekłokrystalicz- 
nych w błonach  biologicznych  narzuca  błonom  celową 
organizację,  dostosowaną  do  ich  funkcji  w żywej  ko- 
mórce. Jednocześnie  ciekłość  takiego  układu  upo- 
rządkowanego zapewnia  błonom  dużą  elastyczność 
i podatność  na  oddziaływania  zewnętrzne,  a także 
— łatwy  transport  odpowiednich  substancji  oraz  wy- 
mianę zużytych  lub  uszkodzonych  fragmentów. 

To,  że  błony  biologiczne  istotnie  zawierają  struktu- 
ry ciekłokrystaliczne,  zostało  stwierdzone  metodami 
dyfrakcji  promieniowania  rentgenowskiego,  elektro- 
nowego rezonansu  paramagnetycznego  oraz  kalory- 
metrii  różnicowej,  a także  na  podstawie  badania  prze- 
mian fazowych  wywołanych  termicznie  w lipidach 
i w błonach. 

Bazę  strukturalną  każdej  błony  biologicznej,  stano- 
wi podwójna  warstwa  molekuł  lipidów,  uporządkowa- 
nych względem  siebie  tak  jak  molekuły  w ciekłym 
krysztale  smektycznym.  Podwójne  warstwy  lipidowe 
powstają  spontanicznie  dzięki  szczególnej  budowie 
molekuł  tych  substancji,  określającej  ich  zachowanie 
się  w kontakcie  z rozpuszczalnikiem  (->  Błony  ko- 
mórkowe). 

Wzajemne  rozpuszczanie  się  substancji  określa  za- 
sada „swój  do  swego”,  tzn.  że  substancje  polarne  są 
dobrze  rozpuszczalne  tylko  w rozpuszczalnikach  po- 
larnych i odwrotnie.  Tak  np.  alkohol  metylowy 
CH3OH  lub  kwas  octowy  CH3COOH,  dzięki  polar- 
nym grupom  — OH  i — COOH,  rozpuszczają  się 
dobrze  w wodzie  — rozpuszczalniku  silnie  polarnym. 
Parafina,  złożona  głównie  z niepolamych  węglowo- 
dorów, nie  rozpuszcza  się  w wodzie,  jest  natomiast 
dobrze  rozpuszczalna  w niepolarnym  benzenie.  Takie 
substancje  jak  alkohol  metylowy  i kwas  octowy  nazy- 
wamy substancjami  hydrofitowymi  (lubiącymi  wodę), 
zaś  węglowodory  — substancjami  hydrofobowymi 
(obawiającymi  się  wody).  Gdy  jednak  w molekułach 
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Rys.  12.  Molekuły  substancji  amfifilowych  mają  polarną  głów- 
kę i długi  ogon  niepolarny.  Budowa  molekuł:  a)  mydła,  b)  lipidu 
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kwasów  i alkoholi  wzrasta  długość  łańcucha  węglowo- 
dorowego, to  hydrofobowe  działanie  tego  łańcucha 
równoważy  hydrofilowe  działanie  grupy  polarnej  i ta- 
kie substancje  — mające  obojnacze  cechy  rozpuszczal- 
ności — nazywamy  substancjami  amfifilowymi.  Typo- 
wymi substancjami  amfifilowymi,  poza  wymieniony- 
mi już  długołańcuchowymi  kwasami  i alkoholami,  są 
również  mydła  (sole  kwasów  tłuszczowych,  rys.  12a) 
oraz  właśnie  lipidy  (rys.  12b).  Wspólną  cechą  molekuł 
tych  związków  jest  posiadanie  przez  nie  polarnej  głów- 
ki i jednego  lub  dwu  długich  ogonów  niepolarnych. 

Po  dodaniu  do  substancji  amfifilowej  niewielkiej 
ilości  wody  powstaje  uporządkowana  struktura  ciekło- 
krystaliczna. Woda  zostaje  podzielona  na  bardzo  cien- 
kie warstewki  lub  nici,  otoczone  ze  wszystkich  stron 
przez  grupy  polarne  molekuł  amfifilowych.  Otrzyma- 
ny ciekły  kryształ,  zbudowany  z kulistych  lub  wydłu- 
żonych miceli,  zawierających  rdzeń  wodny  (rys.  13a), 
lub  z cienkich  płytek,  zwanych  lamelami  (rys.  13b), 


Rys.  13.  Substancje  amfifilowe  tworzą  z wodą  okrągłe  lub 
wydłużone  miecie  (a)  oraz  płytkowe  lamele  (b) 

nazywamy  ciekłym  kryształem  liotropowym,  czyli 
powstającym  pod  wpływem  działania  rozpuszczalni- 
ka. Pojedyncze  liotropowe  lamele,  takie  jak  na  rys. 
13b,  stanowią  bazę  strukturalną  błon  biologicznych, 
połączenia  Ciekłokrystaliczny,  dwuwarstwowy  szkielet  błon 
z białkami  biologicznych,  w którym  molekuły  lipidów  są  zwró- 
cone ku  sobie  łańcuchami  węglowodorowymi,  tworzy 
skomplikowane  połączenia  z białkami.  Substancje 
białkowe  o różnej  konformacji  pokrywają  błonę  z obu 
stron  i w wielu  miejscach  ją  przenikają.  Białka  umiesz- 
czone w błonie  spełniają  wiele  różnorodnych  funkcji 
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biologicznych,  a poza  tym  dzięki  ich  obecności  błona 
staje  się  sztywniejsza,  struktura  zaś  ciekłokrystaliczna 
lipidów  nie  ulega  zniszczeniu  pod  wpływem  nadmiaru 
wody.  Przypuszcza  się  (model  Brockerhoffa),  że  dzia- 
łanie białek  polegające  na  utrwalaniu  struktury  ciekło- 
krystalicznej błon  jest  rezultatem  wiązań  wodoro- 
wych, jakie  powstają  między  grupami  karbonylowymi 
fosfolipidów  i sfingolipidów  jako  akceptorami  a biał- 
kami, cholesterolem  i wodą  — jako  donorami  wodo- 
ru. Mimo  usztywniającego  działania  białek,  błona  ma 
ciągle  naturę  cieczową.  Świadczy  o tym  duża  ruchli- 
wość molekuł  białek  w błonie,  a także  ruchliwość  anty- 
genów i molekuł  lipidów  w płaszczyźnie  błony. 

Badania  spektroskopowe,  rentgenograficzne  i ter- 
mograficzne  dowiodły,  że  lipidy  mogą  tworzyć  nie 
tylko  liotropowe,  lecz  także  termotropowe  fazy  mezo- 
morficzne,  tzn.,  że  przechodzą  w stan  cieczy  anizotro- 
powej także  bez  udziału  wody  i jedynie  pod  wpływem 
ogrzewania.  Termotropowe  przejścia  tych  substancji 
do  fazy  mezomorficznej  występują  jednak  w wysokich 
temperaturach  i wszystkie  ciekłe  kryształy,  spotykane 
w organizmach  żywych,  mają  bez  wyjątku  charakter 
liotropowy,  wynikający  z oddziaływań  lipidów  z wo- 
dą. Usunięcie  wody  z błon  powoduje,  że  lipidy  prze- 
chodzą w stan  krystaliczny,  co  oznacza  przerwanie 
procesów  życiowych  w komórkach.  Lipidy,  kwasy 
nukleinowe  i proteiny  są  aktywne  biologicznie  tylko 
w obecności  wody  i odwodnienie  powoduje  śmierć  ko- 
mórki, mimo  że  jej  skład  chemiczny  pozostanie  nie 
zmieniony. 

Ciekłe  kryształy  liotropowe,  zawarte  w strukturach 
biologicznych,  ulegają  również  przemianie  w zwykłą 
ciecz  po  ich  odpowiednim  podgrzaniu.  Interesujące 
jest,  że  temperatura  przejścia  w stan  cieczy  izotropo- 
wej wielu  liotropowych  ciekłych  kryształów  lipidów 
i wody  wynosi  41  °C,  a powyżej  tej  temperatury,  już 
niebezpiecznej  dla  człowieka,  ustają  mechanizmy  ko- 
mórkowe u wielu  pierwotniaków  i organizmów  wielo- 
komórkowych. Widać  więc,  że  procesy  życia  ulegają 
zahamowaniu  nie  tylko  wtedy,  gdy  lipidy  przechodzą 
w stan  krystaliczny,  lecz  także  wtedy,  gdy  znajdą  się 
one  w fazie  cieczy  izotropowej. 

Inną,  szczególnie  ważną  dla  struktur  błonowych 
substancją  jest  cholesterol.  Prawdopodobnie  mole- 
kuły cholesterolu  przyjmują  położenie  równoległe 
względem  molekuł  lipidów,  jak  to  przedstawiono  na 


termotropo- 
we fazy 
mezomor- 
fiozne 


cholesterol 


rysunku  14,  i przez  osłabienie  oddziaływań  między 
łańcuchami  węglowodorowymi  utrzymują  ciekłokry- 
staliczny charakter  membran  w dużym  przedziale 
temperatur. 

Relacje  między  ciekłokrystalicznym  szkieletem  błon 
biologicznych  i lekami  stanowią  ważny  problem  far- 
makologiczny. Na  przykład  dobra  rozpuszczalność 
leki  w lipidach  jest,  jak  stwierdzono,  warunkiem  aktyw- 
dziafające  ności  leków  działających  na  układ  nerwowy.  Środki 
na  układ  usypiające  i znieczulające,  leki  psychotropowe  i nar- 
nerwowy  kotyki  działają  na  układ  nerwowy  poprzez  ingerencję 
w strukturę  i funkcje  jego  cienkich  błon  ciekłokrysta- 
licznych. Jedne  z tych  substancji  mogą  unieruchamiać 
kationy  K+,  Na+  i Ca++,  przez  co  znoszą  lub  znacznie 
upośledzają  przenoszenie  sygnałów  elektrycznych  w 
nerwach,  inne  zaś,  jak  np.  znany  narkotyk  LSD,  wy- 
wołują lokalne  zmiany  w uporządkowaniu  lipidów 
w błonach,  prowadzące  do  niekontrolowanych,  halu- 
cynogennych reakcji  systemu  nerwowego. 

Obecnie  przypuszcza  się,  że  również  powstanie  ko- 
mórek tkanek  nowotworowych  związane  jest  ze  zmia- 
nami w strukturze  błon,  ponieważ  w komórkach  tych 
zanika  zdolność  reagowania  na  sygnały  przychodzące 
od  komórek  otaczających.  Komórki  rakowate  „tę- 
pieją”, w dużym  stopniu  zatracają  specjalizację  i roz- 
mnażają się  w sposób  nie  kontrolowany.  Zmiany  te 
mogą  być  spowodowane  przez  czynniki  chemiczne, 
mechaniczne,  przez  działanie  wirusów  itd. 
biofizyczne  Badania  błon  lipidowych  i uporządkowanych  ukła- 
modele  dów  makromolekuł  dostarczają  więcej  informacji 
ciekło-  o istocie  życia  niż  jakikolwiek  inny  dział  nauki.  Dla- 
krystaliczne  tego  duże  znaczenie  przypisuje  się  badaniom  modeli 
błon  biologicznych  wytworzonych  sztucznie  w postaci 
podwójnych  warstw  lipidowych.  Warstwy  takie 
umieszcza  się  jako  przegrody  między  dwoma  roztwo- 
rami elektrolitów,  zaś  mechanizmy  przewodzenia,  se- 
lektywność jonową  oraz  działanie  określonych  domie- 
szek bada  się  przez  pomiar  natężenia  prądu  oraz  asy- 
metrii przewodnictwa  w funkcji  napięcia  i w zależ- 
ności od  składu  obu  roztworów. 

Nowe  możliwości  stwarza  modelowanie  błon  przy 
użyciu  warstw  ciekłych  kryształów  o strukturze  chole- 
sterolowej. Z powodu  ułożenia  molekuł  wzdłuż  linii 
śrubowej,  grubość  tych  warstw  kilkaset  razy  przewyż- 
sza grubość  warstw  smektycznych.  Dzięki  temu  war- 
stwy cholesterolowe  mogą  być  łatwo  obserwowane 
przy  użyciu  mikroskopu  optycznego.  Istnieje  więc 
możliwość  modelowania  kształtu  błon  w zadanych 
warunkach  przestrzennych  oraz  ich  rozmieszczenia 
wewnątrz  komórek  o określonej  specjalizacji,  a także 
istnieje  możliwość  badania  zarówno  biogenezy,  jak 
i morfogenezy  błon. 

Upakowanie  pofałdowanych  i przenikających  się 
warstw  cholesterolowych  jest  podobne  do  rozmiesz- 
czenia błon  wielu  organów  specjalnych,  np.  błon  re- 
ceptorów w oku,  rozwiniętych  błon  mitochondriów 
czy  błon  w chloroplastach  u roślin  (il.  109,  110,  tabl. 
27).  Uwarstwienie  kropelek  cholesterolowych  ciekłych 
kryształów  (il.  111,  tabl.  27)  jest  często  analogiczne  do 
obserwowanego  za  pomocą  mikroskopu  elektrono- 
wego uwarstwienia  roztworów  biologicznych. 

Niezwykle  ważną  ze  względu  na  przewodzenie  im- 
pulsów nerwowych  strukturą  membranową  jest  otocz- 


ka mielinowa  aksonów,  zbudowana  z cylindrycznych,  figury 


Rys.  15.  Schemat  budowy  tworu  mielinowego  wytworzonego 
w mieszaninie  lipidów  i wody 


białkowych.  Kształt,  rozgałęzienia  i strukturę  we- 
wnętrzną tworów  mielinowych  można  łatwo  modelo- 
wać także  w ciekłych  kryształach  tematycznych,  po 
dodaniu  do  nich  estrów  cholesterolu  lub  niektórych 
substancji  aktywnych  optycznie  (il.  112,  tabl.  27). 

Badania'  cienkich  warstw  ciekłych  kryształów, 
a zwłaszcza  związków  między  ich  morfologią  a proce- 
sami transportu  masy,  energii  i ładunku  elektrycznego 
w powiązaniu  z towarzyszącymi  im  procesami  che- 
micznymi, pozwolą  znacznie  przybliżyć  rozwiązanie 
tajemnicy  materii  ożywionej.  Badania  biofizycznych 
modeli  ciekłokrystalicznych  mogą  się  okazać  czynni- 
kiem integrującym  prace  w zakresie  biochemii,  bio- 
fizyki, fizjologii  itd.  i mogą  dostarczyć  odpowiedzi  na 
trudne  pytania  z pogranicza  tych  dyscyplin.  Prawdzi- 
wą trudność  stanowi  jednak  formułowanie  popraw- 
nych pytań. 

A.  Adamczyk,  Z.  Strugalski  Ciekle  kryształy , Warszawa 
1976;  L.  M.  Blinov  Zjawiska  elektrooptyczne  w ciekłych  krysz- 
tałach, Post.  Fiz.,  28,  237  (1977);  I.  G.  Czistiakow  Źydkije 
kristalły , Moskwa  1970;  P.  G.  DE  Gennes  The  Physics  of  Liąuid 
Crystals , Oxford  1974;  S.  FribeRG,  R.  F.  Gould  (ed.)  Lyotropic 
Liąuid  Crystals  and  the  Structure  of  Biomembranes , Washington 
1956;  M.  Mięsowicz  50  lat  polskich  badań  nad  ciekłymi  kryszta- 
łami, Post.  Fiz.  26,  129  (1975). 


Współczesne  teorie  symetrii 
w krystalografii 

Zygmunt  Trzaska  Durski 


Rozwój  klasycznej  teorii  symetrii  kryształów  został 
ukoronowany  opracowaniem  przez  J.  S.  Fiodorowa, 
A.  M.  Schoenfliesa  i W.  Bari  owa,  w latach  osiemdzie- 
siątych ubiegłego  stulecia,  teorii  230  grup  przestrzen- 


nych. Wydawało  się  wówczas,  że  prace  nad  teorią  sy-  klasyczna 
metrii  kryształów  zostały  tym  samym  całkowicie  teoria 
zakończone,  że  nic  więcej  w tej  dziedzinie  nie  będzie  symetrii 
można  zrobić.  Jednak  już  wkrótce  w pracach  samego  kryształów 
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Rys.  1.  Jedno- 
rodne deforma- 
cje: sześcian  (a) 
przechodzi  w 
romboedr  w wy- 
niku rozciągnię- 
cia (b),  lub  ściś- 
nięcia (c)  wzdłuż 
trójkrotnej  osi  sy- 
metrii (ustawio- 
nej pionowo  na 
rys.  a) 


Fiodorowa  pojawiły  się  elementy  uogólniające  teorię 
symetrii.  Fiodorow  wprowadził  bowiem  do  krystalo- 
grafii pojęcie  „symetrii  pozornej”  kryształów.  Okaza- 
ło się  więc,  że  nie  wszystko  w teorii  symetrii  jest  już 
wiadome. 

W naszym  stuleciu  rozwój  teorii  symetrii  przebiegał 
w dwu  kierunkach.  Jeden  — dotyczył  doskonalenia 
i opracowywania  szczegółów  klasycznej  teorii  symetrii, 
drugi  — uogólnień  tej  teorii.  Przyjrzyjmy  się  bliżej 
niektórym  fragmentom  tych  prac. 

Doskonalenie  teorii  symetrii  obejmowało  prace  nad 
symetrią  różnorodnych  figur  skończonych  i nieskoń- 
czonych. I tak  np. : 1)  stwierdzono  istnienie  siedmiu 
grup  symetrii  bordiur,  tzn.  szlaków  ornamentacyjnych 
(P.  Niggli,  G.  Polya);  2)  wyprowadzono  31  grup  sy- 
metrii wstęg  (A.  Speiser);  3)  opracowano  teorię  sy- 
metrii rdzeni  i stwierdzono  istnienie  dla  nich  75  grup 
symetrii  (C.  Hermann) ; 4)  ustalono  istnienie  80  grup 
symetrii  warstw  (K.  Herman,  E.  Alexander,  C.  Her- 
mann, L.  Weber) ; 5)  stwierdzono  możliwość  występo- 
wania najgęstszych  ułożeń  kul  o jednakowym  promie- 
niu tylko  w 8 grupach  przestrzennych  (N.  W.  Biełow). 

Do  tego  rodzaju  prac  należy  też  zaliczyć  prace  nad 
krystalograficznymi  i strukturalnymi  odmianami  po- 
staci prostych,  nad  postaciami  krawędziowymi  i wierz- 
chołkowymi (-*  Budowa  kryształów).  Stosowane  wy- 
żej nazwy:  bordiura,  wstęga,  rdzeń,  warstwa  — nie 
mają  znaczenia  potocznego,  lecz  są  ściśle  określonymi 
terminami  naukowymi.  Rdzeń  definiuje  się  np.  jako 
figurę  z jednym  kierunkiem  szczególnym,  nie  mającą 
szczególnych  punktów  i płaszczyzn.  Szczególnymi  na- 
zywają się  tu  takie  punkty,  proste  i płaszczyzny,  które 
nie  mają  w danej  figurze  punktów,  prostych  i płasz- 
czyzn sobie  równoważnych.  Punktem  szczególnym  jest 
np.  środek  kwadratu,  a szczególną  prostą  — cztero- 
krotna oś  symetrii  kwadratu  (w  kwadracie  nie  ma  bo- 
wiem innego  środka  lub  innej  osi  czterokrotnej). 

Uogólnień  klasycznej  teorii  symetrii  można  było 
poszukiwać  przez  zmianę  lub  rozszerzenie  podstawo- 
wych założeń  teorii,  a takimi  są  np.  pojęcia:  równości 
figur,  figury  symetrycznej,  przekształcenia  symetrycz- 
nego. Utworzone  dotychczas  nowe  teorie  symetrii  są 
głównie  oparte  na  różnym  rozumieniu  pojęcia  rów- 
ności figur.  Pojęcie  to  zostało  sformułowane  w XIX  w. 
przez  A.  F.  Moebiusa.  Według  Moebiusa  dwie  figury 
są  równe  wtedy,  gdy  każdemu  punktowi  jednej  figury 
odpowiada  punkt  w drugiej  figurze,  a odległość  między 
dwoma  dowolnymi  punktami  jednej  figury  jest  równa 
odległości  między  dwoma  takimi  samymi  punktami 
drugiej  figury.  W klasycznej  teorii  symetrii  wszystkie 
przekształcenia  symetryczne  figur  (->  Budowa  krysz- 
tałów) są  przekształceniami  izometrycznymi,  tzn.  nie 
zmieniającymi  odległości  między  punktami.  W wyniku 
swoistych  rewizji  pojęcia  równości  figur  i rezygnowa- 
nia z izometryczności  przekształceń  wyrosły  nowe, 
ogólniejsze  w porównaniu  z klasyczną,  teorie  symetrii. 

Pierwsze  teorie  uogólniające  klasyczną  teorię  sy- 
metrii zostały  przedstawione  w pracach  J.  S.  Fiodoro- 
wa o symetrii  pozornej  (1901)  i C.  M.  Vio!i  o harmo- 
nii kryształów  (1904).  Później,  w 1925  r.  D.  W.  Naliw- 
kin  opublikował  pracę  o symetrii  krzywoliniowej,  w 
latach  1947-1951  W.  I.  Michiejew  opracował  teorię 
homologii  kryształów,  a w 1960  r.  A.  W.  Szubnikow 
sformułował  teorię  symetrii  podobieństwa.  Jednak  naj- 
bardziej doniosłą  w skutkach,  mającą  ogromny  wpływ 
na  dalszy  rozwój  i na  dalsze  uogólnianie  teorii  syme- 
trii, okazała  się  teoria  antysymetrii  A.  W.  Szubniko- 
wa  (1951). 

Symetria  pozorna  J.  S.  Fiodorowa  wynikła  z jego 
prac  nad  deformacjami  jednorodnymi  figur  geome- 
trycznych i kryształów.  Jednorodnymi,  tzn.  nie  zmie- 
niającymi charakteru  figury:  figura  wyjściowa  i po- 
chodna mają  np.  taką  samą  liczbę  wierzchołków,  kra- 
wędzi, ścian.  Deformacje  jednorodne  powstają  w re- 
zultacie rozciągnięcia  (lub  ściśnięcia)  albo  „przesunię- 
cia” figur.  W wyniku  jednorodnej  deformacji  figura 
zmienia  swoją  symetrię.  Tak  więc  operacje  rozciągania 
(lub  ściskania)  i przesunięcia  nie  są  operacjami  syme- 
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trii,  lecz  jak  wykazał  później  W.  I.  Michiejew  jedno- 
rodne deformacje  są  operacjami  homologii.  Sześcian 
poddany  rozciągnięciu  lub  ściśnięciu  przekształca  się 


w romboedr  (rys.  1),  a poddany  przesunięciu  przemie- 
nia się  w równoległościan  jednoskośny  (rys.  2)  lub 
trójskośny  Możliwe  są  także  przekształcenia  odwrotne 
(np.  romboedr  — ► sześcian).  Dowolny  wielościan  pod- 
dany jednorodnej  deformacji  pozostaje  wielościanem. 
Przy  rozciąganiu  (lub  ściskaniu)  objętość  wielościanu 
ulega  zmianie,  przy  przesunięciu  objętość  pozostaje 
bez  zmiany.  W obydwu  przypadkach  zmienia  się  po- 
stać równoległościanu.  Badanie  jednorodnych  defor- 
macji doprowadziło  Fiodorowa  do  określenia  operacji 
symetrii  pozornej.  W celu  scharakteryzowania  syme- 
trii pozornej  Fiodorow  wprowadził  pojęcie  elementów 
symetrii  pozornej : osi  i płaszczyzny  symetrii  pozornej 
(np.  odbicie  w płaszczyźnie  symetrii  pozornej  może 
przekształcić  trójkąt  ukośnokątny  w trójkąt  prosto- 
kątny). Według  Fiodorowa  wielościanami  pozornie 
symetrycznymi  względem  siebie  są : wielościan  rzeczy- 
wiście symetryczny  (tj.  mający  klasyczne  elementy 
symetrii)  i wielościan  dowolny  mający  taką  samą  liczbę 
tak  samo  ułożonych  ścian  (jak  wielościan  pierwszy). 

C.M.  Viola  opisał  i scharakteryzował  harmoniczne 
własności  kryształów  oraz  samą  harmonię,  z której 
bezpośrednio  wynika  symetria.  Figura  przestrzenna 
może  być  harmoniczna  względem  środka  harmonii, 
płaszczyzny  lub  osi  harmonii  (są  to  elementy  harmo- 
nii). Na  przykład  płaszczyzną  harmonii  danej  figury 


Rys.  3.  Figury  harmoniczne  względem  jednej  (yy)  i dwóch 
(xx,  yy)  płaszczyzn  harmonii 

jest  taka  płaszczyzna,  która  dzieli  na  połowy  odległo- 
ści między  odpowiednimi  punktami  znajdującymi  się 
na  równoległych  prostych  (rys.  3).  Równoległe  do 
siebie  promienie  rzutujące  płaszczyzny  harmonii  two- 
rzą z tą  płaszczyzną  pewien  kąt.  Płaszczyzna  symetrii 
jest  więc  tym  szczególnym  rodzajem  płaszczyzny  har- 
monii, przy  którym  promienie  rzutujące  są  prosto- 
padłe do  płaszczyzny.  Harmonia  Violi  jest  identyczna 
z symetrią  pozorną  Fiodorowa. 

W.  I.  Michiejew  opierając  się  na  pracach  Fiodorowa 
i Violi  opracował  teorię  homologii  kryształów  i wyka- 
zał, że  zarówno  symetria  pozorna,  jak  i harmonia  są 
homologią.  Homologia  jest  własnością  figur  polega- 
jącą na  jednoznacznej  odpowiedniości  między  wszy- 
stkimi ich  elementami,  przy  tym  odpowiadające  sobie 
elementy  figur  są  jednorodne,  lecz  niekoniecznie  jed- 
nakowe. Dwie  homologiczne  figury  nie  są  sobie  równe, 


symetria 

pozorna 


harmonia 


homologia 


tylko  są  do  siebie  podobne  w tym  sensie,  że  dowolnej 
prostej  w jednej  z nich  odpowiada  prosta  w drugiej,  a 
dowolnej  płaszczyźnie  w pierwszej  figurze  odpowiada 
płaszczyzna  w drugiej  itd.  Homologiczne  względem  sie- 
bie są  np.  dowolne  dwa  trójkąty  — niezależnie  od  dłu- 
gości ich  boków  i kątów  między  bokami.  Homologicz- 
nymi względem  siebie  są  także  każde  dwa  dowolne 
prostopadłościany,  jak  np.  sześcian  i słup  tetragonaln> 
zamknięty  dwuścianem.  Przekształceniem  homolo- 
gicznym nazywa  się  każde  przekształcenie  przeprowa- 
dzające daną  figurę  w figurę  względem  niej  homolo- 
giczną. Pierwszymi  przekształceniami  homologiczny- 
mi zastosowanymi  w krystalografii  były  jednorodne 
deformacje  Fiodorowa. 

elementy  W homologii  kryształów  odpowiednikiem  elemen- 

hotnologit  tów  symetrii  z klasycznej  teorii  symetrii  są  elementy 
homologii.  Do  nich  należą,  prócz  zwykłych  elemen- 
tów symetrii,  płaszczyzna  homologii,  osie  homologii 
(o  takiej  samej  krotności  jak  w symetrii  klasycznej) 
oraz  osie  inwersyjne  homologii.  Płaszczyzna  homo- 
logii TI  jest  płaszczyzną  ukośnego  odbicia,  tzn.  że  pro- 
mienie rzutujące  (które  dla  płaszczyzny  symetrii  są 
do  niej  prostopadłe)  tworzą  z płaszczyzną  IT  pewien 
kąt.  Na  rys.  4 przedstawiono  przekształcenie  homolo- 
giczne kuli  w wyniku  działania  płaszczyzny  II.  Oś  ho- 


Rys.  4.  Kula  po  odbiciu  w płaszczyźnie  homologii  U przechodzi 
w elipsoidę 


Rys.  5.  Elementy  homologii 
ukośnego  walca  o eliptycznej 
podstawie  są  następujące:  oś 
homologii  o nieskończonej  krot- 
ności Aoo*  płaszczyzna  homolo- 
gii II  równoległa  do  płaszczyzny 
podstawy,  płaszczyzna  symetrii 
ABEF , 2-krotna  oś  symetrii  rów- 
noległa do  płaszczyzny  podsta- 
wy, środek  symetrii  oraz  nie- 
skończony zbiór  płaszczyzn  ho- 
mologii przechodzących  (czyli 
równoległych)  przez  Aoo 


mologii  An  jest  prostą,  za  pomocą  której  przeprowa- 
dza się  ukośny  kołowy  lub  eliptyczny  obrót.  Przy  ta- 
kim obrocie  każdy  punkt  układu  porusza  się  na  ogół 
po  elipsie  (lub  po  kole),  przy  czym  elipsa  czy  koło  leżą 
w płaszczyźnie,  która  może  tworzyć  z osią  pewien  kąt 
(rys.  5).  Elementy  symetrii  są  rodzajem  elementów 
homologii. 

klasy  Istnieje  215  klas  homologii,  czyli  różnych  możli- 
homologiii  wych  w kryształach  zespołów  elementów  homologii. 
i harmonie  podobnie  jak  klasy  symetrii  łączy  się  w układy  krysta- 
lograficzne, tak  klasy  homologii  łączy  się  w harmonie 
(jest  ich  7,  a mianowicie:  harmonia  trój  skośna,  jędno- 
skośna,  rombowa,  trygonalna,  tetragonalna,  heksa- 
gonalna i regularna).  W każdej  klasie  homologii  moż- 
na wyprowadzić  postacie  proste  homologii,  w których 
ściany  tworzące  jedną  postać  homologii  mogą  należeć 
do  różnych  krystalograficznych  postaci  prostych.  Mi- 


chiejew  sformułował  również  pojęcie  przestrzennej 
grupy  homologii  i prawidłowego  zespołu  figur  homo- 
logicznych (odpowiedników  grup  przestrzennych  i ze- 
społu pozycji  symetrycznie  równoznacznych).  Podda- 
jąc zespół  punktów  symetrycznie  równoznacznych  de- 
formacjom jednorodnym,  można  otrzymać  prawidło- 
wy zespół  figur  homologicznych,  przy  czym  elementy 
symetrii  grupy  przestrzennej  przemieniają  się  w ele- 
menty homologii  i tworzą  grupę  przestrzenną  homo- 
logii. 

W celu  opisywania  symetrii  organizmów  żywych 
geolog  i paleontolog  — D.  W.  Naliwkin  stworzył  po- 
jęcie symetrii  krzywoliniowej.  Według  Naliwkina 
w przyrodzie  istnieje  wiele  obiektów,  które  łatwo  wy- 
ginają się  i wyprostowują  i tym  samym  stają  się  raz 
symetryczne  krzywoliniowo,  a drugi  raz  — symetrycz- 
ne prostoliniowo.  Przejście  z jednego  stanu  w drugi 
jest  nadzwyczaj  łatwe  i właściwie  niezauważalne. 
Zwróćmy  uwagę  np.  na  żmiję.  Jeśli  leży  ona  nierucho- 
mo wyprostowana,  to  zarys  jej  ciała  wykazuje  sy- 
metrię względem  płaszczyzny  symetrii  (pionowej).  Wy- 
starczy jednak,  aby  żmija  poruszyła  się,  wygięła,  aby 
jej  symetria  prostoliniowa  znikła.  Czy  w wyniku  po- 
ruszenia się,  pełznięcia  żmii,  symetria  jej  ciała  w ogóle 
zginęła?  Oczywiście  — nie,  nastąpiła  tylko  przemiana 
symetrii  prostoliniowej  w symetrię  krzywoliniową. 
Płaszczyzna  symetrii  zmieniła  się  w zakrzywioną  po- 
wierzchnię symetrii.  Podobnie  jest  z człowiekiem.  Cia- 
ło człowieka,  np.  stojącego,  ma  pionową  płaszczyznę 
symetrii.  Co  się  stanie,  gdy  człowiek  nieco  się  wygnie 
w bok?  Czy  ciało  straci  przez  to  symetrię  płaszczyzno- 
wą? Oczywiście  że  nie,  zajdzie  wtedy  jedynie  przemia- 
na płaszczyzny  symetrii  w zakrzywioną  powierzchnię 
symetrii  (tj.  płaszczyznę  symetrii  krzywoliniowej).  Po- 
dobnie i zgięty  kryształ  może  stać  się  symetryczny 
krzywoliniowo.  Postacie  symetryczne  prostoliniowo 
są  szczególnym  rodzajem  postaci  o symetrii  krzywoli- 
niowej. W świecie  nieorganicznym  przeważają  posta- 
cie proste,  słabo  wygięte,  w organicznym  — silnie  wy- 
gięte, a nawet  skręcone. 

Symetria  krzywoliniowa  może  powstawać  w wyniku 
zgięcia  lub  skręcenia  zwykłych  symetrycznych  figur. 
Elementami  symetrii  krzywoliniowej  mogą  być:  oś 
symetrii  krzywoliniowa,  oś  symetrii  spiralna,  po- 
wierzchnia symetrii  zakrzywiona  (tj.  płaszczyzna  sy- 
metrii krzywoliniowej),  powierzchnia  symetrii  spi- 
ralna, a także  — środek  symetrii,  osie  symetrii,  płasz- 
czyzna symetrii.  Elementy  symetrii  są  szczególnymi 
rodzajami  elementów  symetrii  krzywoliniowej.  Jeżeli 
walec  (rys.  6)  zegnie  się  tak,  aby  jego  tworząca  prze- 
mieniła się  w łuk  koła,  to  płaszczyzna  symetrii  ABCD 
walca  pozostanie  płaszczyzną  symetrii  także  i dla  zgię- 
tego walca,  natomiast  płaszczyzna  EFGH  przemieni 
się  w płaszczyznę  symetrii  krzywoliniowej ; oś  symetrii 
MN  o nieskończonej  krotności  (£«>)  zmieni  się  w oś 
symetrii  krzywoliniowej.  Tak  więc  figury  niesyme- 
metryczne  (w  pojęciu  symetrii  klasycznej)  można  roz- 
patrywać jako  krzywoliniowo  symetryczne. 


Rys.  6.  Walec  po  zgięciu  staje  się  figurą  o krzywoliniowych  ele- 
mentach symetrii 
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Symetria  krzywoliniowa  jest  rodzajem  homologii, 
a symetria,  symetria  pozorna  i harmonia  są  szczegól- 
nymi rodzajami  symetrii  krzywoliniowej.  Dla  symetrii 
krzywoliniowej  podjęto  również  próby  określenia  mo- 
żliwych kombinacji  elementów  symetrii  krzywolinio- 
wej i wyprowadzenia  niektórych  klas  symetrii  krzywo- 
liniowej i płaskich  postaci  „krzywokrawędziowych” 
(P.L.  Dubów). 

Chyba  każdy  zna  z lat  dziecinnych  rosyjską  drew- 
nianą zabawkę  — składaną  laleczkę,  w której  po  ot- 
warciu znajduje  się  następna  laleczka  — mniejsza, 
symetria  a w tej  jeszcze  jedna,  którą  też  można  otworzyć  i w jej 
podobień-  wnętrzu  znaleźć  następną  jeszcze  mniejszą  itd.  Takich 
stwa  laleczek,  jedna  w drugiej  jest  kilka  lub  kilkanaście 
(rys.  7).  Wszystkie  laleczki  są  właściwie  takie  same. 


Rys.  7.  Symetria  podobieństwa : drewniane  laleczki  „matrioszki” 


W nauce  o symetrii  podobieństwa  za  jednakowe  — 
jak  już  wspomniano  — uważa  się  nie  tylko  rzeczywi- 
ście jednakowe  figury,  ale  i wszystkie  do  nich  podob- 
ne, tj.  figury  o tym  samym  kształcie.  Analogicznie  do 
operacji  symetrii  można  wprowadzić  operacje  syme- 
trii podobieństwa,  które  są  swoistymi  analogami  trans- 
lacji, odbić  w płaszczyznach  zwykłych  i poślizgu,  oraz 


Rys.  8.  Symetria 
podobieństwa: 
przykład  operacji  K 


obrotów  wokół  osi  zwykłych  i śrubowych,  z tą  tylko 
różnicą,  że  wszystkie  te  operacje  związane  są  z równo- 
czesnym zwiększeniem  (lub  zmniejszeniem)  skali  figur 
i odległości  między  figurami.  Operacja  K jest  naj- 
prostszą operacją  symetrii  podobieństwa;  polega  ona 
na  przenoszeniu  wszystkich  podobnych  części  figury 
w położenia  równoległe,  przy  jednoczesnym  zwiększa- 
niu lub  zmniejszaniu  skali  tych  części  i odległości  mię- 
dzy nimi  n razy  (rys.  8).  Operacja  L składa  się  z kolej- 
no przeprowadzanych  obrotów  podobnych  części  fi- 
gury wokół  nieruchomej  osi  o pewien  stały  kąt  9?, 
którym  towarzyszy  odpowiednie  przesuwanie  figury 
w kierunku  do  osi  (lub  od  osi,  jeśli  operacja  jest  prowa- 
dzona z wnętrza  figury;  rys.  9).  Odpowiadające  so- 
bie punkty  podobnych  części  figury  powinny  leżeć  na 
spirali  logarytmicznej.  Operację  L można  nazwać  spi- 
ralnym ruchem  wokół  osi  podobieństwa.  Łatwo  moż- 
na zauważyć,  że  operacja  K jest  równoważna  operacji 


Rys.  9.  Konstruk- 
cja figury  mającej 
symetrię  podobień- 
stwa L 


ale  różni  je  ich  wielkość.  Laleczki  są  w pewnym  sensie 
jednakowe,  wyczuwa  się  tutaj  pewien  rytm,  pewne  po- 
wtarzanie się,  a jeśli  występuje  powtarzanie  się,  to  jest 
i symetria.  Tym  razem  jest  to  jednak  dziwna  symetria. 
Figury  są  jednakowe,  ale  różnią  się  wielkością.  Każ- 
dym dwu  punktom  jednej  figury  odpowiadają  dwa 
punkty  drugiej  figury,  ale  odległość  między  nimi  jest 
inna.  Każdej  prostej  czy  płaszczyźnie  w jednej  figurze 
odpowiada  prosta  czy  płaszczyzna  w drugiej,  ale 
o innej  wielkości.  H.  Weyl,  który  pierwszy  poddał 
myśl  matematycznego  opisania  takich  prawidłowości, 
nazwał  taką  „symetrię”  podobieństwem,  a A.  W.  Szub- 
nikow,  który  taki  opis  stworzył  nazwał  ją  symetrią 
podobieństwa. 

Historia  powstania  i rozwoju  pojęcia  symetrii  po- 
dobieństwa sięga  w daleką  przeszłość,  a tworzyli  ją 
symetria  uczeni,  malarze  i architekci.  Już  Leonardo  da  Vinci 
podobień-  stosował  symetrię  podobieństwa  w postaci  perspekty- 
stwa  wy.  Symetrię  podobieństwa  obserwuje  się  często  w 
f przyrodzie  przyrodzie,  np.  w ułożeniu  liści  na  młodych  pędach 
i sztuce  roślin,  w prawidłowym  ułożeniu  ziarenek  w kwiatach 
słonecznika  czy  rumianku,  w spiralnych  postaciach 
muszli  amonitów,  w stożkowych  kształtach  wielu 
drzew  (np.  jodła),  w szkieletowych  postaciach  kryszta- 
łów i w tzw.  piramidach  wzrostu  kryształów  (il.  63, 
64,  66,  tabl.  17). 


Rys.  10.  Przykłady  figur  mających  symetrię  podobieństwa  M 
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Rys.  11.  Przykłady  figur  mających  symetrię  podobieństwa  L 
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L przeprowadzanej  przy  <p  = 2n  (tj.  K = L(<p  = 2n)). 
Na  rys.  11  pokazano  przykłady  figur  skonstruowa- 
nych przy  zastosowaniu  operacji  L.  Operacja  M jest 
analogiem  operacji  odbicia  zwykłego  lub  poślizgowe- 
go w symetrii  klasycznej;  nazywa  się  ją  odbiciem  w 
płaszczyźnie  podobieństwa  (rys.  10).  Operacje  K,  L 
i M są  operacjami  symetrii  podobieństwa  figur  dwu- 


Rys.  12.  Trójwymiarowa  figura  powstała  w wyniku  operacji  N 
symetrii  podobieństwa 


wymiarowych  (płaskich).  Operacja  N jest  operacją  sy- 
metrii podobieństwa  figur  przestrzennych  (rys.  12) 
i można  ją  interpretować  jako  iloczyn  operacji 
L(<p  ^ 2n)  i operacji  K = L(ę?  = 2jc),  pod  warun- 
kiem, że  obydwie  osie  są  wzajemnie  równoległe.  W re- 
zultacie operacja  N powoduje  ruch  podobnych  części 
figury  po  rozszerzającej  się  linii  śrubowej. 

Operacjami  symetrii  podobieństwa  są  oczywiście 
także  operacje  klasycznej  symetrii,  stanowiące  szcze- 
gólny rodzaj  ogólniejszych  operacji  symetrii  podobień- 
stwa. 

Operacje  symetrii  podobieństwa  można  składać  ze 
sobą,  tworzyć  ich  kombinacje.  Powstają  przy  tym  gru- 
py symetrii  podobieństwa.  Kilka  przykładów  figur  na- 
leżących do  różnych  grup  pokazano  na  rys.  13. 

Jak  już  wspomniano  poprzednio,  A.  W.  Szubnikow, 
opierając  się  na  wcześniejszych  pracach  A.  Speisera 
(1927)  i L.  Webera  (1929),  sformułował  jeszcze  jed- 
antysymetria  ną  nową  teorię  symetrii,  mianowicie  teorię  antysy- 
metrii.  W przyrodzie  często  spotyka  się  przedmioty 
podobne  do  siebie  a właściwie  równe  sobie  w pewien 
szczególny  sposób,  mianowicie:  jak  pozytyw  i ne- 
gatyw fotograficzny  jednego  i tego  samego  przed- 
miotu, jak  medal  i odcisk  medalu,  jak  pozyton  i elek- 
tron, jak  +1  i — 1,  jak  śruba  i gwint,  jak  postacie 
wzrostu  i postacie  rozpuszczania  kryształów,  jak  pra- 
wa biała  rękawiczka  z czarnym  mankietem  i czarna 


prawa  rękawiczka  z białym  mankietem.  Szubnikow 
ten  rodzaj  równości  figur  nazwał  ich  antyrównością. 
Ogólnie  biorąc,  za  antyrówne  można  uważać  figury 

0 jednakowym  kształcie  i jednakowych  rozmiarach, 
lecz  przeciwstawne  sobie  pod  względem  jakiejś  włas- 
ności: np.  barwy,  znaku,  ładunku  elektrycznego,  kie- 
runku momentu  magnetycznego. 

Stosunki  symetryczne,  jakie  mogą  zachodzić  mię- 
dzy antyrównymi  przedmiotami,  figurami,  Szubnikow 
nazwał  antysymetrią. 

Przekształcenie  antysymetryczne  można  zdefinio- 
wać jako  przekształcenie  symetryczne  przemieniające 
figurę  białą  w czarną  lub  zmieniające  znak  figury  (4- 
na  — ),  czyli  mówiąc  ogólnie  — zmieniające  własność 
figury  na  przeciwną.  Szubnikow  sformułował  więc  po- 
jęcie antysymetrii  jako  zasadnicze  rozszerzenie  syme- 
trii klasycznej  w wyniku  dodania  zmiany  własności 
fizycznej. 

W teorii  antysymetrii  każdemu  punktowi  przypisuje 
się  znak  + lub  — w dowolnym  znaczeniu,  interpreto- 
wanym zwykle  jako  własności  fizyczne:  znak  ładunku 
elektrycznego,  czarny  lub  biały  kolor  itp.  Przekształ- 
ceniem antysymetrycznym  nazywa  się  więc  izome- 
tryczne  przekształcenie  figury  w siebie  samą  przy  rów- 
noczesnej zmianie  znaku  każdego  punktu.  W teorii 
antysymetrii  rozpatruje  się  figury  charakteryzujące 
się  trzema  własnościami:  +1,  — 1,  0 (np.  figura  biała, 
czarna  i szara).  Figury  szare  nazywa  się  także  figura- 
mi neutralnymi. 

W klasycznej  teorii  symetrii  operacje  symetrii  prze- 
prowadzane w przestrzeni  trójwymiarowej  na  trójwy- 
miarowych figurach  skończonych  można  formalnie 
rozpatrywać  jako  operacje  w przestrzeni  czterp wy- 
miarowej. Operacje  takie  pozostawiają  nie  zmienioną 
czwartą  współrzędną  (*4)  równą  zeru  dla  wszystkich 
punktów  figury.  W tym  ujęciu  operacje  antysymetrii 
można  rozpatrywać  również  jako  operacje  w przestrze- 
ni czterowy miarowej,  które  nie  zmieniając  bezwzględ- 
nych wartości  współrzędnych  punktów  figury  wzglę- 
dem osi  Xx,  zmieniają  ich  znak. 

Analogicznie  do  elementów  symetrii  istnieją  ele- 
menty antysymetrii  — środek,  osie  i płaszczyzna  anty- 
symetrii, anty  translacja,  śrubowe  osie  antysymetrii 

1 antypłaszczyzny  poślizgu.  Przekształcenie  antysyme- 
tryczne działa  zawsze  w połączeniu  ze  zwykłymi  ele- 
mentami symetrii.  Działania  różnych  elementów  anty- 
symetrii i porównanie  ich  z przekształceniami  syme- 
trycznymi przedstawiono  na  rys.  14  i 15.  Rysunek  16 
pokazuje  działanie  elementów  antysymetrii  (niektó- 
rych) na  asymetryczny  czworościan. 

Szubnikow  wykazał,  że  istnieje  tylko  122  krystalo- 
graficznych punktowych  grup  antysymetrii  (tzn.  klas 
antysymetrii;  klasy  antysymetrii  nazywa  się  także  kla- 
sami symetrii  magnetycznej),  a w tym:  32  grupy  po- 
larne (jednobarwne,  np.  tylko  białe),  odpowiadające 
figurom,  których  punkty  symetrycznie  równoznaczne 


antyrówność 

figur 


przekształ- 
cenie anty- 
symetryozne 


elementy 

antysymetrii 


punktowe 

grupy 

antysymetrii 


symetria  6-L  (<p  = ~: rc/8)  symetria  3-mM.  symetria  6-M 

Rys.  13.  Figury  o złożonej  symetrii  podobieństwa  (liczba  przed  symbolem  operacji  oznacza  krotność  osi  symetrii) 
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Rys.  14.  Działanie  6-krotnej  osi  symetrii  prostopadłej  do  płaszczyzny  rysunku  (a)  obraz  działanie  6-krotnej  osi  antysymetrii  6' 
(b);  obróceniu  figury  o 60°  w płaszczyźnie  rysunku  towarzyszy  zmiana  barwy  figury 


Rys.  15.  Figury  symetryczne  (a,  b,  c)  i antysymetryczne  (d,  e,  f). 
Symetria  figur:  a)  płaszczyzna  symetrii  m;  b)  dwukrotna  oś 
symetrii  2;  c)  środek  symetrii  1;  d)  płaszczyzna  antysymetrii  m 
e)  dwukrotna  oś  symetrii  2',  f)  środek  antysymetrii  Y 


Rys.  16.  Działanie  elementów  antysymetrii  na  asymetryczny 
czworościan:  a)  środek  antysymetrii  Y,  b)  płaszczyzna  antysy- 
metrii m\  c)  dwukrotna  oś  antysymetrii  2',  d)  czterokrotna  o 
antysymetrii  4' 


Rys.  17.  Przykład  postaci  prostych  w klasie  symetrii  m oraz 
w klasie  antysymetrii  tri 


mają  jeden  znak  (barwę),  i pokrywające  się  z klasycz- 
nymi grupami  punktowymi ; 32  grupy  neutralne  (sza- 
re), odpowiadające  figurom,  których  punkty  nie  mają 
żadnego  znaku;  58  grup  o mieszanej  polamości  (dwu- 
barwnych,  czarno-białych),  odpowiadających  figu- 
rom, których  punkty  symetrycznie  równoznaczne 
mają  różne  znaki.  Szubnikow  wprowadził  również  po- 
jęcie postaci  prostych  dla  grup  o mieszanej  polamości 
(rys.  17). 

Uwzględniając  przekształcenie  antysymetryczne 
otrzymuje  się  22  dwubarwne  typy  sieci  Bravais’go 
(prócz  14  zwykłych,  jednobarwnych).  Grupami  szub- 
nikowskimi  nazwano,  na  cześć  twórcy  teorii,  grupy 
przestrzenne  symetrii  magnetycznej,  tj.  grupy  prze- 
strzenne uwzględniające  antysymetrię.  Grup  tych  jest 
1651,  a w ich  skład  wchodzi:  230  przestrzennych  grup 
fiodorowskich  (polarnych,  białych);  230  grup  neutral- 
nych (szarych)  oraz  1191  grup  o mieszanej  polamości 
(czarno-białych).  Grupy  szubriikowskie  zostały  wy- 
prowadzone po  raz  pierwszy  przez  A.  M.  Zamorzaje- 
wa  (1953)  i niezależnie  od  niego  przez  N.  W.  Biełowa, 
N.  N.  Neronową  i T.  S.  Smirnową  (1955). 

Rozwój  teorii  symetrii  nie  zakończył  się  z chwilą  po- 
jawienia się  prac  Szubnikowa  o antysymetrii  i podo- 
bieństwie. W krótkim  czasie  pojawiły  się  dalsze  uogól- 
nienia tych  teorii.  Sam  Szubnikow,  w 1945  r.,  a więc 
jeszcze  na  kilka  lat  przed  ukazaniem  się  jego  książki 
o antysymetrii  stwierdził,  że  jednemu  punktowi  można 
przypisać  nie  tylko  jeden,  lecz  równocześnie  kilka  zna- 
ków. Tę  myśl,  aby  antysymetrię  uogólnić,  Zamorza- 
jew  i jego  szkoła  rozwinęli  w postaci  antysymetrii 
wielokrotnej,  nazwanej  też  przez  nich  anty  symetrią 
różnego  rodzaju. 

W teorii  antysymetrii  wielokrotnej  każdemu  punk- 
towi figury  przypisuje  się  skończoną  liczbę  / znaków 
4-  lub  — , mających  różne  fizyczne  interpretacje. 
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Pierwszy  znak  może  oznaczać  np.  barwę  białą  lub 
czarną,  drugi  — znak  ładunku  elektrycznego  itp.  Jeżeli 
np.  I ■=  2,  tj.  gdy  punktowi  przypisane  są  dwa  znaki, 
to  w wyniku  przekształcenia  antysymetrycznego  pier- 
wszego, drugiego  czy  trzeciego  (mieszanego)  rodzaju 
ulegnie  zmianie  tylko  pierwszy,  tylko  drugi,  albo 
obydwa  znaki  równocześnie,  np.  (-f+)^( — r), 
(++)5±(+-),  (++)5±(--).  Ogółem  istnieje 
2l  — 1 różnych  rodzajów  antysymetrii. 

Pojęciem  bliskim  antysymetrii  wielokrotnej  są  „gru- 
py złożone”  wprowadzone  do  teorii  symetrii  przez 
A.  L.  Mackaya  (1957). 

Innym  uogólnieniem  antysymetrii  jest  symetria 
barwna  N.  W.  Biełowa  i T.  N.  Tarchowej  (1956).  Śru- 
bowe osie  symetrii,  płaszczyzny  poślizgu  i centrowane 
typy  sieci  Bravais’go  powodują,  że  zespół  punktów 
symetrycznie  równoznacznych  (tj.  zespół  prawidłowy 
punktów)  w położeniu  ogólnym  rozmieszcza  się  w ko- 
mórce elementarnej  na  kilku  poziomach.  Zabarwia- 
jąc na  różne  kol  ory  rzuty  tych  punktów  na  płaszczyznę 
prostopadłą  do  krystalograficznej  osi  Z,  otrzymuje  się 
wielobarwny  zespół  prawidłowy  punktów.  Dla  osi  2l9 
42, 63,  płaszczyzn  c,  n i sieci  A , /,  Z7  będzie  to  dwubarw- 
ny  zespół  punktów.  Dwie  barwy  na  płaszczyźnie  rzutu 
odpowiadają  więc  ułożeniu  punktów  symetrycznie  rów- 
noznacznych na  dwóch  poziomach  związanych  ze  sobą 
osią  śrubową  lub  płaszczyzną  poślizgu.  Stosunki  sy- 
metryczne istniejące  w figurach  dwubarwnych  są  po 
prostu  antysymetrią.  Inaczej  jest,  gdy  elementy  sy- 
metrii lub  sama  sieć  powodują  rozmieszczenie  zespołu 
punktów  symetrycznie  równoznacznych  na  3,  4 lub  6 
poziomach  (symetria  krystalograficzna).  Tego  rodzaju 
rozmieszczenie  dają  osie  3łf  32,  6*,  64  (trzy  poziomy); 
osie  4ls  43  i płaszczyzna  d (cztery  poziomy)  oraz  osie 
61,  65  (sześć  poziomów).  Rozmieszczenie  punktów  na 
trzech  poziomach  powoduje  też  sieć  romboedryczna 
( R ).  Jeśli  punkty  symetrycznie  równoznaczne  znajdu- 
jące się  na  różnych  poziomach  zostaną  różnie  zabar- 
wione, to  na  płaszczyźnie  rzutu  otrzyma  się  3-,  4-  lub 
6-barwny  prawidłowy  zespół  punktów.  Mamy  wów- 
czas do  czynienia  z symetrią  wielobarwną  (barwną). 
Osie  3lf  32,  62,  64,  4lf  43,  6lf  65,  płaszczyzna  d oraz  sieć 
Bravais’go  typu  R są  wielobarwnymi  elementami  sy- 
metrii. Wszystkie  przedstawione  wyżej  uogólnienia 
symetrii  klasycznej  obejmuje  kwazisymetria,  nazywa- 
na też  P-symetrią  (A.  M.  Zamorzajew).  P-symetria 
jest  z kolei  szczególnym  rodzajem  kryptosymetrii 
(A.  Niggli,  H.  Wondratschek).  Kryptosymetria  nie 
obejmuje  symetrii  kompleksowej,  którą  z kolei  można 
rozszerzyć  do  kwatemionowej. 

Geometrycznym  uogólnieniem  symetrii  podobień- 
stwa jest  symetria  konformacyjna,  w której  występują 
zakrzywione  elementy  symetrii  (kule,  koła).  Innym 
geometrycznym  rozszerzeniem  symetrii  podobieństwa 
jest  symetria  afiniczna. 

Omówione  wyżej  teorie  z biegiem  czasu  podlegały 
dalszemu  rozwojowi.  Rozpoczęto  m.in.  wyprowadza- 


nie przestrzennych  grup  homologii  i badanie  antysy- 
metrii figur  homologicznych.  Z połączenia  barwnej 
symetrii  z antysymetrią  powstała  barwna  antysyme- 
tria,  którą  następnie  uogólniono  w postaci  barwnej 
antysymetrii  różnego  rodzaju.  Również  na  symetrię 
podobieństwa  przeniesiono  idee  antysymetrii  prostej 
i antysymetrii  wielokrotnej,  a także  rozszerzono  ją  za 
pomocą  pojęć  symetrii  barwnej  i antysymetrii  barw- 
nej. Idee  antysymetrii  i symetrii  barwnej  przeniesiono 
także  na  symetrię  konformacyjną.  Zostały  już  zapo- 
czątkowane i rozwijają  się  nadal  prace  nad  teorią  grup 
przestrzennych  Fiodorowa  w przestrzeniach  wielowy- 
miarowych i geometriach  nieeuklidesowych;  np.  dla 
n = 4 znaleziono  punktowe  grupy  krystalograficzne 
i wyprowadzono  wszystkie  sieci  Bravais’go. 

Wszystkie  prezentowane  wyżej  teorie  różnych  ro- 
dzajów symetrii  wraz  z ich  uogólnieniami  stanowią 
obecnie  treść  nowej,  znajdującej  się  w pełni  rozwoju 
gałęzi  krystalografii  — krystalografii  matematycznej. 

Czy  osiągnięto  już  kres  rozwoju  teorii  symetrii?  Nie, 
gdyż  w teorii  tej  nadal  istnieją  luki,  poza  tym  na  opra- 
cowanie czekają  dalsze  problemy,  a mianowicie  róż- 
norodne syntezy  fizycznych  i geometrycznych  uogól- 
nień teorii  symetrii,  wyprowadzenie  postaci  prostych 
w symetrii  podobieństwa,  klasyfikacja  postaci  pros- 
tych dla  grup  punktowych  homologii,  dokładniejsze 
zbadanie  praw  symetrii  w obcych  jeszcze  dzisiaj  kry- 
stalografom przestrzeniach  /i-wymiarowych  oraz  w 
przestrzeniach  nieeuklidesowych  geometrii,  np.  w 
pseudoeuklidesowej  geometrii  Minkowskiego,  czy 
w przestrzeni  Łobaczewskiego. 

Niektóre  z przedstawionych  wyżej  teorii  przede 
wszystkim  antysymetrią  i symetria  podobieństwa  już 
obecnie  mają  znaczenie  praktyczne.  Antysymetrią  np. 
znalazła  zastosowanie  w opisie  magnetycznej  struktu- 
ry kryształów,  a także  w klasyfikacji  bliźniaczych 
i równoległych  zrostów  kryształów.  Stała  się  także 
źródłem  twórczej  inspiracji  w sztuce,  czego  przykła- 
dem są  słynne  grafiki  M.  C.  Eschera  (il.  65,  tabl.  17). 
Symetria  podobieństwa  natomiast  umożliwiła  opisa- 
nie kształtów  muszli  amonitu  czy  spirali  wzrostu 
kryształu,  które  wymykały  się  dotąd  wszelkiemu  ści- 
słemu opisowi. 
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FIZYKA  CIAŁA  STAŁEGO 


Metale 

Jacek  Furdyna 

W życiu  codziennym  rozpoznajemy  metale  po  ich 
charakterystycznych  cechach  zewnętrznych.  W tempe- 
raturze pokojowej  są  to  ciała  stałe  o dużej  wytrzyma- 
łości, mające  specyficzny  połysk,  nie  przepuszczają- 
ce światła,  plastyczne  (tzn.  kowalne)  oraz  dobrze 
przewodzące  ciepło  i elektryczność.  Te  pozornie  nie- 
zależne od  siebie  właściwości  mają  wspólne  podłoże 
na  szczeblu  atomowym : elektrony  w zewnętrznych  po- 


włokach atomów  metali  (tzw.  elektrony  walencyjne)  są 
bardzo  słabo  związane  z resztą  atomu  — tworzą  gaz 
elektronowy.  Obecność  tego  gazu  jest,  z kolei,  pod- 
stawą wiązań  międzyatomowych  metalu  i,  jak  poka- 
żemy, prowadzi  do  właściwości  odróżniających  metale 
od  innych  ciał  stałych. 

Zacznijmy  od  atomu  metalu  o jednym  elektronie 
walencyjnym,  np.  atomu  sodu  (rys.  1).  Elektron  wa- 


krysta#©- 

grafia 

matema- 

tyczna 
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wiązanie  lencyjny  (powłoka  3 s na  rys.  1)  otacza  chmurą  elek- 
metaleczne  tronową  jon  sodu  Na+,  składający  się  z jądra  i silnie 
z nim  związanych  pozostałych  elektronów  w powło- 
kach lsy  2s  i 2 p.  Jeżeli  przez  zbliżenie  dwóch  atomów 
sodu  utworzymy  cząsteczkę  Na^,  elektrony  walencyjne 


Rys.  1 . Przykład  pierwiastka  jcdnowartościowego  — model 
atomu  sodu 


e~ 


a)  b) 


Rys.  2.  Elektrony  walencyjne  (e~)  w sodzie:  a)  w atomie;  b)  w czą- 
steczce; c)  w krysztale 


gaz  elektro-  (dzięki  swemu  słabemu  wiązaniu  z atomem  macierzy- 
nów  waleń-  stym)  będą  się  swobodnie  poruszać  „na  terenie”  całej 
cyjnych  cząsteczki  (rys.  2).  Podobnie,  jeżeli  zbliżymy  do  siebie 
większą  ilość  atomów,  tworząc  w ten  sposób  kryształ 
sodu,  elektrony  walencyjne  nie  pozostaną  zlokalizo- 
wane przy  „swoich”  atomach,  lecz  będą  się  poruszać 
w objętości  całego  kryształu.  Wynika  to  z zasady 
nieokreśloności.  Elektrony  o dużym  stopniu  lokaliza- 
cji mogłyby  mieć  według  tej  zasady  duże  wartości  pę- 
du, a więc  i wysoką  energię.  Układ  w swoim  natural- 
nym dążeniu  do  najniższego  stanu  energii  dąży  więc 
równocześnie  do  delokalizacji  elektronów.  Tak  więc 
metal  składa  się  z sieci  dodatnich  jonów,  zanurzo- 
nych w gazie  swobodnie  poruszających  się  elektro- 
nów walencyjnych,  które  straciły  bezpośredni  związek 
z atomami  macierzystymi  i stanowią  niejako  wspólną 
własność  wszystkich  jonów  równocześnie.  Ten  gaz 


elektronowy  tworzy  rodzaj  kleju  przenikającego  prze- 
strzeń międzyjonową,  który  przez  oddziaływanie  elek- 
trostatyczne „wciąga”  w siebie  dodatnie  jony,  gęsto  je 
przez  to  upakowując.  Takie  wzajemne  przyciąganie  jo- 
nów i gazu  elektronowego  stanowi  istotę  wiązania 
metalicznego. 


Mechaniczne  właściwości  metali 


Wiązanie  metaliczne  różni  się  tym  od  wiązań  ko- 
walentnych  lub  jonowych  (-►  Chemia  kwantowa),  że 
działa  bezkierunkowo  i nie  zależy  w zasadzie  od  war- 
tościowości jonu.  Ponieważ  wynika  ono  z bezpośred- 
niego oddziaływania  różnych  ładunków,  wiązanie 
w metalach  jest  przy  tym  bardzo  silne.  Te  cechy  (bez- 
kierunkowość  i silne  przyciąganie)  prowadzą  do  gęste- 
go upakowania  (ułożenia)  atomów  w metalu. 

Najgęstsze  upakowanie  atomów  jest  możliwe  struktura 
w trzech  strukturach  krystalicznych:  w układzie  re- 
gularnym płasko  centrowanym,  w układzie  heksago- 
nalnym najgęstszego  upakowania  oraz  (w  nieco  mniej- 
szym stopniu)  w układzie  regularnym  przestrzennie 
centrowanym  (-*  Budowa  kryształów).  Struktury  te 
podobne  są  do  różnych  sposobów  układania  jedna- 
kowych kul  (przykłady  widujemy  na  straganach 
z owocami).  Układy  te  są  również  proste,  tzn.  mają 
wysoki  stopień  symetrii.  Fakt,  że  prawie  wszystkie 
metale  tworzą  kryształy  o jednej  z trzech  powyższych 
struktur,  wynika  więc  bezpośrednio  ze  specyficznych 
właściwości  „elektronowego  kleju”. 

Wspomniana  już  bezkierunkowość  wiązań  w metalu 
i niezależność  od  wielkości  ładunku  jonu  ma  również 
dalsze  konsekwencje.  W krysztale  miedzi,  np.  możemy 
dany  atom  miedzi  (a  więc  atom  jednowartościowy) 
bez  trudności  zastąpić  dwuwartościowym  atomem, 
np.  cynku.  Atom  obcego  metalu  odda  swoje  elektrony  stopy 
walencyjne  otaczającemu  go  gazowi  elektronowemu, 
wiążąc  się  z siecią  kryształu  przez  powstały  w ten  spo- 
sób ładunek,  zupełnie  tak  samo  jak  sąsiadujące  z nim 
atomy  miedzi.  Atomy  różnych  metali  mogą  się  więc 
mieszać  i układać  w dowolnych  proporcjach  na  wspól- 
nej sieci  krystalicznej.  Ta  obojętność  wiązania  na  ro- 
dzaj atomu  (byleby  łatwo  oddawał  elektrony)  jest 
właściwością,  dzięki  której  możemy  tworzyć  stopy  spawanie 
metali  w szerokim  zakresie  składów,  jak  również 
spawać  i lutować  różne  od  siebie  metale. 


Rys.  3.  Odbicie  światła  przez  ziarna  metalu  o różnych  orienta- 
cjach krystalograficznych 


Obiekty  metalowe,  z którymi  stykamy  się  na  co 
dzień,  są  przeważnie  polikrystaliczne,  składające  się 
z wielu  ziaren,  które  często  możemy  rozróżnić  gołym 
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okiem  dzięki  sposobowi,  w jaki  pojedyncze  ziarna 
odbijają  światło  (rys.  3).  Każde  z ziaren  jest  mono- 
kryształem, oddzielonym  od  przyległych  ziaren 
warstwą  o grubości  jednego  lub  dwu  atomów.  Krysta- 
liczne uporządkowanie  atomów  zmienia  się  więc  rap- 
townie na  przestrzeni  tej  warstwy.  Mimo  to,  ze  wzglę- 
du na  bezkierunkowy  charakter  wiązania  metaliczne- 
go, siła  kohezji  sąsiadujących  ze  sobą  ziaren  nie  różni 
się  w zasadzie  od  siły  wiążącej  atomy  wewnątrz  kry- 
ształu. Rozdzielenie  ziaren  jest  sprawą  nader  trudną. 
Stąd  też  pochodzi  wysoki  stopień  wytrzymałości  wyro- 
bów metalowych,  co  stanowi  o ich  ogromnej  przy- 
datności. 

Szczególną  cechą  metalu  jest  to,  że  może  on  być 
kuty,  gięty  i walcowany  w różne  kształty,  zachowując 
przy  tym  swą  pierwotną  wytrzymałość  i inne  właści- 
wości fizyczne.  Proces  takiej  deformacji  plastycznej 
jest  schematycznie  pokazany  na  rys.  4.  Punktami  za- 
znaczono jony  w sieci  kryształu.  Rys.  4a  przedstawia 
kryształ  metalu  przed  deformacją.  Pod  wpływem  nie- 


kowalne  w mniejszym  stopniu,  łatwiej  się  kruszą 
i mniej  nadają  do  obróbki  mechanicznej. 

Na  mechaniczne  własności  metali  ogromny  wpływ  defekty 
mają  defekty  składu  lub  struktury  kryształów.  Od-  w metalach 
różniamy  kilka  podstawowych  rodzajów  defektów. 

Jeżeli  płaszczyzna  atomów  nagle  się  urywa,  tworząc 
krawędź  (rys.  5),  powstałe  w ten  sposób  zaburzenie 


Rys.  5.  Dyslokacja  kra- 
wędziowa w dwóch  wy- 
miarach 


Rys.  4.  Deformacja  metalu  w trzech  stadiach:  a)  kryształ  przed  deformacją;  b)  odkształcenie  sprężyste  po  przyłożeniu  siły  zewnętrznej 
(strzałka);  c)  odkształcenie  plastyczne  (nieodwracalne)  wskutek  poślizgu  wzdłuż  płaszczyzny  Pt  po  przekroczeniu  granicy  sprężystości 


wielkiej  siły  zewnętrznej  (strzałka  na  rys.  4b)  na- 
stępuje deformacja  sprężysta;  po  usunięciu  siły  kry- 
ształ powraca  do  pierwotnego  kształtu.  Jeżeli  jednak 
siła  przyłożona  (np.  uderzenie  młotem)  przewyższa 
pewną  granicę,  metal  odkształca  się  nieodwracalnie. 
Proces  deformacji  plastycznej  pokazany  jest  na  rys. 
4c,  gdzie  cała  płaszczyzna  atomów  prześlizguje  się 
poziomo  o jedną  (całkowitą)  stałą  sieci,  zabierając 
ze  sobą  górną  część  kryształu.  Rzeczą  zasadniczą  jest 
to,  że  mimo  zewnętrznego  makroskopowego  odkształ- 
cenia na  szczeblu  atomowym  odtwarza  się  po  poślizgu 
(o  jedną  lub  kilka  stałych  sieci  kryształu)  pierwotna 
sytuacja:  jony  „wskakują”  w identyczne  położenie 
równowagi  (identyczne  otoczenie),  w jakim  znajdowa- 
ły się  przed  deformacją.  Mamy  więc  w rezultacie  taki 
sam  materiał  i takie  same  właściwości  fizyczne. 

Jak  widać  z rys.  4,  plastyczna  deformacja  metalu 
wynika  z poślizgu  wzdłuż  płaszczyzn  w krysztale. 
Na  rys.  4a  liniami  przerywanymi  oznaczyliśmy  trzy 
różne  płaszczyzny  sieciowe.  W zasadzie  poślizg  jest 
możliwy  wzdłuż  każdej  takiej  płaszczyzny.  Najłatwiej 
jest  jednak  uzyskać  poślizg  wzdłuż  płaszczyzn  o naj- 
większym zagęszczeniu  atomów  (a  więc  poziomo  lub 
pionowo).  Wynika  to  z dwóch  względów : płaszczyzny 
najgęstszego  upakowania  są  z konieczności  najbar- 
dziej od  siebie  oddalone  (największa  odległość  między- 
płaszczyznowa  A — rys.  4a),  co  zmniejsza  opór  wy- 
nikający z potencjału  jonów  w sąsiednich  płaszczyz- 
nach; poza  tym,  w trakcie  poślizgu  wzdłuż  takiej 
płaszczyzny,  jony  mijają  położenia  równowagi  z naj- 
większą częstością. 

Ze  względu  na  wysoki  stopień  symetrii,  regularne 
układy  krystaliczne  mają  wiele  płaszczyzn  o gęstym 
upakowaniu  atomów,  co  umożliwia  łatwy  poślizg 
jednocześnie  w kilku  kierunkach.  Dzięki  temu  metale 
o strukturze  regularnej  (np.  miedź,  złoto,  ołów)  mogą 
z łatwością  zmieniać  kształt  (są  łatwo  kowalne),  bez 
powstawania  przy  tym  pęknięć  i dziur.  Metale  o struk- 
turze heksagonalnej,  a więc  o niższej  symetrii,  są 


Rys.  b.  Defekty  punktowe:  atom  obcy  w węźle  (u);  luka  w sieci 
tzw.  wakans  (ó);  obcy  atom  w pozycji  międzywęzłowej  (c);  do- 
datkowy atom  własny  w pozycji  międzywęzłowej,  tzw.  defekt 
Frenkla  ( d ) 


sieci  nazywamy  dyslokacją.  Jest  to  przykład  tzw.  de- 
fektu liniowego.  Sieć  kryształu  może  być  również  za- 
burzona defektami  punktowymi,  z których  cztery 
pokazane  są  schematycznie  na  rys.  6. 

Rysunek  7 ilustruje  (w  dwóch  wymiarach),  jak  waż- 
ne jest  zjawisko  dyslokacji  dla  plastyczności  meta- 
li. Pod  wpływem  zewnętrznej  siły  (strzałka)  wiązania 
linii  atomów  zostają  zerwane,  tworząc  krawędź  w pła- 
szczyźnie kryształu  (rys.  7b,  czarne  punkty).  Pod 
dalszym  naporem  siły  powstaje  krawędź  w sąsiedniej 
płaszczyźnie,  zaś  pierwotna  kraw-ędź  „goi  się”  przez 
wskoczenie  atomów  w położenie  równowagi.  Pro- 
ces ten  powtarza  się  — mówimy  wtedy  o ruchu  dyslo- 
kacji. Ruch  dyslokacji  możemy  nawet  oglądać  pod 
mikroskopem.  Jak  widać  z rys.  7,  przemieszczanie  się 


wpływ 

dyslokacji 
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Rys.  7.  Schematyczny  obraz  przemieszczania  się  dyslokacji  pod  wpływem  siły  (strzałka).  W rezultacie  pierwotny  kryształ  (a')  zostaje 
odkształcony  plastycznie  (0 


dyslokacji  prowadzi  do  odkształcenia  kryształu, 
z zachowaniem  jego  wewnętrznej  struktury  mikrosko- 
powej. 

metale  Szczególne  znaczenie  dyslokacji  polega  na  tym,  że 
„twarde"  i od  nich  w dużej  mierze  zależy,  czy  metal  jest  „twardy", 
„miękkie"  czy  „miękki”.  Pokazaliśmy  już,  że  kowalność  metali 
łączy  się  z istnieniem  płaszczyzn  poślizgu.  Dzięki 
dyslokacjom  poślizg  taki  odbywać  się  może  stopnio- 
wo przez  zrywanie  wiązań  w jednym  tylko  szeregu 
atomów  na  raz,  a nie  na  przestrzeni  całej  płaszczyzny 
równocześnie,  wymaga  więc  względnie  małej  siły 
zewnętrznej.  Możemy  to  porównać  do  przesuwania 
dużego  dywanu  po  podłodze.  Jeżeli  zechcemy  prze- 
sunąć cały  dywan  za  jednym  pociągnięciem,  natra- 
fiamy na  duży  opór.  Możemy  natomiast  zrobić  na 
dywanie  fałdę  i popychając  ją,  przesunąć  w ten  spo- 
sób dywan  przy  użyciu  niewspółmiernie  mniejszej  siły. 
Obliczenia  wykazują,  że  idealny  kryształ,  zupełnie 
wolny  od  dyslokacji,  musi  ulec  deformacji  sprężystej 
(rys.  4b),  rzędu  3 do  10%,  zanim  nastąpi  poślizg  (rys. 
4c).  W praktyce  kryształ  czystego  metalu  zaczyna  się 
odkształcać  plastycznie  już  przy  deformacjach  ok. 
0,01%,  właśnie  dzięki  obecności  w nim  dyslokacji. 

Ruch  dyslokacji  możliwy  jest  dzięki  regularności 
sieci  kryształu.  Zaburzenia  porządku  sieci  (np.  atomy 
obce,  atomy  międzywęzłowe)  stanowią  więc  przeszko- 
dę w poruszaniu  się  dyslokacji.  Toteż,  wprowadzając 
takie  defekty,  czynimy  metale  twardszymi.  Złoto 
czternastokaratowe,  zawierające  domieszki,  jest  o wie- 
le bardziej  wytrzymałe  („twardsze”)  niż  złoto  zupełnie 
czyste.  Zaburzeniem  sieci  są  również  połączenia  zia- 
ren w polikryształach,  można  więc  uzyskać  twardszy 
hartowanie  metal  przez  zmniejszenie  rozmiaru  ziaren.  Hartując 
metal  przez  kucie  lub  walcowanie,  wprowadzamy  za- 
burzenie sieci,  którym  są  — paradoksalnie  — nowe 
dyslokacje.  Jeżeli  gęstość  dyslokacji  jest  dostatecznie 
duża,  dyslokacje  poruszające  się  wzdłuż  przecina- 
jących się  płaszczyzn  po  prostu  wchodzą  sobie  w dro- 
gę, uniemożliwiając  dalszy  ruch  i przez  to  czyniąc 
metal  mniej  kowalnym. 


Ruch  elektronów  w metalu  — 
obraz  klasyczny 

Wprawdzie  od  początku  podkreślaliśmy  rolę  elektro- 
nów walencyjnych  w mechanizmie  kohezji,  wiążącym 
metal  w ciało  stałe,  jednak  nasza  uwaga  skupiała  się 
dotychczas  głównie  na  dodatnich  jonach,  na  ich  ukła- 
dzie i ruchu.  Zajmiemy  się  teraz  bezpośrednio  samymi 
elektronami  walencyjnymi,  którym  przypisujemy  nie- 
które najciekawsze  i najbardziej  charakterystyczne 
właściwości  metali. 

Pełny  obraz  dynamiki  elektronów  w metalach  jest 
w zasadzie  możliwy  tylko  w ramach  mechaniki  kwan- 
towej. Zanim  jednak  do  tego  przystąpimy,  opiszemy 
model  pokrótce  model  klasyczny  wprowadzony  przez  P.  Dru- 
D rudego  dego  w 1900  r.,  prawie  natychmiast  po  odkryciu  elek- 
tronu przez  J.  J.  Thomsona.  Na  podstawie  modelu 
Drudego  będziemy  w stanie  opisać,  przynajmniej 
w sposób  jakościowy,  główne  zjawiska  elektryczne, 
termiczne  i optyczne  zachodzące  w metalach.  Model 
klasyczny  daje  przy  tym  intuicyjny,  uchwytny  dla 
wyobraźni  wgląd  w procesy  elektronowe.  Jego  usterki 
natomiast  uwypuklają  subtelności  rzeczywistej  sytuacji 
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i istotę  poprawek,  jakie  do  obrazu  klasycznego  wpro- 
wadza mechanika  kwantowa. 

Model  Drudego  traktuje  elektrony  walencyjne  me- 
talu jako  gaz  elektronów  poruszających  się  swobodnie 
po  całej  objętości  ciała.  W trakcie  swego  ruchu  elek- 
trony napotykają  jony  metalu,  z którymi  (wg  dosłow- 
nej interpretacji  modelu  Drudego)  zderzają  się  i zo- 
stają w ten  sposób  rozpraszane  w różnych  kierunkach. 

Można  by  stąd  wnioskować,  że  średnia  droga  między 
zderzeniami  (tzw.  droga  swobodna)  porównywalna 
jest  z odległością  między  jonami,  a więc  jest  rzędu  1 A. 

Obraz  ten  tłumaczy  zjawisko  przewodnictwa  elek-  przewodni- 
trycznego  w metalach.  Jeżeli  do  próbki  metalu  przy-  ctwo 
łożymy  pole  elektryczne  E , swobodny  elektron  zostaje  elektryczne 

przyśpieszony  (w  kierunku  przeciwnym  do  E ze  wzglę- 
du na  ujemny  ładunek).  Przyśpieszanie  trwa  aż  do  mo- 
mentu zderzenia,  które  rozprasza  elektron  w dowol- 
nym kierunku,  po  czym  proces  przyśpieszania  za- 
czyna się  od  nowa.  Na  skutek  tych  przeciwstawnych 
wpływów  pola  elektrycznego  i zderzeń  powstaje  stan 
równowagi  — elektron  porusza  się  wtedy  ze  średnią 

prędkością  proporcjonalną  do  pola  E , tzw.  prędkością 
unoszenia  (dryfową).  Jak  więc  widać,  wypadkowy 
transport  ładunku  elektrycznego,  tzn.  prąd  elektrycz- 


ny, proporcjonalny  jest  do  pola  E.  Obraz  Drudego  da- 
je nam  zatem  mikroskopowe  uzasadnienie  prawa 
Ohma. 

Traktowanie  elektronów  w metalu  jako  gazu  swo- 
bodnych, niezależnych  od  siebie  cząstek  klasycznych 
prowadzi  również  do  wniosku,  że  z każdym  elektro- 
nem wiąże  się  energia  kinetyczna  f kT,  gdzie  k jest 
stałą  Boltzmanna,  a T — temperaturą  bezwzględną 
kryształu.  Dzięki  swobodzie  poruszania  się  elektrony 
mogą  zatem  z łatwością  pośredniczyć  w przewodzeniu 
ciepła,  co  tłumaczy  bardzo  duże  na  ogół  przewodnic- 
two cieplne  w metalach. 

Niestety  ten  prosty,  klasyczny  obraz  gazu  elektro- 
nowego zawodzi  przy  zastosowaniu  do  kilku  innych 
kluczowych  zjawisk.  Rozpatrzmy  np.  wyżej  wspom- 
niane założenie  modelu,  że  w temperaturze  T każdy 
elektron  walencyjny  wnosi  energię  kinetyczną  f kT. 
Zastosowanie  tego  założenia  do  zagadnienia  ciepła 
właściwego  prowadzi  do  zupełnie  błędnej  wartości, 
przewyższającej  wartość  eksperymentalną  o kilka 
rzędów  wielkości.  Co  więcej,  ponieważ  każdy  elektron 
ma  moment  magnetyczny  związany  ze  spinem,  nale- 
żałoby się  spodziewać,  że  przy  przyłożeniu  pola  ma- 
gnetycznego elektronowe  momenty  magnetyczne  u- 
porządkują  się  wzdłuż  pola  i metal  wykaże  wysoką 
wartość  namagnesowania.  Tamczasem  doświadczalna 
wartość  podatności  magnetycznej  metalu  jest  znowu 
o kilka  rzędów  wielkości  mniejsza  od  wartości  prze- 
widywanej na  podstawie  klasycznego  obrazu  gazu 
elektronowego.  Nie  rozpatrujemy  tu  metali  ferro- 
magnetycznych, których  właściwości  magnetyczne 
(— > Teoria  magnetyzmu)  wiążą  się  z głębszymi  powło- 
kami atomu.  Eksperymentalne  wartości  ciepła  właści- 
wego i podatności  magnetycznej  sugerują  więc,  że 
jedynie  drobna  część  elektronów  walencyjnych,  a nie 
cały  gaz  elektronowy,  bierze  udział  w tych  procesach. 

Obraz  Drudego  również  nie  jest  w stanie  wyjaśnić, 
dlaczego  przewodnictwo  elektryczne  metali  bardzo 
szybko  wzrasta  z obniżaniem  się  temperatury,  często 
osiągając  w temperaturze  ciekłego  helu  (w  bardzo  czy- 
stych kryształach)  wartości  10M05  razy  większe 
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niż  w temperaturze  pokojowej.  W końcu  założenie,  że 
droga  swobodna  elektronu  w metalu  jest  rzędu  stałej 
sieci  kryształu,  również  zupełnie  nie  zgadza  się  z do- 
świadczeniem. Na  przykład  w bardzo  czystych  krysz- 
tałach galu  w temperaturze  ciekłego  helu  długość  dro- 
gi swobodnej  jest  kilkaset  milionów  razy  większa  niż 
odległość  międzyat omowa  kryształu. 


Ruch  elektronów  w metalu  — 
obraz  kwantowy 


Model  przedstawiający  elektrony  walencyjne  metalu 
jako  gaz  swobodnie  poruszających  się  ładunków  jest 
w zasadzie  zgodny  z rzeczywistością.  Błąd  modelu 
Drudego  wynika  z dwóch  dalszych,  mylnych  założeń: 
po  pierwsze  z założenia,  że  wszystkie  elektrony  mają 
jednakowy  wpływ  na  wartość  ciepła  właściwego  i po- 
datności magnetycznej ; po  drugie  z założenia,  że  elek- 
trony ulegają  rozpraszaniu  na  stacjonarnych  jonach 
w sieci  kryształu.  Te  usterki  modelu  wynikają  bezpo- 
średnio z traktowania  elektronu  jako  cząstki  klasy- 
cznej. Jak  się  zatem  przedstawia  rzeczywista  (a  więc 
kwantowa)  sytuacja? 

Wróćmy  do  pojedynczego  atomu  sodu.  Według 
praw  mechaniki  kwantowej  elektrony  atomu  znajdują 
się  na  specyficznych  poziomach  energetycznych  (ozna- 
D ■ czonych  na  rys.  1 jako  powłoki  1 s,  2sy  2 pyi  3$).  Liczba 
energetyczne  eIektronów  przypadających  na  każdą  powłokę  jest 
a Y ściśle  ograniczona  zakazem  Pauliego,  skąd  też  wynika 
struktura  powłokowa  poszczególnych  atomów  (-* 
Chemia  kwantowa). 

Stany  kwantowe  elektronów  w ciele  stałym  wywo- 
dzą się  bezpośrednio  ze  struktury  elektronowej  ato- 
mu. Możemy  uwidocznić  to  w sposób  następujący. 
Wyobraźmy  sobie  atomy  w węzłach  sieci  fikcyjnego 
kryształu,  w którym  odległość  międzyatomowa  (stała 
sieci)  może  być  dowolnie  zmieniana.  Jeżeli  odległość 
międzyatomowa  jest  wielokrotnie  większa  niż  w krysz- 
tale rzeczywistym,  atomy  są  odizolowane  i ich  kwanto- 
we stany  energetyczne  nie  różnią  się  od  stanów  poje- 
dynczego atomu  (lewa  strona  rys.  8).  Gdy  stała  sieci 
fikcyjnego  kryształu  stopniowo  się  zmniejsza,  oddzia- 
ływanie między  atomami  rozszczepia  każdy  poziom 


Rys.  8.  Powstawanie  pasm  energetycznych  wskutek  oddziały- 
wania między  atomami,  na  przykładzie  sodu  (a  oznacza  stałą 
sieci  kryształu  rzeczywistego).  Jak  widać,  pasmo  odpowiadające 
elektronom  walencyjnym  jest  tylko  częściowo  obsadzone  — do 
energii  Fermiego  Ef 


elektronowy  na  szereg  podpoziomów.  Z każdego  po- 
ziomu powstaje  więc  pasmo  stanów  energetycznych. 

Jak  widać  z rys.  8 (i  jak  należałoby  się  spodziewać), 
zewnętrzne  powłoki  atomu  są  najbardziej  rozszcze- 
pione wskutek  oddziaływania  z pozostałymi  atoma- 
mi kryształu.  Widzimy  również,  że  elektrony  w krysz- 
tale nie  mogą  mieć  energii  w przedziałach  pomiędzy 
dozwolonymi  pasmami  (tzw.  w przerwach  energetycz- 
nych). 

Wielkość  pasm  i przerw  energetycznych  w danym 
krysztale  zależy  więc  od  rzeczywistej  odległości 
międzyatomowej  a (linia  przerywana  na  rys.  8)  oraz  od 
rodzaju  danego  pierwiastka.  Natomiast  liczba  stanów 
elektronowych  wewnątrz  pasma  równa  się  liczbie  ato- 
mów w krysztale  (ściślej  — liczbie  komórek  elementar- 
nych w krysztale).  Ponieważ  w ciele  stałym  koncentra- 
cja atomów  jest  rzędu  1023  na  cm3,  stany  te  leżą  tak 
blisko  siebie,  że  energię  wewnątrz  pasma  możemy 
w praktyce  uważać  za  ciągłą. 


Kwantowy  gaz  elektronowy 


Rozważmy  najwyższe  pasmo  energetyczne,  odpo- 
wiadające elektronom  walencyjnym  (3j  na  rys.  8). 
W krysztale  składającym  się  z N atomów  pasmo  za- 
wiera N stanów  kwantowych.  Każdemu  z tych  stanów 

przypisujemy  prędkość  v,  która  odróżnia  dany  stan 
od  pozostałych.  Wygodnie  jest  przedstawić  to  za 
pomocą  tzw.  przestrzeni  prędkości,  pokazanej 
w dwóch  wymiarach  na  rys.  9.  Chodzi  tu  o przestrzeń 
formalną,  matematyczną,  gdzie  wzdłuż  osi  x , y,  z od- 
kładamy składowe  vXt  vy>  vz  wektora  prędkości  v.  Po- 
nieważ stany  elektronowe  w paśmie  odpowiadają  dy- 


Rys.  9.  Przestrzeń  prędkości  w dwóch  wymiarach.  Punkty  czarne 
oznaczają  stany  obsadzone,  kółka  puste  odpowiadają  stanom 

nieobsadzonym ; vF  oznacza  prędkość  Fermiego 


skrętnym  wartościom  v,  każdy  taki  stan  można  przed- 
stawić oddzielnym  punktem  w przestrzeni  prędkości. 
Wszystkie  stany  pasma  będą  w ten  sposób  przedsta- 
wione siecią  N punktów  (rys.  9).  Każdemu  z dozwo- 
lonych stanów  (a  więc  każdemu  punktowi)  przypisu- 
jemy dyskretną  wartość  energii  kinetycznej  E = 
= V2  mvt.  Tak  więc  stany  mające  tę  samą  wartość  v , 
a różniące  się  jedynie  kierunkiem  ruchu  (rys.  9,  stany 
leżące  na  okręgu  o promieniu  v ) odpowiadają  tej  sa- 
mej wartości  energii. 

Zgodnie  z zakazem  Pauliego,  w danym  stanie  kwan- 
towym mogą  znajdować  się  najwyżej  dwa  elektrony 
(o  odwrotnych  kierunkach  spinów).  Odnosi  się  to  nie 
tylko  do  stanów  elektronowych  w pojedynczych  ato- 
mach (o  czym  wspominaliśmy  powyżej),  lecz  również 
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i do  stanów  w pasmach  energetycznych  kryształu.  Za- 
stosowanie zakazu  Pauliego  do  pasma  elektronów  wa- 
lencyjnych wprowadza  ogromnie  ważne,  zupełnie  no- 
we (a  więc  obce  obrazowi  klasycznemu)  właściwości. 
Elektrony  walencyjne  metalu  stopniowo  obsadzają 
stany  wewnątrz  pasma,  począwszy  od  najniżej  poło- 
żonych poziomów  energetycznych  (tzn.  od  najniż- 
szych wielkości  v ) wzwyż,  po  dwa  elektrony  na  każdy 
stan. 

Pasmo  może  więc  pomieścić  2N  elektronów.  Jeżeli 
w danym  materiale  mamy  mniej  niż  2N  elektronów 
walencyjnych  (np.  w sodzie  mamy  ich  dokładnie  N), 
pasmo  pasmo  jest  tylko  częściowo  obsadzone.  Pasmo  takie 
przewodni-  nazywamy  z przyczyn,  które  wyjaśnią  się  poniżej, 
ctwa  pasmem  przewodnictwa.  W stanie  podstawowym  (co 
odpowiada  temperaturze  zera  bezwzględnego)  pasmo 
przewodnictwa  jest  obsadzone  do  pewnej  wartości 


T—  0 K r>OK 


Rys.  10.  Rozkład  Fermięgo-Diraca : a)  dla  T = 0 K;  b)  dla  tempe- 
ratury T wyższej  od  0 K 


energii  Ef , określonej  przez  liczbę  elektronów  walen- 
energia  cyjnych  metalu  (rys.  lOa).  Energię  tę  nazywamy  e- 
Fermiego  nergią  Fermiego.  Charakterystyczną  cechą  każdego 
metalu  jest  posiadanie,  w stanie  podstawowym,  takie- 
go częściowo  obsadzonego  pasma  przewodnictwa. 

Punktem  wyjściowym  dla  omówienia  wielu  zjawisk 
elektronowych  w metalach  jest  rozkład  energetyczny 
elektronów  w paśmie  przewodnictwa,  otrzymany  przez 
E.  Fermiego  i P.  Diraca  przy  uwzględnieniu  zakazu 
Pauliego.  Rozkład  Fermiego-Diraca,  określający  licz- 
bę elektronów  przypadającą  na  dany  obszar  energii, 
pokazaliśmy  na  rys.  1 1 . Wzrost  obsadzenia  elektrono- 
wego (tzn.  liczba  elektronów  przypadająca  w danym 
przedziale  energii)  wraz  ze  wzrostem  energii  można 
zrozumieć  rysując  koło  o promieniu  v (rys.  9):  im 
większa  wartość  energii  (a  więc  wielkość  v),  tym  więcej 
odpowiada  jej  stanów.  W temperaturze  0 K rozkład 
urywa  się  skokowo  na  energii  Fermiego  (krzywa 
przerywana  na  rys.  11),  w temperaturze  wyższej  od 
0 K — jest  krzywą  ciągłą  (rys.  11). 


Rys.  11.  Obsadzenie  stanów  elektronowych  w funkcji  energii 
w temperaturze  zera  bezwzględnego  (stan  podstawowy  metalu) 
oraz  w temperaturze  T (przy  T = 300  K JcTIEf  ~ 0,005) 


Rozkład  Fermiego-Diraca  uwidacznia  dwie  zasad- 
nicze różnice  pomiędzy  kwantowym  gazem  elektrono- 
wym a klasycznym  gazem  Drudego.  W gazie  klasycz-  j 
nym  wszystkie  elektrony  reagują  na  wpływ  tempera- 
tury r,  zyskując  średnią  energię  kinetyczną  3/2 kT. 
W gazie  kwantowym  natomiast  (jak  widać  z rys.  lOb 
i 11),  jedynie  elektrony  odpowiadające  stanom  w bez- 
pośredniej bliskości  energii  Fermiego  przechodzą  ze 
wzrostem  temperatury  T na  wyższe  poziomy  energe- 
tyczne. Po  drugie,  w gazie  klasycznym  przy  T = 0K 
wszelki  ruch  ustaje  całkowicie,  podczas  gdy  w gazie 
kwantowym  zakaz  Pauliego  „wymaga”,  aby  elektrony 
poruszały  się  ze  skończoną  prędkością  nawet  w tem- 
peraturze zera  bezwzględnego  (rys.  9).  W metalach,  ze 
względu  na  dużą  koncentrację  elektronów  walencyj- 
nych, prędkości  te  dochodzą  do  108  cm/s.  W gazie 
klasycznym  prędkości  takie  odpowiadałyby  wzbudze- 
niu termicznemu  50  000  K. 

Górną  granicę  prędkości  dla  T = 0 K,  odpowiada- 
jącą energii  Fermiego,  nazywamy  prędkością  Fermie- 
go vf . Prędkość  tę  przedstawiliśmy  na  rys.  9 jako 
promień  vf . Ma  to  następujące  znaczenie  fizyczne: 
w temperaturze  J=0K  wszystkie  obsadzone  stany 
znajdują  się  wewnątrz  kuli  o promieniu  vf . Powierzch- 
nia kuli  o promieniu  vf  stanowi  zatem  granicę  między 
stanami  obsadzonymi  i nieobsadzonymi.  Powierzch- 
nię tę  nazywamy  powierzchnią  Fermiego. 

Powierzchnia  Fermiego  jest  oczywiście  pojęciem 
czysto  formalnym,  przedstawiającym  rozkład  prędkoś- 
ci w kwantowym  gazie  elektronowym.  Jej  ogromna 
przydatność  przy  omawianiu  metali  wynika  stąd,  że 
w wielu  kluczowych  zjawiskach  elektronowych  (prze- 
wodnictwo elektryczne,  zachowanie  się  ciepła  właści- 
wego, podatności  magnetycznej)  udział  biorą  jedynie 
stany  elektronowe  na  powierzchni  Fermiego  lub  poło- 
żone w bezpośredniej  jej  bliskości. 

Możemy  lo  wyjaśnić  następująco.  Dozwolone 
stany  elektronowe,  choć  dyskretne,  położone  są  ener- 
getycznie bardzo  blisko  siebie.  Energia  AE  pobrana 
przez  elektron  z zewnętrznego  pola  elektrycznego, 
z energii  cieplnej,  względnie  z pola  magnetycznego 
jest  wprawdzie  znikomo  mała  w porównaniu  z £>,  ale 
jest  porównywalna  z odstępami  dzielącymi  poziomy 
energetyczne  wewnątrz  pasma.  Może  więc  ona  powo- 
dować zmiany  w rozkładzie  elektronów.  Przejścia  ele- 
ktronowe są  jednak  możliwe  jedynie  wtedy,  gdy 
w przedziale  energii  AE,  liczonej  od  poziomu  obsa- 
dzonego przez  dany  elektron,  znajdują  się  stany  wolne. 
Zatem  będą  zachodziły  tylko  przejścia  elektronów  ze 
stanów  w bezpośrednim  sąsiedztwie  powierzchni  Fer- 
miego (jak  to  pokazaliśmy  dla  pobudzenia  termiczne- 
go, tzn.  dla  energii  AE  = zUkT,  na  rys.  lOb  i 11),  bo- 
wiem stany  powyżej  energii  Ef  są  nieobsadzone.  Roz- 
ważmy jednak  elektron  na  poziomie  głęboko  poniżej 
energii  Fermiego.  Wszelkie  stany  w zasięgu  energii 
AE  od  tego  poziomu  są  całkowicie  obsadzone.  Takie 
głębokie  poziomy  są  więc  niejako  „zablokowane”  i nie 
biorą  wskutek  tego  udziału  w zjawiskach,  w których 
zmiany  energii  powodowane  polem  zewnętrznym  są 
małe  w porównaniu  z Ef. 

Omawiając  niepowodzenia  teorii  Drudego  pokaza- 
liśmy, że  ciepło  właściwe  i podatność  magnetyczna 
metali  mają  takie  wartości,  jak  gdyby  jedynie  znikoma 
liczba  elektronów  miała  na  nie  wpływ.  Możemy  to  te- 
raz natychmiast  wytłumaczyć  na  podstawie  rozkładu 
Fermiego-Diraca.  Jak  już  mówiliśmy,  jedynie  elektro- 
ny obsadzające  stany  tuż  przy  powierzchni  Fermiego 
mogą  reagować  na  zmiany  temperatury,  pobierać 
energię  cieplną  i wpływać  na  wartość  ciepła  właściwe- 
go. Z podatnością  magnetyczną  jest  podobnie.  W sta- 
nie podstawowym  metalu  na  każdy  dozwolony  stan 
elektronowy  wewnątrz  powierzchni  Fermiego  przy- 
padają dwa  elektrony  o odwrotnych  kierunkach 
spinu.  W tej  sytuacji  wypadkowy  moment  magnetycz- 
ny metalu  równa  się  oczywiście  zeru.  Aby  namagne- 
sować metal  przez  przyłożenie  pola  magnetycznego, 
należy  część  spinów  odwrócić,  co  (ze  względu  na  za- 
kaz Pauliego  i na  całkowite  obsadzenie  poziomów 
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położonych  poniżej  Ef)  można  uzyskać  jedynie  przez 
przejścia  elektronów  na  poziomy  powyżej  £>.  Po- 
nieważ energia  oddziaływania  elektronów  z polem 
magnetycznym  jest  mała  w stosunku  do  £>,  spośród 
wszystkich  elektronów  pasma  przewodnictwa  tylko  te 
odpowiadające  poziomom  tuż  przy  powierzchni  Fer- 
miego przyczyniają  się  do  właściwości  magnetycznych 
metalu. 


Przewodnictwo  elektryczne 

Sprawa  przewodnictwa  elektrycznego  w metalach 
wymaga  dokładniejszego  omówienia  w świetle  kwan- 
towego obrazu.  Elektrony  walencyjne  w metalu  (tzn. 
w paśmie  przewodnictwa)  są  w ciągłym  ruchu.  Jak 
widać  jednak  z rys.  9,  w nieobecności  pola  elektrycz- 
nego każdemu  elektronowi  poruszającemu  się  w da- 
nym kierunku  odpowiada  inny  elektron  poruszający 
się  z dokładnie  taką  samą  prędkością  w kierunku 
przeciwnym.  W rezultacie,  mimo  ruchu  ładunków, 
wypadkowy  prąd  elektryczny  jest  równy  zeru.  Jeżeli 

teraz  przyłożymy  pole  elektryczne  E,  spowoduje  ono 
przejścia,  które  odpowiadają  przyspieszaniu  (a  więc 
zwiększaniu  wartości  v)  elektronów  poruszających 
się  w kierunku  przeciwnym  do  pola  (ze  względu  na 
ujemny  ładunek  elektronów)  oraz  hamowaniu  (tzn. 
zmniejszaniu  v ) elektronów  poruszających  się  w kie- 
runku pola.  W rezultacie  powierzchnia  Fermiego  (tzn. 
przesunięcie  powierzchnia,  wewnątrz  której  znajdują  się  stany  ob- 
powierzchni  sadzone)  zostaje  przesunięta  w przestrzeni  prędkości, 
Fermiego  jak  na  rys.  12. 


Rys.  12.  Przesunięcie  kuli  Fermiego  w przestrzeni  prędkości  pod 
wpływem  pola  elektrycznego.  Koło  zaznaczone  linią  przerywaną 
odpowiada  rozkładowi  prędkości  w nieobecności  pola.  Wskutek 
rozproszenia  elektrony  powracają  do  nieobsadzonych  stanów 
pierwotnego  rozkładu  (strzałki  niebieskie) 

Przyspieszanie  elektronów  przez  pole  E (a  więc 
przesuwanie  powierzchni  Fermiego)  postępowałoby 
w nieskończoność,  gdyby  nie  rozpraszanie  elektronów. 
Wskutek  rozpraszania  otrzymujemy  przejścia  ze  świe- 
żo obsadzonych  (pod  wpływem  pola  E)  stanów  do  sta- 
nów nieobsadzonych,  jak  pokazano  strzałkami  na 
rys.  12.  W rezultacie,  dzięki  współzawodnictwu  po- 
między przyspieszaniem  i rozpraszaniem,  przesunięcie 
powierzchni  Fermiego  osiąga  pewną  stałą  wartość  vu , 
proporcjonalną  do  wielkości  pola  E.  Jest  to  średnia 
prędkość  prędkość  elektronów  w paśmie  przewodnictwa;  na- 
unoszenia  zywamy  ją  prędkością  unoszenia. 

Należy  zauważyć,  że  większość  stanów  prędkości 
wewnątrz  przesuniętej  kuli  Fermiego  była  obsadzona 


również  i w nieobecności  pola.  Prądy  elektronowe 
wynikające  z tych  stanów  znoszą  się  (jak  znosiły  się 
przed  przyłożeniem  pola)  i nie  przyczyniają  się  do 
wypadkowego  prądu  elektrycznego.  Ponieważ  w prak- 
tyce przesunięcie  vu  jest  nadzwyczaj  małe  w porówna- 
niu z promieniem  vf,  jedynie  stany  położone  zupełnie 
blisko  powierzchni  Fermiego  ulegają  zmianie  pod 

wpływem  pola  E.  Możemy  więc  powiedzieć,  że  tylko 
elektrony  na  powierzchni  Fermiego  biorą  udział 
w przewodnictwie  elektrycznym. 

Widzimy  również  na  podstawie  tego  obrazu,  że  pasmo 
gdyby  wszystkie  stany  pasma  (wszystkie  punkty  na  rys.  przewodni- 
9)  były  obsadzone,  żadne  zmiany  w rozkładzie  pręd-  ctwa 
kości  elektronów  nie  mogłyby  nastąpić  pod  wpływem 
pola.  Istnienie  pasm  tylko  w części  zapełnionych  jest 
więc  konieczne  dla  przewodzenia  prądu  elektrycznego 
i dlatego  też  pasma  takie  nazywamy  pasmami  prze- 
wodnictwa. 


Rozpraszanie  elektronów 

Według  dosłownej  interpretacji  modelu  klasycznego 
elektrony  są  rozpraszane  przez  zderzenia  z dodatnimi 
jonami  metalu,  co  ogranicza  drogę  swobodną  elek- 
tronu do  kilku  angstremów.  Jak  już  wspominaliśmy, 
wniosek  ten  jest  w zupełnej  sprzeczności  z danymi  do- 
świadczalnymi. Aby  sformułować  obraz  właściwy, 
należy  podkreślić,  że  w kwantowej  mechanice  elektro- 
ny mają  charakter  podwójny:  zachowują  się  jak  cząst- 
ki materii,  ale  równocześnie  jak  fale.  Zgodnie  z tym 
obrazem  elektron  móżemy  traktować  jako  falę  płaską, 
której  długość  (tzw.  długość  fali  de  Broglie’a)  wyraża 
się  wzorem  X = h/p,  gdzie  p = mv  jest  wielkością 
pędu  elektronu,  a h — stałą  Plancka. 

W oddziaływaniu  z jonami  metalu,  uporządkowany- 
mi periodycznie  w sieci  kryształu,  falowy  charakter 
elektronów  odgrywa  decydującą  rolę.  Można  bowiem 
pokazać,  że  w doskonale  periodycznym  układzie 
(jakim  jest  kryształ  idealny)  fala  płaska  rozchodzi  się 
bez  tłumienia.  W zastosowaniu  do  elektronu  w krysz- 
tale oznacza  to,  że  dzięki  swej  falowej  naturze,  może 
on  poruszać  się  na  przestrzeni  idealnego  kryształu 
zupełnie  bez  rozpraszania! 

Rozpraszanie  więc  odbywa  się  nie  na  jonach  two-  rozpraszanie 
rżących  periodyczny  układ  kryształu,  lecz  na  zaburzę-  na  zaburze- 
niach idealnie  periodycznej  sieci.  Elektron  może  się  neach  sieci 
zderzać  z napotykanymi  na  swej  drodze  obcymi  ato- 
mami (domieszkami),  z defektami  struktury  kryształu 
oraz  z termicznymi  drganiami  sieci,  fononami  (-►  Dy- 
namika sieci  krystalicznej),  powodującymi  chwilowe 
odchylenia  jonów  od  położenia  równowagi.  Obraz 
falowo-korpuskularny  elektronu  od  razu  więc  tłuma- 
czy, dlaczego  droga  swobodna  elektronów,  mierzona 
w niskich  temperaturach  w bardzo  czystych  próbkach 
o wysokim  stopniu  doskonałości  krystalicznej,  jest 
tak  długa. 


Ruch  elektronów  w kryształach 
rzeczywistych 

Chcąc  podkreślić  podstawowe  własności  kwantowe 
gazu  elektronowego  przedstawiliśmy,  jak  dotychczas, 
obraz  nieco  wyidealizowany,  nie  uwzględniliśmy  bo- 
wiem wpływu  dodatnich  jonów  metalu  na  ruch 
elektronów  (poza  wzmianką,  że  w periodycznej  sieci 
kryształu  jony  nie  powodują  rozpraszania).  W rzeczy- 
wistości, jak  pokażemy,  wpływ  sieci  kryształu  na  dy- 
namikę elektronów  jest  bardzo  istotny. 

Ustaliliśmy  już,  że  na  każde  pasmo  energetyczne 
przypada  tyle  oddzielnych,  różnych  od  siebie  stanów 
elektronowych,  ile  mamy  komórek  elementarnych 
w objętości  kryształu  (co  u większości  metali,  dzięki 
ich  prostej  strukturze,  równa  się  po  prostu  liczbie  ato- 
mów). Stany  te  wynikają  z oddziaływania  między  ato- 
mami tworzącymi  sieć  kryształu.  Oczywiście  w oddzia- 
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ływaniu  tym  decydującą  rolę  odgrywa  wzajemne  poło- 
żenie atomów,  a więc  geometria  sieci, 
strefy  Po  uwzględnieniu  szczegółów  krystalograficznych 
Brillouina  otrzymujemy  następujący  obraz:  stany  dozwolone 
pasma  (powiedzmy,  że  jest  ich  AO  tworzą  siatkę  skła- 
dającą się  z N punktów  w przestrzeni  prędkości  (jak  na 
rys.  9).  Punkty  te  jednorodnie  wypełniają  bryłę 
(w  przestrzeni  prędkości)  o kształcie  określonym  przez 
symetrię  danego  kryształu  (np.  zbiór  punktów  na 
rys.  9 odpowiada  dwuwymiarowej  sieci  kwadratowej). 
Bryłę  tę,  zawierającą  wszystkie  stany  pasma  (bez 
względu  na  to,  czy  są  one  obsadzone  czy  nie)  nazywa- 
my strefą  Brillouina. 

W praktyce,  ze  względów  formalnych,  stosuje  się 
przestrzeń  tu  n*e  przestrzeń  prędkości,  lecz  analogiczną  prze- 
" pędu  strzeń  pędu,  gdzie  wzdłuż  osi  x , y,  z odkłada  się  skła- 
dowe pędu  px , Pi/y  Pt,  odpowiadające  poszczególnym 
stanom  elektronowym.  Przykłady  stref  Brillouina 
w przestrzeni  pędu  dla  najczęściej  spotykanych  struk- 
tur krystalicznych  metali  pokazaliśmy  na  rys.  13. 
Pędy  p w bezpośrednim  sąsiedztwie  granic  strefy  od- 


energii  kinetycznej  od  wielkości  i kierunku  pędu  mają  powierzchnia 
bezpośredni  wpływ  na  kształt  powierzchni  Fermiego.  Fermiego 
Powierzchnię  tę  otrzymaliśmy  pierwotnie  w kształcie  w kryszta- 
kuli,  opierając  się  na  założeniu,  że  energia  kinetyczna  łach  rze- 
zależy  tylko  od  wielkości  pędu,  E — }mv2  = p2j2  m.  czywistych 
W rzeczywistości,  jak  się  okazuje,  ta  sama  wartość 
energii  może  odpowiadać  dwu  różnym  wielkościom 
prędkości  (względnie  pędu)  w dwu  różnych  kierun- 
kach. Zatem,  wskutek  anizotropii  kryształu,  po- 
wierzchnia Fermiego  przedstawiająca  zbiór  wszyst- 
kich pędów,  odpowiadających  tej  samej  wartości 
energii  Ef>  ulega  zniekształceniu. 

Wpływ  struktury  kryształu,  zniekształcający  kulę 
Fermiego,  możemy  zilustrować  za  pomocą  nieco  u- 
proszczonego  obrazu.  Na  rys.  15  układ  punktów 
przedstawia  stany  kryształu  wypełniające  strefę 
Brillouina.  Przypominamy,  że  stany  leżące  w pobliżu 
granicy  strefy  są  dużo  bardziej  podatne  na  wpływ 
sieci  kryształu  niż  stany  w głębi  strefy  (odpowiadające 
długim  falom  de  Broglie’a).  Jeżeli  energia  Fermiego 
Ef  jest  dużo  niższa  od  górnej  granicy  pasma  (np. 


energia 
kinetyczna 
elektronu 
w krysztale 


Rys.  13.  Strefy  Brillouina  w przestrzeni  pędu  dla  kryształów  o strukturze:  a)  regularnej  płasko  centrowanej ; b)  regularnej  przestrzennie 
centrowanej;  c)  heksagonalnej 


powiadają  falom  elektronowym  o długości  X =h{p 
porównywalnej  ze  stałą  sieci.  Stany  odpowiadające 
takim  pędom  są  przez  to  dużo  bardziej  czułe  na  wpływ 
sieci  kryształu  niż  stany  odpowiadające  mniejszym 
wartościom  pędu. 

Rozważmy  następnie  wpływ  struktury  kryształu  na 
ruch  danego  elektronu,  poruszającego  się  np.  w dwu- 
wymiarowym układzie  pokazanym  na  rys.  14.  Elek- 
tron taki  porusza  się  w na  przemian  przyśpieszają- 


Rys.  14.  Ruch  elek- 
tronu (strzałki)  w 
dwóch  różnych  kie- 
runkach w krysztale 


cym  go  i hamującym  polu  elektrostatycznym  jonów, 
co  wpływa  na  jego  energię  kinetyczną.  Elektron  poru- 
szający się  wzdłuż  linii  poziomej  ( a na  rys.  14)  na- 
potyka jony  w mniejszych  odstępach  czasu  niż  np. 
elektron  poruszający  się  z tą  samą  prędkością  wzdłuż 
linii  b.  Mimo  identycznej  prędkości  elektrony  te,  ze 
względu  na  różnączęstość  oddziaływań  z jonami,  mają 
różne  energie  kinetyczne.  Podobnie  elektron  porusza- 
jący się  z dużą  prędkością  odczuwa  wpływ  jonów 
inaczej  niż  elektron  poruszający  się  wolniej,  chociaż 
w tym  samym  kierunku. 

Wynikające  w ten  sposób  komplikacje  w zależności 


Rys.  15.  Ewolucja  kształtu  powierzchni  Fermiego.  Przy  małych 
koncentracjach  elektronów  przestrzeń  pędu  obsadzona  przez 
elektrony  leży  z dala  od  granic  strefy  Brillouina,  wpływ  sieci 
kryształu  na  kształt  powierzchni  Fermiego  jest  zatem  mały  i po- 
wierzchnia pozostaje  w przybliżeniu  kulą  (a).  Przy  wyższych 
koncentracjach  powierzchnia  Fermiego  leży  bliżej  granic  strefy, 
silnie  ulega  więc  wpływowi  sieci  kryształu  i znacznie  odbiega 
kształtem  od  kuli  (6) 


pasmo  wypełnione  ao  połowy,  jak  w wypadku  sodu), 
wartości  pędu  odpowiadające  tej  wartości  Ef  leżą 
z dala  od  granicy  strefy  Brillouina.  Wpływ  potencjału 
sieci  na  stany  obsadzone  jest  wtedy  względnie  mały 
i powierzchnia  Fermiego  jest  w dobrym  przybliżeniu 
kulą  ( a na  rys.  15).  Jeżeli  natomiast  energia  Fermiego 
jest  wyższa  (jak  np.  dla  bardziej  skomplikowanych 
dwu-  lub  więcej  wartościowych  metali),  tak  że  pęd 
odpowiadający  Ef  zbliża  się  do  granicy  strefy,  wpływ 
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sieci  jest  znacznie  większy  i prowadzi  do  wyraźnej 
anizotropii  powierzchni  Fermiego  ( b na  rys.  15).  Co 
więcej,  w przypadku  wielowartościowych  metali  mamy 
do  czynienia  z nakładającymi  się  na  siebie  pasmami 
energetycznymi  (do  czego  jeszcze  wrócimy)  i skutkiem 
tego  z kilkoma  strefami  Brillouina  równocześnie. 
Jednakże  ten  wypadek  ze  względu  na  dodatkowe 
komplikacje,  przekracza  zakres  niniejszego  artykułu. 


runku  osi  z.  Obecność  pola  nie  wpływa  na  składową 

ruchu  wzdłuż  z,  natomiast  w płaszczyźnie  xy  elektron 

wchodzi  na  orbitę,  po  której  krąży  z tzw.  częstością  częstość  cy 

cyklotronową.  Jego  ruch  w płaszczyźnie  poprzecznej  klotronowa 

do  //jest  zatem  ruchem  periodycznym.  Jak  wiadomo, 
wg  zasad  mechaniki  kwantowej  energia  w ruchu  perio- 
dycznym ulega  kwantyzacji.  Toteż  energia  kinetyczna 
elektronu  związana  z jego  ruchem  poprzecznym  do 


aj  °)  c) 

Rys.  16.  Przykłady  powierzchni  Fermiego : a)  sód  — sieć  regularna  przestrzennie  centrowana,  b)  miedź  — sieć  regularna  płasko  centro- 
wana, c)  tul  (ziemie  rzadkie)  — sieć  heksagonalna  o najgęstszym  upakowaniu.  Powierzchnie  Fermiego  pokazane  są  wewnątrz  odpowia- 
dających im  stref  Brillouina 


Na  rys.  16  pokazaliśmy  przykłady  powierzchni 
Fermiego  kilku  rzeczywistych  metali.  U góry  przed- 
stawiony jest  przypadek  sodu.  Struktura  krystaliczna 
sodu  odpowiada  sieci  regularnej  centrowanej  prze- 
strzennie. Powierzchnia  Fermiego  (wewnątrz  której 
znajduje  się  dokładnie  połowa  stanów  pasma,  a więc 
połowa  objętości  strefy  Brillouina)  jest  względnie 
odległa  od  granic  strefy,  toteż  prawie  zupełnie  nie  ule- 
ga zniekształceniu  i zachowuje  kształt  kuli  (według 
pomiarów  doświadczalnych  z dokładnością  Viooo)- 
Miedź  krystalizuje  w strukturze  regularnej  płasko 
centrowanej,  co  odpowiada  strefie  Brillouina  poka- 
zanej na  rys.  13a.  Podobnie  jak  sód,  miedź  ma  jeden 
elektron  walencyjny,  a więc  i tutaj  powierzchnia 
Fermiego  wypełnia  dokładnie  połowę  objętości 
strefy.  Jeżeli  wpiszemy  kulę  o tej  objętości  w strefę 
Brillouina  miedzi,  zauważymy,  że  w niektórych 
punktach  powierzchnia  kuli  (ze  względu  na  specyficz- 
ną geometrię  strefy)  bardzo  się  zbliża  do  granic  strefy. 
Zgodnie  z wyżej  opisanym  rozumowaniem  prowadzi 
to  w miejscach  zbliżenia  do  zniekształcenia  pierwot- 
nej kuli  Fermiego.  Powierzchnia  Fermiego  miedzi, 
skonstruowana  na  podstawie  danych  doświadczalnych 
i pokazująca  odchylenia  od  sferyczności  (tzw.  szyjki) 
w miejscach  największego  zbliżenia  do  granic  strefy 
Brillouina,  pokazana  jest  na  rys.  16b.  Również  na 
rys.  16  pokazaliśmy  powierzchnię  Fermiego  dla  bar- 
dziej egzotycznego  przypadku  tulu  (dwuwartościowy 
metal  z grupy  ziem  rzadkich,  struktura  heksagonalna), 
ilustrując  nader  złożoną  strukturę,  na  jaką  napotyka- 
my w bardziej  skomplikowanych  (a  więc  wielowartoś- 
ciowych) materiałach. 


Poziomy  Landaua  5 oscySacje  kwantowe 

Powierzchnia  Fermiego  danego  metalu  stanowi  zwarty 
(choć  nieco  abstrakcyjny)  opis  jego  właściwości  elek- 
tronowych, np.  przewodnictwa  elektrycznego,  własno- 
ści magnetycznych.  Topologia  powierzchni  Fermiego 
jest  więc  obiektem  intensywnych  badań  doświadczal- 
nych współczesnej  fizyki.  Bardzo  pomocne  w ustala- 
niu szczegółów  powierzchni  Fermiego  jest  m.in.  zja- 
wisko de  Haasa-van  Alphena  (i  pokrewne  mu  zjawisko 
Szubnikowa-de  Haasa),  wynikające  z zachowania  się 
elektronów  w silnym  polu  magnetycznym. 

Rozpatrzmy  ruch  swobodnego  elektronu  w Obec- 
ności pola  magnetycznego  H , przyłożonego  np.  w kie- 


H (tzn.  ze  składowymi  pędu  px  i Pu)  może  mieć  tylko 
pewne  ściśle  określone,  kwantowe  wartości.  Te  do- 
zwolone poziomy  energii,  nazywane  poziomami 
Landaua,  wyrażone  są  wzorem : 

2 t 2 poziomy 

Ei  = (l+ł)fwjc  = Pą^-V-,  Landaua 

Ltn 

gdzie  / jest  dowolną  liczbą  całkowitą,  coc  — częstością 
cyklotronową,  a m — masą  efektywną  elektronu ; 
h = k/2 k. 

Kwantyzacja  Landaua  wpływa  drastycznie  na  roz- 
kład stanów  w przestrzeni  pędu,  oznacza  bowiem,  że 
jedynie  niektóre  składowe  pędu  w płaszczyźnie  prosto- 
padłej do  pola  są  dozwolone.  Pokazaliśmy  to  na  rys. 

17,  przedstawiającym  przekrój  przestrzeni  pędu  w pła- 
szczyźnie xy.  Punkty  na  rys.  17a,  oznaczające  dozwo- 
lone stany  w nieobecności  pola,  muszą  się  przemieś- 
cić i „osiąść”  na  stanach  odpowiadających  energiom 
Ei  (rys.  17b).  Stany  obsadzone,  które  w nieobecności 


Rys.  17.  Wpływ  pola  magnetycznego  na  rozkład  stanów  w prze- 
strzeni pędu 


pola  wypełniały  przestrzeń  wewnątrz  powierzchni 
Fermiego  jednorodną,  gęstą  siatką  punktów,  pod 
wpływem  pola  przemieszczają  się  (pozostając  jednakże 
wewnątrz  powierzchni  Fermiego)  na  stany  leżące  na 
powierzchniach  cylindrycznych  („rurach”)  o stałym 
przekroju,  z osią  skierowaną  wzdłuż  pola  magnety- 
cznego H , jak  to  widać  na  rys.  18.  Obecność  pola 
magnetycznego  nie  wprowadza  ograniczeń  wartości 
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Rys.  18.  Rozkład  elektronów  w przestrzeni  pędu  w obecności 

pola  H w wypadku  sferycznej  i anizotropowej  powierzchni  Fer- 
miego. Elektrony  mogą  obsadzać  jedynie  stany  zawarte  wewnątrz 
powierzchni  Fermiego  (linia  przerywana)  i położone  na  rurach 
/»  0,  1,2,3... 

pędu  wzdłuż  H.  Na  rys.  18b  przedstawiliśmy  rozkład 
stanów,  gdy  powierzchnia  Fermiego  jest  bardziej 
skomplikowana. 

Przekrój  „rury”  stanów  odpowiadającej  poziomowi 
Ei  ma  pewną  stałą  wartość  Ai,  proporcjonalną  do  wiel- 
kości pola  H.  Przy  zwiększaniu  pola,  z chwilą  gdy 
Ai  przekroczy  maksymalną  wartość  przekroju  po- 
wierzchni Fermiego  w płaszczyźnie  prostopadłej  do 
pola,  elektrony  obsadzające  /-ty  poziom  Landaua 
„przelewają’’  się  na  poziomy  niższe  (/=  1, 1—2, ...  itd.) 
w taki  sposób,  aby  pozostać  wewnątrz  powierzchni 
Fermiego.  Takiemu  „przelaniu”  się  elektronów  towa- 
rzyszą mierzalne  zmiany  w przewodnictwie,  namagne- 
sowaniu i innych  zjawiskach  elektronowych.  W typo- 
wych polach  magnetycznych  rzędu  jednej  tesli  mamy 
wiele  tysięcy  poziomów  Landaua  poniżej  energii 
które  w miarę  zwiększania  pola  jeden  po  drugim 
„przerastają”  powierzchnię  Fermiego.  Takie  kolejne 
„przelewanie”  się  elektronów  na  coraz  to  niższe 
poziomy  objawia  się  w bardzo  niskich  temperaturach 
oscylacje  w formie  oscylacji  zjawisk  elektronowych  jako  funk- 
kwantowe  cJi  P°^a»  tzw-  oscylacji  kwantowych.  Oscylacje  kwan- 
namagneso-  towe  wartości  namagnesowania  nazywamy  efektem 
wania  i prze-  Haasa-van  Alphena,  zaś  oscylacje  przewodności 
wodmetwa  elektrycznej  — efektem  Szubnikowa-de  Haasa.  Moż- 
na pokazać,  że  oscylacje  kwantowe  danych  wielkości 
są  periodyczną  funkcją  1 (H,  a okres  oscylacji  jest 
proporcjonalny  do  maksymalnego  przekroju  po- 
wierzchni Fermiego  w płaszczyźnie  prostopadłej  do  H. 
Zjawiska  te  nadają  się  idealnie  do  badania  nieizotro- 
powych  powierzchni  Fermiego.  Przez  pomiar  okresu 
oscylacji  namagnesowania  lub  prądu  dla  różnych 
kierunków  pola  względem  kryształu  możemy  ustalić 
maksymalne  wartości  przekroju  powierzchni  Fermiego 
dla  tych  kierunków,  a zatem  topologię  powierzchni 
Fermiego  z wielką  dokładnością.  Oscylacje  kwantowe 
stanowią  więc  jedną  z najbardziej  owocnych,  naj- 
częściej stosowanych  metod  badania  podstawowych 
właściwości  metali. 

Należy  dodać,  że  do  obserwowania  efektu  de 
Haasa-van  Alphena  i innych  oscylacji  kwantowych 
muszą  być  spełnione  następujące  dwa  warunki 
eksperymentalne.  Po  pierwsze,  czas  relaksacji  elek- 
tronu winien  być  dłuższy  od  okresu  cyklotronowego 
(<ycT>l),  tak  aby  droga  elektronu  między  zderze- 
niami równała  się  przynajmniej  jednej  orbicie  cyklo- 
tronowej. Po  drugie,  różnica  energii  między  pozio- 
mami Landaua  powinna  przekraczać  energię  termicz- 
ną elektronu  (Juoc>kT).  Warunki  te  mogą  być  spełnio- 
ne jedynie  w bardzo  czystych  próbkach,  w niskich 
temperaturach  (około  temperatury  ciekłego  helu) 
oraz  w wysokich  polach  magnetycznych  (rzędu  1 T 
i więcej). 

Efekt  de  Haasa-van  Alphena,  a więc  oscylacje 
kwantowe  namagnesowania  w funkcji  pola  magne- 
tycznego, mierzy  się  przeważnie  jednym  z dwu  sposo- 
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bów.  W pierwszym  z nich  wykorzystujemy  fakt,  że 

w obecności  pola  magnetycznego  H próbka  „odczu- 
wa” moment  siły  proporcjonalny  do  jej  namagneso- 
wania M (tzn.  do  jej  momentu  magnetycznego),  jeżeli 
M i H nie  są  równoległe.  Sytuacja  taka  występuje,  gdy 

powierzchnia  Fermiego  jest  niesferyczna,  a pole  H 
skierowane  jest  dowolnie  (tzn.  nie  wzdłuż  osi  symetrii). 
Jeżeli  zawiesimy  próbkę  na  cienkim  a sztywnym  prę- 
ciku, ulegnie  ona  skręceniu  pod  działaniem  momentu 
siły  wywieranym  przez  pole.  Mierząc  położenie 
kątowe  tak  zawieszonej  próbki  w funkcji  pola  otrzy- 
mujemy bezpośredni  pomiar  oscylacji  kwantowych 
namagnesowania.  Okres  oscylacji  daje  nam,  jak  już 
wspomniano,  wartość  ekstremalną  przekroju  po- 
wierzchni Fermiego  w płaszczyźnie  prostopadłej  do 

H.  Mierząc  zatem  zależność  okresu  oscylacji,  (a  więc 
zależność  ekstremalnego  przekroju  powierzchni  Fer- 
miego) od  kierunku  pola  możemy  w wielu  wypadkach 
wnioskować  o kształcie  powierzchni  Fermiego 
w trzech  wymiarach. 

Druga  metoda  badania  oscylacji  de  Haasa-van 
Alphena  polega  na  pomiarze  napięcia  indukowanego 
zmiennym  polem  magnetycznym  dHjdt  w cewce  in- 
dukcyjnej otaczającej  próbkę  metalu.  Można  poka- 
zać, że  napięcie  to  będzie  proporcjonalne  do  dMjdt  = 
= ( dMjdH)(dHjdt ),  gdzie  M jest  namagnesowaniem 
próbki.  Jeżeli  namagnesowanie  M oscyluje  w funkcji 
pola  H , to  przy  równomiernej  zmianie  pola  dHjdt 
oscylacje  te  obserwować  będziemy  bezpośrednio 
jako  oscylacje  w indukowanym  napięciu  cewki 
w funkcji  czasu.  Metoda  indukcyjna  nadaje  się  szcze- 
gólnie do  zastosowania  w wypadku  magnesów  impul- 
sowych, dzięki  którym  otrzymujemy  wzrost  pola  od 
zera  do  kilkudziesięciu  tesli  w przeciągu  kilku  tysięcz- 
nych sekundy.  Oscylujący  sygnał  indukowany  w cewce 
można  obserwować  bezpośrednio  na  ekranie  oscylo- 
skopu. 

Wspominaliśmy  już,  że  oscylacje  kwantowe  wystę- 
pują również  w zjawiskach  transportu  w metalach 
(tzw.  zjawisko  Szubnikowa-de  Haasa),  które  może- 
my badać  np.  przez  pomiar  oporu  próbki  w funkcji  po- 
la magnetycznego.  Należy  dodać,  że  oscylacje  kwanto- 
we występują  właściwie  w każdym  zjawisku,  w którym 
biorą  udział  elektrony  przewodnictwa.  Możemy  je 
zatem  również  obserwować  w takich  zjawiskach  elek- 
tronowych, jak  rozchodzenie  i tłumienie  ultradźwięku 
w metalach,  siła  termoelektryczna,  przewodnictwo 
cieplne,  tłumienie  fal  o częstościach  radiowych  (tzw. 
fal  hel  ikonowych),  magnetostrykcja  (zmiany  objętości 
próbki  pod  wpływem  pola)  i wiele  innych. 


pomiar  oscy- 
lacji kwanto- 
wych namag- 
nesowania 


oscylacje 
kwantowe 
w zjawiskach 
transportu 


Meta  Se  jedrso- 
i wielowartościowe 

Podstawową  cechą  charakterystyczną  metalu,  odróż- 
niającą go  od  innych  materiałów,  jest  posiadanie 
pasm  energetycznych, w których  tylko  część  stanów 
jest  obsadzona  przez  elektrony  nawet  przy  T = 0 K 
(tzn.  w stanie  podstawowym  metalu).  W krysztale  skła- 
dającym się  z N komórek  elementarnych  (co  w wię- 
kszości metali  odpowiada  po  prostu  N atomom),  na 
każde  pasmo  przypada  N różniących  się  od  siebie,  od- 
dzielnych stanów.  Każde  pasmo  może  zatem  pomie- 
ścić, zgodnie  z zakazem  Pauliego,  2 N elektronów. 

Widać  z tego,  że  pierwiastki  jednowartościowe 
o prostych  strukturach  krystalicznych,  wnoszące  do 
pasma  przewodnictwa  tylko  po  jednym  elektronie  na 
komórkę  elementarną  (jak  np.  sód  lub  miedź),  wy- 
pełniają pasmo  dokładnie  do  połowy  i muszą  być 
metalami. 

Czym  jednak  wytłumaczyć,  że  pierwiastki  dwuwar- 
tościowe  (np.  beryl,  cynk,  żelazo)  lub  nawet  niektóre 
czterowartościowe  (cyna,  ołów)  są  również  metalami? 


heryS  Rozpatrzmy  przykład  berylu,  którego  atom  ma  2 
elektrony  w stanie  2 s,  a więc  pełną  powłokę,  co  powin- 
no odpowiadać  całkowicie  obsadzonemu  pasmu 
w krysztale.  Wydawałoby  się  więc,  że  beryl  powinien 
być  izolatorem.  Gdy  jednak  zbliżamy  atomy  berylu  do 
siebie,  tworząc  kryształ  (jak  na  rys.  19),  oddziaływanie 


Rys.  19.  Nakładanie  się  pasm  w wypadku  berylu  (a  odpowiada 
stałej  sieci  kryształu  rzeczywistego) 

między  atomami  rozszczepia  całkowicie  obsadzoną 
powłokę  elektronową  2 s oraz  nieobsadzoną  powłokę 
2 p tak  dalece,  że  odpowiadające  im  pasma  nakładają 
się  na  siebie.  Ponieważ  układ  jako  całość  dąży  do  stanu 
o najniższej  energii,  elektrony  z najwyżej  położonych 
poziomów  pasma  2 s „przelewają”  się  do  niżej  od  nich 
leżących  poziomów  w paśmie  2 p.  W wyniku  tego  ma- 
my dwa  niecałkowicie  obsadzone  pasma.  Obydwa 
zatem  pasma  biorą  udział  w przewodnictwie  elektrycz- 
nym i innych  zjawiskach  elektronowych.  Jak  widać 
z rys.  19,  stopień  nałożenia  się  pasm  jest  określony 
przez  wartość  stałej  sieci : gdyby  odległość  między  ato- 
mami kryształu  była  nieco  większa,  nałożenie  się 
pasm  nie  nastąpiłoby  i beryl  byłby  półprzewodni- 
kiem. 

wpły  w Mała  różnica  w stałej  sieci  może  zatem  spowodować 
ciśnienia  ogromne  zmiany  w fizycznych  właściwościach  ma- 
teriału. Warto  wspomnieć,  że  przy  zastosowaniu  wy- 
sokich ciśnień  do  niektórych  niemetali  powodujemy 
zmiany  w strukturze  krystalicznej  i w odległościach 
międzyatomowych,  w wyniku  których  możemy  otrzy- 
mać nakładanie  się  pasm  i materiał  staje  się  wtedy 
metalem.  Pod  bardzo  wysokim  ciśnieniem  obserwo- 
wano przejścia  w fazę  metaliczną  takich  pierwiastków 
jak  german,  krzem  i nawet  (pod  ciśnieniem  powyżej 
105  MPa)  diament! 

Nasuwa  się  również  pytanie,  dlaczego  nie  wszystkie 
pierwiastki  o nieparzystej  wartościowości  są  metalami. 
Mogłoby  się  wydawać,  że  w przypadku  takich  pier- 
wiastków pasma  odpowiadające  zewnętrznym  po- 
włokom atomów  są  z konieczności  tylko  częściowo 
obsadzone.  Rozważmy  to  na  przykładzie  wodoru. 

wodór  Wodór  jest  pierwiastkiem  jednowartościowym,  w sta- 
nie stałym  (wodór  stały  otrzymujemy  pod  wysokim 
ciśnieniem  w niskich  temperaturach)  jest  izolatorem. 
Wynika  to  stąd,  że  wiązanie  atomów  wodoru  w czą- 
steczce H2  jest  bardzo  silne  i w stanie  stałym  wodór  jest 
siecią  cząsteczek  H2,  a nie  atomów.  Wodór  tworzy 
zatem  tzw.  kryształ  molekularny,  w którym  (w  odróż- 
nieniu od  prostych  układów  krystalicznych)  na  komór- 
kę elementarną  przypada  cząsteczka,  a więc  dwa  e- 
lektrony.  W krysztale  wodoru  mamy  więc  dokładnie 
tyle  elektronów  (2 N)y  ile  mieści  całkowicie  obsadzone 
pasmo  energetyczne.  Teoria  jednak  przewiduje,  że  pod 
niezwykle  wysokim  ciśnieniem  (ponad  2-10°  MPa) 
wodór  stały  zmienia  swą  strukturę  krystaliczną  i rze- 
czywiście staje  się  metalem.  Doświadczenia  nad  o- 
trzymaniem  fazy  metalicznej  wodoru  są  obecnie 
w toku.  Informacje  na  ten  temat  znajdzie  Czytelnik 
w artykule  „Wysokie  ciśnienia”. 


Optyczne  właściwości  metali 

Metale  zwracają  na  siebie  uwagę  przez  swój  pięk- 
ny, metaliczny  połysk.  Optyczne  właściwości  metalu 
podobnie  jak  i inne  ich  cechy  charakterystyczne, 
wynikają  również  w głównej  mierze  z istnienia  nie- 
zupełnie obsadzonych  pasm  energetycznych  (a  więc 
z istnienia  gazu  elektronowego).  Rozważmy  falę  świet- 
lną o częstości  co  padającą  na  gaz  swobodnych  elektro- 
nów. Fala  poprzez  swoje  pole  elektryczne  zmusza 
elektrony  do  drgań  o tej  samej  częstości  co , co  z kolei 
daje  zmienną  w czasie  polaryzację  ośrodka.  Faza, 
z którą  swobodne  elektrony  oscylują  pod  wpływem 
fali,  jest  przy  tym  taka,  że  wynikająca  z ruchu  elektro- 
nów polaryzacja  jest  ujemna  (tzn.  odwrotna  w fazie  do 
elektrycznego  pola  fali).  Jak  się  okaże,  z tego  właśnie 
faktu  wynikają  główne  cechy  optyczne  metali. 

Polaryzacja  ośrodka  może  być  formalnie  wyrażona 
przez  tzw.  efektywną  przenikalność  elektryczną  (prze- 
nikalność  względna)  która  z kolei  stanowi  punkt 
wyjściowy  przy  omówieniu  właściwości  optycznych 
materiałów.  Dla  metalu  * można  wyrazić  z dobrym 
przybliżeniem  jako: 


x = 1 —(ne2/mco2e0)  = 1—  (cOp/co2)t 


gdzie  n jest  koncentracją  elektronów  na  1 cm3,  e — 
ładunkiem,  m — masą  elektronu,  e0  — przenikalnoś- 
cią  próżni,  a cop  — tzw.  częstością  plazmową.  Człon 
ne2lmcoiE(>  przedstawia  wspomniany  wyżej  ujemny 
przyczynek  swobodnych  elektronów  do  polaryzacji 
ośrodka.  Ze  względu  na  dużą  koncentrację  elektro- 
nów w metalach,  wartość  tego  członu  w obszarze  wi- 
dzialnym, podczerwonym  i w niższych  częstościach 
jest  bardzo  duża  w porównaniu  z jednością,  a więc 
przenikalność  elektryczna  x dla  tych  obszarów  czę- 
stości ma  również  wartość  ujemną. 

Z równań  Maxwella  wiemy,  że  w ośrodku  o ujemnej 
przenikalności  elektrycznej  fale  elektromagnetyczne 
nie  mogą  się  rozchodzić.  W tych  warunkach  fale 
świetlne  nie  mogąc  przeniknąć  do  wnętrza  ośrodka, 
zostają  całkowicie  odbite,  niezależnie  od  częstości.  To 
tłumaczy  kolor,  połysk  i brak  przezroczystości 
„białych”  metali,  takich  jak  srebro  lub  aluminium. 
Gładkie  powierzchnie  tych  metali,  odbijając  światło 
w całym  obszarze  widzialnym,  stanowią  idealne  lu- 
stra. Patrząc  na  błyszczący  metal,  możemy  więc 
powiedzieć  że  w zasadzie  „widzimy”  swobodne  elek- 
trony. 

W powyższym  opisie  pominęliśmy  wpływ  absorpcji 
światła.  Absorpcja  światła  przez  gaz  elektronowy 
spowodowana  jest  rozpraszaniem  elektronów  i wyra- 
ża się  przez  poprawkę  do  * rzędu  v/co,  gdzie  v jest  śred- 
nią częstością  zderzeń.  Dla  typowych  wartość  i 
v (KP-1014  Hz)  i dla  częstości  optycznych  (5  • 1015  Hz) 
poprawka  ta  jest  tak  mała,  że  możemy  ją  pominąć. 

W naszych  rozważaniach  nie  uwzględniliśmy  rów- 
nież istnienia  niżej  położonych,  całkowicie  obsadzo- 
nych pasm  energetycznych,  takich  jak  np.  pasmo  2p 
na  rys.  8.  W większości  metali  pasma  te  odpowiadają 
tak  niskim  energiom  w stosunku  do  pasma  elektro- 
nów swobodnych,  że  w zakresie  widzialnym  energia 
kwantu  światła  (fotonu)  hcofln  jest  za  mała,  aby  spo- 
wodować przejścia  elektronowe  z tych  głęboko  po- 
łożonych pasm  (A  na  rys.  20a)  do  poziomów  nieob- 
sadzonych  (pasmo  B ).  Fale  świetlne  nie  wywołują  więc 
żadnych  zmian  w takich  całkowicie  obsadzonych 
pasmach.  W rezultacie  pasma  te  nie  wnoszą  nic  no- 
wego do  naszego  obrazu  właściwości  optycznych 
metali. 

Jednakże  w wypadku  niektórych  metali  (np.  zło- 
ta lub  miedzi)  sprawa  przedstawia  się  inaczej.  Energia 
dzieląca  pasmo  przewodnictwa  od  niższych  pasm  jest 
w tych  metalach  względnie  mała,  mniej  więcej  tego 
samego  rzędu  co  energia  kwantu  /ko/2tc  dla  krótszych 
fal  widzialnego  widma.  Zatem  fale  poniżej  pewnej 
długości  mogą  spowodować  przejścia  między  pas- 
mami, tak  jak  na  rys.  20b.  W złocie  i miedzi  energie 
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barwa  zaota 
i miedzi 


gromadzenie 

ładunku 


Rys.  20.  Mechanizm  absorpcji  przez  przejścia  międzypasmowe: 
a)  energia  fotonu  jest  zbyt  mała,  aby  wywołać  przejścia  z pasma  A 
do  stanów  nieobsadzonych  w paśmie  B , b)  różnica  energii  między 
pasmami  jest  mniejsza,  co  umożliwia  przejścia  międzypasmowe 
i związaną  z nimi  absorpcję  w obszarze  widzialnym 


powodujące  takie  przejścia  odpowiadają  falom  krót- 
szym od  500  nm,  a więc  obszarowi  niebieskiemu  i fio- 
letowemu widma.  Fale  z tego  obszaru  widma  będą 
więc  pochłaniane  i częściowo  usunięte  z odbitego 
przez  metal  światła.  W widmie  odbitego  światła 
przeważać  zatem  będą  fale  dłuższe,  a więc  światło 
czerwone,  pomarańczowe  i żółte,  co  tłumaczy  ciepły 
kolor  tych  metali.  Na  rys.  21  porównujemy  współ- 
czynniki odbicia  dla  srebra  i złota,  odróżniające  metal 
kolorowy  i biały. 

Pokazaliśmy  poprzednio,  że  przenikalność  elek- 
tryczna metali  * ma  wartość  ujemną  ze  względu  na 


Dielektryki 

Bożena  Hłlczer 

Dielektrykami  (izolatorami)  przyjęto  nazywać  ma- 
teriały, które  w danych  warunkach  termodynamicz- 
nych (określonej  temperaturze  i ciśnieniu)  mają 
przerwę  energetyczną  (-*  Struktura  elektronowa  ciał 
stałych)  większą  od  3 eV,  stałoprądową  przewodność 
elektryczną  w polach  poniżej  107  V/m  mniejszą  od 
10-6  Ó-1m-1  oraz  tangens  kąta  strat  w zakresie 
częstości  od  50  Hz  do  106  Hz  mniejszy  od  0,5.  Są  to 
kryteria  formalne.  Najważniejszą  własnością  fizyczną 
dielektryków  jest  zdolność  do  gromadzenia  ładunku 
elektrycznego.  Własność  ta  jest  znana  już  bardzo 
dawno.  Wyniki  eksperymentów  z ciałami  naładowa- 
nymi elektrycznie  pozwoliły  ustalić  prawidłowości 
powszechnie  znane  jako  prawo  Coulomba.  Stała  ma- 
teriałowa charakteryzująca  ośrodek  ze  względu  na  od- 
działywanie ładunków  zwana  jest  przenikalnością 
elektryczną  e.  Z elektrostatyki  wiemy  również,  że 
umieszczenie  dielektryka  w jednorodnym  polu  elek- 
trycznym powoduje  zmianę  gęstości  linii  sił  pola 
elektrycznego,  zależną  od  wielkości  przenikał ności 
elektrycznej  dielektryka.  Najprostszym  przykładem 
jednorodnego  pola  elektrycznego  jest  pole  panujące 
w kondensatorze  płaskim  (o  powierzchniach  okładek 
a odległych  o d ) umieszczonym  w próżni,  do  którego 
przyłożono  napięcie  U.  Na  okładkach  kondensatora 
zgromadzony  jest  ładunek  Q0 , linie  sił  pola  elek- 
trycznego są  prostopadłe  do  okładek  (gdy  pominiemy 
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wysoką  wartość  członu  nezlmco2e0  — a)*l<*)2.  Człon 
ten  zmniejsza  się  jednak  z wzrastaniem  częstości 
i dla  co  = cop  w obszarze  nadfioletu  osiąga  wartość  1 . dodatnia 
Dla  częstości  wyższych  od  a>P  przenikalność  elek-  przenikał - 

ność  elek 


Rys.  21.  Zależność  współczynnika  odbicia  od  długości  fali  dla 
srebra  i dla  złota 


tryczna  * staje  się  więc  dodatnia.  Toteż  w obszarze 
bardzo  krótkich  fal  (nadfiolet  i krótsze)  metal  staje 
się  przeźroczysty  i zachowuje  się  nie  inaczej  niż  dia- 
ment lub  kwarc  w widzialnym  zakresie  widma. 

M.  Ya.  Azbel,  M.  I.  Kaganov,  I.  M.  Lieshitz  Conduclion 
Electrons  in  Metals,  Sc.  Am.  228,  88  (1973);  A.  H.  Cottrell 
The  Naturę  of  Metals.  Sc.  Am.  217,  90  (1967);  L.  Kalinowski 
Fizyka  metali,  Warszawa  1970;  A.  R.  Macxxntosh  The  Fermi 
Surface  of  Metals,  Sc.  Am.  209,  110  (1963). 


efekty  brzegowe),  a natężenie  pola  elektrycznego 
E = U Id.  Znając  gęstość  D strumienia  linii  sił  pola 
elektrycznego  (tzw.  przesunięcie  elektryczne)  oraz 
natężenie  E pola  elektrycznego  możemy  wyznaczyć 
przenikalność  elektryczną  próżni  jako  stosunek  prze- 
sunięcia elektrycznego  w próżni  do  natężenia  pola 
elektrycznego : e0  — &/E  = C0d/a.  Wartość  przeni- 
kalności  elektrycznej  próżni  można  doświadczalnie 
wyznaczyć  mierząc  za  pomocą  galwanometru  bali- 
stycznego ładunek  Qq\  wynosi  ona  e0  — 8,85-1 0-12 
F/m.  Gdy  między  okładkami  kondensatora  płaskiego 
mającego  w próżni  pojemność  C0  umieścimy  dielek- 
tryk, to  pojemność  jego  wzrośnie  do  wartości  C = 
= eC0.  Liczbę  określającą  ile  razy  pojemność  kon- 
densatora zawierającego  dielektryk  jest  większa  od 
pojemności  takiego  samego  kondensatora  próżnio- 
wego nazywamy  przenikalnością  elektryczną  e.  Jeżeli 
do  kondensatora  z dielektrykiem  przyłożymy  prze- 
mienne napięcie  U = U0Qi<aty  to  w obwodzie  popły- 
nie prąd,  który  w wypadku  dielektryka  idealnego 
(bezstratnego)  będzie  wyprzedzał  napięcie  w fazie 
o 7t/2  (rys.  Ib).  Ogólnie,  w dielektryku  realnym 
(stratnym)  oprócz  prądu  przesunięcia  popłynie  prąd 
przewodzenia  o fazie  zgodnej  z przyłożonym  napię- 
ciem (rys.  lc)  i przenikalność  elektryczną  wyraża  się 
jako  wielkość  zespoloną  e*  = e'—ie",  gdzie  e ozna- 
cza rzeczywistą  składową  przenikalności  elektrycznej. 
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Rys.  1.  Relacje  fazowe  między  natężeniem  prądu  7 i napięciem  U: 
a)  kondensator  próżniowy,  b)  kondensator  z dielektrykiem  bez- 
stratnym, c)  kondensator  z dielektrykiem  stratnym 


natomiast  e"  — składową  urojoną,  charakteryzującą 
straty  dielektryczne.  Straty  dielektryczne  przyjęto 
określać  wielkością  tg  S,  czyli  stosunku  natężenia 
prądu  zgodnego  w fazie  z napięciem  do  natężenia 
prądu  przesunięcia:  tg  <5  = oe"C0  U/<oe'C0  U =»  e"je'. 
Często  do  opisu  własności  dielektryków  stratnych 
przewodność  stosuje  się  również  wielkość  Gy  zwaną  przewodnością 
elektryczna  elektryczną,  określoną  jako  iloczyn  częstości  kołowej 
i urojonej  części  przenikalności  elektrycznej: 
G = a>e0e".  Wielkość  ta  opisuje  straty  energii  zwią- 
zane z różnymi  procesami  zachodzącymi  w dielek- 
tryku. 

Przewodnictwo  elektryczne 

Prąd  płynący  po  przyłożeniu  do  dielektryka  stałego 
pola  elektrycznego  zanika  w czasie.  Jest  to  konsek- 
wencja czasowej  zmiany  przewodności  elektrycznej 
dielektryka,  określonej  stosunkiem  gęstości  prądu 
do  natężenia  pola  elektrycznego.  Od  wartości  prze- 
wodności elektrycznej  er  w stanie  ustalonym  (gdy 
czasowe  zmiany  są  mniejsze  niż  kilka  procent  na  go- 
dzinę) zależą  własności  elektryczne  dielektryków, 
zależność  od  jak  wspomnieliśmy  na  wstępie,  przewodność  elek- 
temperatury  tryczna  dielektryków  jest  mała;  w dobrych  dielektry- 
kach w warunkach  normalnych  jest  mniejsza  nawet 
od  10_18f2_1m-1.  Przy  niskich  temperaturach  prze- 
wodność elektryczna  dielektryków  bardzo  słabo 
zależy  od  temperatury  (rys.  2),  a ruchliwość  nośni- 
ków prądu  mieści  się  w przedziale  od  10“14  do  10" 4 


Rys.  2.  Schematyczne  przedstawienie  temperaturowej  zależności 
przewodnictwa  elektrycznego  dielektryków 

m2/Vs.  Ze  wzrostem  temperatury  ruchliwość  nośni- 
ków prądu  rośnie,  wiemy  jednak,  że  rośnie  również 
liczba  nośników  prądu  (— ► Półprzewodniki).  Ponie- 
waż przewodność  elektryczna  zależy  zarówno  od 
liczby  nośników  jak  i od  ich  ruchliwości,  a obie  te 


wielkości  zależą  od  temperatury  w sposób  aktywa- 
cyjny, to  temperaturową  zależność  przewodności  prawo 
elektrycznej  dielektryków  cr  opisuje  dobrze  prawo  Arirheniusa 
Arrheniusa  (rys.  2):  a = 0oe~w/kT,  gdzie  W oznacza 
energię  aktywacji. 

Zastanówmy  się  teraz,  jakie  są  możliwe  sposoby 
transportu  elektrycznego  w dielektrykach.  Aby  zmie- 
rzyć przewodność  elektryczną  dielektryka,  musimy 
nałożyć  na  niego  elektrody  metalowe  i przyłożyć 
zewnętrzne  pole  elektryczne.  Diagram  struktury  pas- 
mowej dielektryka  z nałożonymi  elektrodami  jest 
przedstawiony  schematycznie  na  rys.  3a,  a zagięcie 
pasm  w pobliżu  zetknięcia  powierzchni  metalu  i die- 
lektryka zależy  od  pracy  wyjścia  obydwu  materiałów. 


Rys.  3.  Struktura  pasmowa  układu  metal-dielektryk-metal  (a) 
i schematyczne  przedstawienie  tunelowania  oraz  przewodnictwa 
hoppingowego  (b) 


W niezbyt  silnych  polach  elektrycznych  (mniejszych 
niż  107  V/m)  jednym  z możliwych  mechanizmów 
transportu  ładunku  w takim  układzie  jest  ruch  elek- 
tronu lub  dziury  w pasmach  dozwolonych.  Poruszający 
się  w dielektryku  elektron  (lub  dziura)  wywołuje 
jednak  lokalną  polaryzację  sieci,  przemieszczającą 
się  wraz  z nim.  Obiekt  taki,  zachowujący  się  zupełnie 
inaczej  niż  swobodny  elektron,  nazywamy  polaro- 
nem.  Drugim  możliwym  mechanizmem  jest  transport 
elektronów  (lub  dziur)  przez  pasmo  wzbronione. 
W idealnym  dielektryku  jest  to  możliwe  tylko  w wy- 
niku kwantowego  procesu  tunelowania  w bardzo 
cienkich  kryształach  (o  grubościach  mniejszych  niż 
3 nm).  W rzeczywistych  dielektrykach  defekty  sieci 
krystalicznej  powodują  powstanie  paśmie  wzbro- 
nionym lokalnych,  dozwolonych  poziomów  energe- 
tycznych, zwanych  poziomami  pułapkowymi.  Jeżeli 
gęstość  lokalnych  poziomów  pułapkowych  jest  duża 
i odległości  między  nimi  są  małe  (mniejsze  niż  3 nm), 
to  mogą  wystąpić  zjawiska  kwantowe  i elektrony 
w przyłożonym  polu  elektrycznym  będą  się  poruszać 
skacząc  od  jednej  pułapki  do  drugiej  (rys.  3b).  Prze- 
wodnictwo związane  z tym  zjawiskiem  nazywa  się 
przewodnictwem  hoppingowym.  Przewodnictwo  elek- 
tryczne dielektryków  może  mieć  również  charakter 
jonowy.  W tym  wypadku  transport  ładunku  w polu 
elektrycznym  jest  związany  z ruchem  jonów  między 
położeniami  międzywęzłowymi  lub  lukami  w węzłach 
sieci,  podobnie  jak  w kryształach  jonowych.  Ogólnie 
w dielektrykach  można  wyróżnić  kilka  możliwych 
mechanizmów  transportu  elektrycznego.  Przewod- 
nictwo elektryczne  może  być  związane  z ruchem 
elektronów  (lub  dziur)  w obrębie  dozwolonych  pasm 
energetycznych  i proces  ten  opisuje  formalizm  ruchu 
polaronów  z ruchem  elektronów  (lub  dziur)  przez 
pasmo  wzbronione,  co  prowadzi  do  procesu  tunelo- 
wania lub  hoppingu,  oraz  z ruchem  ujemnie  lub 
dodatnio  naładowanych  jonów  między  defektami 
punktowymi  sieci. 


polarem 


przewod- 

nictwo 

hoppmgowe 


przewod- 

nictwo 

jonowe 


517 


podatność 

dielektryczna 


molekularny 

mechanizm 

polaryzacji 


Polaryzacja  dielektryczna 

Przyłożenie  stałego  napięcia  U do  płaskiego  konden- 
satora próżniowego  spowoduje  naładowanie  go  do 
pojemności  C0i  takiej,  aby  swobodne  ładunki  na  każ- 
dej okładce  wytworzyły  różnicę  potencjałów  równą 
co  do  wielkości  U,  lecz  o przeciwnej  polamości 


i + 4--  + .4  •:+-  4 -4-  f 

O-ł- 

U 

L ~ • ~ ~ j ~~  ~ ~ 1 

1 4+4  4-  4 -r -j-  -r  4-  4 4 ^ -i 

U 

r 

4 4*  4 4 4 4 j 

Rys.  4.  Wpływ  dielektryka  na  gęstość  ładunku  na  okładkach  kon- 
densatora 

(rys.  4a).  Dielektryk  o przenikalności  elektrycznej  c 
umieszczony  między  okładkami  takiego  kondensa- 
tora zwiększy  jego  pojemność,  gdyż  na  okładki  kon- 
densatora musi  dopłynąć  ze  źródła  ładunek  kom- 
pensujący ładunek  polaryzujący  dielektryka  (rys.  4b). 
Efekt  polaryzacji  związany  jest  z orientacją  dipoli 
elektrycznych  (indukowanych  i trwałych)  pod  wpły- 
wem przyłożonego  pola  elektrycznego.  Powstała 
polaryzacja  dielektryczna  P jest  określona  wielkością 
momentu  dipolowego  jednostki  objętości  dielektryka. 
Z rys.  4b  widać,  że  polaryzację  dielektryka  można 
określić  również  jednoznacznie  gęstością  ładunków 
na  powierzchni  dielektryka  i definicje  te  są  używane 
zamiennie.  Gęstość  strumienia  linii  sił  pola  elek- 
trycznego jest  wtedy  określona  związkiem  D = eQEĄ- 
-\-P,  a ponieważ  D = eQs'Et  wyrażenie  wiążące  po- 
laryzację z natężeniem  pola  elektrycznego  ma  po- 
stać P = £<>(«'  — \)E.  Wielkość  (ef  — 1)  nazywamy 
również  podatnością  dielektryczną  ośrodka;  określa 
ona  stosunek  gęstości  ładunku  związanego  do  gęs- 
tości ładunku  swobodnego. 

Przy  wprowadzaniu  wielkości  ey  e'\  G oraz  P, 
traktowaliśmy  dielektryk  jako  ciało  izotropowe. 
Kryształy  dielektryczne  są  jednak  ciałami  wykazują- 
cymi anizotropię  własności  fizycznych,  przy  czym 
wielkości  te  są  zależne  od  kierunku  w krysztale.  Do- 
kładny opis  własności  dielektrycznych,  uwzględnia- 
jący ich  anizotropowy  charakter,  jest  możliwy  jedynie 
za  pomocą  rachunku  tensorowego. 

Dotychczas  nie  wnikaliśmy  w molekularny  me- 
chanizm powstawania  polaryzacji  dielektrycznej,  ani 
nie  wyróżnialiśmy  rodzaju  momentów  dipolowych 
odpowiedzialnych  za  polaryzację  dielektryka,  związa- 
liśmy jedynie  polaryzację  dielektryczną  z wielkością 
natężenia  pola  elektrycznego.  Obecnie  omówimy 
molekularne  mechanizmy  polaryzacji  dielektrycznej. 
Na  wstępie  musimy  zdać  sobie  sprawę,  że  wewnętrzne 
(lokalne)  pole  elektryczne  F panujące  w dielektryku 
różni  się  dość  istotnie  od  przyłożonego  zewnętrznego 
pola  E.  Zagadnienie  pola  wewnętrznego  jest  ciągle  jed- 
nym z głównych  problemów  teorii  dielektryków  i w 
ogólnym  wypadku  nie  jest  rozwiązane.  R.  Clausius 
związał  polaryzację  dielektryczną  z polem  wewnętrz- 
nym F równaniem: 

P = (e'-\)e0E=  NolF, 

gdzie  a — polaryzowalność,  czyli  zdolność  do  tworzenia 
dipoli  przez  atomy  lub  molekuły  ośrodka,  natomiast 
N jest  liczbą  elementarnych  dipoli  w jednostce  obję- 
tości. Pole  lokalne  w dielektrykach  niedipoiowych 
i dielektrykach  z całkowicie  nieuporządkowanymi  mo- 
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mentami  dipolowymi  lub  dipolami  uporządkowa- 
nymi w sieć  o najwyższej  symetrii,  można  opisać 
w sposób  przybliżony  wzorem  Lorentza : 


F — E+ 


3^0 


e'+2 

3 


E 


(pole  Lorentza). 


wzór 

Lorentza 


Inne  wyrażenia  na  pole  wewnętrzne  podali  L.  Onsager 
(w  ujęciu  molekularnym)  oraz  H.  Frohlich  i J.G.  Kirk- 
wood  (na  podstawie  rozważań  statystycznych).  Wy- 
rażenia te  są  bardzo  skomplikowane  i na  ogół  zastę- 
puje się  je  wyrażeniami  otrzymanymi  w sposób 
półempiryczny. 

Ogólnie  polaryzacja  jednorodnego  dielektryka 
składa  się  z polaryzacji  dipolowej  Pd  (wywołanej 
orientacją  trwałych  molekularnych  dipoli  w p°lu 
elektrycznym)  oraz  z polaryzacji  deformacyjnej 
(związanej  z indukowaną  przez  pole  elektryczne  po- 
laryzacją atomową  Pa  i polaryzacją  elektronową  P€). 

Istnieją  oczywiście  materiały  dielektryczne  nie  mające 
trwałych  molekularnych  momentów  dipolowych 
i wtedy  ich  polaryzacja  dielektryczna  jest  tylko  po- 
laryzacją deformacyjną.  Można  wyróżnić  również 
dielektryki,  w których  występuje  jedynie  polaryzacja 
elektronowa. 

Trwałe  momenty  dipolowe  mają  molekuły  o nie-  trwałe 
symetrycznym  rozkładzie  ładunku  (rys.  5).  Moment  momenty 
dipolowy  dużych  molekuł  organicznych  związany  jest  dipolowe 


na  ogół  z takimi  grupami  dipolowymi  jak  grupa  hydro- 
ksylowa O — H lub  grupa  ketonowa  C=0.  Całkowi- 
ty moment  dipolowy  molekuły  jest  wtedy  w dobrym 
przybliżeniu  równy  wektorowej  sumie  wszystkich 
składowych  momentów  pochodzących  od  grup  dipo- 
lowych. 

Gdy  w dielektryku  występują  trwale  dipole  mole- 
kularne fi,  to  w zewnętrznym  polu  elektrycznym 
orientują  się  one  w kierunku  pola  i polaryzacja  dipo- 
lowa, zwana  również  polaryzacją  orientacyjną,  jest 
określona  średnim  rzutem  momentów  dipolowych  na 
kierunek  pola  wewnętrznego  w dielektryku  (rys.  6a). 
W przemiennym  polu  elektrycznym,  w najprostszym 
wypadku,  gdy  w dielektryku  występuje  tylko  jeden 
rodzaj  trwałych  dipoli  molekularnych,  zespoloną 
przenikalność  elektryczną  można  przedstawić  wzorem : 


polaryzacja 

orientacyjna 


co 

e*  = I'  P(t)eicitdt, 

o 

gdzie  ea  oznacza  wartość  przenikalności  elektrycznej 
przy  wysokich  częstościach,  natomiast  p(t)  ma  cha- 
rakter współczynnika  zanikania,  określającego  opóź- 
nienie zmian  polaryzacji  względem  zmian  pola  elek- 
trycznego. W roku  1912  P.  Debye  zaproponował 
wykładniczą  formę  współczynnika  zaniku  £(/)  = 
= /?(0)e  </t,  z czasem  relaksacj  i t,  charakteryzującym 
dielektryk  dipolowy  i zależnym  od  temperatury  w spo- 
sób aktywacyjny.  Prowadzi  to  do  dyspersji  przeni- 
kalności elektrycznej  przedstawionej  na  rys.  6a. 
Debye’owski  model  dielektryka,  w którym  wystę- 
pują dipole  molekularne  jednego  rodzaju,  mające 
jeden  czas  relaksacji,  jest  modelem  uproszczonym. 
W rzeczywistych  dielektrykach  występuje  na  ogół 
rozszerzenie  obszaru  relaksacji  wywołane  zarówno 
różnicami  naturalnej  częstości  drgań  dipoli  związane 
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Rys.  6.  Schematyczne  przedstawienie  polaryzacji  orientacyjnej  oraz  dyspersja  i absorpcja  debyeowska  (a),  polaryzacji  atomowej  (b) 
i elektronowej  (c)  oraz  związana  z tymi  zjawiskami  anomalna  dyspersja  i absorpcja 


z różnicami  w rozmiarach  i kształtach  trwałych  dipoli 
molekularnych  jak  i różnicami  energii  aktywacji 
dipoli,  a więc  różną  konfiguracją  najbliższego  sąsiedz- 
twa takich  samych  dipoli  molekularnych.  Opis  ma- 
tematyczny tego  zjawiska  jest  bardziej  skompliko- 
wany, gdyż  trzeba  wprowadzić  funkcje  rozkładu  cza- 
sów- relaksacji.  Wprowadza  się  je  na  ogół  w postaci 
podanej  przez  Cole-Cole,  Frohlicha  lub  Fuossa-Kirk- 
wooda.  Ogólna  zależność  przenikalności  elektrycz- 
nej od  częstości  dla  układów,  w których  występuje 
rozpraszanie  energii,  została  podana  przez  Kramersa 
i Kroniga.  Dyspersja  przenikalności  elektrycznej 
związana  z relaksacją  polaryzacji  dipolowej  występuje 
w zakresie  częstości  mikrofalowych. 

Wróćmy  teraz  do  polaryzacji  deformacyjnej  i naj- 
pierw rozpatrzmy  polaryzację  atomową  i jonową. 
Dla  uproszczenia  rozważmy  molekułę  złożoną  z dwu 
atomów  (lub  jonów)  A oraz  B (rys.  6b),  między  któ- 
rymi występuje  oddziaływanie.  Przyłożenie  pola  elek- 
trycznego spowoduje  rozsunięcie  rdzeni  atomów 
(jonów),  zwiększając  odległość  między  nimi,  co  po- 
woduje powstanie  momentu  dipolowego  (lub  jeżeli 
molekuła  miała  bez  pola  moment  dipolowy — jego 
zwiększenie).  Prowadzi  to  do  polaryzacji  ośrodka. 
Wiemy  jednak,  że  atomy  można  traktować  również 


jako  obiekty  składające  się  z naładowanego  dodatnio 
rdzenia,  otoczonego  chmurami  elektronów  (rys.  6c), 
których  symetria  jest  określona  ich  stanami  kwanto- 
wymi (— ► Chemia  kwantowa,  rozdz.  „Atomy  wielo- 
elektronowe”).  Przyłożenie  pola  elektrycznego  po- 
woduje przesunięcie  chmury  elektronów  względem 
rdzenia,  co  prowadzi  również  do  powstania  induko- 
wanego momentu  dipolowego  i w konsekwencji  do 
indukowania  polaryzacji  elektronowej. 

Do  polaryzacji  atomowej,  jonowej,  a także  elektro-  model  oscyla- 
nowej  można  zastosować  model  oscylatora  harmonicz-  tora  harmo- 
nego.  Przesunięcie  przez  pole  elektryczne  ładunków  nicznego 
przeciwnych  znaków,  związanych  ze  sobą  sprężyście, 
powoduje  polaryzację  ośrodka.  Po  usunięciu  zabu- 
rzenia wywołanego  polem  ładunki  wracają  do  swo- 
ich pierwotnych  położeń  równowagi  wykonując  drga- 
nia, które  zanikają  z szybkością  określoną  tłumie- 
niem. Gdy  pole  wywołujące  polaryzację  deformacyjną 
jest  polem  przemiennym,  układ  złożony  z takich 
oscylatorów  może  zaabsorbować  energię  przy  pew- 
nej charakterystycznej  częstości  (o0 . Zjawisko  to  jest 
zupełnie  analogiczne  do  absorpcji  rezonansowej  ob- 
wodu elektrycznego  zawierającego  opór  omowy, 
pojemność  oraz  indukcyjność.  Do  opisu  zależności 
zespolonej  przenikalności  elektrycznej  od  częstości 


519 


pola  elektrycznego,  gdy  zachodzi  absorpcja  rezonan- 
zanikanie  sowa,  H.  Frohlich  wprowadził  czynnik  (analogiczny 
polaryzacji  do  współczynnika  Debye’a)  określający  zanikanie 
polaryzacji:  £(/)  = /?(0)e“t/r  cos(c£>0/-F9>),  gdzie  9? 
oznacza  opóźnienie  fazowe  polaryzacji  względem 
pola  elektrycznego.  Na  rys.  6b  i 6c  przedstawiono 
zależność  e'  oraz  e"  od  częstości,  w wypadku  polary- 
zacji atomowej  i elektronowej.  Rezonansowa  absorp- 
cja i dyspersja  związana  z drganiami  rdzeni  atomo- 
wych w molekułach  leży  w obszarze  podczerwieni, 
a związana  z drganiami  dipola  wytworzonego  prze- 
sunięciem chmury  elektronowej  względem  dodat- 
niego rdzenia  — w obszarze  częstości  optycznych. 
W zakresie  częstości  optycznych  zamiast  zespolonej 
przenikalności  elektrycznej  wprowadza  się  zwykle 
zespolony  współczynnik  załamania  n*y  przy  czym 
zespolona  przenikalność  elektryczna  = (n*)2  (za- 
leżność Maxwella).  Polaryzacja  deformacyjna  może 
być  wywołana  także  polem  elektrycznym  fali  świetl- 
nej. Zjawisko  to  odgrywa  istotną  rolę,  gdy  dielektryk 
jest  poddany  działaniu  silnych  wiązek  światła  lase- 
rowego. 

polaryzacja  Polaryzacja  całkowita  dielektryka  jednorodnego 
dielektryka  składa  się  z polaryzacji  deformacyjnej  i polaryzacji 
niejedno-  orientacyjnej.  Materiały  dielektryczne  są  jednak  na 
rodnego  ogół  układami  niejednorodnymi.  Występujące  w cia- 
łach stałych  defekty  sieci  krystalicznej  (defekty  punk- 
towe, dyslokacje  lub  granice  ziaren)  stanowią  pułapki 
dla  poruszających  się  pod  wpływem  przyłożonego 
pola  elektrycznego  nośników  prądu  i w efekcie  na 
nich  gromadzi  się  ładunek  elektryczny.  Ten  prze- 
strzenny ładunek  indukuje  ładunek  na  elektrodach, 

r v ryzacja 


polu  elektrycznym  i przy  zerowych  naprężeniach  me- 
chanicznych, a ponadto  polaryzacja  ta  zmienia  się 
wskutek  małych  zmian  temperatury.  Kryształy  takie 
to  piroelektryki.  Ze  względu  na  swoje  własności 
kryształy  te  znajdują  szerokie  zastosowanie  jako  de- 
tektory promieniowania  cieplnego,  szczególnie  pod- 
czerwonego, np.  w noktowizorach.  Niektóre  spośród 
kryształów  piroelektrycznych  mają  jeszcze  dodatkowo 
niezwykle  interesującą  własność,  mianowicie  kierunek 
ich  polaryzacji  spontanicznej  może  być  zmieniony  za 
pomocą  zewnętrznego  pola  elektrycznego  o natężeniu 
małym  w porównaniu  z natężeniem  pola  wewnętrz- 
nego. Kryształy  te  nazywamy  ferroelektrykami,  ich 
najważniejszą  cechą  jest  możliwość  przepolaryzowa- 
nia.  Wystąpienie  własności  piezo-  i piroelektrycznych 
dielektryków  można  w zasadzie  przewidzieć  na  pod- 
stawie znajomości  klasy  symetrii  kryształu, 
nie  można  jednak  oczywiście  ocenić  wielkości  wy- 
stępującego efektu.  Piezoelektrykami  mogą  być 
kryształy  należące  do  20  klas  nie  mających  środka 
symetrii  (spośród  32  klas ; — ► Budowa  kryształów), 
natomiast  tylko  kryształy  należące  do  10  klas  ma- 
jących oś  symetrii  mogą  wykazywać  własności  piro- 
elektryczne.  Warunkiem  koniecznym  wystąpienia 
własności  ferroelektrycznych  jest  przynależność  kry- 
ształu do  klasy  polarnej  (tzn.  mającej  oś  symetrii),  nie 
jest  to  jednak  warunek  dostateczny.  Jedynie  ekspery- 
mentalnie można  rozstrzygnąć,  czy  kierunek  polaryza- 
cji może  być  zmieniony  za  pomocą  zewnętrznego  pola 
elektrycznego.  W czasie  przepolaryzowania  przez  kry- 
ształ ferroelektryczny  płynie  prąd  przesunięcia,  które- 
go gęstość  jest  w każdej  chwili  miarą  szybkości  zmian 
polaryzacji.  Szybkość  zmiany  polaryzacji  po  przyło- 
żeniu pola  elektrycznego  można  badać  mierząc  rze- 
czywisty prąd  płynący  przez  opór  połączony  szerego- 
wo z kryształem  (rys.  8a),  natomiast  polaryzację 
spontaniczną  można  wyznaczyć  stosując  układ  poda- 
ny na  rys.  8b.  Na  rysunku  tym  przedstawiono  również 
różnicę  odpowiedzi  kryształów  dielektrycznych  bez- 
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co  powoduje  powstanie  dodatkowej  polaryzacji  Pi. 
Dyspersja  i absorpcja  dielektryczna  związana  z ła- 
dunkiem zgromadzonym  na  niejednorodnościach  die- 
lektryka występuje  w obszarze  częstości  od  10-5  Hz 


odpowiedź 

dielektryka 

bezstratnego 


Zależność  całkowitej  polaryzacji  dielektryka  niejedno- 
rodnego od  częstości  przedstawiono  na  rys.  7. 
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Omówione  powyżej  własności  dielektryków  pozwala- 
ją na  wyciągnięcie  wniosku,  że  najważniejszą  cechą 
charakteryzującą  dielektryki  jest  możliwość  zmiany 
ich  polaryzacji  za  pomocą  małych  zmian  zewnętrz- 
nego pola  elektrycznego.  Polaryzacja  kryształów  die- 
lektrycznych może  się  jednak  zmieniać  również 
wskutek  działania  innych  czynników  zewnętrznych, 
takich  jak  naprężenia  mechaniczne  lub  temperatura. 
Kryształy,  w których  małe  zmiany  naprężeń  zewnętrz- 
piezo-  nych  wywołują  zmianę  polaryzacji  (niezależnie  od 
elektryki  zmian  wywołanych  polem  elektrycznym),  nazywamy 
ktyształami  piezoelektrycznymi.  Niektóre  spośród 
piezoelektryków  wykazują  polaryzację  spontaniczną, 
tzn.  polaryzację  dielektryczną  występującą  w zerowym 
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Rys.  8.  Schematyczne  przedstawienie  odpowiedzi  elektrycznej 
dielektryka  bezstratnego  oraz  ferroelektryka  na  zmiany  pola 
elektrycznego 


nieliniowość 

dielektryczna 


anomalie 
w tempera- 
turze Curie 


prawo  Curie- 
Weissa 


zależność 
polaryzacji 
spontanicz- 
nej od 
temperatury 


stopień  upo- 
rządkowania 


stratnych  i kryształów  ferroelektrycznych  na  zmiany 
zewnętrznego  pola  elektrycznego.  Z rysunku  widać, 
że  polaryzacja  dielektryczna  ferroelektryków  nie  jest 
liniową  funkcją  natężenia  pola  elektrycznego;  za- 
leżność P(E ) ma  kształt  typowej  pętli  histerezy. 
Nieliniowość  dielektryczna  ferroelektryków  jest  ich 
bardzo  ważną  własnością;  przejawia  się  ona  również 
w zależności  przenikalności  elektrycznej  od  natęże- 
nia pola  elektrycznego.  Pojemność  kondensatora 
zawierającego  ferroelektryk  zależy  bardzo  silnie  od 
natężenia  mierzącego  pola  — mierzona  za  pomocą 
pola  przemiennego,  o bardzo  małym  natężeniu,  za- 
leży również  od  natężenia  stałego  pola  polaryzują- 
cego. Trzecią  bardzo  ważną  własnością  ferroelektry- 
ków są  anomalie  własności  fizycznych  w temperatu- 
rze Curie  Tc  (temperatura  przejścia  ze  stanu  ferro- 
elektrycznego do  stanu  paraelektrycznego).  W tem- 
peraturze tej  przenikalność  elektryczna  osiąga  war- 
tość maksymalną,  a następnie  w fazie  paraelektrycz- 
nej  maleje  hiperbolicznie  ze  wzrostem  temperatury. 


Rys.  9.  Zależność  od  temperatury  przenikalności  elektrycznej 
siarczanu  trójglicyny  (przy  częstościach  radiowych) 

Jej  temperaturową  zależność  opisuje  dobrze  prawo 
Curie-Weissa  (rys.  9),  podobnie  jak  dla  ciał  ferro- 
magnetycznych (— ► Teoria  magnetyzmu).  Niektóre 
spośród  ferroelektryków  są  w fazie  paraelektrycznej 
również  piezoelektrykami  (np.  sól  Seignette’a, 
kwaśny  fosforan  potasu  KDP ) i dla  tych  kryształów 
pewne,  wyróżnione  przez  symetrię  kryształu,  mo- 
duły piezoelektryczne  oraz  moduły  sprężystości 
osiągają  w temperaturze  Curie  również  anomalnie 
duże  wartości.  Na  rys.  10  pokazano  charaktery- 
styczną temperaturową  zależność  polaryzacji  spon- 
tanicznej dla  tytanianu  baru  oraz  siarczanu  trój- 
glicyny.  W pierwszym  wypadku  przejście  ze  stanu 
ferroelektrycznego  do  stanu  paraelektrycznego  jest 
przemianą  fazową  I rodzaju  i jest  związane  z zani- 
kiem polaryzacji  pochodzącej  od  przesunięcia  jonów 
i elektronów  w komórce  elementarnej  typu  perow- 
skitu.  Drugi  wypadek  (siarczan  trójglicyny)  jest  przy- 
kładem przemiany  fazowej  II  rodzaju  i to  tzw.  prze- 
miany fazowej  typu  porządek-nieporządek.  Model 
przemiany  fazowej  typu  porządek-nieporządek  przyj- 
muje istnienie  w sieci  krystalicznej  elektrycznym 
momentów  dipolowych,  odwracalnych  zewnętrznych 
polem  elektrycznym,  przy  czym  w fazie  ferroelek- 
trycznej równoległe  uporządkowanie  tych  dipoli 
w dużej  objętości  jest  przyczyną  polaryzacji  sponta- 
nicznej kryształu.  Powyżej  temperatury  Curie  znika 
uporządkowanie  dipoli,  a więc  znika  polaryzacja 
spontaniczna.  Aby  określić  stopień  uporządkowania 
ferroelektrycznego  wprowadza  się  parametr  uporząd- 
kowania dalekiego  zasięgu  S = (N+  — AL)/(Ar++AL), 
gdzie  N+  oznacza  liczbę  dipoli  elementarnych  zorien- 
towanych w wybranym  kierunku  dodatnim,  a AL  — 


temperatura 
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Rys.  10.  Zależność  od  temperatury  polaryzacji  spontanicznej: 
a)  tytanianu  baru  i b)  siarczanu  trójglicyny 


liczbę  dipoli  zorientowanych  w kierunku  przeciwnym. 
Parametr  uporządkowania  ma  wartości : S = 0 
w fazie  paraelektrycznej,  5 = +1  w fazie  ferroelek- 
trycznej (oznacza  to,  że  wszystkie  dipole  są  zoriento- 
wane w kierunku  dodatnim),  S = — 1,  gdy  wszystkie 
dipole  są  zorientowane  w kierunku  ujemnym,  oraz 
S < 1 w wypadku  niecałkowitego  uporządkowania. 
W tym  prostym  modelu  polaryzacja  spontaniczna 
Ps  = //(A+-bA L)S,  a temperaturowa  zależność  pa- 
rametru uporządkowania  dalekiego  zasięgu  (rys.  11) 
określa  temperaturową  zależność  polaryzacji  spon- 
tanicznej. Istnieją  również  kryształy,  które  mają  dwie 
identyczne,  antyrównolegle  spolaryzowane  podsieci, 
tzw.  antyferroelektryki.  Wypadkowa  polaryzacja 
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Rys.  11.  Zależność  od  temperatury  parametru  uporządkowania 
dla  ferroelektryków  wykazujących  przejście  fazowe  typu  porzą- 
dek-nieporządek 

spontaniczna  takich  kryształów  jest  równa  zeru. 
Gdy  antyrównolegle  spolaryzowane  podsieci  nie  są 
identyczne,  mamy  kryształ  ferrielektryczny  o małej 
wypadkowej  wartości  polaryzacji  spontanicznej. 

Temperaturowa  zależność  przenikalności  elek- 
trycznej dla  modelu  porządek-nieporządek  jest  okreś- 
lona głównie  temperaturową  zależnością  funkcji  ko- 
relacji (— ► Przejścia  fazowe  i zjawiska  krytyczne)  opi- 
sującej, jak  silny  jest  wpływ  dipola  o dodatniej  (wy- 
różnionej) polarności  na  orientację  innych  dipoli. 
Funkcja  ta  ma  maksimum  w temperaturze  Curie. 
Oznacza  to,  że  przemiana  fazowa  II  rodzaju  w ferro- 
elektrykach jest  zjawiskiem  związanym  z wystąpie- 
niem bardzo  silnych  oddziaływań  między  dipolami 
ferroelektrycznymi  (których  orientację  można  zmie- 
nić za  pomocą  zewnętrznego  pola  elektrycznego). 
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W krysztale  ferroelektrycznym  polaryzacja  spon- 
taniczna nie  ma  w całej  objętości  takiego  samego 
kierunku.  Kryształ  jest  podzielony  na  obszary  elek- 
trycznie uporządkowane  (w  których  dipole  ferro- 
elektryczne są  zorientowane  w tym  samym  kierunku), 
zwane  domenami  ferroelektrycznymi.  Domeny  są 
obszarami  makroskopowymi,  a polaryzacja  sponta- 
niczna w sąsiednich  różnych  domenach  ma  taką  samą 
wartość,  lecz  różni  się  zwrotem,  przy  czym  kierunek 
polaryzacji  musi  się  pokrywać  z kierunkiem  odpo- 
wiedniej osi  polarnej.  Znając  symetrię  kryształu  w fa- 
zie paraelektrycznej  oraz  w fazie  polarnej  można 
przewidzieć  dozwolone  orientacje  ściany  domenowej 
w krysztale.  Są  one  określone  warunkami  ciągłości 
składowej  polaryzacji.  W tytanianie  baru  w fazie 


Rys.  12.  Możliwe  orientacje  ściany  domowej:  a)  w tytanianie  baru, 
b)  w soli  Seignette’a  (deformacja  yx  przesadnie  powiększona) 


tetragonalnej  możliwe  są  tzw.  ściany  180°,  oddziela- 
jące domeny  o antyrównoległych  kierunkach  polary- 
zacji, oraz  ściany  90°,  oddzielające  domeny,  w których 
kierunki  polaryzacji  są  prostopadłe  (rys.  12).  W siar- 
czanie trójglicyny,  który  w fazie  paraelektrycznej  na- 
leży do  klasy  centrosymetrycznej,  a w którym  w fazie 
ferroelektrycznej  polaryzacja  spontaniczna  jest  rów- 
noległa do  osi  b układu  jednoskośnego,  możliwe  są 
jedynie  ściany  180°,  równoległe  do  osi  b.  W soli 
Seignetteła,  która  również  w fazie  paraelektrycznej 
jest  piezoelektrykiem,  a polaryzacja  spontaniczna 
w fazie  ferroelektrycznej  jest  równoległa  do  osi  a 
układu  jednoskośnego,  występuje  piezoelektryczna 
deformacja  yz.  W tym  krysztale  możliwe  są  dwie 
orientacje  ścian  domenowych;  występują  ściany 
domenowe  równoległe  do  osi  a oraz  ściany  dome- 
nowe równoległe  do  osi  c (rys.  12).  Podział  kryształu 
ferroelektrycznego  na  domeny  jest  uwarunkowany 
względami  energetycznymi.  Kryształ  dzieli  się  na 
domeny  w taki  sposób,  aby  ich  energia  wewnętrzna, 
składająca  się  z energii  objętościowej  (elektrycznej 
rozmiary  proporcjonalnej  do  kwadratu  polaryzacji  oraz  sprę- 
domen  żysteJ  proporcjonalnej  do  kwadratu  deformacji), 
energii  depolaryzacji  oraz  energii  ścian  domenowych 
miała  wartość  minimalną.  Rozmiary  domen  w róż- 
nych ferroelektrykach  są  więc  różne,  ale  zależą  rów- 
nież od  wielkości  kryształu.  Ściany  domenowe  w fer- 
roelektrykach są  cienkie  w porównaniu  ze  ścianami 
domenowymi  w ferromagnetykach.  Mają  one  grubość 
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rzędu  kilku  stałych  sieci,  podczas  gdy  w ferromagne- 
tykach grubość  jest  rzędu  kilkuset  stałych.  Duża  gru- 
bość ścian  domenowych  w ferromagnetykach  (— ► 
Struktura  domenowa  i procesy  magnesowania)  jest 
związana  z ciągłą  zmianą  kierunku  namagnesowania 
w ścianie,  podczas  gdy  w ferroelektrykach  moment 
dipolowy  komórki  elementarnej  może  mieć  jedynie 
kierunek  jednej  z osi  polarnych.  Dla  przykładu  można 
podać,  że  grubość  ściany  domenowej  w siarczanie 
trójglicyny,  wyznaczona  metodą  mikroskopii  elek- 
tronowej, wynosi  około  12  nm.  Do  badania  struktury 
domenowej  ferroelektryków  stosuje  się  różne  metody, 
których  wybór  jest  uzależniony  własnościami  bada- 
nych kryształów.  Na  il.  93  (tabl.  23)  podano  zdjęcia 
struktury  domenowej  ferroelektryków  otrzymane  róż- 
nymi metodami. 

Fenomenologiczna  teoria  ferroelektryków  podana 
przez  A.  F.  Devonshire’a  oraz  W.  L.  Ginzburga  jest 
rozwinięciem  teorii  przemian  fazowych  L.  Landaua. 
Teoria  Landaua  była  oparta  na  założeniu,  że  w po- 
bliżu punktu  przemiany  potencjał  termodynamiczny 
można  rozwinąć  w szereg  potęgowy  względem  para- 
metru uporządkowania,  a współczynniki  rozwinięcia 
są  funkcjami  temperatury  oraz  ciśnienia.  Devonshire 
przyjął,  że  parametrem  uporządkowania  ferroelek- 
trycznego przejścia  fazowego  jest  polaryzacja.  Opra- 
cowana przez  niego  teoria  opisuje  dobrze  niektóre 
własności  ferroelektryków.  W 1959  W.  Cochran 
i P.  W.  Anderson  wysunęli  koncepcję,  że  ferroelek- 
tryczna przemiana  fazowa  jest  wynikiem  niestabil- 
ności jednego  z normalnych  modów  drgań  sieci 
krystalicznej  (-+  Dynamika  sieci  krystalicznej)  i ten  ro- 
dzaj drgań  został  nazwany  miękkim  modem.  Oznacza 
to,  że  jedno  z elementarnych  wzbudzeń  układu  staje 
się  niestabilne,  gdy  temperatura  T ->  Tc  (tempera- 
tura Curie).  Częstość  tego  wzbudzenia  dąży  do  0, 
gdy  wektor  falowy  dąży  do  zera.  Z teorii  dynamiki 
sieci  ferroelektryków  wynika,  że  parametrem  ferro- 
elektrycznej przemiany  fazowej  są  wartości  wektora 
falowego  niestabilnych  fononów.  Ponieważ  stan  fer- 
roelektryczny jest  stanem  polarnym,  zatem  „miękkie” 
fonony  muszą  być  polarne,  są  więc  aktywne  w pod- 
czerwieni. Upraszczając  można  powiedzieć,  że  war- 
tości wektora  falowego  miękkiego  modu  opisują 
przemieszczenie  atomów  wewnątrz  komórki  elemen- 
tarnej oraz  różnice  fazowe  między  odpowiednimi 
przesunięciami.  Struktura  nowej  fazy  (fazy  ferro- 
elektrycznej) poniżej  temperatury  przemiany  jest 
superpozycją  zamrożonych  przesunięć  wywołanych 
miękkim  modem  oraz  struktury  fazy  stabilnej  po- 
wyżej Tc  (rys.  13).  Teoria  miękkich  fononów  została 
najpierw  rozwinięta  dla  ferroelektryków  typu  prze- 
sunięcia, jednak  tego  samego  rodzaju  koncepcja  zo- 
stała później  zastosowana  do  ferroelektryków  typu 
porządek-nieporządek . 


Rys.  13.  Obrazowe  przedstawienie  wektora  falowego  miękkiego 
modu  ferroelektrycznego  w BaTiOf  powodującego  przemianę 
fazową  Oh  ->  Civ 
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ferro-  Istnieją  ferroelektryki,  w których  polaryzacja 
elektryki  spontaniczna  nie  jest  parametrem  uporządkowania, 
niewłaściwe  Takie  ferroelektryki  nazwano  ferroelektrykami  nie- 
właściwymi. Parametr  uporządkowania  może  mieć 
taką  samą  symetrię  jak  polaryzacja  spontaniczna, 
tak  jak  w kryształach  KH2P04,  albo  może  mieć  inne 
własności  symetrii  niż  Ps  (np.  w molibdenianie  ga- 
dolinu Gd2(Mo04)3). 


Eiektrety 


Wspomnieliśmy  już,  że  najważniejszą  własnością 
dielektryków  jest  zdolność  do  gromadzenia  ładunku 
elektrycznego.  Dielektryk,  w którym  po  usunięciu 
pola  elektrycznego  utizymuje  się  polaryzacja  dipolo- 
wa lub  rzeczywiste  ładunki  elektryczne,  nazywamy 
elektretem.  Elektret  wytwarza  zewnętrzne  pole  elek- 
tryczne i w tym  sensie  jest  elektrostatycznym  odpo- 
wiednikiem magnesu  trwałego.  Eiektrety  znane  są  już 
od  dawna  (w  1919  r.  fizyk  japoński  M.  Eguchi  wy- 
produkował pierwszy  elektret  z wosku  karnauba). 
Bardzo  długo  stan  elektretowy  wiązano  z trwałym 
uporządkowaniem  orientacji  dipoli  elektrycznych 
i oddziaływaniem  rzeczywistych  ładunków  wstrzyk- 
niętych w procesie  ładowania  z polaryzacją  dipolową, 
a wytwarzane  eiektrety,  głównie  z dielektryków  dipo- 
lowych, miały  grubość  rzędu  centymetrów.  Dopiero 
pod  koniec  lat  sześćdziesiątych  zaczęto  wytwarzać 
eiektrety  z folii  polimerowych  wstrzykując  z zewnętrz- 
nych źródeł' rzeczywisty  ładunek  elektryczny, 
wytwarzanie  Najpierw  omówimy  sposób  wytwarzania  klasycz- 
elektretów  nych  termoelektretów,  których  pole  elektryczne  jest 
związane  z zamrożoną  polaryzacją  dipolową  (lub  po- 
chodzi od  uporządkowanego  ładunku  przestrzennego) 
i ładunkami  wstrzykniętymi  w procesie  wytwarzania 
z przestrzeni  pomiędzy  dielektrykiem  a elektrodą. 
Materiałem  na  termoelektrety  dipolowe  są  dielektryki, 
których  moment  dipolowy  pochodzi  na  ogół  od 
grup  karboksylowych  lub  grup  C — Cl  dużych  molekuł 
organicznych.  Klasycznym  materiałem  termoelektre- 
towym  jest  wosk  karnauba.  Termoelektrety  dipolowe 
otrzymuje  się  przez  polaryzowanie  dielektryków 
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Rys.  14.  Obrazowe  przedstawienie  procesu  wytwarzania  termo- 
elcktretów  dipolowych  oraz  termoelektretów  z rozkładem  prze- 
strzennym ładunku  (ładunki  wstrzyknięte  zaznaczono  kolorem 
czarnym) 


w silnym  zewnętrznym  polu  elektrycznym  w pod- 
wyższonej temperaturze  (w  której  możliwy  jest  obrót 
dipoli  molekularnych)  i „zamrożenie”  uporządko- 
wania dipoli  elektrycznych  przez  ochłodzenie  dielek- 
tryka (rys.  14).  Ładunek  na  powierzchni  elektretu 
zaraz  po  jego  wytworzeniu  pochodzi  przede  wszyst- 
kim od  polaryzacji  dipolowe*',  ma  więc  znak  przeciw- 
ny do  znaku  polarności  elektrod  (tzw.  heteroładunek). 
Maleje  on  w czasie  w sposób  relaksacyjny.  W pro- 
cesie wytwarzania  elektretów  zostaje  jednak  również 
do  dielektryka  wstrzyknięty  ładunek  rzeczywisty 
z przestrzeni  pomiędzy  elektrodami  a dielektrykiem 
(homoładunek),  który  zmniejsza  się  bardzo  powoli 
w czasie.  Efektywny  ładunek  powierzchniowy  elek- 
tretu jest  więc  sumą  ładunku  pochodzącego  od  po- 
laryzacji dipolowej  i ładunku  wstrzykniętego.  Ponie- 
waż czasowe  zmiany  gęstości  tych  ładunków  są  różne, 
termoelektret  dipolowy  wykazuje  zaraz  po  wytworze- 
niu na  powierzchniach  heteroładunek,  który  maleje 
do  zera,  a następnie  pojawia  się  homoładunek,  który 
narasta  do  wartości  maksymalnej  i dalej  zmienia  się 
już  w czasie  bardzo  powoli.  Czasowe  zmiany  efektyw- 
nego ładunku  termoelektretów  obrazuje  rys.  15. 


Rys.  15.  Zmiany  w czasie  ładunku  termoelektretów  dipolowych 


Czas  zmiany  polarności  elektretu  oraz  wielkość 
ustabilizowanego  ładunku  i czas  życia  termoelektretu 
zależą  od  rodzaju  materiału,  warunków  polaryzowa- 
nia oraz  warunkówr  przechowywania.  Polaryzując  np. 
wosk  karnauba  w słabych  polach  (mniejszych  od  10® 
V/m)  otrzymuje  się  eiektrety  wykazujące  wyłącznie 
polaryzację  dipolową,  malejącą  w ciągu  10-20  dni 
do  pewnej  wartości,  która  utrzymuje  się  następnie 
w czasie  rzędu  kilku  miesięcy.  Eiektrety  z wosku 
karnauba  wytworzone  w polach  większych  od  10®  V/m 
wykazują  na  powierzchni  heteroładunek,  który  w cza- 
sie (rzędu  minut  lub  godzin,  w zależności  od  natę- 
żenia pola  polaryzującego  i temperatury  przechowy- 
wania elektretu)  zmniejsza  się  do  wartości  zerowej 
i następnie  pojawia  się  homoładunek,  którego  usta- 
bilizowana wartość  nie  zmienia  się  w czasie  rzędu 
kilkunastu  lat.  Termoelektrety  można  otrzymać  rów- 
nież z dielektryków  niedipolowych,  gdy  rozłożone 
izotropowo  w objętości  ładunki  elektryczne  zostaną 
uporządkowane  przez  pole  polaryzujące  w podwyż- 
szonej temperaturze  i ten  stan  uporządkowania  zo- 
staje zamrożony. 

Porządkujące  działanie  pola  elektrycznego  wyko- 
rzystuje się  również  przy  produkcji  fotoelektretów 
i radioelektretów,  których  zasadę  otrzymywania  po- 
kazuje rys.  16b.  W wypadku  fotoelektretów,  które 
są  wytwarzane  z dielektryków  wykazujących  foto- 
przewodnictwo,  nośniki  prądu  zostają  wzbudzone  do 
pasma  przewodnictwa  pod  wpływem  światła  i następ- 
nie spułapkowane  w pobliżu  elektrod  o odpowiedniej 
polarności.  Prowadzi  to  do  pojawienia  się  warstwy 
ładunku  przestrzennego.  Depolaryzacja  takich  elek- 
tretów jest  związana  z aktywacją  nośników  z pułapek 
wskutek  wzbudzenia  termicznego  lub  wzbudzenia 
optycznego.  Podobny  jest  mechanizm  wytwarzania 
polaryzacji  w radioelektretach,  z tym  że  wzbudzenie 
jest  wywołane  promieniowaniem  jonizującym. 
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Rys.  16.  Układ  do  wytwarzania:  a)  termoelektretów,  b)  fotoclek- 
tretów 


Największe  zastosowanie  praktyczne  znalazły  jed- 
nak elektrety  z cienkich  folii  polimerowych,  w któ- 
rych zgromadzono  duże  gęstości  ładunku  przez  im- 
plantowanie  go  z zewnętrznych  źródeł.  Najprostszą 
metodą  jest  ładowanie  folii  w próżni  wiązką  elektro- 
nów (rys.  17a)  o energiach  rzędu  kilkudziesięciu  keV. 
Efektywny  ładunek  na  powierzchni  elektretu  zależy 
od  energii  elektronów,  natężenia  wiązki  i czasu  bom- 
bardowania. Metodą  tą  można  zgromadzić  w dielek- 
tryku bardzo  dużą  gęstość  ładunku;  jedynym  ogra- 
niczeniem gęstości  są  przebicia.  Ładunek  wprowa- 
dzony przez  napromienienie  wiązką  monoenerge- 
tycznych  elektronów  jest  zgromadzony  w dielektryku 
na  określonej  głębokości,  zdeterminowanej  energią 
elektronów.  Obrazuje  to  rys.  18a,  na  którym  pokazano 
przestrzenny  rozkład  ładunku  w elektretach  wytwa- 
rzanych przez  ładowanie  elektronami  o różnych 
energiach. 
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Rys.  17.  Sposoby  wytwarzania  elcktrctów  foliowych:  a)  łado- 
wanie elektronami,  b)  metoda  wyładowania  koronowego,  c)  me- 
toda przebiciowa,  d)  metoda  cieczowa 
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Rys.  18.  Rozkład  ładunku  we  wnętrzu  elektretu  foliowego  (wy- 
znaczony przez  Collinsa):  a)  elektret  ładowany  wiązką  elektro- 
nów o różnych  energiach  (ładunek  dodatni  na  powierzchni  jest 
wywołany  emisją  wtórnych  elektronów  z dielektryka),  b)  elekret 
ładowany  metodą  cieczową 


Elektrety  foliowe  o dużej  gęstości  ładunku  ujem- 
nego można  otrzymać  również  wykorzystując  wyła- 
dowanie koronowe  w powietrzu  (rys.  17b),  podczas 
którego  powierzchnia  dielektryka  jest  bombardowana 
elektronami  oraz  różnego  rodzaju  jonami  ujemnymi. 
Zjawisko  to  jest  nieco  bardziej  skomplikowane,  gdyż 
elektrony  wnikają  do  dielektryka  na  pewną  głębokość, 
natomiast  jony  ujemne  rekombinują,  wywołując  zmia- 
ny chemiczne  na  powierzchni  dielektryka.  W efekcie 
otrzymuje  się  jednak  elektrety  o dużej  gęstości  ła- 
dunku ujemnego  stabilnego  w czasie.  Należy  jednak 
zaznaczyć,  że  rozkład  efektywnego  ładunku  na 
powierzchni  elektretów  wytwarzanych  metodą  wy- 
ładowania koronowego  wykazuje  pewną  niejedno- 
rodność. 

Do  produkcji  elektretów  foliowych  wykorzystuje 
się  również  procesy  przebiciowe  na  dużej  powierzchni 
(rys.  17c).  W metodzie  tej  folia  dielektryka  jest 
umieszczona  pomiędzy  elektrodami,  do  których  przy- 
kłada się  duże  napięcie  elektryczne,  przy  czym  w celu 
stabilizacji  procesów  przebiciowych  jedna  z elektrod 
jest  elektrodą  o dużym  oporze  (np.  szklaną).  Gęstość 
ładunku  wytworzonego  w ten  sposób  elektretu  zależy 
zarówno  od  przyłożonego  napięcia  jak  i czasu  polary- 
zacji, a stabilność  jest  porównywalna  ze  stabilnością 
elektretów  wytworzonych  przez  bombardowanie  elek- 
tronami. 

Elektrety  foliowe  można  również  otrzymać  za  po- 
mocą metody,  w której  wykorzystano  przekazywanie 
ładunku  do  dielektryka  z elektrody  cieczowej  o dużej 
przewodności  elektrycznej  (rys.  17d).  Na  powierzchni 
folii  gromadzi  się  duże  gęstości  ładunku  usuwając 
w polu  elektrycznym  warstewkę  cieczy. 

Stosując  zaprogramowane  starzenie  przez  wygrza- 
nie elektretu  w podwyższonej  temperaturze  można 
ładunek  zgromadzony  blisko  powierzchni  wpro- 
wadzić w głąb  dielektryka.  Obrazuje  to  rys.  18b. 
W procesie  starzenia  zmniejsza  się  efektywna  gęstość 
powierzchniowa  ładunku  eiektretu,  natomiast  ła- 
dunek pozostały  wykazuje  większą  stabilność  czasową. 
Jest  to  korzystne,  ponieważ  elektrety  wyprodukowane 
omówionymi  powyżej  metodami  mają  napięcie  rów- 
noważne rzędu  1000  V,  natomiast  do  zastosowań 
praktycznych  potrzebne  są  na  ogół  elektrety  o napię- 
ciach około  dziesięciokrotnie  mniejszych. 


starzenie 

elektretów 

foliowych 
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Jak  wspomniano  poprzednio,  elektrety  wytwarzają 
zewnętrzne  pole  elektryczne  i z tego  względu  znalazły 
szerokie  zastosowanie  w urządzeniach,  w-  których  pole 
to  jest  wykorzystywane  w sposób  zachowawczy,  mia- 
nowicie w elektretowych  przetwornikach  elektroaku- 
stycznych. Możliwość  wykorzystania  elektretów  folio- 
wych jako  membrany  w mikrofonie  pojemnościowym 
zmniejszyła  wyraźnie  koszty  produkcji  i umożliwiła 
miniaturyzację,  a więc  uczyniła  mikrofon  elektretowy 
szczególnie  atrakcyjnym. 

Na  rys.  19  pokazano  schemat  budowy  mikrofonu 
elektretowego,  w którym  elektretem  jest  folia  teflo- 
nowa jednostronnie  metalizowana  (grubości  13  pm 
lub  25  pm).  Gęstość  powierzchniowa  ładunku  takiego 


ał 


przed  we!  ektroda 


metalizacja  elektret  foliowy 


Rys.  19.  Schemat  budowy:  a)  mikrofonu  i b)  głośnika  w asy- 
metrycznym układzie  przeciwsobnym 


elektretu  jest  rzędu  10  nC/cm2  i w mikrofonie  jest  on 
oddalony  od  przed wclektrody  o ok.  10  pm.  Napięcie 
wyjściowe  Vm  mikrofonu  elektretowego,  przy  danym 
wychyleniu  membrany  x , zależy  od  natężenia  pola 
elektrycznego  w szczelinie  powietrznej  przetwornika. 
Jest  ono  określone  gęstością  powierzchniową  ładun- 
ku elektretu  Ay  grubością  elektretu  d€y  grubością 
warstwy  powietrza  d0  oraz  przenikalnościami  elek- 
trycznymi e0  oraz  e: 

v AdoX 

m e0(do+dee)  ‘ 

W mikrofonach  pojemnościowych  (a  takim  jest  właś- 
nie przedstawiony  mikrofon  elektretowy)  wychylenie 
membrany  zależy  liniowo  od  ciśnienia  fali  akustycz- 
nej w szerokim  zakresie  częstości,  począwszy  od 


częstości  odcięcia  do  ok.  20  000  Hz.  Odpowiedź  na- 
pięciowa mikrofonu  elektretowego  przy  stałym  na- 
tężeniu dźwięku  jest  więc  niezależna  od  częstości,  głośnik 
Elektret  foliowy  może  być  również  zastosowany  elektretowy 
w głośniku;  na  rys.  19b  przedstawiono  schemat  bu- 
dowy głośnika  elektretowego  pracującego  w asy- 
metrycznym układzie  przeciwsobnym.  Przedstawione 
schematy  budowy  elektretowych  przetworników 
elektroakustycznych  są  schematami  najprostszymi. 

Produkcję  ich  rozpoczęto  w 1970  r.  Obecnie  znane  są 
konstrukcje  elektretowych  przetworników  elektro- 
akustycznych o specjalnych  kierunkowych  charakte- 
rystykach oraz  konstrukcje  przetworników  pracują- 
cych v/  zakresie  częstości  infraakustycznych  oraz 
ultraakustycznych  (od  10-3  Hz  do  108  Hz). 

Na  zakończenie  należy  wspomnieć,  że  szerokie 
zastosowanie  różnego  rodzaju  elektretów  (np.  foto- 
elektretów  w kserografii,  elektretów  foliowych  w prze-  badanie 
twornikach  elektroakustycznych,  różnego  rodzaju  starzenia 
przetwornikach  elektromechanicznych  oraz  filtrach  elektretów 
elektrostatycznych)  wyprzedziły  znacznie  stan  wiedzy 
o podstawowych  procesach  fizycznych  gromadzenia 
ładunku  we  wnętrzu  dielektryka  i jego  reorganizacji 
w procesie  starzenia.  Wydaje  się,  że  postęp  ten  nastąpi 
w najbliższym  czasie,  gdyż  w 1977  r.  opracowano 
dwie  interesujące  metody  badania  przestrzennego 
rozkładu  ładunku  w elektretach  foliowych.  Jedna 
z nich  opracowana  przez  G.  M.  Sesslera,  pozwalająca 
otrzymać  informacje  o rozkładzie  gęstości  ładunku 
na  grubości  elektretu  z dokładnością  1 pm,  wykorzy- 
stuje jako  sondę  wirtualną  elektrodę,  którą  wytwarza 
się  za  pomocą  monoenergetycznej  wiązki  elektro- 
nowej. Druga  metoda,  opracowana  przez  R.  E.  Col- 
linsa, jest  metodą  nieniszczącą  i polega  na  badaniu 
odpowiedzi  elektrycznej  po  przyłożeniu  do  jednej 
strony  elektretu  bardzo  krótkiego  impulsu  cieplnego. 

Stosując  tę  metodę  można  otrzymać  bezpośrednio 
informacje  o wielkości  ładunku  elektretowego  i jego 
średnim  położeniu,  a po  opracowaniu  matematycz- 
nym— informacje  o przestrzennym  rozkładzie  ła- 
dunku w elektrecie  i ogólnie  w dielektryku.  Za  pomo- 
cą wspomnianej  metody  można  badać  również  zmia- 
ny przestrzennego  rozkładu  gęstości  ładunku  w pro- 
cesie samorzutnego  oraz  zaprogramowanego  starzenia 
elektretów,  co  rokuje  nadzieję  na  wyjaśnienie  mecha- 
nizmu tego  procesu. 

J.  C.  Anderson  Dielectrics , London  1967;  R.  Blinc,  B.  Żekś 
Soft  Modes  in  Ferroelectrłcs  and  Antiferrocłectrics,  Amsterdam 
1974;  A.  Chelkowski  Fizyka  dielektryków , Warszawa  1979; 

B.  Hilczer,  J.  Małecki  Elektrety , Warszawa  1980;  S.  Kielich 
Molekularna  optyka  nieliniowa , Warszawa  1977;  T.  Krajewski 
(red.)  Zagadnienia  fizyki  dielektryków , Warszawa  1970;  A.  Pie- 
kara  Polaryzacja  materii.  Materiały  Konferencji  Chemików 
w Spalę,  1959,  str.  268;  A.  Piekara  Mikrofale  i spektroskopia 
mikrofalowa , Warszawa  1953. 


Półprze wod  n i ki 

Tadeusz  Figiefski 

Spośród  olbrzymiej  grupy  ciał  stałych,  występujących 
w sposób  naturalny  w przyrodzie  lub  wytworzonych 
przez  człowieka,  wyróżniamy  tzw.  półprzewodniki. 
Są  to  substancje  krystaliczne,  przewodzące  prąd 
elektryczny  o szczególnie  interesujących  właściwoś- 
ciach. Zaliczamy  do  nich  materiały  wielce  różno- 
rodne pod  względem  budowy  chemicznej,  a więc 
zarówno  czyste  pierwiastki  german  i krzem,  tlenki 
i siarczki  niektórych  metali,  np.  Cu20,  ZnO,  Pbs, 
związki  międzymetaliczne,  jak  InSb,  GaAs,  HgTe 
i wiele  innych.  Poznanie  i wykorzystanie  tych  materia- 
łów stanowi  wielki  krok  naprzód  w rozwoju  technolo- 
gicznym naszej  epoki.  Przed  niespełna  trzydziestu 
laty  został  wynaleziony  tranzystor.  Od  tej  pory  roz- 
począł się,  ciągle  jeszcze  trwający,  niezwykle  inten- 
sywny rozwój  fizyki  półprzewodników. 


O przewodzeniu  prądu  elektrycznego 

Przewodnictwo  elektryczne  półprzewodników,  po- 
dobnie jak  metali,  ma  naturę  elektronową,  to  znaczy 
elementarnymi  nośnikami  prądu  elektrycznego  są  tu 
elektrony,  obdarzone  najmniejszą  możliwą  porcją 
ujemnego  ładunku  elektryczności.  Wchodzą  one 
w skład  poszczególnych  atomów,  z których  zbudowa- 
ny jest  kryształ.  Jeśli  kryształ  przewodzi  prąd,  ozna- 
cza to,  że  przynajmniej  część  tych  elektronów  strąciła 
więź  ze  swoimi  macierzystymi  atomami  i może  sto- 
sunkowo swobodnie  podróżować  po  całym  krysztale. 

Tak  więc  możemy  wyobrażać  sobie,  że  kryształ  metalu 
czy  półprzewodnika  zbudowany  jest  z regularnie 
rozmieszczonych  jonów  — sieci  krystalicznej  — i cze-  9az  elektro- 
goś  w rodzaju  gazu  prawie  swobodnych  elektronów  nowy 
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wypełniających  tę  sieć.  W gazie  elektronowym  po- 
szczególne cząstki  poruszają  się  bezładnie,  a ruch  ten 
jest  tym  intensywniejszy,  im  wyższa  jest  temperatura, 
wporządko-  £ chwilą  przyłożenia  do  kryształu  różnicy  potencjałów 
wany  ruch  elektrostatycznych  na  elektrony  działa  siła  wprowa- 
ladunków  dzająca  dodatkowy,  uporządkowany  ruch  ładunków, 
elektrycznych  który  stanowi  właśnie  prąd  elektryczny. 

Wygodnie  jest  wyobrażać  sobie  kryształ  półprze- 
wodnika w postaci  prostopadłościennej  próbki,  któ- 
rej jeden  wymiar  (długość  d)  jest  znacznie  większy 
od  dwóch  pozostałych.  Taki  kształt  próbek  jest 


Rys.  I . Próbka  półprzewodnikowa  włączona  w obwód  prądu 


najczęściej  stosowany  w badaniach  fizycznych.  Chcąc 
zmierzyć,  powiedzmy,  przewodność  elektryczną  prób- 
ki, musimy  na  jej  końcach  umieścić  elektrody  za- 
pewniające dobry  kontakt  elektryczny  z zewnętrznym 
obwodem  prądu.  Jeśli  do  naszej  próbki  przyłożymy 
różnicę  potencjałów  £/,  to  wytwarza  ona  wewnątrz 
kryształu  pole  elektryczne  o natężeniu  ć — U/d.  Na 
elektron  o ładunku  — e działa  teraz  siła  elektrosta- 
tyczna, której  wartość  wynosi  F—  —eĆ.  Każdy  pra- 
wie swobodny  elektron  w krysztale  doznaje  zatem 
przyspieszenia  o wartości  a = F/m  w kierunku  prze- 
ciwnym do  pola  elektrycznego;  m oznacza  masę 
elektronu.  Gdyby  elektrony  były  całkowicie  swobod- 
ne, poruszałyby  się  ruchem  jednostajnie  przyspieszo- 
nym osiągając  coraz  większe  prędkości.  Nie  uwzględ- 
niliśmy w tym  jeszcze  bezładnego  ruchu  cieplnego 
elektronów.  Ponieważ  jednak  prędkości  dodają  się 
tak  jak  wektory,  możemy  bez  popełnienia  błędu 
wyodrębnić  z wypadkowego  ruchu  składową  prędkość 
wywołaną  unoszeniem  elektronów  przez  pole  elek- 
tryczne i rozpatrywać  ją  niezależnie, 
prędkość  Prędkość  unoszenia  elektronu  nie  może  wzrastać 
unoszenia  nieskończenie,  ponieważ  elektron  co  pewien  czas 
zderza  się  z jonami  sieci  krystalicznej  i ulega  rozpro- 
szeniu. Jeśli  uwzględnimy,  że  przyspieszenie  elektronu 
zachodzi  w czasie  (t)  jego  swobodnego  przebiegu 
między  dwoma  zderzeniami,  to  otrzymamy  na  mak- 
symalną prędkość  unoszenia  wartość  v = ećz/m.  Przy 
prawidłowym  uwzględnieniu  statystycznego  rozkładu 
przedziałów  czasowych  z dla  różnych  elektronów 
w różnych  chwilach  wzór  ten  zostaje  słuszny,  jeśli 
przez  v i z będziemy  rozumieć  średnie  wartości  tych 
parametrów  w ciągu  ruchu. 

Jeśli  liczba  „swobodnych’*  elektronów  w jednostce 
objętości  kryształu,  czyli  tzw.  koncentracja  elektro- 
gęstość  nów,  wynosi  u,  to  gęstość  prądu  (natężenie  prądu  na 
prądu  jednostkę  powierzchni  przekroju)  płynącego  przez 
kryształ  wyniesie  j = env  — en(ezlm)ć.  Wielkość 
ez/m , oznaczana  literą  //,  jest  miarą  średniej  prędkości, 
jaką  nabywa  elektron  w jednostkowym  polu  elek- 
ruchliwość  tycznym  i nazywa  się  ruchliwością  elektronu.  Wy- 
ełektronu  prowadzony  tu  związek  między  j i ć jest  po  prostu 
prawem  Ohma.  Współczynnik  proporcjonalności  po- 
między j i Ć nazywa  się  przewodnością  właściwą  o 
materiału,  zaś  jego  odwrotność  oporem  właściwym  q. 
Tak  więc  ar  = 1 /q  = j/ć.  Korzystając  z uprzednich 
wyprowadzeń  można  teraz  zapisać  wyrażenie  na  o 
w postaci : 

ar  = en/z . 

Jest  to  podstawowy  wzór  — słuszny  nie  tylko  dla 
półprzewodników  — który  wiąże  przewodność  elek- 
tryczną materiału  z koncentracją  i ruchliwością  nośni- 


ków prądu.  Przewodność  właściwa  ciał  zaliczanych 
do  półprzewodników  zawiera  się  w bardzo  szerokim 
zakresie  wartości  od  10*  do  10-10  (Hem)-1. 

Trzeba  od  razu  zdać  sobie  sprawę  z dwóch  istotnych 
rzeczy.  Po  pierwsze,  zarówno  koncentracja,  jak  i ruch- 
liwość w konkretnym  półprzewodniku  mogą  dras- 
tycznie zmieniać  się  wraz  ze  zmianą  temperatury.  Po 
drugie,  w półprzewodniku  mogą  występować  dwa  ro- 
dzaje nośników  prądu.  Wówczas  przyczynki  do  prze- 
wodnictwa pochodzące  od  każdego  z nich  będą  się 
sumować. 


Kwantowy  opis  półprzewodnika 

Traktowanie  w dalszym  ciągu  elektronu  jako  klasycz- 
nej cząstki  materii  nie  zaprowadziłoby  nas  zbyt  da- 
leko. Musimy  uwzględnić  fakt,  że  w mikroświecie 
obowiązują  specyficzne  prawa,  prawa  mechaniki 
kwantowej.  Zgodnie  z teorią  kwantową  elektron  na-  elektron 
leży  rozpatrywać  jako  falę,  zwaną  czasem  falą  de  jako  fala 
Broglie’a.  Elektronowi  o pędzie  p = mv  musimy  przy- 
pisać falę  o długości  X = hjp , gdzie  h jest  stałą  Plan- 
cka. Jeślibyśmy  zapytali  się  w duchu  fizyki  klasycznej 
(tzn.  niekwantowej),  gdzie  dokładnie  znajduje  się 
jakiś  konkretny  elektron,  to  na  gruncie  mechaniki 
kwantowej  nie  dostalibyśmy  jednoznacznej  odpowie- 
dzi. Jeśli  bowiem  elektron  jest  opisany  prostą  falą 
„sinusoidalną”,  a zatem  ma  ściśle  określony  pęd, 
to  jego  umiejscowienie,  jako  fali,  jest  zupełnie  nie- 
określone; elektron  jest  wszędzie.  Można,  co  prawda, 
skonstruować  taką  falę,  której  różna  od  zera  amplitu- 
da jest  zawarta  w pewnym  skończonym  obszarze 
przestrzeni,  ale  będzie  ona  wówczas  złożeniem  kilku 
fal  prostych  o różnych  długościach.  Nie  będzie  ona 
zatem  opisywać  elektronu  o ściśle  określonym  pędzie. 

Mechanika  kwantowa  podaje  dokładny  związek  mię- 
dzy przedziałami  nieokreśloności  położenia  i pędu 
cząstki  w swej  słynnej  zasadzie  — zasadzie  nieokreś- 
loności Heisenberga. 

Jedną  z uderzających  konsekwencji  tej  zasady  jest 
coś,  co  można  by  nazwać  ograniczonością  miejsca  dla 
elektronów.  Mianowicie,  dla  każdego  przedziału  pędu 
(lub  energii)  istnieje  w danej  objętości  ściśle  określona 
liczba  stanów  kwantowych,  w których  mogą  znajdo- 
wać się  elektrony.  Ponadto,  zgodnie  z tzw.  zakazem 
Pauliego,  w każdym  stanie  mogą  przebywać  co  naj- 
wyżej dwa  elektrony.  Różne  stany  kwantowe  swo- 
bodnego elektronu  możemy  opisać  różnymi  wartoś- 
ciami jego  energii  kinetycznej. 

W teorii  kwantowej  zostały  wyprowadzone  przez 
Fermiego  i Diraca  ogólne  prawa  statystyczne  opisu- 
jące prawdopodobieństwo  obsadzenia  poszczególnych 
stanów  elektronami  w zależności  od  temperatury. 

1 tak  w temperaturze  zera  bezwzględnego  będą  obsa- 
dzone wszystkie  możliwe  stany  o najniższej  energii. 

Przy  podwyższaniu  temperatury  następuje  stopniowe 
„rozluźnianie”  zapełnienia;  część  elektronów  prze- 
chodzi do  stanów  o wyższej  energii.  Jeśli  jednak  po- 
równujemy dwa  dowolne  stany  kwantowe,  to  w rów- 
nowadze prawdopodobieństwo  obsadzenia  stanu 

0 niższej  energii  zawsze  pozostaje  większe. 

Prześledźmy  teraz,  w jaki  sposób  mechanika  kwan- 
towa modyfikuje  nasz  prosty  obraz  przewodnictwa  długość  fali 
elektrycznego.  Podstawy  teorii  kwantowej  ciał  stałych  elektronowej 
zostały  sformułowane  jeszcze  w latach  trzydziestych, 

dzięki  pracom  licznych  badaczy,  m.in.  A.  H.  Wilsona 

1 F.  Blocha.  Średnia  długość  fali  elektronu  w krysz- 
tale półprzewodnikowym  jest  tysiąc  razy  większa 
od  odległości  między  sąsiednimi  jonami  sieci  krysta- 
licznej. Taka  fala  rozchodzi  się  w idealnej  sieci  prawie 
bez  zakłóceń.  Można  też  na  to  spojrzeć  z innego 
punktu  widzenia,  traktując  samą  sieć  atomową  jako 
nośnik  fali,  tj.  jako  ośrodek,  w którym  fala  elektro- 
nowa została  wzbudzona. 

Dla  uproszczenia  będziemy  dalej  rozpatrywać  za- 
chowanie się  elektronu  w jednowymiarowym,  nie- 
skończenie długim  krysztale  reprezentowanym  przez 
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Rys.  2.  Przyrząd  do  demonstracji  fali  elektronowej  w krysztale. 
Spiralna  kształtka  obrazuje  zespoloną  funkcję  falową  elektronu 
której  kwadrat  modułu  w każdym  punkcie  wzdłuż  osi  określa 
prawdopodobieństwo  znalezienia  tam  elektronu.  Przez  obrót 
korbki  wytwarzamy  falę  biegnącą,  a mimo  to  rozkład  prawdo- 
podobieństwa pozostaje  zawsze  taki  sam 


łańcuch  równoodległych  od  siebie  atomów.  Oczywiście 
kryształ  taki  w rzeczywistości  nie  istnieje.  Stanowi  on 
jednak  wygodny  model,  na  którym  można  prześle- 
dzić pewne  ogólne  właściwości  trójwymiarowego 
kryształu.  Weźmy  najpierw  pod  uwagę  falę  sprężystą 
rozchodzącą  się  w naszym  łańcuchu  — falę  tego  typu, 
jaka  powstałaby,  gdybyśmy  mocno  napięty  sznur 
gumowy  uderzyli  z góry  dłonią.  W łańcuchu  mogą 
rozchodzić  się*  fale  o najrozmaitszych  długościach 
w dwu  przeciwnych  kierunkach.  W wielu  działach 
wektor  fizyki  przyjął  się  wygodny  zwyczaj  opisywania  fali 
falowy  o określonej  długości  i kierunku  za  pomocą  tzw.  wek- 
tora falowego  k . Wektor  k jest  to  wektor,  którego 
kierunek  jest  zgodny  z kierunkiem  rozchodzenia  się 
fali,  natomiast  jego  długość  równa  się  odwrotności 
fali,  pomnożonej  przez  2jc,  tzn..  k — 2n/X. 

Chwilowe  wychylenia  poszczególnych  atomów  łań- 
cucha dla  prostych  fal  sinusoidalnych  o różnych  dłu- 

a)  ^ 


WvWv 


e) 


Rys.  3.  Poprzeczne  fale  sprężyste  o malejącej  długości  X w jed- 
nowymiarowym łańcuchu  atomowym  (przedstawionym  na  rys.  a): 


b)  X = 12 a,  k = — ; c)  X = 4u,  k 


-2atk 


, 12  f 13  n jc  1 n 

- ;c)  A = — = — = 2 — + — ; 

' 13  6 a a 6 a 


dla  fali  (e)  wychylenia  atomów  są  identyczne  jak  dla  fali  (b) 


gościach  są  przedstawione  na  rys.  3.  Kolejne  wykresy 
odpowiadają  malejącym  wartościom  2,  czyli  wzrasta- 
jącym długościom  wektora  falowego.  Krzywa  na 
rys.  3d  przedstawia  falę  o długości  równej  podwójnej 
odległości  między  sąsiednimi  atomami,  a więc  taką, 
w której  para  sąsiednich  atomów  drga  przeciwsobnie. 
Dla  tej  fali  X = la  i k = n/a.  Każdej  fali  o wektorze 
falowym  leżącym  w przedziale  od  0 do  n/a  odpowiada 
jeden,  ściśle  określony  rozkład  chwilowych  wychyleń 
atomów.  I tu  dochodzimy  do  bardzo  osobliwej  włas- 
ności ruchu  falowego  w ośrodku  nieciągłym.  Jeśli 
w sposób  analogiczny  do  poprzedniego  przedstawimy 
fale  jeszcze  krótsze,  to  okaże  się,  że  nie  tworzą  one 
wcale  nowych  konfiguracji  atomów,  które  nie  byłyby 
już  uwzględnione  w przedziale  0,  ±n/a.  Fale,  których 
wektory  falowe  różnią  się  o całkowitą  wielokrotność 
Inja  są  fizycznie  nierozróżnialne,  a zatem  są  iden- 
tyczne. Ta  właściwość,  która  odnosi  się  równie  dobrze 
do  fali  elektronowej  w krysztale,  pozwala  zrozumieć 
różnicę  w zachowaniu  się  swobodnego  elektronu 
i elektronu  w sieci  krystalicznej. 

Zauważmy  przede  wszystkim,  że  wartość  pędu  elek- 
tronu — odwrotnie  proporcjonalną  do  długości  fali 
de  Broglie’a  — można  wyrazić  wprost  przez  wektor 

falowy  k.  Związek  ten  ma  postać: 

p = hkjlK  — hk  (fi  = h/ln). 

A zatem  wektor  falowy  i pęd  elektronu  można  uważać 
za  wielkości  równoważne,  tyle  że  wyrażone  w róż- 
nych jednostkach.  Związek  ten  pozostaje  słuszny  rów- 
nież dla  elektronu  poruszającego  się  w krysztale, 
z tym  że  wówczas  przez  p należy  rozumieć  średni 
w czasie  ruchu  pęd  elektronu  (zwany  kwazipędem 
lub  pędem  krystalicznym). 

Energia  kinetyczna  swobodnego  elektronu  E = 
= mv2j2  = p2/2m,  co  można  zapisać  teraz  jako 

E = ai2ny(h*k2/2m)  = h2k2/2m. 

Wykres  energii  kinetycznej  w funkcji  wektora  falo- 
wego (pędu)  jest  parabolą.  Relacja  między  energią 

elektronu  a jego  wektorem  falowym,  tj.  funkcja  E(k) 
ma  w fizyce  ciała  stałego  fundamentalne  znaczenie. 
Wnikliwy  Czytelnik  zauważy,  że  znając  zależność 

funkcyjną  E od  k dla  swobodnego  elektronu,  można 
wyrazić  z niej  prędkość  elektronu  jako  pierwszą  po- 
chodną E(k)  po  k,  i podobnie  masę  elektronu  jako 

odwrotność  drugiej  pochodnej  E{k)  po  k , oczywiście 
z pewnymi  współczynnikami.  W przypadku  swobod- 
nego elektronu  takie  przedstawienie  jest  tylko  for- 
malną sztuczką,  natomiast  jest  ono  niezmiernie  wy- 
godne przy  rozpatrywaniu  elektronów  w krysztale 
(-►  Dynamika  elektronu  w ciałach  stałych).  Jeśli 
wyjdziemy  z założenia,  że  jony  sieci  krystalicznej 
w ogóle  nie  oddziałują  na  ruch  elektronu,  to  wykres 
energii  kinetycznej  elektronu  w naszym  jednowymia- 
rowym krysztale  będzie  taką  samą  parabolą,  jak  dla 
elektronu  swobodnego.  Ale  w sieci  wszystkie  wektory 

k różniące  się  o całkowitą  wielokrotność  2nja  opisują 
elektrony  z tym  samym  pędem  krystalicznym.  Aby 
uwzględnić  to  na  naszym  wykresie,  musimy  podzielić 
go  na  strefy  odpowiadające  różnym  przedziałom  war- 
tości k i przenieść  odpowiednie  odcinki  krzywej  E(k) 

do  pierwszej  strefy,  tzn.  do  k leżących  w przedziale  — 
—n la,  n /a.  Taki  sposób  postępowania  pokazany  jest 
na  rys.  4c.  Elektron  o określonym  pędzie  nie  ma  teraz 
jednoznacznie  określonej  energii,  gdyż  może  on  znaj- 
dować się  na  jednej  z wielu  gałęzi  krzywej  E(k). 

Chcielibyśmy  jeszcze  wiedzieć,  czy  i w jaki  sposób 
samo  istnienie  sieci  krystalicznej  wpływa  na  kształt 

zależności  E(k).  Ścisły  rachunek  kwantowy  pokazuje, 
że  wpływ  ten  jest  najsilniejszy  tam,  gdzie  krzywe  od- 
powiadające różnym  gałęziom  E(k)  najbardziej  się 
do  siebie  zbliżają,  a więc  na  krawędzi  strefy  bądź  wjej 
środku.  Rezultat  jest  taki,  jak  gdyby  krzywe  w tych 
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Rys.  4.  Jak  tworzą  się  pasma  energii  dozwolonej  i wzbronionej: 
a)  wykres  energii  kinetycznej  swobodnego  elektronu  w funkcji 

wektora  k (pędu),  b)  ten  sam  wykres  dla  prawie  swobodnego 
elektronu  w krysztale;  zaznaczone  są  strefy  zmienności  wektora 

* c)  sam  wykres  sprowadzony  do  pierwszej  strefy,  d)  uw- 

zględniono modyfikację  wywołaną  jonami  sieci,  e)  symboliczne 
przedstawienie  pasm  energetycznych 


miejscach  wzajemnie  się  odpychały,  odkształcając  się 
struktura  w sposób  pokazany  na  rys.  4d.  Wykres  ten  przedsta- 
' elektronowa  wia  to,  co  nazywamy  strukturą  elektronową  kryształu 
kryształu  (-*  Struktura  elektronowa  ciał  stałych).  Widzimy,  że 
wytworzyły  się  teraz  pewne  obszary  energii,  jakiej 
elektron  w ogóle  nie  może  posiadać.  Mamy  więc 
w krysztale  występujące  na  przemian  pasma  energii 
dozwolonej  i wzbronionej  dla  elektronu.  Ciekawe,  że 
do  takiego  samego  wniosku  doszlibyśmy  wychodząc 
z całkiem  odmiennych  założeń,  a mianowicie  biorąc 
za  punkt  wyjścia  dozwolone  poziomy  energii  w izolo- 
wanych atomach,  i śledząc  co  nastąpi,  jeśli  te  atomy 
zbliżymy  do  siebie  aż  do  utworzenia  kryształu. 


Elektrony  i dziury 

W rzeczywistych,  trójwymiarowych  kryształach  struk- 
tura energetyczna  jest  znacznie  bardziej  skompliko- 
wana niż  ta,  którą  przedstawiliśmy  na  rys.  4d.  W szcze- 
gólności krzywizna  krzywej  E(k)y  w każdym  jej  punk- 
cie może  być  zupełnie  różna  niż  dla  elektronu  swo- 
bodnego. Miarą  krzywizny  jest  wartość  drugiej  po- 
chodnej E po  ky  a ta  dla  swobodnego  elektronu  jest 
odwrotnie  proporcjonalna  do  jego  masy.  Przenosząc 
tego  typu  argumentację  na  przypadek  elektronu  w 
krysztale,  powinniśmy  przypisać  mu  masę  całkiem 
różną  od  masy  elektronu  swobodnego ! Ten  na  pozór 
paradoksalny  wniosek  ma  w istocie  rzeczy  rozsądne 
uzasadnienie.  Elektron  w swoim  ruchu  poprzez  krysz- 
tał oddziałuje  z ładunkami  jonów  sieci.  Zewnętrzne 


pole  elektryczne,  potrzebne  do  nadania  elektronowi 
w krysztale  pewnego  średniego  przyspieszenia,  będzie 
zatem  w ogólności  inne  niż  dla  elektronu  swobodnego. 
Nie  znając  dokładnie  rozkładu  i wartości  wewnętrz- 
nych pól  elektrycznych  w krysztale  i chcąc  być  w zgo- 
dzie z prawami  fizyki,  musimy  przypisać  elektronowi 
pewną  fikcyjną  masę,  różną  od  jego  masy  rzeczywistej. 
Nazywamy  ją  masą  efektywną.  Nie  jest  ona  wielkością 
stałą,  ale  zależy  od  pędu  i energii  elektronu.  Jeżeli 
spojrzymy  jeszcze  raz  na  rys.  4d,  to  zauważymy,  że 
w pewnych  obszarach,  na  krawędziach  bądź  w środku 

strefy,  krzywizna  E(k)  jest  ujemna,  co  odpowiada 
ujemnej  masie  efektywnej!  Nie  powinno  to  nas  już 
jednak  specjalnie  niepokoić. 

Ze  względu  na  skończoną  liczbę  stanów  kwantowych 
pojemność  każdego  z pasm  dozwolonej  energii  jest 
ograniczona.  W paśmie  może  zmieścić  się  jedynie 
ściśle  określona  liczba  elektronów,  która,  jak  można 
pokazać,  jest  zawsze  pewną  wielokrotnością  całkowi- 
tej liczby  atomów  w krysztale.  Jeżeli  niższe  pasmo 
energetyczne  jest  całkowicie  zapełnione,  natomiast 
wyższe  jest  zupełnie  puste,  to  kryształ  będzie  wówczas 
doskonałym  izolatorem  prądu.  Elektron,  ażeby  prze- 
wodzić, musi  uzyskać  pod  wpływem  zewnętrznego 
pola  elektrycznego  dodatkową  prędkość,  a zatem 
przejść  do  innego  stanu  kwantowego.  Tymczasem 
wszystkie  możliwe  stany  w paśmie  są  już  zajęte. 

Taka  sytuacja  może  zaistnieć  jedynie  w tempera- 
turze zera  bezwzględnego.  W każdej  wyższej  tempe- 
raturze pewna  część  elektronów  jest  termicznie  wzbu- 
dzona do  wyższego  pustego  pasma,  gdzie  może  już 
uczestniczyć  w przewodzeniu  prądu.  To  wyższe  pasmo 
będziemy  zatem  nazywać  pasmem  przewodnictwa, 
natomiast  pasmo  dolne,  zapełnione  — pasmem  wa- 
lencyjnym (rys.  5). 


Rys.  5.  Model  pasmowy 
półprzewodnika.  Zazna- 
czone są  wzbudzone 
termicznie  elektrony  i 
dziury 


energie 

wzbronione 


położenie 


Elektron  wzbudzony  do  pasma  przewodnictwa  po- 
zostawia po  sobie  „dziurę”,  czyli  pusty  stan  w paśmie 
walencyjnym.  A zatem  również  w tym  paśmie  może 
odbywać  się  teraz  przewodzenie.  Sytuacja  tutaj  jest 
jednak  nieco  osobliwa.  Zgodnie  ze  statystyką  obsa- 
dzenia stanów,  większość  „dziur”  będzie  się  znajdo- 
wać w obszarze  bliskim  wierzchołka  pasma  walen- 
cyjnego. Tu  jednak  elektrony  mają  ujemną  masę 
efektywną  (rys.  4d).  Kierunek  przyspieszenia  takich 
elektronów  będzie  przeciwny  niż  „normalnych”  elek- 
tronów. Dla  obserwatora,  który  nie  wie  nic  o masie 
efektywnej,  wygląda  to  tak,  jak  gdyby  elektron  był 
teraz  obdarzony  ładunkiem  dodatnim.  W istocie 
rzeczy  ścisły  rachunek  pokazuje,  że  zbiór  wszystkich 
elektronów  w prawie  całkowicie  zapełnionym  paśmie 
zachowuje  się  tak,  jak  niewielka  liczba  cząstek  ob- 
darzonych dodatnią  masą  i dodatnim  ładunkiem 
elektrycznym.  Liczba  tych  cząstek  jest  dokładnie  rów- 
na liczbie  „dziur”.  Możemy  przeto  nadać  „dziurze” 
obywatelstwo,  uwolnić  ją  od  cudzysłowu  i traktować 
ją  jako  pełnoprawny  dodatni  nośnik  prądu  w kryszta- 
le, na  równi  z ujemnym  elektronem.  Ściślejsze  omó- 
wienie tych  spraw  znajdzie  Czytelnik  w artykule  pt. 
„Dynamika  elektronów  w ciałach  stałych”. 

Ze  wzrostem  temperatury  rośnie  koncentracja  ter- 
micznie wzbudzonych  elektronów  i dziur  i kryształ 
staje  się  coraz  bardziej  przewodzący.  Takie  przewodni- 
ctwo nazywamy  samoistnym.  Im  mniejsza  jest  szero- 
kość przerwy  energetycznej,  tj.  różnica  energii  mię- 
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izolator 
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dzy  dnem  pasma  przewodnictwa  i wierzchołkiem 
pasma  walencyjnego,  tym  większe  jest  samoistne 
przewodnictwo  kryształu  w określonej  temperaturze. 
Sytuacja  taka  jest  typowa  zarówno  dla  izolatorów, 
jak  i półprzewodników.  Różnica  między  tymi  dwiema 
grupami  materiałów  jest  czysto  ilościowa  i wskutek 
tego  w pewnym  sensie  umowna.  Za  półprzewodniki 
uważamy  zazwyczaj  te  materiały,  których  przerwa 
energetyczna  jest  mniejsza  od  5 eV ; np.  dla  InSb  wy- 
nosi ona  0,18  eV,  dla  ZnO  3,2  eV.  A metale?  W meta- 
lach mamy  sytuację  dwojakiego  rodzaju;  bądź  za- 
pełnione pasmo  walencyjne  i puste  pasmo  przewod- 
nictwa zachodzą  na  siebie,  bądź  też  pasmo  przewod- 
nictwa jest  tylko  częściowo  zapełnione  elektronami 
(->  Metale). 

Możemy  się  spytać,  czy  można  eksperymentalnie 
odróżnić  przewodnictwo  wywołane  dziurami  od  prze- 
wodnictwa elektronowego.  Otóż  tak.  Umożliwia  to 
znane  od  dawna  zjawisko  Halla,  które  jest  wynikiem 


z atomów  jest  otoczony  czterema  najbliższymi  sąsia- 
dami (rys.  7).  Atom  germanu  ma  w swej  zewnętrznej 
powłoce  4 elektrony,  które  całkowicie  wypełniają 
pasmo  walencyjne.  To  właśnie  powoduje,  że  kryształ 
germanu  nie  jest  metalem.  Rozpatrując  tę  sprawę 


struktura 

germanu 


Rys.  6.  Powstawanie  w próbce  napięcia  Halla,  w wyniku  dzia- 
łania pola  magnetycznego  H 


działania  siły  Lorentza  na  poruszający  się  ładunek 
elektryczny  w polu  magnetycznym.  Jeśli  pole  elek- 
tryczne jest  skierowane  w kierunku  osi  x a pole  mag- 
netyczne w kierunku  osi  z i nośnikami  prądu  są  wy- 
łącznie elektrony  to  pod  wpływem  siły  Lorentza  od- 
chylą się  one  w dodatnim  kierunku  osi  y (rys.  6). 
Wskutek  tego  na  górnej  ściance  kryształu,  prostopad- 
łej do  osi  y , wytworzy  się  w stosunku  do  ścianki 
przeciwległej  nadmiar  ładunku  ujemnego  i związana 
z tym  różnica  potencjałów,  zwana  napięciem  Halla. 
Jeśli  nośnikami  prądu  są  dziury,  to  na  tej  samej 
ściance  powstanie  nadmiar  ładunku  dodatniego  i znak 
napięcia  Halla  jest  przeciwny.  Wielkość  napięcia 
Halla  jest  odwrotnie  proporcjonalna  do  koncentracji 
jednoimiennych  nośników  prądu.  Gdy  nośnikami 
prądu  są  wzbudzone  termicznie  elektrony  i dziury 
w ilościach  dokładnie  sobie  równych,  to  pochodzące 
od  nich  przyczynki  do  napięcia  Halla  praktycznie 
się  zniosą. 


Domieszki  w półprzewodnikach 

Badania  efektu  Halla  w różnych  półprzewodnikach 
dość  wcześnie  doprowadziły  do  wykrycia  zdumiewa- 
jącego faktu.  Ten  sam  pod  względem  chemicznym 
półprzewodnik  może  wykazywać  bądź  przewodnictwo 
elektronowe  bądź  dziurowe,  w zależności  od  rodzaju 
wprowadzonych  doń  minimalnych  ilości  domieszek. 
Wielkość  przewodnictwa  wzrasta  z domieszkowaniem 
i może  być  w ten  sposób  dokładnie  regulowana.  Te 
wyniki  świadczą  dobitnie  o tym,  że  przedstawiony  do- 
tychczas model  przewodnictwa  nie  jest  kompletny 
i wymaga  istotnego  uzupełnienia.  Przeprowadzimy  je 
na  przykładzie  germanu. 

German,  podobnie  jak  krzem,  krystalizuje,  two- 
rząc tzw.  strukturę  typu  diamentu,  w której  każdy 


Rys.  7.  Struktura  krystaliczna  germanu  i krzemu.  Czarne  kul- 
ki obrazują  atomy,  a łączące  je  pręty  — wiązania  chemiczne 


z punktu  widzenia  krystalochemii  powiedzielibyśmy, 
że  cztery  zewnętrzne  elektrony  wchodzą  w skład  wią- 
zań chemicznych,  zapewniających  spójność  całego 
kryształu.  Para  elektronów  — po  jednym  z dwu  są- 
siednich atomów  — wytwarza  tzw.  wiązanie  kowa- 
lencyjne. Ten  chemiczny  punkt  widzenia  jest  pozornie 
całkowicie  sprzeczny  z uprzednio  wprowadzonym 
obrazem  prawie  swobodnych  elektronów.  Ale  tak  nie 
jest.  Prawdopodobieństwo  znalezienia  elektronu  wa- 
lencyjnego jest  rzeczywiście  największe  w „mostku” 
łączącym  dwa  sąsiednie  atomy.  Jednak  elektrony  te, 
rozpatrywane  w dużych  obszarach  kryształu,  zacho- 
wują się  właśnie  tak  jak  fale  — fale  prawdopodobień- 
stwa. Ten  zadziwiający  fakt,  że  to  samo  zjawisko  moż- 
na opisać  na  różne,  często  pozornie  przeciwstawne 
sposoby,  jest  bardzo  powszechny  w fizyce. 

Jeśli  teraz  w miejsce  jednego  z czterowartościo-  domieszki 
wych  atomów  Ge  w krysztale  umieścimy  jakiś  obcy  w germanie 
atom  o pięciu  elektronach  w zewnętrznej  powłoce 
(takimi  są  atomy  pierwiastków  piątej  grupy  tablicy 
Mendelejewa,  np.  antymon),  to  wbuduje  on  się  w sieć 
krystaliczną  wykorzystując  do  wiązań  z sąsiadami 
tylko  cztery  ze  swoich  elektronów  (rys.  8).  Pozostały, 


Rys.  8.  Dwuwymiarowy  schemat  kryształu  germanu  (Ge) 
z wbudowanymi  obcymi  atomami  indu  (In)  i antymonu  (Sb). 
Czarne  kółka  oznaczają  jony  germanu,  kropki  — elektrony 
walencyjne 

piąty  elektron,  pozostaje  bardzo  słabo  związany  z ato- 
mem domieszki  i może  być  stosunkowo  łatwo  od  niej 
oderwany  i przeniesiony  do  pasma  przewodnictwa, 
gdzie  zachowuje  się  oczywiście  jak  zwykły  elektron 


34  - Encyklopedia  fizyki  współczesnej 
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przewodnictwa.  Taką  domieszkę  nazywamy  donorem. 
Analogicznie,  jeśli  domieszką  jest  atom  trzeciej  grupy, 
mający  trzy  zewnętrzne  elektrony,  np.  ind,  to  czwar- 
ty elektron  kosztem  niewielkiej  energii  może  być  — 
dla  skompletowania  wiązań  — uzupełniony  z pasma 
walencyjnego.  W paśmie  walencyjnym  pozostaje 
wówczas  przewodząca  dziura.  Tego  typu  domieszka 
nazywa  się  akceptorem. 

Po  oderwaniu  lub  przyłączeniu  elektronu,  atom  do- 
mieszki — początkowo  neutralny  — staje  się  dodatnio 
lub  ujemnie  naładowanym  jonem.  W schemacie  pasm 
energetycznych  stan  kw-antowy  zlokalizowanego  elek- 


tronu  domieszki 

i 

i 

obrazujemy  rysując  kreskę  — po- 

i 

• ! 

/ • j 

donor 

i 

l 

akceptor 

/ 

A 

W 

1 

1 
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ziom  energetyczny  — wewnątrz  przerwy  wzbronionej. 
Dla  atomu  antymonu  poziom  ten  leży  bardzo  blisko 
pasma  przewodnictwa,  ok.  0,01  eV  poniżej  jego  dna. 
Nawet  w temperaturze  — 200°C  prawie  wszystkie 
donory  Sb  ulegają  zjonizowaniu,  oddając  swoje  elek- 
trony do  pasma  przewodnictwa.  German  domieszko- 
wany antymonem  wykazuje  przewodnictwo  elektro- 
nowe lub,  jak  mówimy,  jest  materiałem  typu  n.  Po- 
ziom typowego  akceptora,  indu,  leży  0,01  eV  ponad 
dnem  pasma  walencyjnego.  Elektrony  z pasma  wa- 
lencyjnego obsadzając  poziomy  akceptorowe,  pozo- 
stawiają po  sobie  dziury.  Materiał  domieszkowany 
indem  ma  zatem  przewodnictwo  dziurowe  (lub  ina- 
czej przewodnictwo  typu  p\  jest  więc  materiałem 
typu  p . 

Wnioski,  które  tu  przedstawiliśmy  są  na  ogół  słusz- 
ne dla  wszystkich  półprzewodników,  z tym  że  w róż- 
nych materiałach  rolę  donorów  i akceptorów  mogą 
spełniać  różne  domieszki.  Co  więcej,  tę  samą  rolę 
mogą  odgrywać  również  istniejące  zawsze  niedosko- 
nałości w budowie  krystalicznej  półprzewodnika,  czyli 
defekty  sieci  (— ► Budowa  kryształów).  Nie  zawsze 
jednak  poziomy  energetyczne  domieszek  lub  defek- 
tów leżą  tak  blisko  pasm  dozwolonej  energii.  We- 
wnątrz przerwy  energetycznej  mogą  także  występo- 
wać głębokie  poziomy.  Są  one  nazywane  czasem  pu- 
łapkami elektronowymi,  dla  podkreślenia  faktu,  że 
utrudnione  jest  termiczne  wyswobodzenie  się  z nich 
elektronu. 

Jak  czułe  własności  elektryczne  półprzewodni- 
ków na  zawartość  domieszek  obrazuje  fakt,  że  doda- 
nie np.  1 mg  antymonu  na  1 tonę  germanu  zmienia 
przewodnictwo  elektryczne  kryształu  na  tyle,  że  decy- 
duje to  o jego  dalszych  zastosowaniach  technicznych. 
Kariera  półprzewodników  opiera  się  przede  wszyst- 
kim na  dwu  wielkich  osiągnięciach  technologicznych. 
Pierwszym  z nich  było  wynalezienie  przez  W.  Pfanna 
sposobu  oczyszczania  kryształów  półprzewodniko- 
wych do  takiego  stopnia  czystości,  jaki  nigdy  przed- 
tem nie  był  osiągalny  dla  żadnych  materiałów.  Sposób 
ten  polega  na  miejscowym  stopieniu  pałeczki  pół- 
przewodnikowej i następnym  wielokrotnym  przecią- 
ganiu stopionej  strefy  wzdłuż  całej  długości  kryształu. 
Domieszki,  które  wolą  gromadzić  się  w fazie  ciekłej, 
zostają  w ten  sposób  wyprowadzone  na  brzeg  krysz- 
tału. 

Drugim  osiągnięciem  było  wytworzenie  w tak 
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oczyszczonym  materiale  dwóch  sąsiadujących  ze  sobą 
obszarów  o różnym  typie  przewodnictwa,  czyli  otrzy- 
manie złącza  p-n.  Tak  więc  w jednym  kawałku  pół- 


temperatura 


przewodnika  możemy  mieć  dwa  względnie  ostro  roz- 
graniczone między  sobą  obszary,  w jednym  z nich 
dominującymi,  czyli  większościowymi  nośnikami 
prądu  są  elektrony,  w drugim  zaś  — dziury.  Na- 
tężenie prądu,  który  płynie  przez  tego  rodzaju  złącze, 
zależy  w sposób  zasadniczy  od  kierunku  przyłożone- 
go napięcia.  Jeśli  kierunek  polaryzacji  jest  taki,  że 
ujemny  biegun  baterii  połączony  jest  z obszarem  typu 
P , to  zarówno  dziury,  jak  i elektrony  w swoich  ma- 
cierzystych obszarach  są  odciągane  przez  pole  elek- 
tryczne z obszaru  złącza.  W pobliżu  granicy  p-n  wy- 
twarza się  warstwa  zubożona  w nośniki  prądu  i prąd 
płynący  przez  złącze  jest  bardzo  słaby.  Jest  to  zatem 
kierunek  zaporowy.  Natomiast  przy  przeciwnej  pola- 
ryzacji dziury  i elektrony  są  spychane  w kierunku 
złącza;  niewielka  ich  część  zostaje  nawet  „wstrzyknię- 


Rys.  1 1 . Złącze  p-n  przy 
dwóch  kierunkach  po- 
laryzacji 
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ta”  do  obszarów  przeciwnego  typu,  gdzie  występują 
w roli  nośników  mniejszościowych.  Opór  elektryczny 
złącza  jest  wówczas  mały,  a prąd  płynący  przezeń 
duży;  jest  to  kierunek  przewodzenia.  Złącze  p-n 
stanowi  zatem  prostownik  prądu  przemiennego, 
tzn.  diodę  półprzewodnikową. 


złącze 

p-n 


Ten  mocno  uproszczony  model  złącza  p-n , który 
tu  przedstawiliśmy,  ma  wartość  raczej  mnemotech- 
niczną. Opisuje  on  prawidłowo  kierunek  prostowania, 
a nawet  uwidacznia  wystąpienie  nowego  ważnego  zja- 
wiska wstrzykiwania  nośników  mniejszościowych. 
W rzeczywistości  warstwa  zubożona  w nośniki  istnieje 
na  złączu  nawet  bez  przyłożenia  doń  zewnętrznego 
napięcia,  co  jest  wynikiem  pojawienia  się  pewnej  sa- 
moistnej różnicy  potencjałów  zapewniającej  wewnętrz- 
ną równowagę  tego,  bądź  co  bądź,  złożonego  układu. 


Światłoczulość  półprzewodników 

Wstrzykiwanie  za  pomocą  złącza  p-n  jest  jednym  ze 
sposobów  chwilowego  zwiększenia  koncentracji  noś- 
ników prądu  w półprzewodniku.  Spośród  kilku  innych 
znanych  sposobów  najważniejszym  jest  oświetlenie 
kryształu.  Jaki  jest  mechanizm  oddziaływania  światła, 
lub  ogólniej  promieniowania  elektromagnetycznego, 
na  kryształ  półprzewodnikowy?  Najbardziej  podsta- 
wowym procesem  jest  wymuszanie  przez  falę  elektro- 
magnetyczną przejść  elektronu  z jednego  pasma  do- 
zwolonej energii  do  innego.  Zjawisko  to  ma  charakter 
rezonansowy  i zachodzi  tylko  wtedy,  gdy  częstość  y 
padającej  fali  jest  dokładnie  równa  różnicy  energii 
E2  — El  stanów  kwantowych,  między  którymi  nastę- 
puje przejście,  podzielonej  przez  stałą  Plancka  h. 
Warunek  ten  zapisuje  się  w postaci 

hv  = E2  — E1. 

hv  jest  tu  energią  najmniejszej  porcji  promieniowania 
o danej  częstości,  tj.  fotonu. 

Jeśli  elektron  znajduje  się  początkowo  w stanie 
kwantowym  o niższej  energii  — taka  sytuacja  jest 
charakterystyczna  dla  równowagi  cieplnej  — wów- 
czas wynikiem  oddziaływania  z falą  elektromagnetycz- 
ną będzie  wzbudzenie  go  do  stanu  o wyższej  energii, 
absorpcja  Mówimy  wtedy,  że  foton  został  pochłonięty  (zaabsor- 
bowany) a jego  energia  przekazana  elektronowi  (rys. 
12a).  Jeśliby  zaś  elektron  znajdował  się  początkowo 


a)  b)  c) 

Rys.  12.  Rodzaje  przejść  elektronowych  z udziałem  fali  elektro- 
magnetycznej: a)  absorpcja  fotonu,  b)  emisja  wymuszona,  c) 
emisja  spontaniczna 

na  wyższym  poziomie  energetycznym  (a  tego  rodzaju 
nietrwały  stan  można  wytworzyć),  to  wówczas  nastę- 
powałoby przejście  rezonansowe  na  poziom  niższy, 
a uwolniona  przy  tym  energia  byłaby  wypromienio- 
emisja  wana  w postaci  fotonu  (rys.  12b).  Zjawisko  to,  zwane 
wymuszona  emisją  wymuszoną,  jest  podstawą  działania  laserów. 

Oczywiście,  tego  rodzaju  przejście  elektronu  z góry 
na  dół  może  zajść  także  samorzutnie,  bez  obecności 
zewnętrznego  promieniowania  (emisja  spontaniczna, 
rys.  12c). 

Jeśli  chodzi  o półprzewodniki,  to  przejścia  rezo- 
nansowe zachodzą  przede  wszystkim  między  stanami 
kwantowymi  pasma  walencyjnego  i pasma  przewod- 
nictwa. Wystąpią  one  zatem  nie  przy  ściśle  określonej 
długości  fali,  ale  w pewnym  paśmie  długości  fal.  Naj- 
większa długość  fali,  przy  której  pojawi  się  jeszcze  re- 
zonansowa absorpcja  promieniowania,  zależy  oczy- 
wiście od  szerokości  przerwy  wzbronionej  danego 
półprzewodnika.  Jeśii  zapamiętamy  prostą  relację 
między  długością  fali  w um  a energią  fotonu  w eV: 
X = 1 ,24 }hv,  to  dla  każdego  materiału  o znanej  przer- 
wie wzbronionej  Eg>  będziemy  mogli  obliczyć,  kładąc 


hv  = Eg , jaka  jest  progowa  długość  fali,  przy  której 
rozpoczyna  się  silna  absorpcja  światła.  Dla  krzemu  na 
przykład,  dla  którego  Eg  = 1,1  eV,  wynosi  ona  1,1 
pm.  Krzem  jest  więc  zupełnie  nieprzezroczysty  dla 
światła  widzialnego.  Rzeczywiście,  płytka  monokry- 
staliczna  Si  ma  wygląd  metaliczny.  Jest  rzeczą  zdu- 
miewającą, że  taka  płytka  nie  stanowi  prawie  żadnej 
przeszkody  dla  promieniowania  cieplnego,  tzn.  pod- 
czerwonego o długości  fali  większej  od  1,1  pm.  Na- 
tomiast czysty  ZnO,  który  ma  przerwę  3,2  eV,  jest 
przezroczysty  niemal  jak  szyba  i silnie  absorbuje  do- 
piero promieniowanie  nadfioletowe. 

W niektórych  półprzewodnikach,  takich  jak  Ge 
i Si,  stany  kwantowe  odpowiadające  dnu  pasma  prze- 
wodnictwa oraz  wierzchołkowi  pasma  walencyjnego 

odpowiadają  zupełnie  różnym  wartościom  wektora  k. 
Przejścia  kwantowe  między  tymi  stanami  muszą  wów- 
czas zachodzić  ze  zmianą  pędu  krystalicznego  elek- 
tronu. Ale  we  wszystkich  zjawiskach  fizycznych  prawa 
zachowania  pędu  i energii  muszą  być  dokładnie  speł- 
nione. Foton  padającego  promieniowania  niesie  ze 
sobą  tak  mały  pęd,  że  można  go  w ogóle  nie  uwzględ- 
niać w tym  procesie.  Jak  wobec  tego  zbilansować  tę 
różnicę  pędów?  Na  pomoc  przychodzi  tu  dodatkowa 
kwazicząstka,  tzw.  fonon,  czyli  kwant  drgań  spręży- 
stych sieci  krystalicznej  (-*  Dynamika  sieci  krystalicz- 
nej). W procesie  trójcząstkowym,  w którym  biorą 
udział  foton,  elektron  i emitowany  bądź  absorbovvany 
fonon,  prawa  zachowania  mogą  być  już  spełnione. 
Jednakże  taki  proces  jest  mniej  prawdopodobny  niż 
proces  dwucząstkowy  i związana  z nim  absorpcja, 
a także  emisja  promieniowania  są  dużo  słabsze. 

Jest  rzeczą  zupełnie  oczywistą,  że  drgania  sieci  — 
fonony  — będą  odgrywać  zasadniczą  rolę  również 
w zjawisku  przewodnictwa  elektrycznego  i innych  zja- 
wiskach transportu  elektronowego  w półprzewodni- 
kach. Ograniczają  one  przede  wszystkim  drogę  swo- 
bodnego przebiegu  elektronu,  a tym  samym  wartość 
ruchliwości  nośników  prądu.  W bardzo  niskich  tem- 
peraturach, gdy  drgania  sieci  są  mało  intensywne, 
ruchliwość  nośników  ograniczona  jest  raczej  rozpra- 
szaniem na  domieszkach  i defektach.  Dla  większości 
półprzewodników  ruchliwość  nie  przekracza  zazwy- 
czaj w normalnych  warunkach  wartości  kilku  tysięcy 
cm2/V  s.  W pewnych  jednak  materiałach  z bardzo 
wąską  przerwą  energetyczną  ruchliwość  elektronów 
osiąga  monstrualnie  duże  wielkości. 

Weźmy  przykład  kryształu  będącego  stopem  dwóch 
związków  półprzewodnikowych  CdTe  i HgTe.  Szero- 
kość przerwy  wzbronionej  tego  materiału  zależy  silnie 
od  procentowej  zawartości  obu  składników  i dla 
stopu,  w którym  10%  całego  materiału  stanowi  CdTe, 
przerwa  energetyczna  całkowicie  się  zamyka.  Krzy- 
wizna pasma  przewodnictwa  w pobliżu  jego  dna  staje 
się  wówczas  bardzo  duża  i masa  efektywna  elektronu 
osiąga  wartość  minimalną.  Powoduje  to  anomalny 
wzrost  ruchliwości  elektronów,  która  w niskich  tem- 
peraturach wyraża  się  liczbą  sześciocyfrową. 

Materiały  o tak  wielkich  ruchliwościach  mają  osob- 
liwe własności  w polu  magnetycznym.  Elektron,  które- 
go droga  swobodnego  przebiegu  jest  wówczas  bardzo 
długa,  porusza  się  na  skutek  działania  siły  Lorentza 
po  orbitach  kołowych  leżących  w płaszczyźnie  prosto- 
padłej do  kierunku  pola  magnetycznego.  W myśl  me- 
chaniki kwantowej  orbity  te  muszą  być  skwantowane, 
czyli  odpowiadać  ściśle  określonym  nieciągłym  war- 
tościom energii.  Następuje  tu  zatem  pewnego  rodzaju 
rozszczepienie  pasma  przewodnictwa  na  poszczególne 
poziomy  kwantowe  (tzw.  poziomy  Landaua).  Stają  się 
wtedy  możliwe  przejścia  rezonansowe  elektronu  mię- 
dzy rozszczepionymi  poziomami  tego  samego  pasma. 
Energie  tych  przejść  można  w szerokim  zakresie  regu- 
lować polem  magnetycznym.  Leżą  już  one  w obszarze 
długości  fal  odpowiadających  dalekiej  podczerwieni. 
Stwarza  to  interesujące  możliwości  nowych  zastoso- 
wań półprzewodników  z wąską  przerwą  energetycz- 
ną, np.  w przyrządach  optoelektronicznych. 
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Wiemy  już,  że  w wyniku  absorpcji  światła  następuje 
wzbudzenie  elektronów  z pasma  walencyjnego  do 
pasma  przewodnictwa;  rezultatem  jest  pojawienie  się 
dodatkowych  nośników  prądu  — elektronów  i dziur. 
Tak  więc  oświetlenie  półprzewodnika  odpowiednio 
krótkofalowym  światłem  zwiększa  jego  przewodni- 
fotoprze-  ctwo  elektryczne,  co  jest  określane  mianem  fotoprze- 
wodnictwo  wodnictwa.  Zjawisko  to  jest  szeroko  wykorzystywane 
do  wykrywania  i pomiaru  promieniowania  elektro- 
magnetycznego. 

Po  wyłączeniu  oświetlenia  wzbudzone  światłem 
nośniki  prądu  zanikają  z czasem,  aż  do  całkowitego 
przywrócenia  stanu  początkowego.  Ten  proces  za- 
niku, zwany  rekombinacją,  może  następować  na  przy- 
rekombinacja  kład  wskutek  samorzutnych  przejść  elektronów  z pas- 
ma przewodnictwa  do  pasma  walencyjnego  z emisją 
fotonów.  W niektórych  półprzewodnikach,  takich  jak 
GaAs,  ten  sposób  powrotu  do  równowagi  jest  dość 
uprzywilejowany.  Jeśli  dodatkowe  pary  elektron-dziu- 
ra  są  wprowadzane  do  materiału  przez  wstrzykiwanie 
złączem  p-n  a ich  rekombinacja  zachodzi  z emisją 
promieniowania,  to  wówczas  mamy  do  czynienia 
eiektrolumi-  z bezpośrednią  przemianą  energii  elektrycznej  w świa- 
nescencja  tło,  zwaną  elektroluminescencją  (-*  Optoelektroni- 
ka półprzewodnikowa).  Wydajność  takiego  świecenia 
ograniczona  jest  konkurencyjnym  mechanizmem  re- 
kombinacji, w którym  uwolniona  energia  przekazy- 
wana jest  drganiom  sieci.  Ten  ostatni  proces  zachodzi 
szczególnie  chętnie  na  wszelkiego  rodzaju  defektach 
sieci  i domieszkach  i on  to  zazwyczaj  ogranicza  dłu- 
gość czasu  życia  wzbudzonych  nośników  prądu. 


Od  tranzystora  do  generatora  Gunna 

Swoiste  właściwości  materiałów  półprzewodnikowych 
uwidaczniają  się  wyraziście  w pewnym,  klasycznym 
już  dziś  doświadczeniu  zaproponowanym  przez  Hay- 
nesa  i W.  Shockleya  z laboratorium  Bell  Telephone. 
Opiszemy  je  tutaj  w wersji  różniącej  się  nieco  od  ory- 
ginału. 

Na  próbce  germanowej  — powiedzmy,  że  jest  ona 
typu  n — wytworzono  w pobliżu  jej  końców  dwa  ma- 
leńkie obszary  typu  p.  Jedno  z utworzonych  w ten 
sposób  złącz  spolaryzowano  w kierunku  przewodze- 
nia, drugie  w kierunku  zaporowym.  To  pierwsze  złą- 
cze nazywamy  emiterem,  ponieważ  wstrzykuje  ono  do 
próbki  nośniki  mniejszościowe  — dziury.  Drugie  złą- 
cze ma  całkiem  odmienną  właściwość.  Może  ono  „wy- 
sysać” dziury  z obszaru  kryształu  bezpośrednio  doń 
zasada  przylegającego.  Dzieje  się  tak  dlatego,  że  złącze  spola- 
działania  ryzowane  zaporowo  nie  stanowi  przeszkody  dla  nośni- 
tranzystora  ków  mniejszościowych.  Wstrzykiwane  przez  emiter 
dziury  rozprzestrzeniają  się  w głąb  próbki  dzięki  pro- 
cesowi dyfuzji,  zanikając  po  drodze  na  skutek  rekom- 
binacji. Ze  względu  na  stosunkowo  krótki  czas  życia 
nadmiarowych  nośników,  efektywny  zasięg  chmury 
dziurowej  nie  przekracza  zazwyczaj  milimetra.  Jeśli 
odległość  emiter-kolektor  wynosi  np.  1 cm,  to 
wstrzyknięte  dziury  nie  docierają  do  kolektora.  Można 
im  jednak  w tym  pomóc,  przykładając  w pewnej  chwili 
do  kontaktów  na  końcach  próbki  taką  różnicę  poten- 
cjałów, która  będzie  je  ciągnąć  w kierunku  kolektora. 
Chmura  nadmiarowych  nośników  zostaje  teraz  oder- 
wana od  emitera  i uniesiona  polem  elektrycznym 
wzdłuż  próbki.  Jeśli  natężenie  pola  elektrycznego  w 
krysztale  wynosi,  powiedzmy,  50  V/cm,  to  biorąc  pod 
uwagę  ruchliwość  dziur  w Ge — 1800  cm2/V  s — 
znajdujemy,  że  prędkość  unoszenia  wynosi  9 -104  cm/s. 
Dziury  przebędą  zatem  odległość  emiter-kolektor 
w czasie  równym  w przybliżeniu  10~5  s,  jest  to  czas 
znacznie  krótszy  od  czasu  życia  nadmiarowych  noś- 
ników prądu  w dobrym  krysztale.  Tak  więc  prawie 
wszystkie  dziury  dotrą  do  obszaru  kolektora  i tu  zo- 
staną przezeń  wessane,  przez  co  zwiększy  się  chwilowy 
prąd  w obwodzie  kolektora.  Jeśli  na  ekranie  oscylo- 
skopu będziemy  rejestrować  sygnał  elektryczny  kolek- 
tora, to  zaobserwujemy  jego  przebieg  w czasie,  taki 
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jak  na  rys.  13c.  Pierwszy  skok  sygnału  pojawia  się  w 
momencie  włączenia  pola  ciągnącego  i jest  wywołany 
spadkiem  napięcia  wzdłuż  długości  kryształu.  Po 
pewnym  czasie  pojawia  się  rozmyty  sygnał  związany 
z dotarciem  chmury  dziurowej  do  kolektora. 


Rys.  13.  Doświadczenie  Haynesa-Shockleya  demonstrujące  ruch 
chmury  dziurowej  w polu  elektrycznym 


Eksperyment  ten  wykazuje  w sposób  bezpośredni 
istnienie  dodatnio  naładowanych  nośników  prądu, 
tj.  dziur  i pozwala  wyznaczyć  ich  ruchliwość  a nawet 
czas  życia.  Demonstruje  on  również  zjawisko  wstrzy- 
kiwania nośników  prądu  oraz  działanie  kolektora. 

Stąd  już  tylko  krok  do  zrozumienia  zasady  działania 
tranzystora.  Jeśli  umieścić  emiter  i kolektor  w dosta- 
tecznie malej  odległości  od  siebie,  to  wówczas,  nawęt 
bez  pola  unoszącego  nośniki,  znaczna  część  wstrzyk- 
niętych dziur  dotrze  do  kolektora.  Taki  układ,  który 
stanowi  uproszczony  model  tranzystora,  ma  własność 
wzmacniania  sygnałów  elektrycznych.  Sygnał  wpro- 
wadzony do  obwodu  emitera  jest  przenoszony  za  po- 
średnictwem nośników  mniejszościowych  do  obwodu 
kolektora.  Ale  napięcie  przyłożone  do  kolektora  może 
znacznie  przewyższać  napięcie  na  emiterze;  stąd  — 
wzmocnienie  mocy  przenoszonego  sygnału. 

Przyjmowaliśmy  dotychczas,  że  zależność  między 
gęstością  prądu  i natężeniem  pola  elektrycznego 
w jednorodnym  półprzewodniku  jest  liniowa,  tzn. 
spełnia  prawo  Ohma.  Jednakże,  to  prawo  przestaje  gorące 
być  słuszne  dla  bardzo  silnych  pól,  gdy  prędkość  uno-  elektrony 
szenia  elektronów  staje  się  porównywalna  ze  średnią 
prędkością  ich  chaotycznego  ruchu  cieplnego.  Wystę- 
puje wówczas  zjawisko  grzania  gazu  elektronowego, 
któremu  towarzyszy  zazwyczaj  wzrost  rozpraszania 
i zmniejszenie  ruchliwości. 

Istnienie  „gorących”  elektronów  może  prowadzić 
w pewnych  wypadkach  do  pojawienia  się  zupełnie  no- 
wych i niezwykłych  zjawisk,  np.  pojawienie  się  ujem- 
nej przewodności  elektrycznej  w GaAs.  Struktura 
pasmowa  tego  półprzewodnika  przedstawiona  jest  ujemna  prze- 
schematycznie  na  rys.  14.  Pasmo  przewodnictwa  ma  wodność 
bezwzględne  minimum  (a)  w środku  strefy  Brillouina,  elektryczna 

tzn.  dla  k = 0.  To  minimum  odległe  jest  od  kra- 
wędzi pasma  walencyjnego  (c)  o 1,35  eV.  W paśmie 
przewodnictwa  występują  ponadto  dodatkowe  lokalne 


określenie 
póiprze  wod- 
nika mag- 
netycznego 


minima  ( b ),  odpowiadające  pewnym  określonym  kie- 
runkom i wartościom  wektora  k elektronu.  Te  lokalne 
minima  leżą  0,35  eV  powyżej  krawędzi  pasma  prze- 
wodnictwa . 


Rys.  14.  Schemat  struktury  elektronowej  arsenku  galu  GaAs: 
a,  b — minima  pasma  przewodnictwa,  c — pasmo  walencyjne 


W domieszkowanym  GaAs  typu  n elektrony,  które 
biorą  udział  w przewodzeniu  prądu,  znajdują  się, 
w normalnych  warunkach,  w najniższym,  środkowym 
minimum  pasma  przewodnictwa.  W silnych  polach 
elektrycznych  elektrony  uzyskują  dodatkową  energię 
kinetyczną.  Jeśli  przyłożone  pole  zwiększy  średnią 
energię  kinetyczną  elektronów-  powyżej  wartości 
0,35  eV,  wówczas  następuje  obsadzenie  elektronami 
bocznych  minimów  pasma  przewodnictwa.  Ale  po- 
jemność bocznych  minimów  lub,  mówiąc  ściślej,  gę- 
stość stanów  kwantowych  w tych  minimach  jest 
znacznie  większa  niż  w minimum  środkowym,  wsku- 
tek różnicy  ich  krzywizn.  A zatem,  chociaż  prawdo- 
podobieństwo obsadzenia  stanów  w bocznych  mi- 
nimach pozostaje  — ze  względu  na  statystykę  — 
mniejsze  niż  w środkowym  minimum,  to  jednak  w 
warunkach  silnego  pola  elektrycznego  może  znaleźć 
się  w nich  przeważająca  część  elektronów  przewod- 
nictwa-. Z drugiej  strony  mniejsza  krzywizna  bocznych 
minimów  powoduje,  że  masa  efektywna  m*  znajdują- 
cych się  tam  elektronów  jest  duża,  a zatem  ich  ruchli- 
wość fi  = ez!m*  jest  mała.  Mamy  już  wszystkie  ele- 
menty niezbędne  do  tego,  aby  zrozumieć  istotę  poja- 
wiającego się  w GaAs  zjawiska  ujemnej  przewodności 
elektrycznej.  Mechanizm  tego  efektu  można  teraz  la- 
pidarnie objaśnić  w następujący  sposób.  W zakresie 
słabych  pól  elektrycznych  większość  elektronów  znaj- 


duje się  w środkowym  minimum  i wtedy  obserwuje 
się  normalne,  niezależne  od  pola  prewodnictwo  krysz- 
tału. Gdy  pole  jest  dostatecznie  silne,  rozpoczyna  się 
obsadzanie  bocznych  minimów,  w których  ruchliwość 
elektronów  jest  mała.  Ze  wzrostem  pola  elektrycznego 
coraz  większa  część  elektronów  przechodzi  do  mini- 
mów o małej  ruchliwości.  W tym  zakresie  prąd  pły- 
nący przez  kryształ  maleje  ze  wzrostem  przyłożonego 
do  kryształu  napięcia. 

Taka  sytuacja  jest  wielce  nienormalna  i prowadzi 
do  tego,  że  pole  elektryczne  wewnątrz  kryształu  prze-  efekt  Gunna 
staje  być  jednorodne.  Tworzą  się  obszary  (domeny) 
silnego  i słabego  pola,  ostro  od  siebie  odgraniczone. 

Ich  granice  przemieszczają  się  wzdłuż  kryształu  zgod- 
nie z unoszeniem  elektronów  przez  pole  elektryczne. 

Docierając  do  końców  kryształu  domeny  wywołują 
w zewnętrznym  obwodzie  oscylacje  prądu.  Jeśli  dłu- 
gość kryształu  jest  niewielka,  to  częstość  tych  oscylacji 
jest  bardzo  duża.  Zjawisko  to,  zwane  efektem  Gunna, 
jest  wykorzystywane  do  generacji  fal  elektromagne- 
tycznych o częstości  mikrofalowej  (-►  Generacja  mi- 
krofal). 

Dla  wygody  Czytelnika  załączamy  krótki  wykaz  maten asy 
podstawowych  materiałów  półprzewodnikowych  wraz  półprzewod- 
z podaniem  ich  najważniejszych  zastosowań.  O bar-  nikowe 
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dzo  wielu  z nich  w ogóle  nie  wspominaliśmy  w tym 
artykule. 

Fizyka  półprzewodników  osiągnęła  obecnie  swój 
okres  dojrzałości.  Pomimo  tego,  ciągle  prowadzi  się 
intensywne  poszukiwania  zarówno  nowych  zjawisk, 
jak  i nowych  materiałów.  Istnieją  obecnie  trzy  grupy 
substancji,  które  przyciągają  szczególną  uwagę  bada- 
czy. Są  to  tzw.  półprzewodniki  magnetyczne,  półprze- 
wodniki amorficzne  (niekrystaliczne)  oraz  półprze- 
wodnikowe związki  organiczne. 

N.  B.  Hannay  Półprzewodniki,  Warszawa  1962;  P.  S.  Kiriejew 
Fizyka  pólr  ze  wodników.  Warszawa  1971;  R.  A.  Smith  Półprze- 
wodniki, Warszawa  1966. 


Półprzewodniki  magnetyczne 

Robert  R.  Gałązka 


Wszystkie  ciała  stałe  występujące  w przyrodzie  można 
podzielić  na  kilka  grup,  przy  czym  kryterium  po- 
działu stanowią  ich  własności  fizyczne.  Półprzewod- 
niki i magnetyki  tworzą  dwie  duże  grupy  ciał  stałych 
o wyraźnie  różnych  własnościach  fizycznych.  W ostat- 
nim dziesięcioleciu  zaszła  potrzeba  wyróżnienia  no- 
wej grupy  materiałów,  które  nazwano  półprzewodni- 
kami magnetycznymi.  Półprzewodniki  magnetyczne 
można  zdefiniować  w różny  sposób,  np.  jako: 

1)  magnetyki  (materiały  magnetyczne)  o przewod- 
ności elekt^cznej  od  104  do  10-10  (Dcm)-1; 

2)  materiały  zawierające  jednocześnie  swobodne 
nośniki  prądu  oraz  zlokalizowane  atomowe  momenty 
magnetyczne.  Koncentracja  nośników  prądu  może 
się  zmieniać  pod  wpływem  warunków  zewnętrznych. 


takich  jak  oświetlenie,  temperatura,  ciśnienie,  pole 
elektryczne  i magnetyczne. 

Materiałami  magnetycznymi  mogą  być  zarówno 
metale  jak  i dielektryki  — izolatory.  Istnieje  również 
duża  grupa  magnetyków  o przewodności  pośredniej, 
pomiędzy  metalami  i izolatorami,  i właśnie  tę  grupę 
materiałów  nazwano  półprzewodnikami  magnetycz- 
nymi. Warto  zwrócić  uwagę  na  to,  że  pierwsza  defi- 
nicja charakteryzuje  materiał  niejako  od  zewnątrz, 
poprzez  makroskopowy  parametr,  jakim  jest  prze- 
wodność właściwa. 

Definicja  druga  jest  głębsza  — charakteryzuje  ma- 
teriał od  strony  mikroskopowej.  Magnetyczny  mo- 
ment pędu  atomu  składa  się  z części  orbitalnej  (zwią- 
zanej z orbitalnym  ruchem  elektronów  wokół  jądra) 
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oraz  części  spinowej  (-+  Teoria  magnetyzmu).  Podob- 
nie jak  ładunek  elektryczny,  np.  elektronu,  charakte- 
ryzuje pole  elektryczne  wytwarzane  przez  elektron, 
tak  spin  charakteryzuje  pole  magnetyczne  elektronu. 
Ponieważ  moment  orbitalny  jest  wielkością  małą, 
o momencie  magnetycznym  atomu,  o magnetycznych 
własnościach  pierwiastków  i związków  chemicznych 
decyduje  spin  atomu  i oddziaływania  spinowe. 

W układzie  okresowym  istnieją  dwie  grupy  pier- 
wiastków, których  atomy  mają  szczególnie  duży  wy- 
padkowy spin.  Są  to  tzw.  metale  przejściowe  (np.  Mn, 
Fe,  Ni,  Cr)  oraz  pierwiastki  ziem  rzadkich  (np.  Eu, 
Gd,  La).  Duża  wartość  spinu  tych  atomów  związana 
jest  z istnieniem  niezapełnionych  powłok  elektrono- 
wych d i /odpowiednio  dla  metali  przejściowych  i pier- 
wiastków ziem  rzadkich.  Mówiąc  w drugiej  definicji 

0 zlokalizowanych  momentach  magnetycznych,  mie- 
liśmy na  myśli  właśnie  obecność  tych  pierwiastków 
w materiale. 

Możemy  teraz  uzupełnić  definicje  półprzewodni- 
ków magnetycznych  dodając,  że  każdy  półprzewodnik 
magnetyczny  musi  zawierać  w postaci  domieszki  lub 
składnika  co  najmniej  1 pierwiastek  z grupy  metali 
przejściowych  lub  grupy  pierwiastków  ziem  rzadkich. 

Własności  fizyczne  półprzewodników  magnetycz- 
nych w dużej  części  są  nowe  i nietypowe  zarówno  dla 
magnetyków,  jak  i półprzewodników.  Dotychczas 
w półprzewodnikach  nie  uwzględniano  oddziaływań 
spinowych  (normaine  półprzewodniki  nie  zawierają 
pierwiastków  magnetycznych).  Fizyka  magnetyków 
nie  brała  pod  uwagę  wpływu  swobodnych  nośników 
prądu  na  oddziaływania  spinowe  (teorie  opracowane 
dla  metali  magnetycznych  ze  względu  na  bardzo  dużą 

1 stałą  koncentrację  nośników  prądu  nie  stosują  się  do 
półprzewodników  magnetycznych).  Półprzewodniki 
magnetyczne  budzą  duże  zainteresowanie  tak  z punk- 
tu widzenia  poznawczego  (możliwość  obserwacji  no- 
wych efektów  fizycznych)  jak  i zastosowań  (możli- 
wość otrzymania  półprzewodników  o regulowanych 
własnościach  magnetycznych  — np.  przez  zmianę 
zawartości  atomów  magnetycznych,  pole  magnetycz- 
ne, temperaturę,  oraz  magnetyków  o różnych  kon- 
centracjach swobodnych  nośników  — elektronów  i 
dziur). 

Ze  względu  na  nowość  problematyki,  jak  również 
duże  trudności  w matematycznym  opisie  półprzewod- 
ników magnetycznych,  wiele  istniejących  teorii,  które 
próbują  wyjaśnić  własności  tych  materiałów,  ma  ra- 
czej charakter  roboczych  hipotez.  Zrozumienie  zja- 
wisk zachodzących  w półprzewodnikach  magnetycz- 
nych szybko  się  pogłębia,  ale  jeszcze  nie  może  być 
porównywane  z wiedzą  i aparatem  matematycznym, 
jakimi  dysponuje  fizyka  półprzewodników  i fizyka 
magnetyków. 


Struktura  energetyczna  — gęstość  stanów 

Elektrony  w atomie  zajmują  określone  stany  energe- 
tyczne. Zmiana  energii  elektronu  (np.  przez  oświetle- 
nie atomu  — doprowadzenie  do  elektronu  energii 
fotonu  fali  elektromagnetycznej)  nie  może  zachodzić 
w sposób  ciągły.  Elektron  przeskakuje  na  wyższy  stan 
energetyczny  pochłaniając  energię  lub  spada  na  niższy 
stan  energetyczny  oddając  energię.  Istnieje  więc  wiele 
dozwolonych  dla  elektronów  stanów  — poziomów 
energetycznych,  a wszystkie  stany  pośrednich  energii 
są  dla  elektronu  zabronione  (-*  Struktura  elektrono- 
wa ciał  stałych). 

W krystalicznych  ciałach  stałych,  np.  w półprze- 
wodnikach, rolę  pojedynczych  stanów  spełniają  pas- 
ma energetyczne.  Trzy  pasma  decydują  o własnościach 
półprzewodnika:  pasmo  podstawowe  — walencyjne, 
pasmo  energii  wzbronionej  (przerwa  energetyczna) 
i pasmo  przewodnictwa  (-*  Półprzewodniki).  W roz- 
ważaniach nad  półprzewodnikami  magnetycznymi 
bardzo  ważnym  parametrem  jest  gęstość  stanów,  czyli 
ilość  stanów  energetycznych  na  jednostkę  energii. 


Jeżeli  elektron  na  skutek  zderzeń  z innymi  elektrona- 
mi, czy  też  rozpraszania  przez  drgające  atomy  sieci 
zmienia  swoją  energię,  gęstość  stanów  dostarcza  nam 
informacji,  ile  stanów  energetycznych  będzie  miał  do 
dyspozycji — jak  łatwo  lub  trudno  będzie  się  pod- 
dawał zmianom  energii.  W typowym  półprzewodniku 
gęstość  stanów  energetycznych  rośnie  monotonicznie 
z energią  elektronu  lub  dziury  (rys.  1). 

Popatrzmy  teraz  na  rys.  2 i 3,  pokazujące  strukturę 
gęstości  stanów  w półprzewodnikach  magnetycznych. 
Widzimy  wyraźną  różnicę.  Pojawiają  się  dodatkowe 
piki  gęstości  stanów  w pewnych  wąskich  przedziałach 
energii,  co  więcej  — pojawiają  się  dozwolone  stany  w 
paśmie  energii  wzbronionej.  Pasmo  przewodnictwa 
i pasmo  walencyjne  rozdzielają  się  na  dwa,  kompliku- 
jąc dodatkowo  sytuację  (fakt  rozdzielenia  się  pasm 
nie  występuje  zawsze  — jest  typowy  tylko  dla  ferro- 
magnetyków  i tylko  dla  pewnych  kierunków  ruchu 
elektronów  w krysztale).  Za  taką  komplikację  obrazu 
gęstości  stanów  odpowiedzialne  są  oczywiście  atomy 
„magnetyczne”.  Dodatkowe  piki  gęstości  stanów 
związane  są  właśnie  z elektronami  tflub / tych  atomów-. 
Rozszczepianie  się  pasm  związane  jest  natomiast 


Rys.  1 . Zależność  gę- 
stości stanów  energe- 
tycznych od  energii  w 
paśmie  walencyjnym  i 
paśmie  przewodnictwa 
typowego  półprzewod- 
nika (gęstość  stanów  w 
paśmie  energii  wzbro- 
nionej równa  jest  oczy- 
wiście zeru) 


Rys.  2.  Schematyczny 
obraz  gęstości  stanów  w 
zależności  od  energii 
dla  półprzewodnika  fer- 
romagnetycznego ; ( + ) 
i (— ) oznaczają  prze- 
ciwne kierunki  spinów 
w rozszczepionych  pas- 
mach przewodnictwa  i 
walencyjnym 
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Rys.  3.  Postulowana  struktura  gęstości  stanów  w półprzewod- 
niku magnetycznym  NiO;  Ef  — poziom  Fermiego 

z sumarycznym  polem  magnetycznym  wytworzonym 
przez  te  atomy.  Zwróćmy  uwagę  na  jeszcze  jeden  fakt 
komplikujący  obraz.  W dostatecznie  niskiej  tempera- 
turze, gdy  cieplne  drgania  atomów  są  małe,  siły  od- 
działywań spinowych  pomiędzy  atomami  powodują 
powstanie  porządku  magnetycznego.  Spiny  kolejnych 
atomów  „magnetycznych”1  mogą  się  dodawać  jak 
w ferromagnetykach  lub  odejmować  ja  w antyferro- 
magnetykach. W ferromagnetycznym  półprzewodniku 
powstaje  silne  wewnętrzne  pole  magnetyczne,  którego 
skutkiem  jest  rozszczepienie  się  pasma  przewodni- 
twa  i pasma  walencyjnego.  Tak  się  dzieje,  gdy  energia 
cieplnych  drgań  sieci  krystalicznej  jest  dostatecznie 
mała  w porównaniu  z energią  oddziaływań  spinowych. 
Dla  każdego  magnetyka  istnieje  jednak  pewna  ściśle 
określona  temperatura  (temperatura  krytyczna),  w 
której  drgania  cieplne  sieci  niszczą  porządek  magne- 
tyczny i wektory  momentów  magnetycznych  ustawiają 
się  przypadkowo.  Powyżej  tej  temperatury  nie  ma  juz 
wewnętrznego  pola  magnetycznego  i tym  samym  znika 
rozszczepienie  pasm. 

Obraz  gęstości  stanów  w materiale  wpływa  zasad- 
niczo na  wszystkie  własności  kryształu.  Wielkości 
fizyczne,  charakteryzujące  materiał,  jak  np.  przewod- 
ność elektryczna,  przewodność  cieplna,  siła  termo- 
elektryczna, a także  własności  optyczne  — zależą 
od  gęstości  stanów.  Można  się  również  spodziewać, 
że  szczególną  rolę  będzie  odgrywała  temperatura  kry- 
tyczna: wszystkie  własności  półprzewodników  magne- 
tycznych w pobliżu  tej  temperatury  powinny  się  zmie- 
niać dość  drastycznie. 


Gigantyczny  magnetoopór 

Z szerokiej  klasy  zjawisk  transportu,  a więc  zjawisk 
związanych  z przenoszeniem  ładunku  i ciepła  omów- 
my tutaj  tylko  jedno  zjawisko,  a mianowicie  zależność 
oporu  właściwego  półprzewodników  magnetycznych 
od  temperatury  i pola  magnetycznego  (tzw.  magneto- 
opór). Zachowanie  się  oporu  w półprzewodnikach 
magnetycznych  jest  zupełnie  inne  niż  w półprzewodni- 
kach i metalach  magnetycznych. 


Na  rys.  4 i 5 pokazany  jest  przebieg  oporu  właści- 
wego dla  ferromagnetycznego  i antyferromagnetycz- 
nego półprzewodnika  w funkcji  temperatury  dla  kilku 
pól  magnetycznych.  W pobliżu  temperatury  krytycznej 
obserwuje  się  w obu  wypadkach  bardzo  silny  wzrost 
oporu.  Jest  to  efekt  wyjątkowo  duży  — opór  ma- 
teriału zmienia  się  o kilka  rzędów  wielkości.  W miarę 


Rys.  4.  Zależność  oporu  właściwego  ferromagnetycznego  pół- 
przewodnika (Hu0,95La0l0o6S)  od  temperatury  T i pola  magne- 
tycznego H 


Rys.  5.  Zależność  oporu  właściwego  antyferromagnetycznego 
półprzewodnika  (Eu0l8oC<lo,20^c)  temperatury  T i pola  magne- 
tycznego H 

wzrostu  temperatury  opór  ferromagnetycznego  pół- 
przewodnika szybko  maleje,  nawet  czasami  poniżej 
wartości  obserwowanej  w niskich  temperaturach. 
W antyferromagnetycznym  półprzewodniku  w miarę 
wzrostu  temperatury  opór  próbki  dalej  rośnie,  ale  już 
znacznie  wolniej. 

Następnym  niezwykłym  zjawiskiem  zachodzącym 
w pobliżu  temperatury  krytycznej  jest  zmniejszanie 
się  oporu  próbki  (nawet  setki  razy)  przy  stosunkowo 
niewielkiej  zmianie  pola  magnetycznego,  czyli  gigan- 
tyczny ujemny  magnetoopór  półprzewodników  mag- 
netycznych. Efekt  działania  pola  magnetycznego 
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szybko  słabnie  w miarę  oddalania  się  od  temperatury 
krytycznej  (szczególnie  w stronę  niższych  temperatur). 
Tak  silnego  efektu  ujemnego  magnetooporu  nie  ob- 
serwuje się  w żadnych  innych  ciałach  stałych,  oprócz 
półprzewodników  magnetycznych. 

Wyjaśnienie  powyższych  zależności  oporu  elek- 
trycznego półprzewodników  magnetycznych  od  tem- 
peratury i pola  magnetycznego  jest  dość  złożone,  po- 
staramy się  podać  ogólny  zarys  rozumowania,  prowa- 
dzący do  jakościowego  wyjaśnienia  tych  zależności. 

W ferromagnetyku  w niskich  temperaturach  istnieje 
silne,  ukierunkowane,  wewnętrzne  pole  magnetyczne. 
Elektron  poruszając  się  wzdłuż  kierunku  pola  magne- 
tycznego porusza  się  tak,  jakby  pola  nie  było.  Wynika 
to  z podstawow-ych  zasad  ruchu  elektronu  w polu 
magnetycznym.  Oczywiście,  elektrony  w krysztale  po- 
ruszają się  we  wszystkich  kierunkach  i wskutek  roz- 
proszeń ustawicznie  zmieniają  swoje  tory.  Jednak  w 
kierunku  równoległym  do  pola  magnetycznego  roz- 
praszanie (związane  z wewnętrznym  polem  magne- 
tycznym) nie  istnieje  (rys.  6).  W miarę  wzrostu  tempe- 
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Rys.  6.  Uproszczony  schemat  ferromagnetycznego  kryształu; 
czarne  kółka  oznaczają  atomy  mające  silny  własny  moment 
spinowy:  a)  w temperaturze  niższej  od  krytycznej  i zerowym 
zewnętrznym  polu  magnetycznym  elck  tron  poruszający  się 
wzdłuż  kierunku  wewnętrznego  pola  magnetycznego  Hw  nie  roz- 
prasza się,  b)  w temperaturze  wyższej  lub  równej  krytycznej 
i w zerowym  zewnętrznym  polu  magnetycznym  elektron  poru- 
szający się  w dowolnym  kierunku  ulega  rozpraszaniu  na  atomach 
z momentem  spinowym,  c)  w temperaturze  równej  krytycznej; 
zewnętrzne  pole  magnetyczne  częściowo  porządkuje  układ  spi- 
nów; elektron  jest  bardziej  rozpraszany  niż  w przypadku  a, 
ale  mniej  niż  w przypadku  b 

ratury  idealny  porządek  magnetyczny  zaczyna  się 
psuć.  Pojawiają  się  obszary  namagnesowane  inaczej 
niż  główna  część  kryształu.  Rozpraszanie  nośników 
prądu  wzrasta,  tym  samym  wzrasta  również  opór 
elektryczny. 

Maksymalny  nieporządek  panuje  w temperaturze 
krytycznej,  gdy  pękają  sprzężenia  spinowe  najbliżej 
oddziałujących  atomów.  Lokalne,  chaotycznie  skiero- 
wane pola  magnetyczne  mogą  być  tak  silne,  że  niemal 
zatrzymują  poruszające  się  elektrony.  Po  zapadnięciu 
się  ostatnich  wiązań  spinowych  średnie  wewnętrzne 
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pole  magnetyczne  szybko  spada  do  zera.  Rozprasza- 
nie maleje,  opór  również  szybko  maleje. 

Przyłożenie  zewnętrznego  pola  magnetycznego  jest 
czynnikiem  porządkującym  sieć  magnetyczną  — 
przywraca  zachwiany  porządek  magnetyczny,  roz- 
praszanie maleje,  opór  również  maleje  — pojawia  się 
ujemny  magnetoopór.  Wpływ  pola  magnetycznego 
jest  więc  w działaniu  podobny  do  efektu  obniżania 
temperatury. 

Zastanówmy  się  teraz,  dlaczego  w obszarze  wyso- 
kich temperatur  opór  ma  mniejsze  wartości  niż  obser- 
wowane w niskich  temperaturach.  Otóż  w ferromag-  samoistny 
netyku,  mimo  że  nie  przykładamy  zewnętrznego  pola  magnetoopór 
magnetycznego,  wewnętrzne  pole  magnetyczne  wy-  ferro- 
wołuje  samoistny  magnetoopór.  Pole  magnetyczne  magnetyków 
w zwykłych  półprzewodnikach  powoduje  zazwyczaj 
zwiększenie  oporu,  często  bardzo  znaczne.  Powyżej 
temperatury  krytycznej  cieplne  drgania  sieci  krysta- 
licznej niszczą  wewnętrzne  pole  magnetyczne  i opór 
próbki  może  zmaleć  nawet  poniżej  oporu  obserwo- 
wanego w bardzo  niskich  temperaturach,  ponieważ 
żaden  samoistny  magnetoopór  już  nie  istnieje. 

W antyferromagnetycznym  półprzewodniku  w ni- 
skich temperaturach  nie  ma  pola  wewnętrznego  — 
atomowe  pola  magnetyczne  kompensują  się  nawza-  opór  anty- 
jem.  Szybki  wzrost  oporu  w miarę  podwyższania  ferromagne- 
t-emperatury  jest  spowodowany  częściowym  psuciem  tyków 
się  kompensacji.  Pojawiają  się  lokalne  pola  magne- 
tyczne, a zatem  wzrost  rozpraszania  nośników  prądu 
i wzrost  oporu.  Po  osiągnięciu  temperatury  krytycz- 
nej pole  magnetyczne  wewnętrzne  dąży  do  zera  wsku- 
tek nieustannych  szybkich  zmian  kierunków  momen- 
tów magnetycznych,  a nie  wskutek  ponownej  kom- 
pensacji. Z punktu  widzenia  pola  magnetycznego 
wracamy  do  sytuacji,  jaka  była  w temperaturach 
niskich,  tzn.  nieistnienia  wewnętrznego  pola  magne- 
tycznego. Opór  próbki  maleje  jednak  tylko  nieznacz- 
nie,  ponieważ  drgania  cieplne  sieci  krystalicznej  są 
także  silnym  źródłem  rozpraszania  nośników  prądu. 

Drgania  te  zwiększają  się  w miarę  wzrostu  tempera- 
tury i opór  próbki  znów  zaczyna  rosnąć.  Warto  pod- 
kreślić, że  cały  efekt  został  wytłumaczony  zmianami 
rozpraszania  nośników  prądu.  Nie  zawsze  sytuacja 
jest  tak  jasna.  W miarę  wzrostu  temperatury  może  się 
jednocześnie  zmieniać  koncentracja  nośników  prądu, 
co  znacznie  komplikuje  obraz  zmian  zachodzących 
w półprzewodnikach  magnetycznych. 

Ogólnie  można  stwierdzić,  że  wszystkie  efekty  anomalie 
transportu  — efekty  związane  z ruchem  . nośników  w pobliżu 
prądu,  wykazują  wiele  osobliwości  w pobliżu  tempe-  temperatury 
ratury  krytycznej.  Anomalnym  zmianom,  oprócz  krytycznej 
oporu  właściwego,  ulegają:  przewodność  cieplna,  siła 
termoelektryczna,  współczynnik  Halla  itp.  Charakte- 
rystyczna jest  także  zależność  różnych  parametrów 
od  kierunku  i rodzaju  (a  tym  samym  siły)  oddziaływań 
magnetycznych.  Ponieważ  przez  tworzenie  stopów 
można  zmieniać  rodzaje  oddziaływań  spinowych, 
należy  oczekiwać  bardzo  silnych  zależności  mierzo- 
nych parametrów  od  składu  otrzymanych  stopów. 

Własności  optyczne  półprzewodników 
magnetycznych 

Optyczne  własności  półprzewodników  magnetycz- 
nych, a więc  m.in.  takie  zjawiska,  jak:  absorpcja  fali 
elektromagnetycznej  w zależności  od  energii  fali  pa- 
dającej, odbicie,  efekt  skręcania  płaszczyzny  polary- 
zacji (efekt  Faradaya),  również  wykazują  anomalie 
w porównaniu  z podobnymi  zjawiskami  obserwowa- 
nymi w półprzewodnikach.  Anomalie  te  widoczne  są 
zarówno  w kształcie  obserwowanych  krzywych,  jak 
również  w ich  zależności  od  temperatury  i pola  mag- 
netycznego. Interpretacja  otrzymanych  wyników  jest 
na  ogół  bardzo  trudna  i wiele  obserwowanych  zależ- 
ności nie  znalazło  dotychczas  pełnego  wyjaśnienia. 

Własności  optyczne  kryształu  stanowią  odbicie  me- 
chanizmów oddziaływania  materiału  z falą  elektro- 


magnetyczną.  W materiałach  magnetycznych  ze 
względu  na  obecność  spinów,  wewnętrznych  pól  mag- 
netycznych, fal  spinowych  itp.  powstają  nowe  formy 
oddziaływań  fali  elektromagnetycznej  z kryształem, 
ponadto  komplikują  się  znane  efekty  optyczne  obser- 
wowane w zwykłych  półprzewodnikach, 
absorpcja  Rozpatrzmy  np.  jedno  z najbardziej  typowych  zja- 
fali  wisk  optycznych  — absorpcję  fali  elektromagnetycz- 
elektromag-  nej  w półprzewodniku  magnetycznym.  W zwykłym 
netycznej  półprzewodniku,  jeżeli  energia  fali  padającej  jest 
mniejsza  od  energii  wzbronionej  (rys.  1)  kryształ  nie 
absorbuje  fali— jest  przezroczysty  dla  padającego 
promieniowania.  W półprzewodnikach  magnetycz- 
nych, w przerwie  energetycznej  znajdują  się  pasma 
o dużej  gęstości  stanów  zvyiązane  z elektronami  d lub 
/.  Może  to  być  jedno,  jak  jia  rys.  2,  lub  więcej  pasm. 
Jeżeli  energia  fali  elektromagnetycznej  będzie  równa 
różnicy  energii  między  pasmem  walencyjnym  i pas- 
mem d lub  fr  lub  różnicy  między  d czy  / a pasmem 
przewodnictwa  (rys.  2),  wówczas  taka  fala  może  być 
silnie  absorbowana,  mimo  że  jej  energia  jest  znacznie 
mniejsza  od  energetycznej  szerokości  pasma  wzbro- 
przykład : nionego.  Na  rys.  7 przedstawiono  absorpcję  we  fluorku 
fluorek  europu  w zależności  od  energii  fali  padającej.  Piki 
europu  oznaczone  numerami  od  / do  6 odpowiadają  różni- 
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Rys.  7.  Widmo  absorpcji  dla  cienkiej  monokrystalicznej  warstwy 
fluorku  europu  (EuF,)  w temperaturze  20  K 

com  energii  pomiędzy  pasmem  walencyjnym  a ko- 
lejnymi stanami  elektronów  powłoki  / europu.  Od- 
powiedni rysunek  struktury  gęstości  stanów  zawie- 
rałby więc  sześć  pików  gęstości  stanów  w przerwie 
energetycznej,  a nie  jeden  jak  na  rys.  2.  Struktura 
widma  absorpcji  fluorku  europu  jest  stosunkowo  pro- 
sta i łatwa  do  interpretacji.  Należy  jednak  pamiętać, 
że  nie  wszystkie  możliwe  do  wyobrażenia  przejścia 
optyczne  są  dozwolone;  różnią  się  one  ponadto  na- 
tężeniem linii  absorpcyjnych,  regułami  polaryzacji  itp. 
Warto  zauważyć,  że  takie  czynniki,  jak : natężenie  linii, 
ich  przesuwanie  się  w funkcj  i temperatury  czy  ciśnie- 
nia, reguły  polaryzacji,  są  bezpośrednią  wskazówką 
ułatwiającą  identyfikację  przejścia  optycznego.  Na 
rys.  7 warto  zwrócić  uwagę  na  wartość  współczynnika 
absorpcji  dla  przejść  6 i 7.  Są  to  bardzo  duże  wartości 
obserwowane  na  ogół  w zwykłych  półprzewodnikach 
dla  przejść  międzypasmowych,  co  dodatkowo  kom- 


plikuje eksperyment  i może  prowadzić  do  mylnej  in- 
terpretacji. 

Związki  europu  wykazują  również  charakterystycz- 
ną anomalię  przesuwania  się  krawędzi  absorpcji  w 
stronę  niższych  energii,  gdy  temperatura  maleje 
i kryształ  zaczyna  się  porządkować  magnetycznie. 
Podobny  efekt  powoduje  przyłożenie  zewnętrznego 
pola  magnetycznego. 


Półprzewodniki  półmagnetyczne 

Materiały,  o których  będzie  mowa,  mieszczą  się  w 
grupie  półprzewodników  magnetycznych  i obie  de- 
finicje podane  na  wstępie  doskonale  się  do  nich  sto- 
sują. Nazwa  półprzewodniki  półmagnetyczne  została 
użyta  niejako  eksperymentalnie,  ponieważ  będzie  mo- 
wa o grupie  materiałów  jeszcze  słabo  zbadanych,  ale 
o bardzo  ciekawych  własnościach.  Będziemy  pod  tą 
nazwą  rozumieli  stopy  półprzewodników  z magne- 
tykami, ale  o raczej  niewielkiej,  najwyżej  kilkunasto- 
procentowej  zawartości  materiału  magnetycznego. 

W tego  typu  materiałach  powinny  dominować  włas- 
ności półprzewodnikowe,  a własności  magnetyczne 
będą  istnieć  niejako  na  drugim  planie. 

Dotychczas  półprzewodnikami  magnetycznymi  na- 
zywaliśmy magnetyki  o pewnych  własnościach  cha- 
rakterystycznych dla  półprzewodników.  Natomiast 
półprzewodniki  półmagnetyczne  są  to  półprzewodniki 
o pewnych  własnościach  charakterystycznych  dla 
magnetyków.  Materiałów  o takich  cechach  może  być  stopy  poł- 
bardzo  wiele,  ponieważ  prawie  każdy  półprzewodnik  przewodni- 
może  tworzyć  stopy  z różnymi  magnetykami.  Można  ków  z mag- 
sobie  wyobrazić  ogromną  liczbę  materiałów  zarówno  netykamn 
o szerokiej  przerwie  energetycznej  i dużym  oporze, 
jak  np.  stopy  ZnS-MnS,  CdSe-MnSe,  CdTe-MnTe 
itd.,  a także  materiały  o małej,  a nawet  zerowej  przer- 
wie energetycznej  i małym  oporze,  jak  np.  InSb-MnSb, 

HgTe-MnTe,  HgTe-FeTe.HgSe-MnSe  itp.  W stopach 
mamy  możliwość  ciągłej  i płynnej  zmiany  koncentra- 
cji atomów  odpowiedzialnych  za  magnetyczne  włas- 
ności materiału.  Daje  to  zarówno  możliwość  stopnio- 
wej zmiany  własności  półprzewodnika,  jak  również 
szanse  regulacji  tych  własności.  Dotychczas  opubli- 
kowano niewiele  prac  na  temat  własności  półprze- 
wodników półmagnetycznych,  można  jednak  oczeki- 
wać jakościowo  i ilościowo  nowych  efektów  fizycz- 
nych. Przede  wszystkim  zewnętrzne  pole  magnetyczne 
powinno  silnie  wpływać  na  własności  tych  materia- 
łów, zarówno  na  własności  obserwowane  w efektach 
transportu  prądu,  jak  i efektach  optycznych.  Można 
się  spodziewać  nowych  oddziaływań  elektronów, 
plazmonów  czy  fononów  z falami  spinowymi,  czy 
'magnonami  (->  Wzbudzenia  elementarne  w ciele  sta- 
łym). Powinny  również  wystąpić  pewne  modyfikacje 
w strukturze  energetycznej.  Patrząc  od  strony  magne- 
tyków, mamy  możliwość  zmiany  typów  oddziaływań 
spinowych,  co  oczywiście  jest  związane  bezpośrednio 
z koncentracją  magnetyka  w stopie.  Otwiera  się 
nowa  dziedzina  w fizyce  ciała  stałego,  która  może 
przynieść  nie  tylko  głębszą  wiedzę  o mechanizmach 
istniejących  oddziaływań  i strukturach  krystalicznych, 
ale  również  - nowe,  a nawet  rewelacyjne,  praktyczne 
zastosowania  tego  typu  materiałów. 

S.  Methfessel,  D.  C.  Mattis  Magnet ic  Semiconductors,  Ber- 
lin 1968  (ros.  Moskwa  1972). 


Struktura  elektronowa  ciał  stałych 

Waldemar  Gorzkowski 


Badanie  struktury  elektronowej  za  pomocą  metod 
mechaniki  kwantowej  stanowi  jedno  z najważniejszych 
zagadnień  fizyki  ciała  stałego,  a w szczególności  fizyki 
metali,  półprzewodników  i izolatorów*.  Wykorzystuje 


się  przy  tym  charakterystyczną  budowę  wewnętrzną 
ciał  krystalicznych.  W rezultacie  otrzymuje  się  war- 
tości dozwolonych  poziomów  energetycznych  zgru- 
powanych w pasma.  Mimo  wyjaśnienia  podstawo- 
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wych  problemów  związanych  ze  strukturą  elektrono- 
wą i mimo  licznych  sukcesów  tej  teorii,  nadal  istnieje 
wiele  zagadnień  nie  rozwiązanych,  głównie  z powodu 
trudności  rachunkowych.  Ścisły  opis  układu  cząstek 
stanowiących  makroskopowe  ciało  stałe,  tj.  elektro- 
nów i jąder  atomowych,  wymagałby  ułożenia  i roz- 
wiązania równania  (w  opisie  kwantowym)  lub  układu 
równań  (w  opisie  klasycznym)  zawierającego  liczbę 
zmiennych  porównywalną  z liczbą  Avogadra  (ok. 
6 TO23).  Jest  to  niewykonalne  nawet  przy  użyciu  naj- 
potężniejszych maszyn  liczących  i dlatego  stosuje  się 
uproszczenia  umożliwiające  otrzymanie  rozwiązań 
przybliżonych. 

Wiele  ze  stosowanych  przybliżeń  ma  tę  własność, 
że  ich  jakość  jest  tym  lepsza,  im  więcej  cząstek  zawiera 
rozpatrywany  układ  fizyczny.  Nie  jest  to  cecha  wy- 
jątkowa. Na  przykład  rozpatrując  gaz  w naczyniu 
operujemy  takimi  pojęciami,  jak  ciśnienie,  tempera- 
tura, entropia  itd.,  które  tym  lepiej  opisują  układ, 
im  więcej  cząsteczek  gazu  on  zawiera  — gdyby  w na- 
czyniu było  tylko  kilka  cząsteczek,  posługiwanie  się 
wymienionymi  pojęciami  byłoby  mało  sensowne,  na- 
leżałoby wtedy  każdą  cząsteczkę  opisywać  oddzielnie, 
uwzględniając  jej  oddziaływanie  z innymi  cząsteczka- 
mi i ze  ściankami  naczynia. 

przybliżenie  Wspomnianą  własność  ma  również  stosowane  naj- 
jedno-  częściej  przybliżenie  zwane  przybliżeniem  jednoelek- 
elektrcnowe  tronowym.  Można  je  odnosić  zarówno  do  bezposta- 
ciowych ciał  stałych,  jak  i do  ciał  krystalicznych. 
W przybliżeniu  tym  zakłada  się,  że  ruch  każdego 
elektronu  walencyjnego  można  opisać  niezależnie 
przyjmując,  że  porusza  się  on  w pewnym  polu  po- 
tencjalnym V(r)  (r  — wektor  położenia),  niezależnym 
od  stanu  rozpatrywanego  elektronu.  Potencjał  ten  jest 
wytwarzany  przez  pozostałe  elektrony  walencyjne 
oraz  rdzenie  atomowe,  czyli  jądra,  wraz  z elektronami 
niewalencyjnymi.  Strukturę  elektronową  bezpostacio- 
wych ciał  stałych  bada  się  od  niedawna  i nie  wiadomo 
jeszcze,  jakie  metody  postępowania  okażą  się  naj- 
owocniejsze. W odniesieniu  do  ciał  krystalicznych 
metody,  oparte  na  przybliżeniu  jednoelektronowym, 
są  podstawowymi  metodami  badawczymi. 

Oprócz  przybliżenia  jednoelektronowego  do  bada- 
nia struktury  elektronowej  coraz  częściej  stosuje  się 
metody  teorii  wielu  ciał,  czyli  metody  uwzględniające 
wzajemne  oddziaływanie  wszystkich  elektronów  wa- 
lencyjnych. Tego  rodzaju  opis  wielociałowy  jest  znacz- 
nie trudniejszy  od  opisu  jednoelektronowego  i nie 
stosuje  się  go  tak  powszechnie.  Istnieją  jednak  zja- 
wiska, których  nie  można  wyjaśnić  za  pomocą  opisu 
jednoelektronowego  (np.  zjawisko  nadprzewodnictwa, 
którego  istotę  udało  się  wyjaśnić  dopiero  za  pomocą 
ujęcia  wielociałowego,  — ► Nadprzewodnictwo). 

Dla  niektórych  ciał  krystalicznych  przybliżoną 

postać  potencjału  V(r ) można  wyznaczyć  korzysta- 
jąc z mniej  lub  bardziej  uzasadnionych  założeń  mo- 
delowych. Czasami  jest  to  wystarczające,  jednak  dla 

żadnego  kryształu  nie  znamy  takiej  postaci  V(r), 
która  umożliwiałaby  pełny  opis  podstawowych  jego 
własności.  Mimo  tej  trudności  wiele  zagadnień  daje 
się  rozwiązać  dzięki  symetrii  kryształów  i związanej 

z nią  symetrii  potencjału  V(r). 

Rozmiary  rzeczywistych  kryształów  (rzędu  mili- 
metrów) są  wielokrotnie  większe  od  stałej  sieci  (kilka 
angstremów).  Z tego  względu  na  ogół  pomija  się  zja- 
wiska powierzchniowe  związane  z istnieniem  po- 
wierzchni kryształu  (->  Stany  powierzchniowe  w cia- 
łach stałych)  i przyjmuje,  że  kryształ  jest  nieskończony, 
warunki  Czasami  na  rozpatrywany  kryształ  nieskończony  na- 
Borrra-  kłada  się  dodatkowo  warunki  Boraa-Karmana.  Jest  to 
Karmasia  równoważne  założeniu,  że  cały  nieskończony  kryształ 
jest  zbudowany  z okresowo  powtarzających  się  w 
przestrzeni  makroskopowych  segmentów,  z których 
każdy  jest  równoważny  badanemu  kryształowi  rze- 
czywistemu. Jeżeli  rzeczywisty  kryształ  jest  kostką 
o wymiarach  x N^a2  x Nzaz,  gdzie  al9  a2  i az  są 
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stałymi  sieci,  a Nu  N2  i Nz — bardzo  dużymi  liczbami 
naturalnymi,  to  warunki  Borna-Karmana  oznaczają 
po  prostu,  że  dja  dowolnej  wielkości  fizycznej  9 za- 
chodzi związek: 

9(x,y,  z)  = ?{x-n1N1auy-\-n2N2a2y  z+nzNzaz, ), 

gdzie  nu  n2  i nz  są  dowolnymi  liczbami  całkowity- 
mi. 

Przy  badaniu  struktury  elektronowej  kryształów 
najważniejsza  okazuje  się  ich  symetria  translacyjna, 
tj.  fakt,  że  kryształ  ma  budowę  mikroskopową  okre- 
sowo powtarzającą  się  w przestrzeni,  co  można  wy- 
razić następującym  związkiem  spełnianym  przez  po- 
tencjał krystaliczny  V(r): 

V(r+  nxax  + n2a2  -f  nzaz)  = V(r), 

gdzie  aly  a2  i az  są  wektorami  charakterystycznymi  dla 
danej  sieci  krystalicznej,  a nly  n2  i nz  — dowolnymi 
liczbami  całkowitymi.  Zauważmy,  że  o ile  w wypadku 
warunków  Borna-Kńrmana  chodziło  o makrosko- 
pową symetrię  dowolnej  wielkości  fizycznej  9,  o tyle 
w wypadku  symetrii  translacyjnej  istotna  jest  mikro- 
skopowa symetria  konkretnej  wielkości  fizycznej  — 

potencjału  krystalicznego  K(r). 

Z symetrii  translacyjnej  wynika,  że  stacjonarne 
funkcje  falowe  elektronu  w krysztale  są  modulowany- 
mi falami  płaskimi  postaci  (tzw.  twierdzenie  Blocha): 

V~k 'Cr ) = u~k(r )eł'*r , ( 1 ) 

gdzie  k jest  wektorem  falowym,  a u~k(r) — funkcją 
modulującą  mającą  taką  samą  symetrię  przestrzenną 

jak  potencjał  V(r).  Czynnik  e1^  = cosk7+  isinkr 
reprezentuje  falę  płaską  zapisaną  za  pomocą  liczb 
zespolonych  (czynnik  zawierający  czas  w zagadnie- 
niach stacjonarnych  nie  występuje  i został  pominięty). 

Zgodnie  z mechaniką  kwantową  wszystkie  infor- 
macje o układzie  fizycznym,  w danym  wypadku  o elek- 
tronie w krysztale,  są  zawarte  w równaniu  Schródin- 
gera.  Przyjmując,  że  funkcje  falowe  będące  rozwiąza- 
niami równania  Schrodingera  mają  postać  (1),  z rów- 
nania tego  uzyskuje  się  równanie  wyznaczające  po- 
stać funkcji  iik(r ) oraz  dozwolone  wartości  energii. 
Ogólnym  wnioskiem  z tego  rodzaju  rozważań  jest  to, 
że  dozwolone  energie  E elektronów  w krysztale  są 

funkcjami  wektora  falowego  k.  Wyznaczenie  kon- 
kretnej zależności  E(k)  wymagałoby  rozwiązania 
otrzymanego  równania. 

W granicznym  przypadku  tzw.  pustej  sieci  przyj - 
mujesię,  że  potencjał  krystaliczny  V zależy  od  wekto- 
ra położenia  r,  ale  bardzo  słabo.  Można  wtedy  przy- 
jąć, że  K(r)  jest  stałe  (lub  równe  zeru  przy  odpo- 
wiednim wyborze  punktu  zerowego  dla  potencjału), 
a mimo  to  ma  symetrię  taką  jak  kryształ,  a nie  taką, 
jal^rzeczywiście  zupełnie  pusta  przestrzeń.  Zależność 

E{k)  ma  wtedy  postać: 

E{k)  = &k*j2my 

gdzie  h = h/ln  (h  — stała  Plancka),  m — masa  elek- 
tronu. 

Jak  wiadomo  z mechaniki,  energia  E i pęd  p cząstki 
swobodnej  związane  są  zależnością 

E — p2!2m. 

Zatem  wielkość  hk  odgrywa  rolę  analogiczną  do  pędu 
w mechanice.  Podobieństw  między  wektorem  hk  a pę- 
dem jest  więcej  i z tego  względu  hic  nazwano  kwazi- 
pędem. 

Zależność  energii  E od  wektora  falowego  k trakto- 
wana jako  jednoznaczna  funkcja  k (mogącego  przyj- 
mować dowolne  wartości)  na  ogół  nie  jest  funkcją 
ciągłą.  Bliższe  badania  tej  zależności  wskazują,  że  gdy 


potencjał 

krystaliczny 


twierdzenie 

Blocha 


dozwolone 

wartości 

energie 


kwazipęd 

elektronu 


V(r)  ź const,  to  wartość  E dla  pewnych  wartości  k 
może  zmieniać  się  skokowo. 

Nieciągłości  funkcji  E(k)  mogą  występować  tylko 
dla  tych  kt  które  spełniają  związek : 


gdzie 


7*  K K'1 
k~2  = 4’ 


K — lxbt  -f-/2^2~ł"^3  » 


= 2n 


a2xaz 

&i(&2  X 0%) 


bo  = 2k  — 


azxa  i 


ax{a2  x az) 


ai  X a*  . 
ax{a2  x az) 


ll9  /2  i /3  oznaczają  liczby  całkowite. 

Powierzchnie,  na  których  mogą  występować  nie- 

strefy  ciągłości  funkcji  E(k ) rozbijają  przestrzeń  wektora  k 
Brillouina  na  rozłączne  obszary  zwane  strefami  Brillouina. 

(Przez  przestrzeń  wektora  k rozumie  się  trójwymiaro- 
wą przestrzeń  euklidesową,  w której  na  trzech  karte- 
zjańskich  osiach  współrzędnych  odłożono  kx , ky  i kz). 

Strefa  zawierająca  punkt  k = (0,  0, 0)  nazywa  się 
pierwszą  strefą  Brillouina,  strefa  z nią  sąsiadująca 

nazywa  się  drugą  strefą  Brillouina,  it<^.  Wektory  bl9  b2 
i bz  nazywają  się  wektorami  podstawowymi  sieci  od- 
wrotnej, zaś  wektor  K — wektorem  sieci  odwrotnej. 
Wszystkie  strefy  Brillouina  mają  jednakową  objętość 
i każdą  z nich  można  uważać  za  pewną  komórkę  ele- 
mentarną sieci  odwrotnej.  Innymi  słowy,  całą  sieć 
odwrotną  można  otrzymać  z pierwszej  strefy  Brillou- 
ina przez  jej  równoległe  przesuwanie.  To  samo  odnosi 
się  do  drugiej,  trzeciej  i dalszych  stref  Brillouina. 
Strefy  Brillouina  o różnych  numerach  mają  różne 
kształty.  Spośród  wszystkich  stref  wyróżnia  się  pierw- 
sza. W odróżnieniu  od  innych  strefa  ta  jest  jednospój- 
na,  tzn.  składa  się  tylko  z jednej  części.  Każda  inna 
strefa  Brillouina  składa  się  z kilku  oddzielnych 
części. 

W przypadku  kryształu  nieskończonego  bez  nało- 
żonych warunków  Borna-Karmńna  wektory  falowe  k 


warunki  na 
wektory 
falowe 


mogą  przyjmować  dowolne  wartości.  Innymi  słowy  k 
może  się  zmieniać  w sposób  ciągły.  Nałożenie  warun- 
ków Borna-Kśrmńna,  czyli  uwzględnienie  skończo- 
nych rozmiarów  kryształu,  połączone  z pominięciem 
zjawisk  powierzchniowych,  jest  równoważne  nałoże- 
niu na  k pewnych  warunków.  Warunki  te  mogą  być 

spełnione  tylko  dla  niektórych  wektorów  k.  W rezul- 
tacie dla  kryształu  z nałożonymi  warunkami  Borna- 

Karmana  wektory  k mogą  przyjmować  tylko  dy- 
skretne (nieciągłe)  wartości,  np.  dla  kryształu  skoń- 
czonego mającego  kształt  równoległościanu  o kra- 
wędziach Lx  = Ntal9  Lz  = N2a2  i Lz  = N& 3 wektory  k 
mogą  przyjmować  wartości  dane  wzorem: 


2k  2n  2n 

Nia~n"  Ntat  "A W"3!’ 


(2) 


gdzie  nl9  n2  i nz  są  dowolnymi  liczbami  całkowitymi. 

Wektorom  k należącym  do  pierwszej  strefy  Brillouina 
odpowiadają  wtedy  wartości  nl9  n2  i nz  spełniające 
nierówności : 

- Ni/2  ^ m < Nt/2. 


Liczba  różnych  wektorów  falowych  w każdej  ze  stref 
Brillouina  jest  jednakowa  i wynosi  AfxAf2Af3,  czyli  jest 


równa  liczbie  komórek  elementarnych  w krysztale. 

Dla  każdego  wektora  k2  z drugiej  (trzeciej,  czwar- 
tej itd.)  strefy  Brillouina  można  znaleźć  taki  wektor 

kx  z pierwszej  strefy  Brillouina,  że  różnica  k2—kx  bę- 
dzie jednym  z wektorów  sieci  odwrotnej  K.  Funkcje 
falowe  yik(r)  odpowiadające  wektorom  k różniącym 
się  o wektor  K różnią  się  jedynie  postacią  funkcji 
«*(r).  W związku  z tym  stany  stacjonarne  elektronów 

w krysztale  można  opisywać  wartością  k z pierwszej 
strefy  Brillouina  (zredukowany  wektor  falowy)  uwa- 
żając Uk(r ) za  wieloznaczną  funkcję  r,  a E(k)  za  wielo- 
znaczną funkcję  k.  Innymi  słowy,  przy  ograniczeniu 
obszaru  zmienności  wektora  k do  pierwszej  strefy 
Brillouina,  każdej  wartości  r odpowiada  więcej  niż 
jedna  wartość  «£(/*),  a każdej  wartości  k — więcej  niż 
jedna  wartość  E{k).  Dokładniejsza  analiza  wskazuje, 
że  wieloznaczną  funkcję  E(k)  określoną  w całej  prze- 
strzeni wektora  k można  traktować  jako  zespół  jedno- 
znacznych funkcji  ciągłych  En{k)  określonych  dla  k 
z pierwszej  strefy  Brillouina,  numerowanych  para- 
metrem n o wartościach  naturalnych.  Mówimy,  że 
parametr  n numeruje  pasma  energetyczne,  czyli  po- 
szczególne gałęzie  funkcji  E(k). 

Kształt  stref  Brillouina  zależy  od  symetrii  transla- 
cyjnej  sieci  krystalicznej.  Na  rys.  1 pokazano  kształt 
pierwszej  i drugiej  strefy  Brillouina  dla  sieci  regularnej 
płasko  i przestrzennie  centrowanej.  Na  rys.  2 poka- 
zano zależność  energii  od  wektora  falowego  dla  pustej 


zredukowany 

wektor 

falowy 


pasma  ener- 
getyczne 


ksrtsłt  stref 
BriSSouina 


Rys.  1.  Pierwsza 
i druga  strefa  Bril- 
louina dla  sieci  re- 
gularnej: a)  płasko 
centrowanej,  b) 
przestrzennie  cen- 
trowanej b) 


druga  strefa  pierwsza  strefa  druga  strefa 
Brillouinna  Brillouinna  Brilloumna 


Rys.  2.  Zależność  E(k)  dla  pustej  sieci.  Niebieska  parabola  od- 
powiada niezredukowanemu  wektorowi  k.  Po  zredukowaniu 
wektora  k do  pierwszej  strefy  Brillouina  funkcja  E{k)  określona 

dla  k spełniających  warunek  - nja  ^ k <.  n/a  staje  się  funkcją 
wieloznaczną  (czarne  linie).  W przypadku  pustej  sieci  dozwolone 
są  wszystkie  wartości  E ^ E0 
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sieci,  a na  rys.  3 dla  bardziej  realistycznego,  cho- 
ciaż również  fikcyjnego  przypadku,  gdy  sieć  nie  jest 

pusta.  Przykład  rzeczywistej  zależności  En(k)  przed- 
stawiono na  rys.  4. 


E(k) 

\l  i\ 

/ ' / 

/ \ \ $ trzecie  pasmo 

/'  | | / energii  dozwolonych 

/ ! I / (n-3) 

energie  wzbronione 

/ 

1 \ 1 / 
i \ 1 / 

1 \ ! / 

\ | / drugie  pasmo 

\ / energii  dozwolonych 

\ / <n-2> 

• 

ą'{_H 

energie  wzbronione 

...  

pierwsze  pasmo 
energii  dozwolonych  (/?  = 1) 

-2  r./a  -r./a  0 r/a  2 r/a  k 


Rys.  3.  Przykład  zależności  E(k ) dla  V(r)  * const.  Widzimy, 
że  na  granicach  stref  Brillouina  pojawiły  się  nieciągłości  funkcji 

E(k).  Niebieskim  kolorem  zaznaczono  zależność  E(k)  dla  nie- 
zredukowancgo  wektora  falowego  (wtedy  E jest  jednoznaczną 

funkcją  k).  Po  zredukowaniu  k do  pierwszej  strefy  Brillouina  E 

staje  się  wieloznaczną  funkcją  k rozpadającą  się  na  kilka  jed- 
noznacznych gałęzi  ciągłych  numerowanych  parametrem  n.  Jak 
widać  z rysunku,  dozwolone  energie  elektronów  mogą  leżeć  tyl- 
ko wewnątrz  pewnych  przedziałów  oddzielonych  obszarami 
energii  wzbronionych,  tj.  energii,  których  nie  może  mieć  elektron 
w stanie  stacjonarnym.  Szerokość  pasma  energii  wzbronionych 
między  pasmem  walencyjnym  a pasmem  przewodnictwa  nazy- 
wa się  przerwą  energetyczną  (Eg) 


n - 3 O 


Hi  » 


Rys.  5.  Stany  ener- 
getyczne atomu 


Rys.  4.  Zależność  energii  E od 
zredukowanego  wektora  falo- 
wego k dla:  a)  krzemu 

i b)  germanu.  Ze  względu  na 
niemożliwość  pokazania  za- 
leżności E od  k przebiegające- 
go całą  trójwymiarową  strefę 
Brillouina  pokazano  jedynie 

zależność  E(k)  dla  k leżących 
na  kilku  liniach  zaznaczonych 
na  rys.  c)  przedstawiającym 
pierwszą  strefę  Brillouina  dla 
germanu  i krzemu 


W przytoczonym  opisie  kwantowym  nie  uwzględ- 
niono własnego  momentu  pędu  elektronu,  tj.  spinu. 
Wprowadzenie  tej  wielkości  podwaja  liczbę  pasm, 
lecz  nie  zmienia  zasadniczego  kształtu  teorii.  Nadal 
ważne  jest  stwierdzenie,  że  dozwolone  energie  elektro- 
nów mogą  leżeć  tylko  wewnątrz  pewnych  obszarów 
oddzielonych  przerwami  energetycznymi  i że.  stany 
elektronów  wewnątrz  tych  pasm  można  „numero- 
wać” za  pomocą  wektora  falowego  k. 

Sytuacja  w kryształach  pod  pewnymi  względami 
przypomina  sytuację  w atomach  i cząsteczkach.  Na 
przykład  w atomie  (rys.  5)  główna  liczba  kwantowa  n 
numeruje  poszczególne  poziomy  energetyczne,  zaś 
stany  elektronów  odpowiadające  danemu  n różnią  się 


wartością  liczb  kwantowych  orbitalnej  liczby  kwan- 
towej / = 0,  J,  2, ...,  /i,  magnetycznej  liczby  kwanto- 
wej m = 0,  ±1,  ±2, ...,  ±/  i spinowej  liczby  kwan- 
towej s = ±72-  W krysztale  liczba  n numeruje  pasma, 

zaś  wektor  k charakteryzuje  stany  wewnątrz  pasma. 

Dla  kryształu  skończonego  liczba  różnych  stanów 
elektronowych  w paśmie,  czyli  liczba  różnych  dozwo- 
lonych wartości  k w pierwszej  strefie  Brillouina  równa 
jest  NtN2Nz>  tj.  liczbie  komórek  elementarnych  w fliczba  stanów 
krysztale.  2 doświadczenia  wiadomo,  że  szerokość  efektreno- 
pasm  energetycznych,  tj.  różnica  między  najwyższą  wych 
i najniższą  energią  elektronów  w danym  paśmie,  jest  w paśmie 
rzędu  1 eV.  Wynika  stąd,  że  różnice  energii  między 
kolejnymi  poziomami  energetycznymi  w paśmie  są 
rzędu  10~23  eV  (dla  kryształu  skończonego).  Szerokość 
strefy  Brillouina  w kierunku  równoległym  do  osi  Xi 
wynosi  2tt jau  Odległości  między  kolejnymi  dozwolo- 
nymi wektorami  k w tym  kierunku  wynoszą  2n/NiOit 
czyli  stanowią  — z grubsza  biorąc — jedną  dziesię- 
ciomilionową  część  szerokości  strefy  (1  /M  » l/(liczba 
Avogadra)  1/3  ^ 10~7).  Widać,  że  stany  elektronowe 

w krysztale  skończonym  w przestrzeni  wektora  k są 
położone  bardzo  gęsto.  Dzięki  temu  nawet  w przy- 
padku kryształu  skończonego  można  postępować  tak, 
jak  postępuje  się  w przypadku  kryształu  nieskończo- 
nego bez  nałożonych  warunków  Borna-Karmana, 
tzn.  można  przyjąć,  że  wewnątrz  pasma  każda  ener- 
gia jest  dozwolona,  a wewnątrz  pierwszej  strefy 

Brillouina  dozwolone  są  wszystkie  wartości  k.  Inny- 
nń  słowy,  można  przyjąć,  że  dopuszczalne  wartości  E 
i k zmieniają  się  w sposób  ciągły,  a nie  dyskretny. 

Warto  w tym  miejscu  wyjaśnić  rolę  warunków  Bor-  irola  warun-  < 
na-Karmana.  Fizyczne  znaczenie  tych  warunków  zo-  ków  Borna-  ^ 
stało  już  omówione  poprzednio.  Natomiast  z matema-  barmana 
tycznego  punktu  widzenia  nałożenie  warunków  Bor- 
na-Karmana prowadzi  do  tego,  że  zbiory  dopuszczal- 
nych wartości  E i k stają  się  zbiorami  dyskretnymi. 

Bez  tych  warunków  zarówno  Ejak  i k zmieniałyby  się 
w sposób  ciągły.  Ponieważ  nawet  w przypadku  dy- 
skretnym w praktyce  stosuje  się  opis  ciągły  ze  względu 
na  fakt,  że  sąsiednie  wartości  dyskretne  są  bardzo 
bliskie  siebie,  mogłoby  się  wydawać,  że  nakładanie 
warunków  Borna-Karmana  niczego  nie  daje.  Tak 
jednak  nie  jest.  Często  bowiem  zdarza  się,  że  ważna 
jest  liczba  stanów  w paśmie.  Wiedząc  np.  jaka  jest 
liczba  elektronów  walencyjnych  przypadających  na 
jedną  komórkę  elementarną,  znając  liczbę  komórek 
elementarnych  w krysztale  i wiedząc,  ile  stanów 
„mieści  się”  w poszczególnych  pasmach,  bez  trudu 
można  obliczyć  (uwzględniając  zakaz  Pauliego),  ile 
najniższych  pasm  jest  zapełnionych  przez  elektrony. 

Obliczenia  takie  przy  ciągłej  zmienności  E i k są 
znacznie  mniej  przejrzyste. 

Gęstość  prawdopodobieństwa  Qk(r)  znalezienia  zależność 
elektronu  w punkcie  danym  wektorem  r jest  równa 
kwadratowi  wartości  bezwzględnej  funkcji  rp~k(r)  lub 
funkcji  uk(r)  (-*  Chemia  kwantowa): 

Qk(r)  = iy^WI2  = \uk(r)  |2. 

Dla  elektronów  walencyjnych  funkcja  o^(r) zazwy- 
czaj ma  wartości  istotnie  różne  od  zera  w całej  ko- 
mórce elementarnej,  a więc  i w całym  krysztale  (funk- 
cja Qh(r)  ma  taką  samą  symetrię  translacyjną  jak  po- 
tencjał krystaliczny  F(r)).  Elektrony  walencyjne  nie 
są  więc  zlokalizowane  w określonych  punktach  prze- 
strzeni, np.  przy  atomach,  lecz  są  rozmyte  po  całym 
krysztale.  Sytuację  taką  mamy  w większości  substan- 
cji o praktycznym  znaczeniu,  chociaż  nie  musi  to 
zawsze  być  prawdą.  Wydaje  się,  że  substancją,  dla 

której  funkcja  ęlć(r)  ma  wartość  istotnie  różną  od 
zera  tylko  w części  komórki  elementarnej  jest  bor. 
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Dopuszczalne  wartości  energii  całkowitej  elektro- 
nów En{k ) są  „numerowane’'  parametrem  dyskretnym 
n,  wskazującym  pasmo,  oraz  parametrem  ciągłym  lub 

„prawie  ciągłym”  k , nie  zależą  natomiast  od  położenia 

elektronów  w krysztale  opisywanego  wektorem  r. 
zależność  Gdybyśmy  więc  chcieli  zrobić  wykres  dopuszczalnych 

energii  E od  r,  to  dla  każdej  dozwolonej  wartości  E 
otrzymalibyśmy  poziomą  kreskę.  Kreski  odpowiada- 
jące wszystkim  wartościom  E,  jakie  mogą  przyjmować 
całkowite  energie  elektronów,  tworzą  pasma  pokazane 
na  rys.  6.  Rysunki  tego  rodzaju  są  uboższe  niż  wy- 


energie 

wzbronione 


energie 

wzbronione 


Rys.  6.  Pasma  energe- 
tyczne w ciele  stałym 

kresy  przedstawiające  E w zależności  cd  n i k.  Uwi- 
docznione są  na  nich  jedynie  zakresy  energii  przyjmo- 
wane przez  elektrony  w poszczególnych  pasmach  i nic 
poza  tym.  W szczególności  nie  należy  sądzić,  że  jeśli 
w paśmie  mamy  tylko  jeden  elektron,  to  może  on 
„przemieszczać”  się  w nim  swobodnie,  bo  „ma  dużo 
miejsca”.  Argumentacja  taka,  często  spotykana  przy 
omawianiu  urządzeń  półprzewodnikowych  takich,  jak 
tranzystory,  diody  itp.  (zwłaszcza  w opracowaniach 
o charakterze  popularnym),  jest  bardzo  sugestywna, 

. f - ale  nieprawdziwa.  Dla  stanów  stacjonarnych  gęstość 

prawdopodobieństwa  znalezienia  elektronu  w punkcie 

* energii  #\  czyli  wielkość  Qk(r ) nie  zależy  od  czasu,  a więc 
o żadnym  ruchu  w zwykłym  znaczeniu  nie  może  być 
mowy.  W wykorzystywanych  w praktyce  materiałach 
często  zdarza  się,  że  istotnie  w paśmie  pustym  elek- 
tron walencyjny  może  się  przemieszczać  stosunkowo 
swobodnie.  Uzasadnienie  tego  jest  jednak  dość  zło- 
żone i odwoływanie  się  tylko  do  intuicyjnych  wyobra- 
żeń na  ogół  zawodzi.  Konieczny  jest  tu  ścisły  opis 
kwantowy  i traktowanie  elektronu  jako  paczki  falo- 
wej, czyli  pewnej  kombinacji  stanów  stacjonarnych. 
Okazuje  się,  że  o możliwości  poruszania  się  elektronu 
w paśmie  decyduje  nie  tylko  liczba  elektronów  w paś- 
mie lecz  i inne  wielkości,  np.  stopień  nakładania  się 
funkcji  falowych  o różnych  wartościach  wektora  fa- 
lowego k itp.  Mogą  zdarzać  się  przypadki,  gdy  mimo, 
że  pasmo  jest  słabo  obsadzone,  swoboda  ruchu  elek- 
tronów jest  mała.  Trudno  jest  ustalić  tu  bezwzględnie 
obowiązującą  regułę.  Z grubsza  biorąc  można  jednak 

powiedzieć,  że  im  funkcje  Qk(r)  są  bardziej  rozmyte, 
tym  swoboda  ruchu  elektronów  jest  większa  (stany 
zdelokalizowane).  Odwrotnie  — funkcjom  wyraźnie 
zlokalizowanym  w jakimś  obszarze  na  ogół  odpowie- 
da  mała  swoboda  ruchu  elektronów  (stany  zlokalizo- 
wane). 

W temperaturze  0 K elektrony  zajmują  najniższe 
stany  energetyczne.  Liczba  stanów  w paśmie  jest 
równa  liczbie  komórek  elementarnych  w krysztale, 
pasmo  Tego  samego  rzędu  jest  też  liczba  elektronów  walen- 
walencyjne  cyjnych  kryształu.  Najwyższe  pasmo  zawierające 
i pasmo  elektrony  nazywamy  pasmem  walencyjnym,  zaś  pasmo 
przewodni-  Jeżące  nad  nim  — pasmem  przewodnictwa  lub  pas- 
ctwa  mem  przewodzenia.  W zależności  od  sposobu  obsa- 
dzenia i wzajemnego  położenia  pasm  oraz  od  swobody 
ruchu  elektronów  kryształy  dzieli  się  na  izolatory, 
półprzewodniki  i metale. 

W izolatorach  i czystych  półprzewodnikach  w tem- 
izolatory  peraturze  0 K niższe  pasmo  (walencyjne)  obsadzone 


całkowicie  elektronami  jest  oddzielone  od  zupełnie 
pustego  pasma  wyższego  (przewodnictwa)  przerwą 
energetyczną  (rys.  7).  W paśmie  pustym  nie  ma  co  się 


Rys.  7.  Struktura 
pasmowa  izolato- 
rów i półprzewod- 
ników samoistnych 
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poruszać,  zaś  w paśmie  całkowicie  obsadzonym  elek- 
trony zajmują  wszystkie  możliwe  stany  (o  wszystkich 

wartościach  k ) i też  nie  mogą  się  poruszać  (zmieniać 
stanu).  Tak  więc  w temperaturze  0 K ani  izolatory  ani 
półprzewodniki  nie  mogą  przewodzić  prądu  elek- 
trycznego. Między  izolatorami  i czystymi  półprze-  pó|przevvot|- 
wodnikami,  czyli  półprzewodnikami  samoistnymi, 
nie  ma  różnicy  jakościowej.  Jest  jedynie  różnica  iloś-  samojstne 
ciowa.  Gdy  przerwa  energetyczna  jest  dostatecznie 
mała,  to  w zwykłych  temperaturach  wskutek  wzbu- 
dzeń termicznych  część  elektronów  z pasma  walencyj- 
nego przechodzi  do  pasma  przewodnictwa. 

Jeżeli  stany  są  zdelokalizowane  (ruch  elektronów 
jest  wtedy  w dużym  stopniu  swobodny),  to  przez  przy- 
łożenie zewnętrznego  pola  elektrycznego  łatwo  wywo- 
łać przepływ  prądu  i mamy  półprzewodnik. 

W izolatorach  przerwa  energetyczna  jest  na  tyle 
duża,  że  termiczne  przejścia  elektronów  z pasma  wa- 
lencyjnego do  pasma  przewodnictwa  są  prawie  nie- 
możliwe, bądź  stany  elektronowe  są  silnie  zlokalizo- 
wane. W pierwszym  wypadku  brak  jest  nośników  ła- 
dunku, natomiast  w drugim  ruch  nośników  jest  bar- 
dzo utrudniony  (przyjęło  się  dość  arbitralnie  uważać 
za  izolatory  materiały  o przerwie  energetycznej  więk- 
szej od  2,5-3  eV). 

W metalach  najwyższe  pasmo  zawierające  niezło-  meta|e 
kalizowane  eletrony  jest  zapełnione  częściowo  lub 
też  zachodzi  nakładanie  pasma  walencyjnego  na  puste 
pasmo  przewodnictwa.  W obu  wypadkach  możliwy 
jest  ruch  elektronów  i przepływ  prądu  (rys.  8). 
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Rys.  8.  Struktura  pasmowa  metali 
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Omówiona  wyżej  struktura  elektronowa  odnosisię 
do  idealnych  kryształów  nie  zawierających  ani  do- 
mieszek, ani  defektów  budowy  sieci  krystalicznej. 

W rzeczywistości  sytuacja  taka  nigdy  się  nie  zdarza. 

Idealny  kryształ  musiałby  mieć  entropię  równą  zeru,  wpływ 
a to  dla  żadnej  temperatury  różnej  od  0 K nie  jest  pomiesŁek 
możliwe.  Uwzględnienie  domieszek  i defektów  w e derektow 
krysztale  prowadzi  do  wniosku,  że  w strukturze  elek- 
tronowej kryształu  powinny  pojawić  się  dodatkowe 
poziomy  energetyczne.  Szczególnie  ważne  okazują  się 
dwa  rodzaje  poziomów  domieszkowych  leżące  we- 
wnątrz przerwy  energetycznej:  poziomy  donorowe 
w pobliżu  dna  pasma  przewodnictwa  i poziomy  akcep- 
torowe w pobliżu  wierzchołka  pasma  walencyjnego. 
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Dh  poziomów  odpowiadających  domieszkom  lub 
defektom  budowy  gęstość  prawdopodobieństwa  zna- 
lezienia elektronu  o (r)  jest  istotnie  różna  od  zera  tylko 
w pewnym  obszarze  wokół  defektu  lub  domieszki. 
Tego  rodzaju  stany  zlokalizowane  zaznaczamy  zwykle 
za  pomocą  linii  przerywanej  (rys.  9).  Przy  dużej  kon- 
centracji domieszek  lub  defektów  obszary  odpowia- 
dające różnym  od  zera  wartościom  różnych  funkcji 
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Rys.  9.  Poziomy  dono- 
rowe i akceptorowe 


mo~  fys.  10.  Gdy  atomy  są  od  siebie  bardzo  oddało-  rozszczepie- 
ne  (duża  odległość  międzyatomowa  d),  rozszczepienie  nie  pozśo- 
poziomów  jest  bardzo  małe,  a funkcje  falowe  są  silnie  mów 
zlokalizowane.  W miarę  zmniejszania  d następują 


Rys.  10.  Powstawanie  pasm  energetycznych  z atomowych  po- 
ziomów energetycznych ; d stała  sieci,  d 0 wartość  stałej  sieci  w kry- 
ształach rzeczywistych  3 


pasma  do- 
mieszkowe 


«(r)  zaczynają  się  nakładać.  Stany  domieszkowe  prze- 
stają wtedy  być  stanami  zlokalizowanymi  i powstaje 
wąskie  pasmo  domieszkowe. 

Zazwyczaj  poziomy  donorowe  lub  akceptorowe 
odpowiadają  domieszkom,  mogą  one  jednak  powsta- 
wać również  wskutek  występowania  defektów  budo- 
wy sieci  krystalicznej,  np.  dyslokacji. 

Poziomy  donorowe  i akceptorowe  z reguły  bardzo 
silnie  wpływają  na  własności  elektryczne  kryształów. 
Przez  odpowiednie  domieszkowanie  ni  ektórym  izola- 
torom można  nadać  własności  półprzewodzące. 

Powstawanie  pasm  energetycznych  można  wyjaśnić 
w inny  sposób.  Sposób  ten  jest  bardziej  poglądowy, 
nie  stanowi  jednak  wygodnej  podstawy  do  wykony- 
wania niezbędnych  obliczeń  ilościowych.  W sieci 
utworzonej  z N komórek  elemetarnych  znajduje  się  N 
jednakowych,  jednakowo  rozmieszczonych  atomów. 
Gdyby  poszczególne  atomy  nie  oddziaływały  ze  sobą, 
to  każdy  prosty  poziom  elektronowy  atomu  byłby 
jY-krotnie  zwyrodniały.  W rzeczywistości  atomy  od- 
działują ze  sobą  — w przeciwnym  wypadku  nie  utwo- 
rzyłyby kryształu.  Oddziaływanie  to  znosi  zwyrod- 
nienie: każdy  A^-krotnie  zwyrodniały  poziom  roz- 
szczepia się  na  N pojedynczych  poziomów  leżących 
bardzo  blisko  siebie  i tworzących  prawie  ciągłe  pas- 


coraz  większe  rozszczepienia  poziomów,  a jednocześ- 
nie funkcje  falowe  elektronów  stają  się  coraz  bardziej 
zdelokalizowane. 

Parametry  struktury  pasmowej,  czyli  wielkości  parametry 
pozwalające  określić  położenie  i kształt  funkcji  En(k),  struk*ury 
można  w zasadzie  obliczyć  znając  potencjał  V(r).  pasmowei 
Jest  to  jednak  skomplikowane  i częściowo  udało  się 
tylko  w kilku  przypadkach.  Zazwyczaj  strukturę  pas- 
mową konkretnych  ciał  krystalicznych  wyznacza  się 
metodami  półempiiycznymi : na  podstawie  rozważań 
teoretycznych  definiuje  się  pewne  parametry,  a kon- 
kretne wartości  tych  parametrów  przyjmuje  się  tak, 
aby  przewidywane  wartości  mierzalne  były  zgodne* 
z doświadczeniem  dla  możliwie  szerokiej  klasy  zja- 
wisk. Szczególnie  cenne  są  tu  dane  z doświadczeń 
optycznych.  Badanie  krawędzi  absorpcji  oraz  natężeń 
przejść  optycznych  między  rozmaitymi  stanami 
pozwala  wyznaczyć  wielkości  przerw  energetycznych 
oraz  kształt  pasm  w pobliżu  ekstremów  funkcji 
En(k). 


AJ.  ANSELM  W Step  do  teorii  półprzewodników.  Warszawa  1967* 
Fizyka  :,awisk  elektronowych  w metalach  i półprzewod- 
nikach, Warszawa  1973,  C.  Kittel  Wstęp  do  fizyki  ciała  stałego. 
Warszawa  1970;  Ch.A.  Wert,  R.M.  Thomson  Fizyka  ciała 
stałego.  Warszawa  1974. 


Dynamika  elektronu  w ciałach 
stałych  (kryształach) 

Waldemar  Gorzkowski 


prędkość 

elelcfronu 


Ruch  elektronu  w przestrzennie  okresowym  polu  kry- 
stalicznym, związanym  z okresowa  budowa  kryształu 
podlega  nieco  innym  prawom  niż  ruch  elektronu  swo- 
bodnego. Prawa  dynamiki  elektronu  w krysztale  za- 
zwyczaj staramy  się  formułować  w sposób  nawiązu- 
jący do  praw  mechaniki  klasycznej,  używając  języka 
podobnego  do  języka  zwykłej  mechaniki.  Prawa  te 
wyprowadza  się  z praw  mechaniki  kwantowej.  Są 
one  słuszne  z pewnymi  ograniczeniami  i dotyczą 
zwykle  wielkości  uśrednionych  po  obszarze  komórki 
elementarnej,  np.  mówiąc  o prędkości  elektronu  mamy 
na  myśli  średnią  prędkość  elektronu  w komórce  ele- 
mentarnej. Prędkość  tę  wyraża  wzór: 


- 1 - 
v =jl  gra d*  En(k)  = 


1 

h 


te  *”<*>’ 


(o 


O , , c o o 

symbole  ^ . - , — oznaczają  pochodne  fun- 

kcji,  która  po  nich  następuje,  po  odpowiednich  zmien- 
nych, przy  założeniu,  że  pozostałe  zmienne  mają  usta- 
lone wartości  (pochodne  cząstkowe) ; fi  = h/2n(h— sta- 

ła  Plancka) ; En(k)  oznacza  energię  elektronu  z n-tego 

pasma  (w  stanie  stacjonarnym)  w punkcie  ~k  strefy 
Brillouina  (-►  Struktura  elektronowa  ciał  stałych), 
gdy  na  kryształ  nie  oddziałują  pola  zewnętrzne.  Okreś- 
lona wyżej  średnia  prędkość  elektronu  jest  prędkością 
grupową  tal  Blocha  w /r-tym  paśmie. 

Gdy  sieć  jest  pusta  zależność  E{k)  opisuje  wzór: 

E = h2kz!2m. 

Prędkość  v jest  wtedy  dana  wzorem: 

v — — hk. 
m 
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W rzeczywistych  kryształach  zależność  E{k)  jest  bar- 
dziej złożona  i wyrażenia  na  v się  komplikują. 

W odniesieniu  do  wielkości  średnich  podstawowe 
prawa  dynamiki  elektronów  opisujące  zmiany  kwa- 

zipędu  hk , energii  E i prędkości  v elektronu  pod  wpły- 
wem makroskopowego  pola  elektrycznego  ć i magne- 
tycznego H można  sformułować  w sposób  przypomi- 
nający klasyczne  prawa  ruchu : 


{hk)  = —eĆ  — — (v x H), 

. dt  , c (2) 

pochodna  siła  pocho-  siła  pochodząca 

kwazipędu  dząca  od  poła  od  pola  magne- 
elektrycznego  tycznego 


pochodna 

energii 


d - 


dt 


v 


przyśpie- 

szenie 


— eć  v (vxH)v> 

c 

siła  razy  prędkość 


rŹ>xH); 

m*  cm* 
stosunek  siły  do  masy 


(3) 

(4) 


e oznacza  tu  bezwzględną  wartość  ładunku  elektronu, 
masa  a m*  nosi  nazwę  krzywiznowej  masy  efektywnej.  Po- 
efektywna  dane  wyżej  równania  odnoszą  się  do  przypadku,  gdy 

energia  E zależy  tylko  od  wartości  wektora  k,  a nie 
zależy  od  jego  kierunku.  Pasma  takie  nazywamy  pa- 
pasma  smarni  sferycznymi.  Krzywiznowa  masa  efektywna, 
sferyczne  a ściślej  biorąc  jej  odwrotność,  dana  jest  wzorem: 


1 1 B2E(k)  (5) 

m*  h*  dk 2 


pasma 
paraboliczne 


Analizując  wzory  (2)-(5)  należy  zwrócić  uwagę  na 
następujące  sprawy:  1)  W równaniach  mamy  masę 
efektywną  a nie  masę  spoczynkową  elektronu  mQ. 
Jest  to  bardzo  istotna  różnica,  gdyż  wielkości  te 
mogą  się  od  siebie  różnić  nawet  o 2-3  rzędy.  Dla 
wielu  metali  masa  efektywna  m * jest  prawie  równa 
masie  elektronu  swobodnego  m0.  Natomiast  dla  in- 
nych substancji  na  ogół  zdarza  się  to  dość  rzadko. 
(Wartość  masy  efektywnej  m*  można  uzyskać  z czę- 
stości cyklotronowej  badając  ruch  elektronu  w ze- 
wnętrznym polu  magnetycznym;  — ► Metale).  2)  Jeżeli 

funkcja  En{k)  jest  liniową  funkcją  kz,  to  masa  efek- 
tywna m * jest  wielkością  stałą,  niezależną  od  k 
(a  więc  i od  energii  E).  Pasma  o takiej  zależności 

E{k)  nazywają  się  pasmami  parabolicznymi.  W in- 
nych wypadkach  masa  efektywna  zależy  od  energii 
elektronu. 

Gdy  pasma  są  niesferyczne,  tj.  gdy  E zależy  nie 

tylko  od  wartości  wektora  ky  lecz  i od  jego  kierunku, 
układ  równań  (2)-{4)  należy  nieco  zmodyfikować. 
Pierwsze  dwa  pozostają  nadal  ważne.  Natomiast 
równanie  (4)  przyjmuje  postać: 


dvj 

~~dt 


i 


U i = y>  *• 
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Wielkość  (1  fm*)a  nazywa  się  tensorem  odwrotności 
masy  efektywnej.  Wielkość  ta  jest  określona  wzorem: 


1 dzE(k)  . . 


(5') 


Dyskusja  wzoru  (5')  w ogólnej  postaci  nie  jest  wy- 
godna. Zazwyczaj  dobierając  odpowiedni  układ 
anizotropo-  współrzędnych  tensor  odwrotności  masy  efektywnej 
wcść  masy  sprowadza  się  na  podstawie  pewnych  reguł  prze- 
efektywnej  kształcania  tensorów  do  szczególnie  prostej,  tzw. 


diagonalnej  postaci,  w której  wielkości  (1  }m*)n  dla 
i # j są  równe  zeru;  różne  od  zera  są  wtedy  tylko 
trzy  wielkości : {l(m*)lu  (l/m*)22,  (1  //Z7*c)33. 

We  wspomnianym  wyżej  układzie  współrzędnych, 
zwanym  układem  osi  głównych  tensora  odwrotności 
masy  efektywnej,  ruch  elektronu  w każdym  z trzech 
kierunków  równoległych  do  osi  współrzędnych  od- 
bywa się  niezależnie,  chociaż  dla  każdego  z tych  kie- 
runków elektron  ma  na  ogół  inną  masę  efektywną. 
W praktyce  często  zdarza  się,  że  dwie  spośród  trzech 
mas  efektywnych  są  równe.  Na  ich  oznaczenie  sto- 
suje się  symbol  m±.  Trzecią  masę  oznacza  się  wtedy 
symbolem  j»n.  Anizotropowy  charakter  masy  efek- 
tywnej jest  przyczyną  występowania  rozmaitego  ro- 
dzaju efektów,  których  nie  obserwuje  się  w wypadku 
elektronów  swobodnych.  Na  przykład  przyłożenie 
pola  elektrycznego  do  kryształu  o paśmie  niesferycz- 
nym  może  powodować  przepływ  elektronów  w kie- 
runku skośnym  do  kierunku  pola  (pojawia  się  wtedy 
napięcie  poprzeczne  w krysztale). 

Osobliwością  masy  efektywnej  jest  to,  że  może  ona 
być  ujemna.  Ujemnej  masie  efektywnej  odpowiada, 
mówiąc  językiem  mechaniki  klasycznej,  przyspie- 
szenie w kierunku  przeciwnym  do  kierunku  działa- 
nia siły.  Z różnych  względów  wygodniej  jest  wówczas 
mówić  o dziurach  zamiast  o elektronach,  czyli  o czą- 
stkach mających  dodatni  ładunek  i dodatnią  masę 
efektywną.  Wielkości  te  co  do  wartości  bezwzględnej 
są  równe  odpowiednim  wartościom  dla  elektronu. 

Zdarza  się,  że  spośród  trzech  mas  efektywnych 
charakteryzujących  pasmo  niesferyczne  np.  tylko 
jedna  jest  dodatnia  a dwie  ujemne.  Wtedy  tylko  w jed- 
nym kierunku  elektron  zachowuje  się  jak  cząstka  o do- 
datniej masie. 

Jak  widać  z dotychczasowych  rozważań,  przyspie- 
szenie elektronu  określone  jako  dv/dt  nie  musi  być 
równoległe  do  siły  zewnętrznej.  Nieizotropowość 
masy  efektywnej  i nierównoległość  przyspieszenia  do 
siły  zewnętrznej  biorą  się  stąd,  że  bariery  potencjału, 
na  które  napotyka  elektron  w swym  ruchu,  w róż- 
nych kierunkach  krystalograficznych  są  różne.  Warto 
przy  tym  zwrócić  uwagę,  że  w równaniach  (2)-(4) 
nie  występują  w postaci  jawnej  siły  wewnętrzne  zwią- 
zane z istnieniem  pola  krystalicznego.  Siły  te  jednak 
zostały  w tych  równaniach  uwzględnione  w postaci 
niejawnej  właśnie  w masie  efektywnej.  Gdyby  pole 
krystaliczne  nie  zostało  uwzględnione,  to  w równa- 
niach występowałaby  masa  elektronu  swobodnego 
m0  a nie  m*. 

Zależność  En(k)  w rzeczywistych  kryształach  może 
być  bardzo  zawiła.  Zwykle  najbardziej  interesują  nas 

jedynie  ekstrema  funkcji  En{k)y  a konkretnie  maksima 
pasma  walencyjnego  i minima  pasma  przewodnictwa, 
bowiem  obsadzenie  pasm  wokół  tych  punktów  jest 
szczególnie  podatne  na  zmiany  temperatury  i innych 

czynników.  Ekstrema  En{k)  nie  muszą  występować 
w środku  strefy.  W germanie  i krzemie  maksimum 

energii  pasma  walencyjnego  odpowiada  k — 0 
(środek  strefy),  natomiast  minima  pasma  przewod- 
nictwa w krzemie  znajdują  się  wewnątrz,  w germa- 
nie — na  brzegu  strefy  Brillouina. 

W minimach  wartość  drugiej  pochodnej  jest  do- 
datnia, a w maksimach  — ujemna.  W odniesieniu  do 

funkcji  En(k ) oznacza  to,  że  minimom  pasma  prze- 
wodnictwa odpowiada  dodatnia  masa  efektywna 
elektronów.  Podobnie  maksimom  pasma  walencyj- 
nego odpowiada  ujemna  masa  efektywna  elektro- 
nów. W częściowo  obsadzonych  (np.  wskutek  wzbu- 
dzeń termicznych)  pasmach  przewodnictwa  elektrony 
zajmują  przede  wszystkim  stany  najniższe,  tj.  w po- 
bliżu minimum  (ewentualną  nadwyżkę  energii  elek- 
trony tracą  wskutek  różnego  rodzaju  efektów  roz- 
proszeniowych na  domieszkach,  na  drganiach  sie- 
ci itp.).  W związku  z tym  elektrony  w paśmie  prze- 
wodnictwa mają  zwykle  dodatnią  masę  efektywną. 
Inaczej  sprawa  przedstawia  się  z pasmem  walencyj- 
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nym.  Pasmo  to  jest  prawie  całkowicie  wypełnione. 
Niewielka  część  elektronów  wskutek  wzbudzeń  ter- 
micznych opuściła  to  pasmo  przechodząc  do  pasma 
przewodnictwa  i w pobliżu  wierzchołka  pasma  mamy 
stany  nieobsadzone.  W obszarach  strefy  Brillouina, 
w których  stany  elektronowe  są  obsadzone,  zmiany 
stanu  elektronów  są  utrudnione  ze  względu  na  zasadę 
Pauliego.  Stan  mogą  zmieniać  na  ogół  tylko  te  elek- 
trony, które  znajdują  się  w pobliżu  stanów  nieobsa- 
dzonych,  a więc  te,  które  znajdują  się  w pobliżu  wierz- 
chołka pasma.  W tym  wypadku  masa  efektywna  elek- 
tronów jest  ujemna.  W zewnętrznych  polach  elek- 
trycznych i magnetycznych  nieobsadzone  stany  elek- 
tronowe zachowują  się  jak  pewne  cząstki  o dodatnim 
ładunku  elektrycznym.  Cząstki  te  przyjęto  nazywać 
dziurami.  Dzięki  wprowadzeniu  pojęcia  dziury,  za- 
miast mówić  o paśmie  prawie  całkowicie  zapełnio- 
nym przez  elektrony,  wygodnie  jest  mówić  o paśmie 
prawie  pustym,  zawierającym  niewielką  liczbę  dziur. 
Bliższa  analiza  wskazuje,  że  dziurze  po  elektronie 
o ujemnej  masie  efektywnej  należy  przypisać  dodat- 
nią masę  efektywną  i odwrotnie.  Należy  jednak  pod- 
kreślić, że  pole  elektryczne  bądź  magnetyczne  nie  od- 
działuje na  puste  miejsca  po  elektronach,  ale  na  same 
elektrony.  Wprawdzie  przy  posługiwaniu  się  opisem 
za  pomocą  dziur  zapominamy  o elektronach  zapeł- 
niających pasmo,  jednakże  należy  sobie  zdawać 
sprawę,  że  własności  tych  elektronów  określają  wła- 
sności dziur,  ich  ładunek,  masę  efektywną  itd.  Często 
spotykany  pogląd,  że  dziura  to  miejsce  po  zwykłym 
elektronie,  jest  niezupełnie  poprawny.  Istotnie  dziura 
o dodatniej  masie  efektywnej  jest  miejscem  po  elek- 
tronie, ale  po  elektronie  o ujemnej  masie  efektywnej. 

W pasmach  sferycznych,  dla  k bliskich  wartości 
ekstremalnej,  zależność  energii  od  k jest  paraboliczna, 

ale  przy  k bardziej  odległych  — pasmo  przestaje  być 
paraboliczne.  Nieparaboliczność  pasm  zaobserwo- 
wano np.  w InSb,  InAs,  HgTe  itp.  W wielu  interesu- 
jących substancjach  zależność  E od  k dla  pasma  prze- 
wodnictwa daje  się  opisać  wzorem  (przykład  pasma 
nieparabolicznego) : 


Eg  oznacza  tu  szerokość  przerwy  energetycznej, 
a m*  — masę  efektywną  na  dnie  pasma  przewod- 
nictwa. 

Warto  tu  zwrócić  uwagę,  że  zależność  (6)  jest  po- 
dobna do  zależności  między  pędem  i energią  elektro- 
nów swobodnych  w mechanice  relatywistycznej.  Pełne 
podobieństwo  odpowiednich  wzorów  otrzymuje  się 
przez  następujące  przyporządkowanie: 

m*  m0,  Eff  -►  2/WoC2 

(c  — prędkość  światła).  Analogia  ta,  mimo  że  jest 
czysto  formalna  i nie  niesie  głębszych  treści,  często 
może  ułatwić  zrozumienie  zjawisk  dotyczących  wspo- 
mnianych substancji  osobom,  które  są  obyte  ze  szcze- 
gólną teorią  względności. 

Przy  badaniu  dynamiki  elektronów  w pasmach  sfe-  pędowa  masa 
rycznych  oprócz  krzywiznowej  masy  efektywnej  m*  efektywna 
często  wprowadza  się  pędową  masę  efektywną  m** 
określoną  wzorem  : 

hk  — m**v. 

kwazipęd  analog 
pędu 

Masa  pędowa  m**  nie  musi  być  równa  i często  nie 
jest  równa  masie  krzywiznowej  m*y  ponieważ  zwią- 
zek hk  — m*v  na  ogół  nie  zachodzi.  Masę  m**  można 
wyrazić  następująco : 

I 1 \ dEnlc 

m**  ~~  h*  k dk  * 

Dla  pasm  parabolicznych  m*  = m *♦.  Dla  pasm  opi- 
sanych zależnością  (6)  zachodzi  związek: 


Masa  pędowa,  podobnie  jak  masa  krzywiznowa,  może 
zależeć  od  energii  elektronu. 

Masa  m **  jest  wielkością,  która  odgrywa  rolę  we 
wszystkich  zjawiskach  transportu  nośników  oraz 
w zjawiskach  optycznych.  Oprócz  zasygnalizowanych 

tu  kilku  rodzajów  zależności  En(k)  istnieje  wiele  in- 
nych ciekawych  typów  pasm,  jednak  nie  wszystkie 
z nich  są  dostatecznie  zbadane  i nie  wszystkie  mają 
praktyczne  znaczenie. 

Bibliografia  — ► Struktura  elektronowa  ciał  stałych. 


Dynamika  sieci  krystalicznej 

V/acław  Nazar ewicz 


Podstawową  własnością  odróżniającą  stan  krysta- 
liczny od  innych  stanów  (gazowego,  ciekłego,  amor- 
ficznego) jest  periodyczna  struktura  przestrzenna, 
periodyczna  Przy  opisie  tej  struktury  korzystamy  z pojęcia  sieci 
struktura  krystalicznej.  Rozróżniamy  czternaście  typów  prze- 
przestrzenna  strzennych  sieci  krystalicznych,  zwanych  sieciami 
Bravais’go.  Węzły  sieci  reprezentują  położenie  iden- 
tycznych atomów  lub  grupy  atomów  (jonów).  Moż- 
liwość przyporządkowania  węzłom  sieci  różnych  grup 
atomów  prowadzi  do  dużej  liczby  odrębnych  struktur 
krystalicznych  (-*  Budowa  kryształów). 

Dzięki  własności  periodyczności  przestrzennej  (sy- 
metrii translacyjnej)  można  w krysztale  rozpatrywać 
tylko  pewien  ograniczony  obszar,  zwany  komórką 
elementarną.  Przez  odpowiednie  powtarzanie  ko- 
mórki elementarnej  w trzech  kierunkach  otrzymuje 
się  cały  kryształ,  który  stanowi  zbiór  olbrzymiej 
liczby  takich  komórek.  Określenie  kształtu  komórki 
elementarnej  oraz  rodzaju  i położenia  wchodzących 
w jej  skład  atomów  daje  pełny  opis  własności  struk- 
turalnych kryształu.  Dane  te  można  uzyskać  metodą 
dyfrakcji  promieniowania  rentgenowskiego. 

Rodzaj  struktury  krystalicznej,  jaki  ma  dana  sub- 
stancja, zależy  od  natury  oddziaływań  między  atoma- 

544 


mi.  Ze  względu  na  te  oddziaływania  wyodrębniamy 
cztery  zasadnicze  grupy  kryształów:  kryształy  kowa- 
lencyjne, jonowe,  metaliczne  i molekularne  (tutaj  nie 
rozpatrywane).  Wielkość  oddziaływań  charaktery- 
zuje energia  wiązania,  która  przybiera  wartości 
w przedziale  od  dziesiątych  części  eV  do  kilku  eV 
na  atom. 

Oddziaływanie  między  atomami  w krysztale  można  oddziaływa- 
opisać  używając  funkcji  energii  potencjalnej.  Funkcja  nia  między 
ta  osiąga  minimum,  gdy  atomy  znajdują  się  w ściśle  atomami 
określonych  położeniach  względem  siebie.  Położenia 
te  są  położeniami  równowagi. 

Przy  opisie  niektórych  własności  kryształów  można 
z powodzeniem  przyjąć  model  statyczny,  który  za- 
kłada, że  atomy  są  nieruchome.  Założenie  to  jest  jed- 
nak idealizacją.  W rzeczywistości  atomy  zawsze  wy- 
konują małe  oscylacje  wokół  swoich  położeń  równo- 
wagi, których  amplituda  zależy  od  temperatury. 

Oscylacje  te  nazywamy  drganiami  sieci  krystalicznej. 

Drgania  sieci  krystalicznej  odgrywają  ważną  rolę 
w wielu  procesach  zachodzących  w ciałach  stałych. 

Uwzględnienie  drgań  sieci  jest  niezbędne  przy  roz- 
patrywaniu własności  cieplnych  kryształów,  jak  ciepło  drgania  sieci 
właściwe,  przewodnictwo  i rozszerzalność  cieplna,  krystalicznej 


Spośród  wielu  innych  zjawisk,  które  zależą  od  drgań 
sieci,  wymienimy  tylko  rozpraszanie  elektronów  w me- 
talach i półprzewodnikach  oraz  absorpcję  promie- 
niowania podczerwonego  w dielektrykach  i półprze- 
wodnikach. 


Podstawowe  przybliżenia 

Kryształ  można  rozpatrywać  jako  układ  złożony 
z dwóch  rodzajów  cząstek:  jąder  atomowych  i elek- 
tronów. Między  tymi  cząstkami  zachodzą  oddziały- 
wania elektrostatyczne  typu  kulombowskiego.  Wed- 
ług mechaniki  kwantowej  stan  kryształu  opisuje 
funkcja  falowa,  która  jest  rozwiązaniem  równania 
Schrodingera  dla  układu  omawianych  cząstek.  Funk- 
cja ta  zależy  zarówno  od  współrzędnych  jąder  ato- 
mowych, jak  i współrzędnych  elektronów  (->  Struk- 
tura elektronowa  ciał  stałych). 

przybliżenie  U podstaw  teorii  ciała  stałego,  a tym  samym  i teorii 
adiabatyczne  dynamiki  sieci  krystalicznej,  leży  przybliżenie  adia- 
batyczne, które  pozwala  rozpatrywać  ruch  jąder  ato- 
mowych i ruch  elektronów'  osobno.  Inaczej  mówiąc, 
stosując  przybliżenie  adiabatyczne,  można  opisać 
stan  kryształu  za  pomocą  iloczynu  dwóch  funkcji  fa- 
lowych, z których  jedna  zależy  tylko  od  współrzęd- 
nych jąder  atomowych,  druga  — od  współrzędnych 
elektronów. 

Przybliżenie  adiabatyczne  stanie  się  zrozumiałe, 
gdy  zwrócimy  uwagę  na  znaczną  różnicę  mas  jąder 
i elektronów,  a co  za  tym  idzie  — również  różnicę 
prędkości  ruchu  tych  cząstek.  Jądra  atomowe  są 
znacznie  cięższe  od  elektronów  i w związku  z tym  po- 
ruszają się  znacznie  wolniej.  Przy  zmianie  położenia 
jąder  atomowych  w krysztale  prawie  natychmiast 
ustala  się  rozkład  przestrzenny  elektronów,  odpowia- 
dający nowym  położeniom  jąder.  Z jednej  strony  moż- 
na więc  rozpatrywać  ruch  elektronów  w polu  poten- 
cjalnym nieruchomych  jąder  (w  ten  sposób  postępuje 
się  m.in.  przy  badaniu  struktury  pasmowej  kryszta- 
łów), z drugiej  zaś  strony  przy  rozpatrywaniu  ruchu 
jąder  atomowych  ważne  są  nie  chwilowe  położenia 
elektronów,  ale  pole  powstające  na  skutek  ich  śred- 
niego przestrzennego  rozkładu.  Pole  to  jest  w pełni 
określone  przez  współrzędne  jąder  atomowych. 

W teorii  kwantowej  drgań  sieci  krystalicznej  przy- 
bliżenie adiabatyczne  pozwala  rozpatrywać  równanie 
Schrodingera  zależne  tylko  od  współrzędnych  jądro- 
wych. Przy  badaniu  drgań  sieci  w ramach  mechaniki 
klasycznej  przybliżenie  adiabatyczne  umożliwia  przed- 
stawienie oddziaływań  międzyatomowych  przy  użyciu 

funkcji  energii  potencjalnej  £/(/?),  która  zależy  tylko 
od  współrzędnych  jąder  atomowych. 

Pomimo  wyeliminowania  współrzędnych  elektro- 
nowych otrzymanie  funkcji  energii  potencjalnej  U(R) 
w konkretnej  postaci  nie  jest  rzeczą  łatwą.  Zakładamy 
jednak,  że  funkcję  tę  można  rozwinąć  w szereg  potę- 
gowy względem  odchyleń  atomów  od  położeń  rów- 
nowagi u = R — R0  (gdzie  R0  oznacza  położenie  rów- 
nowagi) : 

U = U0+Au+Bu2-rCu3-{-  ..., 

czyli 

U = U0+Ux+U2+Uz  + ...  (1) 

Współczynniki  A,  B , C,  ...  zawierają  odpowiednio 
pierwszą,  drugą  itd.  pochodną  energii  potencjalnej 
obliczoną  w położeniu  równowagi. 

Pierwszy  wyraz  w rozwinięciu  jest  energią  poten- 
cjalną układu  nieruchomych  atomów  znajdujących 
się  w położeniu  równowagi.  Wyraz  ten  nie  odgrywa 
roli  w zagadnieniach  dynamiki  sieci  krystalicznej. 

Wyraz  Ux  przedstawia  liniową  zależność  energii 
potencjalnej  od  odchylenia  atomów  od  położeń  rów- 
nowagi. Jest  on  równy  zeru,  gdyż  pierwsza  pochodna 
w minimum  funkcji  jest  równa  zeru.  Wyraz  U2  repre- 


zentuje zależność  kwadratową  energii  potencjalnej 
od  odchyleń  atomów  od  ich  położeń  równowagi. 

Ograniczenie  rozwinięcia  funkcji  energii  potencjalnej 
do  wyrazu  U2  stanowi  istotę  tzw.  przybliżenia  harmo-  przybliżenie 
nicznego.  Sens  tego  przybliżenia  w wypadku  dwóch  harmoniczne 
atomów  ilustruje  rys.  1,  który  przedstawia  rzeczywi- 
sty i przybliżony  (paraboliczny)  kształt  funkcji  energii 
potencjalnej.  W krysztale  energia  potencjalna  pocho- 
dzi od  oddziaływań  wielu  atomów.  Funkcja  energii 
potencjalnej  przedstawia  złożoną  powierzchnię  w wie- 
lowymiarowej przestrzeni. 


położenia  równowagi  R0.  Linia  niebieska  odpowiada  przybliżeniu 
harmonicznemu 

Funkcja  U w przybliżeniu  harmonicznym  zadowa- 
lająco opisuje  oddziaływania  międzyatomowe  wtedy, 
gdy  odchylenia  atomów  od  położeń  równowagi  są 
małe  w porównaniu  z odległościami  między  atomami. 
Z wyjątkiem  niektórych  kryształów  warunek  ten  jest 
stosunkowo  dobrze  spełniony  w niezbyt  wysokich 
temperaturach.  W wielu  kryształach  w temperaturze 
pokojowej  odchylenia  atomów  nie  przekraczają 
0,1  A,  co  stanowi  tylko  kilka  procent  odległości  mię- 
dzyatomowych. 


Równania  ruchu 

Wiele  problemów  dynamiki  sieci  krystalicznej  można 
rozwiązać  posługując  się  metodami  mechaniki  kla- 
sycznej. Punktem  wyjścia  są  newtonowskie  równania 

ruchu  (ma  = F),  w których  występują  masy,  przy- 
spieszenia i siły.  Równania  tego  typu  należy  napisać 
dla  każdego  atomu  w sieci  krystalicznej.  Jest  oczy- 
wiste, że  ze  względu  na  dużą  liczbę  atomów  w krysz- 
tale musimy  wprowadzić  odpowiednie  oznaczenia, 
które  pozwolą  te  atomy  rozróżniać.  Najodpowied- 
niejszym sposobem  określenia  atomu  jest  podanie 
numeru  komórki  elementarnej,  w której  on  się  znaj- 
duje, oraz  numeru  atomu  w komórce  elementarnej. 

Po  tych  wyjaśnieniach  wprowadzimy  następujące 
oznaczenia  niezbędne  do  dalszych  rozważań:  ms  — 

masa  atomu  j,  R0(ls ) — położenie  równowagi  atomu 

s znajdującego  się  w komórce  elementarnej  /,  u(ls ) — 

jego  odchylenie  od  położenia  równowagi,  t — czas, 

a,/?  — zbiór  trzech  współrzędnych  kartezjańskich  klasyczne 

x , y,  z . Klasyczne  równania  ruchu  w przybliżeniu  równania 

harmonicznym  mają  postać:  ruchu 

m = £ Bat  Os,  l's')  «,(/V) . (2) 

ai  l's' 

ap 

Lewa  strona  równania  jest  iloczynem  masy  i przy- 
spieszenia atomu  ( Is)9  prawa  — przedstawia  silę 
działającą  na  ten  atom  pochodzącą  od  wszystkich 
pozostałych  atomów  (/V).  Siła  ta  zależy  liniowo  od 
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stale  odchyleń  poszczególnych  atomów  od  położeń  równo- 
siłowe  wagi.  Współczynniki  Ban(ls,  Vs 0 noszą  nazwę  stałych 
siłowych.  Wyrażają  się  one  przez  drugą  pochodną 
energii  potencjalnej  względem  odchyleń  atomów  od 
położeń  równowagi,  obliczoną  w położeniu  równo- 
wagi. W doskonałym  krysztale  symetria  translacyjna 
powoduje,  że  stałe  siłowe  zależą  tylko  od  różnicy 
wskaźników  / i /',  a nie  zależą  od  ich  wartości  wzię- 
tych osobno. 

Liczba  równań  w układzie  (2)  wynosi  3rN , gdzie  N 
oznacza  liczbę  komórek  elementarnych,  r — liczbę 
atomów  w jednej  komórce.  Wartość  ta  pokrywa  się 
z liczbą  stopni  swobody  wszystkich  atomów  w krysz- 
tale. Opisanie  drgań  sieci  w makroskopowej  próbce 
krystalicznej  objętości  1 cm3  wymaga  olbrzymiej  licz- 
by równań  ruchu,  rzędu  1Q23. 

Warto  zauważyć,  że  prawa  strona  każdego  równa- 
nia w układzie  (2)  składa  się  z dużej  liczby  wyrazów 
opisujących  oddziaływania  międzyatomowe.  Zwykle 
oddziaływania  te  silnie  maleją  ze  wzrostem  odleg- 
łości między  atomami.  Można  to  wykorzystać  do 
znacznego  zmniejszenia  liczby  rozpatrywanych  wy- 
razów. 

Istotna  trudność,  jaką  przedstawia  zapisany  układ 
równań,  wynika  z faktu,  że  każde  równanie  zawiera 
odchylenia  wszystkich  atomów.  Inaczej  mówiąc,  rów- 
nania w układzie  (2)  są  wzajemnie  powiązane.  Z fi- 
zycznego punktu  widzenia  oznacza  to,  że  odchyleniu 
dowolnego  atomu  w krysztale  od  położenia  równo- 
wagi towarzyszy  odchylenie  innych  atomów.  Ruch 
atomów  w krysztale  ma  zatem  charakter  kolektyw- 
ny. 

współrzędne  W teorii  drgań  sieci  krystalicznej  wykazuje  się,  że 
normalne  2^^  w(/s)  można  wprowadzić  nowe  zmienne  Qi, 
które  usuwają  niedogodną  własność  układu  (2),  po- 
legającą na  wzajemnym  powiązaniu  równań.  Nowy 
układ  równań  składa  się  z 3rN  niezależnych  równań 
postaci: 

-^rr-  +«>?G«  = 0 0-1,2, ... , 3/W).  (3) 


Równania  tego  typu  są  dobrze  znane.  Opisują  one 
ruch  niezależnych  oscylatorów  harmonicznych.  Roz- 
wiązania ich  zawierają  harmoniczną  zależność  od 
czasu: 

Qi  = (4) 

co » — częstość  własna  oscylatora.  W każdym  równa- 
niu w układzie  (3)  występuje  teraz  tylko  jedna  zmien- 
na Qi,  którą  nazywamy  współrzędną  normalną. 

Można  wykazać,  że  w doskonałym  krysztale,  po- 
siadającym symetrię  translacyjną,  każdy  oscylator 
wysyła  falę  płaską  postaci: 

ViW)  = ^(<7y)e-W>+«Ą(i<0.  (5) 

Fala  ta  jest  scharakteryzowana  przez  wektor  falowy 
q>  częstość  kołową  o>}{g)  i wektor  polaryzacji  es(qj). 

Wektor  falowy  q określa  kierunek  rozchodzenia  się 
fali,  a jego  wartość  liczbowa  jest  równa  2n/A  (A  — 

długość  fali).  Wektor  polaryzacji  e8(qj)  wskazuje 
kierunek  drgań  atomów  i zależy  od  rodzaju  atomu 

(wskaźnik  s ).  Wskaźniki  q i /,  występujące  przy  czę- 
stościach i wektorach  polaryzacji,  klasyfikują  roz- 
wiązania równań  ruchu.  Do  zagadnienia  tego  jeszcze 
wrócimy. 

Gdy  fale  rozchodzą  się  w kierunkach  wysokiej  sy- 
metrii w krysztale  (np.  w kierunku  [111]  w kryszta- 
łach o strukturze  regularnej),  orientacja  wektora  po- 
laryzacji w stosunku  do  wektora  falowego  jest  łatwa 
do  określenia.  Drgania  można  wówczas  klasyfikować 

jako  ściśle  podłużne  (gdy  e ||  q)  lub  ściśle  poprzeczne 

(gdy  e±,q).  Gdy  fale  rozchodzą  się  w innych  kierun- 
kach, zazwyczaj  wektor  polaryzacji  tworzy  z wekto- 


rem falowym  pewien  kąt  różny  od  kąta  zerowego  lub 
prostego. 

W ramach  przybliżenia  harmonicznego  odchylenia 

atomów  u(Js)  od  położenia  równowagi  można  przed- 
stawić w postaci  superpozycji  3 rN  fal  płaskich: 

sr  N 3 r N 

7(/s)  = (6) 

i 9 i q 

W równaniu  (6)  rolę  współrzędnych  normalnych 
Qj(q)  odgrywa  wyrażenie: 

e.(7jr)e-ł">(7>t  - C/<?).  (7) 

W tym  wypadku  współrzędne  normalne  interpretu- 
jemy jako  wielkości  określające  amplitudy  fal  pła- 
skich. Ruch  opisany  przez  współrzędne  normalne 
nosi  nazwę  drgań  normalnych.  W doskonałej  sieci  drgania 
krystalicznej  drgania  normalne  mają  postać  fal  pła-  normalne 
skich.  W każdym  drganiu  normalnym  biorą  udział 
wszystkie  atomy,  które  drgają  z tą  samą  częstością. 

Między  drganiami  poszczególnych  atomów  istnieje 
stała  różnica  faz.  Ogólna  liczba  drgań  normalnych 
jest  równa  liczbie  stopni  swobody  dla  atomów  w kry- 
sztale (3rA0. 

Aby  opis  drgań  sieci  krystalicznej  w języku  drgań 
normalnych  był  pełny,  pozostaje  jeszcze  wyznaczyć 

częstość  o)j(q)  i wektory  polaryzacji  es(qj).  Można 
to  osiągnąć  przez  rozwiązanie  układu  równań  ruchu 
(2).  Zgodnie  z przedstawionymi  wyżej  rozważaniami 
zakłada  się,  że  rozwiązania  mają  postać  fali  płaskiej. 

Reasumując,  współrzędne  normalne  pozwalają 
sprowadzić  zagadnienie  ruchu  wzajemnie  oddziały- 
wających atomów  do  zagadnienia  ruchu  niezależnych 
oscylatorów  harmonicznych.  Oscylator  harmoniczny 
jest  jednym  z niewielu  układów,  dla  którego  znane  są 
ścisłe  rozwiązania,  zarówno  w ramach  mechaniki 
klasycznej,  jak  i kwantowej.  Nie  można  jednak  za- 
pominać, że  wprowadzenie  formalizmu  oscylatora 
i drgań  normalnych  jest  związane  z kwadratową  za- 
leżnością energii  potencjalnej  od  odchyleń  atomów 
od  położeń  równowagi,  która  stanowi  wynik  przybli- 
żenia harmonicznego. 

Relacje  dyspersji 

Zależność  <oj(q)  charakteryzuje  podstawowe  wła- 
sności dynamiczne  sieci  krystalicznej  i jest  przedmio- 
tem wielu  badań,  zarówno  teoretycznych,  jak  i do- 
świadczalnych. Funkcja  co(q)  nosi  nazwę  relacji  dy- 
spersji lub  prawa  dyspersji. 

Ogólnie  relacje  dyspersji  przedstawiają  zależność 
częstości  drgań  sieci  od  trzech  zmiennych,  którymi 


qv 


Rys.  2.  Powierzchnia  stałej  częstości  w przestrzeni  wektora  falo- 
wego q 
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są  składowe  wektora  falowego  ą.  W trójwymiarowej 
przestrzeni  mogą  one  być  przedstawione  graficznie 
jako  powierzchnie  stałej  częstości  (rys.  2).  Analiza 
własności  tych  powierzchni  umożliwia  otrzymanie 
ważnych  informacji  o strukturze  widma  częstości 
drgań.  W praktyce  jednak  ograniczamy  się  zwykle  do 
rozpatrywania  relacji  dyspersji  tylko  dla  niektórych, 
wybranych  kierunków  w przestrzeni  wektora  falo- 
wego ą (a  tym  samym  w krysztale).  Z reguły  są  to  kie- 
runki odznaczające  się  wysoką  symetrią,  jak  np.  kie- 
runki [111],  [110]  i [100]  w kryształach  o strukturze 
regularnej.  Obrazem  graficznym  relacji  dyspersji  są 
wówczas  krzywe  płaskie,  które  nazywamy  krzywymi 
dyspersji. 

Jest  zrozumiałe,  że  kształt  krzywych  dyspersji  wi- 
nien zależeć  od  natury  kryształu,  a w szczególności 
od  charakteru  oddziaływań  międzyatomowych  w 
krysztale.  Interesują  nas  jednak  przede  wszystkim  te 
własności  relacji  dyspersji,  które  są  wspólne  dla 
wszystkich  kryształów,  niezależnie  od  typu  oddziały- 
wań międzyatomowych.  Do  takich  ogólnych  wła- 
sności relacji  dyspersji  należy  okresowość  i parzy- 
stość. Własności  te  oznaczają,  że  spełnione  są  nastę- 
pujące zależności  : 

a>}(q)  = a>j(q+G)  (8) 

cofa)  = <o}{-q)\  (9) 

G jest  wektorem  sieci  odwrotnej.  Okresowość  funkcji 

coj(q)  jest  następstwem  istnienia  symetrii  translacyj- 
nej  w krysztale,  która  powoduje,  że  wszystkie  nierów- 
noważne  fizycznie  drgania  normalne  odpowiadają 

wartościom  q położonym  w pewnym  ograniczonym 
obszarze.  Podobnie  jak  w zagadnieniach  struktury 
elektronowej  kryształów,  obszar  ten  wygodnie  jest 
wybrać  w postaci  tzw.  strefy  Brillouina.  W trójwy- 
miarowej przestrzeni  q strefa  Brillouina  jest  zamknię- 
tym wielościancm,  którego  kształt  odzwierciedla  sy- 
metrię kryształu. 

Następną  charakterystyczną  cechą  relacji  dyspersji 
jest  wieloznaczność.  Oznacza  to,  że  każdej  wartości 

wektora  falowego  q odpowiada  więcej  niż  jedna  war- 
tość częstości  o.  W związku  z tym  krzywe  dyspersji 
składają  się  z gałęzi,  które  rozróżniamy  przy  pomocy 
wskaźnika  j. 

Ogólna  liczba  gałęzi  drgań  w trójwymiarowym 
krysztale  jest  równa  3 r,  gdzie  r jest  liczbą  atomów 
w komórce  elementarnej.  Analiza  ruchu  drgającego 
prowadzi  do  klasyfikacji  tych  gałęzi  na  akustyczne 
i optyczne.  Liczba  gałęzi  akustycznych  jest  równa  3, 
a liczba  gałęzi  optycznych  3r— 3.  Tak  np.  w krysztale 
trójwymiarowym,  którego  komórka  elementarna  za- 
wiera jeden  atom,  występują  tylko  trzy  gałęzie  aku- 
styczne (nie  ma  gałęzi  optycznych).  W krysztale  trój- 
wymiarowym z dwoma  atomami  w komórce  elemen- 
tarnej jest  ogółem  sześć  gałęzi,  z których  trzy  są  ga- 
łęziami akustycznymi  i trzy  — gałęziami  optycznymi. 
Własności  symetrii  kryształu  mogą  powodować 
zwyrodnienie  niektórych  z tych  gałęzi,  co  redukuje 
ich  liczbę. 

Pozostaje  teraz  sprecyzować,  czym  różnią  się  mię- 
dzy sobą  gałęzie  akustyczne  i optyczne.  Różnica  ta 
najwyraźniej  występuje  w środku  strefy  Brillouina, 
dlatego  omówimy  własności  drgań  długofalowych 

(7  * 0). 

Drgania  akustyczne  odpowiadają  sytuacji,  gdy 
wszystkie  atomy  w komórce  elementarnej  poruszają 

się  w zgodnej  fazie.  Gdy  q = 0,  częstość  drgań  aku- 
stycznych jest  równa  zeru,  a przy  małych  wartościach 

q zmienia  się  liniowo  ze  wzrostem  q . W pobliżu  środka 
strefy  Brillouina  drgania  akustyczne  nie  różnią  się 
od  drgań  towarzyszących  rozchodzeniu  się  fali  aku- 
stycznej w krysztale.  Fakt  ten  znajduje  odbicie  w naz- 
wie, która  została  przyjęta  dla  omawianych  drgań. 


W przypadku  drgań  optycznych  sąsiednie  atomy 
w komórce  elementarnej  poruszają  się  w fazach  prze- 
ciwnych, przy  tym  środek  masy  komórki  elementar- 
nej pozostaje  w spoczynku.  Oznacza  to,  że  amplituda 
drgań  atomów  jest  odwrotnie  proporcjonalna  do  ich 

masy.  Gdy  q — 0,  częstości  drgań  optycznych  dążą 
zawsze  do  skończonej  wartości,  różnej  od  zera.  W kry- 
ształach jonowych  drgania  optyczne  wytwarzają  oscy- 
lujący moment  elektryczny.  Ponieważ  z tym  momen- 
tem związane  są  silne  oddziaływania  optyczne  (po- 
chłanianie), drgania  tego  typu  otrzymały  nazwę  drgań 
optycznych. 

Relacje  dyspersji  w postaci  nie  skomplikowanego 
wyrażenia  matematycznego  można  otrzymać  tylko 
dla  kryształów  jednowymiarowych.  Wykresy  typo- 
wych zależności  dla  tych  kryształów  są  przedstawione 
na  rys.  3a  i 4a.  Zgodnie  z poprzednio  omawianą  wła- 


. wektor  falowy  q 

a)  b) 


Rys.  3.  Krzywe  dyspersji  (a)  i pasmo  dozwolonych  częstości 
drgań  (b)  sieci  liniowej  z jednym  atomem  w komórce  elemen- 
tarnej 


2a  2a 

wektor  falowy  q 


a)  b) 

Rys.  4.  Krzywe  dyspersji  (a)  i pasma  dozwolonych  częstości 
drgań  (b)  sieci  liniowej  z dwoma  atomami  w komórce  elemen- 
tarnej 


snością  okresowości  funkcji  coj(q)  zakres  zmienności 

wektora  falowego  q jest  ograniczony  do  przedziału 
(-Ji/a,  4-rc/tf)  lub  (—n/2ay  -\-n/2a),  który  w tym  wy- 
padku określa  strefę  Brillouina  ( a — odległość  między 
atomami).  W krysztale  mającym  1 atom  w komórce 
elementarnej  występuje  tylko  gałąź  akustyczna,  a w 
krysztale  z dwoma  atomami  w komórce  elementar- 
nej — gałąź  akustyczna  i optyczna.  Liczba  gałęzi 
drgań  jest  mniejsza  niż  w krysztale  trójwymiarowym; 
jest  to  związane  z mniejszą  liczbą  stopni  swobody 
przypadających  na  jeden  atom. 

Warto  zauważyć,  że  częstości  drgań  normalnych 
sieci  przybierają  tylko  wartości  leżące  w ograniczo- 
nym przedziale,  zawartym  między  0 i pewną  maksy- 
malną częstością  com.  W najprostszym  wypadku  cały 
obszar  dozwolonych  częstości  tworzy  jedno  pasmo 
(rys.  3b).  W kryształach  zawierających  dwa  atomy 
w komórce  elementarnej  mogą  występować  dwa  pa- 
sma rozdzielone  przerwą,  z których  jedno  odpowiada 
drganiom  akustycznym,  drugie  — optycznym  (rys. 
4b).  Struktura  pasmowa  i istnienie  maksymalnej  czę- 
stości drgań  jest  cechą  ogólną,  niezależną  od  wymia- 
rowości  kryształu.  Maksymalna  częstość  drgań 
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optycznych  w kryształach  rzeczywistych  jest  zwykle 
rzędu  1013  s"1. 

Analizę  charakteru  drgań  można  stosunkowo  łatwo 
przeprowadzić  dla  kryształów  jednowymiarowych. 
Wyniki  dotyczące  drgań  poprzecznych  w krysztale 
zawierającym  dwa  atomy  w komórce  elementarnej 
są  przedstawione  na  rys.  5.  Wzięto  pod  uwagę  dwie 


iui 

a) 

UJ 

UJ 

u 

u 

u 

i ^ 4 j 4 ^ 

U u 

► 4 

b) 


uzyskać  krzywe  dyspersji  zgodne  z wynikami  pomia- 
rów. W zależności  od  natury  badanych  kryształów 
stosuje  się  różne  modele  oddziaływań  międzyatomo- 
wych. 

Podstawową  metodą  eksperymentalną,  dzięki  której 
można  otrzymać  krzywe  dyspersji,  jest  badanie  nie- 
sprężystego  rozproszenia  neutronów  powolnych.  Po- 
równanie obliczonych  krzywych  dyspersji  z wynikami 
pomiarów  traktuje  się  jako  metodę  kontroli  popraw- 
ności przyjętego  modelu  oddziaływań  międzyato- 
mowych.  Zagadnienie  niesprężystego  rozpraszania 
neutronów  powolnych  na  drganiach  sieci  omówimy 
w dalszej  części  tego  artykułu,  w rozdziale  „Doświad- 
czalne metody  badania  drgań  sieci”. 

Warto  jeszcze  zwrócić  uwagę  na  różnice,  jakie 
istnieją  między  falą  sprężystą  w sieci  krystalicznej 
i falą  sprężystą  w ośrodku  ciągłym,  nie  mającym  dy- 
skretnej struktury  atomowej.  Jak  to  powyżej  przed- 
stawiliśmy, drgania  sieci  krystalicznej  mają  ograni- 
czony zakres  zmienności  częstości  i wektora  falo- 
wego, a zależność  między  tymi  wielkościami  wyka- 
zuje dyspersję.  W wypadku  fali  sprężystej  rozcho- 
dzącej się  w ośrodku  ciągłym  częstość  i wektor  falo- 
wy mogą  w zasadzie  przybierać  dowolne  wartości, 

a zależność  w(q)  jest  liniowa. 


Widmo  wartości  wektora  falowego 


Rys.  5.  Ruch  falowy  w sieci  liniowej  zawierającej  dwa  atomy 
w komórce  elementarnej:  a)  drganie  poprzeczne  akustyczne 

w środku  strefy  Brillouina  ($  = 0);  b)  drganie  poprzeczne  optycz- 
ne w środku  strefy  Brillouina  (g  = 0) ; c)  drganie  poprzeczne 
akustyczne  wewnątrz  strefy  Brillouina;  d)  drganie  poprzeczne 
optyczne  wewnątrz  strefy  Brillouina 

wartości  wektora  falowego  q ; jedna  odpowiada  środ- 
kowi strefy  Brillouina  {q  — 0),  druga  znajduje  się  we- 
wnątrz strefy,  w pewnej  odległości  od  jej  środka. 

Otrzymanie  krzywych  dyspersji  dla  rzeczywistych 
trójwymiarowych  kryształów  (rys.  6)  wymaga  skom- 
plikowanych obliczeń,  do  których  są  niezbędne  ma- 
szyny matematyczne.  Przy  obliczeniach  zakłada  się 
odpowiedni  model  oddziaływań  międzyatomowych. 
Stosunkowo  prosta  sytuacja  jest  wtedy,  gdy  oddzia- 
ływania międzyatomowe  maleją  szybko  ze  wzrostem 


W dotychczasowych  rozważaniach  wychodziliśmy 
z założenia,  że  kryształ  jest  nieskończony.  W rzeczy- 
wistości wszystkie  kryształy  są  ograniczone  powierzch- 
niami i tym  samym  mają  skończone  rozmiary.  Jest 
oczywiste,  że  atomy  znajdujące  się  na  powierzchni 
lub  w jej  pobliżu  drgają  inaczej  niż  atomy  znajdujące 
się  wewnątrz  kryształu,  daleko  od  powierzchni  (inne 
stałe  siłowe).  Drgania  powierzchniowe  stanowią  przed- 
miot specjalnych  badań  (-*•  Stany  powierzchniowe 
w ciałach  stałych). 

W tej  chwili  interesuje  nas  jednak,  jak  obecność 
powierzchni  wpływa  na  drgania  sieci  krystalicznej 
wewnątrz  kryształu.  Można  przypuszczać,  że  jeśli 
oddziaływania  międzyatomowe  szybko  maleją  ze 
wzrostem  odległości,  to  atomy  położone  daleko  od 
powierzchni  „nie  czują”  jej  obecności.  Dlatego  w rze- 
czywistych kryształach  warunki  brzegowe,  jakimi 
się  posługujemy  przy  rozwiązywaniu  równań  ruchu, 
nie  mają  wielkiego  znaczenia.  W tej  sytuacji  możemy 
je  tak  sformułować,  aby  maksymalnie  ułatwić  roz- 
wiązanie równań  ruchu.  Najwygodniejszą  postać  pod 
tym  względem  mają  warunki  cykliczności  Borna- 
Karmana.  Zgodnie  z nimi  odchylenia  atomów  od  po- 


Rys.  6.  Krzywe  dyspersji  drgań  sieci  kry- 
stalicznej krzemu  dla  trzech  kierunków 
krystalograficznych.  Linie  ciągle  przed- 
stawiają wyniki  obliczeń,  a punkty  — 
wyniki  pomiarów  metodą  dyfrakcji  neu- 
tronów powolnych.  Pionowa  linia  prze- 
rywana na  środkowym  rysunku  określa 
granicę  strefy  Brillouina.  Litery  L i T 
oznaczają  odpowiednio  gałąź  drgań  pod- 
łużnych i poprzecznych.  W rozpatrywa- 
nych kierunkach  krystalograficznych  ga- 
łęzie poprzeczne  są  zwyrodniałe 


odległości.  Pozwala  to  rozpatrywać  tylko  niewielką 
liczbę  stałych  siłowych,  które  można  wyrazić  przez 
współczynniki  sprężystości  lub  inne  dane  doświad- 
czalne. W wielu  kryształach  jednak  odgrywają  istotną 
rolę  oddziaływania  dalekiego  zasięgu,  które  muszą 
być  uwzględnione  przy  obliczeniach,  jeżeli  chcemy 


łożenia  równowagi  muszą  się  powtarzać  z okresem 
równym  L : 

u(łs)=u(l+L,s).  (10) 

W odniesieniu  do  kryształu  mającego  postać  sześcianu 
o krawędzi  L oznacza  to,  że  odchylenia  atomów  po- 
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łożonych  w punktach  symetrycznych  na  powierzch- 
niach sześcianu  są  identyczne  (jednakowe  amplitudy 
i fazy).  Warunki  cykliczności  Borna-Karmana  po- 
zwalają przedstawić  ruch  atomów  w skończonym 
krysztale  w postaci  fal  płaskich  bieżących,  podobnie 
jak  w krysztale  nieograniczonym. 

Można  łatwo  wykazać,  że  z warunków  cykliczności 
wynika  dyskretny  zbiór  wartości,  które  może  przy- 
bierać wektor  fałowy  q wewnątrz  strefy  Brillouina. 
Wartości  te  są  rozmieszczone  w sposób  jednorodny: 
w każdym  z trzech  kierunków  są  one  oddalone  od 
siebie  o wartość  równą  2i i/L  (rys.  7). 


Mechanika  kwantowa  przewiduje,  że  oscylator  har- 
moniczny może  przybierać  tylko  dyskretne  wartości 
energii,  określone  wzorem: 

£ n(qj)  = [n(qj)+\\ho)j(q)y  (11) 

gdzie  n(qj)  = 0, 1, 2 ...,  h — stała  Plancka  podzielona 
przez  2k.  Schemat  dozwolonych  poziomów  energe- 
tycznych wynikających  z tego  wzoru  jest  przedsta- 
wiony na  rys.  8. 

Każdemu  dozwolonemu  poziomowi  energetyczne- 
mu odpowiada  pewna  liczba  kwantowa  n(qj\  która 

poziomy 
oscylatora 
harmonicz- 
nego 


(n  + ^)ho)j  (<?) 


Rys.  7.  Rozmieszczenie  dozwolonych  stanów  w przestrzeni  q 
wynikające  z cyklicznych  warunków  brzegowych:  a)  sieć  liniowa, 
b)  sieć  trójwymiarowa  (pokazano  tylko  stany  położone  na  płasz- 
czyźnie qxqy ) 


Całkowita  liczba  dyskretnych  wartości  q w strefie 
Brillouina  jest  równa  liczbie  komórek  elementarnych 
N w krysztale.  W makroskopowych  kryształach  gę- 
stość dyskretnych  wartości  q jest  tak  duża,  że  można 

traktować  q jako  zmienną  ciągłą.  Pozwala  to  przy 
obliczeniach  zastępować  sumowanie  po  dyskretnych 

wartościach  q bardziej  wygodnym  całkowaniem  po 

zmiennej  q.  Przykładem  traktowania  q jako  zmiennej 
ciągłej  są  omawiane  przed  chwilą  krzywe  dyspersji 
(rys.  6). 


Kwantowanie  drgań  sieci 

Przedstawiony  dotychczas  obraz  drgań  sieci  krysta- 
licznej otrzymano  przy  zastosowaniu  praw  mecha- 
niki klasycznej.  Może  powstać  pytanie,  czy  wyniki 
te  nie  są  przybliżone,  a w związku  z tym,  czy  nie 
ulegną  zmianie,  gdy  zastosujemy  metody  mechaniki 
kwantowej.  Okazuje  się,  że  nie.  Oscylator  harmo- 
niczny stanowi  taki  układ  mechaniczny,  którego  czę- 
stość własna  co  jest  zawsze  taka  sama  — niezależnie 
od  tego,  czy  otrzymano  ją  metodami  mechaniki  kla- 
sycznej, czy  kwantowej.  Własność  ta  rozciąga  się  na 
drgania  sieci  krystalicznej,  które  są  równoważne 
zbiorowi  niezależnych  oscylatorów  harmonicznych. 

W tej  sytuacji  zwykle  najpierw  rozwiązujemy  kla- 
syczne równania  ruchu  i otrzymujemy  częstości  drgań 
(oraz  krzywe  dyspersji  i widmo  częstości),  a następ- 
nie stosujemy  procedurę  kwantowania  oscylatora  har- 
monicznego. 


| ho)i(q)  2 

| hio}{q)  1 


0 


0 


Rys.  S.  Diagram  poziomów  energetycznych  oscylatora  harmo- 
nicznego 


może  przybierać  tylko  wartości  całkowite  nieujem- 
ne.  Odległość  między  sąsiednimi  poziomami  energii 

jest  równa  h(Dj(q).  Wielkość  ta  jest  najmniejszą  porcją 
(kwantem)  energii,  która  może  być  pobrana  lub  od- 
dana przy  zmianie  stanu  energetycznego  oscylatora. 

Kwant  energii  drgań  sieci  krystalicznej  nosi  nazwę  fonon 
fononu.  Oscylatorowi  związanemu  z drganiami  sieci 
krystalicznej  znajdującemu  się  w stanie  kwantowym 

n(qj)  odpowiada  n(qj)  fononów,  z których  każdy 
ma  tę  samą  wartość  energii,  równą  hcojig).  Liczby 
kwantowe  n(qj)  często  nazywamy  liczbami  obsadze- 
nia. 

Według  mechaniki  klasycznej  każdy  oscylator  może 
mieć  dowolną  wartość  energii,  która  jest  proporcjo- 
nalna do  kwadratu  amplitudy  drgań.  W temperatu- 
rze zera  bezwzględnego  amplituda  i energia  drgań 
są  równe  zeru.  Natomiast  w opisie  mechaniki  kwan- 
towej w temperaturze  zera  bezwzględnego  pozostają  drgania 

•— * ZGTOWG 

tzw.  drgania  zerowe  o energii  l/2  ftcoj(q)y  które  odpo- 
wiadają stanowi  podstawowemu  oscylatora  okre- 
ślonemu liczbą  kwantową  n(qj)  — 0.  Występowanie 
drgań  zerowych  można  wyjaśnić  na  gruncie  zasady 
nieokreśloności  Heisenberga.  Zgodnie  z tą  zasadą 
atomy  nie  mogą  być  nieruchome,  gdyż  oznaczało- 
by to,  że  ich  położenie  jest  dokładnie  określone, 
a pęd  i energia  może  mieć  nieskończenie  dużą  war- 
tość. 

Fonony  podlegają  kwantowej  statystyce  Bosego- 
Einsteina.  W odróżnieniu  od  statystyki  Fermiego- 
Diraca,  która  ogranicza  liczbę  elektronów  w tym  sa- 
mym stanie  kwantowym  do  dwóch  (o  przeciwnie  skie- 
rowanych spinach),  statystyka  Bosego-Einsteina  nie 

zabrania,  aby  w tym  samym  stanie  kwantowym  qj 
znajdowała  się  dowolna  liczba  fononów.  Zgodnie 
z mechaniką  statystyczną  średnia  wartość  liczby  ob- 
sadzenia <«0?j)>  dla  oscylatora  sieciowego  qj  w wa- 
runkach równowagi  termodynamicznej  dana  jest 
przez  następujące  wyrażenie: 


<”(<77  )>  — » 

ęficofaykT  _i 


(12) 
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gdzie  k — stała  Boltzmanna,  T — temperatura  bez- 
względna. 

średnia  Ze  wzoru  (12)  widać,  że  średnia  liczba  obsadzenia 
liczba  (równoważna  średniej  liczbie  fononów)  zależy  od 
fononów  temperatury.  Kształt  tej  zależności  przedstawia  rys.  9. 

Można  zauważyć,  że  w dostatecznie  wysokich  tem- 


— kr  cji  rozkładu  Bosego- 

” haj  Einsteina 

peraturach  (kcoĄq)<^kT)  zależność  między  średnią 
liczbą  fononów  i temperaturą  ma  liniowy  charakter. 

Należy  podkreślić,  że  wszystkie  dotychczasowe 
rozważania  odnoszą  się  do  fononów  wzbudzonych 
fonony  gene-  termicznie.  Można  jednak  generować  fonony  za  po- 
rowane  pro-  mocą  promieniowania  elektromagnetycznego  po- 
mieniowa-  chłanianego  w krysztale  lub  inaczej.  Częstości  i wek- 
niem  otok-  tory  falowe  wytwarzanych  wówczas  fononów  przy- 
tromagne-  bierają  tylko  niektóre  spośród  możliwych  wartości, 
tycznym  Nie  stosuje  się  do  nich  prawo  rozkładu  statystycz- 
nego (12).  Liczba  generowanych  fononów  jest  funkcją 
natężenia  padającego  na  kryształ  promieniowania 
i nie  zależy  od  temperatury  kryształu.  W odróżnieniu 
od  drgań  sieci  wzbudzonych  termicznie,  które  są  nie- 
spójne, promieniowanie  elektromagnetyczne  (po- 
chodzące z lasera)  może  wytwarzać  drgania  normalne 
posiadające  własność  spójności, 
gaz  Przy  opisie  różnych  procesów,  w których  odgry- 
fononowy  wają  rolę  drgania  sieci,  posługujemy  się  często  mode- 
lem gazu  fononowego.  Model  ten  można  wprowadzić 
opierając  się  na  zasadzie  dualizmu  korpuskulamo- 
-falowego,  stanowiącej  jedno  z podstawowych  zało- 
żeń mechaniki  kwantowej.  W myśl  tej  zasady  każ- 
demu drganiu  normalnemu  o częstości  coj  i wektorze 

falowym  q można  przypisać  określoną  liczbę  nieroz- 
różnialnych  kwazicząstek  (fononów)  o energii 

kcoj(q)  i kwazipędzie  hq.  W ten  sposób  zbiór  drgań 
normalnych  jest  zastąpiony  przez  zbiór  kwaziczą- 
stek. W ramach  przybliżenia  harmonicznego  kwazi- 
cząstki stanowią  gaz  idealny,  w którym  nie  występują 
wzajemne  oddziaływania. 

oddziaływa-  Oddziaływanie  drgań  sieci  z innymi  kwazicząstka- 
nie  fononów  mi  (np.  elektronem  w krysztale)  można  traktować 
z innymi  jako  zderzenie,  dla  którego  obowiązuje  zasada  zacho- 
kwazicząst-  wania  energii  i pędu.  W oddziaływaniach  tych  fo- 
kami nony  mogą  powstawać  i znikać.  Oddziaływanie 
drgań  sieci  między  sobą  odpowiada  w tym  obrazie 
zderzeniu  fononów.  Dla  pojawienia  się  tego  oddzia- 
ływania konieczne  jest  jednak  wyjście  poza  ramy 
przybliżenia  harmonicznego. 

Można  się  oczywiście  domyślać,  że  analogia  mię- 
dzy kwazicząstkami  i zwykłymi  cząstkami,  takimi  jak 
elektrony,  protony,  neutrony,  jest  tylko  częściowa. 
Wskazuje  już  na  to  posługiwanie  się  terminami  kwa- 
zicząstka i kwazipęd. 

W odróżnieniu  od  zwykłych  cząstek  kwazicząstki 
nie  mogą  istnieć  w próżni.  Do  ich  powstania  i istnie- 
nia niezbędny  jest  pewien  ośrodek.  Dla  fononów  ta- 
kim ośrodkiem  jest  kryształ.  Fonon  jako  kwaziczą- 
stka nie  może  być  „wyjęty”  z kryształu. 

Następna  istotna  różnica  wiąże  się  z pojęciem  pędu. 
Jak  wiadomo,  każda  rzeczywista  cząstka  ma  okre- 
ślony pęd,  a w oddziaływaniach  rzeczywistych  cząstek 
obowiązuje  zasada  zachowania  pędu.  Fononowi  nie 


można  przypisać  pędu  fizycznego,  ale  w oddziaływa- 
niach zachowuje  się  on  tak,  jakby  rolę  pędu  odgry- 
wała wielkość  hq.  Niekiedy  rola  ta  jest  w pewnym 
stopniu  ograniczona,  gdyż  zasada  zachowania  pędu 
dla  oddziaływań  z fononami  zawiera  wyrazy  postaci 

hq+ftG  ( G — wektor  sieci  odwrotnej).  W związku 
z tym  mówimy  czasem,  że  hq  określa  pęd  fononu 
z dokładnością  do  wielkości  hG.  Sens  fizyczny  wyrazu 

hG  można  wyjaśnić  przyjmując  możliwość  przeka- 
zania pędu  do  całej  sieci  krystalicznej.  Przedstawione 

wyżej  uwagi  o znaczeniu  wielkości  hq  w dynamice 
sieci  krystalicznej  uzasadniają  posługiwanie  się  ter- 
minem kwazipęd  fononu. 

Warto  jeszcze  zwrócić  uwagę  na  niektóre  dalsze 
różnice  między  cząstkami  i kwazicząstkami.  Przeja- 
wiają się  one  w formie  zależności  energii  od  pędu. 
Jak  wiadomo,  dla  zwykłych  cząstek  zależność  ta  ma 
charakter  uniwersalny:  dla  fotonu  jest  ona  liniowa, 
a dla  cząstek  nierelatywistycznych  — kwadratowa. 
Jeśli  chodzi  o fonony,  to  nie  mają  one  takiej  uniwer- 
salnej zależności  energii  od  pędu.  W każdym  krysztale 
jest  ona  inna  i zależy  od  natury  oddziaływań  między- 
atomowych.  Warto  dodać,  że  zależność  energii  od 
kwazipędu  dla  fononów  jest  analogiczna  do  rozpatry- 
wanej przez  nas  wcześniej  zależności  częstości  drgań 
normalnych  od  wektora  falowego,  reprezentowanej 
przez  krzywe  dyspersji. 

Mimo  pewnych  różnic  występujących  między  rze- 
czywistymi cząstkami  i kwazicząstkami  (w  szczegól- 
ności fononami)  posługiwanie  się  pojęciem  kwazi- 
cząstki jest  bardzo  wygodne  przy  opisie  różnych  od- 
działywań zachodzących  w krysztale.  Jako  przykład 
można  wymienić  oddziaływanie  między  drganiami 
sieci,  oddziaływanie  drgań  sieci  z elektronami  w krysz- 
tale oraz  z polem  elektromagnetycznym  (z  fotonami). 


Widmo  częstości  drgań 

Przy  analizie  niektórych  własności  kryształów  zwią- 
zanych z drganiami  sieci  wygodnie  jest  wprowadzić 
pojęcie  rozkładu  częstości  drgań  lub  widma  częstości 
drgań  sieci.  Widmo  częstości  drgań  można  przed- 
stawić w postaci  pewnej  funkcji,  którą  oznaczymy 
przez  g(co).  Funkcja  ta  jest  zdefiniowana  w ten  spo- 
sób, że  wyrażenie  g(<o)  da>  określa  liczbę  drgań  nor- 
malnych przypadających  na  przedział  częstości  (co, 
a>+dó)).  Funkcja  g(a>)  zwykle  spełnia  warunek  nor- 
malizacji, wynikający  z żądania,  .aby  liczba  wszy- 
stkich drgań  normalnych  równała  się  liczbie  oscyla- 
cyjnych stopni  swobody  w krysztale. 

Stosunkowo  łatwo  można  obliczyć  g(co)  dla  sieci 
jednowymiarowych.  Schematyczny  kształt  tej  funkcji 
jest  przedstawiony  na  rys.  10.  Widzimy,  że  dla  dwu^ 
atomowej  sieci  jednowymiarowej  widmo  częstości 
drgań  składa  się  z dwóch  części,  z których  jedna  od- 
powiada drganiom  akustycznym,  druga  — drga- 


częsłośc  to  częstość  u> 

a)  b) 

R>s.  10  Widmo  drgań  iicci  liniowej,  a)  z jednym  atomem  w ko- 
mórce elementarnej,  b)  z dwoma  atomami  w komórce 


kwazipęd 

fononu 


cząstka  a 
kwazicząstka 


warunek 
normalizacji 
funkcji  g(a>) 
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niom  optycznym.  Można  również  zauważyć,  że  przy 
pewnych  wartościach  w funkcja  ta  dąży  do  nieskoń- 
czoności, ale  nie  powinno  to  dziwić,  gdyż  rozpatry- 
wany model  jest  nierealny. 

£r(a>)  w W rzeczywistych  trójwymiarowych  kryształach 
kryształach  obliczenia  widma  częstości  drgań  wykonuje  się  wy- 
rzeczywi-  łącznie  metodami  numerycznymi  za  pomocą  elektro- 
stych  nowych  maszyn  matematycznych.  W tym  celu  roz- 
wiązuje się  równania  ruchu  dla  dostatecznie  gęsto 

rozmieszczonych  wartości  wektora  falowego  q w 
strefie  Brillouina  i następnie  zlicza  się  drgania  z czę- 
stościami zawartymi  w przedziałach  (a>,  <o-\-doo). 

Widmo  częstości  drgań  ma  zazwyczaj  złożoną  struk- 
turę, która  zależy  od  rodzaju  kryształu.  Rys.  11 
przedstawia  wyniki  obliczeń  dla  krzemu.  W wypadku 


częstość  6 ) 

Rys.  11.  Widmo  częstości  drgań  sieci  krzemu  (obliczone) 


kryształów  trójwymiarowych  funkcja  g(co)  nie  ma 
nieciągłości  typu  nieskończoności,  jak  to  miało  miej- 
sce dla  sieci  liniowych.  Przy  dokładnych  obliczeniach 
otrzymuje  się  jednak  na  krzywych  g(co)  charaktery- 
styczne ostre  załamania. 

Teoria  drgań  sieci  pozwala  ustalić  interesujące 
związki  między  funkcją  g(<o)  i relacjami  dyspersji 

oĄq).  Można  mianowicie  wykazać,  że  osobliwości 
punkty  funkcji  g(a>)  odpowiadają  określonym  punktom  w 
krytyczne  strefie  Brillouina.  Noszą  one  nazwę  punktów  kry- 
tycznych. Położenie  punktów  krytycznych  wyznacza 
się  z warunków  określających  miejsca  w strefie  Bril- 
louina, w których  otoczeniu  powierzchnie  stałej  czę- 
stości mają  kształt  trójwymiarowego  maksimum,  mi- 
nimum lub  siodła.  Po  odpowiednich  obliczeniach 
otrzymujemy  kształt  funkcji  g( co)  w otoczeniu  punk- 
tów krytycznych  związanych  z różnymi  kształtami 
powierzchni  stałej  częstości. 

Z rozważań  teoretycznych  wynika,  że  liczba  róż- 
nego typu  punktów  krytycznych  i odpowiadających 


Rys.  12.  Pierwsza  strefa  Brillouina  dla  kryształów  o strukturze 
regularnej  płasko  centrowanej;  F,  X,  L,  W — punkty  krytyczne 


im  osobliwości  funkcji  g(o>)  jest  określona  wyłącznie  osobliwości 
przez  symetrię  kryształu,  a nie  zależy  od  charakteru  funkcji  <7(g>) 
oddziaływań  międzyatomowych.  Punkty  krytyczne 
tego  rodzaju  występują  zwykle  w strefie  Brillouina 
w miejscach  odznaczających  się  wysoką  symetrią.  Na 
rys.  12  wskazane  są  położenia  punktów  krytycznych 
w strefie  Brillouina  dla  kryształów  o strukturze  s<  ii 
kamiennej,  blendy  cynkowej  i diamentu.  Są  one  ozna- 
czone symbolami  JTy  X,L  i W.  Rysunek  13  przedsta- 


wi 

9M 


krytycznych  różnego  rodzaju 


wia  schematycznie  kształt  funkcji  g(o>)  w sąsiedztwie 
różnych  punktów  krytycznych.  Krzywa  1 i 4 odpo- 
wiada sytuacji,  gdy  na  powierzchni  stałej  częstości 
występuje  odpowiednio  minimum  i maksimum;  krzy- 
wa 2 i i — gdy  powierzchnia  ta  ma  kształt  siodła. 

Opierając  się  na  wynikach  teorii  punktów  krytycz- 
nych, można  przyjąć,  że  widmo  częstości  drgań  każ- 
dego kryształu  składa  się  z szeregu  przyczynków  po- 
chodzących od  punktów  krytycznych  różnego  rodzaju. 
Po  tych  uwagach  staje  się  jasne  pochodzenie  charak- 
terystycznych załamań  widocznych  na  krzywej 
przedstawionej  na  rys.  1 1 . 

Określenie  własności  termodynamicznych  kryszta- 
łów (m.in.  ciepła  właściwego)  nie  wymaga  tak  dokład- 
nej znajomości  kształtu  widma  częstości  drgań. 
Stosunkowo  dobre  wyniki  otrzymujemy  posługując 
się  bardzo  przybliżonymi  funkcjami  g(a>),  otrzyma- 
nymi dla  bardzo  prostych  modeli  dynamicznych 
kryształu. 

Jednym  z takich  modeli  jest  model  Einsteina,  który 
się  opiera  na  założeniu,  że  każdy  atom  w sieci  jest 
niezależnym  oscylatorem.  Widmo  częstości  drgań 
składa  się  z jednej  wartości  cujg,  wspólnej  dla  wszy- 
stkich oscylatorów  (rys.  14a).  Częstość  tę  nazywamy 
częstością  Einsteina.  W modelu  Einsteina  drgania 


własności 

termodyna- 

miczne 

kryształu 


model 

Einsteina 
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a)  0 o 

wektor  falowy  ~q  częstość  a» 


Rys.  14.  Krzywe  dyspersji  i widmo  częstości  drgań;  a)  model 
Einsteina  (coe  — częstość  Einsteina);  b)  model  Debye'a  (eon  — 
częstość  Debye’a) 


sieci  nie  mają  dyspersji.  W związku  z tym  model  ten 
źle  opisuje  drgania  akustyczne,  odznaczające  się  dużą 
dyspersją.  Można  go  jednak  stosować  do  drgań 
optycznych,  które  z reguły  wykazują  słabą  zależność 
częstości  od  wektora  falowego. 
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model  Bardziej  odpowiednim  do  opisu  drgań  akustycz- 
Debye'a  nych  jest  model  Debye’a,  który  traktuje  kryształ  jako 
ośrodek  ciągły  i izotropowy.  Relacje  dyspersji  są 
w tym  wypadku  liniowe,  a widmo  częstości  ma  po- 
stać g(co)  = const-a>2  (rys.  14b).  Maksymalna  czę- 
stość cod  (częstość  Debye’a)  jest  określona  z warunku 
normalizacji  (całkowita  liczba  drgań  w przedziale  od 
zera  do  cod  musi  być  równa  3rN ).  Jest  to  pewnego  ro- 
dzaju odstępstwo  od  własności  ośrodka  ciągłego, 
który  nie  ogranicza  liczby  drgań  normalnych.  W mo- 
delu Debyeła  strefa  Brillouina  ma  kształt  kuli,  której 

promień  zwany  wektorem  falowym  Debye’a, 
odpowiada  w przybliżeniu  rozmiarom  strefy  Bril- 
louina dla  rzeczywistych  kryształów. 

Model  Debye’a  stosunkowo  dobrze  opisuje  drgania 
akustyczne,  którym  odpowiada  długość  fali  większa 
od  odległości  międzyatomowych.  Kryształ  może  być 
wtedy  traktowany  jako  ośrodek  ciągły,  a krzywe 
dyspersji  mają  charakter  liniowy. 

Drgania  akustyczne  o stosunkowo  małych  często- 
ściach są  znacznie  silniej  wzbudzane  niż  drgania 
optyczne.  W związku  z tym  decydujący  wkład  do 
energii  wewnętrznej  kryształu  jest  związany  z drga- 
niami akustycznymi.  Dzięki  temu  model  Debye*a 
daje  dobre  wyniki  przy  obliczeniach  wielkości  termo- 
dynamicznych. Między  innymi  pozwala  on  uzyskać 
poprawną  zależność  ciepła  właściwego  kryształów  od 
temperatury. 


Oddziaływania  anharmoniczne 

Konsekwencją  przybliżenia  harmonicznego  jest  moż- 
liwość przedstawienia  drgań  sieci  w postaci  zbioru 
niezależnych  drgań  normalnych.  W obrazie  tym  ener- 
gia dostarczona  selektywnie  jednemu  drganiu  nor- 
malnemu nie  może  być  przekazana  innym  drganiom 
normalnym.  Tym  samym  w doskonałym  krysztale 
nie  istnieje  mechanizm,  który  by  gwarantował  przy- 
wrócenie równowagi  termodynamicznej. 

W opisie  kwantowym  niezależnym  drganiom  nor- 
malnym odpowiadają  fonony,  między  którymi  nie  za- 
chodzą oddziaływania.  Czas  życia  i droga  swobodna 
fononów  w doskonałym,  nieograniczonym  krysztale 
powinny  więc  osiągać  nieskończenie  dużą  wartość. 

W rzeczywistości  jednak  żaden  kryształ  nie  jest 
ściśle  harmoniczny.  Dokładna  teoria  dynamiki  sieci 
winna  uwzględniać  wyrazy  trzeciego  rzędu  i wyższych 
w rozwinięciu  energii  potencjalnej  względem  odchy- 
wyrazy  an-  leń  od  położeń  równowagi.  Wyrazy  te  nazywamy 
harmoniczne  ^harmonicznymi. 

Z wyrazami  anharmonicznymi  wiąże  się  szereg  ma- 
kroskopowych własności  kryształów,  takich  jak  prze- 
wodnictwo cieplne,  rozszerzalność  cieplna,  zależność 
od  temperatury  współczynników  sprężystości  oraz 
liniowa  zależność  od  temperatury  ciepła  właściwego 
w zakresie  wysokich  temperatur.  Nie  będziemy  się  tutaj 
zajmować  zastosowaniami  teorii  anharmonicznej 
drgań  sieci  do  wyjaśnienia  wymienionych  własności. 
Ograniczymy  się  wyłącznie  do  przedstawienia  ogólnej 
interpretacji  fizycznej  wyrazów  anharmonicznych. 

Dla  szeregu  kryształów  współczynniki  występujące 
przy  wyrazach  anharmonicznych  w rozwinięciu  energii 
potencjalnej  są  małe  w porównaniu  ze  współczynni- 
kami przy  wyrazach  drugiego  rzędu.  W tej  sytuacji 
wyrazy  anharmoniczne  można  traktować  jako  małe 
zaburzenie  drgań  normalnych  doskonałego  kryształu. 
Odpowiednie  obliczenia  wykazują,  że  zaburzenie  to 
powoduje  niewielką  zmianę  częstości  drgań  sieci 
(w  porównaniu  z wynikami  teorii  harmonicznej)  oraz 
pojawienie  się  czasu  relaksacji,  czyli  powrotu  wzbu- 
dzonych drgań  normalnych  do  stanu  równowagi  ter- 
modynamicznej. 

czas  życia  W ujęciu  kwantowym  efektem  wyrazów  anharmo- 
f or?onów  nicznych  jest  pojawienie  się  oddziaływań  między  fo- 
nonami, w wyniku  czego  fonony  mogą  powstawać 
i znikać.  Prowadzi  to  do  skończonej  wartości  czasu 
życia  i drogi  swobodnej  fononów.  Średni  czas  życia 
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Rys.  15.  Dwa  rodzaje  procesów  trójfononowych:  a)  absorpcja 
jednego  fononu  i emisja  dwóch  innych  fononów,  b)  absorpcja 
dwóch  fononów  i emisja  jednego  fononu 


fononów  jest  równoważny  czasowi  relaksacji  energii 
wzbudzonych  drgań  normalnych. 

Zarówno  częstość,  jak  i czas  życia  fononów  zależą 
od  wartości  współczynników  anharmonicznych  i tem- 
peratury. Ze  wzrostem  temperatury  czas  życia  fono- 
nów maleje,  gdyż  rośnie  liczba  fononów  i w następ- 
stwie tego  — prawdopodobieństwo  oddziaływań  mię- 
dzy nimi.  Dla  wielu  kryształów  efekt  ten  jest  stosunko- 
wo mały.  Kształt  krzywych  dyspersji  i widma  czę- 
stości drgań  zaledwie  w niewielkim  stopniu  zależy  od 
oddziaływań  anharmonicznych.  Dlatego  obliczenia 
tych  wielkości  prowadzi  się  z reguły  w ramach  przy- 
bliżenia harmonicznego. 

Bardzo  często  można  się  ograniczyć  do  uwzględ- 
nienia pierwszego  wyrazu  anharmonicznego  w roz- 
winięciu energii  potencjalnej.  Wyraz  ten  reprezentuje 
dwa  typy  procesów,  które  schematycznie  są  przed- 
stawione na  rys.  15.  W procesie  (a)  jeden  fonon  znika, 
a dwa  inne  powstają,  w procesie  (b)  dwa  fonony  zni- 
kają, a na  ich  miejsce  powstaje  jeden  inny.  W od- 
działywaniach tych  spełnione  są  zasady  zachowania 
energii  i kwazipędu,  które  dla  procesu  (b)  mają  postać: 


h(ox  ~f  fia>2  — fico. 


+ Q > (13) 

<7i  + #2  ~ 

Ze  względu  na  zasadę  zachowania  pędu  możliwe  są 
dwa  rodzaje  oddziaływań.  Jedno  z nich  nosi  nazwę 
procesu  normalnego,  drugie  — procesu  przerzutu  lub  procesy 
procesu  Umklapp . Charakterystyczną  cechą  procesu  przerzutu 
przerzutu  jest  to,  że  część  pędu  określona  wielkością 

hG  jest  przekazana  całej  sieci  krystalicznej.  Procesy 
przerzutu  odgrywają  dużą  rolę  w zagadnieniach  do- 
tyczących mechanizmu  ustalania  się  równowagi  ter- 
modynamicznej w krysztale,  mechanizmu,  który  leży 
u podstaw  teorii  sieciowego  przewodnictwa  cieplnego. 


Wpływ  defektów  na  drgania  sieci 


Kryształy,  z którymi  mamy  do  czynienia  w praktyce, 
nigdy  nie  są  doskonałe.  Zawierają  one  zawsze  pewną 
koncentrację  defektów.  Defekty  te  powodują  istotne 
modyfikacje  w obrazie  drgań  sieci  kryształów  do- 
skonałych. 

Wiele  ogólnych  wyników  dotyczących  drgań  sieci 
z defektami  można  otrzymać  rozpatrując  stosunko- 
wo proste  modele  defektów.  Do  takich  należy  m.in. 
defekt  sieci  wytworzony  przez  atom  obcy  (domieszkę  domieszki 
chemiczną)  umieszczony  w węźle  sieci  zamiast  atomu 
własnego  kryształu.  Defekt  taki  wprowadza  lokalne 
zaburzenie,  polegające  na  zmianie  masy  i stałych  si- 
łowych w stosunku  do  wartości  w doskonałej  sieci. 
Oddziaływania  domieszki  z atomami  sieci  zwykle 
mają  krótki  zasięg,  co  w praktyce  pozwala  rozpatry- 
wać tylko  stałe  siłowe  między  atomem  obcym  i jego 
najbliższymi  sąsiadami.  Poza  tym  w najprostszych 
rozważaniach  przyjmuje  się,  że  defekty  nie  oddzia- 
łują między  sobą.  Jest  to  uzasadnione  zwłaszcza  wte- 
dy, gdy  koncentracja  defektów  jest  mała. 

Własności  drgań  sieci  w kryształach  z defektami 
otrzymuje  się  przez  rozwiązywanie  odpowiednich 
równań  ruchu.  Ograniczymy  się  tutaj  do  przedstawie- 
nia wyników  dla  sieci  jednowymiarowej  zawierającej 
jeden  atom  w komórce  elementarnej.  Rozwiązanie 
równań  ruchu  dla  takiej  sieci  z atomem  obcym  umiesz- 
czonym w węźle  wykazuje,  że  widmo  drgań  sieci  skła- 
da się  z pasma  częstości  (podobnie  jak  w sieci  do- 
skonałej) i jednej  dyskretnej  częstości  położonej  po- 


drganie  wyżej  tego  pasma  (rys.  16).  Dyskretna  częstość  od- 
lokaSne  powiada  tzw.  drganiu  lokalnemu.  Charakterystyczną 
cechą  tego  drgania  jest  wykładnicze  malenie  ampli- 
tudy ze  wzrostem  odległości  od  atomu  obcego  (rys. 
17a).  Innymi  słowy,  w drganiu  lokalnym  bierze  udział 
tylko  atom  obcy  i mała  liczba  atomów  znajdujących 
się  w jego  sąsiedztwie. 


Rys.  16.  Położenie  drgań  lokalnych  i rezonansowych  w stosunku 
do  pasma  częstości  drgań  dozwolonych  sieci  doskonałej 

Wpływ  defektów  na  częstości  drgań  normalnych 
w obszarze  pasmowym  jest  pomijalnie  mały.  Pasmo 
dozwolonych  częstości  drgań  w krysztale  zawierają- 
cym małą  koncentrację  defektów  pokrywa  się  z ana- 
logicznym pasmem  w krysztale  doskonałym.  Mody- 
fikacji ulegają  amplitudy  drgań  normalnych,  zwłaszcza 
w pobliżu  defektów.  Czasem  obserwuje  się  rezonan- 
sowy wzrost  amplitudy  dla  określonej  częstości  drgań 
drgania  znajdującej  się  wewnątrz  pasma.  Drgania  mające  tę 
rezonansowe  własność  noszą  nazwę  drgań  rezonansowych  lub 
drgań  pseudolokalnych.  Biorą  w nich  udział  tylko 
atomy  obce  i atomy  znajdujące  się  w ich  sąsiedztwie 
(rys.  17b). 


Rys.  17.  Ruch  atomów  w sieci  liniowej  zawierającej  atom  obcy: 
a)  drganie  lokalne,  b)  drganie  rezonansowe 


Drgania  rezonansowe  występują  wtedy,  gdy  prze- 
kazanie energii  drgań  od  defektu  do  sieci  jest  z ja- 
kichś powodów  utrudnione  i zachodzi  powoli.  Przy- 
czyną utrudniającą  ten  proces  jest  zwykle  słabe  sprzę- 
żenie atomu  obcego  z siecią  (małe  stałe  siłowe)  lub 
mała  wartość  g(co)  dla  co  odpowiadającej  częstości 
drgań  atomu  obcego. 

Drgania  lokalne  pojawiają  się  wówczas,  gdy  atom 
obcy  ma  masę  znacznie  mniejszą  niż  atom  macierzy- 
sty sieci.  Do  tego  samego  efektu  prowadzi  „wzmoc- 
nienie’’ stałych  siłowych  sprzęgających  atom  obcy 
z siecią.  Natomiast,  aby  powstały  drgania  rezonan- 
sowe, muszą  być  wprowadzone  do  sieci  atomy  obce 
o masie  większej  niż  masa  atomów  macierzystych 
sieci  lub  musi  nastąpić  znaczne  „osłabienie”  stałych 
siłowych. 

Doświadczalne  badanie  drgań  lokalnych,  jak  rów- 
nież rezonansowych  przeprowadza  się  w kryształach 
jonowych  i kowalencyjnych  metodami  optycznymi. 


Rys.  18.  Absorpcja  podczerwieni  przez  drgania  lokalne  jonów 
H-  (jon  H-  zastępuje  w sieci  KC1  jon  Cl-)  w krysztale  KC1 
(chlorku  potasu)  w kilku  temperaturach.  Energia  fotonu  w mak- 
simum krzywych  odpowiada  długości  fali  około  21  pm 

W widmach  absorpcji  podczerwieni  obserwuje  się  badania 
pasma  takie,  jak  np.  na  rys.  18;  położenie  maksimum  optyczne 
pasma  pozwala  określić  częstość  drgania  lokalnego 
lub  rezonansowego,  a jego  rozmycie  — czas  życia. 


Doświadczalne  metody  badania 
drgań  sieci 

Niesprężyste  rozproszenie  neutronów 
powolnych 

Wśród  doświadczalnych  metod  dostarczających  in- 
formacji o drganiach  sieci  szczególnie  ważną  rolę  od- 
grywa niesprężyste  rozproszenie  neutronów  powol- 
nych. Metodą  tą  można  otrzymać  krzywe  dyspersji, 
a w wypadku  kryształów  o strukturze  regularnej  — 
również  widmo  częstości  drgań. 

W eksperymentach  rozproszeniowych  stosuje  się 
neutrony  o energii  rzędu  0,1  eV.  Neutrony  o tej  ener- 
gii mają  długość  fali  de  Broglie’a  porównywalną  z 
odległościami  międzyatomowymi  w krysztale.  Dla 
takich  fal  kryształ  stanowi  swego  rodzaju  przestrzeń-  kryształ 
ną  siatkę  dyfrakcyjną.  Monochromatyczna  fala  neu-  jako  siatka 
tronowa  padająca  na  kryształ  w wyniku  oddziaływa-  dyfrakcyjna 
nia  z jądrami  atomowymi  ulega  rozproszeniu.  Gdy 
jądra  atomowe  w każdym  węźle  sieci  mają  identyczne 
własności  rozpraszające,  fale  rozproszone  nakładają 
się  wzajemnie,  dając  zjawisko  interferencji.  Tego  ro- 
dzaju rozproszenie  nazywa  się  spójnym.  Występuje 
ono  wówczas,  gdy  kryształ  jest  doskonały  (brak  de- 
fektów), jednorodny  pod  względem  izotopowym,  a spi- 
ny jąder  atomowych  są  równe  zeru.  Jeżeli  natomiast 
kryształ  zawiera  przypadkowo  rozmieszczone  izotopy 
lub  jego  jądra  atomowe  mają  spiny  różne  od  zera,  to 
mamy  do  czynienia  z rozproszeniem  niespójnym. 

Spójne  rozproszenie  neutronów  w krysztale  może 
może  być  zarówno  sprężyste,  jak  i niesprężyste.  W pro- 
cesach sprężystych  energia  neutronu  w czasie  roz- 
proszenia nie  ulega  zmianie.  Efekty  interferencyjne 
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odbicie  prowadzą  do  tzw.  odbicia  braggowskiego  od  różnych 
braggowskie  płaszczyzn  w krysztale,  co  opisuje  wzór: 

IdsmO  = wA, 

gdzie  d — odległość  między  płaszczyznami  sieciowymi 
w krysztale,  O — kąt  odbicia  braggowskiego,  n — 
rząd  odbicia,  A — długość  fali  de  Broglieła  neutronu. 
Z wzoru  tego  można  wyznaczyć  długość  fali  A,  jeśli 
się  zna  kąt  O z pomiaru.  Posługując  się  związkami : 

E = h2l2MnX2  (Mn  — masa  neutronu), 

\k\  = 2tt/A, 

można  następnie  obliczyć  energię  i wartość  wektora 
falowego  neutronu. 

Z punktu  widzenia  dynamiki  sieci  krystalicznej 
bardziej  interesujące  są  procesy  niesprężystego  roz- 
proszenia, w których  rozproszonemu  neutronowi  to- 
warzyszy pojawienie  się  lub  zniknięcie  jednego  lub 
niespręźyst®  więcej  fononów.  Spójne,  niesprężyste  rozproszenie 
rozpraszanie  neutronów  zachodzące  z udziałem  jednego  fononu 
z udziałem  wykorzystuje  się  do  otrzymania  relacji  dyspersji  fo- 
1 fononu  nonów.  Jeżeli  neutron  ulega  rozproszeniu  i jednocze- 
śnie zachodzi  absorpcja  jednego  fononu,  to  zasada 
zachowania  energii  i pędu  wymaga  spełnienia  nastę- 
pujących zależności : 

£'-£=^-(*'2-*2)  = W?),  (14) 

Mn 

k'  —k  = q + Gs  (15) 

gdzie  Mn  — masa,  E\  El  k\k  — odpowiednio  ener- 
gia i pęd  neutronu  padającego  i rozproszonego.  Gdy 
w doświadczeniu  zmierzy  się  zmiany  energii  i pędu 
neutronu,  to  posługując  się  równaniami  (14)  i (15), 
można  będzie  wyznaczyć  częstość  i wektor  falowy 
fononu  uczestniczącego  w procesie  rozproszenia, 
badanie  W badaniach  niesprężystego  rozproszenia  neutro- 
krzywych  nów  źródłem  neutronów  są  reaktory  jądrowe.  Prędkie 
dyspersji  neutrony  wychodzące  z reaktora  przepuszcza  się 
przez  moderator  (grafit,  woda),  w którym  w wyniku 
szeregu  kolejnych  zderzeń  z lekkimi  atomami  wytra- 
cają one  energię  lub  inaczej  mówiąc  — ulegają  spo- 
wolnieniu. Gdy  temperatura  moderatora  jest  bliska 
pokojowej,  średnia  energia  neutronu  osiąga  wartość 
ok.  0,03  eV.  Neutrony  takie  nazywamy  termicznymi. 

Rys.  19  przedstawia  typowy  spektrometr  neutrono- 
wy przeznaczony  do  badania  krzywych  dyspersji  neu- 
tronów Wiązka  termicznych  neutronów  jest  formo- 


Rys.  t9.  Schemat  spektrometru  neutronowego  do  badania  krzy- 
wych dyspersji:  R reaktor,  Klf  K2>  K3  i K4  kol  ima  tory,  Xt  kryształ 
monochromatora,  X*  kryształ  badany,  X?  kryształ  analizatora, 
D detektor  neutronów,  <P  kąt  rozproszenia 

wana  w kolimatorze  Kx  (kanały  w bloku  substancji 
pochłaniającej  neutrony).  Monochromatyzację  wiązki 
uzyskuje  się  przez  braggowskie  odbicie  od  kryształu 
Xlf  który  odgrywa  rolę  monochromatora.  Energię  E 

i wektor  falowy  K neutronu  wyznacza  się  na  pod- 
stawie pomiaru  kąta  0m.  Następnie  monochroma- 
tyczna wiązka  pada  na  badany  kryształ  X2>  który  jest 
zorientowany  w określony  sposób  w stosunku  do 
wiązki  neutronów.  Energia  neutronów  rozproszonych 
pod  kątem  0 jest  analizowana  przez  kryształ  X3.  De- 
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tektor  D rejestruje  natężenie  rozproszonych  neutro- 
nów w zależności  od  ich  energii  dla  danego  kąta  roz- 
proszenia 0.  W widmie  rozproszenia  obserwuje  się 
maksima  interferencyjne  odpowiadające  rozprosze- 
niu z udziałem  różnych  fononów  (rys.  20).  Każde 
z tych  maksimów  pozwala  wyznaczyć  jedną  wartość 


Rys.  20.  Typowe  widmo  neutronów  rozproszonych  na  fononach 

funkcji  a>j(q ).  Przeprowadzając  badanie  dla  odpowied- 
nio dobranych  różnych  kątów  rozproszenia  S i róż- 
nych orientacji  kryształu  X2f  można  wykreślić  całą 

funkcję  o>j(q).  Specjalne  metody,  których  nie  będzie- 
my tutaj  omawiać,  pozwalają  określić  wektor  pola- 
ryzacji es(qf)  drgań  i przyporządkować  je  odpowied- 
niej gałęzi  krzywej  dyspersji.  Rozmycie  maksimów 
interferencyjnych  przy  dobrej  zdolności  rozdzielczej 
spektrometru  neutronowego  charakteryzuje  czas  życia 
fononów  — związany  głównie  z procesami  anharmo- 
nicznymi  w krysztale. 

W niektórych  kryształach  dominującą  rolę  odgry- 
wają procesy  niespójnego  rozproszenia  niesprężyste- 
go. Nie  można  wówczas  otrzymać  krzywych  dyspersji. 

W kryształach  o strukturze  regularnej  zależność  na- 
tężenia rozproszonych  neutronów  od  energii  (przy 
stałym  kącie  rozproszenia)  odzwierciedla  kształt  wid- 
ma częstości  drgań  g(co). 

Niewątpliwą  zaletą  neutronów  termicznych  w ba-  zalety  stoso- 
daniach  dynamiki  sieci  jest  to,  że  ich  energia  i war-  wania 
tość  wektora  falowego  są  porównywalne  z energią  neutronów 
i wartością  wektora  falowego  fononów  w całym  prze-  termicznych 
dziale  strefy  Brillouina.  Dzięki  temu  w procesie  od- 
działywania zachodzą  znaczne  zmiany  tych  wielkości, 
łatwe  do  zmierzenia.  Duże  znaczenie  ma  także  fakt, 
że  w rozproszeniu  neutronów  mogą  brać  udział  wszy- 
stkie fonony,  jeżeli  tylko  spełniona  jest  zasada  zacho- 
wania energii  i pędu.  Pod  tym  względem  zachodzi 
istotna  różnica  w stosunku  do  oddziaływania  promie- 
niowania elektromagnetycznego  z fononami,  w któ- 
rym występują  dodatkowe  ograniczenia,  nie  wynika- 
jące z zasady  zachowania  energii  i pędu. 


Absorpcja  w podczerwieni 

Jednym  z efektów  oddziaływania  promieniowania 
elektromagnetycznego  z drganiami  sieci  jest  jego  ab- 
sorpcja w krysztale,  która  występuje  w szerokim  za- 
kresie spektralnym,  obejmującym  tzw.  średnią  i daleką 
podczerwień  (od  kilku  do  1000  jim).  Analiza  widma 
absorpcji  dostarcza  wielu  cennych  danych  o drga- 
niach sieci  krystalicznej. 

Absorpcja  promieniowania  na  drganiach  sieci  kry- 
stalicznej może  być  badana  tylko  w kryształach  za- 
wierających niezbyt  dużą  koncentrację  swobodnych 
nośników  ładunku.  W kryształach  metali  i silnie  do- 
mieszkowanych półprzewodników  absorpcja  na  swo- 
bodnych nośnikach  nie  pozwala  obserwować  znacz- 
nie słabszych  pasm  absorpcji  związanych  z drganiami 
sieci. 

Warunkiem  wystąpienia  absorpcji  promieniowania  warunek 
elektromagnetycznego  na  drganiach  sieci  jest  istnie-  absorpcji 
nie  oscylującego  dipolowego  momentu  elektrycznego. 


absorpcja  — 
proces 
kwantowy 


absorpcja 

jednofono- 

nowa 


W kryształach  jonowych  moment  ten  powstaje  w wy- 
niku przeciwf azowego  ruchu  jonów  przeciwnego  zna- 
ku, odpowiadającego  drganiom  optycznym.  W ko- 
mórce elementarnej  zawierającej  dwa  jony  moment 

elektryczny  M wyraża  się  wzorem: 

M = e (16) 

gdzie  e jest  ładunkiem  jonów,  u+  i — odchyleniami 
dodatniego  i ujemnego  jonu  od  położenia  równowagi. 
W bardziej  ścisłych  rozważaniach  należy  uwzględnić 
wkład  do  dipolowego  momentu  elektrycznego  pocho- 
dzący od  deformacji  powłok  elektronowych  atomów, 
która  zachodzi  w czasie  drgań  sieci. 

Absorpcja  promieniowania  jest  procesem  kwanto- 
wym, w którym  mogą  brać  udział  jeden,  dwa  lub  wię- 
cej fononów.  W procesach  tych  obowiązuje  zasada 
zachowania  energii  i kwazipędu.  W oddziaływaniu 
jednofononowym  zasady  te  wymagają  spełnienia  na- 
stępujących warunków: 

tt>foton  = Wfonon,  (17) 


Rys.  21.  Zależność  współczynnika  odbicia  od  długości  fali  dla 
kryształu  NaCl  w różnych  temperaturach 


k = q. 


(18) 


Z wzorów  (17  i (18)  wynika,  że  absorpcja  promie- 
niowania elektromagnetycznego  z towarzyszącą  jej 
emisją  jednego  fononu  zachodzi  wtedy,  gdy  częstość 
fotonu  jest  równa  częstości  fononu,  a wektory  falowe 
fotonu  i fononu  są  zgodnie  skierowane  i równe  co  do 
bezwzględnej  wartości. 

Częstość  fononów  optycznych  jest  zwykle  rzędu 
1013  s“ł.  Częstości  tej  odpowiada  wartość  wektora  fa- 
lowego 2,1  ■ 103  cm-1,  która  jest  o kilka  rzędów  mniej- 
sza od  rozmiarów  strefy  Brillouina.  Można  stąd  wy- 
ciągnąć wniosek,  że  tylko  fonony  znajdujące  się  w po- 
bliżu środka  strefy  Brillouina  mogą  oddziaływać 
z promieniowaniem  elektromagnetycznym.  Ze 
względu  na  bardzo  małą  wartość  wektora  falowego 
tych  fononów  w skali  strefy  Brillouina  mówimy,  że 

mają  one  prawie  zerową  wartość  q. 

Oddziaływania  optyczne  podlegają  określonym 
regułom  wyboru  (— ► Spektroskopia  atomowa).  W wy- 
padku absorpcji  jednofononowej  reguły  te  można 
sformułować  żądając,  aby  dipolowy  moment  elek- 
tryczny wytwarzany  przez  drgania  sieci  był  różny 
od  zera  i miał  składową  równoległą  do  wektora 


elektrycznego  E 
nego,  czyli: 


promieni owania  elektromagnetycz- 
ni 96  0.  (19) 


Jeżeli  przyjmiemy,  że  moment  elektryczny  M jest  rów- 
noległy do  wektora  polaryzacji  e drgań  sieci,  to  pro- 
ste rozważania  doprowadzą  do  wniosku,  że  tylko  fo- 
nony optyczne  poprzeczne  (TO)  oddziałują  z pro- 
mieniowaniem elektromagnetycznym.  Fonony  op- 
tyczne podłużne  (LO)  nie  dają  absorpcji  promienio- 
wania, chociaż  wytwarzają  w krysztale  dipolowy  mo- 
ment elektryczny. 

W kryształach  jonowych  procesy  jednofononowe 
charakteryzuje  bardzo  duży  współczynnik  absorpcji 
(rzędu  10*-106  cm-1).  Do  badania  tej  absorpcji  ko^ 
nieczne  są  bardzo  cienkie  próbki,  które  z różnych 
względów  trudno  jest  otrzymać.  W związku  z tym 
znacznie  wygodniej  jest  badać  współczynnik  odbicia. 
Stosując  odpowiednie  wzory  matematyczne  (tzw.  re- 
lacje Kramersa-Kroniga),  z widma  odbicia  można 
otrzymać  stałe  optyczne,  a w szczególności  współ- 
czynnik absorpcji. 

Pasmo  odbicia  związane  z oddziaływaniem  fotonu 
z fononem  optycznym  nosi  nazwę  reststrahlen  band 
(pasmo  promieni  resztkowych).  Występuje  ono  w 
podczerwieni  przy  długościach  fali  rzędu  kilkudzie- 
sięciu pm.  Rysunek  21  przedstawia  omawiane  pasmo 
odbicia  dla  kryształu  NaCl.  Analiza  pasma  odbicia 
pozwala  otrzymać  częstość  fononu  optycznego  po- 
przecznego (TO)  o wektorze  falowym  q X 0,  jego  czas 
życia  oraz  siłę  oscylatora,  która  określa  wielkość 


sprzężenia  promieniowania  elektromagnetycznego 
z danym  fononem. 

W kryształach  kowalencyjnych  o strukturze  dia- 
mentu (krzem,  german)  atomy  są  neutralne  i elektrycz- 
ny moment  dipolowy  może  pochodzić  tylko  od  de- 
formacji powłok  elektronowych  atomów  wywoływa- 
nej przez  drgania  sieci.  Na  dwóch  identycznych  ato- 
mach w komórce  elementarnej  drgania  sieci  wytwa- 
rzają dipolowe  momenty  elektryczne  równe  co  do 
wielkości,  lecz  przeciwnie  skierowane.  W rezultacie 
całkowity  moment  elektryczny  w komórce  elemen- 
tarnej, a tym  samym  w całym  krysztale  znika.  A za- 
tem w kryształach  tych  nie  zachodzą  procesy  jedno- 
fononowe. W widmie  odbicia  nie  pojawia  się  pasmo 
odbicia  resztkowego,  charakterystyczne  dla  kryszta- 
łów jonowych  lub  kryształów  mających  wiązania 
częściowo  jonowe. 

Do  absorpcji  w kryształach  kowalencyjnych  o struk- 
turze diamentu  przyczyniają  się  głównie  procesy  dwu- 
fononowe.  Oddziaływania  dwufononowe  w tych 
kryształach  związane  są  z dipolowym  momentem 
elektrycznym  drugiego  rzędu,  który  powstaje,  gdy  de- 
formacja powłok  elektronowych  atomów  jest  rezul- 
tatem współdziałania  dwóch  fononów.  Procesy  dwu- 
fononowe występują,  oczywiście,  nie  tylko  w kryszta- 
łach kowalencyjnych.  W kryształach  jonowych  i częś- 
ciowo jonowych  są  jednak  możliwe  inne  mecha- 
nizmy oddziaływania  niż  te,  które  przed  chwilą  przed- 
stawiliśmy. Absorpcja  związana  z procesami  dwufo- 
nonowymi  jest  na  ogół  znacznie  słabsza  niż  absorpcja 
odpowiadająca  procesom  jednofononowym. 

W procesach  dwufononowych  w wyniku  absorpcji 
fotonu  powstają  dwa  fonony  (proces  sumacyjny)  lub 
jeden  fonon  powstaje,  a drugi  znika  (proces  różnico- 
wy). Oddziałujące  fonony  mają  równe  co  do  wiel- 
kości, ale  przeciwnie  skierowane  wektory  falowe. 
W procesach  tych  mogą  brać  udział  fonony  z całej 
strefy  Brillouina,  jeżeli  reguły  wyboru  związane  z sy- 
metrią komórki  elementarnej  nie  zabraniają  oddzia- 
ływań. Rysunek  22  przedstawia  widmo  dwufonono- 
wej  absorpcji  krzemu.  Składa  się  ono  z szeregu  suma- 
cyjnych  pasm  absorpcji,  które  można  przyporządko- 
wać określonym  kombinacjom  dwóch  fononów. 
Analiza  dwufononowego  widma  absorpcji  pozwala 
wyznaczyć  częstość  fononów  w tych  miejscach,  w któ- 
rych funkcja  rozkładu  częstości  drgań  ma  maksima. 

Przy  dużej  zdolności  rozdzielczej  aparatury  pomia- 
rowej w widmie  absorpcji  można  zauważyć  szczegóły 
związane  z punktami  krytycznymi  omawianymi  wy- 
żej. Analiza  widma  absorpcji  pozwala  w takich  razach 
wyznaczyć  częstości  drgań  sieci  w ściśle  określonych 
punktach  strefy  Brillouina.  Do  interpretacji  widma 
absorpcji  konieczna  jest  znajomość  reguł  wyboru, 
które  określają  dozwolone  kombinacje  fononów  w da- 
nym punkcie  krytycznym. 
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absorpcja  Jak  już  wcześniej  zaznaczono,  badanie  procesów 
jednofonono-  jednofononowych  daje  tylko  i nformacje  o fononach  ze 
wa  na  drga-  środka  strefy  Brillouina.  Ograniczenie  to  jest  zwią- 
neach  defefc-  zane  z zasadą  zachowania  kwazipędu  w oddziały- 
tów  waniach  foton-fonon.  Okazuje  się  jednak,  że  można 
„aktywować”  zabronione  oddziały wania jednofonono- 
we  przez  wprowadzenie  do  sieci  krystalicznej  defektów 
(np.  domieszek  chemicznych).  Drgania  specjalnie  do- 
branych defektów  zaledwie  nieznacznie  różnią  się  od 
drgań  atomów  własnych  kryształu.  W czasie  drgań 
defektów  powstaje  oscylujący  dipolowy  moment  elek- 
tryczny, który  oddziałuje  z promieniowaniem  elektro- 
magnetycznym. Jednofononowa  absorpcja  promie- 
niowania elektromagnetycznego  na  drganiach  defek- 
tów odzwierciedla  widmo  częstości  drgań  w prawie 
doskonałym  krysztale. 


Rozproszenie  ramanowskie 

Dotychczas  rozpatrywaliśmy  procesy,  w których  za- 
chodzi absorpcja  fotonu  i powstanie  (emisja)  fono- 
nów. Istnieje  jeszcze  inny  rodzaj  oddziaływań  między 
promieniowaniem  elektromagnetycznym  i kryształem. 
Oddziaływanie  to  prowadzi  do  rozproszenia  fotonu 
z jednoczesnym  powstaniem  (lub  zniknięciem)  fono- 
nów. Nosi  ono  nazwę  rozproszenia  ramanowskiego. 

W doświadczalnych  badaniach  rozproszenia  rama- 
nowskiego na  kryształ  pada  monochromatyczna 
wiązka  światła,  która  ulega  rozproszeniu  we  wszy- 
stkich kierunkach.  Analizuje  się  skład  widmowy  pro- 
anaSiza  pro-  mieniowania  rozproszonego.  W widmie  tym  znajduje- 
mśenśowarcia  my  nie  tylko  częstość  w0  promieniowania  padającego, 
rozproszę-  ale  także  inne  częstości,  mniejsze  i większe  niż  e<v 
rtegc  Analiza  widma  promieniowania  rozproszonego  do- 
starcza informacji  o fononach,  które  biorą  udział 
w procesie  rozproszenia. 

W rozproszeniu  ramanowskim  pierwszego  rzędu 
powstaje  lub  znika  fonon  optyczny  ze  środka  strefy 

Brillouina  (q  X 0).  Rysunek  23  przedstawia  schema- 
tycznie widmo  ramanowskie  odpowiadające  tego 
rodzaju  procesom.  Linia  centralna  o częstości  co0  od- 
powiada rozproszeniu  Rayleigha,  które  zachodzi  bez 
udziału  fononów.  Linia  o częstości  a>A  związana  jest 
z procesem  emisji  jednego  fononu  i nosi  nazwę  linii 
stokesowskiej  — światło  rozproszone  ma  mniejszą 
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częstość  niż  światło  padające.  Linia  o częstości  w2, 
większej  niż  częstość  światła  padającego,  powstaje 
w wyniku  absorpcji  fononu  i nazywa  się  linią  anty- 
stokesowską. 
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Rys.  23.  Schematyczne  widmo  ramanowskie  pierwszego  rzędu 
odpowiadające  oddziaływaniu  z jednym  fononem 


Różnica  (<w0 — cuj  lub  (co2— w0)  określa  częstość  fo- 
nonu biorącego  udział  w procesie  rozproszenia  świa- 
tła. Gdy  w rozproszeniu  jest  czynna  większa  liczba 
fononów,  widmo  ramanowskie  składa  się  z odpowied- 
nio większej  liczby  linii.  Rozmycie  linii  jest  zwykle 
związane  ze  skończonym  czasem  życia  fononów. 

W rozproszeniu  ramanowskim  obserwuje  się  także 
procesy  drugiego  rzędu,  w których  biorą  udział  dwa 
fonony.  Analiza  tych  procesów  dostarcza  danych  o 
fononach  analogicznych  do  danych  z analizy  dwufo- 
nonowych  procesów  absorpcyjnych. 

Rysunek  24  przedstawia  widmo  ramanowskie 
trzech  kryształów  związków  półprzewodnikowych  gru- 
py AinBv.  W widmie  tym  widoczne  są  dwa  silne 
maksima  związane  z fononami  LO  i TO  oraz  słabsze 
maksima  odpowiadające  procesom  drugiego  rzędu. 


GaAs 
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Rys.  24.  Widmo  rozpraszania  ramanowskiego  w kryształach 
GaAS,  InP  i AISb  w temperaturze  pokojowej  (część  antystoke- 
sowska) 


Prawdopodobieństwo  rozproszenia  ramanowskiego  prawdopodo- 
zależy  od  wielkości  zmian  polaryzowalności  elektro-  bieństwo 
nowej  kryształu  wywołanej  przez  drgania  sieci.  Na-  rozproszenia 
tężenie  promieniowania  rozproszonego  w procesach  Ramana" 
jednofononowychjest  zwykle  10*-107  razy  mniejsze  od 
natężenia  promieniowania  padającego. 

Rozproszenie  światła,  przy  którym  powstaje  lub 
znika  fonon  akustyczny,  nazywa  się  rozproszeniem 
Brillouina.  Rozproszenie  to  charakteryzuje  bardzo 


rozproszenie  mała  zmiana  częstości  (rzędu  kilku  cm-1),  która  za- 
Briilouina  leży  od  częstości  światła  padającego.  Dla  procesów 
rozproszenia  ramanowskiego  zmiana  częstości  jest 
mniej  więcej  o dwa  rzędy  wielkości  większa  i ma  war- 
tość stałą,  niezależną  od  częstości  światła  padającego. 
Badanie  rozproszenia  Brillouina  jest  jedną  z metod 
wyznaczenia  współczynników  sprężystości  kryszta- 
łów. 

reguły  Rozproszenie  ramanowskie  podlega  określonym 
wyboru  regułom  wyboru.  Reguły  te  nie  pokrywają  się  z regu- 
łami dla  procesów  absorpcyjnych.  Dlatego  w wid- 
mach ramanowskich  można  często  obserwować  fo- 
nony, które  nie  pojawiają  się  w widmach  absorpcyj- 
nych, np.  w kryształach  o strukturze  diamentu.  W 
rozproszeniu  ramanowskim  pierwszego  rzędu  biorą 
udział  fonony  optyczne  ze  środka  strefy  Brillouina, 
które  nie  mogą  uczestniczyć  w absorpcji  jednofono- 
wej. 

W badaniach  rozproszenia  Ramana  i Brillouina 
stosuje  się  obecnie  lasery  jako  źródła  promieniowania 
pobudzającego.  Odznaczają  się  one  dużą  mocą  i wy- 
soką monochromatycznością.  Dzięki  tym  cechom 
stało  się  możliwe  wykonanie  bardzo  precyzyjnych  ba- 
dań zarówno  procesów  pierwszego,  jak  i drugiego 
rzędu.  Eksperymenty  z określoną  geometrią  i pola- 
ryzacją wiązek  światła  padającego  i rozproszonego 
dostarczają  dokładnych  informacji  nie  tylko  o często- 
ściach fononów,  ale  również  o ich  przynależności  do 
określonej  gałęzi  dyspersyjnej. 

Aktualne  kierunki  badań 

Dynamika  sieci  krystalicznej  jest  jednym  z najstar- 
szych działów  fizyki  ciała  stałego.  Jej  podstawy  te- 
oretyczne zostały  sformułowane  przez  P.  Debye’a, 
M.  Borna  i T.  Karmana  już  w 1912  r.  Przez  długi  jed- 
nak okres  nie  było  odpowiednich  metod  doświadczal- 
nych pozwalających  badać  drgania  sieci.  Wyniki  teorii 
były  kontrolowane  tylko  pośrednio,  poprzez  oblicza- 
nie wielkości  termodynamicznych  i porównywanie 
tych  obliczeń  z wynikami  pomiarów.  Do  wymienio- 
nych celów  zwykle  wykorzystywano  zależność  ciepła 
właściwego  od  temperatury. 

Właściwe  metody  umożliwiające  badanie  własnoścj 
poszczególnych  drgań  normalnych  sieci  krystalicznej 
pojawiły  się  dopiero  w okresie  ostatnich  20  lat. 
W 1955  r.  wykonano  pierwsze  badania  niesprężystego 
rozproszenia  neutronów  powolnych  na  drganiach 
sieci.  Mniej  więcej  od  początku  lat  sześćdziesiątych 


zaczęły  się  pojawiać  coraz  liczniej  prace  stosujące  w 
badaniach  drgań  sieci  technikę  spektroskopii  w pod- 
czerwieni, a w kilka  lat  później  — laserowej  spektro- 
skopii ramanowskiej.  Intensywny  rozwój  badań  ek- 
sperymentalnych stał  się  czynnikiem  stymulującym 
prace  teoretyczne. 

Wśród  aktualnie  prowadzonych  badań  dynamiki 
sieci  krystalicznej  można  wyróżnić  kilka  kierunków. 

Jednym  z nich  jest  niewątpliwie  badanie  dynamiki 
sieci  kryształów  doskonałych,  nie  zawierających  de-  dynamika 
fektów.  Celem  tych  badań  jest  otrzymanie  krzywych  sseci  bez 
dyspersji  i widma  częstości  drgań  dla  rzeczywistych  defektów 
kryształów.  Tematyka  ta  wiąże  się  ściśle  z zagadnie- 
niem oddziaływań  między  atomowych  w kryształach. 

Początkowo  badania  dynamiki  sieci  były  z reguły 
ograniczone  do  kryształów  zawierających  niewiele 
(jeden  lub  dwa)  atomów  w komórce  elementarnej 
i mających  jednocześnie  stosunkowo  prostą  strukturę 
krystaliczną  o wysokiej  symetrii.  Obecnie  coraz  czę- 
ściej spotyka  się  prace  dotyczące  kryształów  o zło- 
żonej budowie.  Specjalne  miejsce  w tych  badaniach 
zajmują  kryształy  molekularne,  w których  oprócz 
zwykłych  drgań,  nazywanych  czasem  drganiami  trans- 
lacyjnymi,  występują  drgania  torsyjne  (skrętne)  oraz 
drgania  atomów  wewnątrz  molekuł. 

Oprócz  dalszego  zainteresowania  dynamiką  sieci 
kryształów  doskonałych,  od  początku  lat  sześćdzie- 
siątych zaczął  się  silny  rozwój  nowego  kierunku  ba- 
dań, który  można  określić  jako  dynamikę  sieci  krysz-  dynamika 
tałów  zawierających  defekty  i niedoskonałości.  Znacz-  sieci 
na  grupa  prac  w tej  dziedzinie  koncentruje  się  wokół  z defektami 
zagadnień  wpływu  na  widmo  drgań  sieci  małej  kon- 
centracji defektów  punktowych.  Wiele  uwagi  poświę- 
ca się  także  badaniu  dynamiki  nieuporządkowanych 
kryształów  mieszanych,  chociaż  napotyka  się  tutaj 
znacznie  większe  trudności  teoretyczne  niż  przy  de- 
fektach punktowych.  Interesujące  zagadnienia,  któ- 
rych badania  znajdują  się  dopiero  w początkowym 
stadium,  są  związane  z dynamiką  substancji  amor- 
ficznych (bezpostaciowych). 

Dokonując  przeglądu  aktualnych  kierunków  badań 
nie  sposób  pominąć  obszernej  dziedziny,  jaką  stanowi 
badanie  oddziaływań  fononów  z innymi  kwazicząst- 
kami w krysztale,  takimi  jak  elektrony,  plazmony, 
magnony  i in.  Poznanie  tych  oddziaływań  jest  nie- 
zbędne do  pełniejszego  zrozumienia  szeregu  własności 
fizycznych  kryształów. 

W.  Cochran  The  Dynamics  cf  Atoms  in  Crystals,  New  York 
1974;  B.  Donovan,  J.  F.  Angress  Lattice  Vibrations,  London 
1971 ; J.  A.  Reissland  The  Physics  of  Phonons , London  1973. 


Wzbudzenia  elementarne  w ciałach 
stałych 

Jerzy  Czerwonko 


Ogólne  pojęcie  wzbudzenia 

Wyobraźmy  sobie  dowolny  układ  fizyczny  o skwan- 
towanych  poziomach  energetycznych  Ek  <Jc  — 0, 
1,  2 ...);  załóżmy  np.,  że  Ek  rośnie  wraz  z k.  Układ 
może  znajdować  się  w stanie  podstawowym,  tj.  w sta- 
nie o energii  najniższej  E0i  lub  też  w którymś  ze  sta- 
nów wzbudzonych,  o energii  Ek  (k> 0).  Energię 
energia  Ek—E0  (k> 0)  nazywamy  energią  wzbudzenia.  Jeśli 
wzbudzenia  układ  jest  izolowany  i znajduje  się  w którymś  ze  sta- 
nów o energii  Ek  ( k = 1,  2,  3, ...),  to  pozostanie  w tym 
stanie  nieskończenie  długo,  ze  względu  na  prawo  za- 
chowania energii;  stany  wzbudzone  układu  będą  więc 
stanami  stabilnymi.  Żaden  z układów  fizycznych  nie 
jest  jednak  izolowany  dokładnie,  chyba  że  myślimy 
ewentualnie  o tak  skomplikowanym  układzie  fizycz- 
nym, jakim  jest  Wszechświat.  (Owo  „ewentualnie” 


ma  dodatkowy  sens,  bowiem  dla  współczesnej  ko- 
smologii kwestia  izolacji  Wszechświata  nie  jest  by- 
najmniej sprawą  trywialną).  Jeśli  rozpatrywany  układ  slabu!  ność 
nie  jest  izolowany,  a oddziaływanie  układu  z otoczę-  stanów 
niem  jest  odstatecznie  słabe,  to  stany  wzbudzone  nie  wzbudzonych 
są  stabilne  — stabilny  jest  tylko  stan  podstawowy. 

Ten  ostatni  fakt  można  łatwo  zrozumieć,  jeśli  się 
uwzględni,  że  prawo  zachowania  energii  obowiązuje 
obecnie  w układzie  rozszerzonym:  układ  + otocze- 
nie. Wobec  tego,  nawet  przy  dowolnie  słabym  oddzia- 
ływaniu z otoczeniem,  układ  w stanie  wzbudzonym 
może  oddać  energię  otoczeniu  i przejść  do  stanu  pod- 
stawowego. Z drugiej  strony,  przejście  ze  stanu  pod- 
stawowego do  wzbudzonego  jest  możliwe  tylko  wte- 
dy, gdy  otoczenie  może  dostarczyć  układowi  w jed- 
nej chwili  energię  Ex-E0  lub  większą,  co  jest  osią- 
galne jedynie  przy  dostatecznie  silnym  oddziaływa- 
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niu.  Jak  widzimy,  istnieje  wyraźna  analogia  między 
stanem  podstawowym  a stanem  równowagi  trwałej 
i stanem  wzbudzonym  a stanem  równowagi  chwiejnej. 

Zgodnie  z podstawowymi  zasadami  mechaniki 
kwantowej  przejście  układu  ze  stanu  k do  jakiegokol- 
wiek innego  stanu  nie  odbywa  się  „na  komendę”,  lecz 
w sposób  statystyczny.  Przejście  to  można  scharakte- 
ryzować średnim  czasem  przebywania  w danym  sta- 
nie, zwanym  inaczej  średnim  czasem  życia  danego 
stanu  lub  też  czasem  relaksacji  r*.  Przejściu  ze  stanu 
k>0  do  stanu  k — 0 odpowiada  zmiana  energii  ukła- 
du o Ek-E0  (której,  zgodnie  z mechaniką  kwantową, 
odpowiada  częstość  vk  = (Ek-E0)!h,  gdzie  h jest 
stałą  Plancka)  oraz  emisja  fali  o tej  częstości  (może 
to  być  np.  fala  elektromagnetyczna).  Zwróćmy  uwa- 
gę, że  informacje  o różnicy  poziomów  energii  uzyskuje 
się  wyłącznie  na  podstawie  pomiaru  częstości  fal,  jeśli 
włączyć  tu  również  fale  opisujące  cząstki.  Stąd,  jeśli 
vic^>  1 Irk,  to  jest  możliwe  określenie  częstości  fali  w cza- 
sie życia  poziomu  (oscylacja  w czasie  życia  poziomu 
zachodzi  wielokrotnie),  jeśli  zaś  częstość  vk  jest  po- 
równywalna z l/u*  lub  mniejsza,  to  częstości  precy- 
zyjnie określić  się  nie  da.  Dlatego  też  nie  powinno 
zaskakiwać  nazwanie  takich  wzbudzeń,  dla  których 
vkTk>ly  tj.  (Ek  — E0)zk>h,  wzbudzeniami  dobrze  okre- 
ślonymi. Zwróćmy  uwagę  na  związek  powyższych 
rozważań  z zasadą  nieokreśloności  dla  energii,  którą 
zapisać  można  w postaci  AE  At  ^ h/lK. 

Aby  łatwiej  uzmysłowić  sobie  sens  warunku  dobrej 
określoności  wzbudzeń,  odwołajmy  się  do  analogii 
akustycznej,  podanej  przez  twórcę  cybernetyki  N. 
Wienera.  Jak  wiadomo  wysokość  dźwięku  jest  zwią- 
zana z najniższą  częstością  w nim  występującą  czyli 
częstością  podstawową.  Dźwięk  będzie  czysty,  jeśli 
oprócz  tej  częstości  wystąpią  w nim  wyłącznie  czę- 
stości harmoniczne  będące  wielokrotnościami  czę- 
stości podstawowej.  Aby  można  było  wyczuć  perio- 
dyczność  związaną  z częstością  podstawową,  tj.  aby 
była  ona  „dobrze  określona”,  potrzeba,  aby  co  naj- 
^>1,  przy  czym  z to  tym  razem  czas  trwania 
dźwięku,  v zaś  — jego  częstość  podstawowa.  Stąd  też, 
jeśli  włączyć  dźwięk  na  czas  krótszy  niż  okres  drgań 
dźwięku,  to  odbierzemy  wrażenie  dźwięku  nieczyste- 
go. Dlatego  właśnie  jest  niemożliwe  czyste  zagranie 
polki  czy  taranteli  przy  wykorzystaniu  dźwięków  naj- 
niższych, np.  przy  grze  na  organach  — włączanych 
pedałami. 


Układy  wielu  cząstek;  cząstki  Fermiego 

Wyobraźmy  sobie  obecnie  ciąg  poziomów  energii 
Ek  (k  = 0,  1,  2,  ...)  takich,  że  Ek+i>Ek  przy  />0. 
Poziomy  te  są  ponadto  niezwyrodniale,  tzn.  każdemu 
poziomowi  Ek  odpowiada  dokładnie  jeden  stan.  Na 
poziomach  tych  mogą  znajdować  się  cząstki  podlega- 
jące statystyce  Fermiego,  oddziałujące  ze  sobą  na 
tyle  słabo,  że  energia  E układu  może  być  z dobrą  do- 
kładnością zapisana  jako 

E0N0+EM+EM+  ...  -f  EkNk  -j-  ...» 

gdzie  Np,  Nu  Nz>  ...,  Nk , ...»  to  liczby  przybierające 
wartości  zero  lub  jeden,  a określające  ile  cząstek  znaj- 
duje się  na  poziomach  E0,  Elf  E2y  ...,  Ek, ...  (Ze  wzglę- 
du na  związek  spinu  ze  statystyką,  wynikający  z re- 
latywistycznej kwantowej  teorii  pola,  cząstki  podle- 
gające statystyce  Fermiego  mają  spin  połówkowy,  co 
oznacza,  że  w zerowym  zewnętrznym  polu  magne- 
tycznym zwyrodnienie  każdego  poziomu  jest  pa- 
rzyste; podkreślmy  jednak,  że  rozważamy  sytuację 
modelową  — brak  zwyrodnienia).  Jeśli  liczba  cząstek 
Fermiego  jest  ustalona,  tzn.  gdy  ^+#1+^2+ 
...  +Nk  = N = const,  to  układ  ma  najniższą  ener- 
gię przy  Nk  = 1 dla  k = 0,  1,  2,  ....  N-l  i Nk  = 0 
dla  k^N.  Tak  więc  stany  z k^N—1  są  obsadzone, 
a stany  z k^N  są.  puste.  Można  również  łatwo  okre- 
ślić wzbudzenia  podanego  układu.  Jeśli  cząstkę  ze 
stanu  k^N—  1 przenieść  do  stanu  l^N,  to  energia 
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powstałego  w ten  sposób  stanu  będzie  wyższa  od  ener-  antycząstki 
gii  stanu  podstawowego  Eg  = E$ -f- E± -f~  £2 + . . . -f- En—\  a dziury 
0 Ei  — Ek , przy  czym  Ei  — Ek  musi  być  dodatnie  przy 
l>k.  Powstały  stan  można  opisać  następująco:  w sta- 
nie k powstała  antycząstka,  w stanie  / zaś  — cząstka. 

Termin  „antycząstka”  użyty  tu  zgodnie  z A.  A. 

Abrikosowem,  nie  jest  bynajmniej  powszechny  w li- 
teraturze naukowej ; częściej  używa  się  wówczas  okre- 
ślenia „dziura”.  Jest  ono  jednak  mylące  ponieważ,  jak 
widać  z powyższego,  ujemność  masy  efektywnej,  isto- 
tna przy  określeniu  dziury  w teorii  pasmowej  (->  Dy- 
namika elektronu  w ciałach  stałych),  nie  była  tu  w ogó- 
le brana  pod  uwagę.  Można  powiedzieć,  że  jeśli  anty- 
cząstka znajduje  się  tak  blisko  maksimum  pasma 
walencyjnego,  że  jej  masa  efektywna  jest  ujemna,  to 
jest  dziurą.  Pojęcie  antycząstki  jest  więc  pojęciem 
ogólniejszym  od  pojęcia  dziury,  z tym  że  antyczą- 
stki w półprzewodnikach,  przy  dostatecznie  niskich 
temperaturach,  są  dziurami. 

Używając  pojęcia  cząstki  i antycząstki  można  opi- 
sać wszystkie  wzbudzenia  rozpatrywanego  układu 
o energii 

Eix+Ei2+  ...  Eig— EkL— Ek2~ Eks 

przy  /i,/2, ...,  i kx,k2,  ...,  ks^N—  1 z cząstka- 

mi występującymi  w stanach  ll9  /2, ...,  / i antycząstka- 
mi  w stanach  kl9  k2,  k3,  ...,  ks.  Również  wszystkie 
wzbudzenia  układu  nie  oddziałujących  ze  sobą  czą- 
stek Fermiego  można  opisać  nie  zakładając,  że  stany 
dla  k = 0,  1,  2,  ...  są  niezwyrodniałe,  tj.  podając  zwy- 
rodnienie stanów,  określane  liczbami  naturalnymi 
gk  wyrażającymi,  ile  mamy  stanów  kwantowych 
o energii  Ek. 

Związek  między  rozpatrywanym  modelem  a struk-  związek  ze 
turą  elektronową  ciał  stałych  jest  dość  oczywisty,  strukturą 
Stanom  zajętym  w przedstawianym  tu  modelu,  gdy  elektronową 
energia  całkowita  ma  najmniejszą  wartość,  odpo- 
wiadają stany  spod  powierzchni  Fermiego  w meta- 
lach i stany  pasma  walencyjnego  w półprzewodni- 
kach; stanom  pustym  — stany  znad  powierzchni 
Fermiego  i stany  pasma  przewodnictwa. 


Oddziałujące  cząstki  Fermiego;  wzbudzenia 
elementarne;  kwazicząstki 


Dotychczas  zakładaliśmy,  że  cząstki  z sobą  nie  od- 
działują, co  może  być  jedynie  przybliżeniem  — gor- 
szym lub  lepszym.  Oddziaływanie  cząstek  prowadzi 
do  wymiany  energii  między  nimi.  Wydzielmy  myślo- 
wo jedną  z cząstek  układu;  pozostałe  potraktujmy 
jako  jej  otoczenie.  Rozważania,  podobne  do  przepro- 
wadzonych poprzednio,  wykazują,  że  jeśli  oddziały- 
wanie międzycząstkowe  (a  więc  i oddziaływanie  wy- 
dzielonej cząstki  z otoczeniem)  jest  dostatecznie  słabe, 
to  spowoduje  niewielkie  przesunięcia  poziomów  ener- 
getycznych wydzielonej  cząstki,  a także  ich  niestabil- 
ność. Poziomom  energetycznym  cząstki  można  więc 
przypisać  średni  czas  życia.  Analogicznie,  przy  do- 
statecznie słabych  oddziaływaniach  poziomy  jedno- 
cząstkowe,  a więc  wzbudzenia  układu,  będą  dobrze 
określone. 

Z drugiej  strony,  trudno  jednak  oprzeć  się  wrażeniu, 
że  kryterium  słabości  oddziaływania  cząstek  między 
sobą  rzadko  jest  spełnione  w ciałach  stałych.  Aby  to 
uzasadnić,  rozpatrzmy  np.  elektrony  przewodnictwa 
w metalu.  Wiadomo  z teorii  pasmowej,  że  oddziały- 
wanie z jonami  zmienia  w sposób  zasadniczy  własno- 
ści elektronów  przewodnictwa,  np.  ich  masy  efek- 
tywne. Oddziaływanie  to  ma  charakter  głównie  elek- 
trostatyczny, czyli  jest  określone  przez  średnią  od- 
ległość pomiędzy  elektronem  i jonem.  Elektrony  od- 
działują ze  sobą  również  elektrostatycznie,  a że  jest 
ich  mniej  więcej  tyle  samo  co  i jonów,  więc  średnia 
odległość  między  elektronami  będzie  zbliżona  do 
średniej  odległości  między  elektronem  i jonem.  Dzięki 
temu,  oddziaływanie  elektronów  między  sobą  po- 
winno być  wielkością  tego  samego  rzędu  co  oddziały- 
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wanie  elektronów  z jonami,  które  modyfikuje  w spo- 
sób zasadniczy  własności  układów  elektronów.  Od- 
działywanie elektron-elektron  powinno  zatem  istot- 
nie modyfikować  własności  układów  elektronów. 

Powstaje  pytanie,  czy  w warunkach  występujących 
w ciałach  stałych  można  w ogóle  mówić  o dobrze 
określonych  wzbudzeniach.  Okazuje  się,  że  można, 
i że  na  przykład  cząstka  i antycząstka  w metalach  le- 
żące dostatecznie  blisko  powierzchni  Fermiego,  tj. 
o energiach  bliskich  energii  Fermiego  Ef , tak  że  ener- 
gia cząstki  lub  antycząstki  E spełnia  nierówność 
\E-Ef\<Ef , są  typowymi  przykładami  wzbudzeń 
dobrze  określonych.  Podobnie  przedstawia  się  z re- 
guły sprawa  z elektronami  i dziurami  w półprzewod- 
nikach, jeśli  mamy  do  czynienia  ze  wzbudzeniami  po- 
łożonymi odpowiednio  blisko  ekstremów  pasm.  Dla- 
czego tak  jest?  Wyjaśnijmy  ten  fakt  na  przykładzie 
elektronów  w metalu.  Jak  wiadomo,  pod  powierzch- 
nią Fermiego  znajdują  się  stany  zajęte  przez  elektro- 
ny, ponad  nią  — stany  puste.  Elektron  można  opisać 

podając  liczby  kwantowe  kwazipędu  p,  energii  oraz 
pasma,  do  którego  należy  elektron.  Oddziaływanie 
międzyelektronowe  prowadzi  do  rozpraszania  elek- 
tronów na  elektronach,  tj.  do  przekazywania  sobie 
nawzajem  przez  elektrony  energii  i kwazipędu.  W każ- 
dym akcie  rozpraszania  musi  być  zachowana  całko- 
wita energia  oraz  całkowity  kwazipęd  elektronów 
(dokładniej  — kwazipęd  musi  być  zachowany  z do- 
kładnością do  wektora  sieci  odwrotnej  pomnożonego 
przez  stałą  Plancka).  Ponadto  elektrony  — ze  względu 
na  zasadę  Pauliego  — muszą  trafić  po  rozproszeniu 
do  stanów  nie  zajętych  przez  elektrony. 

Ów  akt  rozpraszania  można,  zgodnie  z podstawami 
mechaniki  kwantowej,  ująć  również  w sposób  sta- 
tystyczny. Mianowicie,  prawdopodobieństwo  roz- 
proszenia określonego  stanu  w jednostce  czasu,  od- 
wrotnie proporcjonalne  do  średniego  czasu  życia  da- 
nego stanu,  będzie  tym  większe,  im  więcej  jest  stanów 
końcowych,  w które  może  przejść  dany  stan.  Aby 
uściślić  te  rozważania  załóżmy,  że  na  kwazipęd  narzu- 
cono warunki  Boma-Kdrmana  (— ► Struktura  elek- 
tronowa ciał  stałych),  tj.  że 

px  = hnxfL,py  — hnyjL,pz  = hnz/L , 

przy  czym  h jest  stałą  Plancka,  L — długością  krawę- 
dzi sześciennej  kostki  kryształu,  px , Py,  Pz  — składo- 
wymi pędu  elektronu  odpowiednio  w kierunku  x,  y , z, 
zaś  nx,  ny,  tiz  — liczbami  całkowitymi  leżącymi  w prze- 
dziale — A/2+1,  A/2,  gdzie  A3  jest  liczbą  komórek 
w krysztale.  Załóżmy,  że  zależność  energii  od  pędu 
jest  najprostsza,  tj. 

E{px,  py,  pz)  = (p*+/>2+/>P/2m*, 

przy  czym  m*  jest  masą  efektywną.  Niech  stan  pod- 
stawowy układu  będzie  scharakteryzowany  przez  ob- 
sadzenie wszystkich  stanów  z 


Pl+Pl+Pi<Pi> 

czyli 

i£+*J+i£  < 

i nieobsadzenic  wszystkich  pozostałych  stanów;  za- 
łóżmy dodatkowo,  że  L2p£//r<  A2/4  po  to,  aby  wszy- 
stkie stany  obsadzone  mieściły  się  w strefie  Brillouina. 
Cząstki  jako  wzbudzenia  będą  występowały  przy 
nl+nl+nl>L2p*/h*t  antycząstki  zaś — przy  nierów- 
ności odwrotnej.  Niech  w układzie  znajduje  się  czą- 
stka z liczbami  nx,  ny , nz  oraz  antycząstka  z nx , ny , n£. 
Jeśli  w wyniku  rozproszenia  mamy  otrzymać  również 
cząstkę  z mx,  my , mz  oraz  antycząstkę  z mx , my , mz  to 
jako  rezultat  praw  zachowania  pędu  i energii  mamy : 
nx—n'x  = mx—mx  itd.  dla  składowych  y i z,  oraz 

^ “ n»  “ n*  = 

m*.  Nietrudno  zauważyć,  że  im  bardziej 
ti2+/i2  + w2  oraz  ji*2+Jt*2+fl£*  odległe  są  od  L“pF/h\ 
tj.  odVpowierzchni  Fermiego,  tym  większe  są  możli- 


wości wyboru  liczb  mx,  my , mz  oraz  mx,  my,  mz.  Do- 
kładniejsza analiza  wykazuje,  że  liczba  stanów, 
w które  może  przejść  cząstka  czy  też  antycząstka 

0 energii  E , jest  proporcjonalna  do  Ef  (1  — E/EF)2, 
gdzie  Ef  = P2F/2m * jest  energią  Fermiego. 

Dotychczas  nie  określaliśmy  energii  wzbudzeń 
cząstki  czy  też  antycząstki,  zawsze  określano  energię 
wzbudzenia  układu  złożonego  z cząstek  i antyczą- 
stek.  Właściwą  definicję  energii  wzbudzenia  pojedyn-  energia 
czego  otrzymamy,  jeśli  będziemy  dążyli  z energiami  wzbudzenia 
wszystkich  wzbudzeń,  z wyjątkiem  jednego,  do  ener-  pojedynczego 
gii  Ef,  tzn.  do  niewzbudzania  innych  antycząstek  — 
lub  cząstek.  W efekcie  da  to  Ek-EF  dla  cząstek 

1 Ef-Ejc  dla  antycząstek,  co  można  zapisać  jako 
\Eic-EF\.  Porównanie  energii  wzbudzenia  z przyto- 
czonym wyżej  rzędem  wielkości  odwrotności  czasu 
życia  wskazuje,  że  przy  | E — Ef\  ^ Ef  wzbudzenia  po- 
winny być  dobrze  określone.  Dla  rozpatrywanego 
przez  nas  izotropowego  modelu  energie  wzbudzeń 
układu  cząstka-antycząstka  będą  dane  w obszarze 
energii,  w którym  wzbudzenia  te  są  dobrze  określone 
(przy  p^pf),  przez 

Ep  = \p*  — pzF\l2m*  = \p-Pf\  ( p+pF)l2m*x 
X \P-Pf\V, 

gdzie  V = pf/hi*  nazywa  się  prędkością  cząstek  na 
powierzchni  Fermiego.  Co  więcej,  nawet  dla  układów 
silnie  oddziałujących,  dowolne  wzbudzenie  o odpo- 
wiednio małej  energii  — w skali  Ef  — da  się  zestawić  pojęcie  wzbu- 
z określonych  wyżej  cząstek  i antycząstek,  co  znaczy,  dzema  eSe- 
że  są  to  wzbudzenia  elementarne.  W takim  sensie  bę-  mentarnego 
dziemy  używali  tego  pojęcia  również*  dla  innych 
układów  fizycznych.  Nadmieńmy,  że  przedstawione 
rozważania  dotyczą  nie  tylko  rozpatrywanego  tutaj 
jako  przykład  układu  izotropowego.  Dodajmy  rów- 
nież, że  sprawa  wzbudzeń  elementarnych  staje  się 
bardziej  skomplikowana  w wypadku  elektronów 
w nadprzewodnikach,  mimo  iż  podział  wzbudzeń 
elementarnych  na  cząstki  i antycząstki  pozostaje  aktu- 
alny. 

Przedstawiony  wyżej  mechanizm  rozpraszania  czą- 
stek Fermiego  na  sobie,  a więc  m.in.  elektronów  na 
elektronach  w ciałach  stałych,  nie  jest  jedynym  me- 
chanizmem prowadzącym  do  powstania  niestabil- 
ności wzbudzeń  elementarnych.  Innym  mechanizmem 
jest  np.  rozpraszanie  na  kwantach  drgań  sieci  (a  więc 
fononach)  oraz  domieszkach  i wszelkiego  rodzaju 
niedoskonałościach  struktury  kryształu.  Niemniej 
jednak,  działanie  dodatkowych  mechanizmów  roz- 
praszania nie  sprawia,  przynajmniej  dla  dostatecznie 
czystych  i pozbawionych  defektów  kryształów,  że 
wzbudzenia  przestają  być  dobrze  określone  dla  wzbu- 
dzeń o dostatecznie  niskiej  energii.  Rozpatrywano 
tu  również  wzbudzenia  ze  stanu  podstawowego, 
w którym  układ  znajduje  się  jedynie  w temperaturze 
zera  bezwzględnego,  jak  wiadomo  — nieosiągalnej. 

Okazuje  się  jednak,  że  sytuacja  pozostaje  jakościowo  wpływ  tem- 
niezmieniona,  dopóki  temperatura  bezwzględna  w peratury  na 
skali  energetycznej  kT  ( k — stała  Boltzmanna)  jest  okrośloność 
dostatecznie  niska.  Warto  przy  tym  zwrócić  uwagę,  wzbudzenia 
że  stwierdzenie,  czy  &rjest  małe,  nie  jest  sprawą  tak 
prostą  jak  dla  wielkości  bezwymiarowej.  W tym  wy- 
padku określenie  niska  czy  też  wysoka  temperatura 
zależy  od  rozpatrywanego  układu  jak  i rozpatrywane- 
go zjawiska.  Jeżeli  oddziaływanie  elektronów  z fo- 
nonami można  pominąć,  to  w metalach  jedyną  wiel- 
kością o wymiarze  energii,  określającą  układ  elektro- 
nów jest  Ef,  przy  czym  EF/k  ~ 5- 104  K (->  Metale), 
a więc  dla  metali  wystarczy  niekiedy  spełnić  nierów- 
ność T<  5-104  K. 

Jeśli  rozpatrywać  bardziej  skomplikowane  zależ- 
ności energii  elektronów  od  wektora  kwazipędu 
i uwzględniać,  że  może  być  więcej  pasm  częściowo 
zapełnionych,  to  model  gazu  nieoddziałujących  elek- 
tronów opisuje  dobrze  jakościowo,  a niekiedy  i ilo- 
ściowo, własności  elektronowego  układu  metali,  mi- 
mo że  oddziaływanie  elektronów  między  sobą  jest 
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mniej  więcej  tak  samo  silne  jak  oddziaływanie  elek- 
tronów z siecią  krystaliczną.  Jest  w ogóle  rzeczą  za- 
dziwiającą, jak  bardzo  przydaje  się  model  idealnego 
gazu  kwantowego  (Fermiego  lub  Bosego)  przy  opisie 
niskotemperaturowych  własności  wielu  układów 
fizycznych  z silnym  oddziaływaniem.  Fakt  ten  wyjaś- 
niono dopiero  na  gruncie  kwantowej  teorii  wielu  ciał 
w latach  pięćdziesiątych ; wyjaśnienie  to  było  właści- 
wie oparte  na  rozważaniach  analogicznych  do  prze- 
prowadzonych rozważań  czasów  życia  poziomów  an- 
tycząstkowych  i cząstkowych  w pobliżu  powierzchni 
Fermiego.  Niezależnie  od  tego  nie  należy  sobie  wy- 
obrażać, że  wzbudzenie  w układzie  silnie  oddziałują- 
cych cząstek  Fermiego  polega  na  przesunięciu  realnej 
cząstki  spod  powierzchni  Fermiego  nad  tę  powierzch- 
nię należy  to  rozumieć  w ten  sposób,  że  istnieje  wza- 
kwazicząstki  jemnie  jednoznaczna  odpowiedniość  pomiędzy  wzbu- 
i kwazianty-  dzeniami  realnego  układu  i wzbudzeniami  idealnego 
cząstki  układu  nieoddziałujących  cząstek,  pod  warunkiem, 
że  wzbudzenia  mają  dostatecznie  niską  energię.  Dla- 
tego też  słuszniejsze  jest  nazwanie  tych  wzbudzeń 
realnego  układu  odpowiednio  kwazicząstkami  lub  też 
kwaziantycząstkami , a ogólnie  — kwazicząstkami. 
Koncepcja  kwazicząstek,  uzasadniona  tutaj  w odnie- 
sieniu do  układów  cząstek  Fermiego,  znajduje  po- 
wszechne zastosowanie  we  współczesnej  fizyce  fazy 
skondensowanej,  a więc  i ciała  stałego.  Mówiąc  ogól- 
nie, kwazicząstki  to  wyidealizowany  układ  gazowy, 
którego  wzbudzenia  o niskiej  energii  odpowiadają 
we  wzajemnie  jednoznaczny  sposób  wzbudzeniom 
układu  realnego.  Koncepcja  kwazicząstek  jest  kon- 
cepcją naczelną  w dalszej  części  tego  artykułu. 


Trochę  o fononach; 

wzbudzenia  w kryształach  kwantowych 

Dotychczas  rozpatrywaliśmy  wyłącznie  wzbudzenia 
układów  cząstek  Fermiego,  przy  czym  wzbudzenia 
ich  podlegały  również  statystyce  Fermiego.  Nasze 
rozważania  pozwoliły  na  wprowadzenie  ogólnej  kon- 
cepcji kwazicząstki.  Charakterystycznym  przykładem 
kwazicząstek  typu  Bosego,  i to  niezależnie  od  sta- 
ronony  tystyki  atomów  tworzących  kryształ,  są  fonony. 

(Omówiono  je  w artykule  „Dynamika  sieci  krysta- 
licznej”). Wiadomo  stamtąd,  że  w przybliżeniu  har- 
monicznym fonony  są  stabilne,  tzn.  że  ich  liczba  przy 
ustalonym  wektorze  falowym  i polaryzacji  jest  stała 
w czasie.  Wiadomo  również,  że  efekty  anharmoniczne 
prowadzą  do  niestabilności  fononów  i,  z drugiej  stro- 
ny, również  do  przesunięcia  ich  poziomów  energii, 
przy  czym  wzbudzenia  są  w dalszym  ciągu  dobrze 
określone,  zaś  zmiany  poziomów  energetycznych  nie- 
wielkie, jeżeli  człony  anharmoniczne  są  dostatecznie 
słabe.  Jest  to  spełnione  przy  dostatecznie  małej  ampli- 
tudzie drgań  atomów,  tj.  gdy  A<śa,  przy  czym  A jest 
amplitudą  drgań,  zaś  a — stałą  sieci.  Jeśli  mechanika 
klasyczna  opisywałaby  kryształ,  to  odpowiednio  małe 
amplitudy  zgadzałyby  się  z odpowiednio  małymi  ener- 
giami wzbudzeń,  przy  zerowym  wzbudzeniu  ampli- 
tuda byłaby  zerowa.  Dlatego  też,  przy  dostatecznie 
niskich  temperaturach,  człony  anharmoniczne  byłyby 
pomijalnie  małe.  Do  tego  ujęcia  wnosi  istotne  „ale” 
kwantowość  zjawiska,  ze  względu  na  drgania  zerowe 
atomów,  zachodzące  nawet  w temperaturze  zera  bez- 
względnego. Jeżeli  ich  amplituda  jest  znacznie  mniej- 
sza od  stałej  sieci  a,  to  jesteśmy  bliscy  obrazu  klasycz- 
nego i przy  odpowiednio  niskich  temperaturach  przy- 
bliżenie harmoniczne  ma  sens.  Jeżeli  jednak  ta  ampli- 
tuda jest  porównywalna  z a — to  przybliżenie  harmo- 
niczne nie  będzie  dobre  nawet  w temperaturze  zera 
bezwzględnego ; ten  rodzaj  kryształów  nazywa  się 
kryształy  kryształami  kwantowymi.  Typowym  przykładem  kry- 
kwantowe  ształów  kwantowych  są  kryształy  obydwu  izotopów 
helu,  o masach  atomowych  3 i 4;  kryształy  takie  istnie- 
ją w temperaturach  rzędu  paru  stopni  Kelvina,  przy 
ciśnieniach  powyżej  25  hPa  (4He)  i 30  hPa  (3He). 
Ogólnie  — im  mniejsza  masa  atomowa,  tym  większa 
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tendencja  do  kwantowości  kryształu;  tendencję  tę 
można  ocenić  jakościowo  nawet  przy  użyciu  modelu 
harmonicznego,  jeśli  obliczyć  amplitudę  drgań  zero- 
wych. 

Ponieważ  dla  kryształów  niekwantowych  model 
harmoniczny  powinien  być  dobry  przy  odpowiednio 
niskich  temperaturach,  a w modelu  harmonicznym  fo- 
nony są  stabilne  — więc  przy  tak  niskich  tempera- 
turach wzbudzenia  będą  dobrze  określone  dla  wszy- 
stkich wektorów  falowych  k i polaryzacji  X.  Podobna 
sytuacja  może  wystąpić  również  wówczas,  gdy  efekty 
anharmoniczne  są  istotne,  a więc  przy  wyższych  tem- 
peraturach, bądź  też  dla  kryształów  kwantowych. 
W tych  obydwu  wypadkach  fonony  również  istnieją, 
choć  przejawiają  bardziej  złożoną,  bardziej  kwazi- 
cząstkową  strukturę.  Warto  dodać,  że  niezależnie  od 
struktury  kwazicząstek  fononowych,  z faktu  że  liczba 


fononów  w danym  stanie  (k,  X)  może  być  nieograniczo- 
na, wynika,  że  są  to  cząstki  Bosego,  niezależnie  od 
statystyki  atomów  kryształu. 

Pozostańmy  nadal  przy  kryształach  kwantowych. 
Odmienny  charakter  wzbudzeń  fononowych  nie  jest 
ich  jedyną  cechą  specyficzną.  Odmiennie  niż  w innych 
niekwantowych  kryształach  przebiega  tam  również 
proces  dyfuzji.  Jest  to  proces  samodyfuzji,  czyli  przy- 
padkowego błądzenia  atomów  wśród  pozostałych 
atomów  kryształu,  identycznych  z błądzącymi.  Ato- 
my błądzące  wykorzystują  przy  tym  głównie  istnienie 
niezajętych  miejsc  w sieci  krystalicznej,  zwanych  lu- 
kami. Dyfuzja  polega  na  zajęciu  luki  przez  sąsiedni 
atom,  co  tworzy  lukę  w odpowiednim  sąsiednim  węźle, 
kolejnym  zajęciu  tej  luki  przez  sąsiedni  atom,  co  po- 
woduje powstanie  luki  w nowym  miejscu,  itd.  Jeśli 
potraktować  lukę  jako  antycząstkę  (str.  558,  zwróćmy 
uwagę,  że  tam  była  mowa  o poziomach  energetycz- 
nych, tu  zaś  o miejscach  w sieci)  to  można  cały  proces 
opisać  jako  dyfuzję  luki  (rys.  1). 

Wszystkie  czyste  substancje,  poza  3He  i 4He,  w od- 
powiednio niskich  temperaturach  przechodzą  w stan 
stały,  również  przy  zerowym  ciśnieniu  zewnętrznym. 
Wynika  stąd,  że  kryształ  z wszystkimi  węzłami  regu- 
larnej sieci  krystalicznej  zajętymi  przez  atomy  ma 
najniższą  energię.  Powoduje  to  powstanie  barier 
energii  potencjalnej  między  węzłami  sieci.  Bariery 
takie  uniemożliwiają  przeskok  atomu  do  sąsiedniego 
miejsca,  nawet  jeżeli  jest  tam  luka,  dopóki  atom  nie 
uzyska,  dzięki  wzbudzeniu  termicznemu  energii  wy- 
starczającej do  pokonania  bariery  potencjału.  Obni- 
żaniu temperatury  towarzyszy  zatem  zmniejszanie  się 
możliwości  zarówno  tworzenia  luk,  jak  i pokonywa- 
nia bariery  potencjału,  a więc  zmniejszanie  się  współ- 
czynnika dyfuzji.  (Rozważania  te  są  słuszne  przy  trak- 
towaniu atomu  niekwantowo).  Mechanika  kwantowa 
dopuszcza  również,  oprócz  dozwolonego  klasycznie 
skoku  nad  barierą  potencjału,  tunelowe  przejście 
przez  barierę,  tj.  przejście  atomu  o energii  mniejszej 
od  wysokości  bariery.  Efekty  kwantowe  są  oczywiście 
tym  istotniejsze,  im  dyfundujący  atom  jest  lżejszy 
(nikt  bowiem  dotychczas  — nie  bez  racji  — nie  kwan- 
tował równania  ruchu  beczek).  Stąd,  ten  podbarie- 
rowy  mechanizm  dyfuzji  kwantowej,  dotyczy,  jeśli 
nie  brać  pod  uwagę  nierozsądnie  małych  prawdopo- 
dobieństw, jedynie  atomów  najlżejszych,  takich  jak 
izotopy  helu  o liczbie  masowej  3 i 4 (wodór  z reguły 
nie  występuje  w postaci  atomowej,  zaś  jego  cząstecz- 
ka, ze  względu  na  rozmiary,  dyfunduje  w sposób 
utrudniony).  Do  dyfuzji  jest  jednak  potrzebne  wystę- 
powanie luk,  które  powinny  zanikać  przy  zerowej 
temperaturze  bezwzględnej.  Czy  zatem  brak  luk 
w kryształach  3He  i 4He  w dostatecznie  niskich  tem- 
peraturach powstrzymuje  opisany  tutaj  proces  pod- 
barierowy?  Okazuje  się,  że  nie.  Rzecz  w tym,  że  zdol- 
ność luki  do  dyfuridowania  pod  barierą  potencjału 
może  prowadzić  do  istnienia  luk  w równowagowym 
krysztale  kwantowym  nawet  w zerowej  temperaturze 
bezwzględnej.  Spróbujmy  wykazać  tę  możliwość. 

Dla  luki  kwantowej,  mogącej  swobodnie  dyfundo- 
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wać,  kryształ  jest  periodycznym  polem  sił.  Ruch  w ta- 
kim polu  opisuje  pasmowa  teoria  ciał  stałych.  Ener- 
gia luki  ulega  rozszczepieniu  w całe  pasmo  energe- 
tyczne, a stan  kwantowy  luki  jest  opisywany  przez 
wektor  kwazipędu.  Przy  dostatecznie  silnym  roz- 
szczepieniu energii  luki,  dno  pasma  może  znaleźć  się 
poniżej  najniższej  energii  kryształu  bez  luk  — i wtedy 
wytworzenie  pewnej  liczby  luk  staje  się  energetycznie 
dogodne.  Popatrzmy  na  rys.  2 ilustrujący  tę  możli- 
wość. Jego  lewa  część  przedstawia  sytuację  klasycz- 
ną. Energia  E0  oznacza  energię  kryształu  bez  luk, 

fi" 


Rys.  2 

Ei  — energię  kryształu  z jedną  luką.  W wyniku  dy- 
fuzji podbarierowej  poziom  Ex  rozszczepia  się  w całe 
pasmo  dozwolonych  energii  o maksimum  i mini- 
mum £',  co  pokazuje  prawa  część  rysunku.  Jeśli  dno 
pasma  znajdzie  się  poniżej  E0  (energia  E[  < E0)t  to 
wytworzenie  pewnej  liczby  luk  staje  się  energetycznie 
dogodne.  Dzięki  temu  luki  powinny  się  znajdować 
również  w równowagowym  krysztale  przy  zerowej 
temperaturze  bezwzględnej.  Należy  dodać,  że  przy 
określaniu  struktury  takich  kryształów  nie  stwierdzo- 
no by  istnienia  zlokalizowanych  luk,  byłyby  więc  one 
„rozmazane”  po  całym  krysztale.  Można  powiedzieć, 
że  funkcja  rozkładu  gęstości  atomów  w krysztale 
byłaby  nadal  periodyczna,  z tym  że  prawdopodobień- 
stwo znalezienia  atomu  w węźle  sieci  krystalicznej 
byłoby  mniejsze  od  jedności.  Ponieważ  luki  kwantowe 
opisuje  teoria  pasmowa,  można  więc  stanowi  luki 
przypisać  wektor  kwazipędu.  Taka  luka  jest  specy- 
ficzną kwazicząstką,  której  występowanie  jest  charak- 
terystyczne dla  kryształów  kwantowych. 

Prawdopodobieństwo  dyfuzji  kwantowej  maleje 
wraz  ze  wzrostem  temperatury,  głównie  ze  względu 
na  zderzenia  luk  z fononami.  Dzięki  podobnemu 
mechanizmowi  zderzeń  elektronów  z fononami  opór 
elektryczny  metali  maleje  wraz  z temperaturą.  Dla 
kryształów  kwantowych,  w których  luki  istnieją  rów- 
nież w zerze  bezwzględnym,  współczynnik  dyfuzji 
(analog  przewodnictwa,  nie  zaś  oporu  metali)  powi- 
nien wzrastać  ze  spadkiem  temperatury,  przy  dosta- 
tecznie niskich  temperaturach  — gdy  dyfuzja  kwan- 
towa odgrywa  główną  rolę.  Jest  to  akurat  odwrotnie 
niż  przy  normalnej  dyfuzji,  dla  której,  wraz  ze  wzro- 
stem temperatury,  wzrasta  zarówno  liczba  wytwo- 
rzonych luk  jak  i prawdopodobieństwo  nadbariero- 
wego  wzbudzenia  atomów,  a więc  i współczynnik  dy- 
fuzji. Dlatego  współczynnik  dyfuzji,  malejący  wraz 
z temperaturą  przy  odpowiednio  wysokich  tempera- 
turach, staje  się  rosnącą  funkcją  temperatury  przy 
temperaturach  odpowiednio  niskich.  Fakt  ten,  nie- 
zrozumiały w klasycznym  modelu  dyfuzji,  został  po- 
twierdzony doświadczalnie  na  kryształach  helu. 

Omówiona  luka  kwantowa  nie  jest  jedyną  kwazi- 
cząstką mogącą  występować  w kryształach  kwanto- 
wych. Mogą  tu  również  wystąpić  stany  związane  dwu 
lub  więcej  luk;  podobnie,  lekki  atom  domieszki 
w międzywęźlu  kryształu  kwantowego,  dzięki  zja- 
wisku tunelowemu,  zachowuje  się  jak  kwazicząstka, 
której  można  przypisać  kwazipęd.  Dodajmy  jeszcze, 
że  podany  tu  opis  dyfuzji  w krysztale  kwantowym 
i związanych  z tym  wzbudzeń  został  zaproponowany 
przez  I.  M.  Lifszyca  i A.F.  Andrejewa. 


Plazmony 

Aby  zrozumieć  wzbudzenia  plazmowe  rozważmy 
ekranujące  działanie  elektronów.  Mechanizm  tego 
zjawiska  jest  niezwykle  prosty.  Wyobraźmy  sobie,  że 


do  elektrycznie  obojętnego  ośrodka  zawierającego 
elektrony  swobodne,  w takim  np.  sensie  jak  elektrony 
w metalu,  wprowadzono  nadmiarowy  ładunek  do- 
datni. Ładunek  ten  przyciąga  elektrony,  dzięki  czemu 
ich  gęstość  w otoczeniu  ładunku  jest  coraz  większa. 
Inne  cząstki  naładowane,  a więc  jony,  mają  znacznie 
większą  masę  i są  zlokalizowane,  wobec  czego  zmiana 
gęstości  ich  ładunku  jest  znacznie  trudniejsza.  Wzrost 
ładunku  w pobliżu  ładunku  wprowadzonego  kom- 
pensuje jego  działanie  na  dużych  odległościach.  Po- 
dany mechanizm  ekranowania  statycznego  może  ulec 
istotnej  modyfikacji,  gdy  wprowadzony  nadmiarowy 
ładunek  porusza  się  — mówimy  wtedy  o ekranowaniu 
dynamicznym.  Jeśli  wprowadzony  nadmiarowy  ła- 
dunek jest  ładunkiem  ujemnym,  to  elektrony  zostają 
odepchnięte.  Wokół  wprowadzonego  ładunku  po- 
wstaje nadmiar  ładunku  dodatniego,  który  z kolei 
przyciąga  elektrony  itd.,  co  przekonuje  nas,  że  me- 
chanizm ekranowania  działa  również  w stosunku  do 
ładunków  ujemnych. 

Wyobraźmy  sobie  teraz,  że  nadmiarowy  ładunek, 
np.  dodatni,  został  nagle  wprowadzony  do  ośrodka. 
Przyciągane  przez  ten  ładunek  elektrony  zaczęły  się 
poruszać  w jego  kierunku.  Po  nabraniu  pewnej  pręd- 
kości elektrony  będą  miały  skłonność  do  poruszania 
się  na  większą  odległość,  niż  wynikałoby  to  z ich  rów- 
nowagowego rozkładu  w obecności  ładunku  nadmia- 
rowego. Ulegną  one  z kolei  działaniu  sił  elektrosta- 
tycznych działających  w przeciwnym  kierunku.  I zno- 
wu, ze  względu  na  niezerową  prędkość  poruszania  się 
i bezwładność  elektronów,  będą  one  miały  skłonność 
do  dotarcia  za  daleko.  Powtarzanie  się  tego  mecha- 
nizmu prowadzi  do  pojawienia  się  drgań  zwanych 
drganiami  plazmy;  ich  mechanizm  jest  nierozerwalnie 
związany  z ekranowaniem. 

Spróbujmy  otrzymać  wzór  na  częstość  tych 
drgań.  W tym  celu  założymy,  że  ładunek  dodatni, 
który  ma  znacznie  mniejsze  możliwości  poruszania 
się  niż  elektrony,  jest  całkowicie  nieruchomy  i że  został 
jednorodnie  „rozmazany”  po  całym  krysztale. 
Pierwsze  z tych  założeń  jest  idealizacją  istniejącego 
stanu,  drugie  zaś  związane  jest  z faktem,  że  interesują 
nas  wzbudzenia  o bardzo  długiej  fali,  dla  których 
niewielkie  (w  skali  atomowej)  niejednorodności  roz- 
kładu ładunku  nie  odgrywają  żadnej  roli.  Załóżmy 
również,  że  nierównowagowy  rozkład  ładunku  został 
spowodowany  przez  przesunięcie  naładowanej  war- 
stwy o grubości  d na  niewielką  odległość  x (x  < d, 
rys.  3). 


Warstwa  taka  zachowuje  się  jak  kondensator  płaski. 
Powstaje  przy  tym  stałe  pole  elektryczne  ć , działające 
w takim  kierunku,  aby  przywrócić  elektryczną  obo- 
jętność całej  warstwy.  Natężenie  pola  elektrycznego 
określa  wzór 

ć = — 4nNex, 

w którym  N jest  koncentracją,  tj.  liczbą  elektronów 
swobodnych  w jednostce  objętości,  a e — ładunkiem 
elektronu.  Nazwa  „elektrony  swobodne”  została  tu 
użyta  nie  dla  określenia  elektronów  nieoddziałujących 
ze  sobą,  ale  elektronów  mogących  swobodnie  przepły- 
wać. Wzór  na  natężenie  pola  elektrycznego  wynika 
ze  wzoru  na  pojemność  kondensatora  płaskiego  przy 
uwzględnieniu,  że  gęstość  ładunku  powierzchnio- 
wego na  obu  okładkach  kondensatora  wynosi  odpo- 


36  - Encyklopedia  fizyki  współczesnej 
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wienio  ±Nex.  Ruch  elektronu  wewnątrz  warstwy 
opisuje  równanie 

ma  — eć,  czyli  m(d2x(dt2)  — —4nNe2x, 

w’  którym  m jest  masą  elektronu.  Jego  rozwiązaniem 
jest  ruch  harmoniczny  o częstości 

a>p  = (4nNe2/m)lf29 

zwanej  częstością  plazmową.  Wzbudzenia  gęstości 
elektronów  swobodnych,  w podanym  wyżej  sensie, 
częstość  nazywamy  plazmonami.  Jako  kwazicząstki  będące 
plazmonów  w>nikiem  kwantowania  ruchu  oscylatora  podlegają 
one  statystyce  Bosego.  Proste  oszacowanie  wielkości 
h(x>PjlK  przy  założeniu  koncentracji  elektronów  cha- 
rakterystycznych dla  metali  pokazuje,  że  jest  ona 
rzędu  energii  Fermiego.  Nie  jest  to  więc  wzbudzenie 
nisko  leżące  i jego  wzbudzenie  termiczne  jest  wysoce 
nieprawdopodobne,  ponieważ  kT  £>,  aż  do  tem- 
peratury topnienia  metalu  włącznie.  Dlatego  też  sta- 
tystyka tych  wzbudzeń  nie  odgrywa  istotnej  roli  przy 
termicznym  wzbudzeniu  plazmonów,  ponieważ  kwe- 
stia, czy  w danym  stanie  może  istnieć  jeden  plazmon 
czy  więcej,  w sytuacji  gdy  ich  prawie  zupełnie  nie  ma, 
jest  raczej  pytaniem  akademickim.  Zdanie  to  nie  su- 
geruje bynajmniej,  że  plazmony  nie  są  obserwowane, 
wzbudzają  się  one  np.  przy  przechodzeniu  cząstek 
naładowanych  przez  metal,  lub  też  przy  odbiciu  od 
jego  powierzchni.  Eksperymenty  takie  wykazują,  że 
plazmony  są  z reguły  wzbudzeniami  dobrze  określo- 
nymi. 

Dotychczasowe  rozważania  dotyczyły  sytuacji  gra- 
nicznej — długich  fal,  czyli  zerowej  wartości  wektora 
falowego.  Wnikliwsza  analiza  wykazuje,  że  częstość 
plazmonów  zależy  od  wektora  falowego,  a więc,  że 
plazmony  podlegają  dyspresji.  Główna  poprawka  do 
wyrażenia  na  <op  ma  następującą  postać  w granicy 
długofalowej:  yhk2/2nmt  gdzie  k 2 oznacza  kwadrat 

długości  wektora  k>  a y jest  wielkością  bezwymiarową 
rzędu  jedności  (y  « 0,5  dla  Be,  Mg  i Al).  Warto  do- 
dać, że  w teorii  uwzględniającej  oddziaływanie  elek- 
tronów między  sobą,  otrzymuje  się  również  wyrażenie 

na  cop  przy  k — 0 takiej  samej  postaci,  ale  tym  razem 
m oznacza  masę  krystaliczną  elektronu,  zależną  od 
oddziaływania  elektronu  z siecią  krystaliczną,  a nie- 
zależną od  oddziaływania  międzyelektronowego. 

Przy  opisie  plazmonów  powoływaliśmy  się  głównie 
na  przykłady  wzbudzeń  w metalach.  Jednak  wzbudze- 
nia takie  istnieją  we  wszystkich  ciałach  stałych  za- 
wierających swobodne  nośniki,  a więc  również  w pół- 
przewodnikach. Warto  zastanowić  się  w tym  miejscu 
elementar-  n.ad  elementarnością  wzbudzeń.  Dla  wzbudzeń  w fa- 
ność  zie  skondensowanej,  a więc  w ciele  stałym  lub  w cie- 
wzbudzeń  czach  kwestia  ta,  podobnie  jak  elementamość  w fizyce 
cząstek,  nie  jest  raz  na  zawsze  rozwiązana,  całkowicie 
jednoznaczna  i nie  sprawiająca  kłopotów.  Zapropo- 
nowane tutaj  kryterium  elementarności  wzbudzeń 
zwraca  uwagę  na  dwa  aspekty  zagadnienia  — na 
niemożność  złożenia  danego  wzbudzenia  z pewnych 
innych  wzbudzeń  oraz  — możliwość  występowania 
wzbudzenia  w innych,  bardziej  złożonych  wzbudze- 
niach. W szczególności,  jeśli  przy  tworzeniu  takiego 
wzbudzenia  istotne  jest  oddziaływanie  między  wzbu- 
dzeniami składającymi  się  na  nie  i we  wzbudzeniu  tym 
bierze  udział  duża  liczba  wzbudzeń  składowych,  to 
wzbudzenie  takie  nazywa  się  kolektywnym.  Nietrud- 
no zauważyć,  że  kwazicząstki  elektronowe  i fonony 
wzbudzenia  s3  wzbudzeniami  elementarnymi.  Jeśli  mowa  o plaz- 
kclektywne  monach,  to  można  je  traktować  jako  wzbudzenia  ko- 
lektywne, złożone  z elementarnych  wzbudzeń  kwazi- 
cząstkowych  i kwaziantycząstkowych.  Przytoczone 
klasyczne  wyprowadzenie  wyrażenia  na  częstość  plaz- 
mową ani  nie  potwierdza,  ani  nie  odrzuca  tego  punktu 
widzenia.  Warto  jednak  zwrócić  uwagę  na  to,  że  do- 
wolna, dostatecznie  długofalowa  zmiana  gęstości 
przestrzennej  elektronów  może  być  wywołana  powsta- 
niem przewagi  kwazicząstek  w jednym  obszarze 
przestrzennym,  kwaziantycząstek  zaś  — w innym, 
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oraz  na  dominującą  rolę  oddziaływania  elektronów 
przy  drganiach  plazmy.  Mówienie  o kwazicząstkach, 
czy  też  o kwaziantycząstkach  wymaga  dostatecznie 
dobrego  rozróżnienia  ich  kwazipędu,  aby  można  było 
stwierdzić,  czy  są  to  wzbudzenia  spod,  czy  też  znad 
powierzchni  Fermiego,  czyli  Ap  musi  być  znacznie 
mniejsza  od  pędu  Fermiego  pf  ~ h/ay  gdzie  a jest 
stałą  sieci.  Z drugiej  strony  Ax  Ap  > h{4n  zgodnie 
z zasadą  nieokreśloności,  co  daje  razem  oszacowanie 
rozmiarów  liniowych  wspomnianych  obszarów  prze- 
strzennych: Ax  > a.  Ponadto,  jeśli  mamy  precyzyjnie 
określać  rozchodzenie  się  fali,  to  A x musi  być  wyraźnie 
mniejsze  od  długości  fali  2,  a więc  jeśli  X i>  a,  to  opis 
mikroskopowy,  w języku  kwazicząstek  elektrono- 
wych, jest  równoważny  opisowi  makroskopowemu 
w języku  zmiany  gęstości  przestrzennej  elektronów. 


Ekscytony  i polarony 

Omówimy  pokrótce  jeszcze  dwa  rodzaje  wzbudzeń  — 
ekscytony  i polarony,  które  z punktu  widzenia  po- 
danej tu  definicji  nie  są  wzbudzeniami  elementarnymi, 
mimo  iż  ekscytony  często  zalicza  się  do  wzbudzeń 
elementarnych.  Ekscytony  są  stanami  związanymi 
elektronu  i dziury;  występują  one  głównie  w półprze- 
wodnikach, półmetalach  i kryształach  molekular- 
nych. Natomiast  polarony,  będące  stanami  związa- 
nymi elektronu  łub  dziury  z paroma  fononami,  wy- 
stępują z reguły  w kryształach  jonowych  i półprze- 
wodnikach polarnych.  W tym  ostatnim  wypadku  pola- 
ron  powstały  z elektronu  i polaron  powstały  z dziury 
mogą  związać  się  również  w specyficzny  ekscyton.  ekscyton 
Wyobraźmy  sobie  elektron  i dziurę.  Dziurze  można 
przypisać  ładunek  przeciwny  do  ładunku  elektronu, 
stąd  elektron  i dziura  będą  się  przyciągały.  Załóżmy 
na  chwilę,  że  periodyczne  pole  kryształu  nie  istnieje. 

Wtedy  ruch  elektronu  i dziury  można  rozłożyć  na 
dwie  składowe:  ruch  środka  masy — jednostajny 
i prostoliniowy  — oraz  ruch  względny.  Przy  działaniu 
siły  przyciągania  kulombowskiego  ruch  względny 
może  odbywać  się  po  elipsie,  paraboli  i hiperboli. 

W ostatnich  dwóch  sytuacjach  cząstki  oddalają  się 
nieograniczenie  od  siebie,  co  odpowiada  stanowi  nie- 
związanemu.  Przy  ruchu  eliptycznym  odległości  mię- 
dzy cząstkami  są  ograniczone  od  góry;  taki  ruch  pod- 
lega kwantowaniu  identycznemu  jak  w wypadku 
atomu  wodoru.  Może  tu  wprawdzie  zabraknąć,  mimo 
lekkich  elektronów  i ciężkich  dziur  w półprzewod- 
nikach, tak  wyróżnionej  cząstki  centralnej  jak  proton 
w atomie  wodoru.  Całkowita  energia  układu  cząstki 
i dziury  jest  sumą  energii  ruchu  środka  masy  i energii 
ruchu  względnego.  Pierwsza  z nich  zależy  w sposób 
ciągły  od  pędu  ( E = P2j2M,  gdzie  M jest  sumą  mas 
dziury  i elektronu,  a P — sumą  ich  pędów),  natomiast 
druga  z nich  tworzy  znaną  serię  poziomów  wodoru, 
tyle  że  z innym  współczynnikiem  proporcjonalności 
przed  —1/n2,  n = 1,  2,  ...  . Stąd  energia  całkowita 
układu  ma  postać:  —p/n2-\-P2l2M.  W warunkach 
działania  periodycznego  pola  kryształu  podział  ruchu 
na  dwie  niezależne  składowe  — ruch  środka  masy 
oraz  ruch  względny  — staje  się  w zasadzie  niemożli- 
wy; rozkład  taki  można  przeprowadzić  jedynie  w po- 
bliżu ekstremum  pasm  energetycznych.  Zatem  zależ- 
ność energii  ekscytonu  od  głównej  liczby  kwantowej 

n jak  i od  pędu  P ulegnie  skomplikowaniu  tym  bar- 
dziej, że  P7  ze  względu  na  działanie  periodycznego 
pola  kryształu,  jest  teraz  kwazipędem.  Dzięki  temu 
możemy  mówić  o pasmach  ekscytonowych.  Ponieważ 
przy  przestawieniu  wszystkich  liczb  kwantowych  pasma 
opisujących  dwie  jednakowe  cząstki  Fermiego  (fer-  eksoytonowe 
miony)  funkcja  falowa  zmienia  znak,  a przy  analo- 
gicznym przedstawieniu  liczb  kwantowych  cząstek 
Bosego  (bozonów)  — pozostaje  niezmieniona,  więc 
przy  przestawieniu  dwóch  zespołów  liczb  kwanto- 
wych opisujących  układy  składające  się  z dwóch  fer- 
mionów— funkcja  również  nie  zmienia  znaku,  co 


dowodzi,  że  ekscytony  podlegają  statystyce  Bosego. 
Ze  względu  na  zerowy  wypadkowy  ładunek  ekscyto- 
ny nie  biorą  udziału  w transporcie  ładunku,  wpływają 
natomiast  na  własności  optyczne  kryształów.  Rozróż- 
ekscytony  nia  się  zazwyczaj  2 rodzaje  ekscytonów:  ekscytony 
Frenkla  Frenkla,  występujące  z reguły  w kryształach  moleku- 
larnych, w których  elektron  i dziura  są  praktycznie 
ekscytony  biorąc  zlokalizowane  w molekule,  oraz  ekscytony 
Wanniera-  Wanniera-Motta,  o Wysokiem  stopniu  delokalizacji, 
-Motta  występujące  z reguły  w półprzewodnikach. 

Warto  zwrócić  uwagę  na  to,  że  energie  ekscytonów 
odpowiadają  energiom  z przerwy  energetycznej, 
a więc  niedopuszczalnym  dla  kwazicząstek  elektro- 
nowych. Energia  wzbudzenia  układu  elektron  -f 
dziura,  jeśli  obydwie  kwazicząstki  znajdują  się  blisko 
ekstremów  pasma  przewodnictwa  i pasma  walencyj- 
nego, jest  bowiem  bliska  wielkość  przerwy  energe- 
tycznej Eg.  Do  tego  dochodzi  ujemna  energia  od- 
działywania kulombowskiego  elektronu  i dziury,  co 
powoduje,  że  energia  ekscytonu  jest  mniejsza  od  Eg. 
Z drugiej  jednak  strony,  energia  ta  nie  może  być  ujem- 
na, wskazywałoby  to  bowiem  na  fakt,  że  wiązanie  się 
przejście  elektronów  i dziur  w ekscytony  — tzw.  przejście  ekscy- 
ekscytonowe  tonowe  — obniżałoby  energię  układu,  a więc  układ 
byłby  nietrwały.  Zjawisko  przejścia  ekscy tonowego 
pojawia  się  niekiedy  w półmetalach.  Podane  oszaco- 
wanie energii  ekscytonu  nie  zabrania  istnieć  ekscyto- 
nom  o energii  większej  od  Eg.  Można  jednak  wyka- 
zać, że  takie  ekscytony  przestają  być  wzbudzeniami 
dobrze  określonymi,  gdyż  ulegają  rozpadowi  na 
wzbudzenia  elektronowe,  a więc  dysocjację  ekscy- 
tonu. Mimo  nieelementamości  ekscytonów  z punktu 
widzenia  przyjętej  definicji,  można  je  traktować  jako 
składowe  bardziej  skomplikowanych  wzbudzeń. 

W specyficznych  warunkach,  przy  dużej  gęstości 
ekscytonów  w tzw.  kroplach  ekscytonowych  genero- 
wanych w półprzewodnikach  impulsem  laserowym, 
istotne  stają  się  tak  oddziaływania  międzyekscytono- 
we,jak  i wzbudzenia  kolektywne  układu  ekscytonów. 
Ponieważ  ekscytony  podlegają  statystyce  Bosego,  od- 
działywania międzyekscytonowe  mogą  wręcz  dopro- 
wadzić do  przejścia  kropli  ekscytonowej  w stan  nad- 
ciekły  podobnie  jak  to  się  dzieje  z helem  4He. 
polarony  Dodajmy  parę  słów  o polaronach.  Elektron  od- 
działuje z jonami  sieci,  zatem  pojawienie  się  zmiany 
w równowagowej  gęstości  elektronów  musi  powodo- 
wać zmianę  w rozkładzie  gęstości  jonów,  czyli  polary- 
zować sieć.  Taką  zmianę  rozkładu  gęstości  jonów 
można  uzyskać  przez  nałożenie  na  siebie  pewnej  liczby 
fal  wychyleń  jonów  z położenia  równowagi  o różnej 
długości  fali  — tj.  przez  związanie  elektronu  z pewną 
liczbą  fononów.  Podobnie  jak  w wypadku  ekscyto- 
nów wyróżniamy  tu  polarony  o małym  promieniu, 
dobrze  zlokalizowane,  oraz  polarony  o dużym  pro- 
mieniu, rzędu  wielu  stałych  sieci  krystalicznej.  Proces 
wiązania  elektronów  z fononami  powinien  prowadzić 
do  zwiększenia  masy  powstałej  kwazicząstki,  co  jest 
intuicyjnie  jasne.  Analogicznemu  procesowi  „obra- 
stania fononami”  może  ulegać  nie  tylko  elektron,  ale 
i dziura.  Stąd,  jak  już  wspomniano,  wynika  możli- 
wość występowania  polaronowego  ekscytonu,  będą- 
cego stanem  związanym  polaronowej  dziury  i pola- 
ronowego elektronu.  Wzbudzenia  takie  można  ob- 
serwować w półprzewodnikach  polarnych,  o dużej 
biegunowości  wiązań.  Rozważania  podobne  jak  dla 
ekscytonów  wykazują  fermionowy  charakter  pola- 
ronów. 

Uzupełniając  poprzedni  opis  można  powiedzieć,  że 
w wyniku  polaryzowania  sieci  przez  elektron  powstaje 
jama  potencjału  wychwytująca  elektron.  Polaron  nie 
jest  jedyną  kwazicząstką  o tym  charakterze  w fazie 
skondensowanej.  Wśród  kwazicząstek  podobnego 
fluktucn  typu  można  wymienić  np.  fluktuon  i fazon.  Pierwszy 
i fazon  z nich  to  elektron  wychwycony  przez  jamę  potencjału 
wytworzoną  w wyniku  fluktuacji  składników  w po- 
bliżu elektronu  w stopie  nieuporządkowanym;  drugi 
polega  na  wychwyceniu  elektronu  przez  obszar  fazy 
ferromagnetycznej  powstały  w paramagnetyku. 


Czy  da  się  zamknąć  listę  kwazicząstek? 

Polarytony 

Ostatnie  dwie  kwazicząstki  omówiliśmy  w skrócie 
niemalże  telegraficznym.  Nie  od  rzeczy  będzie  pytanie 
o kryteria  wyboru  kwazicząsteczek  omówionych 
w tym  artykule.  Liczba  rozmaitych  wzbudzeń  w fazie 
skondensowanej,  elementarnych  lub  nie  — w poda- 
nym wyżej  sensie,  jest  tak  wielka,  że  trudno  byłoby 
znaleźć  fizyka  do  skompletowania  listy  wzbudzeń 
„na  dzisiaj”  na  podstawie  tego,  co  aktualnie  wie,  nie 
zaś  na  podstawie  dodatkowej  lektury.  Zrezygnowaliś- 
my tu  więc  z omawiania  tych  wzbudzeń,  przy  których 
dublowalibyśmy  fragmenty  innych  artykułów.  Doty- 
czy to  fononów  (-►  Dynamika  sieci  krystalicznej), 
magnonów  (-►  Teoria  magnetyzmu)  oraz  specyficz- 
nych kwazicząstek  elektronowych  charakterystycz- 
nych dla  nadprzewodników  (-*  Nadprzewodnictwo). 

Ze  względu  na  specyfikę  zagadnienia  pominęliśmy 
również  rozmaite  wzbudzenia  metali  w zewnętrz- 
nym silnym  polu  magnetycznym  (fale  spinowe  w 
metalach  normalnych,  w stałym  zewnętrznym  polu 
magnetycznym,  fale  cyklotronowe,  helikony  itd.). 

W artykule  tym  położyliśmy  nacisk  raczej  na  wzbu- 
dzenia elementarne  niż  kolektywne  i,  z drugiej  strony, 
na  wzbudzenia  powszechnie  występujące,  zdając  so- 
bie oczywiście  sprawę  z nieostrości  tego  ostatniego 
kryterium.  Było  ono  wprawdzie  zlekceważone  przy 
opisie  wzbudzeń  w kryształach  kwantowych,  ale 
usprawiedliwiała  nas  wtedy  niezwykłość  sytuacji 
fizycznej. 

Ponieważ  kontynuowanie  przeglądu  kwazicząstek 
w formie  wyliczenia  przypominającego  książkę  telefo- 
niczną jest  raczej  pozbawione  sensu,  zamkniemy  listę 
omówieniem  polarytonu.  Jest  to  wzbudzenie  tym 
różniące  się  jakościowo  od  już  omówionych  lub 
wzmiankowanych,  że  stanowi  ono  stan  związany 
fotonu  z którymś  ze  wzbudzeń,  takich  jak  fonon  op- 
tyczny, ekscyton,  magnon  itp.  Omówimy  pokrótce 
polarytony  fononowe  i polarytony  ekscy  tonowe. 

Musimy  najpierw  wyjaśnić,  w jaki  sposób  fala  elek-  odcfziaływa- 
tromagnetyczna  może  oddziaływać  z fononem  optycz-  elak 

nym  lub  ekscytonem.  Otóż  wektor  elektryczny  fali  tromagne- 
elektromagnetycznej  wywołuje  polaryzację  elektrycz-  tycznej  z fo 
ną  ośrodka.  Ze  względu  na  falowy  charakter  ruchu  nonem  lub 
wektora  elektrycznego  polaryzacja  ta  ma  również  ekscytonem 
charakter  falowy.  Warto  przy  tym  zwrócić  uwagę,  że 
polaryzacja  taka,  przynajmniej  w ośrodkach  o nie- 
zbyt silnej  anizotropii,  jest  poprzeczna,  tzn.  wektor 
polaryzacji  jest  prostopadły  do  kierunku  rozchodze- 
nia się  fali,  ponieważ  fala  elektromagnetyczna  jest 
poprzeczna.  Zastanówmy  się,  jakiego  typu  wzbudze- 
nia mogą  być  indukowane  przez  wektor  elektryczny. 

Jeżeli  sieć  składa  się  z co  najmniej  dwóch  podsieci, 
obsadzonych  przez  atomy  różnych  pierwiastków,  to 
na  atomach  poszczególnych  podsieci  będzie  znajdował 
się  nieco  inny  ładunek  elektryczny.  Fonon  optyczny 
o zerowym  wektorze  falowym  odpowiada  jednorod- 
nemu przesunięciu  podsieci  względem  siebie  tak,  aby 
środek  masy  całego  kryształu  pozostawał  nieruchomy. 

Przy  niecałkowitym  skompensowaniu  ładunku  elek- 
trycznego na  atomach  każdej  podsieci  odpowiada  to 
zmianie  momentu  dipolowego  kryształu,  a więc  jego 
polaryzacji  elektrycznej.  Możemy  stąd  wywniosko- 
wać, że  elektryczne  pole  fali  elektromagnetycznej 
będzie  wzbudzało  fonony  optyczne  o polaryzacji  po- 
przecznej, ze  względu  na  poprzeczny  charakter  fal 
elektromagnetycznych.  Natomiast  fonony  akustyczne 
odpowiadają  drganiom  wszystkich  podsieci  w fazie, 
co  nie  prowadzi  do  zmiany  momentu  dipolowego 
kryształu,  a zatem  pole  elektryczne  nie  wpływa  na 
fonony  akustyczne.  Oddziaływanie  między  falą  elek- 
tromagnetyczną a polaryzacją  dynamiczną  sieci  ma 
charakter  przyciągania,  bowiem  sieć  polaryzuje  się  w 
taki  sposób,  aby  zmniejszyć  energię  łącznego  układu 
promieniowania  + sieć.  Zgodnie  z zasadami  mechaniki 
kwantowej  istnieje  zatem  możliwość  powstania  stanu  polarytony 
związanego  porzecznej  polaryzacji  sieci,  tj.  poprzecz-  fononowe 
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nie  spolaryzowanych  fononów  optycznych,  z kwantami 
pola  elektromagnetycznego,  czyli  fotonami.  Wiązanie 
to  będzie  szczególnie  silne  przy  częstościach  promie- 
niowania elektromagnetycznego  bliskich  częstości 
fononów  optycznych.  Wynika  to  z faktu,  że  przy 
zbliżonych  do  siebie  częstościach  pola  zewnętrznego 
i fononów  optycznych  mamy  do  czynienia  z rezonan- 
sem i polaryzacja  jest  szczególnie  duża.  Biorąc  typo- 
wy rząd  wielkości  częstości  fononów  optycznych  co0 
i oceniając  na  tej  podstawie  długość  fali  promienio- 
wania elektromagnetycznego  (A  = 2kc/coq)  znajdu- 
jemy 2 X 104  nm.  Fonony  optyczne  będą  zatem  wią- 
zać najsilniej  fale  bardzo  długie  w porównaniu  z od- 
ległością międzyatomową  (rzędu  0,1  nm)  i polaryton 
fononowy  będzie  kwazicząstką  o wysokim  stopniu 
delokalizacji.  Opisane  kwazicząstki  odgrywają  istot- 
ną rolę  w optycznych  własnościach  tych  kryształów, 
dla  których  wzbudzenie  fononu  optycznego  zmienia 
moment  dipolowy  kryształu. 

Przejdźmy  teraz  do  polarytonów  ekscytonowych. 
Zasada  wiązania  fali  elektromagnetycznej  z ekscy to- 
nami jest  taka  sama,  jak  w wypadku  fononów  op- 
tycznych, ponieważ  ekscyton  jest  stanem  związanym 
kwazicząstek  naładowanych.  Powstała  kwazicząstka 
będzie  z wielu  względów  podobna  do  opisanego  po- 
przednio polarytonu  fononowego.  Wprowadzenie 
koncepcji  polarytonu  ekscytowanego  zmieniło  w spo- 
sób istotny  opis  własności  optycznych  półprzewod- 
ników. Przedtem  uważano,  że  fala  elektromagne- 
tyczna o częstości  mniejszej  od  częstości  odpowiada- 
jącej szerokości  przerwy  energetycznej  może  wzbu- 
dzać jedynie  ekscytony.  Obecnie  sądzi  się,  że  taka  fala 
elektromagnetyczna  wzbudza  również  polarytony 
ekscytonowe,  co  komplikuje  opis  własności  optycz- 
nych półprzewodników.  Jest  to  fakt,  który  został  po- 
twierdzony doświadczalnie.  Dodajmy  jeszcze,  że  ana- 
logicznie do  wzmiankowanych  tu  polarytonów  ma- 
gnonowych  wektor  pola  magnetycznego  fali  elektro- 
magnetycznej sprzęga  się  z dynamiczną  polaryzacją 
magnetyczną,  a więc  magnonami. 

Warto  jeszcze  na  zakończenie  powiedzieć  trochę 
o wykrywaniu  wzbudzeń  w układach  fizycznych.  Za- 
łóżmy, że  na  układ  działa  pole  zewnętrzne  o określo- 
nej częstości  i określonym  wektorze  falowym.  Wektor 

falowy  k i częstość  kołowa  co  pomnożone  przez  h/2ii 
dają  odpowiednio  pęd  i energię  kwantu  pola.  Załóż- 
my, że  pole  to  wzbudza  kwazicząstki  określonego 


typu.  Jeśli  układ  fizyczny  jest  ciałem  stałym,  to  obo- 
wiązuje prawo  zachowania  kwazipędu,  z dokład- 
nością do  wektora  sieci  odwrotnej  pomnożonego  przez 
h/2Ky  oraz  prawo  zachowania  energii.  Jeśli  więc  będą 

spełnione  równości  E{k^-{-hco(Jc)l2K  = E(k2 ) oraz 
kx+k  — k2+Kn,  gdzie  E(k)  energia  kwazicząstek 

zależna  od  wektora  falowego,  a Kn  — wektor  sieci 
odwrotnej,  to  układ  będzie  pochłaniał  energię  pola. 
Dla  absolutnie  stabilnych  kwazicząstek  niespełnienie 
którejkolwiek  z tych  równości  powoduje  niemożność 
pochłaniania  energii  przez  układ  w reakcji:  kwazi- 
cząstka + kwant  energii  ->  inna  kwazicząstka,  speł- 
nienie zaś  obydwu  tych  równości  prowadzi  do  wystą- 
pienia nieskończenie  cienkiej  linii  absorpcji.  Dla  do- 
brze określonych  wzbudzeń  kwazicząstkowych  ener- 
gie będą  nieco  rozmyte,  zgodnie  z zasadą  nieokreślo- 
ności dla  energii,  AEr  ^ /?/2rc,  i wystarczy,  aby  pier- 
wsze z wymienionych  równań  było  spełnione  jedynie 
w przybliżony  sposób,  z dokładnością  rzędu  h/2nr. 
Powoduje  to,  że  nieskończenie  cienka  linia  absorpcji 
zmienia  się  w wąską  linię  o szerokości  rzędu  hj2nr 
w skali  energii.  Dla  wzbudzeń,  które  nie  są  dobrze 
określone,  linie  absorpcji  stają  się  liniami  szerokimi. 
Wspomniane  procesy  absorpcji  wraz  z procesami  roz- 
praszania, dającymi  się  wyrazić  symbolicznie  w spo- 
sób następujący:  kwazicząstka  -f  kwant  energii-* 
inną  kwazicząstkę  -f  inny  kwant  energii,  spełniają- 
cymi odpowiednie  prawa  zachowania  energii  i kwa- 
zipędu, są  podstawowymi  metodami  zdobywania 
informacji  o widmie  kwazicząstek.  Warto  zaznaczyć, 
że  oprócz  rozpraszania  kwantów  stosuje  się  również 
rozpraszanie  cząstek,  np.  rozpraszanie  neutronów, 
dające  podstawowe  informacje  o widmie  fononów. 

Omawialiśmy  tu  wzbudzenia  związane  ze  wzbudze- 
niami wnętrza  trójwymiarowego  kryształu.  Nieomal 
każde  z tych  wzbudzeń  ma  swój  analog  związany 
z powierzchnią  kryształu.  Wzbudzenia  takie,  jak 
zwykle  w fizyce  powierzchni  (-►  Stany  powierzchnio- 
we w ciałach  stałych),  są  opisywane  dwuwymiarowym 
wektorem  kwazipędu,  określonym  przez  sieć  płaską, 
odwrotną  do  powierzchni  kryształu,  stanowiącej  jego 
granicę.  W niektórych  wypadkach  rozważania  nad 
wzbudzeniami  powierzchniowymi  niewiele  się  różnią 
od  rozważań  nad  wzbudzeniami  objętościowymi. 

M.  I.  Kaganow  Elektrony,  fonony,  magnony...  Warszawa 
1978;  M.  I.  Kaganow,  I.  M.  Lifszyc,  Kwaziczasticy,  Moskwa 
1976;  W.  Wardzyński,  Polarytony , Post.  Fiz.  27,  477  (1976). 


Stany  powierzchniowe  w ciałach 
stałych 

Jacek  Łagowski  i Andrzej  Morawski 


Powierzchnia  rozumiana  jako  ograniczenie  bryły 
ciała  stałego  lub,  w złożonych  układach,  jako  granica 
pomiędzy  różnymi  fazami  pełni  istotną  rolę  w wielu 
zjawiskach,  będących  przedmiotem  równoczesnego 
zainteresowania  szeregu  dziedzin  nauki.  Spośród 
szczególnie  aktualnych  zagadnień  związanych  z po- 
wierzchnią wymienić  można  badania  mechanizmów 
funkcjonowania  układów  biologicznych,  zjawiska 
katalizy  itp. 

Zainteresowanie  powierzchnią  ciała  stałego,  a zwła- 
szcza procesami  fizycznymi  zachodzącymi  na  granicy 
złącza  metal-półprze wodnik  datuje  się  od  1876  r., 
kiedy  to  odkryto  zjawisko  fotowoltaiczne  w tego 
rodzaju  złączach.  Znane  już  wtedy  było  prostujące 
działanie  kontaktu  metal-półprzewodnik  (1874  r.). 
Jednak  dopiero  prace  z lat  pięćdziesiątych  XX  w. 
przyczyniły  się  do  istotnego  postępu  w dziedzinie 
wiedzy  o powierzchni.  Zapoczątkowany  w latach 
dwudziestych  naszego  stulecia  burzliwy  rozwój 
fizyki  ciała  stałego  pozwala  w stopniu  zadawalającym 
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opisywać  i rozumieć  własności  wnętrza  kryształów. 
Postęp  w technologii  umożliwiający  otrzymywanie 
dużych,  jednorodnych  monokryształów  zbliżył  re- 
zultaty badań  doświadczalnych  do  teoretycznych. 
Teoretyczny  model  krystalicznego  ciała  stałego  za- 
kłada translację  komórki  elementarnej  aż  do  nie- 
skończoności; nie  uwzględnia  zatem  ograniczenia 
przestrzennego  kryształu.  Wprowadzenie  takiego 
ograniczenia,  tzn.  powierzchni,  pociąga  za  sobą  dale- 
ko idące  konsekwencje.  Jak  wykazał  I.  E.  Tamm 
(1932  r.),  występujące  na  powierzchni  zaburzenie 
periodyczności  sieci  krystalicznej  i w związku  z tym 
zaburzenie  periodyczności  potencjału  na  granicy 
kryształ-próżnia  prowadzi  do  pojawienia  się,  nawet 
w idealnych  kryształach  półprzewodnikowych, 
dozwolonych  elektronowych  stanów  energetycznych 
w obszarze  energii  wzbronionych  (tzw.  stanów  po- 
wierzchniowych Tamma).  Zagadnieniem  tym  zajmo- 
wało się  następnie  wielu  fizyków.  Do  szczególnego 
postępu  wiedzy  o stanach  powierzchniowych  dopro- 


wzbudzenia 

powierzch- 

niowe 


stany  po- 
wierzchnio- 
we Tamma 


wadziły  prace  W.  Shockleya.  Wynalezienie  w 1948  r. 
tranzystorów  przez  J.  Bardeena,  W.  Brattaina 
i W.  Shockleya,  przy  okazji  badań  powierzcfmi 
półprzewodników,  w istotny  sposób  wzmogło  zain- 
teresowanie fizyką  półprzewodników  i w szczególno- 
ści problematyką  stanów  powierzchniowych,  mają- 
cych ogromne  znaczenie  w działaniu  kontaktów  me- 
tal-półprzewodnik,  złączy  />-«,  tranzystorów,  a zwłasz- 
cza układów  scalonych.  Dotychczas  jednak  nie  zo- 
stały rozwiązane  zasadnicze  problemy  poznawcze 
i fizyka  powierzchni  i stanów  powierzchniowych  nadal 
znajduje  się  w stadium  intensywnego  rozwoju. 


Powierzchnie  czyste  i powierzchnie 
rzeczywiste 

Pochodzenie  (natura)  stanów  powierzchniowych 
oraz  zjawiska  nimi  uwarunkowane  wiążą  się  ściśle 
z charakterem  powierzchni  kryształu.  Najprostszy 
w sensie  fizycznym  i chemicznym  układ  stanowi  tzw. 
powierzchnia  powierzchnia  czysta,  czyli  zewnętrzna  powierzchnia 
czysta  atomowa  (jonowa)  kryształu,  będąca  zakończeniem 
sieci  krystalicznej  (rys.  1).  Najlepszą  ilustracją 
takiej  powierzchni  jest  powierzchnia  kryształu  roz- 
łupanego w ultrawysokiej  próżni.  Istnienie  w kryszta- 
łach pewnych  płaszczyzn  sieciowych,  tzw.  płaszczyzn 
łupliwości,  umożliwia  odsłonięcie  płaszczyzn  zawie- 


Rys.  1.  Idealna  powierzchnia  czysta  — schemat  dwuwymiarowy. 
W zależności  od  powierzchni  krystalograficznej  atom  powierzch- 
niowy ma  zerwane  jedno  wiązanie  (np.  powierzchnia  111  ger- 
manu) lub  dwa  wiązania  (np.  powierzchnia  100  germanu) 


rających  tylko  jeden  rodzaj  atomów  (jonów).  Na 
czystość  powierzchni  odsłoniętych  po  przełupaniu 
wpływa  wtedy  tylko  czystość  całego  kryształu,  tzn. 
przypadkowe  domieszki  przedostające  się  do  mono- 
kryształu w procesie  hodowania.  Z powierzchniami 
czystymi  można  mieć  do  czynienia  jedynia  w warun- 
kach ultrawysokiej  próżni  ( p < 10” 8 Pa)  w ograni- 
czonym czasie.  W próżni  rzędu  10~8  Pa  już  po  paru 
godzinach  występuje  dostrzegalne  pokrycie  powierz- 
chni adsorbowanymi  molekułami,  co  zmienia  charak- 
ter powierzchni.  Powierzchnię  czystą  można  również 
otrzymać  usuwając  warstwy  absorbowane  bombar- 
dowaniem jonami,  elektronami,  a w niektórych  wy- 
padkach również  wygrzewaniem  kryształu  w ultra- 
wysokiej próżni. 

powierzchnie  Powierzchnie,  na  których  znajdują  się  warstwy 
rzeczywiste  adsorbowane,  noszą  nazwę  powierzchni  rzeczywi- 
stych. Warstwy  te  mogą  być  silnie  związane  z krysz- 


tałem, tzw.  warstwy  chemisorbowane  (np.  tlen  two- 
rzący na  powierzchni  krzemu  tlenki),  lub  warstwy 
słabo  związane  (np.  cząsteczki  wody),  powstające 
wskutek  fizycznej  adsorpcji.  Zwykle  oba  rodzaje 
warstw  występują  równocześnie.  Powierzchnia  rze- 
czywista obejmuje  trzy  elementy  (rys.  2):  powierzch- 


powierzchnia  rozdziału 
kryształ- warstwa  adsorbowana 


warstwa- 

otoczenie 
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Rys.  2.  Powierzchnia  rzeczywista  — schemat  dwuwymiarowy. 
W praktyce,  z uwagi  na  proces  dyfuzji  w głąb  kryształu,  rozdział 
kryształ- warstwa  adsorbowana  nie  musi  być  ostry 


nię  rozdziału  kryształ-warstwa  adsorbowana,  warstwę 
adsorbowaną,  zewnętrzną  powierzchnię  rozdziału 
warstwa-otoczenie. 

Przy  powszechnie  stosowanej  obróbce  kryształów 
obejmującej  cięcie,  polerowanie  i trawienie  chemiczne 
(lub  elektrolityczne),  które  usuwa  warstwę  przypo- 
wierzchniową uszkodzoną  przy  obróbce  mechanicz- 
nej, uzyskuje  się  powierzchnie  rzeczywiste.  Jeden 
z rodzajów  powierzchni  rzeczywistych  stanowią  po- 
wierzchnie celowo  pokryte  warstwami  izolatora,  prze- 
wodnika lub  jednego  i drugiego.  Pewne  ich  rodzaje, 
tzw.  struktury  warstwowe  (np.  struktury  MIS  — 
metal-izolator-półprzewodnik)  wykorzystywane  są 
powszechnie  jako  elementy  elektroniczne. 

W dotychczas  opanowanych  zastosowaniach  prak- 
tycznych ciał  stałych  mamy  do  czynienia  jedynie  z po- 
wierzchniami rzeczywistymi.  Znaczenie  badań  po- 
wierzchni czystych  określają  względy  poznawcze. 
Powierzchnie  te  stanowią  najprostszy  układ  odnie- 
sienia, bez  którego  trudno  określić  jednoznacznie  me- 
chanizmy zjawisk  zachodzących  na  dowolnej  po- 
wierzchni. 


Stany  powierzchniowe  na  powierzchni 
czystej 


Atomowa  powierzchnia  kryształu  jest  utworzona 
przez  ostatnią  płaszczyznę  atomów  (jonów)  sieci  kry- 
stalicznej (rys.  1).  Atomy  tworzące  tę  płaszczyznę  są 
pozbawione  części  swoich  sąsiadów  niezbędnych  do 
skompletowania  wiązań  sieci  krystalicznej.  W po- 
glądowych modelach  atomistycznych  uważa  się,  że 
stany  powierzchniowe  pochodzą  od  zerwanych  wiązań 
atomów  powierzchni,  które  oddają  elektron  (stany 
donorowe,  rys.  3a)  lub  też  zostają  uzupełnione  przy- 
łączeniem elektronu  (stany  akceptorowe,  rys.  3b). 
W modelu  takim  liczba  stanów  powierzchniowych 
wiąże  się  ściśle  z liczbą  atomów  na  powierzchni 
i jest  rzędu  1014/cm2.  Ze  względu  na  to,  że  ruch  ele- 


Rys.  3.  Stany  powierzchniowe  związane  z zerwanymi  wiązania- 
mi: a)  donorowe,  b)  akceptorowe.  W wypadku  (a)  atom  po- 
wierzchni oddaje  swój  elektron  uczestniczący  w wiązaniu,  ła- 
dując się  dodatnio;  w wypadku  (b)  przyłącza  elektron  uzupeł- 
niający zerwane  wiązanie 
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ktronów  jest  możliwy  po  powierzchni  (przejście  z jed- 
nego atomu  na  drugi),  a niemożliwy  prostopadle  do 
niej,  mówi  się,  że  elektrony  w stanach  powierzchnio- 
wych są  swobodne  w kierunkach  równoległych  do 
powierzchni,  a zlokalizowane  prostopadle  do  niej. 
modele  ato-  Modele  atomistyczne  powierzchni,  aczkolwiek  nie 
mistyczne  dają  ścisłego  ilościowego  opisu  stanów  powierzchnio- 
powierzchni  wych  i procesów  elektronowych  z nimi  związanych, 
stanowią  podstawę  do  jakościowej  interpretacji  wielu 
zjawisk,  w tym  w szczególności  fizykochemicznej 
aktywności  powierzchni,  zależności  prędkości  wzrostu 
kryształów  od  orientacji  powierzchni,  różnej  odpor- 
ności mechanicznej  powierzchni  itp. 

Znacznie  precyzyjniejszy  opis  stanów  powierz- 
chniowych na  czystej  powierzchni  można  uzyskać  na 
gruncie  teorii  kwantowej.  Jednak  mimo  już  ponad 
czterdziestoletnich  badań  i niewątpliwych  postępów 
ciągle  jeszcze  nie  jest  możliwy  pełny  ilościowy  opis 
elektronowej  struktury  powierzchni  rzeczywistego 
kryształu.  Wielka  złożoność  zagadnienia  zmusza  do 
przyjmowania  upraszczających  założeń  dość  daleko 
odbiegających  od  sytuacji  istniejącej  w rzeczywistym 
krysztale.  Podstawowym  założeniem  upraszczającym 
jest  założenie,  że  symetria  translacyjna  zachowuje  się 
aż  do  powierzchni.  Przy  tak  postawionym  zagadnie- 
niu powierzchnia  jest  traktowana  jako  obszar  przej- 
ścia od  periodycznie  zmieniającej  się  energii  poten- 
cjalnej elektronu  wewnątrz  kryształu  (-*  Struktura 
elektronowa  ciał  stałych)  do  stałej  wartości  energii 
potencjalnej  elektronu  w otaczającej  kryształ  próżni. 
Obszar  przejścia  stanowi  równocześnie  barierę  po- 
tencjału uniemożliwiającą  odpływ  elektronów  z 
kryształu  do  próżni.  Znając  rozwiązanie  równania 
Schródingera  w obu  ośrodkach,  tj.  znając  funkcje 
struktura  falowe  elektronów  w krysztale  i w próżni,  można 
elektronowa  określić  strukturę  elektronową  na  powierzchni, 
na  po-  Wynikiem  takiej  analizy  są  dwa  ogólne  wnioski: 
wierzchni  1)  dla  energii  elektronu  leżącej  w obrębie  dozwolo- 
nych pasm  energetycznych  powierzchnia  nie  wpro- 
wadza żadnych  dodatkowych  ograniczeń  na  stany 
energetyczne  elektronu  w krysztale;  2)  w obszarze 
energii  wzbronionych  (w  przerwie  energetycznej) 
pojawiają  się  pewne  poziomy  energetyczne,  zwane 
stanami  powierzchniowymi,  dozwolone  dla  elektro- 
nów. Obydwa  te  wnioski  są  niezwykle  istotne.  A mia- 
nowicie wniosek  pierwszy  oznacza,  że  struktura 
pasmowa  cienkich  kryształów  (coraz  powszechniej 
stosowanych  do  produkcji  przyrządów  półprzewodni- 
kowych) zawiera  wszystkie  cechy  struktury  pasmowej 
nieskończonego  kryształu;  z wniosku  zaś  drugiego 
wynika,  że  obecność  powierzchni  (bariery  potencja- 
łu na  powierzchni)  manifestuje  się  analogicznie  jak 
obecność  domieszek  w krysztale,  wprowadzając  lokal- 
ne poziomy  energetyczne  w przerwie  wzbronionej, 
stany  Przyjęty  powszechnie  dla  poziomów  energetycz- 
powierz-  nych  na  powierzchni  termin  stany  powierzchniowe 
chniowe  wiąże  się  ściśle  z charakterem  funkcji  falowych  opisu- 
jących elektrony  na  powierzchni.  Funkcje  falowe  tych 
elektronów  zanikają  wykładniczo  w głąb  kryształu. 
Oznacza  to,  że  elektrony  nie  mogą  przemieszczać  się 
w kierunku  prostopadłym  do  powierzchni,  a zatem  są 
na  niej  zlokalizowane.  Omówione  powyżej  ogólne, 
jakościowe  wnioski  otrzymuje  się  bez  względu  na 
kształt  bariery  potencjalnej  przy  powierzchni  — 
konieczne  jest  tylko  jej  istnienie.  Chcąc  podać  peł- 
niejszy, ilościowy  opis  stanów  powierzchniowych, 
tzn.  określić  funkcje  falowe  elektronów  w stanach 
powierzchniowych,  położenie  energetyczne  (wartości 
energii),  gęstość  tych  stanów,  należy  uwzględnić 
przebieg  energii  potencjalnej  elektronów  przy  po- 
wierzchni. Rozwiązanie  tego  zagadnienia  w sposób 
ścisły  nie  jest  możliwe.  Niemożność  pełnego  opisu 
teoretycznego  stanów  powierzchniowych  wynika  z: 
1)  nieznajomości  rzeczywistego  kształtu  energii  po- 
tencjalnej na  powierzchni  kryształów,  2)  występowa- 
nia przy  powierzchni  zaburzenia  struktury  krystalo- 
graficznej — przegrupowania  atomów  na  płaszczyźnie 
sieciowej  ograniczającej  kryształ  i na  płaszczyznach 
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z nią  sąsiadujących,  3)  trudności  rachunkowych  w ok- 
reśleniu funkcji  falowych  we  wnętrzu  kryształu  odpo- 
wiadających energiom  wzbronionym.  Najtrudniejsze 
do  pokonania  wydają  się  problemy  1 i 2.  Warunkiem 
ich  rozwiązania  jest  uzyskanie  danych  doświadczal- 
nych o strukturze  powierzchni  w mikro-  i makroskali. 

Duże  nadzieje  wiąże  się  tutaj  z dalszym  rozwojem  no- 
woczesnych metod  badawczych  opartych  na  dyfrakcji 
elektronów  (np.  metody  LEED  — dyfrakcji  powol- 
nych elektronów)  oraz  spektroskopii  jonowej,  tzw. 
spektroskopii  elektronów  Augera,  wykorzystującej 
czułe  na  lokalną  strukturę  powierzchni  zjawisko 
emisji  elektronów  z kryształu  na  skutek  oddziały- 
wania z jonami  gazów  szlachetnych. 

Uzyskiwane  z metod  przybliżonych  parametry 
stanów  powierzchniowych  w decydujący  sposób  za- 
leżą od  przebiegu  energii  potencjalnej  na  powierzchni. 

Ze  względów  historycznych  rozróżnia  się  dwa  typy 
przybliżenia  przebiegu  energii  potencjalnej,  które  po- 
służyły Tammowi  (1932  r.)  i Shockleyowi  (1939  r.) 
do  sformułowania  pierwszych  teorii  stanów  powierz- 
chniowych. Tamm  przyjął  niesymetryczny  przebieg 
energii  potencjalnej  w otoczeniu  ostatniej  warstwy 
atomowej,  Shockley  natomiast  zakładał  symetryczny  przybliżenie 
przebieg  potencjału  aż  do  ostatniej  warstwy  atomowej  Tamma 
(rys.  4).  W rezultacie  Tamm  uzyskał  jeden  poziom 
energetyczny  leżący  pomiędzy  każdymi  dwoma  pas- 


Rys.  4.  Przejście  od  periodycznie  zmiennej  energii  potencjalnej 
elektronu  U wewnątrz  kryształu  do  stałej  energii  w próżni  dla 
idealnego  kryształu  i idealnej  powierzchni.  Linia  przerywana 
przedstawia  przybliżenie  Tamma  z niesymetrycznym  zakończe- 
niem energii  potencjalnej  elektronu  na  powierzchni  (z  = 0). 

W przybliżeniu  Shockleya  energia  elektronu  zmienia  się  syme- 
trycznie aż  do  powierzchni;  a stała  sieci  krystalicznej 

mami  energii  dozwolonych  — są  to  tzw.  stany  po- 
wierzchniowe Tamma,  podczas  gdy  Shockley  uzyskał 
dwa  poziomy  energetyczne  leżące  w pobliżu  środka 
przerwy  energetycznej,  tzw.  stany  powierzchniowe  przybliżenie 
Shockleya.  Jakkolwiek  obydwa  modele  odbiegają  Shockleya 
znacznie  od  sytuacji  w krysztale  rzeczywistym,  odegra- 
ły jednakże  bardzo  ważną  rolę  w rozwoju  całej  fizyki 
stanów  powierzchniowych.  Na  podstawie  dotychcza- 
sowych badań  teoretycznych  można  dzisiaj  przynaj- 
mniej w sposób  jakościowy  określić  możliwe  rodzaje 


Rys.  5.  Rodzaje  stanów  powierzchniowych  na  powierzchni  czy- 
stej: a)  poziomy  dyskretne  o położeniach  energetycznych  Ex 
i E2,  b)  pasma  o szerokościach  SEt  i ÓE2,  c)  stany  o ciągłym  roz- 
kładzie gęstości  w funkcji  energii ; Ec,  Ev  — energia  odpowiada- 
jąca dolnej  krawędzi  pasma  przewodnictwa  i wierzchołkowi  pa- 
sma walencyjnego 


stany  szybkie 
i powolne 


stanów  powierzchniowych  na  powierzchni  atomowo 
czystej.  Rezultaty  te  przedstawione  są  na  rys.  5. 
Tak  więc  możliwe  są  dyskretne  poziomy  energetyczne 
o położeniu  energetycznym  E1  i E2,  wąskie  pasma 
o krawędziach  przy  energii  Ex  i (szerokościach 

energetycznych  6EX  i SEJ  oraz  ciągły  rozkład  stanów 
powierzchniowych  z maksimami  gęstości  stanów 
przy  energiach  Ex  i E2. 


Stany  powierzchniowe  na  powierzchni 
rzeczywistej 

Zagadnienie  stanów  powierzchniowych  na  powierzch- 
ni rzeczywistej  jest  znacznie  bardziej  skomplikowane 
niż  na  powierzchni  atomowo  czystej,  tak  że  teoria 
stanów  powierzchniowych  w tym  wypadku  nie  została 
dotychczas  w sposób  zadowalający  sformułowana. 
Adsorbowana  na  zewnętrznej  płaszczyźnie  atomowej 
kryształu  warstwa  w sposób  zasadniczy  zmienia  prze- 
bieg energii  potencjalnej  elektronu.  W wyniku  ad- 
sorbcji  zerwane  wiązania  zostają  wysycone  (rys.  2), 
co  powoduje  zanik  stanów  powierzchniowych  charak- 
terystycznych dla  powierzchni  czystych.  Pojawiają  się 
natomiast  inne  stany  powierzchniowe  pochodzące 
od  niedopasowania  warstwy  adsorbowanej  z płasz- 
czyzną atomową,  domieszek  gromadzących  się  na 
granicy  rozdziału  kryształ-warstwa,  domieszek  i de- 
fektów w warstwie  oraz  molekuł  osiadających  na 
granicy  rozdziału  warstwa  adsorbowana-otoczenie. 
Parametry  stanów  powierzchniowych,  takie  jak  poło- 
żenie energetyczne,  gęstość,  przekrój  czynny  na  wy- 
chwyt elektronu  czy  dziury  itp.,  zależą  od  powierzchni 
krystalograficznej,  obróbki  kryształu  oraz  atmosfery 
gazowej  otaczającej  kryształ. 

Zazwyczaj  stany  powierzchniowe  występujące  na 
powierzchni  rzeczywistej  dzieli  się  na  dwie  grupy  — 
tzw.  stany  szybkie  i powolne.  Podział  ten  dokonywany 
jest  ze  względu  na  czas  wymiany  ładunku  pomiędzy 
stanami  powierzchniowymi  i wnętrzem  kryształu. 
Dla  stanów  szybkich  czas  ten  jest  rzędu  mikrosekund, 
dla  powolnych  zaś  — milisekund  lub  dłuższy.  Stany 
szybkie  o gęstości  nie  przewyższającej  1012  na  cm2 
zlokalizowane  są  na  ogół  na  granicy  rozdziału  krysz- 
tał-warstwa adsorbowana;  powolne  — wewnątrz 
warstwy  adsorbowanej  i na  granicy  rozdziału  warstwa 
-otoczenie  (liczba  tych  stanów  może  osiągać  101S  na 
cm2).  Parametry  stanów  powierzchniowych  uzyskuje 
się  doświadczalnie  analizując  udział  stanów  powierz- 
chniowych w zjawiskach  fizycznych,  takich  jak  prze- 
wodnictwo powierzchniowe,  efekt  połowy  i fotona- 
pięcie  powierzchniowe. 


Udział  stanów  powierzchniowych 
w zjawiskach  fizycznych 


w wielu  zjawiskach  fizycznych  zachodzących  w krysz-  przewodni- 
tale.  Wśród  tych  zjawisk  istnieją  takie,  w których  po-  ctwo  i rekom- 
wierzchnia  daje  pewien  przyczynek  do  obserwowanego  binacja  po- 
w całym  krysztale  efektu,  np.  udział  przewodnictwa  wierzchnio- 
powierzchniowego  w całkowitym  przewodnictwie  wa 
kryształu,  udział  rekombinacji  powierzchniowej  w fo- 
toprzewodnictwie  itp.,  oraz  takie,  które  nie  istnia- 
łyby, gdyby  nie  było  stanów  powierzchniowych,  np. 
fotonapięcie  powierzchniowe.  Doświadczalne  bada- 
nie tych  zjawisk  jest  źródłem  informacji  o parametrach 
stanów  powierzchniowych,  takich  jak  położenie  ener- 
getyczne, gęstość,  przekroje  czynne  na  wychwyt  ele- 
ktronów i dziur  itp.  Przy  wyjaśnieniu  wpływu  po- 
wierzchni na  elektronowe  zjawiska  zachodzące  w kry- 
sztale szczególnie  ważna  jest  koncepcja  przypowierz- 
chniowego obszaru  ładunku  przestrzennego. 


Przypowierzchniowy  obszar  ładunku 
przestrzennego 

Koncepcję  przypowierzchniowego  obszaru  ładunku 
wysunęli  J.  Bardeen,  W.  Shockley  i W.  Brattain. 
Stany  powierzchniowe  traktuje  się  jako  zlokalizowane 
na  powierzchni  naładowane  centra.  Oznacza  to,  że 
powierzchnia  jest  elektrycznie  naładowana.  Aby 
kryształ  pozostał  elektrycznie  obojętny,  sumaryczny 
ładunek  powierzchni  musi  być  zrównoważony  rów- 
nym co  do  wartości  ładunkiem  przeciwnego  znaku 
w sąsiadującym  z powierzchnią  wnętrzem  kryształu. 
W ten  sposób  w krysztale  mamy  do  czynienia  z trzema 


pasmo  walencyjne 
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kryształu 
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Obecność  stanów  powierzchniowych,  ładunku  elek- 
trycznego w nich  zgromadzonego  oraz  zmiana  ła- 
dunku w stanach  powierzchniowych  przejawia  się 


Rys.  6.  Schemat  energetyczny  powierzchni  rzeczywistej  i przy- 
powierzchniowego obszaru  ładunku  przestrzennego;  prostokąta- 
mi zaznaczono  różne  rodzaje  stanów  powierzchniowych.  Podano 
również  podstawowe  wielkości  charakteryzujące  powierzchnię 


Przypowierzchniowy  obszar  ładunku  przestrzennego  w półprzewodnikach 


Typ  przewodni- 

Ładunek w sta- 

Charakterystyka 

ctwa  elektrycz- 
nego we  wnętrzu 
kryształu 

nach  powierzch- 
niowych 

nazwa  obszaru 

typ  przewodnictwa  elektrycznego 

Elektronowe 

ujemny 

ujemny  o du- 
żej wartości 
dodatni 

obszar  zubożenia  (słabo  przewodzący) 
obszar  inwersji  (przewodzący) 
obszar  wzbogacenia  (silnie  przewodzący) 

elektronowe,  koncentracja  elektronów  mniejsza  niż 

we  wnętrzu 

dziurowe 

elektronowe,  koncentracja  elektronów  większa  niż 
we  wnętrzu 

Dziuro  we 

ujemny 

dodatni 

dodatni  o dużej 
wartości 

obszar  wzbogacenia  (silnie  przewodzący) 
obszar  zubożenia  (słabo  przewodzący) 
obszar  inwersji  (przewodzący) 

dziurowe,  koncentracja  dziur  większa  niż  we 
wnętrzu 

dziurowe,  koncentracja  dziur  mniejsza  niż  we 

wnętrzu 

elektronowe 
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elementami:  naładowaną  elektrycznie  powierzchnią, 
przypowierzchniowym  obszarem  ładunku  przestrzen- 
nego — neutralizującym  ładunek  powierzchni,  oraz 
elektrycznie  obojętnym  wnętrzem  kryształu  (rys.  6). 
W półprzewodnikach  koncentracje  elektronów  (lub 
obszary  dziur)  są  stosunkowo  niewielkie  i przypowierzchnio- 
zuhożenia,  wy  obszar  ładunku  przestrzennego  rozciąga  się  na 
inwersji^  i głębokość  od  10“ 5 cm  do  10“3  cm.  W metalach  jest  on 
wzbogacenia  rzędu  10“ 7 cm  i w większości  zjawisk  nie  odgrywa 
znaczącej  roli.  Zależnie  od  ładunku  w stanach  po- 
wierzchniowych rozróżnia  się  trzy  obszary  ładunku 
powierzchniowego  — tzw.  obszar  zubożenia,  inwersji 
i wzbogacenia,  scharakteryzowane  w tabeli  i przed- 
stawione na  rys.  7. 


wzbogacenia 


zubożenia 


obszar 

inwersji 


a)  b>  c) 

Rys.  7.  Przypowierzchniowy  obszar  ładunku  przestrzennego 
w półprzewodniku  typu  n (przewodnictwo  elektronowe):  a)  ob- 
szar wzbogacenia  — koncentracja  elektronów  większa  niż  we 
wnętrzu  kryształu,  b)  obszar  zubożenia  — koncentracja  elektro- 
nów niniejsza  niż  we  wnętrzu  kryształu,  c)  obszar  inwersji  — 
zmiana  typu  przewodnictwa;  we  wnętrzu  — typ  ny  w POŁP  — 
typ  P\  Er.,  Ev  energia  odpowiadająca  dolnej  krawędzi  pasma 
przewodnictwa  i wierzchołkowi  pasma  walencyjnego,  Ef  po- 
ziom Fermiego.  Obszar  inwersji  jest  zawsze  oddzielony  od  obję- 
tości obszarem  zubożenia 


pole  elek-  Obszar  przypowierzchniowy  może  mieć  zupełnie 
tryczne  w ob-  inne  własności  fizyczne  niż  wnętrze  kryształu.  Pole 
szarze  przy-  elektryczne  może  w nim  osiągnąć  wartości  rzędu 
powierzch-  105  V/cm.  Może  to  być  obszar  izolujący  lub  silnie 
niowym  przewodzący.  Ruchliwość  nośników  prądu  jest  w nim 
z reguły  znacznie  niższa  niż  we  wnętrzu  kryształu 
(z  uwagi  na  rozpraszanie  przez  powierzchnię).  Inne 
są  własności  rekombinacyjne.  W obszarach  silnej 
inwersji  i wzbogacenia  istotnej  modyfikacji  ulega 
struktura  pasmowa.  Charakterystyczne  dla  wnętrza 
kryształu  kwaziciągłe  pasma  dozwolonych  energii 
ulegają  kwantyzacji  w kierunku  prostopadłym  do  po- 
wierzchni, tzn.  zachowując  ciągłość  w kierunkach 
równoległych  do  powierzchni  rozpadają  się  na  układ 
poziomów  dyskretnych  dla  kierunku  ruchu  elektronu 
(dziury)  prostopadłego  do  powierzchni. 


Przewodnictwo  powierzchniowe 

Jedną  z najbardziej  rozpowszechnionych  metod 
eksperymentalnych  badania  stanów  powierzchniowych 
opartych  na  procesach  zachodzących  w przypowierz- 
chniowym obszarze  ładunku  przestrzennego  stanowi 
pomiar  przewodnictwa  elektrycznego  cienkich  płytek 
w funkcji  atmosfery  gazowej  (rys.  8).  W metodzie  tej 
poddaje  się  analizie  przewodność  powierzchniową 
materiału  zdefiniowaną  jako  er*  = 1/%d(<x— cr0bj),  gdzie 
a — całkowita  (mierzona)  przewodność  płytki, 
a crobj  — przewodność  objętościowa  materiału,  czyli  — 
gdy  płytka  jest  dostatecznie  cienka  — przewodność 
odpowiadająca  zerowemu  ładunkowi  na  powierzchni, 
d — grubość  płytki ; czynnik  1/2  pochodzi  z uwzględ- 
nienia dwóch  powierzchni  płytki.  Pokazany  na  rys.  8a 
przebieg  przewodności  pozwala  określić  całkowity  ła- 
dunek w stanach  powierzchniowych  odpowiadający 
danej  atmosferze.  Na  krzywej  można  wyodrębnić  sil- 
nie przewodzące  obszary  przypowierzchniowe:  ob- 
szar inwersji,  w którym  dominuje  przewodnictwo 
elektronowe,  oraz  obszar  wzbogacenia  o przewodni- 
ctwie dziurowym.  Obszary  te  przedzielone  są  obsza- 
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Rys.  8.  Zmiana  przewodnictwa  elektrycznego  cienkich  próbek 
Ge  typu  p (przewodnictwę  dziurowe)  przy  zmianach  atmosfery 
gazowej  oraz  zmiana  ich  oporu  elektrycznego  przy  rozciąganiu 


rem  zubożenia  przewodzącym  słabiej  niż  wnętrze 
płytki. 

Informacji  o przejściu  pod  działaniem  atmosfery 
od  dominacji  elektronów  w przypowierzchniowym 
obszarze  ładunku  do  dominacji  dziur  dostarcza  po- 
miar piezooporu  (zmiany  oporu  wywołanej  mecha- 
nicznym naprężeniem)  cienkich  płytek  garmanowych 
lub  krzemowych  (rys.  8b).  W germanie  i krzemie 
elektrony  wnoszą  do  piezooporu  przyczynek  prze- 
ciwnego znaku  niż  dziury,  stąd  też  całkowity  piezo- 
opór  cienkiej  płytki  zmienia  znak  przy  zmianie  atmo- 
sfery otaczającej  płytkę  sygnalizując  przejście  od  do- 
minacji elektronów  do  dominacji  dziur. 

Należy  podkreślić,  że  przejście  pod  działaniem 
atmosfery  przez  wszystkie  trzy  rodzaje  ładunku  po- 
wierzchniowego możliwe  jest  jedynie  w nielicznych 
wypadkach.  W ogromnej  większości  materiałów  pół- 
przewodnikowych obszar  ten  jest  obszarem  zuboże- 
nia o małej  przewodności,  trudnej  do  wydzielenia 
z całkowitej  przewodności  cienkich  płytek.  Ponadto 
w przewodnictwie  powierzchniowym,  obok  udziału 
swobodnych  elektronów  i dziur  w przypowierzchnio- 
wym obszarze  ładunku  przestrzennego,  możliwe  jest 
również  przewodnictwo  po  samych  stanach  powierz- 
chniowych, którego  nie  można  określić  wskutek  bra- 
ku modeli  teoretycznych  stanów  powierzchniowych 
(a  tym  samym  i mechanizmu  przewodnictwa  po  sta- 
nach powierzchniowych). 


Efekt  połowy 

W określaniu  położeń  energetycznych  i koncentracji 
stanów  powierzchniowych  na  powierzchniach  rzeczy- 
wistych, a niekiedy  również  na  powierzchniach  czy- 
stych, pomocny  jest  efekt  połowy.  Jest  to  efekt  pow- 
stający, gdy  do  kryształu  półprzewodnikowego  przy- 
łoży się  zewnętrzne  pole  elektryczne  w sposób  po- 
jemnościowy. Płaska  elektroda  przewodząca  (naj- 
częściej metalowa)  tworzy  z płytką  półprzewodnikową 
kondensator  płaski  o pojemności  C (rys.  9a).  Przy- 
łożone napięcie  U indukuje  na  elektrodzie  i w próbce 
ładunek  przeciwnego  znaku  o wartości  Qina  — CU. 
Gdyby  nie  było  stanów  powierzchniowych,  cały  ła- 
dunek elektryczny  indukowany  w próbce  przejawiał- 
by się  jako  ładunek  przewodzących  prąd  swobodnych 


pomiar 

piezooporu 


wysokie  napięcie 
zmienne  lub  stałe 


b) 

Rys.  9.  Układ  do  pomiaru  efektu  polowego  oraz  zależność  prze- 
wodności elektrycznej  cienkiej  płytki  germanowej  typu  p od  na- 
pięcia na  elektrodzie  polowcj  (wykres  wykonany  jest  w funkcji 
— U,  gdyż  znak  ładunku  indukowanego  w próbce  jest  przeciwny 
niż  ładunku  na  elektrodzie  polowej) 


zastosowanie 
w tranzysto- 
rze polowym 


powierzch- 
niowy efekt 
piezoelek- 
tryczny 
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nośników  (elektronów  lub  dziur)  Gprzew  = (?md- 
W rzeczywistości  duża  część  indukowanego  ładunku 
zostaje  wychwycona  i unieruchomiona  w centrach 
na  powierzchni  próbki  (czyli  w stanach  powierzch- 
niowych) i C?przew/£?ind  < 1 J różnica  Qind  — Gprzew  jest 

ładunkiem  wychwyconym  przez  stany  powierzch- 
niowe. O wartości  Ćprzew  wnioskuje  się  ze  zmian  prze- 
wodności płytki  w funkcji  napięcia  U przyłożonego 
do  elektrody  polowej  (rys.  9b). 

Przebiegi  czasowe  zmian  przewodności  przy  włą- 
czeniu i wyłączeniu  napięcia  na  elektrodzie  umożliwia- 
ją określenie  parametrów  dynamicznych  stanów  po- 
wierzchniowych (przekroju  czynnego  na  wychwyt 
elektronów  i dziur)  oraz  badanie  mechanizmów  wy- 
miany ładunków  między  wnętrzem  kryształu  a stanami 
powierzchniowymi  (np.  zjawisk  tunelowych  na  po- 
wierzchni). Efekt  połowy  ma  także  ogromne  znaczenie 
praktyczne  — został  on  wyzyskany  w tranzystorze 
polowym. 

W półprzewodnikach  o własnościach  piezoelektrycz- 
nych (kryształy  polarne  o strukturze  nie  mającej 
środka  symetrii)  wykorzystuje  się  wersję  efektu  polo- 
wego, w której  modulacja  pola  elektrycznego  przy  po- 
wierzchni odbywa  się  przez  przyłożenie  do  kryształu 
jednoosiowych  naprężeń  mechanicznych  (tzw.  po- 
wierzchniowe efekty  piezoelektryczne).  Przyłożone 
naprężenia  powodują  powstawanie  w krysztale  pola- 
ryzacji elektrycznej.  Różnica  w stosunku  do  klasycz- 
nej wersji  efektu  polowego  polega  na  wykorzystaniu 
pól  wewnętrznych,  a nie  zewnętrznych,  co  umożliwia 
śledzenie  w eksperymencie  zmian  pracy  wyjścia. 
Praca  wyjścia  W,  zdefiniowana  jako  różnica  energii 
pomiędzy  położeniem  poziomu  Fermiego  w półprze- 
wodniku a energią  elektronu  w próżni,  jest  sumą  po- 
winowactwa elektronowego  odległości  energe- 
tycznej poziomu  Fermiego  Ef  od  dna  pasma  prze- 
wodnictwa Ec  i energii  eUs  wynikającej  z istnienia 
powierzchniowej  bariery  potencjału  (rys.  6).  W usta- 
lonych warunkach  — przy  określonej  temperaturze 
i atmosferze  otaczającej  kryształ  ( x i Ef~Ec  mają 
wówczas  stałe  wartości)  zmiany  pracy  wyjścia  spo- 
wodowane jednoosiowym  naprężeniem  pozwalają 
śledzić  zmiany  bariery  powierzchniowej  Us , a więc 
wielkości  bezpośrednio  związanej  z ładunkiem  w sta- 
nach powierzchniowych. 


Zjawiska  fotoelektryczne  wewnętrzne 

Stany  powierzchniowe  odgrywają  szczególnie  istotną 
rolę  w zjawiskach  fotoelektrycznych  wewnętrznych 
w ciałach  stałych,  np.  w fotoprzewodnictwie  i w pow- 
stawaniu fotonapięcia.  Stanowią  one  bowiem  do- 
datkowy kanał  rekombinacyjny,  a także  biorą  bez- 
pośrednio udział  w pochłanianiu  promieniowania 
elektromagnetycznego  padającego  na  kryształ.  Wiel- 
kość obserwowanego  efektu  zależy  od  generacji, 
czyli  ilości  dodatkowo  wytwarzanych  swobodnych 
nośników  — i od  procesu  odwrotnego,  tzn.  rekombi- 
nacji (anihilacji)  — zaniku  generowanych  nośników. 
Parametrem  opisującym  rekombinację  par  elektron- 
-dziura,  a zatem  i fotoefekt  przy  stałej  generacji  jest 
czas  życia  generowanych  par.  Czas  ten  dla  określonego 
kryształu  jest  tym  dłuższy,  im  mniej  jest  centrów 
rekombinacyjnych  (poziomów  lokalnych  w przer- 
wie wzbronionej).  Stany  powierzchniowe,  które  są  do- 
datkowym, obok  istniejących  we  wnętrzu  kryształu, 
kanałem  rekombinacyjnym  zmniejszają  czas  życia 
generowanych  nośników.  Rekombinacja  w stanach 
powierzchniowych  (rys.  10)  wpływa  na  zależność 
czasu  życia  od  grubości  kryształu  bądź  od  głębokości 
wnikania  światła.  Jeśli  światło  jest  słabo  absorbowane 


Rys.  10.  Przykład  działania  stanów  powierzchniowych  jako  cen- 
trów rekombinacji.  Pary  elektron-dziura,  generowane  światłem 
o energii  hv  większej  od  przerwy  energetycznej  Eu,  anihilują  szyb- 
ciej w obecności  stanów  powierzchniowych 


(energia  padających  fotonów  odpowiada  podstawo- 
wej krawędzi  absorpcji),  generacja  par  jest  jednorod- 
na w całej  objętości  kryształu  i w bardzo  grubych 
płytkach  rekombinacja  powierzchniowa  nieznacznie 
zmienia  czas  życia.  Natomiast  w cienkich  kryształach 
(rzędu  kilkunastu  pm)  procesy  generacji  i rekombina- 
cji zachodzą  przy  powierzchni  i na  czas  życia  duży 
wpływ  ma  rekombinacja  powierzchniowa.  Tak  więc 


długość  fali 

Rys.  11.  Rozkład  spektralny  fotoprzewodności  siarczku  kadmu 
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gdy  płytki  są  cienkie  — przy  generacji  jednorodnej 
obserwuje  się  silną  zależność  czasu  życia  od  grubości 
płytki.  Jeśli  współczynniki  absorpcji  są  duże,  światło 
pochłaniane  jest  w obszarze  przypowierzchniowym 
(w  przybliżeniu  w warstwie  o grubości  równej  od- 
wrotności współczynnika  absorpcji),  a zatem  grubość 
płytki  jest  mało  istotnym  parametrem.  Wynika  to 
stąd,  że  grubość  kryształu  jest  zawsze  co  najmniej 
kilka  razy  większa  od  głębokości  wnikania  światła. 
Przy  generacji  przypowierzchniowej  szczególnie  uprzy- 
wilejowana jest  więc  rekombinacja  przez  stany  po- 
wierzchniowe i prawie  nie  zależy  od  grubości  krysz- 
tału a jedynie  od  stanu  powierzchni  (ilości  centrów 
rekombinacyjnych  na  powierzchni).  Przejawem  silnej 
rekombinacji  powierzchniowej  jest  występowanie 
maksimum  w rozkładzie  spektralnym  fotonapięcia, 
fotoprzewodności  itp.  Przy  energii  fotonów  większej 
od  przerwy  energetycznej,  w obszarze  wzrastającego 
nadal  współczynnika  absorpcji,  zamiast  spodziewane- 
go wzrostu  np.  fotoprzewodności  obserwuje  się  jej 
zmniejszenie,  spowodowane  rekombinacją  powierz- 
chniową (rys.  11). 

ujemny  Rekombinacja  powierzchniowa  jest  zjawiskiem 
wpływ  re-  ujemnie  wpływającym  na  pracę  wszystkich  fotoele- 
kairsbi  nacji  mentów,  a zwłaszcza  fotoogniw  i złącz  laserowych, 
powserzch-  Na  przykład  przy  niewłaściwej  obróbce  powierzchni 
niowej  gęstość  stanów  powierzchniowych  może  tak  wzrosnąć, 
że  wskutek  rekombinacji  powierzchniowej  wielkość 
fotonapięcia  będzie  znacznie  mniejsza  od  spodziewa- 
nej, wynikającej  z własności  kryształu  i wielkości 
generacji. 

Udział  stanów  powierzchniowych  w pochłanianiu 
światła  padającego  na  kryształ  związany  jest  z in- 
dukowanymi światłem  przejściami  elektronowymi 
przedstawionymi  na  rys.  12.  Jest  to  pochłanianie 
nieznaczne,  bezpośrednio  mierzalne  jedynie  przy  wy- 
korzystaniu wielokrotnego  odbicia  światła  od  po- 


hv^Ei~Ev 

1 1 


Rys.  12.  Schematyczne  przedstawienie  przejść  elektronowych  do 
i ze  stanów  powierzchniowych  przy  absorpcji  fotonów  o odpo- 
wiedniej energii  hv 


wierzchni.  W sposób  pośredni  można  je  wykryć 
dzięki  towarzyszącym  tym  przejściom  zmianom  kon- 
centracji nośników  ładunku  w próbce,  modyfikacji 
procesów  rekombinacji  lub  zmianie  obsadzenia 
stanów  powierzchniowych.  Stosowane  w praktyce  me- 
tody sprowadzają  się  w zasadzie  do  pomiarów  foto- 
napięcia w funkcji  energii  fotonów  w obszarze  hv<Eg. 
W najnowszej  z tych  metod,  tzw.  spektroskopii  foto- 
spektro-  napięcia  powierzchniowego,  wykorzystuje  się  zjawis- 
skopia  ko  zmiany  potencjału  powierzchniowego  (zmiany 
fotonapięcia  spadku  napięcia  na  przypowierzchniowym  obszarze 
po  wierzch-  ładunku  przestrzennego  — rys.  6)  przy  oświetleniu, 
mowego  wynikające  ze  zmiany  ładunku  elektrostatycznego 
w stanach  powierzchniowych  pod  wpływem  przejść 
indukowanych  światłem.  W kryształach  o właściwoś- 
ciach piezoelektrycznych,  możliwa  jest  do  zrealizo- 
wania niezwykle  prosta  wersja  spektroskopii  foto- 
napięcia powierzchniowego,  polegająca  na  analizie 
wzbudzonych  światłem  drgań  mechanicznych  cienkich 
płytek  (rys.  13).  Wywołana  światłem  zmiana  ładunku 
w stanach  powierzchniowych  wywołuje  zmianę  pola 
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elektrycznego  w przypowierzchniowym  obszarze  ła- 
dunku przestrzennego,  co  prowadzi  do  mechanicznego 
odkształcenia  cienkich  płytek.  Pomiar  amplitudy 
drgań  w funkcji  energii  fotonów  pozwala  m.in.  na 
bezpośrednie  określenie  położenia  energii  stanów 
powierzchniowych . 


Rys.  13.  Wzbudzanie  drgań  cienkich  płytek  piezoelektrycznych 
przerywanym  strumieniem  światła  monochromatycznego  i re- 
jestrowanie ich  jako  odchylenie  odbitego  od  kryształu  promienia 
lasera  oraz  typowe  zależności  amplitudy  drgań  kryształów  arsen- 
ku galu  i siarczku  kadmu  (grubości  20  pro)  od  długości  fali  świa- 
tła pobudzającego  drgania 


Fotoemisja  (zjawisko  fotoelektryczne 
zewnętrzne) 

Jeśli  energia  fotonów  padających  na  powierzchnię 
jesi  dostatecznie  duża,  obserwuje  się  efekt  wybija- 
nia elektronów  z materiału  do  otoczenia  (zjawisko 
fotoemisji).  W przypadku  metali  próg  fotoemisji  próg 
(minimalna  energia  fotonów,  przy  której  obserwuje  fotoemisji 
się  efekt)  pozwala  określić  pracę  wyjścia,  czyli  różnicę 
pomiędzy  energią  elektronu  w próżni  i energią  po- 
ziomu Fermiego  w materiale.  W przypadku  izola- 
torów i niezwyrodniałych  półprzewodników,  poziom 
Fermiego  leży  w przerwie  energetycznej,  stąd  też 
obecność  elektronów  na  poziomie  Fermiego  może  wy- 
nikać jedynie  z istnienia  poziomów  lokalnych  i ich 
koncentracja  jest  niewielka.  Próg  fotoemisji  pojawia 
się  zatem  nie  przy  energii  fotonów  równej  pracy 
wyjścia,  lecz  przy  energii  hvP  = x+*x+Eg  (rys.  14), 
odpowiadającej  wybijaniu  elektronów  z pasma  wa- 
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Rys.  14.  Emisja  elektronów  przy  absorpcji  fotonów:  a)  z metalu, 
b)  z półprzewodnika;  hvm  i hvp  oznaczają  energie  progowe  od- 
powiednio metalu  I półprzewodnika 


lencyjnego.  Porównanie  wielkości  hvp  i pracy  wyjścia 
(mierzonej  innymi  metodami)  pozwala  wnioskować 
jak  jest  położony  poziom  Fermiego  na  powierzchni 
kryształu.  Położenie  poziomu  Fermiego  zdetermino- 
wane jest  ładunkiem  elektrycznym  w stanach  po- 
wierzchniowych. Badania  fotoemisji  w ultrawysokiej 
próżni,  połączone  z oczyszczaniem  powierzchni, 
pozwalają  wnioskować  o skoku  energii  potencjalnej, 
Axj  na  warstwie  adsorbowanej.  W ostatnim  okresie 
szczególne  zainteresowanie  wzbudzają  precyzyjne 
pomiary  fotoemisji  wywołanej  fotonami  o energiach 
poniżej  energii  progowych.  Elektrony  mogą  być  wy- 
bijane do  otoczenia  ze  stanów  powierzchniowych  zlo- 
kalizowanych w przerwie  energetycznej. 


Fononowe  stany  powierzchniowe 

Obok  omówionych  wyżej  elektronowych  stanów  po- 
wierzchniowych wzrasta  zainteresowanie  drganiami 
sieci  krystalicznej  (-*  Dynamika  sieci  krystalicznej) 
o amplitudzie  zanikającej  wykładniczo  przy  przejściu 
od  powierzchni  w głąb  kryształu  — tzw.  fononowymi 


stanami  powierzchniowymi.  Inaczej,  są  to  fonony  zlo- 
kalizowane na  powierzchni  kryształu.  Podobnie  jak 
elektronowe  stany  powierzchniowe,  występują  na  po- 
wierzchniach rzeczywistych  i czystych  i ich  natura 
wiąże  się  zarówno  ze  strukturą  powierzchni,  jak  też 
z adsorbowanymi  na  powierzchni  molekułami.  Fono- 
ny powierzchniowe  występują  zarówno  jako  drgania 
normalne  akustyczne,  jak  też  optyczne,  a ich  energie 
leżą  zazwyczaj  w obszarze  energii  wzbronionych  we 
wnętrzu  kryształu  (poniżej  energii  objętościowych 
fononów  optycznych  i powyżej  maksymalnej  energii 
objętościowych  fononów  akustycznych).  Obok  roli 
w określaniu  np.  termicznych  własności  kryształów 
lub  procesów  rozproszeniowych,  badania  fononów  po- 
wierzchniowych są  uzupełnieniem  do  badań  elektrono- 
wych stanów  powierzchniowych  — obie  problematyki 
opierają  się  na  tych  samych  modelach  struktury  po- 
wierzchni i oddziaływania  z otaczającą  atmosferą. 

S.  G.  Davison,  J.  D.  Leyine  Surfa  ce  States,  New  York  1970 
(ros.  Moskwa  1973);  D.  R.  Frankl  Electrical  Properties  of  Se - 
miconductor  Surfaces,  Oxford  1967;  A.  Many,  Y.  Goldstein, 
N.  B.  Grover  Semiconductor  Surfaces , Amsterdam  1971;  C.  G. 
Scott,  C.  E.  Reed,  Sur  face  Physics  of  Phosphors  and  Semicon- 
ductor s,  London  1975. 


Wysokie  ciśnienia 

Tadeusz  Suski 

Układ  poddany  działaniu  ciśnienia  zmienia  się  pod 
różnymi  względami.  Gaz  lub  para  może  zamieniać  się 
w ciecz,  ciecz  — w ciało  stałe  lub  odwrotnie,  struktura 
ciała  stałego  może  ulec  przeobrażeniu  w wyniku  zmia- 
ny układu  atomów.  Ciśnienie  może  wpływać  na  szyb- 
kość i sposób  krystalizacji,  stopień  rozpuszczalności 
jednej  substancji  w drugiej,  może  też  wpływać  na  zmia- 
nę szybkości  zachodzenia  wielu  reakcji  chemicznych. 

Geologia  i geofizyka  bada  rezultaty  działania  ciś- 
nienia w procesie  tworzenia  się  skał  i minerałów  na 
wysokie  Ziemi  i we  Wszechświecie.  Opisuje  zjawiska  zacho- 
ciśnienia  dzące  we  wnętrzu  Ziemi  czy  innych  planet.  Zasadnicze 
w przyrodzie  znaczenie  dla  poznania  tych  zjawisk  ma  możliwość  od- 
tworzenia w laboratorium  warunków,  które  decydują 
o zachodzeniu  w przyrodzie  badanych  procesów.  Naj- 
ważniejszymi parametrami  określającymi  te  warunki 
są  wysokie  ciśnienia  i towarzyszące  im  wysokie  tem- 
peratury. Rysunek  1 ilustruje  obszary  występowania 

MPa 


wysokich  ciśnień  w przyrodzie.  Dla  porównania  przed- 
stawiono górne  granice  ciśnień  osiąganych  w labora- 
toriach. 

Inżynieria  materiałowa  koncentruje  się  na  wyko- 
rzystaniu wysokich  ciśnień  do  otrzymywania  nowych 
materiałów.  Specjalnie  prowadzone  procesy  technolo- 
giczne umożliwiają  uzyskanie  substancji  o bardzo 
korzystnych  własnościach,  np.  o wyjątkowej  wytrzy- 
małości mechanicznej  czy  też  odporności  termicznej. 
Wysokie  ciśnienia  umożliwiają  również  szersze  sto- 


sowanie technologii  obróbki  plastycznej  materiałów, 
co  prowadzi  do  znacznej  poprawy  własności  uzyskiwa- 
nych elementów. 


Metody  otrzymywania  wysokich  ciśnień 

Do  otrzymywania  wysokich  ciśnień  w laboratoriach 
stosuje  się  aparaturę  różnych  typów  i konstrukcji. 
Różnice  w ich  budowie  zależą  od  wielkości  uzyskiwa- 
nych ciśnień,  zakresu  temperatur,  objętości  komory, 
aktywności  chemicznej  stosowanych  materiałów. 
Specjalne  warunki  eksperymentalne,  jak  na  przykład 
konieczność  prowadzenia  badań  elektrycznych,  op- 
tycznych, magnetycznych  czy  rentgenowskich,  na- 
rzucają dodatkowe  wymagania  co  do  ich  rozwiązań 
konstrukcyjnych. 

W klasyfikacji  aparatury  wysokociśnieniowej  czę- 
sto stosuje  się  podział  wg  rodzaju  ośrodka  prze- 
kazującego ciśnienia  i odpowiednio  dzieli  się  je 
wtedy  na  aparaturę  gazową,  cieczową  oraz  aparaturę, 
w której  ośrodkiem  przekazującym  ciśnienie  jest  cia- 
ło stałe.  Doświadczenia  wymagające  wysokiej  pre- 
cyzji pomiaru  prowadzone  są  na  ogół  w ciśnieniowych 
urządzeniach  gazowych.  Natomiast  tam,  gdzie  głów- 
nym celem  jest  uzyskanie  jak  najwyższych  ciśnień,  sto- 
suje się  aparaturę,  w której  ośrodkiem  przekazującym 
ciśnienie  jest  ciało  stałe.  Przy  doborze  najodpowied- 
niejszego urządzenia  ciśnieniowego  konieczny  jest  na 
ogół  kompromis  pomiędzy  wygodą  w prowadzeniu 
badań  a trudnościami  wytworzenia  wysokiego  ciś- 
nienia. 

Największą  jednorodność  ciśnienia  gwarantują 
aparatury  gazowe.  Sprężanie  gazów  utrudnia  jednak 
ich  duża  ściśliwość  oraz  konieczność  uszczelnienia 
aparatury.  Trudności  te  zmniejszają  się  oczywiście 
przy  zastosowaniu  urządzeń  cieczowych  oraz  urzą- 
dzeń z ciałem  stałym.  Ze  względu  na  dużą  ściśliwość 
gazów  sprężanie  ich  odbywa  się  w kilku  etapach  w cy- 
lindrach z ruchomymi  tłokami  (rys.  2a ; il.  59,  tabl.  16). 
Sprężony  gaz  przekazuje  się  elastyczną  kapilarą  do 
specjalnie  przystosowanej  dla  danego  rodzaju  pomia- 
rów komory.  Wygląd  jednej  z takich  komór  przedsta- 
wia il.  57  na  tabl.  16. 

Maksymalne  ciśnienie  w aparaturach  gazowych  nie 
przekracza  na  ogół  1500  MPa.  W tym  zakresie  ciśnień 
metody  badawcze  są  tak  rozwinięte,  że  możliwe  jest 
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Rys.  2.  Podstawowe  typy  urządzeń  do  wytwarzania  wysokich 
ciśnień  statycznych:  a)  układ  tłok-cy!inder,  b)  kowadło  Bridg- 
manna  (otaczający  próbkę  pirofilit  jest  ośrodkiem  przekazującym 
ciśnienie  i stanowi  izolację  termiczną  między  kowadłami  a tło- 
kiem i wewnętrznie  grzaną  próbką),  c)  urządzenie  wielokowadłowe 
Halla,  d)  urządzenia  typu  „belt” 


aparatura  Aparaturę  cieczową  można  stosować  w znacznie 
cieczowa  mniejszym  zakresie  temperatur  niż  aparaturę  gazową. 

W niskich  temperaturach  ciecze  zestalają  się  już  przy 
bardzo  małych  ciśnieniach.  W wysokich  temperatu- 
rach ciecz  staje  się  chemicznie  niestabilna.  Utrudnione 
jest  również  prowadzenie  badań  optycznych,  gdyż 
ciecze  są  znacznie  mniej  przezroczyste  niż  gazy. 
Urządzenia  cieczowe  są  natomiast  znacznie  prostsze 
w konstrukcji  i łatwiejsze  w użyciu  niż  gazowe.  Sprę- 
żanie odbywa  się  tu  na  ogół  również  w cylindrze 
z ruchomym  tłokiem,  jednak  ze  względu  na  mniejszą 
ściśliwość  wystarcza  jeden  etap  sprężania.  Ponadto 
w aparaturze  cieczowej  trudności  z zapewnieniem 
szczelności  są  znacznie  mniejsze  niż  w aparaturze  ga- 
zowej. Za  pomocą  komór  cieczowych  można  uzyskać 
ciśnienie  3 a nawet  5 GPa. 

aparatura  Aparatura  ciśnieniowa  z ośrodkiem  stałym,  nazy- 
z ciałem  wana  też  często  aparaturą  kwazihydrosta tyczną, 
stałym  umożliwia  uzyskanie  najwyższych  ciśnień  (rys.  2b, 
c,  d).  Wytworzone  ciśnienia  są  jednak  niejednorodne, 
a bardzo  mała  objętość  komory  roboczej  ogranicza 
możliwości  eksperymentalne  do  obserwacji  jedynie 
dużych,  jakościowych  efektów  najczęściej  związanych 
z przemianami  fazowymi.  W urządzeniach  takich  jak 
przedstawione  na  rys.  2b  możliwe  jest  obecnie  uzyska- 
nie ciśnień  do  100  GPa. 

Do  uzyskania  największych  ciśnień  stosuje  się 
technikę  ciśnień  dynamicznych.  Polega  ona  na  wyko- 
rzystaniu fali  uderzeniowej  powstającej  w wyniku 
eksplozji  (-►  Fale  uderzeniowe),  co  pozwala  uzyskiwać 
ciśnienia  rzędu  10*  GPa.  Wadą  ograniczającą  możli- 
wości stosowania  tej  techniki  jest  trudność  kontrolo- 
wania warunków  doświadczenia,  ponieważ  ciśnienie 
działa  w okresach  mikrosekundowych.  Ponadto 
fala  uderzeniowa  powoduje  wzrost  temperatury  do 
kilku  tysięcy  stopni. 
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Procesy  zachodzące  przy  wysokim  ciśnieniu 

Interpretację  zachowania  się  substancji  poddanych 
działaniu  wysokich  ciśnień  ułatwia  reguła  Le  Chatelie- 
ra.  Mówi  ona,  że  układ  w stanie  równowagi  poddany 
działaniu  sił  zewnętrznych  dąży  do  zminimalizowania 
efektu  działania  przyłożonych  sił.  Dlatego  też  ciśnie- 
nie dąży  do  zahamowania  wszelkich  procesów  prowa- 
dzących do  wzrostu  objętości  układu  i faworyzuje 
reakcje,  których  wynikiem  jest  zmniejszenie  tej  obję- 
tości i,  wiążący  się  z tym,  wzrost  gęstości. 

Regułę  Le  Chateliera  można  zilustrować  rozważa- 
jąc równanie  stanu  f(py  q,  T)  = 0,  wiążące  termodyna- 
miczne parametry  stanu : ciśnienie  py  gęstość  q i tempe- 
raturę T.  Równanie  stanu  można  przedstawić  jako  po- 
wierzchnię w przestrzeni  trójwymiarowej  o współrzęd- 
nych py  Qy  T.  Każdy  z punktów  tej  powierzchni  od- 
powiada stanowi,  w którym  sąsiadujące  fazy  znajdują 
się  w równowadze.  Na  wykresie  (rys.  3)  można  wyróż- 
nić trzy  oddzielne  obszary  odpowiadające  trzem  sta- 
nom skupienia  substancji:  gazowi,  cieczy  i ciału  sta- 
łemu. Faza  gazowa  i stała  znajdują  się  w równowadze 
wzdłuż  krzywej  sublimacji:  faza  stała  i ciekła  — 
wzdłuż  krzywej  topnienia  (krzepnięcia),  a gazowa  i cie- 
kła— wzdłuż  krzywej  wrzenia  (kondensacji).  Każdy 


Rys.  3.  Równanie  stanu  f(p,p,  T ) = 0.  Rzut  powierzchni  p,p,  T 
na  płaszczyznę  pT 

punkt  tych  trzech  krzywych  odpowiada  stanowi  (o- 
kreślonemu  przez  ciśnienie  i temperaturę),  w którym 
mogą  istnieć  dwie  fazy,  a punkt  potrójny  jest  charakte- 
rystyczny jako  jedyny  punkt  współistnienia  wszystkich 
trzech  faz.  Należy  zauważyć,  że  krzywa  wrzenia  nie 
istnieje  dla  ciśnień  i temperatur  wyższych  niż  kry- 
tyczne (pky  Tk).  Oznacza  to,  że  można  przeprowadzić 
ciecz  w gaz  w sposób  ciągły,  nie  przekraczając  linii 
przejścia  fazowego,  zwiększając  ciśnienie  i temperaturę 
powyżej  wartości  krytycznych. 

W gazie,  przy  temperaturze  powyżej  krytycznej, 
wzrost  ciśnienia  prowadzi  do  zmniejszenia  odległości 
międzyatomowych  lub  międzycząsteczkowych.  Przy 
ciśnieniach  rzędu  10*  MPa  objętość  zmniejsza  się 
tysiąckrotnie  w stosunku  do  objętości  w warunkach 
normalnych.  Poniżej  punktu  krytycznego,  zgodnie 
z równaniem  stanu  konkretnej  substancji,  może  na- 
stąpić przemiana  w fazę  ciekłą.  Wzrost  ciśnienia  do 
około  5 GPa  powoduje  20-50%  zmniejszenie  obję- 
tości cieczy.  Ciśnienie  podwyższa  temperaturę  top- 
nienia substancji,  które  krzepną  ze  zwiększeniem  gęs- 
tości fazy  stałej  (rys.  3).  W wypadku  substancji 
takich  jak  woda,  mających  fazę  stałą  o mniejszej 
gęstości  niż  ciekła,  temperatura  krzepnięcia  ulega 
obniżeniu  ze  wzrostem  ciśnienia.  Na  przykład  tempe- 
ratura krzepnięcia  wody  przy  200  MPa  wynosi  — 20°C. 
Powyżej  200  MPa  woda  krystalizuje  w innych  fazach 
stałych  o większej  gęstości  niż  ciecz,  a temperatura 
krzepnięcia  wzrasta  ze  wzrostem  ciśnienia.  Przy 
4500  MPa  krzepnięcie  zachodzi  w temperaturze 
1 90°C. 

Ciała  stałe  są  mniej  ściśliwe  niż  ciecze,  przy  czym 
ściśliwość  zarówno  jednych  jak  i drugich  maleje 
ze  wzrostem  ciśnienia.  Oprócz  ciągłych  zmian  obję- 
tości obserwuje  się  również  zmiany  skokowe  (rys.  4) 
związane  z przemianami  fazowymi.  Nie  istnieje  ogól- 
na reguła  pozwalająca  przewidzieć  dla  danej  sub- 
stancji liczbę  możliwych  faz  i rodzaj  przemian  fa- 
zowych w warunkach  działania  wysokiego  ciśnienia. 
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Dopiero  wszechstronne  określenie  mikroskopowej  bu- 
dowy substancji  (symetria  rozkładu  atomów,  ich  ro- 
dzaj, charakter  i wielkość  oddziaływań  między  nimi) 
pomaga  zrozumieć  jej  zachowanie  się  w warunkach 
działania  ciśnienia. 


o 


Rys.  4.  Zależność  objętości  różnych  ciał  stałych  od  ciśnienia 


nym  układzie  atomów.  Cez  w wysokich  ciśnieniach 
wykazuje  zarówno  polimorficzną  przemianę  fazową 
jak  i izostrukturalną  (bez  zmiany  symetrii  rozkładu 
atomów)  przemianę  elektronową,  poza  tym  staje  się 
nadprzewodnikiem.  Badania  metodami  dyfrakcji 
nautronów  i promieni  rentgenowskich  prowadzone 
w temperaturze  pokojowej  wykazały  trzy  wartości 
ciśnienia,  przy  których  występuje  skokowa  zmiana 
objętości  tego  metalu.  Pierwsza  osobliwość  występuje 
przy  2,37  GPa  (rys.  5).  Przy  tym  ciśnieniu  następuje 
polimorficzną  przemiana  fazowa.  Towarzyszy  jej 
zmiana  objętości  o około  0,6% ; stosunek  objętości 
komórki  elementarnej  cezu  po  przemianie  do  objętości 
tej  komórki  przy  ciśnieniu  atmosferycznym  wynosi 
y/yQ  = 0,63.  Przed  przemianą  fazową  atomy  tworzą 
sieć  przestrzennie  centrowaną  (ócc),  po  przemianie  — 
płasko  centrowaną  (Jcc ). 

Następna  nieciągłość  występuje  przy  4,22  GPa; 
skok  objętości  wynosi  ok.  9%  (VfV0  — 0,45).  Można 
przyjąć,  że  jest  to  przemiana  izostrukturalna  pierw- 
szego rodzaju.  Struktura  nowej  fazy  jest  również  płas- 
ko centrowana.  W rezultacie  działania  ciśnienia 
zmniejszeniu  ulegają  atomy  cezu.  Uważa  się,  że  prze- 
miana ta  polega  na  zmianie  stanu  elektronowego  cezu 
z 6s  ->  5 d.  Elektron  z powłoki  o większym  promieniu 
zostaje  „wciśnięty”  w powłokę  o mniejszym  promie- 
niu. 

Trzecia  przemiana  Cs  III  do  Cs  IV  zachodzi  przy 
4,27  GPa;  objętość  maleje  o 2,4%  (VjV0  = 0,41). 
Struktura  fazy  Cs  IV  nie  jest  znana.  Powyższe  zmiany 
są  także  wykazywane  w pomiarach  oporu  elektrycz- 
nego w funkcji  ciśnienia.  Skokową  zmianę  właściwoś- 
ci cezu  obserwuje  się  ponadto  przy  ok.  12  GPa.  Obni- 
żenie temperatury  do  1,5  K przy  tym  ciśnieniu  powo- 
duje pojawienie  się  fazy  nadprzewodzącej  cezu. 


Z punktu  widzenia  atomowej  struktury  materii 
każda  substancja  stanowi  układ  elektronów  i rdzeni 
atomowych.  Liczba  rdzeni  atomowych  w molu  sub- 
stancji jest  rzędu  liczby  Avogadra,  tzn.  1023.  W wielu 
zagadnieniach  fizyki  ciała  stałego  rozważa  się  nie- 
zależnie zachowanie  się  elektronów  i sieci  krysta- 
licznej. W innych  wypadkach  konieczne  jest  wzięcie 
pod  uwagę  oddziaływań  między  tymi  dwoma  układa- 
mi. Istnieją  przemiany  fazowe,  w których  zachodzą 
zmiany  w strukturze  układu  elektronów  przy  zacho- 
waniu symetrii  rozkładu  atomów,  tzw.  izotypia. 
Mechanizm  przemian  fazowych  ze  zmianą  struktury 
krystalicznej  polegający  na  przesunięciach  atomów, 
przemiany  czyli  zmianie  nie  tylko  ich  odległości  ale  i symetrii, 
polimorficzne  prowadzi  do  tzw.  przemian  polimorficznych.  Mogą 
być  one  zapowiadane  przez  charakterystyczne  zmiany 
w strukturze  energetycznej  drgań  cieplnych  atomów 
(fononów).  Opis  i interpretacja  wielu  przemian  fazo- 
wych wymaga  jednak  dokładnego  zbadania  obu  pod- 
układów  (elektrony,  rdzenie  atomowe)  wraz  z ich 
wzajemnymi  oddziaływaniami. 

Na  przykładzie  cezu  poddanego  działaniu  wysokie- 
go ciśnienia  pokażemy  możliwości  modyfikacji,  które 
potencjalnie  tkwią  w stosunkowo  mało  skomplikowa- 


Rys.  5.  Wykres  fazowy  cezu 


Elektrony  i ciśnienie 

Wskutek  zbliżania  się  do  siebie  atomów  tworzących 
pierwotnie  układ  nie  oddziałujących  ze  sobą  cząstek, 
z dyskretnych  poziomów  energetycznych  elektro- 
nów formują  się  pasma  energetyczne  (— ► Struktura 
elektronowa  ciał  stałych).  Szerokość  przerwy  pomię- 
dzy pasmami,  szerokość  samego  pasma  oraz  nakłada- 
nie się  pasm  zależą  od  charakteru  oddziaływań  między 
atomami  kryształu.  Działanie  ciśnienia  modyfikuje 
te  oddziaływania  i prowadzi  do  obniżenia  wielkości 
obszarów  energii  zabronionej  między  pasmami  (np. 


Rys.  6.  Przewodność  właściwa  par  rtęci  w funkcji  ciśnienia  i gę- 
stości 
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między  pasmem  walencyjnym  i przewodnictwa  w pół- 
przewodnikach) albo  wzrostu  wielkości  nakładania  się 
tych  pasm,  a więc  do  wzrostu  własności  metalicznych 
badanej  substancji. 

pomiar  prze-  Zachowanie  się  większości  substancji  potwierdza 
wodności  ten  ogólny  wniosek.  Obserwacja  przewodnictwa  elek- 
elektrycznej  trycznego  par  metali  poddanych  działaniu  ciśnienia 


Rys.  7.  Zależność  przerwy  energetycznej  rtęci  od  gęstości; 
V0  objętość  rtęci  w 0°C  i przy  ciśnieniu  100  MPa 


Rys.  8.  Zależność  oporu  elektrycznego  iterbu  od  temperatury, 
przy  różnych  ciśnieniach.  Przy  ciśnieniu  około  1400  MPa  widać 
zmianę  charakteru  funkcji  R A.T)  z zależności  odpowiadającej 
metalom  na  zależność  odpowiadającą  półprzewodnikom 
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wykazuje  takie  tendencje.  Wzrost  gęstości  par  w wa- 
runkach powyżej  temperatury  krytycznej  (nie  ma  moż- 
liwości utworzenia  się  fazy  ciekłej  w wyniku  konden- 
sacji par)  prowadzi  do  powstania  struktury  pasmowej, 
pojawienia  się  przerwy  energetycznej,  a następnie 
jej  zamknięcia.  W rezultacie  powoduje  to  ciągłe 
przejście  od  własności  dielektrycznych  przez  półprze- 
wodnikowe do  metalicznych.  Przeprowadzono  wiele 
doświadczeń  obejmujących  pomiary  przewodności 
elektrycznej,  siły  termoelektrycznej,  efektu  Halla  oraz 
absorpcji  optycznej  ciekłej  i gazowej  rtęci.  Zmiana 
gęstości  par  rtęci  od  2 do  6 g/cm3  przy  ciśnieniu  nie 
przekraczającym  200  MPa  odpowiadała  zmianie  prze- 
wodności elektrycznej  o sześć  rzędów.  Rys.  6 przed- 
stawia zależność  przewodności  par  rtęci  w funkcji* 
ciśnienia  i gęstości  w temperaturze  1550°C,  a rys.  7 
ilustruje  zależność  wielkości  przerwy  energetycznej 
od  zmiany  gęstości  spowodowanej  działaniem  wyso- 
kiego ciśnienia. 

Przy  bardzo  wysokich  ciśnieniach  obowiązuje  ogól- 
na zasada  stwierdzająca,  że  działaniu  ciśnienia  towa- 
rzyszy wzrost  charakteru  metalicznego  substancji. 
Przy  ciśnieniach  pośrednich  obserwuje  się  jednak 
również  zmianę  własności  w kierunku  przeciwnym. 
Ciśnienie  wywołuje  przemiany  me  ta  1-półprze  wodnik 
czy  metal-izolator.  W ten  sposób  zachowuje  się  np. 
iterb  (rys.  8),  wapń,  stront  i bizmut.  Przy  określonych 
wartościach  ciśnienia  i temperatury  w metalach  tych 
„otwiera  się”  przerwa  energetyczna.  Warto  również 
wspomnieć  o zachowaniu  się  kryształów  półprze- 
wodnikowych. Na  przykład  w germanie  pod  wpływem 
działania  ciśnienia  przerwa  energetyczna  początkowo 
rośnie,  następnie  przechodzi  przez  maksimum  i od  ciś- 
nień rzędu  4000  MPa  ulega  zmniejszeniu.  Podobne 
wyniki  uzyskiwano  przy  badaniach  antymonku  galu 
GaSb.  Natomiast  zachowanie  się  fosforku  galu  GaP 
potwierdza  ogólną  tendencję  wzrostu  właściwości 
metalicznych  wraz  z ciśnieniem,  i to  w pełnym  zakresie 
przykładanego  ciśnienia. 


Sieć  krystaliczna  i ciśnienie 

Zmiana  odległości  między  tworzącymi  ciało  stałe 
atomami  powoduje  zmianę  ich  wzajemnych  oddziały- 
wań, a w konsekwencji  zmianę  częstości  ich  drgań  ter- 
micznych (a*).  Gdy  substancja  poddana  jest  równo- 
miernemu ściskaniu,  jej  objętość  ulega  zmniejszeniu, 
atomy  drgają  wokół  położeń  o większym  udziale  sił 
odpychających  (— ► Dynamika  sieci  krystalicznej). 
Wskutek  tego  powinna  znacznie  wzrosnąć  częstość  c o». 
Potwierdzają  ten  wniosek  wyniki  pomiarów  przy 
wysokich  ciśnieniach.  Wzrost  a>i  obserwowano 
w substancjach  z wiązaniami  jonowymi,  kowalencyj- 
nymi oraz  w kryształach  molekularnych.  Odbiciem 
tych  zmian  mikroskopowych  jest  wzrost  współczyn- 
ników sprężystości  ciał  stałych  przy  wzroście  ciśnienia. 
Obserwowane  w niektórych  kryształach  obniżenie 
częstości  jednego  czy  kilku  typów  drgań  termicznych 
atomów  wraz  ze  wzrostem  ciśnienia  można  traktować 
jako  zapowiedź  utraty  stabilności  sieci  krystalicznej. 
W rezultacie  następuje  polimorficzna  przemiana  fa- 
zowa; zmienia  się  symetria  rozkładu  atomów  oraz  ich 
wzajemne  odlegości.  Sytuacja  taka  powstaje  w wielu 
kryształach  ferroelektrycznych,  na  przykład  w PbTi03, 
SbSi,  a także  w kryształach  półprzewodnikowych, 
na  przykład  CdS. 

Występowanie  większej  lub  mniejszej  ściśliwości 
oraz  polimorficznych  przemian  fazowych  różnorod- 
nych substancji  związane  jest  z możliwościami  zwięk- 
szenia gęstości  upakowania  atomów  czy  cząsteczek 
w strukturze  substancji.  Przypomnieć  tu  można  prze- 
mianę fazową  w cezie  przy  2,37  GPa,  podczas  której 
przebudowuje  się  struktura  bcc  w bardziej  gęstą  fcc. 
Rodzaj  wiązań  chemicznych  decyduje  o istnieniu  ta- 
kiej a nie  innej  struktury  krystalicznej.  Struktura  kry- 
ształów molekularnych  (np.  kryształy  gazów  szlachet- 
nych o słabych  wiązaniach  międzycząsteczkowych 
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modyfikacja  i małej  gęstości)  ulega  łatwiej  zmianom  pod  wpływem 
struktur  kry-  ciśnienia.  Dla  lodu,  który  jest  również  kryształem  mo- 
stalicznych  lekularnym,  określono  osiem  modyfikacji  krystalicz- 
nych, istniejących  w warunkach  różnych  ciśnień  i tem- 
peratur. Kryształy  z wiązaniami  metalicznymi  są  na 
ogół  mniej  ściśliwe  od  kryształów  molekularnych. 
Podobnie  jest  dla  struktur  łańcuchowych  (parafina), 
czy  warstwowych  (grafit).  Struktury  te  wykazują 
znaczne  zróżnicowanie  ściśliwości  w różnych  kierun- 
kach krystalograficznych.  Silne  wiązania  kowalencyj- 
ne ograniczają  możliwość  zwiększenia  upakowania 
pod  wpływem  ciśnienia  — substancje  z tymi  wiąza- 
niami należą  do  najmniej  ściśliwych,  np.  diament 
jest  ponad  200  razy  mniej  ściśliwy  niż  cez. 


Nadprzewodnictwo 

Głównym  mikroskopowym  mechanizmem  nadprze- 
wodnictwa jest  oddziaływanie  przyciągające  między 
elektronami,  realizowane  za  pośrednictwem  sieci  kry- 
stalicznej (oddziaływanie  elektron-fonon).  Im  większe 
jest  to  oddziaływanie,  tym  wyższa  temperatura  Tk 
przejścia  do  stanu  nadprzewodzącego  (-*  Nadprze- 
wodnictwo). Ciśnienie  — przez  modyfikacje  struktur 
krystalicznych  lub  własności  elektronowych,  a tak- 
że oddziaływania  elektron-fonon  — wywiera  bardzo 
istotny  wpływ  na  zjawisko  nadprzewodnictwa. 

Ogromna  liczba  metali,  związków  metalicznych, 
a także  związków  i pierwiastków  o charakterze  pół- 
przewodnikowym w pewnych  warunkach  może  wy- 
stępować w fazie  nadprzewodzącej.  Często  warunkiem 
koniecznym  pojawienia  się  nadprzewodnictwa  jest 
działanie  ciśnienia  hydrostatycznego  (rys.  9).  Induko- 
wane ciśnieniem  nadprzewodniki  grupują  się  głównie 


niu  pojawiają  się  dwie  lub  więcej  nadprzewodzące  fazy  rcadprze 
fazy  wysokociśnieniowe.  W barze  przy  5,5  GPa  po-  wodzące 
jawia  się  faza  nadprzewodząca  (temperatura  przejścia 
Tk  ^1,3  K),  druga  przemiana  fazowa  zachodzi  przy 
ciśnieniu  około  14  GPa  z Tk  ~ 5 K (rys.  10).  Faza 
nadprzewodząca  pojawia  się  w cerze  przy  p 5 GPa. 

Cer  jest  obecnie  jedynym  znanym  pierwiastkiem  wy- 


Rys.  10.  Zależność  względnego  oporu  elektrycznego  baru  od 
ciśnienia.  Przy  ciśnieniu  5,5  GPa  i ciśnieniu  14  GPa  zachodzą 
przemiany  fazowe.  Powstałe  fazy  mają  własności  nadprzewodzące 
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Rys.  9.  Układ  okresowy  pierwiastków:  kolor  niebieski  oznacza  pierwiastki  nadprzewodzące;  kolor  szary  — pierwiastki  magnetyczne; 
kratki  w połowie  niebieskie  odpowiadają  pierwiastkom  nadprzewodzącym  w wysokich  ciśnieniach 


metale  indu-  w dwóch  miejscach  układu  okresowego.  Pierwiastki 
kowane  z prawej  strony  układu  Mendelejewa  przy  podwyż- 
ciśnieniem  szaniu  ciśnienia  wykazują  na  ogół  wzrost  własności 
metalicznych.  Te  indukowane  ciśnieniem  metale,  np. 
Ge  i Si,  przy  wysokich  ciśnieniach  są  bez  wyjątku  nad- 
przewodnikami, podobnie  jak  inne  metale  sąsiadujące 
w układzie  okresowym  (Zn,  In,  Sn),  w których  elektro- 
nami przewodnictwa  są  elektrony  s i p.  Z lewej  strony 
sytuacja  jest  bardziej  skomplikowana.  Indukowane 
ciśnieniem  nadprzewodniki  bar  i cez  mają  właściwości 
metali  przejściowych,  a więc  i potencjalne  możliwości 
by  stać  się  nadprzewodnikami.  Mają  one  niezlokali- 
zowane  elektrony  s , a pod  wpływem  ciśnienia  po- 
jawia się  dodatkowy  udział  silnie  zlokalizowanych 
elektronów  d i/. 

W wielu  substancjach  poddanych  wysokiemu  ciśnie- 


Rys.  11.  Zależność  temperatury  przejścia  nadprzewodzącego 
cynku  i kadmu  od  ciśnienia.  Zmniejszenie  temperatury  przy 
wzroście  ciśnienia  jest  wynikiem  obniżenia  oddziaływania  ele- 
ktron-fonon 
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kazującym  jednocześnie  uporządkowanie  magnetycz- 
ne i nadprzewodzące  (rys.  9). 

wzrost  Sub  Działanie  ciśnienia  może  prowadzić  zarówno  do 
obniżenie  wzrostu  temperatury  przejścia  nadprzewodzącego,  jak 
temperatury  również  jej  obniżenia.  Tak  na  przykład  obniżenie  Tk 
przejścia  i zanik  nadprzewodnictwa  dla  cynku  i kadmu  (rys.  11) 
w warunkach  działania  ciśnienia  jest  wynikiem  obni- 
żenia wielkości  oddziaływania  elektron-fonon.  Po- 
miary przeprowadzone  w szerokim  zakresie  ciśnień 
wskazują,  że  Tk  wielu  metali  maleje  liniowo  ze  wzro- 
stem ciśnienia  (dTkjdp  < 0).  Taki  przebieg  jest  spo- 
wodowany głównie  wzrostem  częstości  drgań  termicz- 
nych atomów  wraz  ze  wzrostem  ciśnienia. 


Zastosowanie  wysokich  ciśnień  w inżynierii 
materiałowej 

Uważa  się,  że  każdy  materiał  istniejący  w przyrodzie 
może  być  wytworzony  w warunkach  laboratoryjnych. 
Diament,  wysokociśnieniowa  modyfikacja  węgla,  jest 
w temperaturze  pokojowej  i przy  ciśnieniach  poniżej 
1200  MPa  fazą  metastabilną  termodynamicznie. 
Struktura  tej  metastabilnej  fazy  utrzymuje  się  nieskoń- 
czenie długo.  Dopiero  poddanie  diamentu  działaniu 
temperatury  powyżej  1000°C,  przy  niskich  ciśnieniach, 
prowadzi  do  przemiany  diament-grafit.  Dla  grafitu 
ciśnienie  20  GPa  w temperaturze  pokojowej  nie  jest 
wystarczające  do  zmiany  w diament.  Aby  zaszła  taka 
przemiana,  konieczne  jest  jednoczesne  działanie  wy- 
sokiej temperatury  i ciśnienia. 

Od  wielu  lat  podejmowano  różne  próby  otrzymania 
syntetyczny  syntetycznego  diamentu,  m.in.  metodą  podgrzewania 
diament  związków  węgla  do  wysokich  temperatur  przy  jedno- 
czesnym stosowaniu  wysokich  ciśnień.  Dokonano  tego 
po  raz  pierwszy  w Stanach  Zjednoczonych  (General 
Electric,  1955  r.).  Sukces  osiągnięto  dzięki  zastosowa- 
niu ciśnienia  rzędu  10  GPa  (znacznie  wyższych  niż 
dotychczas  stosowane)  jednocześnie  z wysokimi  tem- 
peraturami (ok.  1000°C).  Wykorzystano  dodatkowo 
działanie  katalityczne  stopionych  metali  (np.  tanta- 
lu). Katalizatory  ułatwiają  zrywanie  silnych  wiązań 
międzyatomowych  wewnątrz  warstw  tworzących 
grafit.  Katalizator  spełnia  funkcję  rozpuszczalnika 
dla  węgla.  Z tak  wytworzonego  roztworu  wolny  węgiel 
krystalizuje  w postaci  diamentu.  Następuje  to  w wy- 
niku obniżenia  stopnia  rozpuszczalności  diamentu 
w stosunku  do  rozpuszczalności  grafitu  w tych  samych 
warunkach,  tzn.  w warunkach  działania  wysokiej 
temperatury  i ciśnienia.  Należy  dodać,  że  uzyskiwano 
diament  w procesie  przemiany  grafit-diament  rów- 
nież bez  użycia  katalizatorów.  Proces  taki  wymaga 
jednak  stosowania  ciśnień  powyżej  12  GPa  i tempera- 
tur w granicach  2500-3000°C. 

Poszukiwania  nowych  materiałów  doprowadziły  do 
uzyskania  wielu  ciekawych  substancji,  wytworzonych 
w warunkach  wysokich  i ultrawysokich  ciśnień,  sta- 
bilnych przy  ciśnieniu  atmosferycznym.  Udało  się  na 
koezyt  i przykład  „zagęścić”  kwarc  (SiÓ2).  Dwie  jego  fazy  — 
stiszowit  koezyt  i stiszowit  — są  substancjami  gęstszymi  odpo- 
wiednio o 10%  i 6%.  Wytworzenie  stiszowitu  wymaga 
stosowania  ciśnień  rzędu  10  GPa  przy  600°C. 

Obie  laboratoryjnie  wytworzone  formy  Si02  zosta- 
ły wykryte  w kraterach  meteorytów.  Koezyt  został 
także  rozpoznany  jako  produkt  podziemnej  eksplozji 
jądrowej.  Fakty  te  dają  wyobrażenie  o możliwościach 
laboratoriów'  wysokociśnieniowych.  Można  je  porów- 
nywać z tym  co  istnieje  w warunkach  naturalnych, 
w procesach  zderzeń  gigantycznych  meteorytów  z po- 
wierzchnią Ziemi,  czy  podczas  bardzo  silnych  wybu- 
chów nuklearnych. 

Stosując  wysokie  ciśnienia  w procesie  syntezy 
różnych  materiałów  uzyskuje  się  materiały  o własnoś- 
ciach szczególnie  cennych  ze  względu  na  ich  zastoso- 
wanie. W wielu  wypadkach  są  to  materiały  nie  mające 
odpowiedników  w przyrodzie.  Człowiek  sterując 
procesami  technologicznymi  ma  większe  możliwości 
zmian  — i to  niezależnych  — temperatury  i ciśnie- 
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nia.  W warunkach  naturalnych  procesy  wzrostu  i ob- 
niżania temperatury  są  ściśle  związane  z odpowiedni- 
mi wzrostami  i redukcją  ciśnień.  Przykładem  materiału 
syntetycznego  nie  mającego  odpowiednika  natural- 
nego jest  regularna  odmiana  azotku  boru  BN  (bora- 
zon).  Związek  ten  krystalizuje  w procesie  podobnym 
do  stosowanego  przy  wytwarzaniu  diamentu  i tworzy 
materiał  o strukturze  regularnej.  Odznacza  się  ogrom- 
ną odpornością  termiczną  i dużą  twardością. 

Wysokie  ciśnienia  znalazły  wiele  ważnych  zasto- 
sowań w dziedzinie  obróbki  plastycznej  materiałów 
zwanej  hydrostatycznym  wytłaczaniem  lub  hydroeks-  hydro- 
truzją.  W metodzie  tej  wykorzystuje  się  zjawisko  pod-  ekstruzja 
wyższenia  plastyczności  przy  wysokim  ciśnieniu.  Ma- 
teriał wyjściowy  wraz  z ośrodkiem  przenoszącym  ciś- 
nienie (np.  olej)  zawarty  jest  w grubościennym  cylin- 
drze. Cylinder  ten  z jednej  strony  zamyka  matryca 
z otworem,  z drugiej  ruchomy  tłok.  Gdy  wskutek 
przesuwania  tłoka  wzrośnie  wystarczająco  ciśnienie 


Rys.  12.  Zasada  procesu  hydrostatycznego  wytłaczania  (hydro- 
ekstruzji) 


Rys.  13.  Elementy  uzyskiwane  w procesie  hydroekstruzji  (produk- 
ty firmy  Asea) 


ośrodka  ciśnieniowego,  materiał  (sprężany  hydrosta- 
tycznie) przechodzi  przez  otwór  w matrycy  zmieniając 
swój  kształt  i zmieniając  przekrój  (rys.  12).  Proces 
hydroekstruzji  ma  wiele  zalet  w porównaniu  z innymi 
technikami  obróbki  plastycznej.  Oto  niektóre  z nich: 
proces  ten  odbywa  się  w znacznie  niższych  temperatu- 
rach; własności  mechaniczne  uzyskiwanego  materiału 
wykazują  dużą  jednorodność  w całym  przekroju. 
Ciśnienie  hydrostatyczne  zwiększa  ciągliwość  niektó- 
rych twardych  i kruchych  materiałów  do  takiego  stop- 
nia, że  ich  deformacja  następuje  znacznie  łatwiej  (np. 
Be,  V,  Zr);  różnorodność  kształtów  matrycy  pozwała 
uzyskiwać  prawie  dowolne  kształty  ekstrudowanych 
elementów  (rys.  1 3),  przy  czym  uzyskuje  się  dużą  do- 
kładność wymiarów  produktu.  Istnieje  możliwość 
powlekania  jednych  materiałów  innymi,  należy  jedy- 
nie stosować  odpowiednio  przygotowane  wsady. 


Metaliczny  wodór? 


żają,  że  ten  skok  odpowiada  przemianie  dielektrycz- 
nego wodoru  w wodór  metaliczny.  Następnie  zaczęto 
się  zastanawiać  nad  możliwościami  stabilizacji  fazy 


Rys.  14.  Zależność  mię* 
dzy  oporem  elektrycz- 
nym i siłą  działającą  na 
kowadła  w procesie 
otrzymywania  metalicz- 
nego wodoru  (7*  — 4,2 
K).  Zależność  odpo- 
wiada wzrostowi  ciśnie- 
nia 


Jeżeli  się  spojrzy  na  pierwszą  kolumnę  układu  okreso- 
wego, zwraca  uwagę  odrębność  wodoru  w stosunku 
do  reszty  pierwiastków  z tej  kolumny.  Są  one  metala- 
mi, a tylko  wodór  ma  własności  dielektryczne  (jest 
izolatorem).  Odrębność  ta  od  dawna  inspirowała  wiele 
prac  teoretycznych.  Wielu  fizyków  przewidywało,  że 
działanie  odpowiednio  wysokiego  ciśnienia  winno 
przeprowadzać  dielektryczny  wodór  w metal. 

Ogromne  nakłady  finansowe  na  badania  dotyczące 
tego  zagadnienia  związane  są  głównie  z nadzieją 
własności  rozbudzoną  przez  przewidywania  naukowców  co  do 
nadprzewo-  własności  nadprzewodzących  metalicznego  wodoru, 
dzące  Wyjątkowo  cenną  własnością  ma  być  bardzo  wysoka 
temperatura  przejścia  nadprzewodzącego,  pomiędzy 
200-300  K.  Możliwość  zachowania  stanu  nadprzewo- 
dzącego nawet  w 200  K.  ( — 73°C)  otwierałaby  zupełnie 
nowe  perspektywy  przed  energetyką.  Przewiduje  się 
również,  że  metaliczny  wodór  mógłby  pełnić  funkcję 
wysokokalorycznego  paliwa  nie  wprowadzającego 
zanieczyszczeń. 

Obiecujące  rezultaty  prowadzące  do  otrzymania 
metalicznego  wodoru  uzyskano  w Instytucie  Fizyki 
Wysokich  Ciśnień  Radzieckiej  Akademii  Nauk.  Nau- 
kowcy z tego  Instytutu  wykorzystali  gigantyczną  prasę 
hydrauliczną  współdziałającą  z kowadłami  diamento- 
wymi ochłodzonymi  do  4,2  K.  Jedno  z nich  jest  płaskie, 
drugie  ma  kształt  bardzo  płaskiego  stożka.  Takie  roz- 
wiązanie służy  uzyskaniu  ciśnień  rzędu  100  GPa 
w centralnej  części  kowadeł.  Przez  obszar  ten  prze- 
puszczono bardzo  czysty  gazowy  wodór,  doprowadza- 
jąc do  jego  zestalenia  w postaci  cienkiej  warstwy. 
Podczas  eksperymentu  mierzono  prąd  elektryczny 
płynący  w obwodzie,  w którym  znajdowały  się  ko- 
wadła i warstwa  zestalonego  wodoru.  Pojawienie  się 
prądu  w tym  obwodzie  powinno  świadczyć  o przekro- 
czeniu ciśnienia  krytycznego.  W opisywanym  ekspery- 
mencie opór  elektryczny  zmalał  o sześć  rzędów  (od 
108  do  102H)  przy  różnych  ciśnieniach  leżących  między 
100  i 300  GPa  (rys.  14).  Eksperymentatorzy  uwa- 


Rys.  15.  Histereza 
zależności  oporu  elek- 
trycznego od  działa- 
jącej na  kowadła  siły 
w procesie  otrzymy- 
wania metalicznego 
wodoru  (T  = 4,2  K). 
Strzałki  wskazują  kie- 
runek zmian  ciśnienia 


metalicznej  wodoru,  jego  istnieniem  w warunkach  nor- 
malnych oraz  możliwościami  otrzymania  większej 
ilości  tej  substancji.  Znanych  jest  wiele  substancji, 
które  istnieją  w fazie  metastabilnej  po  usunięciu 
działania  ciśnienia  (syntetyczny  diament).  Uczeni 
radzieccy  uważają,  że  bardzo  obiecujące  z tego  punktu  Histereza 
widzenia  jest  występowanie  histerezy  ciśnieniowej,  ciśnieniowa 
Otóż  wodór  nie  powraca  do  fazy  dielektrycznej,  gdy 
redukuje  się  ciśnienie.  Pozostaje  metaliczny  nawet 
w chwili,  gdy  ciśnienie  wynosi  około  połowy  wartości 
krytycznej  (rys.  15).  Szuka  się  więc  sposobów  po- 
większenia tej  histerezy  do  wartości  gwarantującej 
stabilność  uzyskanego  nadprzewodnika  w warunkach 
zbliżonych  do  normalnych. 
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MAGNETYZM 


Teoria  magnetyzmu 

Jerzy  Mielnicki  i Bogusław  Mrygoń 


Teoria  magnetyzmu  obejmuje  teorię  właściwości 
magnetycznych  izolowanych  cząstek  elementarnych, 
atomów  i molekuł,  a także  zbiorów  atomów  lub  mo- 
lekuł w postaci  gazu,  cieczy  łub  ciała  stałego.  Właści- 
wości magnetyczne  zbioru  atomów  wynikają  z wła- 


ściwości magnetycznych  izolowanych  atomów  oraz 
z charakteru  oddziaływań  między  pojedynczymi  ato- 
mami. Natura  tych  oddziaływań  ma  decydujące  zna- 
czenie w kształtowaniu  się  określonych  właściwości 
magnetycznych  ciał  złożonych  z wielu  elementarnych 
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nośników  magnetyzmu.  W tym  sensie  ferromagne- 
tyzm, który  występuje  w niektórych  kryształach,  jest 
zjawiskiem  kolektywnym,  ponieważ  warunkiem  ko- 
niecznym pojawienia  się  ferromagnetyzmu  w ciele 
stałym  są  odpowiednie  oddziaływania  między  elek- 
tronami. Jednolity  opis  właściwości  magnetycznych 
elementarnych  nośników  magnetyzmu  oraz  zbiorów 
tych  nośników  z uwzględnieniem  oddziaływań  możli- 
wy jest  jedynie  w ujęciu  teorii  kwantowej.  Podamy  tu 
zarys  kwantowej  teorii  magnetyzmu  powłoki  elektro- 
nowej atomu  oraz  układu  atomowych  momentów 
magnetycznych  w ciałach  stałych  o budowie  kry  sta- 
licznej. 


Magnetyzm  atomowy 


Wiele  podstawowych  właściwości  fizycznych  ciał  sta- 
łych wyjaśnić  można  znając  zachowanie  się  elektro- 
nów na  zewnętrznych  powłokach  atomów  izolowa- 
nych. Każdy  elektron  ma  własny  moment  pędu  okre- 
ślony spinową  liczbą  kwantową  s równą  1/2.  Dla  spi- 
nu s = 1/2  jedyne  dwa  możliwe  rzuty  wektora  wła- 
snego momentu  pędu  na  dowolnie  wybrany  kierunek 
kwantowa  zewnętrznego  pola  magnetycznego  mają  tę  samą  war- 
liczba  tość  i określone  są  przez  magnetyczną  spinową  liczbę 
magnetyczna  kwantową  ms : 

slz}  = msh\ 


ms  może  przyjmować  tylko  dwie  wartości 
fi  = 1,0545887  • 10~3d  J • s — stała  Plancka  podzielona 
moment  przez  2jt.  Ze  spinem  elektronu  związany  jest  moment 
magnetyczny  magnetyczny,  którego  dwa  możliwe  rzuty  na  kieru- 
elektronu  nek  zewnętrznego  pola  magnetycznego  są  równe 

fi[z]  = 2 mtfiB.  (1) 

Wielkość  fiB  = ehjlmc , gdzie  e oznacza  ładunek 
elektronu,  m — jego  masę  spoczynkową,  c — pręd- 
kość światła,  nazywana  jest  magnetonem  Bohra  i od- 
grywa rolę  jednostki  momentu  magnetycznego  w skali 
atomowej.  Wartości  bezwzględne  wektorów  spino- 
wego momentu  pędu  i momentu  magnetycznego  wy- 
rażają się  wzorami : 


l-Psi  — s(s~r\)h. 

(2) 

\Ms\  = 2\S s{s-t\)  fiB. 

(3) 

Określając  właściwości  magnetyczne  powłoki  elek- 
tronowej atomu,  oprócz  momentów  magnetycznych 
związanych  ze  spinem  elektronów  należy  uwzględnić 
również  momenty  magnetyczne  związane  z ruchem 
orbitalnym  elektronów.  Pewną  rolę  odgrywa  również 
magnetyzm  jądra  atomowego.  Momenty  magnetycz- 
ne nukleonów  są  jednak  około  1000  razy  mniejsze  od 
momentów  magnetycznych  elektronów.  Przykładem 
efektów  związanych  z momentem  magnetycznym  ją- 
dra może  być  nadsubtelna  struktura  widm  atomo- 
wych (-*  Spektroskopia  atomowa)  bądź  jądrowy  re- 
zonans magnetyczny. 

Wielkość  wektora  momentu  pędu  związanego  z or- 
bitalnym ruchem  elektronu  wyraża  się  wzorem: 

iKt  = VT(f+T)fi.  (4) 


Orbitalna  liczba  kwantowa  / przyjmuje  wartości 

1 = 0,  1,2,  1), 

orbitalny  gdzie  n oznacza  główną  liczbę  kwantową.  Z orbital- 
moment  nym  momentem  pędu  związany  jest  moment  magne- 

magnetyczny  tyczny 

lwi  = vm+ iy  mb  (5) 

Z mechaniki  kwantowej  wynika  bez  dodatkowych 
założeń,  że  rzuty  wektora  orbitalnego  momentu  pędu 
na  kierunek  zewnętrznego  pola  mogą  przyjmować 
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tylko  ściśle  określone  wartości.  Możliwe  rzuty  orbi- 
talnego momentu  magnetycznego  określone  są  przez 
zespół  magnetycznych  orbitalnych  liczb  kwanto- 
wych mi,  które  mogą  przyjmować  (2/+1)  wartości, 
a mianowicie 

/m  = -/,  -(/-l),...,  -1,0,  1 </— 1),  /. 

Mówimy  więc,  że  wektor  orbitalnego  momentu  pędu, 
a tym  samym  związany  z nim  moment  magnetyczny, 
jest  skwantowany  przestrzennie  (rys.  1).  Wartości 


rzutu  orbitalnego  momentu  magnetycznego  elektro- 
nu na  kierunek  wyróżniony  przez  zewnętrzne  pole 

wynoszą  w 

J = miiiB.  (6) 


Gdy  w atomie  znajduje  się  więcej  niż  jeden  elek- 
tron, suma  wektorowa  momentów  pędu  oraz  suma 
momentów  magnetycznych  poszczególnych  elektro- 
nów daje  w wyniku  wypadkowy  moment  pędu  i mo- 
ment magnetyczny  atomu.  Możliwe  są  dwa  sposoby 
złożenia  momentów  pędu  elektronów  w atomie.  Cał- 
kowity moment  pędu  atomu  można  otrzymać  przez 
dodanie  najpierw  spinowego  i orbitalnego  momentu 
poszczególnych  elektronów,  a następnie  zsumowanie 
wypadkowych  momentów  pędu  wszystkich  elektro- 
nów. Drugi  sposób,  prowadzący  do  innych  wartości 
energii  poziomów'  energetycznych  atomu,  polega  na 
zsumowaniu  najpierw  wszystkich  momentów  spino- 
wych, a następnie  momentów  orbitalnych  poszczę-  całkowity 
gólnych  elektronów.  Całkowaty  moment  pędu  atomu  moment 
otrzymuje  się  przez  dodanie  wypadkowego  momentu  pędu  atomu 

spinowego  Ps  i wypadkowego  momentu  orbitalnego 

Pl.  O wyborze  sposobu  obliczania  całkowitego  mo- 
mentu pędu  atomu  decyduje  wielkość  oddziaływania 
pomiędzy  momentem  spinowym  i orbitalnym  elek- 
tronu. Zwykle  sprzężenie  spin -orbita  jest  słabe 
i słuszny  jest  drugi  sposób  sumowania  momentów 
pędu.  Całkowity  moment  pędu  atomu  określamy  licz- 
bą kwantową  / (liczbę  tę  oznacza  się  zazwyczaj  lite- 
rą J ).  Wartości  bezwzględne  odpowiednich  wektorów 
momentu  pędu  atomu  określone  są  następującymi 
wzorami : 

iKsl  = j/s(s+d  f>, 

\Pl\  = ]/l(L+\)  fi. 


\Pi\  = ]//(/+!)«. 


Ponieważ  wypadkowy  moment  spinowy  i moment 
orbitalny  całkowicie  zapełnionej  powłoki  elektrono- 
wej atomu  równe  są  zeru,  przy  obliczaniu  wypadko- 
wych momentów  atomu  uwzględnia  się  jedynie  mo- 
menty elektronów  z powłok  niezapełnionych.  Z mo- 
mentami pędu  atomu,  określonymi  liczbami  kwan- 
towymi S,  L i /,  związane  są  odpowiednie  momenty  moment 
magnetyczne  atomu  fis , fiL  i fii . Zarówno  moment}  magnetyczny 
pędu  jak  i momenty  magnetyczne  atomu  są  sk wanto  atomu 


wane  analogicznie  do  momentu  pojedynczego  elek- 
tronu. Liczbom  kwantowym  5,  L i / przyporządko- 
wane są  odpowiednie  magnetyczne  liczby  kwantowe 
msy  niL  i nu.  Stosując  atomowe  liczby  kwantowe 
można  wyrazić  za  pomocą  wzorów  (1)  i (6)  wartości 
możliwych  rzutów  spinowego  i orbitalnego  momentu 
magnetycznego  atomu  na  kierunek  zewnętrznego 
pola.  Wartości  bezwzględnego  spinowego  i orbital- 
nego momentu  magnetycznego  atomu  określone  są 
wzorami  analogicznymi  do  wzorów'  (3)  i (5). 

Z porównania  wzorów  (2)  i (3)  oraz  (4)  i (5)  wyni- 
ka, że  spinowy  i orbitalny  moment  magnetyczny  nie- 
jednakowo wyrażają  się  przez  odpowiednie  momenty 
pędu.  Dla  momentu  spinowego  stosunek  momentu 
magnetycznego  do  mechanicznego  jest  dwa  razy  więk- 
szy niż  taki  sam  stosunek  dla  momentu  orbitalnego. 
Z uwagi  na  ten  fakt  kierunek  wypadkowego  momentu 

magnetycznego  atomu  fi  nie  pokrywa  się  z kierunkiem 
wypadkowego  momentu  mechanicznego  Pi.  Ponie- 
waż ładunek  elektronu  jest  ujemny,  wektory  fis  i fiL 
są  odpowiednio  antyrównoległe  do  wektorów  Ps  i Pl. 
W skali,  w której  długość  wektora  fiL  równa  się  dłu- 
gości wektora  Pl , długość  wektora  fis  jest  równa  po- 
dwójnej długości  wektora  Ps.  Graficzny  obraz  sumo- 
wania momentów  mechanicznych  i magnetycznych 
atomu  przedstawiony  jest  na  rys.  2.  Wypadkowy  mo- 


Rys.  2.  Sumowanie  mechanicznych  i magnetycznych  momentów 
atomu 


skuteczny 

moment 

magnetyczny 

atomu 


ment  magnetyczny  fi  tworzy  z wektorem  Pi  kąt  różny 
od  180°.  Można  powiedzieć,  że  wektor  fi  wykonuje 
precesję  dookoła  kierunku  P.  Skuteczny  moment 
magnetyczny  atomu  fii  równy  jest  rzutowi  wektora  fi 

na  kierunek  wektora  Pi.  Wykonując  odpowiednie 
obliczenia  trygonometryczne  znajdujemy 


gdzie 


i m\  = g 


g=  l + 


i(/-fl)+S(S+l)-L(£+l) 

2/(/-fl) 


(7) 

(8) 


jest  współczynnikiem  rozszczepienia  spektroskopo- 
wego. Możliwe  wartości  rzutów  wypadkowego  mo- 
mentu magnetycznego  atomu  fii  na  kierunek  zew- 
nętrznego pola  określone  są  wzorem : 

fi[p  = g mi  fiB ; (9) 

magnetyczna  liczba  kwantowa  atomu  przyjmuje  war- 
tości 

mi  =-/,-(/- 1), 

W przypadkach  granicznych,  kiedy  całkowity  moment 

Pi  — Psy  tzn.  gdy  L = 0,  czynnik  rozszczepienia 
spektroskopowego  g = 2.  W drugim  skrajnym  przy- 
padku Pt  = ~Pl , tzn.  gdy  5 = 0,  g = 1.  Istnienie 
momentu  magnetycznego  atomu  i omówiona  powy- 
żej jego  kwantyzacja  przestrzenna  zostały  potwier- 
dzone w doświadczeniach  Sterna  i Gerlacha,  w któ- 
rych badano  odchylenie  strumienia  atomów  w nie- 
jednorodnym polu  magnetycznym. 


Diamagnetyzm 


Najbardziej  naturalnym  sposobem  klasyfikacji  sub- 
stancji pod  względem  ich  właściwości  magnetycznych 
jest  podanie  wielkości  charakteryzującej  reakcję  oś- 
rodka na  zewnętrzne  pole  magnetyczne  H.  Taką 
wielkością  jest  z definicji  podatność  magnetyczna 

X = M!H\ 

M jest  namagnesowaniem  ośrodka,  tzn.  momentem 
magnetycznym  przypadającym  na  jednostkę  objętości. 
Substancje  o dodatniej  podatności  nazywamy  para- 
magnetykami,  a o ujemnej  — diamagnetykami. 

Zjawisko  diamagnetyzmu  jest  powszechne  i właści- 
we wszystkim  bez  wyjątku  ciałom.  Nie  zawsze  jednak 
zjawisko  to  można  zaobserwować,  ponieważ  słaby 
efekt  diamagnetyczny  bywa  często  przesłonięty  przez 
silniejszy  efekt  paramagnetycznego  namagnesowania. 
Diamagnetyzm  można  obserwow-ać  łatwo  i bezpo- 
średnio wówczas,  gdy  atomy,  jony  lub  cząsteczki 
mają  wypadkowy  moment  magnetyczny  równy  zeru. 
Orbity  elektronowe  w atomach  można  wyobrażać 
sobie  jako  kołowa  obwody  elektryczne  o zerowym 
oporze,  w których  płynie  prąd  o stałym  natężeniu. 
Przyłożenie  zewnętrznego  pola  magnetycznego  po- 
woduje zmianę  przechodzącego  przez  te  obwody  stru- 
mienia indukcii  magnetycznej.  W orbitach  elektro- 
nowych indukują  się  wówczas  dodatkowe  prądy, 
które  płyną  tak  długo,  jak  długo  działa  zewnętrzne 
pole.  Zgodnie  z prawem  Lenza  momenty  magne- 
tyczne indukowanych  prądów  kompensują  zmianę 
strumienia  indukcji  magnetycznej,  a więc  mają  kie- 
runki przeciwne  do  pola  zewnętrznego.  Wobec  tego 
substancja  złożona  z atomów  o wypadkowym  mo- 
mencie magnetycznym  równym  zeru,  umieszczona 
w zewnętrznym  polu  magnetycznym  magnesuje  się, 
przy  czym  zwrot  wektora  namagnesowania  jest  prze- 
ciwny do  wektora  natężenia  pola.  Podatność  diama- 
gnetykówjest  zwykle  bardzo  mała,  rzędu  — 10~6,  i nie 
zależy  od  temperatury. 

Do  diamagnetyków  należą  wszystkie  gazy  szla- 
chetne, niektóre  metale  (np.  cynk,  złoto,  rtęć),  nie- 
które niemetale  (np.  krzem,  fosfor,  siarka)  oraz  wiele 
związków  organicznych. 


Paramagnetyzm 


Zjawisko  paramagnetyzmu  występuje  tylko  w tych 
materiałach,  w których  atomy  lub  molekuły  mają 
stały  moment  magnetyczny.  Zastanówmy  się,  jakie 
jest  namagnesowanie  ośrodka  zawierającego  N ato- 
mów w jednostce  objętości,  z których  każdy  ma  mo- 
ment magnetyczny  fiiy  umieszczonego  w zewnętrznym 

polu  magnetycznym  o natężeniu  H.  Zakładamy,  że 
atomy  nie  oddziałują  ze  sobą.  Namagnesowanie 
ośrodka  jest  wynikiem  orientacji  momentów'  magne- 
tycznych atomów  wzdłuż  kierunku  przyłożonego  pola 
magnetycznego  pod  wypływem  tego  pola.  Drgania 
cieplne  przeciwdziałają  porządkującemu  działaniu 
pola  na  momenty  magnetyczne. 

Jak  już  wiemy,  moment  atomu  o liczbie  kwantowej 
I ma  (2/-fl)  możliwych  orientacji  w przestrzeni, 
a możliwe  składowe  tego  momentu  w kierunku  pola 
określone  są  wzorem  (9).  Prawdopodobieństwo  w 
danej  orientacji  określone  jest  wzorem  Boltzmanna: 

< o ~ exp  (fpłł/kBT), 

gdzie  ku  oznacza  stałą  Boltzmanna,  T — temperaturę 
bezwzględną.  Iloczyn  — fipH  wyraża  energię  od- 
działywania atomu  z przyłożonym  polem  magnetycz- 
nym. Namagnesowanie  ośrodka  równe  jest 

M — N \fllp^y  (10) 
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gdzie  oznacza  wartość  średnią  rzutu  momentu 

magnetycznego  na  kierunek  pola,  którą  można  obli- 
czyć znając  wartości  energii  oddziaływania  między 
atomem  i polem,  odpowiadające  poszczególnym  orien- 
tacjom momentu  ///.  Wartość  dana  jest  wyra- 

żeniem: 

+/ 

</*/ *>  ~~~n • 

£ exp( u^H/kuT) 

-i 

Podstawiając  zamiast  fjfp  prawą  stronę  równania 
(9),  oraz  wykonując  sumowanie  we  wzorze  (1 1)  otrzy- 
mujemy : 

<y/]>  = gnBIBi{x\  (12) 

gdzie 

g {.tul  H 

x^-kn^r’ 

funkcja  a Bi{x)  nazywana  jest  funkcją  Brillouina.  Na  ry- 
BriUouina  sunku  3 podane  są  wykresy  Bi(x)  dla  kilku  wartości  I. 

Dla  * « 1 (tzn.  dla  małych  natężeń  zewnętrznego 


pola  magnetycznego)  funkcję  Bi(x ) można  przedsta- 
wić w przybliżonej  postaci: 


Br(x)  = — x’>  x <ś  1.  (13) 

Podstawiając  prawe  strony  równości  (12)  i (13)  do 
równania  (10)  otrzymujemy  zależność  namagneso- 
wania ośrodka  od  pola  H : 


M = 


Ng*n»  /(/+!) 
3 ksT 


H. 


(14) 


Porównując  z definicją  podatności  magnetycznej 
X = M/H , otrzymujemy: 

X — cons  t/T.  (15) 


Ośrodki,  dla  których  słuszne  jest  to  równanie, 
Curie  znane  jako  prawo  Curie,  nazywamy  paramagnetyka- 
prawo  mi.  Prawo  Curie  mówi,  że  podatność  paramagnetyka 
nie  zależy  od  zewnętrznego  pola  w zakresie  małych 
jego  natężeń  (x  <ś  1)  i jest  odwrotnie  proporcjonalna 
do  temperatury.  Z rysunku  3 wynika,  że  dla  dużych 
wartości  xy  co  odpowiada  fizycznej  sytuacji  T 0, 
funkcja  Brillouina  dąży  do  wartości  asymptotycznej. 
Oznacza  to,  że  dla  T -►  0 namagnesowanie  ośrodka 
osiąga  wartość  maksymalną,  zwaną  nasyceniem,  na- 
wet przy  bardzo  małych  wartościach  zewnętrznego 
pola. 
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Zgodność  kwantowej  teorii  paramagnetyzmu  z wy- 
nikami doświadczalnymi  dla  wielu  ośrodków  wyka-  przykłady 
żujących  właściwości  paramagnetyczne  jest  doskona-  para- 
ła. Przykładami  ośrodków  paramagnetycznych  mogą  magnetyków 
być  niektóre  metale  i pierwiastki  oraz  ich  sole,  ga- 
zowy tlenek  azotu  NO,  wolne  rodniki  organiczne, 
jak  np.  trójfenylometyl  C(QH5)3. 


Spontaniczne  uporządkowanie 
magnetyczne 

Znany  jest  fakt,  że  pewne  kryształy  zawierające  ato- 
my z różnym  od  zera  momentem  magnetycznym  wy- 
kazują w dostatecznie  niskich  temperaturach  spon- 
taniczne namagnesowanie  w nieobecności  zewnętrz- 
nego pola  magnetycznego.  Istnienie  makroskopowego 
momentu  magnetycznego  w krysztale  przy  H — 0 
sugeruje,  że  w wyniku  wzajemnego  oddziaływania 
momenty  magnetyczne  atomów  tworzą  regularną 
strukturę  (uporządkowanie).  Rysunek  4 przedstawia 


* l 

v ; 

t . A 

i 

a)  uporządkowanie 
ferromagnetyczne 


b)  uporządkowanie 

antyferromagnetyczne 


c)  uporządkowanie 
ferrimagnetyczne 


Rys.  4.  Niektóre  możliwe  uporządkowania  układów  momentów 
magnetycznych 


trzy  najbardziej  typowe  możliwe  uporządkowania 
momentów  magnetycznych  w kryształach  wykazują- 
cych spontaniczne  namagnesowanie. 

Z danych  doświadczalnych  wynika,  że  dla  kryszta- 
łów ferromagnetycznych  współczynnik  rozszczepie- 
nia spektroskopowego  g równy  jest  w przybliżeniu  2. 
Oznacza  to,  że  ferromagnetyzm  uwarunkowany  jest 
nie  orbitalnymi,  a spinowymi  magnetycznymi  mo- 
mentami atomów.  Jak  już  wspomniano,  momenty 
magnetyczne  powłok  zapełnionych  są  równe  zeru. 
Elektrony  walencyjne  kolektywizują  się  przy  powsta- 
waniu stanu  metalicznego  tworząc  paramagnetyczny 
gaz  elektronów  prawie  swobodnych  (— ► Metale). 
Wobec  tego  ferromagnetyzm  możliwy  jest  jedynie 
w kryształach  zawierających  atomy  pierwiastków 
przejściowych,  tzn.  atomy  mające  nieza pełnioną  we- 
wnętrzną powłokę  elektronową.  Są  to  metale  przej- 
ściowe grupy  żelaza  z niezapełnioną  powłoką  3 d oraz 
pierwiastki  ziem  rzadkich  z niezapełnioną  powłoką  4 f 
Istnienie  niezapełnionej  powłoki  wewnętrznej  jest 
warunkiem  koniecznym  ale  niedostatecznym  po- 
wstania uporządkowania  ferromagnetycznego  w 
krysztale.  Z metali  grupy  żelaza  tylko  żelazo,  nikiel 
i kobalt  są  ferromagnetykami.  Z metali  ziem  rzadkich 
tylko  gadolin,  dysproz  i erb  wykazują  właściwości 
ferromagnetyczne.  Ferromagnetyzm  powstaje  w wy- 
niku oddziaływania  wymiennego  elektronów  z nie- 
za pełnionych  powłok,  przy  czym  oddziaływanie  to 
jest  efektem  kwantowym.  Kw-antowy  opis  tego  od- 
działywania podany  został  przez  W.  Heisenberga. 
W modelu  Heisenberga  energia  oddziaływania  wy- 
miennego określona  jest  następującym  wzorem: 

.V  z 

U=  -2j££SiS,,  (16) 

i-1  i-1 

gdzie  N jest  całkowitą  liczbą  spinów  w krysztale,  in- 
deksy i i j numerują  węzły  sieci  krystalicznej,  a Si 

i Sj  oznaczają  spiny  atomów  w /-tym  i y-tym  węźle 
sieci,  traktowane  jako  klasyczne  wektory.  Wzór  (16) 
uwzględnia  oddziaływanie  każdego  spinu  tylko  z naj- 
bliższymi sąsiadami  w liczbie  z — stanowi  to  tzw. 
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przybliżenie  najbliższych  sąsiadów.  Sumowanie  we 
wzorze  (16)  obejmuje  każdą  parę  spinów  w krysztale 
tylko  raz.  Miarą  oddziaływania  wymiennego  jest 
tzw.  całka  wymiany  J — wielkość  fizyczna  nie  mająca 
analogii  w fizyce  klasycznej. 

W celu  ilustracji  wzoru  (16)  rozpatrzymy  parę 

oddziałujących  ze  sobą  spinów  Si  oraz  Sj.  Na  pod- 
stawie wzoru  (16)  energia  tego  oddziaływania  jest 
równa: 

U = -2 JSi  Sj  = J-2JSiSjCos(pf  (17) 

updrządko-  gdzie  q>  jest  kątem  pomiędzy  Si  i Sj.  Energia  układu 
wartie  fizycznego  w warunkach  równowagi  termodynamicz- 
antyferro-  nej  osiąga  zawsze  minimum.  Gdy  J > 0,  najniższa 
magnetyczne  wartość  energii  U odpowiada  wartości  kąta  <p  = 0°. 

i ferri-  Stan,  któremu  odpowiada  najniższa  energia,  nazy- 
magnetyczne  wamy  stanem  podstawowym.  Dla  / > 0 stanem  pod- 
stawowym jest  więc  uporządkowanie  typu  ferroma- 
gnetycznego, tzn.  spiny  Si  i Sj  są  skierowane  równo- 
legle (rys.  4a).  Dla  J < 0 najniższa  energia  odpowiada 
antyrównoległemu  ustawieniu  spinów  (9?  = 180°). 
oddziały-  Możemy  wyróżnić  wtedy  dwa  rodzaje  uporządkowa- 
wanie  nja  — uporządkowanie  antyferromagnetyczne  (rys. 
wymienne  ąb)  oraz  ferri  magnetyczne  (rys.  4c).  W pierwszym 

przypadku  wartości  bezwzględne  spinów  Si  i Sj  są 
takie  same  i wypadkowy  spin  uporządkowania  anty- 
ferromagnetycznego równy  jest  zeru.  W uporządko- 
waniu ferrimagnetycznym  ze  względu  na  różne  war- 
tości bezwzględne  spinów  Si  i Sj  wypadkowy  spin 
jest  różny  od  zera. 

Stany  podstawowe  realizowane  są  jedynie  w tem- 
peraturze zera  bezwzględnego.  Przy  wzroście  tem- 
peratury, na  skutek  drgań  termicznych  sieci  krysta- 
licznej idealne  uporządkowanie  spinów  ulega  coraz 
większemu  zaburzeniu  i układ  N spinów  przechodzi 
w jeden  z możliwych  stanów  wzbudzonych  o energii 
większej  od  energii  stanu  podstawowego.  Znajo- 
mość energii  tych  stanów  pozwala  określić  wiele 
właściwości  termodynamicznych  kryształów  ferro- 
magnetycznych. 

Omówimy  dwie  metody  teoretycznego  opisu  ukła- 
du oddziałujących  ze  sobą  spinów  w temperaturach 
wyższych  od  zera.  Najprostsza  i najstarsza  teoria 
spontanicznego  uporządkowania  magnetycznego 
układu  N spinów  w sieci  krystalicznej  opiera  się  na 
koncepcji  tzw.  pola  molekularnego.  Jedno  z nowszych 
i ściślejszych  ujęć  teorii  posługuje  się  pojęciem  tzw. 
fal  spinowych. 


Teoria  poia  molekularnego 

Wzór  (16)  zastosowany  do  jednego  atomu  znajdują- 
cego się  w /-tym  węźle  sieci  krystalicznej  ma  postać: 

z 

l/x=  -2JŚ,£s}.  (18) 

i- 1 


wyrażonej  wzorem  (19).  Wobec  tego,  porównując  te 
dwa  wzory,  otrzymujemy 


He  * 


2 J 
gt*H 


z 


2*. 


j~i 


(20) 


Zakładamy  następnie,  że  każdy  spin  Sj  możemy  za- 
stąpić przez  wartość  średnią  (Slj])  . Jest  to  zasadni- 
cze przybliżenie,  na  którym  opiera  się  metoda  pola 
molekularnego.  Ponieważ  wszystkie  atomy  są  iden- 
tyczne i równoważne,  wartość  średnia  (Śj*  J>  zwią- 
zana jest  z całkowitym  namagnesowaniem  kryształu 
zgodnie  ze  wzorem 


Wobec  tego 

He 


M = Ngfta  <S)Jl>. 


2zJ 

gUB 


<^r>  = 


2 zJ 

WAm' 


(21) 

(22) 


Energia  Ui  określona  wzorem  (19)  ma  analogiczną 
postać  do  wzoru  na  energię  momentu  magnetycznego 
umieszczonego  w zewnętrznym  polu.  Wobec  tego, 
przeprowadzając  podobne  rozumowanie  jak  dla 
ośrodka  paramagnetycznego,  otrzymujemy  wzór  na 
namagnesowanie  ferromagnetyka  analogiczny  do 
wzoru  (12): 

M=  NgfiBSBs(x),  (23) 


gdzie 


gJUBSHe 

kBT 


(24) 


Funkcja  Brillouina  Bi  we  wzorze  (12)  zależna  jest  od 
pola  zewnętrznego  H.  Zakładamy  teraz,  że  zewnętrzne 
pole  magnetyczne  równe  jest  zeru.  Argument  funkcji 
B9  we  wzorze  (23)  zależy  od  pola  molekularnego, 
a tym  samym  od  namagnesowania  M (wzór  22). 
Mówiąc  inaczej,  równanie  (23)  na  namagnesowanie 
M jest  uwikłane.  Najprostszym  sposobem  znalezie- 
nia namagnesowania  M w danej  temperaturze  jest 
graficzne  rozwiązanie  układu  równań  (21)  i (23).  Na 
rysunku  5 przedstawiony  jest  przykładowy  przebieg 


Rys.  5.  Zależność  sponta- 
nicznego namagnesowa- 
nia ferromagnetyk 
temperatury.  < 
punkty  przedstawił 
ne  doświadczalne  dla  ni- 
klu; krzywa  teoretyczna 
wynika  przy  S = */«  z 
teorii  pola  molekularnego 


M(r> 

M(0) 
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L- 
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i- 
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T/Tc 


Oddziaływanie  wymienne  spinu  Si  z najbliższymi 
sąsiadami  możemy  zastąpić  oddziaływaniem  spinu 

Si  z hipotetycznym  polem  magnetycznym  He,  które 
nazywamy  polem  molekularnym.  Pojęcie  pola  mole- 
kularnego zostało  wprowadzone  po  raz  pierwszy 
w klasycznej  teorii  ferromagnetyzmu  przez  P.  Weissa, 
który  założył  acl  hoc  istnienie  pola  magnetycznego  we- 
wnątrz kryształu  ferromagnetycznego.  W ujęciu 
kwantowym  pole  molekularne  ma  sens  przybliżenia 
modelowego,  w którym  oddziaływanie  wymienne 
wyrażamy  w postaci  oddziaływania  momentu  ma- 
gnetycznego z efektywnym  polem  zewnętrznym. 
W takim  ujęciu  energię  U1  można  zapisać  w postaci : 


spontanicznego  namagnesowania  w funkcji  tempera- 
tury otrzymany  tą  metodą.  Temperatura  Tc,  w której 
znika  spontaniczne  namagnesowanie,  nazywana  jest 
temperaturą  Curie  lub  temperaturą  krytyczną.  Wzór 
na  temperaturę  Curie  otrzymany  w teorii  pola  mole- 
kularnego ma  postać: 

Tc=™ę±±.  (25> 

3A :b 

Dla  temperatur  T > Tc  ferromagnetyk  zachowuje 
się  w zewnętrznym  polu  magnetycznym  tak  jak  para- 
magnetyk,  przy  czym  podatność 


(/,=  -gUBSiHr.  (19)  X = J^L.  (26) 

Wartość  natężenia  Hc  musi  być  oczywiście  taka,  aby 

energia  wyrażona  wzorem  (18)  była  równa  energii  Wzór  (26)  znany  jest  jako  prawo  Curie- Weissa. 


wartość 
średnia  spinu 


spontaniczne 

namagneso- 

wanie 

ferro- 

magneiyka 


temperatura 

Curie 


prawo  Curie— 
Weissa 
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spontaniczne  Metodę  pola  molekularnego  można  również  sto- 
namagneso-  sować  do  opisu  spontanicznego  uporządkowania 
wanie  typu  antyferromagnetycznego  lub  ferrimagnetyczne- 
antyferro-  go.  W najprostszym  modelu  materiału  antyferroma- 
magnetyka  gnetycznego  sieć  magnetycznych  atomów  można  po- 
dzielić na  dwie  równoważne,  wzajemnie  przenikające 
się  podsieci  A i B w ten  sposób,  że  najbliższymi  sąsia- 
dami atomów  A są  atomy  B i odwrotnie.  Dwupodsie- 
ciowy  model  antyferromagnetyka  przedstawiony  jest 
na  rys.  6.  Dla  każdej  podsieci  oblicza  się  spontaniczne 


namagnesowanie  oddzielnie.  Ponieważ  wartości  bez- 
względne wszystkich  spinów  są  jednakowe,  wypadko- 
we namagnesowanie  podsieci  A znosi  się  z namagne- 
sowaniem podsieci  B , a zatem  moment  magnetyczny 
kryształu  jest  równy  zeru.  Temperaturowa  zależność 
namagnesowania  podsieci  dla  uporządkowania  anty- 
ferromagnetycznego przedstawiona  jest  schematycz- 
nie na  rys.  7. 

Temperatura  Tn , w której  znika  jednocześnie  upo- 
rządkowanie w obydwu  podsieciach,  nazywana  jest 
temperatura  temperaturą  Neela.  Typowym  przykładem  prostego 
iNgela  antyferromagnetyka  jest  mangan. 


Rys.  7.  Jakościowa  zależ- 
ność spontanicznego  na- 
magnesowania podsieci 
kryształu  antyferromag- 
netycznego od  tempera- 
tury 


Metoda  fal  spinowych 

W zakresie  niezbyt  wysokich  temperatur  w stosun- 
ku do  temperatury  Tc  energia  stanów  wzbudzonych 
niewiele  się  różni  od  energii  stanu  podstawowego. 
Stany  takie  można  opisać  za  pomocą  tzw.  fal  spino- 
wych, które  przechodząc  przez  kryształ  zaburzają 
jego  uporządkowanie. 

Rozpatrzmy  na  wstępie  uproszczoną  sytuację, 
w której  N spinów  jest  ustawionych  w tym  samym 
kierunku,  przy  czym  odległość  między  sąsiednimi 
spinami  jest  stała  i równa  a (kryształ  jednowymiaro- 
wy). Załóżmy  ponadto,  że  spin  w miejscu  /-tym  od- 
działuje tylko  z najbliższymi  sąsiadami  znajdują- 
cymi się  w miejscach  i — 1 oraz  i + l . Energię  oddziały- 
wania (16)  dla  takiego  układu  spinów  można  wtedy 
zapisać  w postaci : 

(27) 

t 

gdzie  m jest  momentem  magnetycznym  związanym 

ze  spinem  Si  zależnością  w = —gusSi.  Oddziały- 
wanie /-tego  spinu  z sąsiadami  zastąpiliśmy  przez 
oddziaływanie  tego  spinu  z efektywnym  polem  magne- 
tycznym 

Hi  = — — (Si-t+Śi-n).  (28) 

g/*B 

Zmianę  momentu  pędu  ftSi  pod  wpływem  tego  pola 
określa  następuiący  związek: 

— = mxHi,  czyli  h^L  = -gftaSt  X Hu  (29) 
dt  dt 

Moment  skręcający  wyrażony  iloczynem  wektoro- 
wym mxHu  powoduje  zmianę  jedynie  kierunku 

wektora  momentu  pędu  hSi  Gego  długość  pozostaje 
stała,  rys.  8).  Rozpisując  równanie  (29)  na  składowe 
w kierunku  osi  x i y i zakładając,  że  amplitudy  S f 


Rys.  8.  Precesja  momentu  pędu  hSi  w 
polu  magnetycznym  Hi 


spontaniczne 

namagneso- 

wanie 

ferrimagne- 

tyka 


Podobny  model  stosuje  się  do  wyznaczania  tempe- 
raturowej zależności  spontanicznego  namagnesowa- 
nia w przypadku  uporządkowania  ferrimagnetycz- 
nego.  Dla  prostych  ferrimagnetyków  wprowadza  się 
dwie  podsieci  A i B jak  na  rys.  6,  przy  czym  momenty 
magnetyczne  atomów  A i B nie  są  sobie  równe.  Wy- 
padkowe namagnesowanie  ferrimagnetyka  równe  jest 
sumie  wektorowej  momentów  magnetycznych  oby- 
dwu podsieci : 


M — M a-\-  Mb* 


i Sy  są  małe,  otrzymujemy  następujący  przybliżony 
układ  równań: 


dSt 

dt 


2IS 

h~ 


(2  Sf-Sf.,  — S*ł+ł). 


(30) 


dSt 

dt 


2IS 


(2S*-S*,-S7+1). 


Rozwiązania  tego  układu  poszukujemy  w postaci 
płaskiej  fali  bieżącej : 


Klasycznym  przykładem  substancji  ferrimagnetycz- 
nych  są  ferryty. 

Metodą  pola  molekularnego  osiągamy  dość  dobrą 
zgodność  jakościową,  a w wielu  wypadkach  również 
ilościową,  wyników  teoretycznych  z danymi  do- 
świadczalnymi. Dotyczy  to  szczególnie  prostych 
struktur  magnetycznych  w zakresie  wyższych  tem- 
peratur. 


Sf  — u exp  /'  (cot — km  a) ; Sy  = v exp  i (<ot — km  a),  (3 1 ) 

którą  nazywać  będziemy  falą  spinową.  Występujące 
tu  wielkości  u i r są  stałymi,  i = ]/— 1 , k = 2k/a jest 
wektorem  falowym  związanym  z falą  o długości  A. 
Wielkość  ma , w której  m jest  liczbą  całkowitą,  opi- 
suje odległość  spinu  Si  od  spinu  wybranego  jako  po- 
czątek układu  odniesienia. 


fale  spinowe 
w kryszta- 
łach ferro- 
magnetycz- 
nych 


precesja 

momentu 

pędu 
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zależność 

dyspersyjna 


bieżąca  fala 
spinowa 


Po  podstawieniu  wielkości  (31)  do  równań  (30) 
dostajemy  układ  równań,  który  ma  rozwiązania  tylko 
wtedy,  gdy  spełniony  jest  następujący  związek: 

ha>  = 4/5(1  —coska).  (32) 

Jest  to  zależność  dyspersyjna  co  = to(k)  dla  fal  spino- 
wych w jednowymiarowym  krysztale.  Jeżeli  uwzględ- 
nić w rozważaniach  działanie  przyłożonego  z zewnątrz 
pola  magnetycznego  o natężeniu  Hy  to  zależność 
dyspersyjna  przybiera  postać: 

h<a  = 4/5  (1  -cos  ka)-\-g/xBH.  (33) 
Zależność  tę  przedstawia  rys.  9. 


Rys.  9.  Zależność  dy- 
spersyjna fali  spino- 
wej rozchodzącej  się 
w krysztale  jednowy- 
miarowym 


Falę  spinową  w krysztale  trójwymiarowym  (rys. 
10)  opisują  wzory: 

Sf  = wexp  i ( cot — kr  i) ; 5f  = vexp  i (wt — kr  i),  (34) 

gdzie  wektor  falowy  k o długości  2jc/ż  skierowany  jest 

wzdłuż  kierunku  rozchodzenia  się  fali,  zaś  wektor  r 
opisuje  położenie  danego  jonu  w sieci  krystalicznej. 
Zależność  dyspersyjną  dla  trójwymiarowego  kry- 
ształu o strukturze  regularnej  wyraża  wzór 

ń(o  = 2/5[z  — cos (kam)]+gMBH;  (35) 

m 


sumowanie  rozciąga  się  na  z wektorów  am  łączących 
wybrany  atom  z jego  najbliższymi  sąsiadami.  Rozwi- 
jając cos  (k  am)  w szereg  dostajemy  dla  długich  fal 
spinowych  ( ka  <ś  1,  gdzie  a — stała  sieci  krystalicz- 
nej) zależność  dyspersyjną  w postaci  przybliżonej : 

ha>  x 2ISa*k*+gfiBH.  (36) 


Ze  wzoru  tego  wynika,  że  częstość  fal  spinowych 
w ferromagnetykach  jest  proporcjonalna  do  kwadratu 
wektora  falowego. 

Rozpatrzmy  teraz  kryształ  antyferromagnetyczny, 
którego  sieć  krystaliczna  przedstawiona  jest  na  rys.  6. 
Rozumując  podobnie  jak  przy  ferromagnetykach  do- 
chodzimy do  następującego  wzoru  określającego 
częstość  fal  spinowych  w krysztale  antyferromagne- 
tycznym : 

coskamn‘*±gMBH, 

m 


fale  spinowe 
w kryszta- 
łach antyfer- 
romagnetycz- 
nych 

(37) 


gdzie  Hey  określone  wzorem  (22),  jest  efektywnym 
polem  opisującym  oddziaływanie  wymienne  pomiędzy 
najbliższymi  sąsiadami  z różnych  podsieci.  Uwzględ- 
niona została  również  za  pośrednictwem  pola  Ha 
anizotropia  magnetokrystaliczna  ośrodka  (-*•  Struk- 
tura domenowa  i procesy  magnesowania),  która 
w antyferromagnetykach  jest  zazwyczaj  bardzo  silna. 
W wyniku  silnej  anizotropii  częstość  fal  spinowych 
w antyferromagnetykach  jest  zwykle  znacznie  większa 
niż  w ferro-  czy  w ferrimagnetykach.  Z powyższego 
wzoru  wynika,  że  przyłożenie  zewnętrznego  pola  ma- 
gnetycznego powoduje  rozszczepienie  krzywej  dy- 
spersyjnej fal  spinowych  na  dwie  gałęzie  (rys.  11). 


A 


Rys.  11.  Zależność  dys- 
persyjna fal  spinowych 
w krysztale  antyferro- 
magnetycznym w nie- 
obecności zewnętrznego 
pola  magnetycznego  (li- 
nia niebieska),  oraz  po 
przyłożeniu  pola  H (li- 
nie czarne 


Ze  wzoru  (37)  dostajemy  dla  długich  fal  spinowych 
(. ka  1)  następującą  zależność  dyspersyjną: 


hco  : 


: fMB 


2*^1  ' ±gftBH . (38) 


Jeśli  pominiemy  podobnie,  jak  przy  ferromagne- 
tyzmie, anizotropię  magnetokrystaliczną  kładąc  Ha  = 
= 0,  to  otrzymamy  proporcjonalność  częstości  <o  do 
pierwszej  potęgi  k (w  ferromagnetykach  zależność  ta 
jest  kwadratowa). 

Na  rys.  6 widzimy  dwupodsieciowy  kryształ  ferri- 
magnetyczny.  Różni  się  on  od  kryształu  antyferro- 
magnetycznego tym,  że  wartości  bezwzględne  spinów 
z obu  podsieci  są  różne,  w wyniku  czego  wypadkowy 
spin  i moment  magnetyczny  są  różne  od  zera.  Taki 
ferrimagnetyk  ma  dwie  gałęzie  zależności  dyspersyj- 
nej (rys.  12).  Gałęzie  te  dla  stosunkowo  długich  fal 
spinowych  opisane  są  przez  następujące  wzory: 


fale  spinowe 
w kryszta- 
łach ferro- 
magnetycz- 
nych 


hoh  = 4|/2  | k +SMB  H,  (39) 


[SASB  Tl/2 

1+  4 (SA-Ś*ja*k2\  +gUBH’  (40) 

gdzie  SA  i SB  są  spinami  odpowiednio  z jednej  i dru- 
giej podsieci.  Występuje  przy  tym  ścisła  analogia  po- 
między gałęzią  opisaną  przez  wzór  (39)  a zależnością 
dyspersyjną  w ferromagnetykach  (co  ~ k2).  Druga 
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gałąź  zależności  dyspersyjnej  występuje  tylko  w fer- 
rimagnetykach.  W przeciwieństwie  do  sytuacji  od- 
powiadającej pierwszej  gałęzi,  precesujące  z czę- 
stością^ spiny  z obu  podsieci  nie  są  teraz  antyrówno- 
ległe,  co  prowadzi  do  nieznikania  energii  wymiennej 
nawet  w granicy  k -*  0. 


Rys.  12.  Dwie  gałęzie  zależności  dyspersyjnej  fal  spinowych 
w krysztale  ferrimagnetycznym  w nieobecności  pola  magnetycz- 
nego H.  Przyłożenie  tego  pola  powoduje  przesunięcie  obu  gałę- 
zi w stronę  wyższych  częstości 


Kwantowanie  fal  spinowych.  Własności 
kryształów  magnetycznych  w niskich 
temperaturach 

Energie  fal  spinowych  są  skwantowane.  Oznacza  to, 
że  energia  fali  spinowej  o częstości  co*  i wektorze  falo- 
wym k nie  może  przyjmować  dowolnych  wartości, 
lecz  tylko  wartości: 

Ek  = (/te+ł)^*,  (41) 

gdzie  n/c  = 0,  1,  2,  ...  nosi  nazwę  kwantowej  liczby 
fali  spinowej,  zaś  wielkość  haik  określona  jest  zależ- 
nością dyspersyjną. 

magnony  Każde  elementarne  wzbudzenie  o energii  hcok  nosi 
nazwę  magnonu  i może  być  traktowane  jako  poru- 
szająca się  w krysztale  oddzielna  cząstka.  W tym  uję- 
ciu liczbę  kwantową  nic  można  traktować  jako  liczbę 

magnonów  o tej  samej  długości  wektora  falowego  k 
i częstości  a>*. 

Na  podstawie  powyższych  stwierdzeń  można  podać 
następującą  interpretację  nisko  położonych  stanów 
wzbudzonych  kryształu  magnetycznego:  każdy  taki 
stan  jest  odchyleniem  od  konfiguracji!  dealnego  upo- 
rządkowania w wyniku  występowania  wielu  fal  spi- 
nowych. W pierwszym  przybliżeniu  fale  te  można 
traktować  jako  niezależne  od  siebie.  Dany  stan  wzbu- 
dzony określa  się  podając  wartości  liczb  kwanto- 
wych nly  ...,  nn  dla  fal  spinowych  o wektorach  ku  ... 

kn , przy  czym  dla  skończonej  próbki  może  występo- 
wać tylko  pewma  skończona  liczba  wzbudzeń  nic. 

Weźmy  teraz  pod  uwagę  jednostkę  objętości  ferro- 
magnetyka,  w skład  której  wchodzi  N spinów,  każdy 

o wartości  S.  Rzuty  spinu  S na  pewien  wyróżniony  kie- 
runek określone  są  przez  magnetyczną  liczbę  spinową, 
która  może  przyjmować  jedną  zwartości  S,  S—  1, ...» 
—5.  Wynikają  stąd  dwa  wnioski.  Po  pierwsze,  w ujęciu 
kwantowym  fali  spinowej  nie  można  przedstawić  tak, 
jak  to  pokazuje  rys.  10.  Po  drugie,  magnetyczna  licz- 
ba całkowitego  spinu  układu  składającego  się  z N 
spinów,  ms,  może  przyjmować  jedynie  wartości  NS, 
MS— 1,  ...»  -NS. 

W stanie  podstawowym,  w którym  wszystkie  spiny 
skierowane  są  w jedną  stronę,  magnetyczna  liczba 
kwantowa  układu  ms  — NS.  Wzbudzenie  jednego 
magnonu  wiąże  się  z odchyleniem  jednego  ze  spinów 
w wyniku  czego  liczba  kwantowa  ms  maleje  do  war- 
tości NS—  1.  To  odchylenie  spinu  na  skutek  oddziały- 
wania wymiennego  nie  pozostaje  zlokalizowane  w jed- 
nym miejscu,  lecz  wędruje  stale  przez  całą  sieć  kry- 
staliczną. Takiemu  w-ędrującemu  odchyleniu  spino- 
wemu można,  podobnie  jak  w przedstawieniu  kla- 
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sycznym,  przypisać  pewien  wektor  falowy  k oraz  zwią- 
zaną z nim  częstość  co*. 

Jeśli  w krysztale  zostało  wzbudzonych  n magno- 
nów, to  liczba  ms  wynosi 

ms  = NS-n,  (42) 


gdyż  wzbudzenie  każdego  magnonu  zmniejsza  war- 
tość rzutu  całkowitego  spinu  na  pewien  wyróżniony 
kierunek  o jedność.  Z rzutem  tym  wiąże  się  namagne- 
sowanie 

M = g (43) 

Tak  więc  jeśli  liczba  spinów  N odnosi  się  do  jednostki 
objętości  rozpatrywanego  kryształu,  to  wzbudzenie  n 
magnonów  powoduje  obniżenie  namagnesowania  M 
od  wartości  maksymalnej  M0  = NgfisS  do  wartości 

M = M0  — ngfiB . (44) 

Powyższy  wynik  można  sformułować  w sposób  na- 
stępujący: wzbudzenie  jednego  magnonu  prowadzi 
do  zmniejszenia  momentu  magnetycznego  próbki 
o wartość  równą  gfiB  niezależnie  od  tego,  jaki  jest 
wektor  falowy  i częstości  magnonu. 

Wynika  stąd  ważny  wniosek,  że  jeśli  znamy  cał- 
kowitą liczbę  magnonów  o różnych  wektorach  falo- 
wych k w jednostce  objętości  kryształu,  £ nk*  to 

k 

potrafimy  obliczyć  też  zmianę  namagnesowania,  która 
wynosi : 

M0  — M — gnu  £ nk.  (45) 

jt 


Jak  już  mówiliśmy,  magnony  można  traktować  po- 
dobnie jak  elektrony  czy  fonony,  tzn.  jako  cząstki 
obdarzone  pewną  energią  i pędem.  Średnia  liczba 
cząstek  o danej  energii  zależy  od  temperatury,  przy 
czym  zależność  ta  opisywana  jest  przez  wzory  staty- 
styczne, które  w zależności  od  rodzaju  cząstek  przyj- 
mują jedną  z poniższych  postaci: 


lub 


n/c 


1 

exp(faok!kB  T)+  1 


(46) 


nk  = 


1 

exp(fj<oklkB  T)—  1 


(47) 


gdzie  kB  jest  stałą  Boltzmanna,  T — temperaturą 
bezwzględną,  zaś  ba>k  jest  energią  cząstki  o wektorze 

falowym  k. 

O cząstkach,  do  których  stosuje  się  wzór  (46)  po- 
wiadamy, że  podlegają  statystyce  Fermiego-Diraca. 
Cząstki  te  nazywamy  fermionami.  Przykładem  fer- 
mionów są  np.  elektrony. 

Cząstki,  do  których  stosuje  się  wzór  (47),  podlegają 
statystyce  Bosego-Einsteina  i noszą  nazwę  bozonów. 
Do  bozonów  zaliczamy  zarówno  fonony,  jak  i ma- 
gnony. Rozkład  Bosego  stosuje  się  wtedy,  gdy  wszy- 
stkie stany  kwantowe  układu  można  obsadzać  danymi 
cząstkami  bez  ograniczeń.  Natomiast  rozkład  Fer- 
miego stosuje  się  do  takich  cząstek,  które  w danym 
układzie  muszą  znajdować  się  w różnych  stanach 
kwantowych.  Inaczej  mówiąc  do  fermionów  stosuje 
się  zakaz  Pauliego. 

Korzystając  ze  wzoru  (47)  można  obliczyć  liczbę 
magnonów  wzbudzonych  w danej  temperaturze 


i 


M 


0,0587  j 

iksTY'2 

b ' 

i 2/5/  ’ 

(48) 


gdzie  b = 1,  2,  4 odpowiednio  dla  sieci  regularnej 
prymitywnej,  regularnej  centrowanej  przestrzennie 
i regularnej  płasko  centrowanej.  Ze  związków  (45) 
i (48),  jak  też  na  podstawie  zależności  M0  = M( 0)  = 
= NgtiBS  dostajemy  ostatecznie: 


M(T)  = M(0)l 


[>- 


0,0587/A:/!7-\:>,2l 
bS  \ 2/S / J 


(49) 


fermiony 
a bozony 


prawo  21 2 
Blocha 


Jest  to  tzw.  „prawo  3/2  Blocha”  dobrze  opisujące 
zależność  namagnesowania  od  temperatury  w zakre- 
sie niskich  temperatur. 

W podobny  sposób  można  znaleźć  energię  układu 
związaną  ze  wzbudzonymi  falami  spinowymi.  Jak 
wynika  z mechaniki  kwantowej,  energia  ta  jest  wyra- 
żona wzorem: 

UM  = £ ńthiok*  (50) 

ciepło  * 

właściwe  Można  stąd  obliczyć  ciepło  właściwe  przy  stałym 
ferromagne-  namagnesowaniu,  Cxr  które  jest  pochodną  UM  po 
tyków  temperaturze: 


Powyższe  wzory  odnoszą  się  do  ferromagnetyków. 
Stosują  się  one  jednak  również  do  ferrimagnetyków. 
ferrimagne-  Wprawdzie  w ferri magnetykach  występują  dwa  ro- 
tyki  dzaje  fal  spinowych  (rys.  12),  jednakże  fale  spinowe 
o dużej  energii  (nie  dążącej  do  zera  przy  k -►  0)  nie 
są  właściwie  wzbudzane  aż  do  temperatury  około 
10  K.  W związku  z tym  do  odchylenia  namagnesowa- 
nia od  maksymalnej  wartości  M0  przyczyniają  się 
głównie  fale  spinowe  o zależności  dyspersyjnej  ana- 
logicznej do  zależności  charakteryzującej  ferromag- 
netyk,  tj.  fale  spinowe  o energii  proporcjonalnej  do 
k2  (wzór  39). 

antyferro-  Obliczenia  dla  antyferromagnetyków  są  znacznie 
magnetyki  bardziej  skomplikowane  z uwagi  na  duży  zazwyczaj 
wkład  anizotropii  magnetokrystalicznej  do  wyraże- 
nia określającego  energię  fal  spinowych.  Jeśli  jednak 
pominąć  anizotropię,  to  okazuje  się,  że  zmiana  na- 
magnesowania wraz  z temperaturą  dana  jest  przez 
poniższe  wyrażenie: 

M(T)  = (52) 

Prawo  3/2  Blocha  nie  stosuje  się  zatem  do  antyferro- 
magnetyków. W dodatku  obliczenia  ciepła  właści- 
wego prowadzą  do  wniosku,  że  zmienia  się  ono  pro- 
porcjonalnie do  jP  (a  nie  do  T3'2,  jak  we  wzorze  51). 
Jest  to  wynikiem  proporcjonalności  energii  fal  spi- 
nowych do  pierwszej  potęgi  k , a nie  do  k 2,  jak  to 
miało  miejsce  w ferromagnetykach. 

Zależność  częstości  fal  spinowych  od  ich  wektora 
falowego  wyznacza  się  m.in.  za  pomocą  niespręży- 
stego  rozpraszania  neutronów.  Neutrony  zostają  roz- 
proszone przez  strukturę  magnetyczną  wraz  z jed- 
noczesną kreacją  lub  anihilacją  magnonu.  Znając 
energię  i pęd  padających  i rozproszonych  neutronów 
można  wyznaczyć  na  tej  podstawie  zależność  dysper- 
syjną dla  magnonów. 


Poznanie  właściwości  fal  spinowych  pozwala  zro- 
zumieć wiele  zjawisk  obserwowanych  doświadczalnie 
w ciałach  magnetycznych.  Teoria  fal  spinowych  sta- 
nowi jednocześnie  opartą  na  mechanice  kwantowej 
metodę  opisu  podstawowych  właściwości  tych  ciał.  stosowal- 
Stosuje  się  ją  z dobrymi  wynikami  w zakresie  stosun-  ność  teorii  fal 
kowo  niskich  temperatur,  rzędu  Vio  temperatury  spinowych 
Curie.  W wyższych  temperaturach  liczba  magnonów 
staje  się  na  tyle  duża,  że  założenie  o niezależności  fal 
spinowych  przestaje  być  słuszne.  Należy  uwzględniać 
wtedy  również  oddziaływania  pomiędzy  falami  spi- 
nowymi. Przy  dostatecznie  dużej  liczbie  wzbudzeń 
fale  spinowe  zaczynają  rozpraszać  się  na  falach  spi- 
nowych, przy  czym  to  rozpraszanie  może  znacznie 
zmieniać  ich  energię.  W rezultacie  wprowadzonych 
poprawek  można  przedłużyć  zakres  stosowalności 
metody  fal  spinowych  do  temperatur  przewyższają- 
cych V*  temperatury  Curie.  W temperaturach  jeszcze 
wyższych  należy  stosować  już  inne  metody  opisu. 

Przedstawiony  tu  zarys  teorii  magnetyzmu  zawiera 
jedynie  jej  podstawowe  elementy.  Prezentowane  wy- 
niki słuszne  są  dla  stosunkowo  prostych,  modelo- 
wych przypadków.  Bogactwo  form,  w jakich  przeja- 
wia się  przyroda,  powoduje,  że  teoria  dająca  dobry 
opis  rzeczywistych  układów  fizycznych  jest  znacznie 
bardziej  złożona,  szczególnie  pod  względem  matema- 
tycznym. Prezentowane  przykładowo,  na  rys.  4,  typy 
uporządkowania  magnetycznego  są  najprostszymi 
z możliwych.  Wiele  magnetyków  wykazuje  bardziej 
złożone  uporządkowanie,  wymagające  np.  wprowa- 
dzenia do  modelowego  przedstawienia  więcej  niż 
dwu  podsieci.  Omówione  bezpośrednie  oddziaływa- 
nie wymienne  dwóch  sąsiednich  atomów'  magnetycz- 
nych również  nie  jest  jedynym  możliwym.  W przy- 
padku wielu  rzeczywistych,  niemetalicznych  magnety- 
ków, aby  opisać  prawidłowo  oddziaływanie  wymien- 
ne, należy  uwzględnić  wpływ  atomów  niemagnetycz- 
nych, zajmujących  miejsca  między  atomami  magne- 
tycznymi w sieci  krystalicznej.  Atomy  niemagnetycz- 
ne uczestniczą  w oddziaływaniach  wymiennych  ato-  r?*a  atonio  w 
mów  magnetycznych  będąc  pewnego  rodzaju  „prze-  niemagne- 
kaźnikami”  tych  oddziaływań.  Kwantowy  opis  po-  tycznych 
średniego  oddziaływania  wymiennego  jest  oczywi- 
ście bardziej  złożony.  Czytelnika  głębiej  interesują- 
cego się  teorią  magnetyzmu  odsyłamy  do  specjali- 
stycznej literatury  podanej  niżej. 

Teoria  magnetyzmu  jest  jedną  z trudniejszych  teorii 
fizycznych,  ciągle  się  jeszcze  rozwijającą. 

C.  Kittel  Wstęp  do  fizyki  ciała  stałego.  Warszawa  1974; 

D.  H.  Martin  Magnctism  insołids , London  1967;  A.  H.  Morrish 
Fizyczne  podstawy  magnetyzmu.  Warszawa  1970;  J.  S.  Smart 
Effecti*e  Field  Theories  of  Magnetism,  Philadelphia  1966  (ros. 

Moskwa  1968). 


Struktura  domenowa  i procesy 
magnesowania 


Henryk  Szymczak  i Rita  Szymczak 


Zagadnienie  domen  należy  do  głównych  zagadnień 
w fizyce  materiałów  magnetycznych.  Poznanie  wła- 
sności statycznych  i dynamicznych  domen  jest  klu- 
czem do  wyjaśnienia  mechanizmów  określających 
podstawowe  parametry  techniczne  materiału  magne- 
tycznego. Badanie  domen  jest  pomostem  pomiędzy 
badaniami  technicznymi  a badaniami  o charakterze 
czysto  poznawczym,  gdyż  struktura  domenowa  zde- 
terminowana jest  z kolei  oddziaływaniami  o charak- 
terze kwantowym.  Do  opisu  własności  domen  sto- 
suje się  zarówno  formalizm  kwantowy  jak  i fenome- 
nologiczny. Do  swego  rodzaju  paradoksu  urasta  fakt, 
że  własności  domen  cylindrycznych  zostały  opisane 
przez  ich  odkrywcę  (A.  H.  Bobeck,  1967)  za  pomocą 
aparatu  matematycznego  jedynie  z zakresu  szkoły 
średniej.  Tematyce  domen  cylindrycznych  poświęca 


się  obecnie  najwięcej  prac  (spośród  prac  poświęco- 
nych fizyce  magnetyków)  i nic  nie  wskazuje  na  to,  by 
zainteresowanie  tym  tematem  miało  maleć.  A prze- 
cież problem  domen  jest  jednym  z najstarszych  pro- 
blemów badawczych.  Hipotezę  o istnieniu  domen  wy- 
sunął już  w 1907  r.  P.  Weiss  jednocześnie  z hipotezą 
pola  molekularnego  (zwanego  również  polem  Weissa).  poje  moieku- 
Hipoteza  o istnieniu  wewnętrznych,  bardzo  silnych  |arne 
(często  rzędu  108  A/m)  pól  magnetycznych  potrzebna  (Weissa) 
była  Weissowi  do  wyjaśnienia  zjawiska  spontanicz- 
nego uporządkowania.  Weiss  nie  wyjaśnił  natury  tego 
pola.  Według  współczesnych  poglądów  pole  moleku- 
larne jest  efektywnym  polem  opisującym  oddziały- 
wania wymienne  między  jonami  magnetycznymi 
(tzn.  jonami  o różnym  od  zera  momencie  magnetycz- 
nym). Ma  więc  ono  naturę  kwantową.  Przyjęcie  hi- 
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potezy  pola  molekularnego  (->  Teoria  magnetyzmu) 
wyjaśnia  wiele  podstawowych  własności  kryształów 
magnetycznych  (zależność  namagnesowania  od  tem- 
peratury, istnienie  temperatury  Curie  itp.),  nie  wy- 
jaśnia jednak  faktu,  że  kryształy  ferromagnetyczne 
są  najczęściej  obserwowane  w stanie  o zerowym  wy- 
padkowym namagnesowaniu.  To  właśnie  doprowa- 
domeny  dziło  Weissa  do  postawienia  drugiej  hipotezy  — hi- 
magnetyczne  potezy  o istnieniu  domen.  Według  tej  hipotezy  dome- 
— obszary  ny  magnetyczne  (zwane  również  obszarami  Weissa) 
Weissa  są  mikroobszarami,  w których  namagnesowanie  jest 
jednorodne  (zarówno  ze  względu  na  kierunek  jak 
i amplitudę).  Tak  więc  w obszarze  domeny  mamy  do 
czynienia  z pełnym  (maksymalnym)  namagnesowa- 
niem. Gdy  kryształ  znajduje  się  w stanie  rozmagneso- 
wania, kierunki  namagnesowania  w różnych  dome- 
nach rozrzucone  są  przypadkowo  tak,  że  wypadkowy 
moment  magnetyczny  w dowolnym  kierunku  jest 
równy  zeru.  Tu  dochodzimy  do  najbardziej,  jak  się 
wydaje,  frapującej  i zagadkowej  własności  materia- 
łów ferromagnetycznych.  Wiadomo  oczywiście,  że 
materiały  ferromagnetyczne  mogą  być  trwale  namag- 
nesowane. O wiele  bardziej  intrygujący  jest  jednak 
fakt,  że  namagnesowanie  ich  może  być  zmieniane 
przy  użyciu  stosunkowo  niewielkich  pól  magnetycz- 
nych. Pola  rzędu  80  A/m  są  często  wystarczające  do 
nasycenia  lub  do  zmiany  kierunku  namagnesowania 
w krysztale,  chociaż  jak  już  wspomniano,  pole  mo- 
lekularne ma  natężenie  107-108  A/m.  Ten  zadziwia- 
jący fakt  hipoteza  Weissa  tłumaczy  bardzo  prosto 
w następujący  sposób:  efektem  przyłożenia  zewnętrz- 
nego pola  magnetycznego  nie  są  zmiany  na  poziomie 
atomowym  (chyba,  że  natężenie  tego  pola  jest  porów- 
nywalne z natężeniem  pola  molekularnego),  ale  usta- 
wienie się  wektorów  namagnesowania  poszczegól- 
nych domen  w kierunku  pola  bądź  to  w rezultacie 
obrotu  tych  wektorów,  bądź  też  zmiany  kształtu 
i wielkości  poszczególnych  domen.  Weiss  nie  był  w sta- 
nie wyjaśnić,  w jaki  sposób  powstaje  struktura  do- 
teoria  menowa.  Dopiero  w 1935  r.  L.  D.  Landau  i J.  M.  Lif- 
Landaua  szyć  podali  teoretyczne  uzasadnienie  hipotezy  Weissa 
i Lif  szyca  udowadniając,  że  struktura  domenowa  powstaje  w wy- 
niku dążenia  układu  do  stanu  o minimalnej  energii 
wewnętrznej.  Wskutek  podziału  kryształu  na  domeny 
zmniejsza  się  znacznie  energia  pola  rozmagnesowu- 
jącego.  Pochodzenia  tego  pola  należy  szukać  w od- 
działywaniu dipolowym,  które  jest  znacznie  słabsze 
niż  oddziaływania  wymienne.  Może  się  wydać  rzeczą 
nienormalną,  że  faworyzowana  jest  raczej  struktura 
domenowa  niż  stan  jednorodnego  namagnesowania. 
Przyczyną  tego  stanu  rzeczy  jest  fakt,  że  oddziaływa- 
. nia  dipolowe  są  oddziaływaniami  dalekiego  zasięgu, 
stosunkowo  wolno  malejącymi  z odległością,  podczas 
gdy  oddziaływania  wymienne  mają  charakter  krótko- 
energia  zasięgowy  i ograniczone  są  zazwyczaj  do  najbliższych 
wewnętrzna  sąsiadów.  Dlatego  nie  ma  sprzeczności  w fakcie  istnie- 
struktury  nia  struktury  domenowej  w całym  krysztale  i istnie- 
domenowej  nia  jednorodnego  lub  prawie  jednorodnego  namagne- 
sowania na  małych  odległościach,  tzn.  wewnątrz 
pojedynczej  domeny  w krysztale.  Energia  wewnętrz- 
na określająca  rozmiary  i własności  struktury  do- 
menowej składa  się  z trzech  zasadniczych  części: 
energii  wymiany,  energii  anizotropii  magnetokry- 
stalicznej  i energii  magnetostatycznej  pola  rozmag- 
nesowującego. 


Energia  wymiany 

Jest  to  podstawowy  rodzaj  energii  w krysztale  mag- 
netycznym, warunkujący  powstanie  uporządkowania 
magnetycznego.  Oddziaływania  wymienne  określają 
rodzaj  uporządkowania  magnetycznego  (ferro-,  anty- 
ferro-,  ferrimagnetyczne),  zależność  namagnesowania 
od  temperatury,  wpływają  też  istotnie  na  inne  para- 
metry magnetyczne  materiału  (np.  na  anizotropię). 
Energię  oddziaływania  wymiennego  (— ► Teoria  mag- 
netyzmu, wzór  16)  dwóch  jonów  /-tego  z /-tym,  ob- 


darzonych spinami  Si  i Sj9  można  zapisać  w postaci 
klasycznej : 

£wym  = ~2JS2COS(p,  (1) 

gdzie  9?  jest  kątem  pomiędzy  sąsiednimi  spinami.  Za- 
kładając, że  kąt  ten  jest  mały,  można  skorzystać 
z przybliżonej  zależności  cos  9?  = 1 — ł/2ę?2  i wzór  (1) 
zapisać  (po  pominięciu  stałej,  niezależnej  od  <p)  w po- 
staci: 

£,Wym  = y5V2.  (2) 

Analiza  powyższego  wzoru  prowadzi  do  wniosku 
o istnieniu  obszarów  przejściowych  między  dome-  ściany 
nami,  zwanych  inaczej  ścianami  domenowymi.  Ścia-  domenowe 
ną  domenową  nazywa  się  warstwę  przejściową,  która 
oddziela  przylegające  do  siebie  domeny  namagneso- 
wane w różnych  kierunkach.  Całkowita  zmiana  kie- 
runku spinu  (lub  momentu  magnetycznego)  między 
domenami  nie  zachodzi  w postaci  nagłego  skoku 
w obszarze  jednej  płaszczyzny  atomowej,  lecz  — w 
sposób  stopniowy  — na  przestrzeni  wielu  płaszczyzn 
atomowych.  Energia  wymiany  zmniejsza  się,  gdy 
zmiana  kierunku  spinów  rozkłada  się  na  wiele  spinów. 

Aby  to  zrozumieć  załóżmy,  że  spiny  w sąsiednich 
domenacn  skierowane  są  przeciwnie.  Jeżeli  całkowita 
zmiana  o kąt  n zachodzi  stopniowo  przez  N różnych 
przejść,  to  kąt  między  sąsiednimi  spinami  jest  równy 
njNy  a więc  energia  wymiany  przypadająca  na  parę 
sąsiednich  jonów  jest  równa 

£wym  = JS2(k/N)\ 

Całkowita  energia  wymiany  odpowiadająca  łańcu- 
chowi złożonemu  z N+  1 jonów  wynosi : 

jEwym  — JS2n2/N.  (3) 

Tak  więc  stopniowa  zmiana  kierunków  spinów  w ścia- 
nce domenowej  znacznie  zmniejsza  energię  wymiany. 

Ze  wzoru  (3)  wynika,  że  ścianka  domenowa  powinna 
się  rozszerzać  bez  ograniczenia  (gdy  N ->  oo,  wtedy 
Ewym  ->  0).  Byłoby  tak,  gdyby  nie  występowały  inne 
rodzaje  energii,  a przede  wszystkim  energia  anizo- 
tropii magnetokrystalicznej. 


Energia  anizotropii  magnetokrystalicznej 

Energia  anizotropii  magnetokrystalicznej  jest  tą 

częścią  energii  kryształu,  która  zależy  od  kierunku 

wektora  namagnesowania.  Anizotropia  magneto- 

krystaliczna  jest  przyczyną  występowania  kierunków 

łatwego  (i  trudnego)  magnesowania.  Przez  kierunek  kierunek 

łatwego  magnesowania  rozumie  się  kierunek,  w któ-  łatwego 

rym  kryształ  magnesuje  się  do  nasycenia  przy  naj-  magnesowa- 

mniejszym  natężeniu  pola  magnetycznego.  W dal-  nia 

szych  rozważaniach  rozpatrzymy  przykład,  gdy 

kryształ  ma  jeden  kierunek  łatwego  magnesowania. 

Z punktu  widzenia  anizotropii  magnetokrystalicznej 
takie  kryształy  nazywa  się  jednoosiowymi.  Charakter 
anizotropii  magnetokrystalicznej,  czyli  istnienie  jed- 
nego lub  wielu  kierunków  łatwego  magnesowania, 
zależy  od  symetrii  sieci  krystalicznej.  Kryształy  nale- 
żące do  układu  heksagonalnego,  tetragonalnego  czy 
romboedrycznego  są  kryształami  jednoosiowymi 
(w  sensie  magnetycznym).  Nie  zawsze  jednak  taka  ko- 
relacja między  strukturą  krystaliczną  i anizotropią 
istnieje.  W 1970  r.  odkryto,  że  w niektórych  kryszta- 
łach o strukturze  granatu  (a  więc  w kryształach  regu- 
larnych) w procesie  wzrostu  może  być  indukowana 
jednoosiowa  anizotropia.  Jeszcze  ciekawszy  efekt 
zaobserwowano  w 1973  r.,  kiedy  to  udało  się  wy- 
tworzyć jednoosiową  anizotropię  w amorficznych 
cienkich  warstwach  stopów  Gd-Co  i Gd-Fe.  A prze- 
cież w materiałach  amorficznych  trudno  wyróżnić 
jakiś  kierunek.  W obu  wypadkach  natura  anizo- 
tropii jednoosiowej  nie  została  jeszcze  do  końca  wy- 
jaśniona. Gęstość  energii  anizotropii  magnetokry- 
stalicznej (a  więc  energii  na  jednostkę  objętości)  dla 
magnetyków  jednoosiowych  zapisuje  się  najczęściej 
w postaci  rozwinięcia  typu: 

£an  = KiSin^-pKg  sin40+...,  (4) 
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gdzie  Kx,  K2  są  stałymi  anizotropii  magnetokrysta- 
licznej,  0 — kątem  pomiędzy  wektorem  namagneso- 
wania i wyróżnioną  osią.  Do  opisu  większości  ma- 
teriałów jednoosiowych  wystarcza  jedna  stała  Kx. 

Znając  wyrażenie  opisujące  energię  anizotropii 
szerokość  magnetokrystalicznej  można  by  już  przystąpić  do 
ścianki  obliczenia  szerokości  ścianki  domenowej  i energii 
domenowej  niezbędnej  do  jej  utworzenia.  Nie  wiemy  jednak,  jak 
zmienia  się  kierunek  spinu  w ściance  (zakładamy  jed- 
norodny charakter  zmian).  Dokładnie  funkcję  opisu- 
jącą zmianę  kierunku  spinu  w ściance  można  obliczyć 
metodami  rachunku  wariacyjnego.  Przy  szacunko- 
wych obliczeniach  przyjmujemy,  że  w ściance  0 = 
— rc/2.  Wtedy  na  podstawie  wzoru  (4)  energia  anizo- 
tropii na  jednostkę  powierzchni  ścianki  wynosi 

<ran  = KxNay  (5) 


gdzie  a jest  stałą  sieci  krystalicznej.  Całkowita  gę- 
gęstośćener-  stość  energii  ścianki  domenowej  ow  zawiera  oprócz 
gii  ścianki  aan  jeszcze  wyraz  opisujący  energię  wymiany,  £wym/a2, 
domenowej  czyli 

<7«,  = JSWINa*  + KxNa.  (6) 

Parametr  N wyznacza  się  z warunku,  że  energia  ścian- 
ki domenowej  powinna  osiągać  wartość  minimalną: 


czyli 


do  w 


o. 


N = ]/n‘JS2/K1a> . 


(7) 


Gdy  namagnesowanie  jest  jednorodne  i skierowane  bieguny 
prostopadle  do  powierzchni  kryształu,  wtedy  nie  poją-  powierzch- 
wiają  się  oczywiście  bieguny  objętościowa,  natomiast  niowe 
łatwo  obliczyć  gęstość  biegunów  na  powierzchni. 

Wynosi  ona  q = + \M\y  gdy  namagnesowanie  skie- 
rowane jest  ku  powierzchni  i q = — I M | — w prze- 
ciwnym przypadku.  Energię  magnet ostatyczną  obli- 
cza się  podobnie  jak  energię  oddziaływań  ładunków 
elektrycznych: 

(ll> 

Oh/^0  y y *12 

We  wzorze  (11)  całkowanie  prowadzi  się  po  obję- 
tości kryształu  V;  r12  — odległość  między  punktem 
o ‘ współrzędnych  rx  i punktem  o współrzędnych  r2. 

Z wyprowadzonych  wzorów  można  korzystać  przy 
analizie  najprostszych  struktur  domenowych. 

Strukturę  domenową  w jednoosiowych  magnety- 
kach opisuje  się  zazwyczaj  za  pomocą  jednego  z dwu 
modeli : 

1)  model  struktury  zamkniętej  — zaproponowany 
w 1935  r.  przez  L.  D.  Landaua  i J.  M.  Lifszyca  (rys. 
la); 

2)  model  struktury  otwartej  — zaproponowany 
w 1949  r.  przez  Ch.  Kittela  (rys.  Ib). 

Całkowanie  we  wzorze  (11)  znacznie  się  upraszcza 
jeśli  założyć,  że  kryształ  ma  kształt  płytki  o grubości 
hy  nieograniczonej  w płaszczyźnie  xy.  Jak  widać 
z rysunków  kryształ  rozbity  jest  na  bloki  prostopa- 
dłościenne  o szerokości  D (D  — szerokpść  domeny), 


Szerokość  ścianki  domenowej  ó — Na , zatem 

5 = K\/JSWia,  (8) 

zaś  energia  ścianki 

^ = 2n\/KxJS~ia.  (9) 

Mimo  wielu  założeń  upraszczających,  wyrażenia  (8) 
i (9)  różnią  się  nieznacznie  od  wyrażeń  dokładnych, 
wyznaczonych  na  podstawie  rachunku  wariacyjnego. 
Dla  ilustracji  oszacujmy  wartości  S i ow  w żelazie 
przyjmując  J — 2,16- 10-21  J,  S = 1 , Kx  *=  4,2- 104  J/m3, 
a = 2,86- 10-10  m: 

ó = 4,2  -10-8  m (czyli  ok.  150  stałych  sieci), 
ow  = 1,1  • 10  ~3  J/m2. 

Jak  widać  z powyższych  obliczeń  ścianki  domenowe 
są  na  ogół  bardzo  wąskie.  Dlatego  bada  się  je  najczę- 
ściej metodami  mikroskopii  elektronowej. 

Energia  magnetostatyczna  poła 
rozmag  nesowującego 

Jest  to  najtrudniejsza  do  obliczenia  część  energii 
kryształu  zawierającego  domeny  magnetyczne.  Za- 
zwyczaj w fenomenologicznym  przybliżeniu  korzysta 
się  z wynikającej  z równań  Maxwella  formalnej  ana- 
logii między  statycznymi  polami  magnetycznymi 
gęstość  bie-  j elektrycznymi.  Wprowadza  się  pojęcie  gęstości  bie- 
gunów mag-  gunów  (lub  gęstości  ładunków  magnetycznych)  zde- 
netycznych  finiowanej  następująco: 

q = —di  vM;  (10) 

M—  wektor  namagnesowania. 


wysokości  h i długości  nieograniczonej.  Ścianki  do-  struktura 
menowe,  wychodzące  na  powierzchnię  płytki  tworzą  domenowa 
układ  równoległych  linii  (stąd  inna  nazwa  omawia-  zamknięta 
nych  struktur  — struktury  paskowe).  Struktura  Lan-  (Landaua- 
daua-Lifszyca  różni  się  od  struktury  Kittela  obecno-  -Lifszyca) 
ścią  przy  powierzchni  tzw.  domen  zamykających. 

Domeny  te  powodują,  że  namagnesowanie  nie  ma 
składowej  prostopadłej  do  powierzchni  płytki,  a więc 

0 = 0.  Można  łatwo  obliczyć  energię  całkowitą  (li- 
czoną na  jednostkę  powierzchni)  dla  modelu  Lan- 
daua-Lifszyca.  Energia  całkowita  składa  się  tu  z 2 
części : 

£ll  = Ep-ł-Ea . i (12) 

Pierwsza  część  jest  energią  związaną  z obecnością 
ścianek  domenowych.  Jeżeli  rozmiary  kryształu 
w kierunkach  x i y oznaczymy  chwilowo  przez  Lx 

1 Ly  (pamiętając,  że  LXy  Ly  oo),  to  całkowita  po- 
wierzchnia ścian  domenowych  (bez  domen  zamyka- 
jących, których  wkład  można  pominąć)  wynosi 
hLzLy/D.  Stąd 

Ep  — OwhlD. 

Druga  część  we  wzorze  (12)  reprezentuje  energię  ani- 
zotropii magnetokrystalicznej  związaną  z istnieniem 
domen  zamykających,  w których  0 = 7r/2; 

Ea  = KDl  2. 

Szerokość  domen  D wyznacza  się  z warunku  na  mi- 
nimum energii  układu : 


dD 
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struktura 

otwarta 

(Kittela) 


domeny 

cylindryczne 


energia 
kryształu 
z domenami 
cylindry- 
cznymi 


stąd 

D = }/2atv/:iK  , £r.i.  = ^la^Rh . (13) 

W przypadku  struktury  Kittela  całkowita  energia 
również  składa  się  z 2 części: 

Ek  — Ep  -f  Em  , (14) 

gdzie  Ep  ma  postać  identyczną  jak  we  wzorze  (12), 
a Em  reprezentuje  energię  magnetostatyczną  związaną 
z obecnością  biegunów  na  powierzchni  płytki.  Ko- 
rzystając z (11)  można  otrzymać  następujące  wyra- 
żenie : 

Em  = 1,08-10  5M2D. 

Z warunku  na  minimum  energii  układu  otrzymuje  się: 


D = j/<r»A/l,08  IOW2  , 
Ek  = 2 ^1,08  10‘AłWi . 


(15) 


Porównując  Ek  i Eli.  można  ocenić,  która  z omawia- 
nych struktur  jest  energetycznie  korzystniejsza.  Łatwo 
pokazać,  że  gdy 

K\MZ>  2,16  105,  (16) 


wtedy  £ll>£k.  Spełnienie  nierówności  (16)  jest  wa- 
runkiem koniecznym  (chociaż  nie  zawsze  dostatecz- 
nym) istnienia  struktury  otwartej. 


Ponieważ  En  jest  proporcjonalne  do  objętości  do- 
meny (o  promieniu  r ) a Ev  do  jej  powierzchni,  więc 
£W~r2,  a Ev~r.  Okazuje  się,  że  Em~r2  dla  r</r, 
natomiast  Em^r  dla  r^>h.  Rysunek  3 przedstawia  za- 


W  obecności  zewnętrznego  pola  magnetycznego, 
struktura  otwarta  może  przejść  niekiedy  w strukturę 
jak  na  rys.  2.  Na  rysunku  tym  widać  charakterystycz- 
ne domeny  o kształcie  cylindrycznym.  Są  to  wspom- 
niane wyżej  domeny  cylindryczne,  odkryte  i zbadane 
przez  A.  H.  Bobecka  w 1967  r.  Zainteresowanie  tymi 
domenami  wiąże  się  z ich  małymi  rozmiarami  i moż- 
liwością kontrolowanego  ich  przesuwania,  z czego 
wynika,  że  mogą  być  one  wykorzystane  do  budowy 
pamięci  dla  maszyn  cyfrowych. 

Początkowo  domeny  cylindryczne  obserwowano 
w ortoferry(ach  (kryształach  tlenkowych  o strukturze 
rombowej,  zawierających  jony  żelaza  i lantanowców). 
Średnica  domen  cylindrycznych  w ortoferrytach  wy- 
nosi ok.  100  pm.  W 1970  r.  odkryto  domeny  cylin- 
dryczne w granatach  (są  to  kryształy  tlenkowe  o struk- 
turze regularnej,  zawierające  jony  żelaza  i lantanow- 
ców). W granatach  średnica  domen  cylindrycznych 
zawarta  jest  w- granicach  1-10  pm.  Wreszcie  w 1973  r. 
odkryto  domeny  cylindryczne  w cienkich  warstwach 
amorficznych,  takich  jak  np.  stopy  Gd-Co  czy  Gd-Fe. 
Średnica  domen  cylindrycznych  w tych  warstwach 
może  być  znacznie  mniejsza  od  1 pm. 

Przeanalizujmy,  od  czego  zależy  energia  kryształu 
zawierającego  domeny  cylindryczne.  Sposób  postę- 
powania nie  różni  się  tu  niczym  od  analizy  rozpatry- 
wanych już  modeli.  Oprócz  rozpatrywanych  poprzed- 
nio rodzajów  energii  należy  jeszcze  uwzględnić  ener- 
gię oddziaływania  domen  z zewnętrznym  polem  mag- 
netycznym o natężeniu  H: 

Eh  = --  / ( MH)dV . (17) 

V 

W wypadku  domen  cylindrycznych  energia  magneto- 
statyczna  ma  dość  skomplikowaną  postać  (pojawiają 
się  tu  całki  eliptyczne).  W związku  z tym  analizę 
układu  przeprowadzimy  jakościowo.  Energia  krysz- 
tału zawierającego  pojedynczą  domenę  cylindryczną 
składa  się  z 3 części : 

Ec  = Ep  | Em  *f  Eh . (18) 


leżność  całkowitej  energii  Ec  od  promienia  domeny  r 
(w  dowolnych  jednostkach).  Jak  wynika  z wykresu, 
gdy  H = 0,  to  Ec  nie  ma  minimum  (energetycznie  wy- 
godniejsza jest  tu  struktura  paskowa).  Przy  pewnym 
natężeniu  pola  magnetycznego  H = H'  energia  cał- 
kowita ma  minimum  i pojawiają  się  domeny  o pro- 
mieniu R' . Ze  wzrostem  natężenia  pola  H zmniejsza 
się  promień  domeny  aż  do  chwili,  gdy 

min  EC{R)  — 0. 

Wtedy  domena  cylindryczna  znika.  Ze  względu  na 
analogię  z zapadaniem  grawitacyjnym  mówi  się,  że 
domena  zapada  się.  Tak  więc  domeny  cylindryczne 
mogą  istnieć  tylko  w określonym  przedziale  natężeń 
pól  magnesujących.  Również  promień  domeny  cylin- 
drycznej zmienia  się  przy  zmianie  H w-  określonym 
przedziale.  Przedział  ten  zależy  od  stosunku  aw/M2. 
W konkretnym  materiale  magnetycznym  nie  można 
zatem  wytworzyć  dowolnie  małej  domeny.  Stąd 
ustawiczne  poszukiwania  nowych  materiałów,  w 
których  można  by  wytwarzać  domeny  mające  mniej- 
sze rozmiary. 

W urządzeniach  wykorzystujących  domeny  cylin- 
dryczne (np.  w ->  Pamięciach  magnetycznych)  bu- 
duje się  specjalne  układy  do  detekcji  domen.  Działanie 
ich  oparte  jest  na  zjawisku  zmiany  pola  rozmagneso- 
wującego  w pobliżu  domeny  cylindrycznej.  Na  tej  za- 
sadzie buduje  się  hallotronowe  lub  magnetooporowe 
detektory  domen.  W badaniach  własności  fizycznych 
domen  korzysta  się  z innych  metod. 


Metody  obserwacji  struktury  domenowej 

Istnieje  wiele  metod  obserwacji  struktury  domenowej, 
najczęściej  jednak  stosuje  się  metodę  figur  proszko- 
wych lub  metodę  magnetooptyczną.  Metoda  figur 
proszkowych  polega  na  pokrywaniu  powierzchni 
kryształu  specjalnym  koloidem  zawierającym  drobny 
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metoda  figur  proszek  magnetyczny  (np.  magnetyt).  Proszek  ten 
proszkowych  gromadzi  się  na  granicach  domen,  w miejscach,  gdzie 
ścianki  domenowe  wychodzą  na  powierzchnię.  Me- 
toda figur  proszkowych  daje  więc  informację  jedynie 

0 strukturze  domenowej  na  powierzchni  kryształu. 
Więcej  informacji  można  uzyskać  za  pomocą  metod 
magnetooptycznych.  W metodach  tych  wykorzystuje 
się  fakt,  że  stan  polaryzacji  światła  odbitego  od  po- 
wierzchni kryształu  lub  przechodzącego  przez  krysz- 
tał zależy  od  kierunku  wektora  namagnesowania. 
Uzyskuje  się  więc  informację  nie  tylko  o rozkładzie 

1 kształcie  domen,  ale  również  w wielu  wypadkach 
o kierunku  wektora  namagnesowania  w poszczegól- 
nych domenach.  Występowanie  określonego  zjawi- 
ska magnetooptycznego  w odbiciu  — efektu  Kerra 

metody  mag-  biegunowego,  podłużnego  i poprzecznego,  w trans- 
netooptyozme  misji  — efektu  Faradaya  i efektu  Cottona-Moutona) 
zależy  od  geometrii  układu,  a więc  od  wzajemnego 
położenia  wektora  falowego  światła,  wektora  polary- 
zacji światła  i wektora  namagnesowania  (— ► Magneto- 
optyczne zjawiska).  Na  ił.  89-92  (tabl.  23)  przedsta- 
wiono kilka  zdjęć  struktury  domenowej,  uzyskanych 
za  pomocą  różnych  technik  badawczych  na  krysz- 
tałach o jednoosiowej  anizotropii  i to  t akich,  w któ- 
rych występują  domeny  cylindryczne.  We  wszystkich 
przypadkach  kierunek  łatwego  magnesowania  jest 
prostopadły  do  płaszczyzny  płytki.  Ilustracja  90a 
przedstawia  zdjęcie  struktury  domenowej  ferrytu  ba- 
rowego BaFe12Ó19  uzyskane  metodą  figur  proszko- 
wych. Widać,  żę  powierzchniowa  struktura  domeno- 
wa jest  bardzo  skomplikowana.  Zdjęcie  90b  przed- 
stawia ten  sam  obszar  kryształu  badany  metodą  Fara- 
strukfura  daya.  W przeciwieństwie  do  struktury  powierzchnio- 
powierzch-  wej,  struktura  wewnętrzna  jest  stosunkowo  prosta. 

niowa  a Można  również  zauważyć  istnienie  korelacji  między 
wewnętrzna  strukturą  powierzchniową  i strukturą  wewnętrzną. 

Nie  jest  to  jednak  regułą  i często  struktura  powierzch- 
niowa nie  wykazuje  żadnego  podobieństwa  do  struk- 
tury wewnętrznej.  Wracając  do  przedstawionych 
zdjęć  należy  podkreślić,  że  są  one  unikalne  i to  z dwóch 
powodów.  Po  pierwsze,  na  zdjęciu  90b  widać  rzadkie 
zjawisko  istnienia  obok  siebie  domen  cylindrycznych 
o różnych  kierunkach  wektora  namagnesowania  (na 
zdjęciu  domeny  czarne  i białe).  Istnieją  one  bez  zew- 
nętrznego pola  magnetycznego,  stabilizowane  polem 
rozmagnesowującym.  A także  dlatego,  że  wykonane 
zostało  na  stosunkowo  grubym  krysztale  (ok.  1 mm). 
Kryształy  o takiej  grubości  są  całkowicie  nieprzezro- 
czyste dla  światła  widzialnego.  Dlatego  do  obserwacji 
domen  metodą  Faradaya  wykorzystano  tu  podczer- 
woną część  widma.  Technika  badania  struktury 
domenowej  ferrytów  heksagonalnych  (takich  jak 
BaFe120I9)  rozwinięta  została  w Instytucie  Fizyki 
PAN  i pozwoliła  na  obserwację  struktury  domeno- 
wej w płytkach  o rekordowej  grubości  dochodzącej 
do  ok.  0,5  cm. 

struktura  Seria  zdjęć  89a,  b,  c i d przedstawia  strukturę  do- 
domenowa  menową  (obserwowaną  techniką  Faradaya)  w cien- 
granatu  kich  warstwach  granatu  Yj.aGdo.sBio.gFea.sGa^Onj. 

Zdjęcie  89a  przedstawia  strukturę  w zerowym  polu 
magnetycznym.  Zdjęcia  89b,  c i d pokazują  ten  sam 
odcinek  kryształu  w polu  magnetycznym  (skierowa- 
nym prostopadle  do  warstwy)  o natężeniu  odpowied- 
ni® 2170  A/m,  2900  A/m  i 3790  A/m).  Widać  wyraź- 
nie, jak  jedne  domeny  (na  zdjęciach  — białe)  rosną 
kosztem  domen  mających  przeciwną  polaryzację  i jak 
struktura  paskowa  przechodzi  w strukturę  cylin- 
dryczną. 

domeny  Ilustracja  91  (tabl.  23)  przedstawia  zdjęcie  siatki  do- 
cylindryczne  men  cylindrycznych  w granacie  Ys^Gdo.sFe.iGaOjj;. 
w granacie  Siatkę  taką  wytwarza  się  przykładając  prostopadle 
do  próbki  pulsujące  pole  magnetyczne  o określonym 
natężeniu.  Domeny  cylindryczne  tworzą  tu  dwuwy- 
miarową heksagonalną  siatkę. 

Ilustracja  92  (tabl.  23)  przedstawia  zdjęcie  struk- 
tury domenowej  materiału  najbardziej  interesują- 
cego z punktu  widzenia  wykorzystania  domen  cylin- 
drycznych w technice  — cienkich  warstw  amorficz- 


nych (stop  Gd-Co).  Ponieważ  warstwa  jest  całkowi- 
cie nieprzezroczysta  dla  światła,  do  obserwacji  struk- 
tury wykorzystano  tu  efekt  Kerra  (biegunowy). 


Procesy  magnesowania 

Obecność  struktury  domenowej  powoduje,  że  bez 
zewnętrznego  pola  magnetycznego  kryształ  jest  w za- 
sadzie rozmagnesowany,  tzn.  wypadkowy  moment 
magnetyczny  jest  równy  zeru.  Przyłożenie  zewnętrz- 
nego pola  magnetycznego  powoduje  powstanie  nie- 
zerowego  wypadkowego  namagnesowania,  które  ro- 
śnie w miarę  zwiększania  poła  magnetycznego,  aż 
osiąga  wartość  M0  równą  namagnesowaniu  jednorod- 
nego, bezdomenowego  kryształu.  Indukcja  magne- 
tyczna osiąga  przy  tym  wartość  Bs  (rys.  4)  — zwaną 
indukcją  nasycenia.  Cykliczna  zmiana  pola  magne- 
tycznego wywołuje  zmianę  namagnesowania  i in- 
dukcji po  zamkniętej  krzywej  (krzywa  //  z rys.  4) 
zwanej  pętlą  histerezy.  Pętlę  histerezy  charakteryzują 
dwa  podstawowe  parametry:  indukcja  szczątkowa 
(lub  pozostałość  magnetyczna)  Br  określona  jako  war- 


Rys.  4.  Pętla  histerezy  indukcji  magnetycznej;  B » indukcja  nasy- 
cenia, Br  indukcja  szczątkowa;  Hc  pole  koercji 


tość  B w punkcie  H — 0;  siła  koercji  Hc  (lub  pole 
koercji,  natężenie  powściągające)  określona  jako  war- 
tość pola  H , przy  którym  B = 0.  Z wymienionych 
powyżej  parametrów  BSy  Br  i Hc  tylko  Bs  jest  para- 
metrem całkowicie  zależnym  od  materiału.  Pozostałe 
parametry  zależą  od  obróbki  technologicznej  ma- 
teriału, od  rodzaju  i rozkładu  defektów,  od  parame- 
trów struktury  domenowej  itd.  Można  więc  je  zmie- 
niać. Stąd  też  podstawowe  zadanie  teorii  procesów 
magnesowania  polega  na  zrozumieniu  mechanizmów 
determinujących  parametry  Br  i Hc  — parametry, 
które  mają  istotne  znaczenie  przy  praktycznym  wy- 
korzystaniu materiału  magnetycznego. 

Istnieją  dwa  zasadnicze  procesy  wpływające  na 
kształt  krzywej  magnesowania:  procesy  przesuwania 
ścian  domenowych  i procesy  rotacji  wektora  namag- 
nesowania w domenach.  W pierwszym  procesie  ruch 
ścian  domenowych  prowadzi  do  powiększenia  obję- 
tości domen,  w których  namagnesowanie  skierowane 
jest  zgodnie  z kierunkiem  zewnętrznego  pola  magne- 
tycznego. W drugim  procesie  nie  zachodzi  w zasadzie 
zmiana  objętości  domen,  natomiast  wektor  namagne- 
sowania w domenach  obraca  się  w kierunku  zewnętrz- 
nego pola  magnetycznego.  Oba  procesy  mogą  zacho- 
dzić w sposób  odwracalny  lub  nieodwracalny. 
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materiały  Ze  względu  na  charakter  procesów  magnesowania 
magnetyczne  materiały  magnetyczne  dzielą  się  na  dwie  duże  grupy: 
miękkie  materiały  magnetycznie  miękkie  i materiały  magne- 
tycznie twarde.  Do  grupy  materiałów  magnetycznie 
miękkich  zaliczamy  ferro-  i ferrimagnetyki,  których 
magnesowanie  lub  przemagnesowanie  zachodzi  w sto- 
sunkowo słabych  polach  magnetycznych.  Materiały 
te  mają  dużą  wartość  indukcji  nasycenia,  małe  pole 
koercji,  dużą  przenikalność  magnetyczną  i małe  straty 
na  przemagnesowanie.  Do  podstawowych  materia- 
łów tej  grupy  należą:  żelazo,  stale  krzemowe,  stopy 
żelaza  z niklem,  niektóre  ferryty.  Do  grupy  ma- 
materiafiy  teriałów  magnetycznie  twardych  zalicza  się  ferro- 
magnetyczne i ferrimagnetyki,  w których  magnesowanie  zachodzi 
twarde  w stosunkowo  silnych  polach  magnetycznych.  Ma- 
teriały te  wykorzystywane  są  najczęściej  do  wytwa- 
rzania magnesów  trwałych.  Muszą  one  mieć  dużą 
wartość  indukcji  szczątkowej  oraz  duże  pole  koercji. 
W ostatnich  latach  i w tej  grupie  materiałów  doko- 
nano ważnych  odkryć.  Odkryto  nowe,  bardzo  obie- 
cujące materiały  do  wytwarzania  magnesów  trwa- 
łych. Są  to  związki  międzymetaliczne  typu  MCo5 
(Af  — lantanowiec,  najczęściej  Sm,  Pr,  La,  Nd). 
Związki  te  swoimi  parametrami  znacznie  przewyż- 
szają stosowane  dotychczas  materiały  do  wytwarza- 
nia magnesów  trwałych.  Np.  dla  SmCo6  pole  koercji 
Hc  = 800  kA/m  a Bs  — 1,0  Vs/m2.  Tak  duże  war- 
tości Hc  związane  są  z gigantyczną  anizotropią  mag- 
netokrystaliczną  (i  ewentualnie  magnetosprężystą) 
tych  materiałów.  Natura  anizotropii  w tych  związ- 
kach nie  została  dotychczas  w pełni  wyjaśniona.  Dużą 
wartość  Hc  uzyskuje  się  po  odpowiedniej  obróbce 
technologicznej  materiału  (prasowanie  proszków  w 
silnych  polach  magnetycznych).  Omawianych  związ- 
ków używa  się  do  wyrobu  miniaturowych  magnesów 
trwałych,  koniecznych  do  radykalnego  zminiaturyzo- 


Magnetooptyka 

Wiesia  w Warc/zyński 

Magnetooptyka  jest  działem  nauki  o zjawiskach  op- 
tycznych, zajmującym  się  wpływem  pola  magnetycz- 
nego na  rozchodzenie  się  promieniowania  elektromag- 
netycznego w ośrodku.  Zjawiska  magnetooptyczne 
wiążą  się  zatem  ze  wzajemnym  oddziaływaniem  pro- 
mieniowania elektromagnetycznego  i materii.  Zjawi- 
ska te  stanowią  istotne  źródło  informacji  o oddziały- 
waniach promieniowania  elektromagnetycznego  z ma- 
terią, a więc  o specyficznych  właściwościach  tych  ciał, 
w których  promieniowanie  się  rozchodzi. 

Z punktu  widzenia  charakteru  promieniowania 
zakresy  pro-  elektromagnetycznego  rozróżniamy  zjawiska  magne- 
mieniowania  tooptyczne  w zakresie  mikrofal,  promieniowania  pod- 
czerwonego oraz  w zakresie  światła  widzialnego 
i promieniowania  pozafioletowego.  Różnice  w zja- 
wiskach magnetooptycznych  w tych  obszarach  pro- 
mieniowania wiążą  się  ze  specyficznymi  cechami  tego 
promieniowania,  wynikającymi  z częstości  drgań, 
a co  za  tym  idzie  — energii  fotonów. 

Z punktu  widzenia  ośrodka,  w którym  rozchodzi 
rodzaje  się  światło,  możemy  rozróżniać  zjawiska  magneto- 
ośrodka  optyczne  w gazach,  cieczach  i ciałach  stałych.  Róż- 
nice w zjawiskach  magnetooptycznych  w tych  ośrod- 
kach wynikają  z ich  charakterystycznych  cech.  Naj- 
bardziej interesujące  i różnorodne  zjawiska  magneto- 
optyczne obserwuje  się  w ciałach  stałych  ze  względu 
na  ich  regularną,  krystaliczną  budowę  oraz  różnice 
we  właściwościach  elektrycznych  i magnetycznych, 
które  decydują  o oddziaływaniu  z promieniowaniem 
elektromagnetycznym.  Mówiąc  o zjawiskach  magne- 
tooptycznych bardzo  często  mamy  właśnie  na  myśli 
zjawiska  zachodzące  w ciałach  stałych. 

Fale  elektromagnetyczne  o określonych  często- 
ściach przechodząc  przez  ośrodek  mogą  być  tłumione 
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wania  sprzętu  radiotechnicznego,  elektrotechnicz- 
nego itp. 

Większość  prac  naukowych  prowadzonych  obecnie  procesy 
w zakresie  fizyki  domen  magnetycznych  dotyczy,  magnesowa- 
obok  wspomnianych  zagadnień  domen  cylindrycz-  n*a  w AfCo5 
nych,  właśnie  problemu  procesów  magnesowania 
w związkach  MC o5.  Badania  te  obejmują  m.in.  ob- 
serwacje struktur  domenowych  w tych  materiałach 
i poszukiwanie  korelacji  między  strukturą  domeno- 
wą, parametrami  technicznymi  materiału  (głównie 
polem  koercji)  i obróbką  technologiczną.  Chodzi  tu 
również  o wyjaśnienie  mechanizmów  hamowania  ro- 
tacji wektora  namagnesowania  w związkach  MC o5. 

Na  zakończenie  należy  jeszcze  raz  podkreślić,  że 
domeny  magnetyczne  występują  zawsze  tam,  gdzie 
istnieje  możliwość  obniżenia  energii  układu  przy 
przechodzeniu  od  konfiguracji  jednorodnego  nasyce- 
nia z wysoką  energią  do  konfiguracji  domenowej 
z niższą  energią.  A zatem  można  oczekiwać,  że 
struktura  domenowa  występuje  również  i w innych 
materiałach.  I rzeczywiście,  podobne  własności  do  w 

domen  w magnetykach  mają  domeny  w ferroelektry-  ferroełektry- 
kach.  Strukturę  domenową  obserwuje  się  w nad-  ^ach 
przewodnikach  I rodzaju  i w stanie  przejściowym  przy 
przejściach  fazowych  I rodzaju.  Mechanizm  pow- 
stawania domen  w wymienionych  przypadkach  jest 
bardzo  podobny  (w  ferroelektrykach  — identyczny) 
do  opisanego  mechanizmu  powstawania  domen  w 
magnetykach.  Widzimy  więc,  że  pojęcia  domeny  nie 
należy  wiązać  jedynie  z materiałami  magnetycznymi. 

Ma  ono  znaczenie  o wiele  bardziej  uniwersalne. 

Domeny  cylindryczne , I Szkoła  Zimowa  „Nowe  Materiały  Mag- 
netyczne”, Warszawa  1976;  C.  Kittel  Wstęp  do  fizyki  ciała  sta - 
lego,  Warszawa  1974;  A.  H.  Morrisk  Fizyczne  podstawy  magne- 
tyzmu, Warszawa  1970;  M.  Nałęcz  (red.)  Cylindryczne  domeny 
magnetyczne  w technice  cyfrowej , Warszawa  1973;  R.  Wadas 
Ferrimagnetyzm,  Warszawa  1968. 


(pochłaniane),  przy  czym  stopień  tłumienia  w ciałach 
krystalicznych  zależy  od  polaryzacji  fali.  Fale  o róż- 
nej polaryzacji  rozchodząc  się  w kryształach  biegną 
z różnymi  prędkościami  w określonych  kierunkach 
krystalograficznych.  Zjawiskami  związanymi  z roz- 
chodzeniem się  światła  w kryształach  zajmuje  się  od- 
rębny dział  optyki  — zwany  optyką  kryształów ; zna- 
jomość tych  zjawisk  jest  niezbędna  dla  zrozumienia 
zjawisk  magnetooptycznych. 

Znamy  wiele  zjawisk  magnetooptycznych  wiążą-  2iaw*ska 
cych  się  z wpływem  zewnętrznego  pola  magnetycz-  magneto- 
nego  tak  na  amplitudę  drgań  fali  biegnącej  w ośrodku  optyczne 
umieszczonym  w tym  polu,  jak  i na  prędkość  rozcho- 
dzenia się  fali  o określonej  polaryzacji  w takim  ośrod- 
ku. Pierwsze  zjawisko  magnetooptyczne  odkrył 
w r.  1845  M.  Faraday,  obserwując  skręcenie  płasz- 
czyzny polaryzacji  światła  biegnącego  w szkle  w kie- 
runku równoległym  do  przyłożonego  zewnętrznego 
pola  magnetycznego.  Doświadczenia  podobne  pow- 
tarzane następnie  z innymi  materiałami,  m.in.  z ga- 
zami, doprowadziły  do  odkrycia  w r.  1896  zjawiska 
Zeemana.  Polega  ono  na  zmianach  pochłaniania  lub 
emisji  promieniowania  w badanym  materiale  pod 
wpływem  zewnętrznego  pola  magnetycznego  (roz- 
szczepienie pod  wpływem  pola  magnetycznego  linii 
emisyjnych  lub  linii  absorpcyjnych  gazu).  Te  zjawiska 
magnetooptyczne  mogły  być  opisane  i wyjaśnione 
na  podstawie  klasycznej  dynamiki  elektronu  w polu 
magnetycznym,  przy  pomocy  teorii  zjawisk  elektro- 
magnetycznych sformułowanej  przez  Maxwella  oraz 
teorii  dyspersji  rozwiniętej  przez  H.  Lorentza,  P.  Dru- 
dego,  W.  Voigta  i in.  w początkach  XX  w.  Dalszy 
istotny  postęp  w badaniach  magnetooptycznych  na- 
stąpił dopiero  w latach  pięćdziesiątych  XX  w.,  kiedy 


^ ; 


polaryzacja 

światka 


Rys.  2. 


to  badania  objęły  materiały  o właściwościach  przede 
wszystkim  półprzewodnikowych,  a następnie  mag- 
netycznych, do  interpretacji  zaś  obserwowanych  zja- 
wisk użyto  kwantowej  teorii  i wynikającego  z niej 
opisu  struktury  pasmowej  materiałów.  Od  tego  też 
czasu  magnetooptyka  stała  się  jedną  z podstawowych 
metod  badawczych  struktury  elektronowej  ciał 
stałych. 

Ponieważ  w zjawiskach  magnetooptycznych  istotną  rolę  od- 
grywa polaryzacja  światła,  przypomnijmy  pokrótce  najbardziej 


(tylko  drgania  wektorów  £).  W fali  spolaryzowanej  kołowo 
(rys.  3b)  wektor  natężenia  pola  elektrycznego  zmienia  kierunek 
wzdłuż  drogi,  po  której  się  rozchodzi  fala,  ale  jest  zawsze  pro- 
stopadły do  kierunku  rozchodzenia  się  fali;  koniec  wektora 
porusza  się  po  linii  śrubowej.  Patrząc  wzdłuż  kierunku  rozcho- 
dzenia się  fali  stwierdzamy,  że  koniec  wektora  natężenia  pola 
elektrycznego  porusza  się  po  obwodzie  kola.  Ruch  ten  może 
zachodzić  bądź  w prawo  (zgodnie  z ruchem  wskazówek  zegara), 
bądź  w lewo  (przeciwnie  do  ruchu  wskazówek  zegara).  Mówimy 
o fali  spolaryzowanej  kołowo,  w prawo  lub  w lewo.  Każdą  falę 
spolaryzowaną  liniowo  można  zastąpić  przez  dwie  fale  spolary- 
zowane kołowo  w prawo  i lewo , przy  czym  fale  te  mają  takie  same 
fazy. 


nałożenie  fal 
spola  ryzowa- 
nych liniowo 


f = const 


x = const 


Rys.  1.  Zmiany  natężenia  pola  elektrycznego  £ i magnetycznego 

H:  a)  w określonej  chwili  wzdłuż  drogi,  po  której  rozchodzi  się 
fala  i b)  w czasie  w określonym  miejscu  przestrzeni 


istotne  wiadomości  na  ten  temat.  Fala  elektromagnetyczna  pole- 
ga na  rozchodzeniu  się  periodycznych  w czasie  i przestrzeni  za- 
burzeń elektrycznych  i magnetycznych  w postaci  periodycznych 

zmian  natężenia  pola  elektrycznego  E i magnetycznego  H (wek- 


tory £ i H są  względem  siebie  prostopadłe). 

Obrazowo  falę  elektromagnetyczną  można  przedstawić  posłu- 
gując się  wykresami  natężenia  pola  elektrycznego  lub  magnetycz- 
nego bądź  w ustalonym  czasie  dla  różnych  punktów  drogi, 
wzdłuż  której  fala  się  rozchodzi,  bądź  też  w ustalonym  punkcie 
przestrzeni  w funkcji  czasu.  Wykresy  takie  w wypadku  fali  sprę- 
żystej przedstawiają  wychylenie  z położenia  równowagi  drgają- 
cych cząstek  widziane  w określonej  chwili  wzdłuż  linii  rozcho- 
dzenia się  fali  (periodyczność  fali  w przestrzeni  — przestrzenny 
obraz  fali),  bądź  też  wychylenie  wybranej  cząstki  w czasie  (perio- 
dyczność fali  w czasie  — czasowy  obraz  fali).  Aby  sobie  wyobra- 
zić zmiany  zachodzące  przy  rozchodzeniu  się  fali,  należy  nałożyć 
w wyobraźni  na  siebie  obraz  przedstawiający  zmiany  w czasie 
i obraz  zmiany  w przestrzeni.  Analogia  z falą  sprężystą  może 
być  tu  pomocna  — łatwiej  wyobrazić  sobie  wychylenia  cząstek  niż 
zmiany  pola  — należy  jednak  pamiętać,  że  jest  to  tylko  analogia. 

Fala  spolaryzowana  to  taka  fala,  w której  drgania  za- 
chodzą w sposób  uporządkowany.  Jeśli  wektor  natężenia  pola 
elektrycznego  w wiązce  światła  drga  w określonej  płaszczyźnie 
(analogia  z drganiami  cząstek  w określonej  płaszczyźnie), 
to  taką  falę  świetlną  nazywamy  falą  spolaryzowaną  liniowo 


(rys.  la,  b). 

W wyniku  nałożenia  się  dwóch  fal  o jednakowych  amplitu- 
dach, spolaryzowanych  liniowo,  których  wektory  elektryczne 
drgają  w płaszczyznach  wzajemnie  prostopadłych,  otrzymamy 
falę  spolaryzowaną  liniowo,  kołowo  lub  eliptycznie,  w zależności 
od  różnicy  faz  <5  obydwóch  fal.  Jeśli  różnica  faz  wynosi  0,  n, 
2 n, ...  (wielokrotność  n),  wówczas  fala  wypadkowa  jest  falą  spola- 
ryzowaną liniowo,  przy  czym  drgania  odbywają  się  w płaszczyź- 
nie tworzącej  kąt  +45°  lub  -45°  z płaszczyznami  drgania  fal 
składowych.  Jeśli  różnica  faz  wynosi  •••  (nieparzysta  wie- 

lokrotność a/2),  wówczas  fala  jest  spolaryzowana  kołowo.  Przy 
pozostałych  różnicach  faz  mamy  falę  spolaryzowaną  eliptycznie. 
Sytuację  przedstawia  poglądowo  rys.  2,  a obraz  fali  wypadkowej 
spolaryzowanej  liniowo,  kołowo  i eliptycznie  — rys.  3abc 


Rys.  3.  Fale  wypadkowe  powstałe  z nałożenia  dwóch  fa!  (o  wek- 
torach £x  i £2)  spolaryzowanych  liniowo:  a)  fala  spolaryzowana 
liniowo,  b)  fala  spolaryzowana  kołowo,  c)  fala  spolaryzowana 
eliptycznie 


Zjawiska  magnetooptyczne  obserwowane  są  przy  konfiguracja 
określonym  kierunku  rozchodzenia  się  energii  roz-  Faradaya 
patrywanej  fali  w stosunku  do  kierunku  pola  magne-  i Voigta 
tycznego.  Rozróżniamy  dwie  zasadnicze  konfigu- 
racje: kierunek  rozchodzenia  się  energii  i kierunek 
pola  magnetycznego  są  do  siebie  równoległe  (konfi- 
guracja Faradaya,  rys.  4a)  albo  kierunek  rozchodze- 
nia się  energii  i kierunek  pola  magnetycznego  są  do 
siebie  wzajemnie  prostopadle  (konfiguracja  Yoigta, 
rys.  4b). 
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np  fal  spolaryzowa- 


Rys.  4.  Schemat  układu  do  obserwacji  zjawisk  magnetooptycz- 
nych: a)  konfiguracja  Faradaya,  b)  konfiguracja  Yoigta 


Zjawisko  Faradaya 

Zjawisko  Faradaya  polega  na  skręceniu  płaszczyzny 
polaryzacji  światła  spolaryzowanego  liniowo,  bieg- 
nącego w substancji  umieszczonej  w silnym  polu  mag- 
netycznym, przy  czym  światło  biegnie  wzdłuż  linii  sił 
pola  magnetycznego  (rys.  5).  Kąt  skręcenia  płasz- 
czyzny polaryzacji  0 jest  proporcjonalny  do  długości 
drogi  /,  którą  światło  przebiega  w ośrodku  skręcają- 
cym, znajdującym  się  w polu  magnetycznym,  oraz  do 
natężenia  pola  magnetycznego  H: 

0 = kłH. 

Współczynnik  k (stała  Verdeta)  charakteryzuje  zdol- 
ność danej  substancji  do  skręcania  płaszczyzny  po- 
laryzacji w polu  magnetycznym.  W materiałach  mag- 
netycznych występują  silne  pola  wewnętrzne,  które 
są  tylko  porządkowane  przez  pola  zewnętrzne  — kąt 
skręcenia  zależy  w tym  wypadku  głównie  od  stopnia 
namagnesowania  ciała  badanego  a nie  od  pola  ze- 
wnętrznego. 

Skręcenie  płaszczyzny  polaryzacji  wyjaśniamy  w 
sposób  następujący:  kołowo  spolaryzowane  fale  (na 
które  można  rozłożyć  falę  spolaryzowaną  liniowo) 
biegną  w ośrodku  z różnymi  prędkościami,  wskutek 
czego  po  wyjściu  z ośrodka  pojawia  się  między  nimi 
pewna  różnica  faz,  zależna  od  drogi,  jaką  światło 
przebyło  w rozpatrywanym  ośrodku,  oraz  od  różnicy 


magnes  nadprzewodnikowy 


Rys.  5.  Schemat  układu  pozwalającego  obserwować  zjawisko 
Faradaya 
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Rys.  6. 

spolaryzowanych  kołowo  po  wyjściu  z ośrodka  otrzy- 
mujemy drgania  liniowe  OC'.  Fala  spolaryzowana  li- 
niowo przy  wejściu  do  ośrodka,  w której  wektor  elek- 
tryczny drgał  wzdłuż  OC  doznała  skręcenia  płasz- 
czyzny polaryzacji  o kąt  d.  Jeśli  skręcenie  płaszczyzny 
polaryzacji  (widziane  od  strony  obserwatora,  do  któ- 
rego oka  wpada  światło)  jest  zgodne  z ruchem  wska- 
zówek zegara,  to  przypadek  taki  nazywamy  skręce- 
niem prawoskrętnym  lub  dodatnim.  Kierunek  skrę- 
cenia płaszczyzny  polaryzacji  jest  taki  sam  jak  kieru- 
nek obrotów  szybszej  z dwóch  kołowo  spolaryzowa- 
nych składowych.  Różnica  faz  S obu  fal  równa  jest 
26.  Można  ją  wyrazić  przez  różnicę  współczynników 
załamania  obu  fal: 

C 2nl ( v 

*0 

gdzie  ż0  jest  długością  fali  w próżni.  Tak  więc 
_ ni 

0 = —(ni-np). 

Zjawisko  Faradaya  tłumaczy  się  wpływem  pola 
magnetycznego  na  prędkość  rozchodzenia  się  fali  spo- 
laryzowanej kołowo  w prawo  i w lewo  w danym 
ośrodku.  Wielkość  skręcenia  magnetycznego  zależy 
od  długości  fali,  a więc  wykazuje  dyspersję. 

Zjawisko  magnetycznego  skręcenia  płaszczyzny  po- 
laryzacji wywołane  jest  precesją,  jaką  wykonują  elek- 
trony swobodne  oraz  elektrony  wchodzące  w skład 
atomów  i cząsteczek  substancji  pod  wpływem  ze- 
wnętrznego pola  magnetycznego.  W rezultacie  takiej 
precesji  współczynniki  załamania  (prędkości)  promie- 
ni światła  spolaryzowanych  kołowo  w prawo  i w lewo 
przyjmują  różną  wartość.  Opis  teoretyczny  zjawiska 
Faradaya  zależy  od  tego,  czy  mamy  do  czynienia  ze 
swobodnymi  nośnikami  prądu  (np.  w półprzewodni- 
kach), czy  też  z nośnikami  związanymi.  W pierwszym 
wypadku  mówimy  o wewnątrzpasmowym  zjawisku 
Faradaya,  w wypadku  drugim  — o zjawisku  Fara- 
daya międzypasmowym. 

Magnetyczne  skręcenie  płaszczyzny  polaryzacji  po- 
jawia się  w bardzo  krótkim  czasie  po  wytworzeniu 
pola  magnetycznego  (rzędu  10~9  s)  i równie  szybko 
zanika  po  usunięciu  pola  magnetycznego.  Obserwacje 
tego  zjawiska  prowadzi  się  w konfiguracji  Faradaya, 
w obszarach  widmowych,  dla  których  ośrodek  jest 
przezroczysty.  W zależności  od  materiału  obserwuje 
się  je  głównie  w podczerwieni  lub  obszarze  widzial- 
nym widma  promieniowania  elektromagnetycznego. 


dyspersja 

skręcenia 

magnetycz- 

nego 


Zjawisko  Voigta  (Cottona-Moutona) 

Światło,  przechodząc  przez  ośrodek  umieszczony 
w zewnętrznym  polu  magnetycznym  o kierunku  linii 
sił  prostopadłym  do  kierunku  rozchodzenia  się  świa- 
magnetyczna  tła,  doznaje  podwójnego  załamania.  Takie  magae- 
dwójłomność  tyczne  podwójne  załamanie  (magnetyczna  dwójłom- 
ność),  obserwowane  w parach  i gazach  zostało  naz- 
wane zjawiskiem  Voigta,  a identyczne  zjawisko  ob- 
serwowane w cieczach  — zjawiskiem  Cottona-Mou- 
tona. Obecnie  największe  znaczenie  ma  badanie  tego 
zjawiska  w ciałach  stałych,  zwłaszcza  w półprzewod- 
nikach i magnetykach.  Najczęściej  nazywamy  je 
w tych  materiałach  zjawiskiem  Voigta.  Zjawisko  mag- 
netycznego podwójnego  załamania  w parach  i ga- 
zach ujawnia  się  dla  światła  o częstości  bliskiej  linii 
pochłaniania.  Opisowe  wyjaśnienie  tego  zjawiska  jest 
następujące.  Współczynniki  załamania  fal  liniowo 
spolaryzowanych  o polaryzacji  równoległej  do  kie- 
runku pola  magnetycznego  i prostopadłej  do  tego 
kierunku  stają  się  pod  wpływem  pola  magnetycznego 
różne.  (Fala  spolaryzowana  prostopadle  i równolegle 
do  kierunku  pola  magnetycznego  rozchodzi  się  z róż- 
► ną  prędkością.)  W gazach  różnica  współczynników 

załamania  #i||  — n±  jest  bardzo  mała.  Po  przejściu 
w badanym  ośrodku  drogi  / obie  fale  zyskują  pewną 
różnicę  faz,  co  prowadzi  do  tego,  że  fala  początkowo 
liniowo  spolaryzowana,  po  wyjściu  z ośrodka  staje 
się  falą  spolaryzowaną  na  ogół  eliptycznie.  Podobnie 
ciecze  pierwotnie  optycznie  izotropowe  stają  się  pod 
wpływem  pola  magnetycznego  dwójłomne,  przy  czym 
zachowują  się  jak  kryształy'  jednoosiowe  o osi  op- 
tycznej równoległej  do  pola  magnetycznego.  Róż- 
nice współczynników  załamania  fali  spolaryzowanej 
równolegle  i prostopadle  do  pola  magnetycznego  są 
znacznie  większe,  a fala  po  przejściu  drogi  w oma- 
wianym ośrodku  zyskuje  znacznie  większą  różnicę 
faz  aniżeli  w gazach.  Tak  więc  po  wyjściu  z ośrodka 
może  być  ona  spolaryzowana  eliptycznie,  kołowo  lub 
liniowo  w zależności  od  uzyskanej  przez  obie  fale 
różnicy  faz.  Schemat  układu  do  obserwacji  zjawiska 
Voigta  przedstawia  rys.  7.  Światło  przechodzi  przez 
polaryzator  dający  falę  liniowo  spolaryzowaną,  przy 


czym  drgania  zachodzą  w płaszczyźnie  tworzącej  kąt 
45°  z kierunkiem  zewnętrznego  pola  magnetycznego 

H.  Następnie  światło  pada  na  badany  ośrodek  umiesz- 
czony w polu  magnetycznym  o kierunku  prostopa- 
dłym do  kierunku  rozchodzenia  się  światła.  W ośrodku 
falę  rozłożyć  można  na  dwie,  z których  jedna  jest  spo- 
laryzowana równolegle,  a druga  — prostopadle  do 
kierunku  pola  magnetycznego.  Obie  te  fale  rozchodzą 
się  w badanym  ośrodku  z różną  prędkością,  co  pro- 
wadzi do  powstania  różnicy  faz  i fala  po  wyjściu 
z ośrodka  ma  polary  zację,  którą  badać  można  za  po- 
mocą analizatora. 

zjawisko  W kryształach  sytuacja  jest  bardziej  skompliko- 
Voigta  wana,  ponieważ  charakter  magnetycznego  podwój- 
wkryszta-  nego  załamania  zależy  od  tego,  jak  przyłożone  jest 
łach  pole  magnetyczne  w stosunku  do  osi  krystalograficz- 
nych kryształu.  W kryształach  regularnych,  gdy  pole 
magnetyczne  przyłożone  jest  równolegle  do  głównej 
osi  krystalograficznej,  obserwujemy  podwójne  zała- 


manie, jak  w kryształach  jednoosiowych.  Przy  innych 
orientacjach  pola  magnetycznego  kryształ  może  za- 
chowywać się  jak  kryształ  dwuosiowy.  Jeśli  kryształ 
jest  anizotropowy  i wykazuje  już  naturalną  dwójłom- 
ność,  zjawisko  magnetycznej  dwójłomności  nakłada 
się  na  tę  dwójłomność  naturalną. 

Różnica  faz  obserwowana  w zjawisku  Voigta  jest 
proporcjonalna  do  długości  drogi,  którą  przebiega 
światło  w ośrodku  i do  kwadratu  natężenia  pola  mag- 
netycznego. Zależy  również  od  długości  fali  promie- 
niowania, efekt  ten  bowiem,  podobnie  jak  efekt  Fa- 
radaya, wykazuje  dyspersję.  Obserwuje  się  to  zjawi- 
sko w obszarach  widmowych,  dla  których  ośrodek 
badany  jest  przezroczysty. 

Podkreślić  należy,  że  działanie  pola  magnetycznego 
wywołuje  jednocześnie  pojawienie  się  zjawiska  skrę- 
cenia płaszczyzny  polaryzacji,  gdy  światło  biegnie 
w kierunku  pola  magnetycznego  (efekt  Faradaya) 
i dwójłomności  magnetycznej,  gdy  światło  biegnie 
prostopadle  do  pola.  Czyniąc  obserwacje  w kierunku 
pola  magnetycznego  stwierdzamy  pojawienie  się  efektu 
Faradaya;  gdy  kierunek  obserwacji  staje  się  coraz 
bardziej  zbliżony  do  prostopadłego  do  pola  magnetycz- 
nego, coraz  większą  rolę  odgrywa  dwójłomność  wy- 
wołana polem  magnetycznym.  W specjalnych  sytu- 
acjach możemy  pominąć  jeden  z efektów  i brać  pod 
uwagę  tylko  drugi.  Ogólnie  rzecz  biorąc,  gdy  nie  moż- 
na pominąć  jednego  ze  zjawisk,  efektywna  różnica 
faz  wynika  z nałożenia  się  obu  zjawisk. 

Właściwości  optyczne  materiału  charakteryzuje 
tensor  przenikalności  elektrycznej.  Przyłożenie  pola 
magnetycznego  modyfikuje  ten  tensor., Tensor  prze- 
nikalności elektrycznej  przedstawić  można  za  pomocą 
tensora  symetrycznego  i parzystego  ze  względu  na 
natężenie  pola  magnetycznego  — odpowiedzialnego 
za  dwójłomność  magnetyczną,  oraz  tensora  antysy- 
metrycznego  i nieparzystego  ze  względu  na  natężenie 
pola  magnetycznego  — odpowiedzialnego  za  skręce- 
nie płaszczyzny  polaryzacji.  Stąd  wynika  różna  za- 
leżność obu  efektów  od  natężenia  pola  magnetycznego. 
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Zjawisko  Zeemana 

Zjawisko  Zeemana  polega  na  rozszczepieniu  linii  wid- 
mowych w polu  magnetycznym.  W r.  1896  P.  Zeeman 
zauważył,  że  gdy  świecące  pary  sodu  (płomień  sodo- 
wy) umieści  się  w silnym  polu  magnetycznym,  wów- 
czas żółte  linie  widmowe,  charakterystyczne  dla  świe- 
cących par  sodu,  ulegają  znacznemu  poszerzeniu. 
Dalsze  badania  prowadzone  przy  użyciu  przyrządów 
o dużej  zdolności  rozszczepiającej  wykazały,  że  linie 
rozszczepiają  się  w polu  magnetycznym  na  szereg 
składowych.  Schemat  urządzenia  do  badania  efektu 


Rys.  8.  Schemat  układu  do  badania  zjawiska  Zeemana 
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Zeemana  przedstawia  rys.  8.  Źródło  światła  umiesz- 
czone jest  w polu  magnetycznym  wytworzonym  za 
pomocą  elektromagnesu.  Obserwujemy  widmo  pro- 
mieniowania wysyłanego  bądź  w kierunku  prostopad- 
zjawisko  łym  do  linii  sił  pola  magnetycznego,  bądź  w kierunku 
Zeemana  równoległym  do  linii  sił.  Liczba  składowych  i rodzaj 
normalne  ich  polaryzacji  zależy  od  kierunku  obserwacji.  W kie- 
runku prostopadłym  do  linii  sił  pola  magnetycznego 
obserwujemy  rozszczepienie  na  trzy  linie,  przy  czym 
są  one  spolaryzowane  liniowo.  W kierunku  równoleg- 
łym do  pola  magnetycznego  obserwujemy  rozszcze- 
pienie na  dwie  linie,  przy  czym  składowe  są  spolary- 
zowane kołowo  w kierunkach  przeciwnych.  Opisane 
rozszczepienie  nazywamy  normalnym.  Zarówno  ro- 
dzaj rozszczepienia,  jak  i rodzaj  polaryzacji  można 
wyjaśnić  na  gruncie  klasycznej  teorii  elektronów, 
zjawisko  Często  jednak  występuje  rozszczepienie  na  większą 
Zeemana  liczbę  składowych.  Tego  rodzaju  zjawisko  nosi  nazwę 
anomalne  anomalnego  zjawiska  Zeemana.  Wytłumaczenie  ano- 
malnego zjawiska  Zeemana  możliwe  jest  tylko  na 
gruncie  teorii  kwantowej.  Zjawisko  rozszczepienia 
linii  widmowych  pod  wpływem  pola  magnetycznego 
obserwujemy  również  w widmie  pochłaniania,  gdy 
ośrodek  pochłaniający  światło  umieszczony  jest  w po- 
lu magnetycznym.  Czasami  zjawisko  to  nazywamy 
odwróconym  zjawiskiem  Zeemana. 

W ciele  stałym  występuje  zjawisko  analogiczne  do 
rozszczepienia  Zeemana  — rozszczepienie  poziomów 
energetycznych  pasm  (-»  Struktura  elektronowa  ciał 
stałych)  w zewnętrznym  polu  magnetycznym  (tzw. 
poziomy  Landaua).  Przejścia  pomiędzy  poziomami 
Landaua  pasm  walencyjnych  i pasma  przewodnictwa 
odpowiedzialne  są  za  obserwowane  maksima  pochła- 
niania w pobliżu  krawędzi  absorpcji. 

W ciałach  stałych  zarówno  w półprzewodnikach 
jak  i magnetykach  istotne  znaczenie  mają  domieszki. 
Przejścia  pomiędzy  poziomami  domieszek,  a także 
pomiędzy  poziomami  domieszek  i poziomami  pasm 
prowadzą  do  pojawienia  się  określonych  linii  lub 
pasm  pochłaniania,  szczególnie  w niskich  temperatu- 
rach. Obserwujemy  również  w niskich  temperaturach 
bogate  widma  luminescencji  zw-iązane  z przejściami 
pomiędzy  takimi  poziomami.  W polu  magnetycznym 
pojawia  się  rozszczepienie  tych  linii,  co  również  można 
uznać  za  odmianę  efektu  Zeemana  w ciałach  stałych. 
W celu  wyjaśnienia  wszystkich  tych  zjawisk  konieczny 
jest  opis  kwantowy. 

związek  Pomiędzy  zjawiskiem  Faradaya  i Voigta  a zjawi- 
między  skiem  Zeemana  istnieje  ścisły  związek,  wynikający 
zjawiskiem  z relacji  dyspersyjnych,  wiążących  ze  sobą  zmiany 
Faradaya  współczynnika  załamania  w funkcji  długości  fali  ze 
i zjawiskiem  zmianami  pochłaniania  wraz  z długością  fali.  Innymi 
Zeemana  słowy,  znając  widmo  pochłaniania  w całym  zakresie 
widmowym,  a więc  w zasadzie  dla  częstości  od  zera  do 
nieskończoności,  możemy  (korzystając  z zależności 
dyspersyjnych)  obliczyć  wartość  współczynnika  za- 
łamania dla  dowolnych  częstości  promieniowania. 
W praktyce  procedurę  opisaną  stosować  możemy 
przy  określonych  ograniczeniach  dla  znacznie  węż- 
szego obszaru  widmowego.  Rozpatrzmy  najprostszą 
sytuację  — pojedynczą  linię  widmową.  Bez  pola  ma- 
gnetycznego występuje  pojedyncza  linia  pochłaniania 
przy  częstości  v0  związana  z przejściem  pomiędzy 
określonymi  poziomami  w atomie  (rys.  9a).  W polu 
magnetycznym,  przy  obserwacji  w konfiguracji  Fa- 
radaya, linia  ta  rozszczepia  się  na  dwie  o częstościach 
i v2,  przy  czym  jedna  spolaryzowana  jest  kołowo 
w prawo,  a druga  — w lewo  (rys.  9b).  Z każdą  linią 
pochłaniania  zgodnie  z relacją  dyspersyjną  związane 
są  zmiany  współczynnika  załamania  m dla  linii  vx  i np 
dla  linii  v2  (rys.  9c).  Z różnicą  współczynników  zała- 
mania m—nv  wiąże  się,  jak  wiemy,  kąt  skręcenia 
płaszczyzny  polaryzacji  0 (rys.  9d).  Przykład  ten  wy- 
raźnie wskazuje,  że  rozszczepienie  linii  widmowych 
w polu  magnetycznym  (efekt  Zeemana)  prowadzi 
jednocześnie  do  pojawienia  się  — dla  światła  o dłu- 
gości fali  w pobliżu  linii  pochłaniania  — skręcenia 
płaszczyzny  polaryzacji,  a więc  do  efektu  Faradaya. 
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W zupełnie  analogiczny  sposób  znajdziemy  związek 
między  zjawiskiem  Zeemana  a zjawiskiem  Yoigta. 

W ciałach  stałych,  szczególnie  w półprzewodnikach, 
obserwuje  się,  poza  omówionymi,  wiele  zjawisk  mag- 
netooptycznych charakterystycznych  dla  tych  materia- 
łów. Zwróćmy  uwagę  na  dwa  spośród  nich. 


Rys.  9.  Zależność  od  częstości:  a)  pochłaniania  bez  pola  magne- 
tycznego, b)  pochłaniania  w polu  magnetycznym  (obserwacja 
w konfiguracji  Faradaya),  c)  współczynników  załamania  fali 
spolaryzowanej  kołowo  w prawo  i w lewo,  d)  kąta  skręcenia 
płaszczyzny  polaryzacji  9 (lub  różnicy  współczynników  m—np) 

Rezonans  cyklotronowy  polega  na  absorpcji  pro-  rezonans 
mieniowania  elektromagnetycznego  (z  obszaru  mikro-  cyklotronowy 
fal  lub  podczerwieni)  przez  elektrony  lub  dziury  znaj- 
dujące się  w półprzewodniku,  gdy  jest  on  umieszczony 
w polu  magnetycznym. 

Według  wyobrażeń  teorii  elektronowej,  poruszające 
się  ładunki  przebiegają  określoną  drogę  między  akta- 
mi kolejnych  zderzeń.  W polu  magnetycznym  ładunki 
zakreślają  tory  będące  odcinkami  obwodów  kół  le- 
żących w płaszczyźnie  prostopadłej  do  kierunku  pola 
magnetycznego,  przy  czym  tym  większą  część  obwodu 
koła  zakreśla  ładunek,  im  rzadziej  doznaje  rozprosze- 
nia. Częstość  kołowa,  z jaką  poruszają  się  w polu  mag- 
netycznym ładunki  — tzw.  częstość  cyklotronowa 
o)c  zależy  od  natężenia  pola  magnetycznego,  od  masy, 
jaką  należy  przypisać  ładunkom,  oraz  od  wielkości 
ładunku  (dla  dziur  i elektronów  będzie  to  ładunek 
elementarny  e odpowiednio  ze  znakiem  + lub  — ): 

<oc= He/cm* 

(m*  — masa  efektywna). 


wyznaczanie  W półprzewodnikach  zarówno  dziurom  jak  i elek- 
masy  tronom  przypisać  należy  masę  efektywną  w*  lub  m* 
efektywnej  różną  od  masy  swobodnego  elektronu  i charaktery- 
styczną dla  danego  półprzewodnika  (->  Dynamika 
elektronu  w ciałach  stałych).  Kierunek  ruchu  po  ob- 
wodzie koła  dziur  i elektronów  jest  oczywiście  prze- 
ciwny. Jeśli  na  półprzewodnik  znajdujący  się  w polu 
magnetycznym  pada  promieniowanie  elektromagne- 
tyczne spolaryzowane  kołowo  (fala  mikrofalowa  lub 
podczerwona),  to  gdy  częstość  tego  promieniowania 
zbliża  się  do  częstości  cyklotronowej,  pochłanianie  fali 
elektromagnetycznej  gwałtownie  rośnie.  Maksymalne 
pochłanianie  zachodzi  w warunkach  rezonansu,  gdy 
częstość  fali  elektromagnetycznej  jest  równa  częstości 
cyklotronowej.  Tak  więc  mierząc  pochłanianie  przy 
różnych  częstościach  padającego  promieniowania  mo- 
żemy wyznaczyć  częstość  cyklotronową,  a następnie 
obliczyć  (znając  natężenie  pola  magnetycznego)  masę 
efektywną  nośników.  Co  więcej,  wiedząc,  jakie  pro- 
mieniowanie jest  pochłaniane:  o polaryzacji  prawo- 
skrętnej  czy  lewoskrętnej,  możemy  ustalić,  czy  za 
pochłanianie  odpowiedzialne  są  nośniki  dodatnie 
(dziury)  czy  ujemne  (elektrony).  Efekt  cyklotronowy 
obserwować  można  jednak  tylko  w stosunkowo  czy- 
stych (odznaczających  się  małą  koncentracją  nośni- 
ków) półprzewodnikach  i w dostatecznie  niskich 
temperaturach. 

odbicie  W półprzewodnikach  o dużej  koncentracji  nośni- 
magneto-  ków  obserwujemy  zjawisko  odbicia  magnetoplazmo- 
plazmowe  wego.  Promieniowanie  elektromagnetyczne  z obszaru 
podczerwieni  jest  wówczas  pochłaniane  przez  nośniki 
swobodne.  Współczynnik  odbicia  przechodzi  przez 
wyraźne  minimum,  po  czym  szybko  wzrasta  tworząc 
tzw.  krawędź  plazmową.  Położenie  minimum  odbicia 
zależy  od  koncentracji  nośników,  a także  takich  pa- 
rametrów półprzewodnika  jak  masa  efektywna.  W po- 


Rys.  10.  Rozszczepienie  krawędzi  plazmowej  arsenku  indu  w polu 
magnetycznym 

lu  magnetycznym  minimum  to  ulega  rozszczepieniu 
na  dwa  (rys.  10).  Odległość  między  minimami  równa 
jest  częstości  cyklotronowej.  Mierząc  tę  odległość 
natychmiast  wyznaczamy  masę  efektywną.  Jest  to 
bardzo  cenna  metoda  wyznaczania  masy  efektywnej 
w silnie  domieszkowanym  materiale. 


Zastosowanie  zjawisk 
magnetooptycznych 
w materiałach  magnetycznych 

W materiałach  magnetycznych  zjawiska  magnetoop- 
tyczne pozwalają  na  obserwacje  i badanie  rozkładu 
przestrzennego  namagnesowania  w kryształach.  Jak 
wiadomo  w kryształach  takich  występują  domeny, 
przy  czym  w obszarze  domeny  namagnesowanie  ma 
określoną  wartość  i kierunek.  Postaramy  się  obecnie 
pokrótce  wyjaśnić,  jak  wykorzystując  omawiane  po- 


wyżej zjawiska  magnetooptyczne,  można  wyodrębnić 
poszczególne  domeny  w krysztale. 

Wyobraźmy  sobie  płytkę  krystaliczną  zawierającą  badanie 
szereg  obszarów,  w których  wektor  namagnesowania  domen 
jest  różnie  zorientowany  w stosunku  do  powierzchni 
płytki.  Rozważamy  tylko  najprostsze  wypadki,  gdy 
wektor  ten  jest  bądź  prostopadły  do  powierzchni  płyt- 
ki bądź  do  niej  równoległy.  Umieśćmy  taką  płytkę 
między  skrzyżowanymi  polaryzatorem  i analizato- 
rem, tak  jak  na  rys.  11.  W obszarach  A i B wektory 
namagnesowania  są  prostopadłe  do  powierzchni 
płytki,  lecz  przeciwnie  skierowane,  w obszarach  C i D 


Rys.  11.  Schemat  doświadczenia  umożliwiającego  badanie  domen 
w krysztale  magnetycznym 

wektory  te  leżą  w płaszczyźnie  płytki,  przy  czym  w ob- 
szarze C wektor  namagnesowania  jest  równoległy  do 
kierunku  drgań  wektora  elektrycznego  fali  świetlnej 
przechodzącej  przez  polaryzator.  W obszarze  A wek- 
tor namagnesowania  skierowany  jest  zgodnie  z kie- 
runkiem rozchodzenia  się  światła  i w takim  razie 
płaszczyzna  polaryzacji  światła  przechodzącego  przez 
ten  obszar  płytki  ulegnie  skręceniu  o kąt  +6.  W ob- 
szarze B wektor  namagnesowania  skierowany  jest 
przeciwnie  do  kierunku  rozchodzenia  się  światła 
i w tym  obszarze  płaszczyzna  polaryzacji  ulegnie  skrę- 
ceniu o kąt  — 0.  Światło  rozchodzące  się  w obszarze 
C drga  zgodnie  z kierunkiem  namagnesowania,  nie 
obserwujemy  tu  zatem  ani  skręcenia  płaszczyzny  po- 
laryzacji jak  w obszarach  A i B (efekt  Faradaya)  ani 
magnetycznej  dwójłomności.  W obszarze  Z),  aczkol- 
wiek wektor  namagnesowania  jest  prostopadły  do 
kierunku  rozchodzenia  się  światła  i nie  powoduje  skrę- 
cenia płaszczyzny  polaryzacji,  to  jednak  w odróżnie- 
niu od  obszaru  C tworzy  pewien  kąt  z kierunkiem 
drgań  wektora  elektrycznego  fali  świetlnej  i dzięki 
temu  w obszarze  tym  będziemy  mieli  do  czynienia 
z dwójłomnością  magnetyczną. 

Jeśli  więc  obserwujemy  płytkę  przez  skrzyżowany 
z polaryzatorem  analizator,  gdy  analizator  skręcony 
jest  od  pozycji  skrzyżowanej  dodatkowo  o kąt  4-0, 
0,  —0,  to  obszary  A , B,  C i D uwidocznią  się  jako 
obszary  o różnej  jasności  (rys.  12).  Gdy  analizator 
skręcony  jest  o kąt  4-0,  obszar  A jest  ciemny  --  skrę- 
ca on  bowiem  o taki  kąt  płaszczyznę  polaryzacji,  ob- 
szar B jest  jasny,  a obszary  C i D wykazują  oświetle- 
nie pośrednie.  Gdy  analizator  skręcony  jest  o kąt 
—0,  analogicznie  obszar  B jest  ciemny,  a obszar  A — 
jasny.  Gdy  analizator  ustawiony  jest  pod  kątem  0 — 
obszar  C jest  ciemny,  obszary  A i B są  jednakowa 
rozjaśnione,  natomiast  w obszarze  D (ze  względu  na 
dwójłomność  magnetyczną)  stopień  rozjaśnienia  (przy 
obserwacji  w świetle  białym  także  zabarwienie)  za- 
leży od  grubości  płytki  i od  kąta  między  wektorem 
namagnesowania  w tym  obszarze,  a kierunkiem  drgań 
światła  wychodzącego  z polaiyzatora. 

Obserwacje  omówione  powyżej  łatwo  przeprowa- 
dzić za  pomocą  mikroskopu  polaryzacyjnego.  Pamię- 
tać jednak  należy,  że  także  naprężenia  prowadzą  do 
pojawienia  się  dwójłomności  w kryształach,  a zatem 
naprężenia  występujące  ewentualnie  w kryształach 
mogą  w istotny  sposób  zniekształcać  obserwowany 
obraz. 


-e 


Rys.  12. 
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Zjawiska  magnetooptyczne  w materiałach  magne- 
tycznych wykorzystywane  są  szeroko  przy  budowie 
różnego  typu  urządzeń.  Omówimy  kilka  z nich. 
rotator  Rotator  (rys.  1 3)  — przyrząd  obracający  płaszczyz- 
nę polaryzacji  światła  spolaryzowanego  liniowo  o okre- 
ślony kąt.  Wektor  namagnesowania  kryształu  jest 
równoległy  do  kierunku  rozchodzenia  się  światła  (lub 
ma  różną  od  zera  składową  namagnesowania  w kie- 
runku rozchodzenia  się  światła).  Długość  kryształu 
dobiera  się  tak,  aby  przy  określonej  długości  fali  płasz- 
czyzna polaryzacji  skręcana  była  o wymagany  kąt. 


polaryzator 


przezroczysty  kryształ 


Rys.  1 3.  Rotator 


izolator  Izolator  (lub  wentyl,  rys.  14)  — urządzenie,  w któ- 
rym światło  może  przechodzić  w jednym  kierunku. 
Kryształ  skręca  płaszczyznę  polaryzacji  o kąt  45°; 
analizator  jest  skręcony  względem  polaryzatora  o kąt 
45°.  Światło  przechodzi  z lewa  na  prawo,  nie  prze- 
chodzi natomiast  z prawa  na  lewo. 


polaryzator  analizator 


modulator  Modulator  (rys.  15)  — przyrząd  zmieniający  ampli- 
tudę przechodzącego  światła  za  pomocą  sterującego 
go  sygnału.  Zewnętrzne  pole  magnetyczne  solenoidu, 
zasilanego  sygnałem  sterującym  modulator,  może 


zmieniać  wektor  namagnesowaniarM  kryształu.  Zmia- 
na namagnesowania  powoduje  zmianę  skręcenia 
płaszczyzny  polaryzacji,  analizator  przepuszcza  więc 
falę  o zmiennym  — modulowanym  natężeniu. 

Przesuwnik  fazy  (rys.  16)  — przyrząd  zmieniający  przesuwnik 
fazę  fali  wychodzącej.  Spolaryzowane  liniowo  światło  fazy 
wychodzące  z polaryzatora  jest  w ćwierćfalówce 
(płytce  krystalicznej  dającej  różnicę  faz  między  pro- 
mieniem zwyczajnym  i nadzwyczajnym,  odpowiada- 
jącą Ź/4;A — długość  fali)  przekształcane  na  światło 
spolaryzowane  kołowo.  Wchodzi  ono  następnie  do 
kryształu.  Zmiana  wektora  namagnesowania  kryształu 
powoduje  zmianę  współczynnika  załamania  fali  spo- 
laryzowanej kołowo,  a zatem  — długości  drogi 
optycznej  światła  w krysztale.  Po  wyjściu  z kryształu 
światło  spolaryzowane  kołowo  może  być  zamienione 
na  światło  spolaryzowane  liniowo  przez  drugą  ćwierć- 


falówkę.  Po  wyjściu  z ćwierćfalówki  faza  liniowo  spo- 
laryzowanej fali  zależy  od  wartości  wektora  namagne- 
sowania kryształu  i może  być  zmieniana  sygnałem 
doprowadzonym  do  solenoidu. 

Domeny  cylindryczne,  I Szkoła  Zimowa  „Nowe  Materiały 
Magnetyczne”,  Warszawa  1976;  J.  F.  Dtllon  Magnet  ooptical 
properties  of  magnetic  cristals  w Magnetic  Properties  of  Mate- 
rials, New  York  1971;  L.  Landau,  E.  Lifszic  Elektrodynamika 
ośrodków  ciągłych,  Warszawa  1960;  J.  F.  Nye  Własności  fizyczne 
kryształów  w ujęciu  tensorowym  i macierzowym.  Warszawa  1962. 


Pamięć  magnetyczna 

Henryk  Lachowicz 


Pamięć  magnetyczna,  podobnie  jak  i pamięci,  w któ- 
rych wykorzystuje  się  inne  niż  magnetyczne  zjawiska 
fizyczne,  np.  nadprzewodnictwo  lub  zjawisko  piezo- 
elektryczne, jest  urządzeniem  zdolnym  do  przyjmowa- 
nia informacji,  ich  przechowywania  oraz  udostępnia- 
nia i odtwarzania  w postaci  nie  zmienionej.  Pamięć 
magnetyczna  jest  najstarszą  formą  pamięci  na  Ziemi 
(starszą  niż  pamięć  gatunku  homo  sapiens ),  choć  świa- 
domość tego  człowiek  posiadł  bardzo  niedawno,  bo 
dopiero  w dwudziestym  stuleciu.  Wynikła  ona  z ba- 
dań geofizycznych,  zwłaszcza  zaś  z badań  zachowania 
się  magnetycznego  pola  ziemskiego  w pradziejach 
naszego  globu.  Informacje  o tym  polu  uzyskuje  się  na 
podstawie  pomiarów  paleomagnetycznych.  Okazuje 
się  bowiem,  że  stygnące  skały  magmowe  jak  również 
skały  osadowe  ze  względu  na  to,  że  zawierają  w sobie 
minerały  ferromagnetyczne,  magnesowały  się  trwale 
pomiary  w czasie  stygnięcia  lub  osadzania  w taki  sposób,  że  ich 
paleomagne-  namagnesowanie  przyjmowało  kierunek  zgodny  z ak- 
tyczne  tualnie  istniejącym  magnetycznym  polem  ziemskim 


oraz  wartość  proporcjonalną  do  wartości  tego  pola. 
Dzięki  temu  zjawisku,  pomiary  namagnesowania  pró- 
bek skalnych  pozwalają  wnioskować  o wartości  i kie- 
runku ziemskiego  pola  magnetycznego  w dalekiej 
przeszłości  geologicznej.  Właśnie  na  tej  podstawie 
odkryto  doniosłe,  o dużych  konsekwencjach,  zjawisko 
zmiany  biegunowości  tego  pola,  które  wystąpiło  po 
raz  ostatni  700  tys.  lat  temu.  Ta  liczba  doskonale 
unaocznia  wielką  trwałość  pamięci  magnetycznej. 


Pamięć  dźwięku  i obrazu 

Historia  współczesnych  pamięci  magnetycznych  za- 
czyna się  dopiero  w końcu  ubiegłego  wieku,  kiedy  to 
O.  Smith  (1880  r.)  wykorzystał  do  zapisu  magnetycz- 
nego stalowy  drut,  co  znalazło  powszechniejsze  zasto- 
sowanie przeszło  pięćdziesiąt  lat  później,  w radiofonii. 

W pamięciach  tych  wykorzystywane  jest  w zasadzie 
to  samo  zjawisko,  które  od  miliardów  lat  utrwala  nam 
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informacje  o zachowaniu  się  ziemskiego  pola  magne- 
tycznego. W początkowej  fazie  rozwój  magnetycznych 
urządzeń  pamięciowych  koncentrował  się  na  zapisie 
dźwięku  i doprowadził  do  tak  doskonałych  już  kon- 
strukcji, jak  np.  magnetofon  stereofoniczny.  Zapis 
sygnałów  akustycznych,  polega  w nim  na  ich  odpo- 
wiednim odwzorowaniu  w postaci  dwuwymiarowego 
(w  płaszczyźnie  taśmy)  rozkładu  namagnesowania 
szczątkowego  warstwy  magnetycznej,  którą  pokryta 
jest  taśma  magnetofonowa.  Wymaga  to  odpowied- 
niego przetworzenia  tych  sygnałów  na  zmienne  pole 
magnetyczne,  proporcjonalne  do  nich  zarówno  w czę- 
stości jak  i amplitudzie.  Pole  to  magnesuje  warstwę 
w taśmie  przesuwającej  się  ze  stałą  prędkością  pod 
wytwarzającą  je  głowicą.  Przy  odczycie  rozproszone 
pole  magnetyczne,  występujące  nad  powierzchnią  war- 
stwy i odwzorowujące  istniejący  w niej  rozkład  na- 
magnesowania, indukuje  w uzwojeniu  głowicy  (w  wy- 
niku ruchu  taśmy  względem  głowicy),  siłę  elektromo- 
toryczną proporcjonalną  do  szybkości  zmian  tego  po- 
la, a więc  i do  zapisanego  sygnału  akustycznego.  Cha- 
rakterystyka namagnesowania  warstwy  nie  jest  linio- 
wa (ma  postać  pętli  histerezy),  co  prowadzi  qo  znie- 
kształceń harmonicznych  w czasie  zapisu  dźwięku. 
W celu  wyeliminowania  tego  efektu  jest  zwykle  sto- 
sowane pole  podmagnesowania,  wytwarzane  przez 
prąd  zmienny  o dużej  częstości  płynący  przez  uzwoje- 
nie głowicy  w trakcie  zapisu.  Częstość  tego  prądu  musi 
być  na  tyle  duża  (40-80  kHz),  aby  przesuwający  się 
pod  głowicą  odcinek  warstwy  zdążył  się  kilkakrotnie 
przemagnesować.  W latach  pięćdziesiątych  naszego 
stulecia  pamięć  magnetyczną  taśmową  wykorzystano 
również  do  zapisu  obrazu  zarówno  czarno-białego  jak 
i kolorowego.  Pierwsze  urządzenia  potocznie  zwane 
ampeksami  (od  nazwy  firmy  AMPEX),  pojawiły  się 
w 1956  r.  (rys.  1).  Sygnał  wizyjny  niesie  znacznie  więk- 
szą ilość  informacji  w jednostce  czasu  aniżeli  sygnał 


wynosi  200-240  obr/min  (odpowiada  to  prędkości 
liniowej  głowicy  względem  taśmy  do  30  m/s),  pręd- 
kość przesuwu  taśmy  0,4  m/s.  Zapis  wizji  jest  doko- 
nywany z zachowaniem  pewnego  marginesu  na  obyd- 
wu brzegach  taśmy,  co  jest  niezbędne  do  wyelimino- 
wania zakłóceń  powstających  w momentach  stykania 
się  głowicy  z taśmą.  Margines  ten  pozwala  jednocze- 
śnie na  zapisywanie  dźwięku  oraz  impulsów  synchro- 
nizacji na  ścieżkach  położonych  wzdłuż  brzegów  ta- 
śmy. Przy  zapisie  wizji,  obraz  jest  zwykle  analizowa- 
ny wg  standardowego  systemu  telewizyjnego,  opartego 
na  zasadzie  rastru  (jedna  linia  rastru  zajmuje  w opi- 
sanym systemie  odcinek  o długości  ok.  0,4  mm  ścieżki 
na  taśmie).  Przy  rejestracji  obrazu  kolorowego  zapis 
składa  się  z 3 ścieżek  podstawowych  składowych  świe- 
tlnych sygnału  telewizyjnego.  Magnetyczny  zapis  ob- 
razu znajduje  najszersze  zastosowanie  w telewizji, 
gdzie  ułatwia  realizację  programu  (możliwość  mon- 
tażu, wznowienia  programu,  wymiany  programów 
czy  też  otrzymywania  wielu  kopii  przez  jednoczesny 
zapis  na  kilku  urządzeniach),  bywa  również  stosowany 
do  celów  specjalnych  np.  na  sztucznych  satelitach,  przy 
badaniu  powierzchni  kuli  ziemskiej. 


Pamięci  cyfrowe:  ferrytowe 
i elektromechaniczne 

Niezwykle  dynamiczny  rozwój  elektronicznych  ma- 
szyn cyfrowych  — EMC  (zwanych  powszechnie  kom- 
puterami), który  nastąpił  po  II  wojnie  światowej,  po- 
budzał m.in.  również  i rozwój  pamięci  magnetycz- 
nych, oczywiście  przede  wszystkim  pod  kątem  ich  za- 
stosowania w EMC.  Historycznie  pierwsza  EMC  o 
nazwie  ENIAC  (z  ang.  Electronic  Numerical  Inte- 
grator and  Calculator)  została  uruchomiona  w 1947  r. 
w USA  i działała  z szybkością  5 tys.  dodawań  na  1 s. 
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Rys.  1.  Urządzenie  do  magnetycznego  zapisu  obrazu  (system  ampeks):  a)  mechanizm,  b)  wirujący  blok  głowic 


foniczny.  Odpowiadające  temu  widmo  częstości  za- 
wiera się  w granicach  50  Hz  - 6 MHz  (przy  zapisie 
dźwięku  przenoszone  pasmo  zwykle  nie  przekracza 
20  kHz).  Największa  częstość,  jaką  urządzenie  jest 
zdolne  przenieść  Jest  m.in.  uwarunkowana  prędkością 
przesuwu  taśmy.  Stosując  podobne  rozwiązanie  jak 
przy  zapisie  fonicznym,  prędkość  przesuwu  taśmy 
musiałaby  wynosić  ok.  100  m/s,  podczas  gdy  dla  dźwię- 
ku jest  poniżej  1 m/s  (np.  zapis  10  min  audycji  tele- 
wizyjnej wymagałby  aż  60  km  taśmy).  Trudność  tę 
pokonano,  stosując  zapis  poprzeczny  (ścieżki  dla  syg- 
nału wizji  prostopadłe  do  długości  taśmy),  w którym 
dzięki  umieszczeniu  czterech  głowic  zamocowanych 
na  obracającym  się  bębnie  (rys.  Ib),  było  możliwe 
zwiększenie  względnej  prędkości  nośnika  magnetycz- 
nego w stosunku  do  głowic.  Prędkość  obrotowa  bębna 


Zasadnicza  różnica  w działaniu  magnetycznej,  jak 
zresztą  i każdej  innej  pamięci  cyfrowej,  w stosunku 
do  urządzeń  przeznaczonych  do  zapisywania  dźwięku 
lub  obrazu,  wynika  z faktu,  że  wszelkie  operacje 
w maszynie  cyfrowej  są  dokonywane  na  liczbach. 
Posługiwanie  się  systemem  dziesiętnym  wymagałoby 
umiejętności  rozróżniania  przez  każdy  układ  maszyny 
dziesięciu  stanów  odpowiednio  przyporządkowa- 
nych dziesięciu  cyfrom  tego  systemu  (1,2, ...  9,0).  Wy- 
korzystując różne  zjawiska  fizyczne  łatwiej  jest  bu- 
dować układy  wykazujące  dwa  stabilne  stany  równo- 
wagi (np.  prąd  płynie  — prąd  nie  płynie,  świeci  — nie 
świeci  itp.).  Z tych  też  względów  w EMC  jest  po- 
wszechnie stosowany  system  dwójkowy  (binarny), 
w którym  każdą  cyfrę,  a tym  samym  i liczbę  w układzie 
dziesiętnym,  można  przedstawić  jako  ciąg  jedynek 


system 

dwójkowy 
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i zer.  System  lub  kod  dwójkowy  jest  utworzony  za 
pomocą  dwóch  cyfr  0 i 1 umieszczanych  na  pozycjach, 
którym  są  przyporządkowane  kolejne  potęgi  liczby 
„dwa”,  np.  ciąg  1 -244-0*23-f  0-22+l  -21-}- 1 -2°,  od- 
powiadający liczbie  19  w systemie  dziesiętnym,  jest 
zapisany  w systemie  dwójkowym  jako  10011.  Wyma- 
ga to  od  układów  pamięci  zdolności  do  rozróżniania 
tylko  dwóch  informacji  elementarnych  0 i 1 (elemen- 
tarną jednostkę  informacji  0 lub  1 przyjęto  nazywać 
w technice  cyfrowej  bitem  — z ang.  binary  digit  — 
cyfra  dwójkowa).  W pamięciach  magnetycznych  in- 
formacjom tym  są  zwykle  przyporządkowane  dwa 
stabilne  stany  namagnesowania,  różniące  się  zwrotem. 

Z zasadą  działania  magnetycznej  pamięci  cyfrowej 
pamięć  zapoznamy  się  na  przykładzie  pamięci  ferrytowej, 
ferrytowa  w której  elementarnymi  komórkami  pamięciowymi  są 
rdzeniowa  rdzenie  ferrytowe  w kształcie  pierścionków  (toroidów) 
o średnicach  zewnętrznych  wielkości  dziesiętnych 
części  mm  (rys.  2a).  Charakterystyka  magnesowania 
takiego  rdzenia  ma  postać  prostokątnej  pętli  histerezy 
(rys.  2b).  Rdzeń  jest  tym  lepszy  do  użycia  w pamięci,  im 


ciwnym  zwrocie  wytworzonym  przez  impuls  prądu 
(—Im)  płynący  przez  linię  słowa  na  wyjściach  linii  bito- 
wych (1,2,  ...  n)  pojawią  się  napięcia  odpowiadające 
zmianom  indukcji  magnetycznej  w poszczególnych 
rdzeniach  zgodnie  ze  wzorem  u(t)  = —A  dBjdt(A  — 
stała).  Zmiana  indukcji  w rdzeniach,  które  zawierały 
informację  0,  jest  niewielka  (AB0  — obieg  A E A) 
i odpowiadające  jej  napięcie  również  małe.  W rdze- 
niach z informacją  1,  napięcie  jest  duże  wskutek  dużej 
zmiany  indukcji  (AB1  — obieg  D -+  E A).  Jak  wspo- 
minaliśmy, po  odczycie  wszystkie  rdzenie  wybranego 
słowa  znajdują  się  w stanie  0,  co  umożliwia  wpisanie 
nowej  informacji,  lub  ponowne  wpisanie  dopiero  co 
odczytanej.  Pamięci  ferrytowe  są  powszechnie  stoso- 
wane w EMC  jako  pamięci  operacyjne  (lub  wewnętrz-  pamięć 
ne),  stanowiące  podstawową  część  jednostki  central-  operacyjna 
nej  maszyny  cyfrowej.  Pojemność  pamięci  ferrytowych  (wewnętrzna) 
wyrażająca  maksymalną  liczbę  bitów,  jaką  można 
jednocześnie  przechowywać,  zawiera  się  w granicach 
od  kilkuset  bitów  do  kilku  Mbitów.  Uzyskiwany 
w nich  czas  cyklu,  określany  czasem,  który  jest  po- 
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bliższe  jedności  są  jego  współczynniki  prostokątności 
i kwadratowości,  zdefiniowane  stosunkami  Br/Bm 
i B(—l  Hm)IBm  (w  praktyce  osiągane  są  wartości  w gra- 
nicach 0,9-0,98).  W rdzeniu  łatwo  uzyskać  dwa  róż- 
niące się; zwrotem  stabilne  stany  namagnesowania,  od- 
powiadające dodatniej  i ujemnej  pozostałości  magne- 
tycznej (+Br  i —Br).  Stanom  tym  są  przyporządko- 
wane odpowiednio  cyfry  1 i 0 systemu  dwójkowego. 
Zapis,  jak  również  i odczyt  informacji,  są  dokonywane 
za  pomocą  impulsów  prądu,  płynących  przez  uzwoje- 
nia i nazywane  liniami  słów  i bitów  (słowo  jest  pod- 
stawową jednostką  obliczeniową  danej  maszyny  i mo- 
że zawierać  np.  256  bitów),  które  przechodzą  przez 
rdzeń,  tworząc  płat  pamięciowy  (rys.  2c).  Zakładając, 
że  stan  wszystkich  rdzeni  w wybieranej  linii  słowa  (np. 
w linii  4)  odpowiada  cyfrze  0 (jak  przekonamy  się  stan 
taki  jest  rzeczywiście  ustalony  po  każdym  odczycie) 
wpisywanie  określoną  informację  (np.  liczbę  19=  10011)  wpisuje- 
informacji  my,  pobudzając  wszystkie  rdzenie  w tej  linii  impulsem 
pola  o amplitudzie  równej  połowie  amplitudy  maksy- 
malnej (f  Hm)  oraz  jednocześnie  impulsem  pola  o 
tej  samej  amplitudzie  i zwrocie  w tych  liniach  bito- 
wych, w których  ma  być  wpisana  cyfra  1.  Rdzenie 
pobudzane  tylko  polem  połówkowym,  wytworzonym 
przez  impuls  prądu  f Im,  przepływający  przez  linię  sło- 
wa, są  magnesowane  zgodnie  z obiegiem  A ->■  B -►  A 
na  pętli  histerezy  (rys.  2b)  i w chwili  zaniku  impulsu 
tego  pola  w rdzeniu  ustala  się  ponownie  stan  0.  Rdze- 
nie pobudzane  dwoma,  sumującymi  się  impulsami 
pola,  są  magnesowane  zgodnie  z obiegiem  A ->  B -> 
C D — i ustala  się  w nich  stan  1 . Pobudzając  teraz 
rdzenie  impulsem  pola  o pełnej  amplitudzie,  lecz  prze- 


trzebny  do  dokonania  zapisu  słowa,  jego  odczytu 
i zwykle  ponownego  wpisania  odczytanej  informacji 
wynosi  od  100  ns  do  kilku  jis.  Czas  ten  decyduje  o 
szybkości  działania  EMC. 

Dużą  grupę  pamięci  magnetycznych  stanowią  urządzenia 
urządzenia  elektromechaniczne,  których  zasada  dzia-  elektro-, 
łania  jest  podobna  do  urządzeń  do  zapisu  dźwięku  mechaniczne 
lub  obrazu.  Informacja  cyfrowa  jest  zapisywana  w 
warstwie  magnetycznej,  stanowiącej  powierzchnię 


Rys.  3.  Zasada  zapisu  informacji  binarnej  na  ruchomym  nośniku 
magnetycznym  w pamięciach  elektromechanicznych 
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taśmy,  bębna  lub  dysku.  Zapis,  zwykle  wielościeżko- 
wy,  jest  dokonywany  za  pomocą  głowicy,  przez  której 
uzwojenie  przepływają  impulsy  prądu  o polaryzacji 
dodatniej  lub  ujemnej,  zależnie  od  rodzaju  zapisywa- 
nej informacji  0 lub  1 (rys.  3).  Pole  magnetyczne,  wy- 
twarzane w szczelinie  głowicy  magnesuje  kolejno  ob- 
szary przesuwającej  się  warstwy  w kierunku  zgodnym 
lub  przeciwnym  do  kierunku  jej  ruchu  (na  rys.  3 w 
sposób  poglądowy  przedstawiono  zapis  liczby  19  = 
==  10011).  W czasie  odczytu  rozproszone  pole  namag- 
nesowanych obszarów,  zamykając  się  w obwodzie 
magnetycznym  głowicy,  indukuje  w jej  uzwojeniu 
(w  trakcie  ich  przesuwania  się  pod  szczeliną  roboczą) 
siłę  elektromotoryczną  w postaci  ciągu  impulsów, 
których  polaryzacja  jest  zależna  od  zwrotu  namagne- 
sowania, a tym  samym  i od  rodzaju  informacji  dwój- 
kowej. 

Pamięci  elektromechaniczne,  taśmowe,  bębnowe 
pamięć  i dyskowe  są  dzisiaj  powszechnie  stosowane  w EMC 
zewnętrzna  jako  urządzenia  zewnętrzne,  służące  do  zapamiętywa- 
nia tzw.  masowej  informacji,  której  zapis  wymaga 
bardzo  dużej  pojemności,  ok.  1010  bitów.  Pamięci 
dyskowe  i taśmowe  mają  praktycznie  nieograniczoną 
pojemność  ze  względu  na  możliwość  wymiany  pa- 
kietów dysków  lub  krążków  taśmy.  Poważnym  bra- 
kiem tych  urządzeń  jest  natomiast  ich  stosunkowo 
mała  szybkość  działania.  Wadą  też  jest  istnienie  w tych 
konstrukcjach  dość  skomplikowanych  zespołów  me- 
chanicznych, stwarzających  spore  kłopoty  w czasie 
eksploatacji.  Pamięci  ferrytowe  i elektromechaniczne, 
mimo  prób  wprowadzenia  innych  pamięci  magne- 
tycznych, są  jednak  nadal  bezkonkurencyjne  i stoso- 
wane w najnowszych  generacjach  EMC. 


Najnowsze  konstrukcje  pamięci  cyfrowych 

Znaczny  postęp  uzyskany  w technice  laserowej,  a prze- 
de wszystkim  w konstrukcji  laserów  półprzewodniko- 
pamięć  wych,  ponownie  skupił  uwagę  na  pamięci  termomagne- 
termomag-  tooptycznej,  której  pomysł  i pierwszy  model  zrodził 
netooptyczna  się  już  w 1958  r.  Nieco  później  (1967  r.)  zwrócono 
uwagę  na  możliwość  wykorzystania  cylindrycznych 
domen  magnetycznych  (— ► Struktura  domenowa 
i procesy  magnesowania)  w układach  pamięci.  Ocze- 
kuje się,  że  pamięci  te  wyeliminują  urządzenia  elektro- 
mechaniczne głównie  ze  względu  na  potencjalną  moż- 
liwość osiągnięcia  w nich  bardzo  dużych  pojemności 
przy  małych  rozmiarach  geometrycznych  (gęstość 
upakowania  informacji  rzędu  108  bitów/cm2  powierz- 
chni nośnika;  dla  porównania  — gęstość  tę  w mózgu 
ludzkim  ocenia  się  na  1010  bitów/cm3).  W obydwu  ro- 
dzajach pamięci  jako  nośnik  informacji  jest  stosowana 
cienka  warstwa  (grubości  rzędu  kilku  pm)  wykazu- 
jąca anizotropię  magnetyczną,  przy  czym  kierunek 
stosowane  łatwego  magnesowania  leży  w płaszczyźnie  warstwy 
materiały  lub  prostopadle  do  jej  powierzchni.  Stosowanymi  ma- 
teriałami są  bizmutek  manganu  (MnBi),  związki  eu- 


warstwa 

magnetyczna 


Rys.  4.  Schemat  blokowy  pamięci  termomagnetooptycznej  z nie- 
ruchomym nośnikiem  informacji 


ropu  (np.  EuS  lub  EuSe)  dla  pamięci  termomagne- 
tooptycznych  oraz  proste  lub  mieszane  granaty  magne- 
tyczne (np.  Sm0i5Y2t5Ga1(2Fe3i8O12)  i warstwy  amor- 
ficzne stopów  metali  grupy  przejściowej  z Iantanow- 
cami  (np.  GdCo)  dla  obydwu  rodzajów  pamięci. 
W pamięci  termomagnetooptycznej  zapis  jest  doko- 
nywany za  pomocą  silnej  wiązki  światła  laserowego 
(rys.  4),  współdziałającej  z polem  magnetycznym. 
Impuls  światła  — zwykle  o czasie  trwania  mniejszym 
od  1 ps  — pada  na  wybraną,  za  pomocą  układu  od- 
chylenia wiązki,  elementarną  komórkę  pamięciową 
w ciągłej  warstwie  nośnika  i powoduje  jej  lokalne  na- 
grzanie do  temperatury  większej  od  temperatury  Curie 
materiału  (->  Teoria  magnetyzmu),  w wyniku  czego 
komórka  jest  termicznie  rozmagnesowana.  (Powierz- 
chnia tej  komórki  jest  określona  przez  przekrój,  w 
płaszczyźnie  warstwy,  zogniskowanej  wiązki  światła, 
a uzyskiwane  w praktyce  wiązki  mają  średnicę  ok. 
2 pm).  Do  otrzymania  takich  temperatur  (rzędu  kil- 
kuset °C)  używa  się  zwykle  lasera  gazowego  He-Ne 
o mocy  ok.  100  mW.  Współdziałające  pole  magne- 
tyczne, synchroniczne  z impulsami  światła,  wymusza 
w czasie  stygnięcia  materiału  w obrębie  komórki  wy- 
magany zwrot  namagnesowania.  Pole  to  ma  kierunek 
prostopadły  do  powierzchni  warstwy  (gdy  kierunek 
łatwego  magnesowania  jest  prostopadły  do  powierz- 
chni warstwy)  lub  równoległy  (gdy  kierunek  łatwego 
magnesowania  leży  w płaszczyźnie  warstwy).  Zwrot 
pola  jest  zależny  od  rodzaju  zapisywanej  informacji 

0 lub  1,  dzięki  czemu,  po  zaniku  impulsów  światła 

1 pola,  namagnesowanie  w elementarnej  komórce  pa- 
mięci ma  zwrot  odpowiadający  wpisanej  cyfrze  dwój- 
kowej. Odczyt  zapisanej  w ten  sposób  informacji  jest 
dokonywany  za  pomocą  tej  samej  wiązki  laserowej 
o świetle  liniowo  spolaryzowanym,  lecz  tym  razem 
o wielokrotnie  mniejszej  energii.  Zależnie  od  rodzaju 
warstwy  magnetycznej,  w celu  rozróżnienia  odczy- 
tywanej informacji,  wykorzystuje  się  zjawisko  Fara- 
daya lub  Kerra  (->  Magnetooptyka).  Zasadę  odczytu 


Rys.  5.  Zasada  odczytu  informacji  przy  wykorzystaniu  efektu 
Faradaya 


w wypadku  przezroczystej  warstwy  o prostopadłym 
kierunku  łatwego  magnesowania  pokazuje  rys.  5.  Po 
przejściu  przez  analizator  otrzymuje  się  wiązki  światła 
o różnym  natężeniu  lx  i /2.  Różnica  natężeń  wiązek 
jest  spowodowana  skręceniem  płaszczyzny  polaryzacji 
światła  (zjawisko  Faradaya)  przechodzącego  przez 
obszary  warstwy  o przeciwnych  zwrotach  namagne- 
sowania, co  odpowiada  informacjom  0 i 1. 

Padając  na  fotodetektor  (np.  fotorezystor  lub  fo- 
todiodę), wiązki  Ix  i /2,  niosące  odpowiednio  infor- 
mację 0 i 1,  generują  na  wyjściu  detektora  impulsy 
elektryczne  o zróżnicowanej  amplitudzie  odpowiednio 
do  różnicy  ich  natężeń  Al.  W opisanym  rozwiązaniu 
pamięci  termomagnetooptycznej  największą  trudność 
sprawia  właściwe  ogniskowanie  wiązki  laserowej  oraz 
jej  odchylanie.  Z tych  też  względów  rozwiązanie  to, 
w zasadzie  analogiczne  do  pamięci  holograficznej, 
nie  znalazło  dotąd  szerszego  zastosowania. 

Większe  nadzieje  wiąże  się  z rozwiązaniem  (rys.  6), 
w którym  nośnik  informacji  naniesiony  na  podłoże 
w kształcie  dysku  obraca  się,  a informacja  jest  maga- 
zynowana wzdłuż  koncentrycznych  ścieżek  (podobnie 


zapis 

informacji 


odczyt 

informacji 
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jak  w pamięciach  dyskowych).  W tej  konstrukcji  sto- 
sowane są  lasery  półprzewodnikowe  (GaAs),  uszere- 
gowane w bloku  w ten  sposób,  że  jeden  laser  przypada 
na  jedną  ścieżkę.  Przy  odczycie  wykorzystuje  się  wiąz- 
kę odbitą  (efekt  Kerra),  w związku  z czym  w tym 


okresu  (rys.  7).  Elementy  toru  mają  najczęściej  kształt 
liter  T,  I,  X,  Y lub  krokiewek.  Sposób  przesuwania 
domen  w torze  typu  T-I,  najczęściej  stosowany  w 
praktyce,  przedstawia  rys.  8,  na  którym  są  widoczne 
kolejne  fazy  ruchu  odpowiadające  czterem  położe- 


domeny 
cylindryczne 
jako  nośnik 
informacji 


pętle 

pamięciowe 


rozwiązaniu  stosuje  się  warstwy  o kierunku  łatwego 
magnesowania  leżącym  w płaszczyźnie  warstwy.  Po- 
jemność tej  pamięci,  uwarunkowana  głównie  precyzją 
zogniskowania  światła  laserowego  (ok.  2 pm)  i od- 
ległością między  sąsiednimi  źródłami  światła  w bloku 
(ok.  50  pm),  może  być  rzędu  kilkuset  Mbitów/dysk, 
co  odpowiada  gęstości  ok.  200  ścieżek/cm. 

Najnowszym  rozwiązaniem  pamięęi  magnetycznej 
jest  pamięć  cyfrowa,  w której  nośnikiem  informacji  są 
magnetyczne  domeny  cylindryczne  wytwarzane  w 
epitaksjalnych  (— ► Mikroelektronika)  warstwach  gra- 
natów lub  warstwach  amorficznych  stopów  typu 
Gd-Co.  Domenie  cylindrycznej  występującej  w okre- 
ślonym miejscu  warstwy  jest  przyporządkowana  cyf- 
ra 1,  jej  brakowi  w tym  miejscu  cyfra  0 (wakansja). 
Odpowiednie  ciągi  składające  się  z domen  i ich  wa- 
kansji  tworzą  liczby  (słowa)  w kodzie  dwójkowym. 
Domeny  cylindryczne  mogą  się  przemieszczać  między 
określonymi  punktami  na  powierzchni  warstwy,  co 
jest  równoznaczne  z przekazywaniem  informacji. 

Najmniejsze  średnice  domen  ok.  0,5  pm  uzyskano 
dotychczas  w warstwach  amorficznych.  Ze  względu 
na  możliwości  współczesnych  technik  fotolitograficz- 
nych ocenia  się,  że  średnica  ta  nie  może  być  jednak 
mniejsza  niż  0,1  pm.  W pierwszych  stosowanych  w 
praktyce  magnetycznych  pamięciach  cyfrowych  śred- 
nica domeny  wynosiła  6 urn,  w nowszych  — 3 pm. 
W rozwiązaniach  tych  z reguły  stosuje  się  epitaksjalne 
warstwy  granatów.  Warstwy  amorficzne  nie  znalazły 
jednak  jeszcze  powszechniejszego  zastosowania. 

Podstawowym  elementem  w pamięci  magnetycznej 
jest  zamknięta  pętla  pamięciowa  — stanowiąca  rejestr 
szeregowy  — do  której  informacja  jest  wpisywana, 
przechowywana  i następnie  z niej  pobierana.  Przesu- 
wanie ciągów  informacyjnych  (składających  się  z do- 
men i wakansji)  w obrębie  pętli,  niezbędne  do  prze- 
prowadzania wymienionych  operacji,  jest  realizowane 
za  pomocą  torów  propagacyjnych  wykonywanych 
zwykle  w postaci  cienkowarstwowych  struktur  per- 
malojowych  (stop  Ni-Fe),  naparowywanych  przez 
odpowiednią  maskę  na  warstwę  nośnika  oraz  współ- 
pracującego z nimi  wirującego  w płaszczyźnie  war- 
stwy pola  magnetycznego.  Ruch  poszczególnych  do- 
men w ciągu  następuje  w rezultacie  oddziaływań  mię- 
dzy domeną  i biegunami  magnetycznymi  wytwarza- 
nymi w elementach  permalojowych  toru  przez  wiru- 
jące pole.  Źródłem  tego  pola  są  sinusoidalne  prądy 
elektryczne  płynące  przez  dwa  uzwojenia  o wzajemnie 
prostopadłych  osiach,  przesunięte  w fazie  o ćwierć 
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Rys.  7.  Zasada  wytwarzania  pola  wirującego  w płaszczyźnie 
warstwy  i pola  podmagnesowania  prostopadłego  do  tej  płasz- 
czyzny 

domeny 

A 
/ 


+ HV 
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permaJojowe 
elementy  toru 

Rys.  8.  Sposób  przesuwania  domen  cylindrycznych  w torze  pro- 
pagacyjnym  typu  T-I 

niom  pola  wirującego  (rys.  8a,  b,  c i d).  Pełny  obrót 
pola  odpowiada  przesunięciu  o jedno  położenie  w pe- 
riodycznej strukturze  toru  (rys.  8e).  Podstawowy  układ 
pamięci  (rys.  9),  zawiera  szereg  pętli  pamięciowych 
(do  kilkudziesięciu,  każda  o pojemności  rzędu  kilku- 
set bitów),  sprzężonych  przez  bramki  przepustowe 
z pętlą  transportową,  która  służy  do  wprowadzania 
lub  wyprowadzania  informacji  z pętli  pamięciowych. 
Bramki  przepustowe,  kierujące  ciągi  domen  w okre- 
ślone odgałęzienia  torów,  są  zwykle  wykonywane 
również  w postaci  odpowiednich  struktur  permalojo- 
wych i wbudowanych  w nie  ścieżek  przewodzących, 
w których  kierunek  płynącego  prądu  decyduje  o kie- 
runku otwarcia  bramki.  W czasie  zapisu  poszczególne 
bity  słowa,  wytworzonego  przez  generator  w postaci 
odpowiedniego  ciągu  domen  (np.  10011  jak  to  poka- 
zano dla  przykładu  na  rys.  9),  są  wprowadzane  do 
pętli  transportowej  i następnie  przesunięte  w niej  w ta- 
ki sposób,  że  mogą  być  jednocześnie  wprowadzone  do 


wprowadza- 
nie słów  do 
pętli 


pamiętania.  Zasada  działania  anihilatora  jest  oparta 
na  zjawisku  zanikania  domeny. 

Pojedyncza  płytka  pamięciowa  zawiera  jeden  lub 
kilka  podstawowych  układów.  Szereg  płytek  pamię- 
ciowych (do  kilkudziesięciu)  umieszczonych  we  wnęt- 
rzu układu  wytwarzającego  pole  wirujące  i podmag- 
nesowania  tworzy  podstawowy  moduł  pamięci,  z któ- 
rych można  składać  układy  o wymaganej  pojemności. 
Na  il.  98  (tabl.  24)  przedstawiono  moduł  pamięci  na 
domenach  cylindrycznych.  W istniejących  rozwiąza- 
niach tych  pamięci  osiągana  jest  gęstość  zapisu  105- 
10®  bitów/cm2,  szybkość  przekazywania  informacji 
106-107  bitów/s  oraz  pojemności  do  kilku  Mbitów. 

W najnowszym  rozwiązaniu  pamięci  na  domenach 
cylindrycznych  jest  wykorzystywana  regularna  (hek- 
sagonalna) siatka  domen,  powstająca  w sposób  natu- 
ralny w epitaksjalnej  warstwie  granatu  magnetycz- 
nego. Położenia  komórek  pamięciowych  wyznaczają 
same  domeny,  gęsto  upakowane  w warstwie;  upako- 
wanie w siatce  domen  jest  16-krotnie  większe  w po- 
równaniu z poprzednio  omawianym  rozwiązaniem, 
w którym  ze  względu  na  magnetostatyczne  oddziały- 
wania odległość  między  sąsiednimi  domenami  nie 
może  być  mniejsza  niż  cztery  średnice  domeny.  Cy- 
from dwójkowym  0 i 1 są  przyporządkowane  odpo- 
wiednio dwa  rodzaje  domen,  różniące  się  strukturą 
magnetyczną  otaczającej  je  ścianki.  W czasie  odczytu 
jedne  z nich  poruszają  się  pod  pewnym  kątem  w sto- 
sunku do  gradientu  wymuszającego  ten  ruch  pola 
magnetycznego,  drugie  — równolegle.  Pozwala  to 
kierować  domeny  odpowiadające  informacjom  0 i 1 
do  dwóch,  niezależnych  torów  odczytu.  Zapis,  pole- 
gający na  tworzeniu  domen  o kontrolowanej  struk- 
turze ścianki,  jest  dokonywany  za  pomocą  dwóch 
koincydencyjnych  pól  skierowanych  prostopadle 
i równolegle  do  płaszczyzny  warstwy.  Najistotniejszą 
zaletą  tego  rozwiązania  jest  bardzo  duża  stabilność 
siatki  na  zmiany  warunków  zewnętrznych. 

Wobec  niezwykle  dynamicznego  rozwoju  badań 
materiałów  magnetycznych  w ostatnich  latach  na 
świecie,  nie  można  wykluczyć  i tego,  że  zanim  publi- 
kacja ta  dotrze  do  rąk  Czytelników,  pojawią  się  pa- 
mięci magnetyczne  wykorzystujące  materiały  i zja- 
wiska dziś  jeszcze  nie  znane. 

A.  J.  Meyerhoff  (red.)  Cyfrowe  zastosowania  układów  magne- 
tycznych, Warszawa  1964;  M.  Nałęcz  (red.)  Cylindryczne  dome- 
ny magnetyczne  w technice  cyfrowej.  Warszawa  1973;  E.  Nowak, 
Z.  Sawicki  Pamięci  maszyn  cyfrowych:  konstrukcja  i techno- 
logia, Warszawa  1977;  B.  Urbański  Magnetyczny  zapis  dźwię- 
ków i obrazów , Warszawa  1965. 


Najsilniejsze  pola  magnetyczne 

Czesi  a w Bazan 

Pole  magnetyczne  wpływa  w zasadzie  na  wszystkie 
zjawiska  fizyczne,  jest  więc  jednym  z istotnych  czyn- 
ników fizycznego  poznania  świata.  Ponieważ  na  ogół 
działanie  pola  magnetycznego  jest  tym  większe  im 
większe  jest  jego  natężenie  bądź  też  można  je  zaobser- 
wować dopiero  po  przekroczeniu  pewnych  granicz- 
nych wartości,  fizycy  starają  się  stosować  pola  coraz 
silniejsze. 

Wielkość  pola  określamy  podając  jego  natężenie 
U£l06A/m  lub  indukcję.  Międzynarodowa  jednostka  natężenia 
pola:  amper  na  metr  (A/m)  jest  zbyt  mała  dla  na- 
szych celów.  Bardziej  odpowiednią  jest  wielkość 
105  A/m  = 1 kA/cm.  Jednostką  indukcji  magnetycz- 
nej jest  tesla  (T).  W próżni  1 T odpowiada  ok. 

10  kA/cm.  Dla  uproszczenia  będziemy  się  posługiwać 
jednostką  indukcji,  pisząc  krótko:  pole  1 T — zamiast 
pole  o natężeniu  10  kA/cm  w powietrzu. 

Człowiek  bezpośrednio  nie  odczuwa  obecności,  a 
tym  bardziej  wielkości  pola  magnetycznego.  Dlatego 
przypomnimy  dla  porównania  wartości  odpowied- 
nich pól  magnetycznych: 
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pole  między  biegunami  magnesu  podkowiastego  — 
około  0,1  T; 

pole  magnetyczne  Ziemi  przy  jej  powierzchni  — 
poniżej  10" 4 T; 

pola  magnetyczne  gwiazd  — poniżej  5 T. 

Pola  magnetyczne  powyżej  5 T uważane  są  za  silne. 
Wartości  silnych  pól  magnetycznych  spotykanych  w 
przyrodzie  podano  na  rys.  1. 

Pola  magnetyczne  możemy  wytwarzać  trzema  spo- 
sobami : a)  używając  magnesów  trwałych ; b)  wyzysku- 
jąc przepływ  prądu  elektrycznego  np.  przez  przewod- 
nik; c)  łącząc  metody  a i b.  Ponieważ  w metodzie  a i c 
stosuje  się  ferromagnetyki,  wartość  otrzymywanego 
pola  jest  ograniczona  wartością  namagnesowania  na- 
sycenia. Dalszy  wzrost  pola  można  uzyskać  przez 
zwiększanie  masy  magnesu  lub  rdzenia,  przy  czym 
wzrost  ten  jest  wykładniczy.  Na  przykład  zwiększeniu 
masy  rdzenia  z 10  do  100  t odpowiada  wzrost  pola 
z 3,5  T do  7 T.  Największy  zbudowany  elektromagnes 
rdzeniowy  miał  120  t i wytwarzał  pole  7 T.  Dalszy 
rozwój  tego  typu  źródeł  silnych  pól  magnetycznych 


pętli  pamięciowych,  których  liczba  odpowiada  w za- 
sadzie długości  słowa  mierzonej  w bitach.  Poszczegól- 
ne bity  wpisanego  słowa  są  następnie  synchronicznie 
przesuwane  w pętlach  pamięciowych,  krążąc  w nich 
do  momentu,  w którym  przechowywana  informacja 


pętla  transportowa 


Rys.  9.  Schemat  podstawowego  układu  cyfrowej  pamięci  na 
domenach  cylindrycznych 

pobieranie  ma  być  odczytana.  Pobranie  danego  słowa  przebiega 

informacji  w odwrotnej  kolejności.  Odczyt  następuje  w detek- 
torze (wykorzystującym  zjawisko  Halla,  zjawisko 
magnetooptyczne  lub  magnetooporowe),  na  którego 
wyjściu  pojawia  się  sekwencja  impulsów  napięcia 
odpowiadająca  odczytywanej  informacji.  Umiesz- 
czony w torze  replikator  pozwala  na  odtworzenie  kie- 
rowanego do  detektora  ciągu  informacyjnego,  co 
umożliwia  dalsze  przechowywanie  odczytywanej  in- 
formacji. Sprzężony  z pętlą  transportową  anihilator 
służy  z kolei  do  niszczenia  domen  w tych  ciągach  in- 
formacyjnych, które  nie  są  przeznaczone  do  dalszego 
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Rys.  1.  Pola  magnetyczne  osiągane  różnymi  metodami  i spoty- 
kane w przyrodzie.  Poszczególne  punkty  przedstawiają  pola 
uzyskiwane  doświadczalnie.  Linia  kreskowana  oddziela  obszar 
pól  dotychczas  dostępnych  (poniżej  krzywej)  od  obszaru  pól 
nieosiągalnych.  Na  osi  poziomej  podano  czas  narastania  impulsu 
lub  czas  możliwej  pracy  elektromagnesu 


nie  miałby  już  sensu  i dlatego  do  uzyskiwania  pól 
powyżej  5 T stosuje  się  elektromagnesy  bezrdzeniowe. 


Do  czego  mogą  służyć  silne 
pola  magnetyczne 

Zastosowanie  silnych  pól  magnetycznych  związane 
jest  z podstawowymi  przejawami  działania  pola  ma- 
gnetycznego przedstawionymi  schematycznie  na  rys.  2. 


Silne  pola  magnetyczne  stosuje  się  do  formowania  dziedziny 
wiązek  cząstek  (naładowanych),  do  zmiany  toru  po-  zastosowań 
jedynczych  cząstek  naładowanych  o dużej  energii 
(a  i d),  do  utrzymywania  plazmy  w ograniczonym  ob- 
szarze i rozdzielania  ładunków  w generatorach  mag- 
netohydrodynamicznych  (a),  do  badania  ogólnych 
własności  ciała  stałego  i konkretnych  własności  ma- 
teriałów, a także  do  obróbki  metali  (b  i c).  Zilustru- 
jemy rolę  silnych  pól  najpierw  w badaniach  ciała  sta- 
łego. 


agnetyk 

•rzewodnik 


magnetyk 

omagnetyk 


metal  w 


pole  rośnie 
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Rys.  2.  Działanie  pola  magnetycznego:  a)  Zakrzywianie  torów 
cząstek  naładowanych  w płaszczyźnie  prostopadłej  do  pola  (na 
ruch  w kierunku  równoległym  pole  nie  działa).  Promień  krzy- 
wizny r = mvlqB,  gdzie  v prędkość,  q ładunek  elektryczny, 
m masa,  B indukcja  magnetyczna,  b)  Porządkowanie  kierunku 
dipoli  magnetycznych  wzdłuż  linii  pola.  c)  Działanie  sił  wciągają- 
cych i wypychających  w polu  niejednorodnym,  d)  Przyspieszanie 
ładunków  w połu  zmiennym  rosnącym  w czasie 


Nadprzewodniki  stosuje  się  m.in.  do  budowy  elek-  w nadprze- 
tromagnesów  wytwarzających  silne  pola  magnetyczne,  wodnikach 
Z drugiej  strony  silne  pola  są  niezbędne  do  określenia 
własności  nadprzewodników,  przy  czym  muszą  one 
być  większe  niż  pola  krytyczne  nadprzewodników 
(sięgające  60  T).  Fizyków  interesują  badania  takich 
własności  nadprzewodników,  jak  zależność  pola  kry- 
tycznego od  temperatury,  czy  prądu  krytycznego  od 
pola  i temperatury  (rys.  3)  bądź  przebiegi  namagneso- 
wania, z których  można  wyciągnąć  wnioski  o mecha- 
nizmie powstawania  nadprzewodnictwa,  ruchu  linii 
strumienia  magnetycznego  przenikających  przez  nad- 
przewodnik itp. 

Źródłem  informacji  o strukturze  elektronowej  me-  w metalach 
tali  są  badania  zmian  oporu  elektrycznego  w polu 
magnetycznym.  Opór  metali  rośnie  w polu  magnetycz- 
nym i to  tym  silniej,  im  niższy  jest  opór  właściwy  me- 
talu. Dlatego  w badaniach  tych  stosuje  się  niskie  tem- 
peratury i czyste  próbki.  Niektóre  metale  wykazują 
silny  (liniowy  lub  kwadratowy)  wzrost  oporu  ze  wzro- 
stem pola,  a inne  — po  początkowym  wzroście  — 
wykazują  nasycenie.  W monokryształach  opór  w jed- 
nych kierunkach  może  zmieniać  się  wg  jednej  zależ- 
ności, a w innych  — wg  drugiej  (anizotropia  magne- 
tooporu,  rys.  4).  Zjawiska  te  mają  ścisły  związek 
z własnościami  gazu  elektronowego  (z  kształtem 
powierzchni  Fermiego),  a bardziej  poglądowo  — 
z możliwościami  ruchu  elektronów  w sieci  krystalicz- 
nej w polu  magnetycznym.  Wiemy,  że  pod  działaniem 
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pola  magnetycznego  elektrony  powinny  poruszać  się 
po  okręgach.  W sieci  krystalicznej  natrafiają  jednak 
na  oddziaływania  pól  elektrycznych,  które  pozwalają 
im  na  ruch  po  okręgach  lub  — ogólniej  — krzywych 
zamkniętych,  albo  po  krzywych  otwartych  (np.  po 
linii  falistej).  W pierwszym  wypadku  opór  elektryczny 
w silnym  polu  nie  zmienia  się,  a w drugim  rośnie 
kwadratowo  z polem.  Czasem  w dostatecznie  silnym 
przebicie  polu  następuje  przejście  z jednego  typu  zależności 
magnetyczne  w drugą,  tzw.  przebicie  magnetyczne.  Podobne  zja- 
wiska zachodzą  w półprzewodnikach.  Zmiany  włas- 


nadprzewod- 


Rys.  3.  Charakterystyki  nadprzewodników  „twardych”:  a)  Za- 
leżność natężenia  prądu  krytycznego  od  natężenia  pola  magne- 
tycznego w temperaturze  4,2  K;  średnica  drutów  0,5  mm.  b)  Za- 
leżność natężenia  pola  krytycznego  od  temperatury.  Linie  ciągłe 
przedstawiają  pomiary  w polach  stałych,  kropki  — dane  z po- 
miarów w polach  impulsowych,  linie  przerywane  — ekstrapolacje 
hipotetyczne.  Nadprzewodnik  PbMofiS8,  o najwyższym  polu 
krytycznym,  nie  jest  jeszcze  stosowany  w praktyce 


ności  nośników  prądu  w metalach  i półprzewodnikach 
rzutują  również  na  własności  cieplne  i optyczne  tych 
substancji. 

W ciałach  paramagnetycznych  występuje  zjawisko 
ustawiania  się  dipoli  magnetycznych  w kierunku  w paramag- 
pola.  Obserwuje  się  to  jako  wzrost  namagnesowania  netykach 
ciała  (tj.  paramagnetyk  w polu  staje  się  magnesem). 

Stopień  uporządkowania  zależy  od  temperatury, 
gdyż  ruchy  cieplne  niszczą  uporządkowanie.  Aby 
w danej  temperaturze  uporządkować  większość  di- 
poli, trzeba  stosować  pole  ok.  2 T na  każdy  stopień 


pole  magnetyczne 

Rys.  4.  Typowa  zależność  oporu  elektrycznego  od  pola  magne- 
tycznego (monokryształ  rutenu;  pole  magnetyczne  skierowane 
prostopadle  do  dwu  różnych  osi  krystalograficznych;  tempera- 
tura 4,2  K) 

temperatury  w paramagnetykach  elektronowych  i ok. 

3000  T w paramagnetykach  jądrowych.  W celu  na- 
magnesowania tych  ostatnich  trzeba  stosować  tem- 
peratury poniżej  10" 2 K. 

W ferromagnetykach,  dipole  magnetyczne  ustawie-  w ferromag- 
ne  są  równolegle  względem  siebie  i zwrócone  w pe-  netykach 
wnym  wyróżnionym  kierunku  narzuconym  przez 
strukturę  krystaliczną,  przy  czym  mniej  więcej  w po- 
łowie objętości  materiału  zwrot  dipoli  jest  przeciwny 
niż  w pozostałej  jego  części.  Wypadkowy  moment 
magnetyczny  jest  równy  zeru.  Gdy  przyłożymy  pole 
magnetyczne  w tym  właśnie  kierunku  krystalogra- 
ficznym, już  w stosunkowo  słabym  polu  następu- 
je zmiana  zwrotu  dipoli  skierowanych  przeciwnie 
(o  180°)  i próbka  zostaje  namagnesowana  do  nasy- 
cenia. Dlatego  ten  kierunek  krystalograficzny  na- 
zwano kierunkiem  łatwego  magnesowania.  Aby 
próbkę  namagnesować  w kierunku  odmiennym  od 
łatwego,  trzeba  dipole  obrócić  o określony  kąt  wzglę- 
dem osi  łatwego  magnesowania,  a to  wymaga  włoże- 
nia odpowiedniej  pracy  w pokonanie  energii  pola  kry- 
stalicznego. Całkowite  namagnesowanie  próbki  uzy- 
skuje się  w polach  magnetycznych  dużo  większych, 
dochodzących  np.  do  100  T.  Wielkość  pola  magne- 


pole  magnetyczne 

Rys.  5.  Krzywe  namagnesowaniu  ferromagnetyka  (polikryształ 
USbSe)  i antyferromagnetyku  (monokryształ  PrSn3)  w tempera- 
turze 4,2  K.  Do  całkowitego  namagnesowania  trzeba  by  zasto- 
sować pola  rzędu  50  T (a)  i 30  T (ó) 
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tycznego  niezbędnego  do  całkowitego  namagnesowa- 
nia próbki  jest  więc  miarą  wielkości  działających  pól 
anizotropii  magnetokrystalicznej  i charakteryzuje  da- 
ny materiał  (rys.  5,  krzywa  a). 

Jeszcze  ciekawiej  wygląda  przebieg  namagnesowa- 
nia antyferromagnetyków  (krzywa  b).  Pola  moleku- 
larne powodują  w nich  ustawienie  sąsiednich  dipoli 
w kierunkach  przeciwnych,  a anizotropia  magneto- 
kry  sta  liczna  — wzdłuż  określonej  osi  w krysztale. 
Pole  magnetyczne  stara  się  ustawić  dipole  w swoim 
kierunku  i proces  namagnesowania  zależy  od  wiel- 
kości pola  w stosunku  do  wielkości  tych  innych  od- 
działywań i od  jego  kierunku.  Na  ogół  obserwuje  się, 
że  w określonym  polu  namagnesowanie  zmienia  się 
skokowo.  Oznacza  to  pokonanie  bądź  pola  anizo- 
tropii, bądź  pola  molekularnego  (wówczas  antyferro- 
magnetyk zmienia  się  w ferromagnetyk).  Badania 
w’  silnych  polach  pozwalają  na  określenie  w-ielkości 
tych  oddziaływań. 

W miarę  zwiększania  natężenia  pola  elektrony 
w metalu  krążą  (o  ile  mogą)  po  okręgach  o coraz 
mniejszych  promieniach.  W polach  rzędu  10  tys.  T 
(a  więc  jeszcze  nieosiągalnych)  rozmiary  tych  okrę- 
gów powinny  być  zbliżone  do  rozmiarów  orbit  ato- 
mowych. Również  same  orbity  atomowe  ulegną  de- 
formacji (ściskaniu),  co  powinno  prowadzić  do  rady- 
kalnych zmian  własności  ciał  i atomów. 

Silne  pola  magnetyczne  stosowane  są  w urządze- 
niach fizyki  jądrowej  do  przyspieszania  cząstek,  wy- 
prowadzania ich  z obszaru  akceleratorów,  separacji 
i identyfikacji.  Do  lat  sześćdziesiątych  stosowano 
wszędzie  w tych  wypadkach  przestrzennie  olbrzymie 
elektromagnesy  rdzeniowe,  wytwarzające  pola  tylko 
do  ok.  2 T,  zasilane  mocami  rzędu  dziesiątków  mega- 
watów. Właśnie  z tego  powodu  różnego  typu  akcele- 
ratory (np.  synchrotrony)  rozrastały  się  do  olbrzy- 
mich, kilometrowych  rozmiarów.  Zwiększenie  pola 
w tych  urządzeniach  np.  pięciokrotnie  pozwoliłoby  na 
porównywalne  zmniejszenie  wymiarów  lub  zwiększe- 
nie uzyskiwanej  energii.  W wielu  krajach  przygoto- 
wuje się  projekty  zastosowania  do  tego  celu  elektro- 
magnesów nadprzewodnikowych  o indukcji  ok.  5 T. 
Pola  impulsowe  do  30  T w elektromagnesach  o sto- 
sunkowo dużych  średnicach  stosuje  się  do  identyfi- 
kacji cząstek  w komorach  pęcherzykowych. 

Podobna  sytuacja  istnieje  w urządzeniach  do  syn- 
tezy termojądrowej.  Do  utrzymywania  plazmy  w ko- 
morze badawczej  stosuje  się  ,, butelki”  lub  „zwiercia- 
dła’ magnetyczne,  wytwarzające  pola  do  20  T.  W 
urządzeniach  pierścieniowych  typu  Tokamak  energia 
cząstek  plazmy  zależy  od  wielkości  pola  impulsowego 
działającego  na  cząstki,  a z kolei  do  ich  utrzymywania 
w rurze  trzeba  odpowiednio  dużego  pola  skierowanego 
wzdłuż  pierścienia.  W urządzeniu  Alcator  zbudowa- 
nym ostatnio  w Stanach  Zjednoczonych  zastosowano 
oba  pola  po  10  T. 

W magnetohydrodynamicznych  generatorach  ener- 
gii elektrycznej  pole  magnetyczne  służy  do  rozdziela- 
nia ładunków  w plazmie.  Zwiększenie  pola  przy  sto- 
sowaniu elektromagnesów  nadprzewodnikowych  pro- 
wadzi tu  — tak  jak  i w akceleratorach  — do  zmniej- 
szenia rozmiarów  lub  zwiększenia  uzyskiwanej  energii. 
Obecnie  próbuje  się  stosować  elektromagnesy  nad- 
przewodnikowe w-ytwarzające  pola  5 T zamiast  elek- 
tromagnesów rdzeniowych.  W Japonii  zbudowano  np. 
elektromagnes  nadprzewodnikowy  wytwarzający  w 
komorze  o poprzecznych  wymiarach  1,3  x 0,4  m i dłu- 
gości 2,8  m pole  do  4,5  T.  Masa  jego  przekracza  50  ton. 

Pole  magnetyczne  może  służyć  nie  tylko  do  przy- 
spieszania cząstek  elementarnych.  Jeżeli  w polu  sil- 
nego elektromagnesu  impulsowego  umieścimy  meta- 
lową kulkę,  to  prądy  indukowane  w metalu  wytworzą 
własne  pola  skierowane  przeciwnie  do  pola  głównego 
i kulka  będzie  wypychana  z pola  na  zewnątrz  (rys.  2c). 

W doświadczeniach  z ciałami  o masie  ok.  2 g uzyska- 
no prędkości  powyżej  100  km/s.  Podobny  efekt  — 
wypychanie  metalu  w polu  impulsowym  — stosuje  się 
w technice  do  walcow-ania  prętów  i prasowania  nawet 


skomplikowanych  kształtek.  W ten  sposób  wytwarza 
się  również  wysokie  ciśnienia  stosowane  do  badań 
fizycznych,  a także  wysokie  ciśnienia  w przemyśle  do 
kształtowania  metali. 


Wytwarzanie  silnych  póS 
magnetycznych 

Pole  magnetyczne  wytworzone  wokół  prostego  prze- 
wodu z przepływającym  prądem  jest  niedogodne  do 
badań,  gdyż  zmienia  się  silnie  w przestrzeni.  Do  do- 
świadczeń fizycznych  potrzebne  są  pola  jednorodne 
w obszarach  o rozciągłości  od  jednego  do  kilku  cen- 
tymetrów i większych.  Uzyskuje  się  je  najprościej  w 
solenoidzie.  Jednostką  natężenia  pola  jest  A/cm  właś- 
nie dlatego,  że  dla  wytworzenia  pola  w solenoidzie 
trzeba  przez  uzwojenie  przepuścić  tyle  amperów  na 
1 cm  długości  solenoidu,  ile  ma  wynieść  natężenie  po- 
la; np.  dla  wytworzenia  pola  o indukcji  około  10  T, 
tzn.  o natężeniu  105  A/cm,  przez  każdy  cm  długości 
solenoidu  trzeba  przepuścić  prąd  o natężeniu  100  tvs. 
amperów  (może  to  być  10*  A w jednym  przewodzie 
lub  po  1000  A w stu  przewodach).  Pole  można  zwięk- 
szyć nakładając  solenoidy  na  siebie,  gdyż  pola  po- 
szczególnych solenoidów  dodają  się.  W ten  sposób 
otrzymujemy  cewkę  cylindryczną  z wewnętrznym 
otworem  pomiarowym.  Natężenie  pola  w danej  cewce 
jest  zawsze  proporcjonalne  do  natężenia  prądu  i licz- 
by zwojów,  a ponadto  zależy  od  kształtu  i wielkości 
cewki  oraz  rozkładu  prądu  wewnątrz  (w  różnych  czę- 
ściach cewki  można  przepuszczać  prądy  o różnych 
natężeniach).  Zwoje  dalej  położone  od  środka  cewki 
wytwarzają  pole  słabsze,  ich  działanie  jest  więc  mniej 
skuteczne. 

Elektromagnesy  do  wytwarzania  silnych  pól  mag- 
netycznych nie  zawsze  mają  kształty  cylindryczne 
(jak  np.  solenoid).  W wielu  doświadczeniach  z fizyki 
jądrowej,  w urządzeniach  termojądrowych  czy  w ge- 
neratorach magnetohydrodynamicznych  stosuje  się 
elektromagnesy  o nieraz  bardzo  skomplikowanych 
kształtach,  dostosowanych  do  żądanego  przebiegu 
linii  sił  pola  magnetycznego  (rys.  6 i il.  61,  tabl.  16). 
Pola  magnetyczne  uzyskiwane  różnymi  metodami 
mają  zawsze  ograniczoną  wartość,  która  zależy  od 
sposobu  uzyskiwania  pola. 
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Rys.  6.  Elektromagnes  typu  Bittcra:  a)  Schemat  budowy  cewki 
(strzałki  oznaczają  drogę  przepływu  prądu).  Narysowano  tylko 
część  otworków  tworzących  w cewce  kanaliki  dla  przepływu  wody 
chłodzącej,  b)  Wygląd  kompletu  blach  uzwojenia  trzyccwko- 
wego  elektromagnesu  wytwarzającego  pole  20  T (Międzynaro- 
dowe Laboratorium  Silnych  Pól  Magnetycznych  i Niskich  Tem- 
peratur, Wrocław).  Widoczne  otworki  — to  kanaliki  chłodzące 


Energia  elektryczna  doprowadzana  do  elektromag- 
nesu jest  potrzebna  do  wytwarzania  pola  w czasie 
jego  narastania  oraz  do  pokonania  oporu  elektrycz- 
nego stawianego  przez  przewodnik  przy  przepływie 
prądu.  Zużycie  energii  na  wytworzenie  pola  odgrywa 
istotną  rolę  w elektromagnesach  impulsowych.  Wy- 
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dzielanie  ciepła  wskutek  przepływu  prądu  zachodzi 
natomiast  zarówno  w elektromagnesach  impulso- 
wych, jak  i elektromagnesach  wytwarzających  pola 
stałe.  Dlatego  najekonomiczniejsze  są  elektromagnesy 
nadprzewodnikowe. 

elektro-  Ze  względu  na  brak  oporu  elektrycznego  prąd  może 
magnesy  przepływać  przez  nadprzewodniki  bez  strat  energii, 
nadprze-  Wydawałoby  się  więc,  że  wystarczy  nawinąć  cewkę 
wodnikowe  z nadprzewodnika,  zanurzyć  w ciekłym  helu,  prze- 
puścić określony  prąd  i otrzymamy  odpowiednie  pole. 
Okazuje  się  jednak,  że  istnieją  tu  dwa  ograniczenia. 
Zasadnicze  polega  na  tym,  że  każdy  nadprzewodnik 
traci  własności  nadprzewodzące  w polu  powyżej  pola 
krytycznego  (rys.  3).  Te  szczytowe  wartości  praktycz- 
nie też  nie  są  osiągalne,  gdyż  w danym  polu  przez 
nadprzewodnik  może  płynąć  tylko  ograniczony  prąd. 
Można  to  skompensować  znacznym  wzrostem  obję- 
tości cewki,  co  jest  nieekonomiczne.  Dlatego  najwyż- 
sze pola  magnetyczne  uzyskiwane  w elektromagne- 
sach nadprzewodnikowych  wynoszą  17,5  T,  a projek- 
tuje się  magnesy  na  20  T (mimo  że  maksymalne  pola 
krytyczne  stosowanych  materiałów  wynoszą  ok. 
25  T).  Tak  więc  dla  uzyskania  pól  wyższych  trzeba 
wydatkować  znaczną  energię. 

straty  Aby  zdać  sobie  sprawę  z wielkości  strat  energii, 
energii  zrobimy  przykładowe  oszacowanie.  Wyobraźmy  so- 
bie, że  z pręta  miedzianego  o grubości  1 cm  wykona- 
my solenoid  o średnicy  4 cm  i długości  20  cm.  Dla 
uzyskania  10  T musimy  przepuścić  prąd  o natężeniu 
105  A.  Znając  długość  pręta  (ok.  3 m)  i opór  właściwy 
miedzi  możemy  obliczyć  opór  pręta  i wydzieloną  moc. 
Wynosi  ona  aż  6 MW. 

Rzeczywiste  elektromagnesy  wytwarzające  takie 
pola  pobierają  moc  mniejszą,  ok.  2 MW.  Ponieważ 
moc  rośnie  proporcjonalnie  do  kwadratu  natężenia 
prądu  — rośnie  ona  z kwadratem  pola.  Taki  sam  so- 
lenoid na  20  T zużyje  już  teoretycznie  8 MW.  Dla 
porównania:  trzydziestotysięczne  miasto  zużywa  dla 
potrzeb  gospodarstwa  domowego  wieczorem  ok. 
4 MW.  Ta  sama  moc  może  ogrzać  w ciągu  sekundy 
10  kg  miedzi  do  temperatury  topnienia. 

Ostatni  przykład  wskazuje,  że  gdyby  nie  przedsię- 
wziąć żadnych  środków  ostrożności,  uzwojenie  elek- 
tromagnesu stopiłoby  się  w ciągu  kilkudziesięciu 
sekund.  Dlatego  elektromagnesy  takie  muszą  być 
chłodzone,  najczęściej  wodą  o wysokiej  czystości 
(dla  uniknięcia  korozji  i elektrolizy), 
elektro-  W zakresie  mniej  więcej  do  20  T moc  pobierana 
magnesy  przez  cewki  rośnie  proporcjonalnie  do  kwadratu  pola, 
dużej  mocy  potem  jednak  wzrost  staje  się  coraz  szybszy.  Tak  np. 

dla  uzyskania  pola  40  T zamiast  22  x 8 = 32  MW 
trzeba  by  dostarczyć  około  200  MW.  Takie  elektro- 
magnesy są  już  projektowane,  ale  na  budowę  ich 
mogą  sobie  pozwolić  tylko  najbogatsze  kraje.  Przy- 
czyną silnego  wzrostu  mocy  są  naprężenia  mecha- 
niczne w cewkach. 

Wiadomo,  że  pole  magnetyczne  działa  na  przewod- 
nik z prądem  siłą  proporcjonalną  do  iloczynu  natę- 
żenia prądu  i indukcji  pola.  Ponieważ  zaś  samo  pole 
jest  proporcjonalne  do  natężenia  prądu,  siły  działające 
na  uzwojenie  rosną  z kwadratem  pola.  Są  to  siły  ścis- 
kające uzwojenie  wzdłuż  osi  i rozrywające  je  promie- 
niście na  zewnątrz.  W polach  ok.  25  T osiąga  się 
granicę  wytrzymałości  miedzi.  Należy  więc  zastąpić 
ją  materiałem  bardziej  wytrzymałym,  ale  o większym 
oporze  właściwym  (co  daje  dodatkową  stratę  energii), 
albo  zmniejszyć  natężenie  prądu  w ośrodku  magnesu, 
a to  oznacza  powiększanie  rozmiarów  magnesu.  Po- 
nadto ilość  kanałów  chłodzących  nie  może  być  do- 
wolnie duża,  np.  nie  mogą  się  one  z sobą  stykać,  gdyż 
uniemożliwiłyby  przepływ  prądu.  Wszystko  to  pro- 
wadzi do  wzrostu  wielkości  cewki,  przy  niezmiennej 
średnicy  wewnętrznej,  i do  lawinowego  wzrostu  tra- 
conej mocy.  

Największe  pola  o mocy  do  23  T w magnesach 
chłodzonych  wodą  otrzymywane  są  w Laboratorium 
Silnych  Pól  CNRS  w Grenoble  i w Narodowym 
Laboratorium  Magnetycznym  MIT  w Cabmridge 


(USA),  poza  tym  istnieje  ok.  15  ośrodków  dysponu- 
jących polami  słabszymi. 

W poszukiwaniu  sposobów  zmniejszenia  mocy  nie- 
zbędnych do  zasilania  elektromagnesów  zwrócono 
uwagę  na  możliwość  zmniejszenia  oporu  właściwego 
metalu  przez  obniżenie  temperatury.  Opór  właściwy 
miedzi  w ciekłym  azocie  maleje  ok.  6 razy,  w ciekłym 
wodorze  lub  ciekłym  helu  — kilkaset  razy,  a opór 
bardzo  czystego  aluminium  — kilka  tysięcy  razy. 
Z megawatów  przechodzimy  więc  już  do  kilowatów. 
Jakkolwiek  pobór  mocy  bezpośrednio  przez  elektro- 
magnes odpowiednio  maleje,  to,  jeśli  się  wliczy  koszty 
skraplania,  okazuje  się,  że  opłacalna  jest  tylko  praca 
elektromagnesu  wykonanego  z aluminium  chłodzo- 
nego ciekłym  helem. 

W latach  sześćdziesiątych  wykonano,  głównie  w 
Stanach  Zjednoczonych,  kilka  elektromagnesów  do 
pracy  ciągłej.  Nie  znalazły  one  jednak  szerszego  za- 
stosowania ze  względu  na  znaczne  ilości  zużywanego 
chłodziwa.  Dla  przykładu:  wykonany  w Boulder 
elektromagnes  na  10  T,  o mocy  zasilania  5 kW  (za- 
miast normalnie  ok.  3,5  MW),  zużywał  ok.  600  1 
ciekłego  wodoru  na  godzinę.  Toteż  obecnie  elektro- 
magnesy kriogeniczne  stosuje  się  na  ogół  do  pracy 
impulsowej. 

Stosunkowo  niedawno  (w  1966  r.)  wysunięto  ideę 
połączenia  cech  elektromagnesu  dużej  mocy  (wytwa- 
rzanie silnych  pól)  i nadprzewodnikowego  (moc  zasi- 
lania bardzo  mała).  Nakładając  na  elektromagnes 
dużej  mocy  (np.  20  T)  elektromagnes  nadprzewodni- 
kowy na  10  T otrzymamy  układ  wytwarzający  pole 
30  T przy  nie  zmienionej  mocy  zasilania.  W 1974  r. 
ukończono  budowę  takich  elektromagnesów  w dwu 
ośrodkach  (IEA  w Moskwie  i MIT  w USA;  rys.  7 
i il.  60,  tabl.  16).  Obecnie  na  świecie  pracują  już  4 
magnesy  hybrydowe,  a najsilniejsze  pole  wytworzone 
w nich  wynosi  30  T. 


Rys.  7.  Schemat  elektromagnesu  hybrydowego  wytwarzającego 
pole  25  T,  wykonanego  w Instytucie  Energii  Atomowej  w Mo- 
skwie. Część  wewnętrzna  chłodzona  wodą  wytwarza  pole  18,4  T 
przy  mocy  zasilania  5,6  MW,  część  zewnętrzna,  nadprzewodząca, 
wytwarza  pole  6,3  T.  Elektromagnes  nadprzewodnikowy  (zanu- 
rzony w zbiorniku  z ciekłym  helem)  ma  masę  ok.  1,5  t i średnicę 
zewnętrzną  70  cm 

Opisane  dotychczas  elektromagnesy  mogą  utrzy- 
mywać zadaną  wartość  pola  przez  czas  dostatecznie 
długi,  np.  kilkadziesiąt  minut.  Wykorzystuje  się  je  do 
badań  wymagających  dłuższego  czasu  lub  takich, 
w których  stałość  pola  odgrywa  istotną  rolę.  Prowa- 
dzi się  więc  w nich  badania  fizyczne  ciał  stałych,  zwła- 
szcza metali,  opisane  w poprzednim  rozdziale.  Sto- 
suje się  je  również  w niektórych  urządzeniach  fizyki 
jądrowej. 

Pola  silniejsze,  powyżej  30  T,  uzyskuje  się  metodą 
bardziej  oszczędną.  Ponieważ  pobieranie  przez  dłuż- 
szy czas  prądu  o mocy  dziesiątków  lub  setek  mega- 
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elektro-  watów  jest  zbyt  kosztowne,  doprowadzamy  taki  prąd 
magnesy  d°  elektromagnesów  odpowiednio  krótkimi  impul- 
impulsowe  sami,  gromadząc  energię  elektryczną  w urządzeniach 
zasilających  przez  czas  stosunkowo  długi,  w przer- 
wach między  impulsami.  Wówczas  średnia  moc  po- 
bierana może  być  dostatecznie  niska.  Przykładem 
może  być  największy  elektromagnes  chłodzony  wodą 
w Canberrze  (Australia),  zasilany  mocą  szczytową 
30  MW  w ciągu  paru  sekund,  a wytwarzający  pole 
30  T.  Ogólnie  ma  tu  zastosowanie  zasada:  silniejsze 
pole  — krótszy  czas.  Dalszym  sposobem  zmniejszania 
mocy  pobieranej  jest  zmniejszenie  średnicy  wewnę- 
trznej cewki,  np.  do  1 cm.  Cewki  są  wówczas  nawinię- 
te z drutu,  bądź  stanowią  jednowarstwowe  solenoidy 
(rys.  8),  czy  wreszcie  składają  się  tylko  z jednego 
zwoju.  Im  mniej  zwojów,  tym  krótszy  czas  impulsu. 


Rys.  8.  Schemat  jednowarstwowego  elektromagnesu  impulso- 
wego. Pola  impulsowe  do  ok.  50  T wytwarzane  są  tą  metodą 
w Polsce  w różnych  instytutach  Warszawy,  Poznania  i Wrocławia 

Do  zasilania  typowych  cewek  stosuje  się  na  ogół  ba- 
terie kondensatorów.  Tak  np.  w jednym  z najwię- 
kszych laboratoriów  tego  typu  w Los  Alamos  ba- 
teria może  zmagazynować  energię  10  min  J.  Mini- 
malny czas  rozładowania  wynosi  4 ps.  Dzieląc  energię 
przez  czas  otrzymujemy  moc  rzędu  1012  W (milion 
megawatów);  otrzymywane  pola  sięgają  400  T. 
wpływ  samo-  Wydawałoby  się,  że  można  zwiększać  liczbę  kon- 
indukcji  kon-  densatorów  i skracać  czas  rozładowania.  Jednak  jest 
densatorów  to  niemożliwe:  czas  rozładowania  ogranicza  bowiem 
na  moc  elek-  samoindukcja  kondensatorów,  a zwiększenie  ich  licz- 
tromagne-  by  powiększa  samoindukcję  obwodu  (długość  połą- 
sów  czeń). 

Cewki  elektromagnesów  impulsowych  na  ogół  są 
chłodzone  cieczami  kriogenicznymi  w celu  obniże- 
nia oporu  elektrycznego.  W trakcie  impulsu  prądu 
ciepło  wydzielane  w cewce  nie  może  szybko  wy- 
dostać się  na  zewnątrz,  a zatem  cewka  się  ogrzewa. 
W wypadku  impulsów  najkrótszych  prąd  płynie  tylko 
po  powierzchni,  ponadto  pole  magnetyczne  dyfun- 
dując  w głąb  solenoidu  nadtapia  warstwę  naskórkową 
metalu.  Z tego  względu,  a także  z uwagi  na  naprężenia 
mechaniczne  przekraczające  wytrzymałość  materiału, 
cewki  wytwarzające  pola  powyżej  100  T ulegają  każ- 
dorazowo rozerwaniu  lub  deformacji, 
ściskanie  Do  otrzymywania  pól  jeszcze  wyższych  stosuje  się 
strumienia  inne  metody.  Wyobraźmy  sobie,  że  wytworzymy  pole 
magnetycz-  o indukcji  10  T w cienkościennym  cylindrze  metalo- 
nego  wym  o osi  skierowanej  wzdłuż  pola,  a następnie  bę- 
dziemy go  szybko  ściskać  promieniście  ku  osi.  Wsku- 


tek tego  zmniejszać  się  będzie  przekrój  cylindra,  za- 
chowany natomiast  zostanie  strumień  indukcji  mag- 
netycznej. Ponieważ  strumień  magnetyczny  jest  to 
iloczyn  indukcji  magnetycznej  i powierzchni  obejmo- 
wanej przez  przewodnik  (w  tym  wypadku  — pole 
przekroju  cylindra),  zachowanie  stałej  wartości  stru- 
mienia przy  //-krotnym  zmniejszeniu  powierzchni 
przekroju  powoduje  w-krotny  wzrost  indukcji  mag- 
netycznej. Przy  typowych  wartościach  średnic  cy- 
lindra: początkowej  10  cm  i końcowej  0,5  cm,  pole 
przekroju  maleje  400  razy;  odpowiednio  do  tego  pole 
magnetyczne  powinno  wzrosnąć  z 10  T do  4000  T.  zastosowanie 
W rzeczywistości  osiąga  się  wzrost  dwustukrotny,  z ładunków 
powodu  częściowego  wypływu  strumienia  magnetycz-  wybucho- 
nego  przez  ścianki  cylindra.  Do  ściskania  cylindra  wych 
stosuje  się  eksplozje  ładunków  wybuchowych  (rys.  9). 

Ograniczeniem  tej  metody  jest  wartość  ciśnienia 
wytwarzanego  przez  istniejące  materiały  wybuchowe, 
wskutek  czego  pierścieniowi  można  nadać  tylko  ogra- 
niczone przyspieszenie.  Jest  ono  ograniczone  jego 
masą  oraz  siłami  elektrodynamicznymi  wynikającymi 
z ruchu  przewodnika  w polu  magnetycznym.  W miarę 
wzrostu  pola  ruch  ścianek  cylindra  jest  hamowany 
rosnącym  przeciwdziałaniem  pola  magnetycznego 
(równoważne  ciśnieniu  1Q12  Pa  w polu  1500  T).  A więc 
dalszy  rozwój  wymaga  albo  stosowania  silniejszych 
materiałów  wybuchowych,  albo  nowych  metod.  Me- 
todą ściskania  strumienia  magnetycznego  uzyskuje 
się  pola  do  1500  T,  przy  czym  rekordowe  pole  wy- 
nosiło 2500  T (rys.  1). 


Rys.  9.  Schemat  jednego  z możliwych  urządzeń  do  uzyskiwania 
najsilniejszych  pól  magnetycznych  metodą  ściskania  strumienia 
magnetycznego.  Zużywa  się  10-20  kg  materiału  wybuchowego 

Pola  impulsowe  stosuje  się  we  wszystkich  zagadnie- 
niach opisanych  w rozdziale  o zastosowaniach  silnych  zastosowa- 
pól  magnetycznych,  a więc  zarówno  do  badań  ciał  ni©  pól  im- 
stałych,  jak  też  w fizyce  jądrowej  czy  termojądrowej,  pulsowych 
Jednakże  długość  impulsu  pola  musi  być  dostosowana 
do  danego  zagadnienia  fizycznego,  a to  z kolei  ogra- 
nicza wielkość  stosowanych  pól  magnetycznych.  Moż- 
na podać  orientacyjnie,  że  w urządzeniach  fizyki  ją- 
drowej i termojądrowej  stosuje  się  pola  do  30  T, 
w badaniach  ciał  stałych  — do  kilkuset  T.  Pola  naj- 
wyższe, powyżej  1000  T stosuje  się  w badaniach  plaz- 
my oraz  do  wytwarzania  dużych  ciśnień. 

P.  Byszewski,  A.  Szymdorski  Ekstremalne  pola  magnetyczne , 

Problemy  nr  1,  334  (1974);  D.  S.  Parasnis  Magnetyzm , War- 
szawa 1970;  J.  Szpilecki  A łegagausowe  pola  magnetyczne , Post. 

Fiz.  19,  411  (1968);  W.  Zawadzki  O silnych  polach  magnetycz- 
nychr,  Problemy  nr  4,  217  (1964). 
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Wydarzenia  w kosmosie  i w świecie  wielkich  energii 
fizyki  jądrowej  usunęły  w cień  właściwą  rewolucję 
techniczną  przebiegającą  na  naszych  oczach,  rewo- 
lucję, bez  której  te  wielkie  osiągnięcia  naszej  doby  nie 
byłyby  w ogóle  możliwe.  Mowa  — oczywiście  — 

0 elektronice.  Hasło  elektronika  kojarzy  się  najczęściej 
z telewizją  i radiotechniką,  z komputerami  (elektro- 
nowymi mózgami)  i automatyką  przemysłową,  radio- 
lokacją i elektromedycyną.  Szybki  postęp  w rozwoju 
tych  urządzeń  uświadamiamy  sobie,  gdy  nasze  dzieci 
grymaszą,  że  odbiornik  radiowy  nie  dość  łatwo  mieści 
im  się  w kieszonce  lub  że  kolory  na  pokazie  telewi- 
zyjnym nie  są  dość  naturalne.  Od  czasu  do  czasu 
prasa  stara  się  nas  olśnić  możliwościami  „myślących” 
maszyn,  a gdy  przypadkiem  trafimy  pod  opiekę  me- 
dycyny, przerażają  nas  coraz  bardziej  wymyślne  urzą- 
dzenia badające  człowieka  swymi  elektrycznymi 
mackami. 

elektronika  U źródeł  tego  rozwoju  stoi  skromnie  właściwa 
techniczna  elektronika,  zwana  inaczej  elektroniką  techniczną, 
zajmująca  się  wytwarzaniem  bardzo  nieefektownych 
przyrządów,  jak  lampy  elektronowe  (w  tym  lampy 
radiowe)  i przyrządy  półprzewodnikowe  (diody,  tran- 
zystory, hallotrony  i in.).  Pierwsze  przyrządy  elektro- 
nowe pojawiły  się  w początkach  naszego  stulecia 

1 z punktu  narzuciły  burzliwy  rozwój  radiotechnice. 
Ale  zajmujący  się  nimi  naukowcy  niemal  od  razu 
spostrzegli,  że  rola  ich  będzie  znacznie  większa.  Istotą 
działania  tych  przyrządów  było  i jest  wykorzystanie 
ruchu  swobodnych  elektronów  do  wykrywania,  se- 
lekcjonowania, wzmacniania  i przetwarzania  dociera- 
jących do  nich  bodźców-sygnałów.  A to  przecież  jest 
istotą  działania  poszczególnych  komórek  i całych 
systemów  nerwowych,  jest  istotą  procesu  myślenia. 

Jak  wiadomo,  wspaniałe  działanie  naszego  mózgu 
zawdzięczamy  ogromnej  liczbie  elementarnych  ko- 
mórek mikroskopijnej  wielkości.  Pierwsze  lampy  elek- 
tronowe miały  kilkanaście  cm  wysokości,  toteż  zesta- 
wienie bodaj  kilkuset  takich  „komórek”  stawało  się 
dosłownie  monstrualnym  problemem, 
tranzystor  — Zasadnicza  zmiana  nastąpiła  z chwilą,  gdy  wyna- 
przełom  w leziono  tranzystor  — wzmacniający  przyrząd  elektro- 
elektronice  nowy  wykorzystujący  ruch  elektronów  nie  w próżni, 
jak  to  było  w lampach,  lecz  w ciele  stałym  (a  ściślej  — 
w półprzewodniku).  Szybkość  rozwoju  produkcji 
tranzystorów,  a wraz  z nimi  innych  przyrządów  elek- 
tronowych, jest  czymś,  nawet  w skali  pojęć  dwudzies- 
towiecznych tak  wyjątkowym,  że  śmiało  można  mówić 
o „eksplozji”  elektroniki.  Jeśli  się  przyjmie,  że  w 
1950  r.  na  całym  świecie  wyprodukowano  przyrządów 
elektronowych  za  sumę  ok.  5 mld  umownych  jedno- 


stek monetarnych,  to  w 1960  r.  wyprodukowano  ich 
już  za  25  mld,  a w 1970  — za  48  mld.  W 1980  r.  war- 
tość wyprodukowanych  przyrządów  elektronowych 
wyniosła  już  183  mld  takich  umownych  jednostek. 

Zastosowania  przyrządów  półprzewodnikowych 
obejmują,  jak  powódź,  coraz  to  nowe  dziedziny,  przy 
czym  ekspansja  techniczna  łączy  się  tu  z ekspansją 
ekonomiczną.  I tak  np.  zbudowany  w 1966  r.  pierw- 
szy kalkulator  elektroniczny  zawierał  w sobie  pokaźną 
liczbę  diod  i tranzystorów  łącznej  wartości  170  dola- 
rów. Osiem  lat  później  wewnątrz  takiego  samego  kal- 
kulatora jest  jeden  tylko  przyrząd  półprzewodniko- 
wy— układ  scalony  wielkiej  skali  integracji,  który 
kosztuje  3,5  dolara ; układ  ten  jest  przy  tym  znacznie 
bardziej  niezawodny  i eliminuje  prawie  całkowicie 
czynności  montażowe  w produkcji  kalkulatora.  W 
tych  warunkach  staje  się  zrozumiałe,  że  w 1971  r. 
w USA  sprzedawano  takie  kalkulatory  na  sztuki, 
a dwa  lata  później,  w 1973  r.,  sprzedano  ich  ok. 

6,5  min  sztuk  za  700  min  dolarów.  Podobnie  wygląda 
rynek  zegarków  elektronicznych.  Takie  przykłady 
można  mnożyć  i mnożyć. 

Entuzjaści  elektroniki  twierdzą,  że  postęp,  który 
wprowadza  ona  do  techniki  i w ogóle  do  ludzkiego 
życia,  da  się  porównać  jedynie  z postępem,  który 
nastąpił  po  wprowadzeniu  metali  w miejsce  narzędzi 
i przedmiotów  użytkowych  wykonywanych  z kamie- 
nia. Możliwe,  trzeba  jednak  pamiętać,  że  tamten  pro- 
ces trwał  wiele  wieków. 

Co  da  człowiekowi  elektronika  za  następne  50  lat? 

Jak  zmieni  oblicze  naszej  planety  w XXI  wieku? 

Ryzykowna  byłaby  przepowiednia,  zwłaszcza  po  tym, 
co  wyżej  powiedziano  o czasie  minionym.  Już  w tej 
chwili  jest  niemal  pewne,  że  następnym  krokiem  będą 
tzw.  przyrządy  funkcjonalne.  Przebiegające  w nich  przyrządy 
procesy  będą  odwzorowaniem  fizycznym  lub  matema-  funkcjonalne 
tycznym  zjawisk  rządzących  otaczającym  nas  świa- 
tem. Dzięki  takim  przyrządom  pojedynczy  człowiek 
zostanie  być  może  wyposażony  w dodatkowy  mózg, 

„mózg  elektronowy”,  który  zwielokrotni  jego  możli- 
wości zarówno  w dziedzinie  ochrony  zdrowia,  orga- 
nizacji pracy  i odpoczynku,  jak  i,  miejmy  nadzieję, 
w służbie  innym  ludziom. 


Elektronika  półprzewodnikowa 
w zbliżeniu 

Cóż  to  jest  ta  elektronika  półprzewodnikowa?  Według 
definicji  jest  to  dziedzina  nauki  i techniki  zajmująca 
się  praktycznym  wykorzystaniem  zjawisk,  w których 
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podstawowe  znaczenie  ma  dający  się  sterować  ruch 
elektronów  w półprzewodnikach.  Obejmuje  ona  teo- 
rię, konstrukcję  i technologię  przyrządów  półprze- 
wodnikowych. Jak  niemal  każda  dziedzina  techniki, 
wyrosła  na  gruncie  osiągnięć  fizyki,  a zwłaszcza  fizyki 
ciała  stałego.  Natomiast  w przeciwieństwie  do  więk- 
szości innych  dziedzin  — elektronika  półprzewodni- 
ków wykorzystała  i wykorzystuje  osiągnięcia  fizyki 
(odkrycia  zjawisk)  w bardzo  krótkim  czasie  po  ich 
sformułowaniu,  a często  nawet  korzysta  ze  zjawisk 
będących  dopiero  przedmiotem  badań.  Stąd  ścisłe 
powiązanie  tych  dwu  gałęzi  wiedzy,  stąd  liczne  rzesze 
fizyków  pracujących  jako  elektronicy  i na  odwrót. 

Elektronika  półprzewodników  rozpoczęła  swój 
niezależny  byt  od  skonstruowania  dwóch  elementar- 
nych przyrządów  półprzewodnikowych:  diody  (po- 
czątek naszego  stulecia)  i tranzystora  (1948  r.).  Ist- 
nienie tych  przyrządów  stymulowało  badania  nad 
materiałami  półprzewodnikowymi  i nad  technologią 
struktur  półprzewodnikowych.  Rozwój  tych  ostatnich 
doprowadził  do  wynalezienia  kilkudziesięciu  innych 
przyrządów,  bądź  wykorzystujących  nowe  zjawiska 
w strukturze  jedno-  lub  dwuzłączowej,  bądź  stano- 
wiących zupełnie  nowe  formy  (kombinacja  złącz, 
kontaktów  i kondensatorów),  bądź  wreszcie  będących 
powieleniem  przyrządów  klasycznych  w monolityczny 
układ  scalony.  Rozwój  technologii  doprowadził  w la- 
tach sześćdziesiątych  do  nowego  skoku  jakościowego, 
do  technologii  epiplanarnej  i MOS,  umożliwiających 
stosunkowo  łatwe  i niedrogie  (wielkoseryjne)  wytwa- 
rzanie bardzo  skomplikowanych  układów.  Wówczas 
to  wyodrębniono  pojęcie  mikroelektroniki  — tej  dzie- 
dziny elektroniki  półprzewodnikowej,  która  się  zaj- 
muje układami  scalonymi.  Oczywiście  metody  tech- 


nologiczne mikroelektroniki  umożliwiają  wytwarzanie 
również  wielu  innych  przyrządów  półprzewodniko- 
wych, przy  czym  dają  możność  łączenia  ich  z gotowy- 
mi wzmacniaczami,  przetwornikami  itp.  Można  w ten 
sposób  skonstruować  fotodetektor  z układem  zasila- 
jąco-detekcyjnym,  hallotron  ze  wzmacniaczem  itp. 

Słuszniej  byłoby  wobec  tego  mówić  dziś  o mikro- 
elektronice jako  dziedzinie  podstawowej,  a o pozo- 
stałych dziedzinach  elektroniki  półprzewodnikowej  — 
jako  o częściach  czy  szczególnych  przypadkach  mikro- 
elektroniki. Tradycyjnie  jednak  (jeśli  można  mówić  podział 

0 tradycji  w dyscyplinie  liczącej  sobie  tak  naprawdę  elektroniki 
niespełna  30  lat)  dzieli  się  elektronikę  półprzewodni-  półprzewod- 
kową  inaczej,  przyjmując  za  kryterium  rodzaj  zasto-  nikowej 
sowania.  W ten  sposób  wyodrębniamy:  klasyczną 
elektronikę  półprzewodników,  zajmującą  się  diodami 

1 tranzystorami  w postaci  dyskretnej  (tj.  w postaci 
odrębnych  przyrządów);  mikroelektronikę,  zajmującą 
się  układami  scalonymi;  optoelektronikę  półprze- 
wodnikową, zajmującą  się  źródłami  (diody  elektrolu- 
minescencyjne, lasery,  wskaźniki  alfanumeryczne  itp.) 
i detektorami  promieniowania  oraz  ich  kombinacja- 
mi ; elektronikę  półprzewodnikowych  przyrządów 
bezzłączowych  (hallotrony,  gausotrony,  termistory 
itp.);  półprzewodnikową  elektronikę  mikrofalową, 
zajmującą  się  przyrządami  pracującymi  w zakresie 
mikrofal. 

W dalszych  rozdziałach  omówimy  dokładniej  waż- 
niejsze z tych  dziedzin.  Tu  warto  sobie  jedynie  uświa- 
domić ogromną  różnorodność  „elektronicznych  dzie- 
ci” (il.  8,  tabl.  2),  by  spotykając  je  dziś  w najdziwniej- 
szych nieraz  postaciach  i we  wszystkich  gałęziach 
ludzkiej  działalności,  wiedzieć,  że  pochodzą  z jednej 
rodziny. 


Fizyka 

przyrządów  półprzewodnikowych 

Stanisław  Sikorski 


Podstawę  działania  przyrządów  półprzewodnikowych 
stanowią  określone  zjawiska  fizyczne.  Jednym  z ta- 
kich zjawisk  jest  zwiększanie  się  lub  zmniejszanie 
koncentracji  nośników  ładunku,  a co  za  tym  idzie  — 
możliwość  regulacji  przewodności  właściwej  w pół- 
przewodnikach. Najprostszym  sposobem  zmian  kon- 
centracji jest  zmiana  temperatury  materiału,  jej  pod- 
wyższenie powoduje  w półprzewodnikach  wzrost 
koncentracji  nośników  (-►  Półprzewodniki).  Zjawisko 
to  zostało  wykorzystane  przy  konstrukcji  termisto- 
rów,  tj.  przyrządów  stosowanych  m.in.  w układach 
do  pomiaru  temperatury. 

Istnieje  jednak  możliwość  regulowania  przewod- 
nictwa w stałej  temperaturze,  „na  zimno”  (co  jest 
wykorzystywane  w większości  przyrządów  półprze- 
wodnikowych). Dodatkowe  nośniki  ładunku,  które 
powodują  zmianę  przewodnictwa  bez  podwyższania 
temperatury,  nazywamy  nadmiarowymi. 


Nośniki  nadmiarowe 

Znane  są  dwa  zjawiska  fizyczne  powodujące  wystę- 
powanie nośników  nadmiarowych:  zjawisko  fotoelek- 
tryczne  wewnętrzne  i wstrzykiwanie  nośników  wy- 
stępujące w złączach  p-n. 

przewodni-  W 1873  r.  W.  Smith  zaobserwował  silny  wpływ 
ctwo  selenu  światła  na  przewodnictwo  selenu.  Nie  znano  wtedy 
kwantowego  charakteru  tego  zjawiska.  Obecnie  dzię- 
ki teorii  pasmowej  (-►  Struktura  elektronowa  ciał 
stałych)  opis  jest  jasny.  Rzucając  strumień  światła  na 
półprzewodnik,  wprowadzamy  do  jego  wnętrza  kwan- 
ty światła,  fotony,  o energii  hv  ( h — stała  Plancka, 


v — częstość  drgań  fali  świetlnej).  Energetyczny  obraz 
zjawiska  przedstawia  rys.  1.  Wewnątrz  półprzewod- 
nika w paśmie  przewodnictwa  pojawia  się  dodatkowy 
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Rys.  1.  Przejścia  elektronów  przez  pasmo  zabronione:  a)  zja- 
wisko fotoelektryczne  wewnętrzne  — generacja  pary  dziura-elek- 
tron,  b)  rekombinacja  bezpośrednia  — promienista,  c)  rekombi- 
nacja pośrednia  — przez  centrum  rekombinacji 

elektron,  a w paśmie  podstawowym  (walencyjnym)  — fotoprze- 
puste  miejsce  po  wyrwanym  elektronie,  dziura,  która  wodnictwo 
stanowi  dodatni  nośnik  ładunku.  Następuje  więc  ge- 
neracja pary  dziura-elektron.  Powstałe  pary  nośników 
o różnych  znakach  tworzą  pewien  nadmiar  koncen- 
tracji w stosunku  do  koncentracji  wynikającej  z po- 
budzenia cieplnego,  dlatego  nośniki  te  nazywamy 
nadmiarowymi.  Koncentrację  nadmiarową  dziur 
oznaczamy  Ą p,  elektronów  An,  przy  czym: 

Ap  — Any  (1) 

gdyż  generacja  odbywa  się  parami.  Korzystając  z ogól- 
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nego  wzoru  na  elektryczną  przewodność  właściwą  a 
półprzewodnika  ( a — enpy  e — ładunek  elektryczny, 
n — koncentracja  nośników,  — ruchliwość;  — * 
Półprzewodniki)  i z powyższej  zależności,  możemy 
łatwo  obliczyć  przyrost  przewodności  właściwej  wy- 
wołanej oddziaływaniem  światła: 

Aa  — e{jJLn  An+jupAp)  = e(pn+Mp)Apy  (2) 

gdzie  jup  i Mn  — to  odpowiednio  ruchliwość  dziur 
i elektronów.  Przyrost  przewodności  właściwej  pod 
wpływem  światła  nosi  nazwę  fotoprzewcdnictwa. 
Zjawisko  to  wykorzystuje  się  w przyrządach  półprze- 
wodnikowych — fotoopomikach  (fotorezystorach), 
używanych  do  wykrywania  strumienia  świetlnego 
i pomiaru  jego  natężenia. 

W zjawisku  fotoprzewodnictwa  bardzo  duże  zna- 
czenie ma  fakt,  że  istnieją  nośniki  ładunku  dodatniego 
i ujemnego  (dwunośnikowy  mechanizm  przewodzenia 
prądu).  Pozwala  to  na  wytwarzanie  dużych  koncentra- 
cji nadmiarowych  nośników  ładunku  i zachowanie 
jednocześnie  wypadkowej  neutralności  elektrycznej 
nie  tylko  w całości  układu,  ale  i lokalnie  (warto  tu 
zwrócić  uwagę,  że  zjawisko  fotoprzewodnictwa  nie 
występuje  w metalach,  w których  jest  tylko  jeden  ro- 
dzaj nośników  ładunku  elektrycznego). 

Po  wyłączeniu  światła  fotoprzewodnictwo  nie  za- 
nika natychmiast  (rys.  2),  lecz  stopniowo,  a zanik  ma 
charakter  wykładniczy,  podobnie  jak  np.  rozpad  pro- 
mieniotwórczy. Zjawisko  zaniku  nośników  nadmiaro- 
wych nazywa  się  rekombinacją.  Czas  r,  po  upływie 


światło 


Rys.  2.  Zanik  fotoprzewodnictwa  po  wyłączeniu  oświetlenia: 
a)  oświetlona  próbka  półprzewodnikowa;  b)  zależność  natężenia 
strumienia  świetlnego  od  czasu  /,  c)  zależność  fotoprzewod- 
ności  Jer  od  czasu  i 

którego  Aa  zmniejszy  się  e = 2,72  raza,  nosi  nazwę 
czasu  życia  nośników  nadmiarowych.  Czasy  życia 
nośników  nadmiarowych  mogą  być  bardzo  różne; 
r = 10“ 8 s uznajemy  za  krótki,  r — 10“3  s — za  bar- 
dzo długi. 

Rekombinacja  może  następować  wskutek  samo- 
rzutnych przejść  elektronów  z pasma  przewodnictwa 
do  pasma  walencyjnego  (rys.  Ib).  Wytwarzającą  się 
przy  tym  energię  przejmuje  powstający  foton  o ener- 
gii hv , równej  przerwie  energetycznej  Eg.  Ten  rodzaj 
rekombinacji  nazywamy  rekombinacją  bezpośrednią 
lub  promienistą.  Ma  ona  bardzo  duże  znaczenie  jako 
podstawa  działania  przyrządów  optoelektronicznych 
(-►  Optoelektronika  półprzewodnikowa). 

W krzemie  i germanie  stwierdzono  bardzo  słabe 
promieniowanie  rekombinacyjne.  W tych  półprze- 
wodnikach występuje  więc  inny  sposób  rekombinacji, 
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tzw.  rekombinacja  pośrednia  (rys.  lc).  W przerwie 
energetycznej  oprócz  poziomów  lokalnych,  położo- 
nych w pobliżu  pasma  przewodnictwa  czy  pasma  wa- 
lencyjnego (poziomy  donorowe  i akceptorowe),  po- 
wstają poziomy  pochodzące  od  defektów  sieci  krysta- 
licznej lub  atomów  domieszkowych  niektórych  pier- 
wiastków (np.  miedzi),  stanowiących  centra  rekom- 
binacji. Poziomy  te  są  zlokalizowane  w pobliżu  środka 
przerwy  energetycznej.  Elektrony  nie  przechodzą  bez- 
pośrednio do  pasma  podstawowego,  lecz  najpierw 
spadają  na  poziom  energetyczny  centrum  rekombi- 
nacji, a stamtąd  — prawie  natychmiast  — do  pasma 
podstawowego,  zajmując  poziom  energetyczny  dziury. 
W rezultacie  znika  elektron  w paśmie  przewodnictwa 
i dziura  w paśmie  podstawowym.  Szereg  pierwiastków 
wprowadzonych  do  materiału  półprzewodnikowego 
powoduje  znaczną  rekombinację.  Tak  np.  miedź  przy 
koncentracji  4- 1014  atomów  w 1 cm3  kryształu  germa- 
nu sprawia,  że  r jest  rzędu  10" 5 s.  Ponieważ  1 cm3 
germanu  zawiera  4-1022  atomów,  zatem  wystarczy 
zaledwie  1 atom  miedzi  na  108  atomów  germanu, 
ażeby  wywierać  decydujący  wpływ  na  rekombinację. 
Zwiększenie  koncentracji  takiej  domieszki  zmniejsza, 
oczywiście,  proporcjonalnie  czas  życia.  Ta  sama  kon- 
centracja miedzi  w krzemie  daje  dziesięciokrotnie 
większy  skutek,  a więc  wymagania  co  do  czystości  są 
jeszcze  większe. 

Jak  już  powiedzieliśmy,  nośniki  nadmiarowe  od- 
grywają ogromną  rolę  w pracy  przyrządów  półprze- 
wodnikowych, dlatego  to  wielkość  czasu  życia  r 
w danym  materiale  ma  duże  znaczenie  praktyczne. 
Ten  parametr  materiału  jest  bardzo  istotny  także 
i dlatego,  że  dostarcza  cennych  informacji  o rodzaju 
domieszek  i defektów.  Warto  zwrócić  uwagę,  że  jest 
to  parametr  niezależny  od  przewodności  właściwej  <r, 
ponieważ  inne  domieszki  decydują  zazwyczaj  o czasie 
życia,  a inne  o przewodności. 

Czas  zaniku  fotoprzewodnictwa  w oświetlanych 
próbkach  nie  zależy  od  kształtu  próbek  i elektrod, 
natomiast  jest  w znacznym  stopniu  zależny  od  stanu 
powierzchni  (-*  Stany  powierzchniowe  w ciałach  sta- 
łych). Jeśli  zatem  chcemy  poznać  własności  rekom- 
binacyjne całej  objętości  kryształu,  musimy  zredu- 
kować wpływ  powierzchni.  Kiedy  dokonamy  bardzo 
starannej  obróbki  powierzchni  (polerowanie,  trawie- 
nie chemiczne  itp.),  czas  zaniku  fotoprzewodnictwa 
próbki  jako  całości  będzie  równy  czasowi  życia  r 
nośników  nadmiarowych.  Źle  obrobiona  powierzch- 
nia płytki  półprzewodnikowej  zawiera  ogromne  za- 
gęszczenie zakłóceń  sieci  krystalicznej,  działających 
jako  powierzchniowe  centra  rekombinacji,  niezależnie 
od  centrów  rekombinacji  wewnątrz  próbki.  Czas  za- 
niku fotoprzewodnictwa  jest  wówczas  dużo  mniejszy 
niż  czas  życia  objętościowy.  Jest  to  tzw.  efektywny 
czas  życia. 

Parametrem  określającym  rekombinacyjne  wła- 
sności powierzchni  jest  szybkość  rekombinacji  po- 
wierzchniowej S mierzona  w cm/s  (jest  to  szybkość 
dopływu  strumienia  nośników  nadmiarowych  rekom- 
binujących  na  powierzchni).  Jeśli  powierzchnia  jest 
dobrze  przygotowana  (gładka  i oczyszczona),  S = 
= 100  cm/s,  jeśli  chropowata,  S może  dochodzić  do 
105  cm/s. 

Rekombinacja  powierzchniowa  zależy  nie  tylko  od 
samej  obróbki,  ale  także  od  stanu  otaczającej  atmo- 
sfery (temperatury,  wilgotności  i innych  czynników), 
a ponadto  zmienia  się  z upływem  dni.  Ma  to  ogromne 
znaczenie  dla  pracy  przyrządów  półprzewodnikowych. 
Wskutek  różnych,  mniej  lub  bardziej  skutecznych 
zabiegów  technologicznych  uzyskuje  się  powierzchnie 
'o  dobrych  właściwościach,  a przede  wszystkim  dopro- 
wadza się  do  stabilizacji  tych  właściwości,  do  których 
należy  w pierwszym  rzędzie  szybkość  rekombinacji 
powierzchniowej.  Wielkim  osiągnięciem  nowoczesnej 
technologii  półprzewodników  stało  się  wykorzystanie 
specjalnie  wytwarzanej  na  płytkach  krzemu  warstwy 
tlenku  krzemu,  która  trwale  zabezpiecza  powierzch- 
nię i świetnie  stabilizuje  jej  własności  fizyczne. 
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Dyfuzja  i droga  dyfuzji  nośników 
nadmiarowych 

Rozważając  własności  i znaczenie  nośników  nadmia- 
rowych, nie  zajmowaliśmy  się  ich  rozkładem  prze- 
strzennym. Ważna  była  ich  ogólna  liczba  w próbce, 
ona  bowiem  decydowała  o ogólnym  fotoprzewodnict- 
wie.  Ponadto  wychodziliśmy  z założenia  (rys.  2a),  że 
próbka  jest  przeniknięta  strumieniem  świetlnym  wy- 
twarzającym równomierny  rozkład  nośników  nad- 
miarowych i że  oświetlamy  całą  próbkę.  A przecież 
w wielu  wypadkach  może  być  oświetlona  tylko  część 
próbki,  przy  czym  jeśli  nawet  oświetlimy  całą  próbkę, 
światło  nierównomiernie  dociera  do  wszystkich  punk- 
tów w jej  głębi.  Co  więcej,  bardzo  często  światło 
wnika  na  głębokość  dużo  mniejszą  niż  grubość  próbki. 
Wtedy  nadmiarowe  elektrony  i dziury  są  generowane 
tuż  pod  powierzchnią.  Jednakże  nie  wszystkie  nośniki 
nadmiarowe  są  skupione  tam,  gdzie  dociera  światło  — 
mają  one  możliwość  przemieszczania  się  dzięki  dy- 
fuzji. 

Matematycznym  wyrazem  dyfuzji  jest  prawo 
Ficka,  stwierdzające,  że  gęstość  strumienia  nośników 
jest  proporcjonalna  do  przestrzennego  spadku  kon- 
centracji nośników  (pochodna  względem  współrzęd- 
nej ze  znakiem  minus).  Przepływ  nośników  odbywa  się 
więc  w kierunku  od  większych  koncentracji  do  mniej- 
szych koncentracji. 

gęstość  Przypuśćmy,  że  dziury  są  rozłożone  w ten  sposób, 
prądu  że  spadek  koncentracji  występuje  tylko  w kierunku 
dyfuzyjnego  osi  x.  Przepływ  nośników  ładunku  dodatniego  stano- 
dziur  wi  jednocześnie  pewien  prąd  elektryczny  o tym  sa- 
mym zwrocie,  a zatem  na  mocy  prawa  Ficka  gęstość 
prądu  dyfuzyjnego  dziur: 

JpD=-eDp^,  (3) 

gdzie  Dp  jest  stałą  dyfuzji  dziur,  dpjdx  — przyrostem 
ich  koncentracji. 


Rys.  3.  Dyfuzja  nośników  nadmiarowych  w głąb  półprzewodnika 


gęstość 
prądu  dy- 
fuzyjnego 
elektronów 


Podobnie  dyfuzji  elektronów  towarzyszy  prąd  elek- 
tryczny o gęstości : 

JnD  — + e Dn  , 


gdzie  Dn  — stała  dyfuzji  elektronów. 
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Znając  ruchliwości  fip  i fin  nośników,  można  obli- 
czyć stałe  dyfuzji  Dv  i Dn  z zależności  Einsteina-Smo- 
luchowskiego : 


„ kT 

Dp — /*j>> 


r,  kT 

Dn  = f*n 

e 


(4) 


( kTje  = 0,026  V w temperaturze  pokojowej).  Stałe 
dyfuzji  nie  są  równe,  gdyż  ruchliwości  elektronów 
fin  i dziur  pp  nie  są  równe  (zależą  od  masy  efektywnej ; 
— ► Dynamika  elektronu  w ciałach  stałych).  Nośniki 
bardziej  ruchliwe  mają  więc  większą  stałą  dyfuzji. 

Wskutek  dyfuzji  nośniki  nadmiarowe  generowane 
tuż  pod  powierzchnią  próbki  półprzewodnikowej 
przemieszczają  się  w głąb  półprzewodnika,  dążąc  do 
wypełnienia  całej  objętości.  Jednakże  po  drodze  na- 
potykają centra  rekombinacji  i ulegają  zanikowi. 
Im  więcej  ich  przybywa  do  danego  miejsca,  tym  szyb- 
sza jest  rekombinacja.  Po  pewnym  czasie  (kilkakrotna 
wartość  r)  ustala  się  w każdym  punkcie  próbki  stan 
równowagi:  tyle  nośników  dopływa,  ile  ich  rekombi- 
nuje.  Równowagowy  rozkład  koncentracji  nośników 
nadmiarowych  pokazany  jest  na  rys.  3 zarówno  w 
sposób  poglądowy,  jak  i na  wykresie  (rys.  3b).  Przy 
powierzchni  jest  najwięcej  nośników,  w miarę  odda- 
lania się  w głąb  koncentracja  ich  maleje  w sposób 
wykładniczy.  Średnią  odległość,  którą  nośniki  prze- 
bywają od  powierzchni  w głąb  w czasie  swego  życia, 
nazywamy  drogą  dyfuzji  i oznaczamy  symbolem  Ld . 
Jest  to  odległość,  na  której  koncentracja  początkowa 
(Ap0  — dziur,  czy  Jn0 — elektronów)  zmniejsza  się 
e « 2,72  raza.  Droga  dyfuzji  jest  tym  większa,  im 
większa  jest  stała  dyfuzji  oraz  czas  życia  t nośników 
nadmiarowych.  Wielkość  ta  wyraża  się  wzorami : 

dla  półprzewodników  o przewodnictwie  dziurowym 

(typ  P)  

Ld  =yDnT  ; 

dla  półprzewodników  o przewodnictwie  elektrono- 
wym (typ  ń)  

Ld  = \ Dpr, 


Z tych  wzorów  wynika,  że  o drodze  dyfuzji  nośników 
nadmiarowych  decyduje  stała  dyfuzja  nośników  mniej- 
szościowych. Przy  wartościach  granicznych  r = 10“8- 
-10“3  s droga  dyfuzji  nośników  nadmiarowych  za- 
wiera się  w granicach  0,01-1  mm. 

Opisane  wyżej  dyfuzyjne  wnikanie  w głąb  materia- 
łu nośników  nadmiarowych  połączone  z ich  jedno- 
czesną rekombinacją  odgrywa  dużą  rolę  w pracy 
przyrządów  półprzewodnikowych,  w szczególności 
w złączu  p-n. 


Złącze  p-n 

Dotychczas  rozważaliśmy  przepływ  prądu  przez  prób- 
ki półprzewodnikowe  jednorodne.  Oznacza  to,  że  roz- 
mieszczenie domieszek  donorowych  lub  akceptoro- 
wych, a co  za  tym  idzie  — koncentracje  nośników  są 
jednakowe  we  wszystkich  miejscach  próbki. 

Najprostszym  rodzajem  półprzewodnika  niejedno- 
rodnie domieszkowanego,  zwanego  strukturą  pół- 
przewodnikową, jest  bryła  półprzewodnikowa,  w któ- 
rej wytworzono  dwa  sąsiadujące  ze  sobą  obszary 
o różnym  typie  przewodnictwa  (obszar  typu  p i obszar 
typu  n)y  czyli  złącze  p-n . Model  złącza  p-n  przed- 
stawiono na  rys.  4a.  Do  obydwu  części,  p i n,  bryły 
półprzewodnika  dołączono  elektrody  dla  umożliwie- 
nia przepuszczania  prądu  przez  złącze.  W konkret- 
nym przyrządzie  półprzewodnikowym  może  występo- 
wać jedno  lub  więcej  takich  złącz. 

Niemożliwe  jest  oczywiście  uzyskanie  złącza  przez 
zwykłe  zetknięcie  dwóch  bryłek  o różnym  typie  prze- 
wodnictwa. Możemy  jednak  wykonać  taki  ekspery- 
ment myślowo,  łącząc  płaszczyznami  dwie  jednorodne 
płytki  półprzewodnikowe  typu  n oraz  typu  p.  Kon- 
centracje, a właściwie  ładunki  elektryczne  dziur  i elek- 
tronów przed  ścisłym  zetknięciem  obu  obszarów. 


droga 

dyfuzji 


struktura 
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Rys.  4.  Powstawanie  bariery  potencjału  w złączu  p-n : a)  model 
przestrzenny,  b)  rozkład  ładunku  dziur  przed  połączeniem  obsza- 
rów p i n,  c)  rozkład  ładunku  elektronów  przed  połączeniem  ob- 
szarów p i n,  d)  rozkład  ładunku  dziur  po  połączeniu  obszarów 
p i n,  e)  rozkład  ładunku  elektronów  po  połączeniu  obszarów 
p i n,  f)  rozkład  gęstości  ładunku  przestrzennego  p w warstwie 
podwójnej,  g)  przebieg  pasm  energii  elektronów  w złączu  p-n 
bez  przepływu  prądu 


przedstawiają  rys.  4b  i c.  Po  połączeniu  obszarów 
n i p , umożliwiającym  przepływ  nośników  ładunku, 
taki  rozkład  koncentracji  nie  utrzymuje  się  i dziury 
z obszaru  p , gdzie  ich  jest  bardzo  dużo,  dy fundują 
do  obszaru  w,  gdzie  jest  ich  bardzo  mało.  Rekombi- 
nują  tam  z elektronami,  ponieważ  nośniki  nadmiaro- 
we zakłócają  równowagę  termodynamiczną.  W rezul- 
tacie — w obszarze  n przybywa  niewiele  dziur,  nato- 
miast ubywa  ich  w obszarze  p,  a więc  nośniki  więk- 
szościowe odsuwają  się  niejako  od  płaszczyzny  roz- 
graniczającej obszar  p od  obszaru  ny  zostawiając  po 
sobie  warstwę  zubożoną,  tzn.  obszar  o znacznie 
przestrzenny  zmniejszonej  koncentracji  nośników  większościowych 
ładunek  przy  niewiele  zmienionej  koncentracji  nośników 
ujemny  mniejszościowych.  Dziury,  cofając  się  w obszar  p , 
zostawiają  po  sobie  nieruchome  zjonizowane  akcep- 
tory. Powstaje  więc  obszar  przestrzennego  ładunku 
ujemnego  (zaznaczony  na  rys.  4d  kolorem  niebieskim), 
wzrastającego  w miarę  pogrubiania  się  warstwy  zubo- 
żonej. Ładunek  ten  wytwarza  bardzo  silne  pole  elek- 
tryczne, przeciwdziałające  dyfuzji  dziur.  Grubość 
warstwy  zubożonej  Wp  zależy  od  stałej  dyfuzji  noś- 
ników ładunku  oraz  od  własności  dielektrycznych  pół- 
przewodników. Warstwa  WP  w półprzewodnikach 


0 oporze  właściwym  ok.  1 Cl  cm  wynosi  mniej  niż 

1 pm  = 10~6  m.  Jest  to  wielkość  do  tysiąca  razy 
mniejsza  niż  droga  dyfuzji  nośników  nadmiarowych 
(0,01-1  mm). 

Podobnie  zachowują  się  elektrony  w obszarze  n. 
Tam  także  powstaje  warstwa  przestrzennego  ładunku 
elektrycznego,  ale  dodatniego  (rys.  4e),  ponieważ  co- 
fające się  elektrony  zostawiają  po  sobie  dodatnio 
zjonizowane  donory.  W rezultacie  — po  jednej  stro- 
nie powierzchni  granicznej  p-n  powstaje  warstwa 
ładunków  ujemnych,  po  drugiej  — dodatnich.  Wy- 
twarza się  więc  układ  ładunków  taki  jak  w nałado- 
wanym kondensatorze,  gdzie  na  jednej  okładce  wy- 
stępuje warstwa  ładunków  dodatnich,  na  drugiej  zaś 
ujemnych.  Naładowanie  kondensatora  powoduje  po- 
wstanie napięcia  elektrycznego  pomiędzy  ładunkami 
okładek.  Oznacza  to,  że  energie  potencjalne  ładunków 
jednej  i drugiej  warstwy  są  różne.  Analogiczna  sytu- 
acja zachodzi  w złączu  p-n:  wytworzenie  się  pola 
elektrycznego  w obszarze  między  warstwami  ładun- 
ków i powstanie  różnicy  energii  potencjalnych  nośni- 
ków ładunku  między  jedną  a drugą  stroną  złącza. 
Energia  potencjalna  elektronów  jako  nośników  ła- 
dunku ujemnego  jest  wyższa  po  stronie  warstwy  nała- 
dowanej dodatnio.  Przebieg  tej  energii  odwzorowują 
poziomy  energii  pasm  — powstaje  w ten  sposób  ba- 
riera energetyczna  złącza  p-n  przedstawiona  na  rys. 
4g.  Jeśli  przez  złącze  nie  przepływa  prąd,  wysokość 
bariery  jest  nieco  mniejsza  od  wielkości  przerwy 
energetycznej  Eg.  Jeśli  do  elektrod  złącza  przykłada- 
my napięcie  ze  źródła  prądu  (tzw.  napięcie  polary- 
zacji), następuje  podwyższenie  lub  obniżenie  bariery. 
Ma  to  *miejsce,  gdy  do  obszaru  p przykładamy  dodat- 
ni, a do  obszaru  n ujemny  biegun  źródła.  Dziury 
z obszaru  p przepływają  wtedy  do  obszaru  n,  czyli 
powstaje  prąd  dziurowy.  Elektrony  poruszają  się  w 
stronę  przeciwną,  tworząc  prąd  o zwrocie  zgodnym 
z prądem  dziurowym  (ponieważ  znak  ich  ładunku 
jest  przeciwny).  Dzięki  obniżeniu  bariery  prądy  te 
osiągają  znaczne  wartości,  w związku  z czym  kierunek 
od  p do  n nazywamy  kierunkiem  przewodzenia. 

Wskutek  dyfuzji  nośników  większościowych  z jed- 
nego obszaru  do  drugiego  w sąsiadujących  ze  sobą 
obszarach  o przeciwnym  typie  przewodnictwa,  po 
obu  stronach  powierzchni  granicznej  powstają  ob- 
szary o nierównowagowej  koncentracji  nośników, 
wnikające  na  głębokości  równe  drogom  dyfuzji  Ld 
nośników  nadmiarowych.  Jest  to  zjawisko  analogicz- 
ne do  zjawiska  powstawania  nośników  nadmiarowych 
pod  wpływem  światła,  a następnie  ich  dyfuzji  w głąb 
półprzewodnika  na  głębokość  właśnie  równą  Ld. 
Teraz  jednak  nośniki  nadmiarowe  powstają  wskutek 
przepływu  prądu  przez  złącze,  są  więc  niejako  „wstrzy- 
kiwane” zarówno  z obszaru  p do  n , jak  z n do  p. 
Zjawisko  to  ma  ogromne  znaczenie  w przyrządach 
półprzewodnikowych  (np.  diodach  elektrolumine- 
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Rys.  5.  Rozkład  wstrzykiwanych  nośników  nadmiarowych 
w złączu  p-n  spolaryzowanym  w kierunku  przewodzenia 
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scencyjnycht  tranzystorach)  i nosi  nazwę  wstrzyki- 
wania nośników  nadmiarowych.  Przykładowy  roz- 
kład nośników  nadmiarowych  w złączu  pracującym 
w kierunku  przewodzenia  przedstawia  rys.  5.  Kon- 
centracja nośników  nadmiarowych  zależy  wykładni- 
czo od  napięcia  polaryzacji  U , a ściśle  — od  energii 
nośników  eU  dzielonej  przez  kT.  Wyraża  to  funkcja 
Ceu!kT,  Gęstość  prądu  dyfuzji  nośników  większoś- 
ciowych Ja  jest  więc  proporcjonalna  do  funkcji 
wykładniczej : 

Jd  = Js&vlkT9  (5) 

przy  czym  współczynnikiem  proporcjonalności  jest 
pewna  wartość  gęstości  prądu  Js.  W temperaturze 
pokojowej  (290  K): 

Ja  = Jse*«u  = (6) 

Podwyższenie  napięcia  polaryzacji  U zaledwie  o 0,06  V 
powoduje  dziesięciokrotny  wzrost  natężenia  prądu. 
Jednakże  wzór  ten  można  stosować  tylko  do  wartości 
eU  mniejszych  od  wartości  energii  wzbronionej  Eg, 
w przeciwnym  bowiem  razie  bariera  znika  i prąd  pod- 
lega prawu  Ohma,  jeśli  w ogóle  złącze  nie  ulegnie 
zniszczeniu  wskutek  przegrzania. 

Jeżeli  przyłączymy  zewnętrzne  napięcie  polaryzacji 
złącza  w kierunku  przeciwnym  niż  w dotychczasowym 
rozważaniu,  a więc  w ten  sposób,  że  do  elektrody 
części  p złącza,  dołączony  będzie  ujemny  biegun  źródła 
prądu,  to  taką  polaryzację  nazwiemy  wsteczną  lub 
zaporową.  Dyfuzja  nośników  większościowych  już 
przy  niewielkich  napięciach  wstecznych  będzie  cał- 
kowicie zahamowana  przez  silne  pole  elektryczne. 
Ponadto  dziury  w części  p zostaną  przyciągnięte  do 
elektrody  ujemnej,  elektrony  zaś  w części  n — do 
elektrody  dodatniej,  tak  że  nośniki  większościowe 
obu  znaków  cofną  się  znacznie  bardziej  w głąb  swoich 


*yp  p I- 


x 


Rys.  6.  Podwyższenie  bariery  potencjału  w złączu  p-n  spolaryzo- 
wanym wstecznie:  a)  model  przestrzenny,  b)  rozkład  ładunku 
dziur,  c)  rozkład  ładunku  elektronów,  d)  rozkład  gęstości  ładunku 
przestrzennego  p w warstwie  podwójnej,  e)  przebieg  pasm  energii 
elektronów 


obszarów  niż  w warunkach  równowagi.  Zostawią  one 
po  sobie,  jak  to  przedstawia  rys.  6,  obszary  naładowa- 
ne dodatnio  po  stronie  n , ujemnie  zaś  po  stronie  p. 
W ten  sposób  ładunek  przestrzenny  po  obu  stronach 
warstwy  podwójnej  będzie  znacznie  zwiększony 
i wniknie  na  duże  głębokości  w obszary  p i n.  Bariera 
potencjału,  którą  wytworzy  taka  warstwa  podwójna, 
będzie  więc  wyższa  niż  w warunkach  równowagi, 
a wielkość  jej  podwyższenia  będzie  równa  przyłożo- 
nemu napięciu  polaryzacji  wstecznej.  W kierunku  za- 
porowym można  przykładać  bardzo  duże  napięcie  — 
w odpowiednio  wykonanych  złączach  przekraczające 
1000  V.  Można  uważać,  że  złącze  spolaryzowane 
w kierunku  wstecznym  składa  się  z przewodzących 
obszarów  p i n przedzielonych  warstwą  izolatora  gru- 
bości fVn-ł-fVp,  zwaną  warstwą  zaporową,  ponieważ 
w tym  obszarze,  pozbawionym  prawie  nośników', 
półprzewodnik  ma  właściwości  izolatora.  W ten  spo- 
sób złącze  p-n  jest  kondensatorem  i to  takim,  w któ- 
rym możemy  zmieniać  grubość  warstwy  izolatora, 
a więc  o zmiennej  pojemności.  Zjawisko  to  ma  za- 
stosowanie w tzw.  waraktorach. 

W miarę  wzrostu  napięcia  wstecznego  wzrasta  na- 
tężenie pola  elektrycznego  wewnątrz  warstwy  zapo- 
rowej. Gdy  osiąga  ono  pewną  wartość,  następuje  tzw. 
lawinowe  przebicie  złącza,  połączone  z gwałtownym 
wzrostem  prądu.  Jeśli  się  nie  przekroczy  pewnych 
wartości  prądu,  złącze  nie  ulegnie  zniszczeniu.  Zja- 
wisko to  jest  wykorzystywane  w diodach  lawinowych. 

Mimo  że  warstwa  zaporowa  ma  — wskutek  zaha- 
mowania dyfuzji  nośników  większościowych  — wła- 
sności izolacyjne,  przepływa  przez  nią  prąd  dyfuzji 
nośników  mniejszościowych,  zwany  prądem  nasyce- 
nia. Prąd  ten  jest  niezależny  od  przyłożonego  napięcia 
(zarówno  w kierunku  zaporowym,  jak  i przewodze- 
nia), stanowi  stałą  wartość  na  tle  prądu  pi-zewodzenia, 
a przy  tym  ma  zwrot  przeciwny,  należy  więc  jego  war- 
tość odjąć  od  wartości  prądu  określonej  wzorem  (5). 
Ponieważ  wypadkowy  prąd  płynący  przez  złącze  przy 
napięciu  U = 0 winien  być  równy  zeru,  przeto  war- 
tość gęstości  prądu  nasycenia  musi  być  równa  Js . 
Zatem  gęstość  wypadkowego  prądu  płynącego  przez 
złącze  wynosi: 

/ = Js  ęeUfkT  — Js  = Js  (CeUlkT-\),  (7) 

Widać,  że  spełniony  jest  warunek  równowagi  złącza 
przy  braku  zewnętrznego  napięcia:  gdy  17=0,  to 
7 = 0.  Powyższy  wzór  określa  zależność  natężenia 
przepływającego  prądu  od  napięcia  przyłożonego  do 
złącza,  zilustrowaną  na  wykresie  (rys.  7). 


Rys.  7.  Charakterystyka  prądowo-napięciowa  idealnego  złącza 
p-n  w temperaturze  T = 290  K 

Prąd  nasycenia  o gęstości  Js  zależy  od  właściwości 
obu  materiałów  p i n w sposób  następujący: 

j cDp  llv  ^ eDnpn 

Lp  Lin 

gdzie  nv  jest  koncentracją  nośników  mniejszościowych 
(elektronów)  w obszarze  p,  pn  — koncentracją  dziur 
w obszarze  «,  a Lp , Ln  — drogi  dyfuzji  nośników 
mniejszościowych  odpowiednio  w obszarze  p i n. 
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Aby  złącze  przepuszczało  mały  prąd  w kierunku 
wstecznym,  prąd  nasycenia  musi  być  również  mały. 
Drogi  dyfuzji  Lv  i Ln , a co  za  tym  idzie  — czasy 
życia  rp  i rn  nośników  mniejszościowych  muszą  więc 
być  duże.  Można  to  uzyskać  przez  ograniczenie  re- 
kombinacji w obszarze  złącza  dzięki  dobrze  opraco- 
wanej technologii,  przy  której  struktura  kryształu 
jest  jak  najmniej  naruszona  i nie  wprowadza  się 
niepożądanych  domieszek.  Fakt,  że  opór  złącza 
w kierunku  przewodzenia  jest  mały,  a w kierunku 
zaporowym  bardzo  duży,  jest  podstawą  jednego 
z ważniejszych  rodzajów  zastosowania  złącz  p-n,  a 
mianowicie  prostowania  prądu  zmiennego  (-*  Przy- 
rządy półprzewodnikowe  dyskretne). 


Oddziaływanie  nośników  nadmiarowych 
na  złącze  p-n.  Zjawisko  tranzystorowe 

Spolaryzowanie  złącza  w kierunku  przewodzenia  po- 
ciągało za  sobą  zjawisko  wstrzykiwania  nośników 
nadmiarowych  do  obu  części  złącza  (wskutek  obniże- 
nia się  jego  bariery  potencjału).  Okazuje  się,  co  po- 
twierdza teoria  i doświadczenie,  że  występuje  też 
zjawisko  odwrotne:  obniżanie  się  bariery  potencjału 
pod  wpływem  wytworzonych  w obszarze  złącza  noś- 
ników nadmiarowych.  Oznacza  to  pojawienie  się  na- 
pięcia polaryzacji  na  elektrodach  złącza  nie  dołączo- 
nego do  źródła  energii  elektrycznej.  Nośniki  nad- 
złączowe  miarowe  mogą  powstawać  np.  pod  wpływem  światła, 
zjawisko  a na  elektrodach  złącza  pojawia  się  wówczas  napięcie 
fotowol-  elektryczne.  Jest  to  złączowe  zjawisko  fotowoltaiczne. 
taiczne  Znajduje  ono  zastosowanie  w przyrządach  do  pomiaru 
natężenia  światła  oraz  do  przetwarzania  energii  świetl- 
nej w energię  elektryczną,  np.  w bateriach  słonecznych 
wykonywanych  z krzemu,  których  sprawność  ener- 
getyczna przekracza  10%  Jest  to  osiągnięcie  o dużym 
znaczeniu  praktycznym. 

Do  oświetlonego  złącza  można  przyłożyć  napięcie. 
Każdemu  napięciu  polaryzacji  będzie  odpowiadać 
pewne  natężenie  prądu,  inne  niż  w złączu  nie  oświet- 
lonym. Wszystkie  pary  dziura-elektron  generowane 
strumieniem  świetlnym  w odległości  mniejszej  niż  ich 
droga  dyfuzji  dotrą  do  złącza,  gdzie  ulegną  rozdzie- 
leniu pod  wpływem  pola.  Elektrony  będą  się  poruszać 
polaryzacja  od  obszaru  p do  obszaru  n złącza,  dziury  zaś  w kie- 
złącza  runku  przeciwnym.  Towarzyszące  ruchom  obu  ro- 
oświetlonego  dzajów  nośników  prądy  elektryczne  sumują  się  ze 
względu  na  różnicę  znaków  ładunku.  Wypadkowy 
prąd  ma  zwrot  zgodny  z ruchem  dziur  od  n do  p. 
Jest  to  zwrot  prądu  wstecznego,  a więc  nośniki  nad- 
miarowe zwiększają  (co  do  bezwzględnej  wartości) 
prąd  wsteczny,  co  psuje  własności  złącza  jako  pro- 
stownika. Urządzenie,  w którym  jeden  obszar  złącza 


p-n  może  być  oświetlony,  zostało  zastosowane  jako  fotodioda 
przyrząd  zwany  fotodiodą  (-*  Optoelektronika  pół- 
przewodnikowa). 

W fotodiodzie  wykorzystane  jest  oddziaływanie 
nośników  nadmiarowych  wytworzonych  za  pomocą 
światła  na  wstecznie  spolaryzowane  złącze  p-n.  Za- 
miast wytwarzania  nośników  nadmiarowych  za  po- 
mocą światła  można  wykorzystać  zjawisko  ich  wstrzy- 
kiwania. W tym  celu  należy  w pobliżu  wstecznie  spo- 
laryzowanego złącza  p-n  umieścić  złącze  n-p  i spola- 
ryzować je  w kierunku  przewodzenia.  Powstanie 
w ten  sposób  struktura  pokazana  na  rys.  8.  Obszar/?, 

emiter  baza  kolektor 
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Rys.  8.  Struktura  tranzystora  n-p-n 

wspólny  dla  obu  złącz,  jest  zaopatrzony  w osobną  zjawisko 
elektrodę  i nosi  nazwę  bazy.  Obszar  n spolaryzowany  tranzysto- 
zaporowo  w stosunku  do  bazy  nazywa  się  kolektorem  rowe 
(łac.  cołligere  'zbierać’),  natomiast  przeciwległy  ob- 
szar w,  spolaryzowany  w kierunku  przewodzenia, 
nazywa  się  emiterem  (łac.  emittere  'wysłać’).  Prąd 
przepływający  przez  złącza  emitera  wstrzykuje  do  ob- 
szaru p nośniki  nadmiarowe,  które  docierają  do  złą- 
cza kolektora,  powodując  przepływ  dużego  prądu 
przez  to  złącze  (spolaryzowane  w kierunku  zaporo- 
wym). Jest  to  zjawisko  tranzystorowe,  odkryte  w 
1948  r.  przez  Bardeena  i Brattaina.  Stało  się  ono 
punktem  zwrotnym  w ogromnym  i szybkim  rozwoju 
elektroniki  półprzewodników.  Najważniejszym  zasto- 
sowaniem zjawiska  tranzystorowego  jest  wzmacnianie 
sygnałów  elektrycznych.  Napięcie  między  emiterem 
i bazą  wynosi  ułamek  wolta,  a między  kolektorem 
i emiterem  może  wynosić  od  kilku  do  kilkuset  wol- 
tów. Jednocześnie  prąd  płynący  między  kolektorem 
a emiterem  jest  dużo  większy  niż  prąd  między  bazą 
i emiterem.  Dzięki  temu  sygnał  elektryczny  małej 
mocy  wprowadzony  do  obwodu  baza-emiter  powo- 
duje pojawienie  się  sygnału  elektrycznego  większej 
mocy  w obwodzie  kolektor-emiter. 

A.  K.  Jonscher  Podstawy  działania  przyrządów  półprzewodni- 
kowych, Warszawa  1962;  1.  J.  Kampel  Półprzewodniki.  Teoria 
i zastosowanie.  Warszawa  1974;  A.  Świt,  J.  Pultorak  Przyrządy 
półprzewodnikowe , Warszawa  1976. 
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Jarosław  Świderski 

Od  „kryształka"  do  kryształka 

Elektronika  zajmuje  się  przekształcaniem  sygnałów 
elektrycznych  przez  wpływanie  bezpośrednio  na  ruch 
elektronów.  Początkowo  operacje  takie  najłatwiej 
było  przeprowadzać  w próżni,  działając  na  strumień 
elektronów  polem  elektrycznym  i magnetycznym  ste- 
rowanym „makroskopowo”  przez  regulację  wytwa- 
rzającego je  prądu  elektrycznego  (elektronika  próż- 
niowa — lampy  elektronowe). 

W siedemdziesiątych  latach  ubiegłego  stulecia  od- 
kryto, że  styk  metalu  z półprzewodnikiem  ma  właści- 


wości prostujące.  Fakt  ten  umożliwił  wytworzenie  kryształki 
prymitywnych  elementów  półprzewodnikowych,  tzw.  prostujące 
kryształków,  i budowanie  przy  ich  użyciu  kryształko- 
wych radiodobiorników.  Kryształki  te  to  nic  innego 
jak  pierwsze  diody  półprzewodnikowe,  w których  się 
wykorzystuje  odpowiednią  konfigurację  ciał  krysta- 
licznych dla  formowania  wiązki  (strumienia)  elektro- 
nów płynących  przez  ciało  stałe.  Ponieważ  w diodzie 
półprzewodnikowej  ruch  elektronów  odbywa  się 
w obszarze  znacznie  mniejszym  niż  w analogicznych 
przyrządach  elektroniki  próżniowej,  pierwsze  poważ- 
niejsze zastosowanie  półprzewodników  związane  było 


z techniką  wielkich  częstości  (np.  radiolokacja),  gdzie 
konieczne  jest  uzyskanie  jak  najmniejszych  pojem- 
ności i indukcyjności  czynnego  elementu.  Drugą  cechą 
szczególną  przyrządów  półprzewodnikowych,  dającą 
im  przewagę  nad  próżniowymi,  było  wykorzystywanie 
ruchu  elektronów  w ich  jak  gdyby  naturalnym  środo- 
wisku. Aby  sterować  elektronami  w próżni,  trzeba  je 
tam  wprowadzić,  np.  przez  termoemisję  z rozgrzanego 
do  wysokiej  temperatury  drutu  wolframowego  (stąd 
świecenie  katod  w lampach  radiowych).  Swobodne 
elektrony  w półprzewodniku  egzystują  w normalnej 
temperaturze  w dostatecznej  dla  „elektronicznych” 
celów  liczbie  bez  ingerencji  człowieka,  a więc  przy- 
rządy półprzewodnikowe  nie  wymagają  skompliko- 
wanych, energochłonnych  i nietrwałych  urządzeń 
zmuszających  elektrony  do  akcji  (na  przykład  ukła- 
dów zasilających  żarzenie  katod  w lampach  radio- 
wych). 

Dalszy  rozwój  elektroniki  półprzewodnikowej  to 
już  jedno  pasmo  triumfów  technologii.  Niepewne,  nie 
zastosowanie  zawsze  powtarzalne  styki  metal-półprze  wodnik  zastą- 
monokrysz-  piono  monokrystalicznym  materiałem  półprzewodni- 
tałów  kowym,  w którym  minimalne  ilości  obcych  atomów 
zmieniają  typ  przewodnictwa  w części  obszaru  czyn- 
nego z elektronowego  (w)  na  dziurowy  (p)  lub  od- 
wrotnie (->  Fizyka  przyrządów  półprzewodnikowych). 
Rolę  prostownika  przejęła  powierzchnia  graniczna 
między  obszarami  o różnym  typie  przewodnictwa. 
Granice  te,  czyli  złącza  p-n,  można  dziś  rozmieszczać 
w materiale  półprzewodnikowym  z dokładnością  do 
dziesiątych  części  mikrometra,  a odpowiednio  je  do- 
bierając — tworzyć  struktury  dowolnie  niemal  skom- 
plikowanych przyrządów  (->  Mikroelektronika).  Z hi- 
storycznego „kryształka”,  który  był  zlepkiem  poli- 
krystalicznych ziaren  dociskanych  metalową  igłą,  po- 
została tylko,  i to  już  coraz  rzadziej  używana,  nazwa : 
kryształek,  czyli  kawałeczek  (wymiary  od  dziesiątych 
części  do  pojedynczych  milimetrów)  półprzewodniko- 
wego monokryształu  z wbudowanymi  złączami  p-n 
i metalowymi  (najczęściej  napylonymi)  elektrodami. 
Ale  i ta  nazwa  ustępuje  nowszym : półprzewodnikowa 
struktura  lub  z angielska  — czip. 


Diody  i tranzystory 

Właściwości  prostujące  złącza  p-n  lub  złącza  metal- 
półprzewodnik  wykorzystano  w diodzie  półprzewodni- 
if  u fikcje  kowej,  przejmującej  wszystkie  funkcje  spełniane  po- 
diody  przednio  przez  diody  próżniowe : prostowanie  prądów 
próżniowej  zmiennych,  ich  generację,  wykrywanie  (detekcja) 
sygnałów  elektromagnetycznych,  „mieszanie”  sygna- 
łów o różnych  częstościach  itp.  Pojedyncze  złącze  p-n 
znalazło  też  zastosowanie  jako  detektor  lub  emiter 
energii  promienistej,  kondensator  o regulowanej  po- 


Rys.  1.  Przykładowa  charakterystyka  prądowo-napięciowa  diody 
półprzewodnikowej 
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jemności,  detektor  naprężeń  mechanicznych,  ogra- 
nicznik napięcia,  skomplikowany  przetwornik  funkcji 
matematycznych  itd.  Niektóre  z tych  przyrządów 
zostały  szerzej  opisane  w rozdziałach  poświęconych 
mikroelektronice,  optoelektronice  czy  elektronice 
mikrofalowej.  Jak  z tego  widać,  pojęcie  diody  i jej  za- 
kres zastosowania  są  bardzo  szerokie.  Zawsze  jednak 
jest  to  dwuelektrodowy  przyrząd  półprzewodnikowy 

0 nieliniowej  charakterystyce  prądowo-napięciowej 
(rys.  1),  tj.  o takiej  zależności  prądu  płynącego  przez 
diodę  od  przyłożonego  napięcia,  że  można  rozróż- 
nić kierunek  przewodzenia  i kierunek  wsteczny  (zapo- 
rowy). Jeśli  do  diody  półprzewodnikowej  przyłożone 
jest  napięcie  w ten  sposób,  że  dodatni  potencjał  znaj- 
duje się  na  elektrodzie  połączonej  z obszarem  typu  n, 
mówimy  o spolaryzowaniu  jej  w kierunku  zaporowym, 
tj.  w kierunku,  w którym  ma  większy  opór  elektrycz- 
ny. Przez  diodę  płynie  wtedy  prąd  zaporowy  (inaczej 
wsteczny),  składający  się  z prądu  ładunków  mniej- 
szościowych, powstających  pod  wpływem  generacji 
termicznej,  i z prądu  upływu.  Pierwszy  nie  zależy  od 
przyłożonego  napięcia,  a jedynie  od  temperatury 

1 parametrów  rekombinacyjnych,  drugi,  proporcjo- 
nalny do  przyłożonego  napięcia,  „kryje”  w sobie  nie- 
doskonałości złącza.  W pierwszym  przybliżeniu  moż- 
na sobie  diodę  spolaryzowaną  zaporowo  wyobrazić 
jako  równoległe  połączenie  diody  idealnej  (przez 
którą  płynie  prąd  zaporowy)  i opornika  (przez  który 
płynie  prąd  upływu). 

Przy  dostatecznie  dużym  napięciu  (tzw.  napięciu 
przebicia)  prąd  zaporowy  zaczyna  szybko  rosnąć 
wskutek  generacji  par  elektron-dziura,  spowodowanej 
zerwaniem  pewnych  wiązań  kowalencyjnych  między 
sąsiednimi  atomami  i tunelowym  przenikaniem  elek- 
tronów walencyjnych  przez  pasmo  wzbronione  (tzw. 
zjawisko  Zenera),  oraz  wskutek  powielania  lawino- 
wego (generacji  par  elektron-dziura  pod  wpływem 
dostatecznie  „rozpędzonych”  elektronów).  Napięcie 
przebicia  związane  ze  zjawiskiem  Zenera  maleje  ze 
wzrostem  temperatury,  a związane  ze  zjawiskiem  po- 
wielania — rośnie. 

Przez  diodę  spolaryzowaną  w kierunku  przewodze- 
nia, tj.  w kierunku,  w którym  ma  ona  mniejszy  opór, 
płynie  prąd  zależny  od  napięcia  początkowo  wykład- 
niczo, a następnie  liniowo,  gdyż  dioda  zaczyna  się 
wówczas  zachowywać  jako  opornik. 

Bardziej  złożone  struktury,  zawierające  co  najmniej 
dwa  złącza  p-n,  złącze  i dwa  kontakty  omowe  (nie 
prostujące  styki  metal-półprzewodnik)  lub  kombi- 
nację złącz  p-n,  kontaktów  i kondensatorów,  umożli- 
wiają wzmacnianie  sygnałów  elektrycznych  lub  ich 
przełączanie. 

Trójelektrodowy  przyrząd  półprzewodnikowy  zwa- 
ny tranzystorem  (triodą  półprzewodnikową)  jest  dru- 
gim, obok  diody,  podstawowym  przyrządem  współ- 
czesnej elektroniki,  elementarnym  składnikiem  przy- 
gniatającej większości  układów  scalonych  (mikro- 
układów). Najpopularniejsze  obecnie  rozwiązania  — 
to  tranzystor  bipolarny  o dwóch  złączach  p-n 
i tranzystor  połowy  MOS,  w którym  przepływ  ładun- 
ków elektrycznych  jest  sterowany  polem  kondensa- 
tora. Tranzystor  bipolarny  zbudowany  jest  z płytki 
półprzewodnikowej  zawierającej  trzy  obszary  (emiter, 
baza,  kolektor;  rys.  2)  o kolejno  zmieniającym  się  ty- 
pie przewodnictwa  ( p-n-p  lub  n-p-ń).  Prąd  płynący 


przez  spolaryzowaną  wstecznie  diodę  kolektor-baza 
jest  sterowany  przez  prąd  spolaryzowanej  w kierunku 
przewodzenia  diody  emiter-baza,  gdyż  nośniki  wpro- 
wadzane z obszaru  emitera  dy fundują  (lub  w szczegól- 
nym wypadku  są  unoszone  polem)  przez  obszar  bazy 
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przewodni- 
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Zenera 


tranzystor 
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i zwiększają,  jako  dodatkowe  nośniki  mniejszościowe, 
prąd  wsteczny  płynący  z kolektora.  Obwód  diody 
emiter-baza  (spolaryzowanej  w kierunku  przewodze- 
nia) odznacza  się  oczywiście  małym  oporem,  w prze- 
ciwieństwie do  obwodu  z diodą  kolektor-baza. 

Tranzystor  połowy  (rys.  3)  wykonany  jest  w zasa- 
dzie z krzemu.  Nazwa  MOS  pochodzi  od  skrótu  an- 
gielskich słów  metal-tlenek-półprzewodnik.  Używa 
się  też  czasem  nazwy  MIS,  w której  słowo  tlenek  zo- 
stało zastąpione  bardziej  ogólnym  — izolator.  Ozna- 
czenie p+  stosuje  się  do  półprzewodnika  o przewod- 
nictwie typu  p silnie  domieszkowanego.  Prąd  płynący 
między  elektrodami  a i c (czyli  między  dwoma  obsza- 

a b c 

metal 

" ■ S1O2 

—Si 


Rys.  3.  Tranzystor  MOS 


rami  p+)  w wąskiej,  przypowierzchniowej  warstewce 
obszaru  n (tzw.  kanałem)  jest  sterowany  potencjałem 
przyłożonym  do  elektrody  b (bramki),  która  wraz 
z bardzo  cienką  (ułamek  jim)  warstwą  tlenku  i po- 
wierzchnią półprzewodnika  stanowi  kondensator 
o małej  stratności.  Tranzystory  MOS  pracują  przy 
niższych  częstościach  niż  tranzystory  bipolarne,  ich 
wytwarzanie  jest  jednak  znacznie  łatwiejsze,  a ponadto 
sterowanie  kondensatorowe  zużywa  znacznie  mniej 
energii.  Stąd  ich  główne  zastosowanie  w monolitycz- 
nych układach  scalonych  wielkiej  skali  integracji 
(-►  Mikroelektronika). 

Tranzystory  i diody  stanowią  elementy  podstawowe 
układów  bardziej  złożonych,  same  również  przybierają 
nieraz  skomplikowane  formy  wieloelektrodowe.  Moż- 
na tu  wymienić  np.  tranzystor  tyratronowy,  czyli  tyry- 
stor, spełniający  funkcję  sterowanego  zaworu  (dwu- 
stanowego elementu  przełączającego).  Składa  się  on 
z czterech  obszarów  o kolejno  zmieniających  się  ty- 
pach przewodności:  p-n-p-n , i ma  charakterystykę 
prądowo-napięciową  podobną  nieco  (rys.  4)  do  cha- 


Rys.  4.  Charakterystyka  prądowo-napięciowa  tyrystora 


rakterystyki  diody  — z tą  różnicą,  że  przełączenie  go 
w stan  przewodzenia  wymaga  przyłożenia  odpowied- 
niego napięcia,  tzw.  napięcia  przeskoku  (UP),  niższego 
od  napięcia  przebicia  i dającego  się  sterować  za  po- 
mocą prądu  bazy. 


Miniaturyzacja,  mikrominiaturyzaciai 
i co  dalej? 

Zwiększenie  liczby  złącz,  kontaktów,  kondensatorów 
itp.  prowadzi  do  tworzenia  skomplikowanych  ukła- 
dów indywidualnych,  a następnie  do  układów  scalo- 
nych. Zmniejszanie  wymiarów  elementów  czynnych  już 
jest  celem  dość  atrakcyjnym,  a łączy  się  z tym  prawie 
zawsze  zmniejszenie  ciężaru,  zasi lania  i przede  wszyst- 


kim zwiększenie  niezawodności.  Skok  jakościowy 
spowodowany  wprowadzeniem  elementów  półprze- 
wodnikowych można  obrazowo  przedstawić  modnym 
w pierwszych  latach  „panowania”  półprzewodników 
porównaniem : „Gdyby  w czasie  lądowania  aliantów 
w Normandii  w 1944  r.  były  już  znane  i stosowane 
tranzystory,  ciężar  przerzucanego  na  francuski  brzeg 
ekwipunku  przypadającego  na  jednego  żołnierza  zma- 
lałby w przybliżeniu  o jedną  tonę”. 

Wprowadzenie  technologii  epiplanarnej  umożliwiło 
następny  skok  jakościowy.  Zamiast  wycinania  z mo- 
nokryształów jak  najcieńszych  płytek,  co  zawsze  na- 
ruszało strukturę  krystaliczną  czynnych  obszarów 
półprzewodnika,  zastosowano  tzw.  warstwy  epitak-  warstwy 
sjalne,  tj.  bardzo  cienkie  (od  pół  do  kilkunastu  mikro-  epitaksjalne 
metrów)  monokrystaliczne  warstwy,  narastające  w od- 
powiednio sterowanym  procesie  na  podłożu  dającym 
wytrzymałość  mechaniczną  i (przeważnie)  orientację 
krystalograficzną.  Płytki  te  (w  technologii  epiplanar- 
nej stosuje  się  przede  wszystkim  krzem)  pokrywa  się 
jeszcze  o rząd  cieńszymi  warstewkami  świetnego  izo- 
latora, jakim  jest  tlenek  krzemu ; odgrywa  on  zarówno 
rolę  ochrony  przed  atmosferą,  jak  i maski  (otwory 
wytrawiane  po  odpowiednim  naświetleniu  specjalnej 
emulsji  — stąd  precyzja,  na  jaką  stać  tylko  optykę), 
przez  którą  się  dozuje  domieszki  dające  odpowiedni 
typ  przewodnictwa.  Te  dwa  elementy  technologicz- 
ne— epitaksja  i pokrycie  krzemu  jego  tlenkami, 
czyli  pasywacja  — przyniosły  rewolucję,  powstały  pasywacja 
diody  i tranzystory,  w których  problem  wymiarów 
sprowadzał  się  do  problemu  dotarcia  do  samej  struk- 
tury (czipu).  Najcieńsze  druty  były  grubsze  od  nie- 
których czynnych  obszarów,  nie  mówiąc  już  o ogra- 
niczeniach wymiarów  narzucanych  przez  możliwości 
manipulowania  oprawkami.  Doszły  też  nowe  proble- 
my, które  poprzednio  ledwo  dawały  o sobie  znać: 
układowe  i materiałowe.  Do  pierwszych  należy  sprawa 
iloczynu  maksymalnej  mocy,  jaka  może  być  tracona 
w danym  elemencie  (diodzie,  tranzystorze  itp.),  i ma- 
ksymalnej częstości  sygnału,  przy  jakiej  ten  element 
zachowuje  jeszcze  swoje  właściwości.  Oczywiście  — 
im  mniejszy  element,  tym  łatwiej  zachować  np.  dosta- 
tecznie małe  pojemności  potrzebne  przy  dużych  czę- 
stościach. Ale  jednocześnie  przy  tym  samym  prądzie 
mniejszy  element  bardziej  się  nagrzewa  i zmienia 
swoje  właściwości  z przyczyn  natury  termicznej. 

Stąd  tendencja  do  budowania  elementów  o wielu  od- 
powiednio połączonych  obszarach  stanowiących  je- 
den przyrząd.  I tak  np.  nowoczesny  tranzystor  dużej 
mocy  i dużej  częstości,  tzw.  overlayy  składa  się  z kilku- 
dziesięciu elementów,  co  czyni  go  podobnym  raczej 
do  układu  scalonego,  i to  średniej  skali  integracji 
(rys.  5). 

Ogromne  znaczenie  w całej  elektronice  półprze- 
wodników mają  problemy  materiałowe.  Wielka  czyś-  problemy 
tość  pierwiastków  i związków  półprzewodnikowych,  materiałowe 
której  nie  można  określić  nawet  najczulszymi  me- 
todami chemicznymi,  doskonałość  sieci  krystalicznej 
półprzewodników,  jednorodność  parametrów  elek- 
trycznych — oto  wymagania,  jakich  nie  stawia  żadna 
inna  gałąź  techniki.  Miniaturyzacja  potęguje  te  wy- 
magania w sposób  oczywisty;  niejednorodność  np. 
występująca  na  powierzchni  1 jim2  mogła  być  do- 
puszczalna w złączu  o powierzchni  10  mm2,  ale  dys- 
kwalifikuje ona  złącze  o powierzchni  milion  razy 
mniejszej.  Mikrominiaturyzacja,  w ślad  za  którą  idzie 
tworzenie  struktur  wielozłączowych,  narzuca  waru- 
nek, by  taka  niejednorodność  nie  występowała  w żad- 
nym złączu  wchodzącym  w skład  danego  przyrządu, 
gdyż  zdyskwalifikuje  to  całą  strukturę.  Powyższe  wy- 
magania skierowały  znaczne  potencjały  badawcze  na 
zagadnienia  związane  z pomiarami  parametrów  elek- 
trycznych i strukturalnych  materiałów  półprzewod- 
nikowych. Wyposażenie  laboratoriów  pomiarowych 
stanowi  dziś  najpoważniejszą  pozycję  zarówno 
w budżecie  instytutów,  jak  zakładów  przemysłowych 
działających  w dziedzinie  elektroniki  półprzewod- 
nikowej. 
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Rys.  5.  Struktury  tranzystorów:  a)  i b)  tranzystory  impulsowe, 
c)  tranzystor  overlay,  d)  tranzystor  typu  metal-tlenek-półprze- 
wodnik  (MOS) 


Rozważmy  np.  zagadnienie  tzw.  mikroniejednorod- 
ności  półprzewodników.  Otóż  wzrost  monokryszta- 
łów z fazy  ciekłej  nie  odbywa  się  w sposób  ciągły,  ale 
jak  gdyby  drobnymi  skokami,  co  powoduje  także  sko- 
kowy (periodycznie  zmieniający  się)  rozkład  domie- 
szek, a więc  i większości  parametrów  elektrycznych 
półprzewodnika.  Rysunek  6 ukazuje  zmiany  napięcia 
fotoelektrycznego  wzdłuż  monokryształu  krzemu  wy- 
wołane mikroniejednorodnościami.  Oczywiście  w 
punktach  największych  odchyleń  od  średniej  koncen- 
tracji domieszek  oraz  w punktach  najsilniejszych 
zmian  tych  koncentracji  (największe  „wbudowane*’ 
pola  elektryczne)  najczęściej  występują  defekty  ele- 
mentów półprzewodnikowych.  Wprawdzie  mikro- 
niejednorodność  przeważnie  nie  pojawia  się  w trakcie 
monokrystalizacji  z fazy  gazowej,  a więc  w trakcie 
większości  procesów  dających  warstwy  epitaksjalne, 
ale  ponieważ  warstwy  te  są  zwykle  nakładane  na 
podłoże  wycięte  z monokryształów  wyrosłych  z fazy 


odległość 


Rys.  6.  Rozkład  napięcia  fotoelektrycznego  związany  z mikro- 
niejednorodnością,  zmierzony  wzdłuż  monokryształu  krzemu 
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ciekłej  — domieszki  dyfundują  z tych  ostatnich  do 
obszaru  czynnego  i wytwarzają  w nim  mikroniejed- 
norodność  analogiczną  do  istniejącej  w podłożu.  Sama 
istota  powstawania  mikroniejednorodności  nie  jest 
zbyt  dobrze  zbadana.  Dotychczas  udało  się  uzyskać 
monokryształy  wolne  od  mikroniejednorodności 
jedynie  w warunkach  kosmicznych,  w stanie  nie- 
ważkości (badania  nad  tym  problemem  wchodzi- 
ły między  innymi  w skład  programu  pierwszego 
wspólnego  lotu  kosmonautów  amerykańskich  i ra- 
dzieckich). 

Diody  półprzewodnikowe  i tranzystory  umożliwiły 
miniaturyzację  układów.  Skonstruowano  miniaturowe 
odbiorniki  radiowe,  a przenośne  stacje  radionadaw- 
cze,  niegdyś  potężne  „maszynerie”  montowane  na 
ciężarówkach,  zmieniły  się  w chowane  w dłoniach 
pudełka.  Powstało  wiele  miniaturowych  urządzeń 
automatyki  przemysłowej. 

Dalszy  postęp  w dziedzinie  miniaturyzacji  — mi- 
krominiaturyzacja  — przyniósł  ogromny  rozwój  elek- 
tronicznych maszyn  matematycznych,  popularnie 
zwanych  komputerami.  Wprowadzenie  technologii 
epiplanamej  (i  związanej  z nią  technologii  MOS) 
stworzyło  realne  szanse  budowania  komputerów 
o wymiarach  i niezawodności  umożliwiających  ich 
obecne  rozpowszechnienie,  mimo  iż  nowoczesny 
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komputer  zawiera  wiele  milionów  czynnych  elemen- 
tów. Tradycyjny  tranzystor  miał  wymiary  czipu 
mierzone  w milimetrach,  a do  tego  dochodziła  spora 
oprawka  z doprowadzeniami.  Układ  scalony  wielkiej 
skali  integracji  w strukturze  o wymiarach  5x  5x0,2 
mm  mieści  kilkanaście  tysięcy  tranzystorów.  Czy  tech- 


nika, wspierana  przez  fizykę,  pójdzie  w tym  kierunku 
jeszcze  dalej?  Na  pewno  tak. 

W.  Marciniak  Przyrządy  półprzewodnikowe  i układy  scalone , 
Warszawa  1979;  W.  Rosiński  Zasady  działania  tranzystorów , 
Warszawa  1977;  J.  Świderski  Techniczne  badania  właściwości 
materiałów  i struktur  półprzewodnikowych>  Warszawa  1975;  A. 
Świt,  J.  Pułtorak  Przyrządy  półprzewodnikowe , Warszawa  1976. 


Optoelektronika  półprzewodnikowa 

Marian  A.  Herman 


Optoelektroniką  nazywa  się  dział  elektroniki,  którego 
przedmiotem  jest  łączne  wykorzystanie  optycznego 
jak  i elektrycznego  sposobu  przetwarzania  i przekazy- 
wania sygnałów.  Podstawą  optoelektroniki  są  fizyczne 
procesy  warunkujące  przetwarzanie  sygnałów  elek- 
trycznych na  optyczne  i sygnałów  optycznych  na  elek- 
tryczne oraz  procesy  wytwarzania,  przesyłania,  prze- 
twarzania i magazynowania  informacji  niesionych 
przez  światło.  Ogólny  schemat  układu  optoelektroni- 
nicznego  przedstawia  rys.  1. 


detektor 
przetwarza- 
jący sygnał 
optyczny 
na  sygnał 
elektryczny 


Rys.  1.  Schemat  układu  optoelektronicznego 


kanał  Zaletą  wykorzystania  kanału  optycznego  do  prze- 
optyczny  sy łania,  przetwarzania  i magazynowania  informacji 
jest  to,  że  występujące  w tym  kanale  nośniki  infor- 
macji (fotony)  są  pozbawione  ładunku  elektrycznego. 
Ponieważ  czynnikami  sterującymi  procesem  przekazy- 
wania lub  przetwarzania  informacji  są  w tym  wypad- 
ku układy  wieloatomowe  (kryształy  lub  ciecze,  któ- 
rych atomy  są  naładowane  elektrycznie  lub  wykazują 
silne  właściwości  magnetyczne)  oddziaływające  z foto- 
nami niezbyt  silnie  (zwłaszcza  przy  małych  natęże- 
niach światła  nie  wywołujących  efektów  nieliniowych), 
to  niesiona  przez  te  fotony  w kanale  optycznym  infor- 
macja nie  ulega  niezamierzonym  zniekształceniom. 
Kanał  elektryczny  szeroko  stosowany  w klasycznej 
elektronice,  w którym  nośniki  informacji  (elektrony) 
i czynniki  sterujące  (pole  elektryczne  czy  pole  magne- 
tyczne) oddziałują  ze  sobą  bardzo  silnie,  jest  znacznie 
bardziej  podatny  na  wszelkiego  rodzaju  zniekształce- 
nia przesyłanej,  przetwarzanej  czy  magazynowanej 
informacji.  Inną  zaletą  kanału  optycznego  jest  to,  że 
wysoka  częstość  sygnałów  optycznych  (1 01 4-l  O15  Hz) 
zwiększa  o około  106  razy  pojemność  informatyczną 
tego  kanału  w stosunku  do  pojemności  kanału  elek- 
trycznego. Kanał  optyczny  zapewnia  ponadto  dosko- 
nałą izolację  galwaniczną  zacisków  wyjściowych, 
z których  odbierana  jest  informacja,  od  zacisków 
wejściowych,  do  których  informacja  ta  zostaje  do- 
prowadzona. 

Od  dawna  już  znane  są  takie  elementy  układów 
optoelektronicznych,  jak  różnego  rodzaju  lampy  elek- 
tryczne, żarowe  czy  gazowe,  które  są  sterowanymi 
elementy  elektrycznie  źródłami  światła,  różne  materiały  dielek- 
układów  tryczne  ciekłe,  szklane  czy  krystaliczne  będące  ośrod- 
optoeSektro-  kami,  w których  światło  się  rozchodzi  lub  jest  prze- 
nicznych  twarzane,  oraz  takie  jak  fotokomórka  czy  fotopowie- 
lacz,  które  są  detektorami  światła.  Zastosowanie  tych 
elementów  oraz  zbudowanych  przy  ich  użyciu  ukła- 
dów było  i jest  nadal  ogromne,  zwłaszcza  w automa- 
tyce czy  technice  pomiarowej.  Duże  wymiary  wymie- 
nionych elementów,  a w konsekwencji  i duże  wymiary 
całych  układów  optoelektronicznych,  jak  i niedosko- 
nałość fizyczna  (niespójność)  światła  używanego  jako 
nośnika  nformacji  uniemożliwiały  jednak  realizację 


w kanale  optoelektronicznym  tych  wszystkich  funkcji, 
które  do  niedawna  realizować  można  było  przy  użyciu 
elektrycznego  kanału  przekazywania  i przetwarzania 
informacji.  Trudno  byłoby  sobie  np.  wyobrazić  radar 
optyczny  czy  telefon  optyczny  z żarówką  lub  zwykłą 
lampą  jarzeniową.  Dopiero  odkrycie  na  początku  lat 
sześćdziesiątych  laserów  oraz  zastosowanie  półprze- 
wodników spowodowało,  że  optoelektronika  zaczęła 
skutecznie  konkurować  z klasyczną  elektroniką  czy 
telekomunikacją.  Wiele  danych  wskazuje  już  obecnie 
na  to,  że  w niedalekiej  przyszłości  może  ona  w pew- 
nych wypadkach  zastąpić  z powodzeniem  obie  te 
dziedziny  techniki. 

Dział  optoelektroniki,  w którym  do  realizacji  pro- 
cesów optoelektronicznych  wykorzystuje  się  półprze- 
wodniki, nosi  nazwę  optoelektroniki  półprzewodni- 
kowej. Znane  obecnie  półprzewodnikowe  przyrządy 
✓ optoelektroniczne  mają  takie  parametry  techniczne, 
że  można  je  stosować  w układzie  optoelektronicznym 
w każdym  z przedstawionych  na  rys.  1 bloków  funk- 
cjonalnych (źródło,  ośrodek,  detektor).  Z materiałów 
półprzewodnikowych  można  wykonać  źródła  światła 
sterowane  elektrycznie  oraz  detektory  przetwarzające 
sygnał  świetlny  na  sygnał  elektryczny.  Materiały  te 
mogą  też  stanowić  ośrodek  optyczny,  przez  który 
światło  jest  przekazywane  lub,  w którym  jest  ono 
przetwarzane  na  światło  o innych  właściwościach 
fizycznych.  Największe  znaczenie  spośród  wymienio- 
nych półprzewodnikowych  przyrządów  optoelektro- 
nicznych mają  źródła  i detektory,  gdyż  mogą  one  speł- 
niać samodzielnie  różne  funkcje  bez  konieczności  łą- 
czenia ich  ze  sobą  w jeden  złożony  układ  optoelektro- 
niczny. 


Półprzewodnikowe  źródła  światła 

Rozwój  półprzewodnikowych  źródeł  światła  wiąże 
się  z odkryciem  zjawisk  katodoluminescencji  i elektro- 
luminescencji  półprzewodników.  Katodoluminescen- 
cja  — to  świecenie  (luminescencja)  półprzewodnika 
wywołane  napromienieniem  go  strumieniem  elektro- 
nów. Elektroluminescencj a jest  natomiast  świeceniem 
półprzewodnika  pod  wpływem  prądu  elektrycznego, 
który  przez  niego  przepływa.  Katodoluminescencja 
półprzewodników  znalazła  zastosowanie  np.  w lampie 
kineskopowej,  która  jest  nieodłączną  częścią  składo- 
wą każdego  telewizora.  Wykorzystanie  tego  zjawiska 
w konstrukcji  lampy  oscyloskopowej  stało  się  pod- 
stawą budowy  oscylografu,  przyrządu,  bez  którego 
trudno  byłoby  sobie  wyobrazić  współczesną  elektro- 
niczną technikę  pomiarową. 

Katodoluminescencyjne  źródła  światła  nie  znajdują 
jednak,  jak  do  tej  pory,  szerszego  zastosowania  w 
układach  optoelektronicznych.  Jest  to  związane  z ich 
dużymi  wymiarami  oraz  z tym,  że  do  skutecznego 
bombardowania  półprzewodnika  strumieniem  elek- 
tronów potrzebne  jest  wytworzenie  wysokiej  próżni, 
w której  elektrony  te  mogłyby  się  poruszać  i byłyby 
odpowiednio  przyspieszane. 

Znacznie  szersze  zastosowanie  w półprzewodniko- 
wych układach  optoelektronicznych  znalazły  elektro- 
luminescencyjne źródła  światła.  Gdy  źródłem  światła 
jest  półprzewodnik  polikrystaliczny  o jednym  typie 
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przewodnictwa,  osadzony  w postaci  cienkich  warstw 
na  odpowiednich  elektrodach  metalowych  i świecący 
pod  wpływem  przepływającego  przezeń  stałego  lub 
zmiennego  prądu  elektrycznego  (efekt  Destriau),  to 
mamy  do  czynienia  z tak  zwaną  komórką  elektrolumi- 
nescencyjną lub  panelem  elektroluminescencyjnym. 
Gdy  natomiast  źródłem  światła  jest  półprzewodniko- 
we złącze  p-n  (-*  Fizyka  przyrządów  półprzewodniko- 
wych) wytworzone  w materiale  monokrystalicznym 
i świecące  pod  wpływem  stałego  prądu  elektrycznego 
przepływającego  przez  złącze  w kierunku  przewodze- 
nia (efekt  Łosiewa),  to  mamy  do  czynienia  z diodą 
świecącą  lub  ze  złączowym  źródłem  światła.  W zależ- 
ności od  konstrukcji  diody  oraz  od  natężenia  prądu 
elektrycznego  płynącego  przez  złącze  p-n,  promienio- 
wanie świetlne  emitowane  przez  źródło  złączowe  jest 
albo  niespójne  — mamy  wówczas  do  czynienia  z dio- 
dą elektroluminescencyjną  (DEL),  albo  jest  ono 
spójne  — źródło  jest  wówczas  laserem  złączowym. 
Diody  elektroluminescencyjne  i lasery  złączowe  są 
obecnie  najczęściej  stosowane  jako  źródła  światła 
w układach  optoelektronicznych. 

DEL  składa  się  z małego  kawałka  monokrystalicz- 
nego  półprzewodnika,  w którym  wytworzono  złącze 
p-n,  przymocowanego  za  pomocą  odpowiedniego 
spoiwa  do  podstawki  metalowej,  oraz  z osłony  ota- 
czającej i hermetyzującej  ten  półprzewodnik,  wyko- 
nanej najczęściej  z barwionej  żywicy  (rys.  2,  il.  6 na 
tabl.  2).  Najważniejszym  elementem  DEL  jest  złącze 


Rys.  2.  DEL  zamocowana  na  podstawce  tranzystorowej  i zanu- 
rzona w przezroczystej  żywicy 


p-n.  Gdy  zostanie  ono  spolaryzowane  elektrycznie 
w kierunku  przewodzenia,  to  w obszarze  typu  p,  w 
warstwie  o grubości  rzędu  1 pm,  wytwarza  się  stan 
inwersji  obsadzeń  poziomów  energetycznych.  Więcej 
elektronów  znajduje  się  wówczas  w paśmie  przewod- 
nictwa (o  większej  energii)  niż  na  górnych  poziomach 
pasma  walencyjnego  (o  mniejszej  energii).  Oznacza  to, 
że  elektrony  mogą  przejść  na  puste  poziomy  pasma 
walencyjnego  i rekombinować  z dziurami  znajdujący- 
mi się  po  stronie  p złącza  p-n.  Gdy  rekombinacji  tej 
towarzyszy  emisja  promieniowania  elektromagnetycz- 
nego, mówimy  o rekombinacji  promienistej  dziur 
i elektronów  w złączu  p-n.  Gdy  energia  rekombinacji 
nośników  ładunku  przekazywana  jest  sieci  krystalicz- 
nej półprzewodnika,  mówimy  o rekombinacji  niepro- 
mienistej.  Podstawowym  kryterium  wyboru  materia- 
łów do  produkcji  DEL  jest  stosunek  prawdopodo- 
bieństw wystąpienia  w danym  półprzewodniku  re- 
kombinacji promienistej  i rekombinacji  niepromieni- 
stej.  Im  większe  jest  prawdopodobieństwo  rekombina- 
cji promienistej  w stosunku  do  prawdopodobieństwa 
rekombinacji  niepromienistej,  tym  bardziej  dany  ma- 
teriał półprzewodnikowy  nadaje  się  do  produkcji 
DEL.  Jeśli  jest  to  materiał  o przerwie  energetycznej 
dostatecznie  dużej  (większej  niż  1 ,7  eV),  to  emitowane 
promieniowanie  elektromagnetyczne  jest  promienio- 
waniem widzialnym.  Materiałami  używanymi  obecnie 
do  produkcji  DEL  są  półprzewodnikowe  związki  galu 
z arsenem  lub  z fosforem.  Arsenek  galu  (Ga As)  do- 
mieszkowany krzemem  emituje  promieniowanie  pod- 
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czerwone  o długości  fali  około  0,97  pm.  Fosforek  galu 
(GaP)  domieszkowany  w obszarze  p cynkiem  i tlenem, 
a w obszarze  n tellurem  emituje  promieniowanie 
czerwone.  GaP  domieszkowany  w obszarze  p cynkiem 
i azotem,  a w obszarze  n siarką  i azotem  emituje  pro- 
mieniowanie zielone.  Diody  z GaP  mogą  być  wyko- 
nane również  w taki  sposób,  że  ich  barwa  świecenia 
zmienia  się  w funkcji  natężenia  przepływającego  przez 
nie  prądu.  Jest  to  związane  z tym,  że  mechanizmy 
rekombinacji  promienistej  w DEL  czerwonych  z GaP 
i w DEL  zielonych  z GaP  są  inne.  Rekombinacja 
promienista  warunkująca  świecenie  czerwone  jest 
związana  z przejściami  między  poziomami  domiesz- 
kowymi donorów  i akceptorów.  Dlatego  też,  gdy 
rośnie  prąd  płynący  przez  złącze,  następuje  zjawisko 
nasycenia  natężenia  świecenia,  wynikające  ze  skoń- 
czonej liczby  centrów  rekombinacyjnych  (par  donor- 
akceptor).  Rekombinacja  warunkująca  świecenie  zie- 
lone związana  jest  z przejściami  z płytkiego  poziomu 
domieszkowego  azotu  do  pasma  walencyjnego.  Po- 
nieważ nie  ma  tu  ograniczenia  liczby  centrów  rekom- 
binacyjnych nie  obserwujemy  też  zjawiska  nasycenia 
natężenia  luminescencji  wraz  ze  wzrostem  prądu  pły- 
nącego przez  złącze.  Ponadto  czerwone  świecenie  wy- 
stępuje tylko  po  stronie  p złącza  p-n  zaś  zielone  świe- 
cenie występuje  po  obu  stronach  złącza  p-n.  Gdy  więc 
obszar  n DEL  z GaP  jest  domieszkowany  siarką 
i azotem  (świecenie  zielone),  zaś  obszar  p cynkiem 
i tlenem  (świecenie  czerwone),  barwa  świecenia  diody 
zależy  od  natężenia  płynącego  przez  nią  prądu.  Przy 
małym  natężeniu  prądu  DEL  świeci  intensywnie 
światłem  czerwonym  a słabo  światłem  zielonym.  Gdy 
natężenie  prądu  wzrasta,  rośnie  też  natężenie  światła 
zielonego,  natomiast  natężenie  światła  czerwonego 
nie  zmienia  się.  W wyniku  tego  następuje  zmiana  bar- 
wy emitowanego  światła  — przez  pomarańczową, 
żółtą  aż  do  zielonej.  Do  produkcji  DEL  emitujących 
światło  widzialne  stosuje  się  też  często  związek  mie- 
szany GaAsi_zPx,  z odpowiednimi  domieszkami. 

DEL  są  źródłami  światła  niespójnego.  Półprzewod- 
nik z wytworzonym  w nim  złączem  p-n  zdolnym  emi- 
tować promieniowanie  elektromagnetyczne,  można 
ukształtować  tak,  by  powstał  rezonator  optyczny, 
tzn.  układ,  w którym  promieniowanie  elektromagne- 
tyczne tworzy  fale  stojące.  Gdy  tak  ukształtowany 
półprzewodnik  pobudzimy  znacznie  silniejszym  prą- 
dem elektrycznym  niż  DEL,  to  może  powstać  w nim 
proces  laserowy,  tzn.  proces  generacji  spójnego  pro- 
mieniowania elektromagnetycznego  w wyniku  wymu- 
szonych przejść  elektronów  z pasma  przewodnictwa 
do  pasma  walencyjnego  (-*  Lasery  — podstawy  dzia- 
łania). W najprostszym  przypadku  półprzewodnik  ma 
kształt  rezonatora  Fabry’ego-Perota  tzn.  jest  prosto- 
padłościanem, którego  boki  prostopadłe  do  płasz- 
czyzny złącza  p-n  tworzą  zwierciadła  rezonatora.  Pro- 
mieniowanie wytworzone  w tym  rezonatorze  może 
zostać  rozproszone  w półprzewodniku,  nie  dając 
wkładu  do  tworzącej  się  w nim  fali  stojącej.  Może  ono 
zostać  zaabsorbowane,  może  być  niedokładnie  odbite 
na  zwierciadłach  rezonatora  lub  też  może  się  wydo- 
stać z półprzewodnika  jako  promieniowanie  niespój- 
ne. Powstające  straty  promieniowania  stwarzają  ko- 
nieczność wstrzyknięcia  przez  złącze  tak  dużej  liczby 
elektronów,  by  zagwarantowana  została  przewaga 
aktów  wytwarzania  promieniowania  nad  aktami  jego 
rozpraszania.  Zatem  dopiero  po  przekroczeniu  pew- 
nej progowej  wartości  natężenia  prądu  płynącego 
przez  złącze  p-n  diody  laserowej  emituje  ona  promie- 
niowanie spójne  i monochromatyczne.  Najlepsze  la- 
sery złączowe  pracujące  w temperaturze  pokojowej 
wymagają  prądów  o natężeniach  rzędu  kilkudziesię- 
ciu mA,  co  odpowiada  progowej  gęstości  prądu  rzędu 
kilkuset  A/cm2.  Przy  wartościach  natężenia  prądu 
mniejszych  od  wartości  progowej  laser  jest  zwykłą 
DEL.  Emituje  on  wówczas  promieniowanie  niespójne 
o dość  szerokiej  linii  widmowej  i znacznie  mniejszym 
natężeniu.  Ten  dwustanowy  charakter  pracy  jest  bar- 
dzo ważną  cechą  laserów  złączowych  wykorzystaną 
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w układach  do  przetwarzania  danych.  Wartość  pro- 
gowego natężenia  prądu  lasera  złączowego  lub,  co 
znacznie  częściej  się  podaje,  wartość  progowej  gęstości 
prądu,  jest  istotnym  parametrem  eksploatacyjnym 
tego  przyrządu.  Przy  zbyt  wysokich  wartościach  prą- 
dów progowych  lasery  złączowe  mogą  bowiem  praco- 
wać tylko  impulsowo,  gdyż  występujące  wówczas 
efekty  cieplne  uniemożliwiają  pracę  ciągłą  (przy  zasi- 
laniu prądem  stałym). 

Najprostszy  a zarazem  najbardziej  do  niedawna 
rozpowszechniony  typ  lasera  złączowego,  tzw.  laser 
homozłączowy,  ma  postać  przedstawioną  schema- 
tycznie na  rys.  3,  Akcja  laserowa  występuje  w cienkim 
obszarze  (obszar  aktywny)  przylegającym  do  złącza 
p-ny  wytworzonego  w jednego  rodzaju  materiale  pół- 
przewodnikowym, a wiązka  promieniowania  lasero- 
wego jest  skierowana  prostopadle  do  pary  doskonale 
gładkich  płaszczyzn  półprzewodnika  odgrywających 
rolę  zwierciadeł  rezonatora  Fabry’ego-Pćrota.  Lasery 
homozłączowe  są  najczęściej  wykonane  z GaAs,  mają 
bardzo  duże  progowe  gęstości  prądów  (rzędu  104-10* 
A/cm2),  wskutek  czego  w temperaturze  pokojowej 
mogą  pracować  tylko  impulsowo. 
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Rys.  3.  Najprostszy  laser  złączowy  (laser  homozłączowy)  z re- 
zonatorem Fabry’ego-Pćrota  oraz  jego  struktura  pasmowa, 
współczynnik  załamania  i rozkład  promieniowania  w obszarze 
aktywnym;  na  dole  przykład  konstrukcji  z rezonatorem  zmonto- 
wanym na  sześciokątnym  korpusie  z gwintem 


<o 

o> 

o 

c 

© 


N 

O E 
-o  J2 

Cl  75 
OT  Ni 


kierunek  ruchu  elektronów 


©©0000000000/ 
£0000000/ 


_/'©  ©0©©0©0©©©©0© 
©©©©©©©©©©©©©©© 


kierunek  ruchu  elektronów 

000©0eQ00Q00> 

©©ee©0©©> 


© 

O) 


a> 


ję 


"V 


/g©®0®0 ©©©©©©©© 
©©©©©( 


©©©©©©©©©©©©©© 


C) 


Rys.  4.  Laser  heterozłączowy:  a)  schemat  budowy  lasera  z pa- 
skową geometrią  kontaktu  omowego,  b)  struktura  pasmowa 
i rozkład  promieniowania  lasera  monoheterozłączowego,  c)  struk- 
tura pasmowa  i rozkład  promieniowania  lasera  bihetorozłączo- 
wego 
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Dokładne  badania  przeprowadzone  w ostatnich  la- 
tach doprowadziły  do  odkrycia,  że  dostatecznie  niskie 
wartości  prądów  progowych  można  uzyskać  tylko  w 
półprzewodnikach  o złożonej  strukturze  składu  che- 
micznego. Najlepsze  rezultaty  uzyskano  w strukturach 
złożonych  z warstwy  GaAs  oraz  z dwóch  warstw, 
w których  część  atomów  Ga  zastępują  atomy  Al,  przez 
co  powstaje  związek  trójskładnikowy  Al^Ga^As. 
Złącza  powstałe  na  styku  dwóch  warstw  o różnym 
składzie  chemicznym  nazywa  się  heterozłączami.  Fo- 
heterozłącza  nieważ  przerwy  energetyczne  w GaAs  i w Al  Ga  _^As 
mają  różne  wartości,  to  w heterozłączu  utworzonym 
z tych  materiałów  powstają  znacznie  wyższe  bariery 
energetyczne  (potencjału)  dla  elektronów  niż  w złączu 
p-n  wytworzonym  w materiale  jednego  rodzaju,  np. 
w GaAs.  Powoduje  to,  że  elektrony  wstrzyknięte  przez 
złącz ep-n  w GaAs  do  obszaru  p tego  materiału  zostają 
odbite  od  bariery  energetycznej  występującej  na  hetero- 
złączu GaAs-Al^Ga^As  ograniczającym  grubość 
obszaru  p w GaAs  (rys.  4).  Rozkład  przestrzenny 
elektronów  w strukturze  warstwowej  lasera  hetero- 
złączowego  zostaje  więc  ograniczony  do  obszaru  znaj- 
dującego się  między  heterozłączami  tej  struktury. 
Różnice  występujące  we  współczynnikach  załamania 
między  GaAs  i Al^Ga^As  powodują,  że  i światło  od- 
bija się  od  heterozłącza  między  tymi  dwoma  związka- 
mi półprzewodnikowymi.  W strukturze  warstwowej 
z dwoma  heterozłączami  zostaje  więc  ograniczony 
rozkład  przestrzenny  zarówno  elektronów  wstrzyk- 
niętych do  obszaru  p przez  złącze  jak  i promieniowania 
elektromagnetycznego  wytworzonego  w wyniku  wy- 
muszonych przejść  emisyjnych  tych  elektronów.  Te 
dwa  ograniczenia  przestrzenne,  równoznaczne  ze 
zmniejszeniem  strat  optycznych  w laserze,  prowadzą 
do  uzyskania  wartości  progowej  gęstości  prądu  rzędu 
kilkuset  A/cm2,  co  umożliwia  ciągłą  pracę  lasera  hete- 
rozłączowego  w temperaturze  pokojowej, 
właściwości  Złączowe  elektroluminescencyjne  źródła  promie- 
złącz  elektro-  niowania  elektromagnetycznego  wyróżniają  następu- 
Surmnescen-  jące  właściwości:  1)  duża  sprawność  przemiany 
cyjnych  energii  elektrycznej  w energię  promienistą  — w naj- 
lepszych laserach  złączowych  sięga  ona  40%,  w DEL 
świecących  zielono  skuteczność  świetlna  może  osią- 
gać granicę  teoretycznie  możliwą  680  Im/W;  2)  czas 
pracy  użytecznej  (tzn.  okres,  po  upływie  którego  na- 
tężenie świecenia  maleje  do  połowy  swej  wartości  po- 
czątkowej) w najlepszych  obecnie  egzemplarzach  la- 
serów złączowych  jest  rzędu  10  000  godzin  (pracy  nie- 
przerwanej), w DEL  zaś  aż  do  ok.  20  lat  (DEL  są 
ponadto  odporne  na  wstrząsy  i warunki  atmosferycz- 
ne); 3)  mały  pobór  mocy  ze  źródła  zasilania  (kilka- 
naście lub  kilkadziesiąt  mW);  4)  duża  sprawność 
i łatwość  modulacji  emitowanego  promieniowania 
z częstościami  sięgającymi  wartości  109  Hz  — modu- 
lacja jest  realizowana  bezpośrednio  przez  zmianę 
prądu  płynącego  przez  diodę;  5)  małe  wymiary— pół- 
przewodnik z wytworzonym  w nim  złączem  ma  zwykle 
kształt  prostopadłościanu  o bokach  0,2  mm,  0,5  mm, 
0,5  mm. 


Półprzewodnikowe  detektory 
promieniowania  elektromagnetycznego 


przewodnika  podczas  procesu  jonizacji  atomów  w 
krysztale,  wystarcza  na  to,  by  elektron  pokonał  siły 
wiążące  go  wewnątrz  półprzewodnika  i opuścił  na- 
promieniony półprzewodnik,  mamy  do  czynienia 
ze  zjawiskiem  fotoelektrycznym  zewnętrznym.  Zja- 
wisko to  jest  wykorzystywane  we  wszelkiego  rodzaju 
fotokomórkach,  czy  fotopowielaczach.  Powstawanie 
pod  wpływem  napromienienia  swobodnych  nośników 
ładunku  wewnątrz  półprzewodnika  nazywa  się  nato- 
miast zjawiskiem  fotoelektrycznym  wewnętrznym. 

Różne  są  skutki  zjawiska  fotoelektrycznego  wewnętrz- 
nego w półprzewodniku.  Zależą  one  przy  tym  od 
struktury  półprzewodnika,  od  obecności  w nim  okreś- 
lonych domieszek,  jak  też  od  występowania  w pół- 
przewodniku wewnętrznych  pól  elektrycznych.  Zja- 
wisko fotoelektryczne  wewnętrzne  wywołuje  obniże- 
nie oporu  elektrycznego  jednorodnego  półprzewod- 
nika w postaci  płytki  lub  warstwy  napylonej  na  jakiś 
inny  materiał.  W półprzewodniku  z wytworzonym 
złączem  p-n,  nie  spolaryzowanym  zewnętrznym  na- 
pięciem elektrycznym,  zjawisko  to  wywołuje  pojawie- 
nie się  na  złączu  stałego  napięcia  fotoelektrycznego 
(efekt  fotowoltaiczny).  Gdy  natomiast  złącze  p-n 
zostanie  spolaryzowane  wstępnie  w kierunku  zapo- 
rowym, to  zjawisko  fotoelektryczne  wewnętrzne  po- 
woduje zmianę  nieliniowego  oporu  złącza.  Fotode-  fotodetektory 
tektory  półprzewodnikowe,  w których  wykorzystano  pófprze- 
opisane  skutki  wewnętrznego  zjawiska  fotoelektrycz-  wodnikowe 
nego  noszą  odpowiednio  nazwy:  fotoopornik  (foto- 
rezystor),  fotoogniwo  (bateria  słoneczna)  oraz  foto- 
dioda. W takich  fotodetektorach  zawsze  występują 
następujące  procesy  fizyczne:  wytworzenie  nośników 
ładunku  przez  promieniowanie  elektromagnetyczne 
padające  na  półprzewodnik,  przeniesienie  (transport) 
tych  nośników  przez  obszar  półprzewodnika  do  kon- 
taktów metalowych  łączących  ten  półprzewodnik 
z zewnętrznym  obwodem  elektrycznym,  oraz  oddzia- 
ływanie fotoprądu  dopływającego  do  kontaktów  z ze- 
wnętrznym obwodem  elektrycznym.  Charakter  wy- 
mienionych procesów  jest  zwykle  różny  w różnych 
typach  fotodetektorów  półprzewodnikowych . Warun- 
kuje on  parametry  eksploatacyjne  tych  fotodetektorów 
oraz  określa  możliwości  ich  zastosowań. 

Najprostszym  typem  fotodetektora  jest  fotoopor-  fotoopornik 
nik.  Jest  to  przyrząd  złożony  z płytki  półprzewodni- 
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wywołane 
przez  pro- 
mieniowanie 


Promieniowanie  elektromagnetyczne  padające  na  ja- 
kąś substancję  może  zostać  odbite,  zaabsorbowane 
łub  też  może  przejść  przez  tę  substancję  z pewnym  nie- 
wielkim tylko  osłabieniem  jego  natężenia.  Detektory 
promieniowania  elektromagnetycznego  konstruuje 
się  w taki  sposób,  by  maksymalna  część  padającego 
na  nie  promieniowania  została  w nich  zaabsorbowana. 
Ta  zasada  jest  ogólna  dla  wszystkich  rodzajów  detek- 
torów, a więc  i dla  detektorów  półprzewodnikowych. 
Różne  są  zjawiska,  które  zachodzą  w półprzewodniku 
pod  wpływem  padającego  nań  promieniowania  elek- 
tromagnetycznego i różne  są  też  rodzaje  detektorów 
półprzewodnikowych.  Gdy  energia,  którą  przekazuje 
promieniowanie  elektromagnetyczne  elektronom  pół- 
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Rys.  5.  Fotooporniki : 
a)  w postaci  płytki  pół- 
przewodnikowej, b)  w 
postaci  warstwy  prze- 
wodnikowej napylonej 
na  płytkę  szklaną 


kowej  lub  z warstwy  półprzewodnikowej  napylonej 
na  płytkę  szklaną.  Na  przeciwległych  końcach  tej  war- 
stwy lub  płytki  wykonane  są  liniowe  (nieprostujące) 
kontakty  metalowe  (rys.  5).  W czasie  padania  na  po- 
wierzchnię fotoopornika  promieniowania  elektro- 
magnetycznego zmniejsza  się  jego  opór  elektryczny. 
Pochłonięte  promieniowanie  wytwarza  w nim  nośniki 
ładunku  albo  w wyniku  przejść  międzypasmowych, 
albo  w wyniku  przejść  z udziałem  poziomów  energe- 
tycznych domieszkowych  leżących  w przerwie  energe- 
tycznej półprzewodnika.  Fotoprzewodnictwo  w tego 
typu  fotodetektorach  może  się  pojawić  jednak  tylko 
wtedy,  gdy  energia  pochłoniętych  fotonów  jest  równa 
lub  większa  od  energii  oddzielającej  poziom  domiesz- 
kowy leżący  w przerwie  energetycznej  od  krawędzi 
pasma  przewodnictwa  lub  pasma  walencyjnego,  albo 
też  jest  co  najmniej  równa  przerwie  energetycznej 
półprzewodnika.  Ten  fakt  określa  tzw.  długofalową 
granicę  pracy  fotoopornika.  . 

Fotoogniwo  jest  przyrządem  o stosunkowo  dużej 
powierzchni  oświetlonej.  Złącze p-n  znajduje  się  w bez- 
pośrednim sąsiedztwie  (na  głębokości  rzędu  1 ?.im) 
oświetlanej  powierzchni.  Padające  na  złącze  fotony 
o energii  większej  od  szerokości  przerwy  energetycz- 
nej półprzewodnika  powodują  powstanie,  w miejscu 
gdzie  są  pochłaniane,  par  elektron-dziura.  Pole  elek- 
tryczne wewnątrz  półprzewodnika,  związane  z obec- 
nością złącza  p-n,  przesuwa  nośniki  różnych  rodzajów 
w różne  strony.  Elektrony  trafiają  do  obszaru  w, 
dziury  zaś  do  obszaru  p.  Rozdzielenie  nośników  ładun- 
ku w złączu  powoduje  powstanie  na  nim  zewnętrzne- 
go napięcia  elektrycznego.  Ponieważ  rozdzielone  noś- 
niki są  nośnikami  nadmiarowymi  (mają  nieskończony 
czas  życia),  a napięcie  na  złączu  p-n  jest  stałe,  oświe- 
tlone złącze  działa  jako  ogniwo  elektryczne. 

Fotodioda  jest  również  elementem  półprzewodni- 
kowym ze  złączem  p-n.  Teraz  jednak  złącze  jest  spola- 
ryzowane wstępnie  w kierunku  zaporowym.  Wskutek 
oświetlenia  prąd  zaporowy  złącza  jest  modulowany 
przez  powstające  w złączu  pary  elektron-dziura,  co 


z punktowymi  kontaktami  metalicznymi  oraz  diody  fotodioda 
lawinowe.  Wszystkie  te  fotodiody  mają  duże  i różno-  lawinowa 
rodne  zastosowania  praktyczne.  Jednak  fotodiody 
lawinowe,  które  odznaczają  się  silnym  wewnętrznym 
wzmocnieniem  fotoprądu  mają  przed  sobą,  jak  się 
wydaje,  największe  perspektywy  zastosowań,  zwłasz- 
cza w układach  komunikacji  optycznej.  Fotodioda 
lawinowa  pracuje  przy  dużych  napięciach  zaporo- 
wych, przy  których  oświetlenie  złącza  p-n  powoduje 
przebicie  lawinowe.  Jeżeli  wytworzony  przez  pochło- 
nięty foton  nośnik  mniejszościowy,  np.  elektron,  zo- 
stanie przyspieszony  w polu  elektrycznym  spolaryzo- 
wanego zaporowo  złącza  p-n  do  energii  kinetycznej 
większej  ok.  1,5  raza  od  energii  równej  przerwie 
energetycznej  półprzewodnika,  to  może  on  w wyniku 
zderzenia  niesprężystego  przekazać  część  swej  energii 
elektronowi  z pasma  walencyjnego  powodując  jego 
przejście  do  pasma  przewodnictwa.  W ten  sposób  na- 
stępuje generacja  pary  elektron-dziura,  kosztem  pew- 
nego obniżenia  energii  elektronu  pierwotnego,  który 
jednak  nadal  pozostaje  w paśmie  przewodnictwa. 

Powstaje  układ  dwóch  elektronów  przewodnictwa 
i jednej  dziury,  które  to  nośniki  ponownie  mogą  na- 
bywać energię  kinetyczną  w polu  złącza  p-n.  Po 
osiągnięciu  energii  większej  od  przerwy  energetycznej, 
każdy  z tych  ładunków  może  wytworzyć  następną 
parę  elektron-dziura.  Proces  ten  powtarza  się  wielo- 
krotnie w sposób  lawinowy,  dając  na  kontaktach  me- 
talicznych takiej  diody  silny  sygnał  elektryczny.  Po- 
bicie lawinowe  bywa  często  zlokalizowane  w kilku 
obszarach,  w których  tworzą  się  tzw.  mikroplazmy. 

Aby  uzyskać  w diodzie  lawinowej  duże  wzmocnienie  uzyskiwanie 
fotoprądu,  konieczne  jest  takie  wykonanie  złącza  dużego  _ 
p-n s aby  przebicie  to  zachodziło  jednocześnie  w całym  wzmocnienia 
obszarze  złącza  oraz  by  efekty  brzegowe  w miejscu 
wyjścia  złącza  na  powierzchnię  półprzewodnika  nie 
spowodowały  prądów  upływowych.  Wymaga  to  do- 
brania materiału  o małej  ilości  wtrąceń  i dużej  dosko- 
nałości sieci  krystalicznej  (małej  ilości  dyslokacji)  oraz 
zastosowania  pierścienia  ochronnego  (rys.  7). 
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Rys.  7.  Fotodioda  lawinowa 


złoto 


c) 

Rys.  6.  Fotodiody:  a)  selenowa,  b)  krzemowa,  c)  germanowa 

powoduje  odpowiednie  zmiany  nieliniowego  oporu 
tego  złącza.  Konstrukcje  kilku  rodzajów  fotodiod 
przedstawiono  na  rys.  6.  Rodzina  fotodiod  jest  bardzo 
duża.  Zaliczają  się  do  niej  diody  typu  p-i-n,  diody 
z barierą  Schottky’ego,  diody  z heterozłączami,  diody 


Zastosowania  półprzewodnikowych  źródeł 
i detektorów  promieniowania 
elektromagnetycznego 

Półprzewodnikowe  źródła  i detektory  promieniowa- 
nia elektromagnetycznego  znajdują  różnorodne  za- 
stosowania. DEL  emitujące  światło  widzialne  stosuje 


lampki  syg- 
nalizacyjne 


wskaźniki 

alfanume- 

ryczne 


się  jako  miniaturowe  lampki  sygnalizacyjne  małej 
mocy  o barwach  świecenia  czerwonej,  żółtej  czy  zielo- 
nej w różnego  rodzaju  aparaturze  elektronicznej, 
zwłaszcza  przenośnej.  DEL  mogą  wskazywać,  że  zo- 
stało włączone  napięcie  w aparaturze,  mogą  pod- 
świetlać przezroczyste  klawisze  z określonymi  napi- 
sami, np.  w aparatach  telefonicznych,  mogą  być 
oświetlaczami  przyrządów  wskazujących  poziom  pa- 
liwa w baku  samochodowym  czy  szybkość  samocho- 
du, mogą  też  być  źródłem  promieniowania  w prze- 
nośnych dalmierzach  optycznych.  DEL  są  również 
stosowane  we  wskaźnikach  alfanumerycznych.  Diody 
te,  połączone  w jedną  mozaikę  świecącą  i sterowane 
przez  sygnały  elektryczne  trafiają  na  specjalny  układ 
kodujący,  pozwalają  wyświetlać  dowolną  cyfrę  od 
zera  do  dziewięciu  lub  dowolną  literę  alfabetu. 
Układy  takich  wskaźników  mogą  tworzyć  albo  swois- 
tą tablicę  świetlną,  albo  układ  wielocyfrowy  stosowa- 
ny np.  w woltomierzach  cyfrowych,  w kalkulatorach 
elektronicznych  czy  w zegarkach  elektronicznych.  Po- 
jedynczą mozaikę  złożoną  z 35  DEL  przedstawia 
rys.  8,  natomiast  całą  tablicę  świetlną  rys.  9. 

DEL  emitujące  promieniowanie  podczerwone  słabo 
tłumione  przez  atmosferę  (długość  fali  ),  # 0,9  pm) 
są  stosowane  jako  źródła  promieniowania  podczer- 
wonego, m.in.  w dalmierzach  optycznych,  w prze- 


linijka  z DEL 


czytniki 

taśmy 

perforowanej 


Rys.  9.  Tablica  świetlna  wykonana  z DEL 

nośnych  telefonach  optycznych  krótkiego  zasięgu 
(bez  połączenia  kablowego)  czy  też  w czytnikach  taś- 
my perforowanej  w maszynach  matematycznych  (rys. 
10).  Możliwość  szerokiego  zastosowania  tych  źródeł 
promieniowania  wiąże  się  również  z przyrządami 
zwanymi  transoptorami  lub  optronami.  Są  to  umiesz- 
czone w jednej  obudowie  i izolowane  elektrycznie  od 
siebie  dwa  elementy  układu  optoelektronicznego  — 
źródło  i detektor  promieniowania  elektromagnetycz- 
nego (rys.  1 1).  W urządzeniach  tych  źródłem  jest  DEL 
(zwykle  wykonana  z GaAs)  emitująca  promieniowa- 
nie podczerwone,  a detektorem  — fotodioda  (wyko- 
nana z krzemu),  której  czułość  widmowa  jest  prawie 
transoptory  maksymalna  dla  emitowanej  fali.  Transoptor  jest  pod- 
stawowym elementem  strukturalnym  układów  opto- 
elektronicznych mogącym  realizować  różne  funkcje 
obwodowe,  takie  jak  np.  wzmacnianie,  generacja, 
przełączanie  czy  formowanie  sygnałów.  Może  być 
ponadto  używany  jako  transformator  prądu  stałego 
lub  jako  przekaźnik.  Transoptory  są  szczególnie  przy- 
datne tam,  gdzie  występuje  styk  dwóch  różnych  sieci 
elektrycznych,  np.  wysokiego  i niskiego  napięcia,  wy- 
magających zastosowania  galwanicznej  separacji 
między  nimi.  Są  więc  stosowane  w układach  kontroli 
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Rys.  10.  Schemat  czytnika  taśmy  perforowanej.  Taśma  perforo- 
wana przechodząca  pomiędzy  linijką  wykonaną  z 12  DEL  a ukła- 
dem fotodetektorów,  powoduje  pojawienie  się  sygnału  elektrycz- 
nego tylko  z tej  fotodiody,  która  znajduje  się  bezpośrednio  pod 
otworem  w taśmie  (tylko  wówczas  światło  z DEL  dochodzi  do 
fotodiody).  Sygnały  elektryczne  odbierane  z układu  fotodiod 
odtwarzają  rozmieszczenie  otworów  na  taśmie 


Rys.  1 1.  Transoptory:  a)  na  podstawce  tranzystorowej,  b)  w obu- 
dowie ceramicznej 


wysokiego  napięcia,  w aparaturze  medycznej,  która 
musi  być  izolowana  od  pacjenta,  w układach  za- 
bezpieczających maszyny  górnicze  przed  iskrzeniem 
czy  też  urządzeniach  zabezpieczających  przed  prze- 
ciążeniami prądowymi. 

Lasery  złączowe  nie  mają,  jak  do  tej  pory,  tak  ma- 
sowego zastosowania  jak  DEL.  Zarysowują  się  jednak 
już  na  obecnym  etapie  rozwoju  trzy  główne  kierunki 
zastosowania  tych  przyrządów.  Dwustanowy  charakter 
pracy  umożliwia  ich  zastosowanie  w układach  do  prze- 
twarzania danych,  wykonujących  określone  operacje 
logiczne.  Przełączenie  ze  stanu  pracy  „off”  (DEL)  do 
stanu  pracy  „on”  (laser)  może  się  odbywać  nie  tylko 
za  pomocą  elektrycznych  sygnałów.  Okazuje  się,  że 
można  też  laser  przełączyć  z jednego  stanu  w drugi  za 
pomocą  sygnału  świetlnego,  emitowanego  z drugiego 
lasera  złączowego.  Fakt  ten  umożliwił  skonstruowanie 
laserów  sprzężonych  optycznie.  Lasery  sprzężone 
optycznie  są  wykonywane  zwykle  w ten  sposób,  że 
w jednej  monokrysta licznej  płytce  GaAs  wytwarza  się 
dwa  laserujące  złącza  p-n.  Aby  zwiększyć  sprzężenie 
optyczne  między  laserami,  oba  złącza  umieszcza  się 
w tej  samej  płaszczyźnie,  a ponadto  tylko  strony  p 
złącz  są  od  siebie  oddzielone  elektrycznie  (przez  od- 
powiednie wdyfundowanie  domieszek  akceptorowych 
do  płytki  GaAs).  Oba  złącza  mają  różną  długość,  zaś 
ścianki  boczne  płytki,  prostopadłe  do  osi  optycznej 
układu,  są  dodatkowo  zmatowione  w obszarze  złącza 
dłuższego.  W obszarze  złącza  krótszego  ścianki  boczne 
mają  gładkość  lustrzaną.  Zapobiega  to  możliwości 


zastosowania 

laserów 

złączowych 


lasery  generacji  światła  w kierunku  prostopadłym  do  osi 
sprzężone  układu  w laserze  dłuższym.  Gdy  gęstosć  prądu  prze- 
<»n,tucznie  pływającego  przez  laser  krótszy  (obszar  I na  rys.  2) 
optycznie  wkks7Z  od  gęstości  prądu  płynącego 

przez  laser  dłuższy  (A  > A)>  to  akcja  laserowa  wy- 
stępuję tylko  w laserze  krótszym  i to  w kierunku 
poprzecznym.  Dzieje  się  tak  dlatego,  ze  w aserze 
dłuższym,  pracującym  wówczas  poniżej  progu  lasero- 


ściu  pojawia  się  silny  laserowy  sygnał  optyczny  C. 
Poziom  zasilania  części  środkowej  jest  tak  dobrany, 
by  sygnał  laserowy  na  wyjściu  C pojawił  się  tylko 
wtedy,  gdy  sygnały  A i B trafiają  na  układ  jednocześ- 
nie. Przy  jednym  sygnale  A lub  B układ  pracuje  jako 
DEL.  W podobny  sposób  jest  realizowana  w laserze 
z dwiema  odizolowanymi  elektrycznie  częściami  ope- 
racja „lub”  (rys.  13b). 
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wego,  promieniowanie  wychodzące  z lasera  krótszego 
w kierunku  równoległym  do  osi  układu  jest  silnie 
absorbowane.  Jeżeli  jednak  gęstość  prądu  w obszarze 
złącza  dłuższego  (obszar  //)  wzrasta  do  wartości  pro- 
gowej akcji  laserowej  w tym  złączu  (A  to.  Pro" 

mieniowanie  tego  złącza  spowoduje  zmniejszenie  in- 
wersji obsadzeń  w obszarze  złącza  krótszego,  a w 
konsekwencji  wygaszenie  procesu  laserowego  w kie- 
runku  poprzecznym  do  osi  optycznej  układu.  Układ 
będzie  teraz  emitował  promieniowanie  jedynie  w kie- 
runku równoległym  do  osi  układu.  Jak  widać,  zmie- 
niając gęstość  prądów  zasilających  każde  ze  złączy 
n-n  układu,  można  przełączać  promieniowanie  lasero- 
we na  wyjściu  z kierunku  prostopadłego  do  osi  układu 
na  kierunek  równoległy  do  tej  osi. 

Na  tej  zasadzie  można  konstruować  układy^  reali- 
zujące różne  operacje  logiczne,  np.  operacje  „i  oraz 
operację  „lub”.  Operację  „i”  (rys.  13a)  realizuje  laser 
z trzema  elektrycznie  odizolowanymi  częściami  znaj- 
dującymi się  w jednym  wspólnym  rezonatorze.  Stały 
prąd  trafia  na  część  środkową  X,  co  powoduje  pro- 
mieniowanie układu  jako  DEL.  Dwie  pozostałe  części 
układu  spełniają  rolę  elementów  pochłaniających  pro- 
mieniowanie w rezonatorze  — me  doprowadza  się  bo- 
wiem do  nich  prądu.  Gdy  na  układ  trafiają  sygnały 
optyczne  A i 5,  to  wskutek  działania  ich  energii  pro- 
mienistej na  złącza  p-n  absorbentów  maleje  współ- 
czynnik absorpcji  w tych  obszarach,  w wyniku  czego 
w rezonatorze  wzbudza  się  akcja  laserowa,  a na  wyj- 


Rys.  13.  Przykłady  laserowych  układów  logicznych 

Małe  wymiary  i mała  masa  oraz  dostatecznie  duża 
moc  emitowanego  promieniowania  (które  z łatwością 
można  modulować),  umożliwiają  zastosowanie  lase- 
rów złączowych  połączonych  ze  światłowodem,  np. 
z włóknem  szklanym  lub  ze  światłowodem  z tworzy- 
wa sztucznego  (rys.  14),  zarówno  jako  nadajnika  syg- 
nałów optycznych  jak  i stacji  przekaźnikowej  (wzmac- 
niającej i retransmitującej  sygnały  optyczne)  do  celów 
telekomunikacji  optycznej.  Perspektywa  tego  zasto- 
sowania laserów  złączowych  może  bardzo  poszerzyć 
możliwości  zastosowania  tych  przyrządów,  rewolu- 
cjonizując jednocześnie  telekomunikację. 

Trzecim  wreszcie  kierunkiem  zastosowania  laserów 
złączowych  jest  zastosowanie  o bardziej  specjalnym 
przeznaczeniu.  Lasery  te  mogą  być  np.  stosowane 
jako  głowice  lokacyjne  w radarach  optycznych 
umieszczonych  w samolotach  odrzutowych,  mogą  tez 
być  zapalnikami  pocisków  balistycznych,  mogą  wresz- 
cie służyć  jako  miniaturowe  czytniki  hologramów 
i stanowić  elementy  holograficznych  układów  pamię- 
ciowych w maszynach  matematycznych 

Jeszcze  szersze  zastosowanie  niż  źródła  promienio- 
wania elektromagnetycznego  mają  półprzewodnikowe 
detektory  tego  promieniowania.  Są  one  obecnie  stoso- 
wane niemal  w każdej  dziedzinie  techniki.  W regulacji 
automatycznej  stosuje  się  je  jako  różnego  rodzaju  re- 
ceptory selektywne,  reagujące  tylko  na  promienio- 
wanie o określonej  długości  fali,  oraz  meselektywne  -- 
reagujące  na  promieniowanie  o różnych  długościach 
fal.  W technice  pomiarowej  znajdują  zastosowanie 
jako  mierniki  natężenia  sygnałów  optycznych  nato- 
miast w kosmonautyce  wykorzystuje  się  je  jako  ba- 
terie słoneczne,  tzn.  jako  przetworniki  energii  pro- 
mieniowania słonecznego  w energię  elektryczną  zasi- 
lającą aparaturę  znajdującą  się  w pojezdzie  kosmicz- 
nym Wieloelementowe  mozaiki  zawierające  od  kilku 
do  kilkunastu  tysięcy  światłoczułych  elementów  są 
stosowane  jako  przetworniki  obrazow  w kamerach 
telewizyjnych.  Mogą  one  też  być  zastosowane  do 
przetwarzania  obrazu  optycznego  na  bodźce  czucio- 
we stając  się  wówczas  częścią  składową  urządzeń 
zastępujących  niewidomym  wzrok.  Szerokie  zastoso- 
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Rys.  14.  a)  Przykład  sprzężenia  światła  emitowanego  przez  lasei 
złączowy  (z  lewej)  i DEL  (z  prawej)  z włóknem  szklanym,  b)  laLr> 
heterozłączowe  połączone  ze  światłowodem  wykonanym  z włó- 
kna z tworzywa  sztucznego  (średnica  światłowodu  ok.  2 mm) 


wanie  fotodetektorów  (głównie  krzemowych)  wiąże 
się  również  ze  wspomnianymi  już  wyżej  transoptora- 
mi  czy  czytnikami  taśmy  perforowanej,  w których 
współpracują  one  ściśle  z półprzewodnikowymi 
źródłami  promieniowania  elektromagnetycznego, 
noktowizja  Ważne  zastosowanie  znalazły  też  półprzewodniko- 
termografia  we  detektory  promieniowania  podczerwonego  o dłu- 
gości fali  równej  kilka  lub  kilkanaście  pm.  Są  one 
stosowane  w noktowizji  (widzenie  w ciemności  na 
podstawie  rejestracji  promieniowania  podczerwone- 
go emitowanego  przez  różne  ciała  lub  obiekty  i prze- 
tworzenia go  na  promieniowanie  widzialne)  oraz  w 
termografii  (rejestracja  rozkładu  temperatury  na  po- 
wierzchni rozgrzanego  obiektu  na  podstawie  rejestra- 
cji natężenia  promieniowania  podczerwonego  emito- 
wanego przez  elementy  powierzchni  tego  obiektu). 

Zakres  zastosowań  półprzewodnikowych  elemen- 
tów optoelektronicznych  jest  ogromny  i przytoczone 
powyżej  przykłady  nie  wyczerpują  wszystkich  możli- 
wości. 


Kierunki  rozwoju  optoelektroniki 
półprzewodnikowej 


Rozwój  optoelektroniki  półprzewodnikowej  jest  sty- 
mulowany z jednej  strony  nowymi  zastosowaniami 
przyrządów  i układów  optoelektronicznych  w róż- 
nych dziedzinach  techniki,  z drugiej  zaś  strony  rozwo- 
jem innych  gałęzi  elektroniki,  np.  automatyki,  infor- 
matyki czy  telekomunikacji,  które  wykorzystują 
przyrządy  optoelektroniczne  i narzucają  odpowiednie 
wymagania  w odniesieniu  do  niezawodności,  spraw- 
ności energetycznej,  miniaturyzacji  czy  funkcjonal- 


ności tych  urządzeń.  Rozwój  mikroelektroniki  (— ► Mi- 
kroelektronika) spowodował  np.  konieczność  opraco- 
wania zminiaturyzowanego  i niezawodnego  źródła 
światła,  by  wskaźniki  świetlne  stosowane  w układach 
mikroelektronicznych  były  porównywalne  swymi  wy- 
miarami i niezawodnością  z tymi  układami.  Dopro- 
wadziło to  do  konstrukcji  pierwszych  DEL. 

Różne  są  tendencje  rozwojowe  poszczególnych  ro- 
dzajów przyrządów  optoelektronicznych.  W zakresie 
półprzewodnikowych  źródeł  promieniowania  elektro-  zwiększenie 
magnetycznego  można  przewidywać  rozwój  w kierun-  zakresu  wid- 
ku  rozszerzenia  zakresu  widmowego  emitowanych  mowego 
fal  i to  zarówno  w stronę  ultrafioletu,  jak  i w stronę 
podczerwieni  (bardzo  dalekiej),  w kierunku  zwiększe- 
nia mocy  emitowanego  promieniowania  oraz  zwięk- 
szenia sprawności  energetycznej  procesu  emisji  pro- 
mieniowania. Innym  kierunkiem  rozwoju  źródeł  jest 
tworzenie  dużych  matryc  świecących,  zmieniających 
od  punktu  do  punktu  swą  barwę  i natężenie  pod  wpły- 
wem sterujących  sygnałów  elektrycznych.  Matryce  rhatryce 
takie  mogą  znaleźć  zastosowanie  jako  duże,  płaskie  świecące 
ekrany  telewizji  kolorowej,  zawieszane  na  ścianie. 

Jeśli  chodzi  o półprzewodnikowe  detektory  pro- 
mieniowania elektromagnetycznego,  to  dąży  się  za- 
równo do  znacznego  zwiększenia  ich  czułości  energe- 
tycznej i widmowej,  jak  też  do  tworzenia  matryc 
i mozaik  o bardzo  dużym  upakowaniu  elementów  de- 
tekcyjnych, co  umożliwi  skonstruowanie  urządzeń 
do  rozpoznawania  druku,  obrazów  barwnych  i przed-  e* ozpoznawa- 
miotow.  Ważnym  kierunkiem  rozwoju  detektorów  nie  druku, 
^ędzie  tez  prawdopodobnie  trójwymiarowy  zapis  in-  obrazów 
formacji  optycznej  (w  całej  objętości  kryształu)  jak  barwnych  itp. 
i przetwarzanie  energii  promieniowania  słonecznego 
w energię  elektryczną  za  pomocą  dużych  powierzchni 
światłoczułych. 


wodni  kową  w zakresie  konstrukcji  układów  pamię- 
ciowych maszyn  matematycznych  przewidując  możli- 
wość budowy  systemów  o bardzo  szybkim  dostępie 
i pojemności  większej  niż  1012  bitów  na  cm2.  Wynika 
to  z jednej  strony  z faktu,  że  teoretyczna  granica 
gęstości  upakowania  bitów  informacji  jest  usta- 
lona przez  długość  fali,  na  jakiej  jest  ta  informacja 
zapisywana,  z drugiej  zaś  strony  przez  możliwość  wy- 
korzystania zalet  techniki  holograficznej. 

Innym  kierunkiem  rozwoju  optoelektroniki  pół- 
przewodnikowej jest  tzw.  monolityczna  optyka  zinte- 
growana (scalona).  Jest  to  dziedzina  zajmująca  się 
mikrominiaturyzacją  układów  optoelektronicznych 
na  zasadzie  analogicznej  jak  w obwodach  scalonych. 
Dąży  się  tu  do  skonstruowania  całego  układu  opto- 
elektronicznego, tj.  źródła,  elementu  przetwarzającego 
lub  przesyłającego  oraz  detektora  w postaci  jednego 
monolitycznego  elementu  krystalicznego  o wymia- 
rach rzędu  ułamka  milimetra.  Rozwój  tej  dziedziny 
może  doprowadzić  do  nowych,  trudnych  jeszcze  do 
przewidzenia  zastosowań  układów  optoelektronicz- 
nych. 

■*'  iff^.NK2V^  Zjawiska  optyczne  w półprzewodnikach , War- 
szawa 1974;  C.  H.  Gooch  Przyrządy  elektroluminescencyjne  ze 
złączem  p-n , Warszawa  1977. 
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Andrzej  Zawadzki 

W ciągu  zaledwie  kilkunastu  lat  prawie  we  wszystkich 
dziedzinach  elektroniki  zastąpiono  lampy  elektrono- 
we elementami  półprzewodnikowymi:  diodami,  tran- 
zystorami, tyrystorami  (tzw.  dyskretnymi  elementami 
półprzewodnikowymi).  Mają  one  znacznie  mniejsze 
rozmiary,  większą  niezawodność,  zużywają  mniej 
energii  oraz  są  tańsze  dzięki  zastosowaniu  w dużym 
stopniu  zautomatyzowanych  metod  produkcji. 

Początkowo  stosowano  proste,  pojedyncze  tranzy- 
story i diody.  Następnie  opracowano  elementy  pół- 
przewodnikowe spełniające  inne  funkcje  (jak  np.  ty- 
rystory), a tranzystory  i diody  wyspecjalizowano  w 
najróżnorodniejsze  typy  — mocy,  wielkiej  częstości, 
przełączające,  mikrofalowe  itp.  Szybko  jednak  osiąg- 
nięty został  kres  miniaturyzacji  i niezawodności  ukła- 
dów elektronicznych  zbudowanych  z dyskretnych 
elementów  półprzewodnikowych,  bowiem  muszą  one 
mieć  wymiary  umożliwiające  montaż,  a duża  liczba 
połączeń  określa  pewien  poziom  niezawodności  tych 
układów,  który  trudno  zwiększyć.  Na  przykład,  wg 
danych  statystycznych,  przy  1000  połączeń  przynaj- 
mniej jedno  zawodzi  raz  na  5 godzin  pracy  układu. 

Tymczasem  rozwój  pewnych  dziedzin  elektroniki 
uzależniony  był  od  dalszego  radykalnego  postępu 
mimaSus-y-  w dziedzinie . miniaturyzacji,  zmniejszenia  zużycia 
zacja  energii  oraz  zwiększenia  niezawodności  układów 
elektronicznych.  Takimi  dziedzinami  były  przede 
wszystkim  informatyka,  telekomunikacja  satelitarna 
i automatyka. 

Potrzeba  opracowania  nowej  koncepcji  konstrukcji 
układów  elektronicznych  pojawiła  się  w sytuacji,  gdy 
istniały  już  możliwości  techniczne  realizacji  takiej 
koncepcji.  Mianowicie  doprowadzona  była  do  per- 
fekcji technologia  planarna,  służąca  do  wytwarzania 
większości  tranzystorów,  diod  i tyrystorów  półprze- 
wodnikowych. Technologia  ta  polega  na  wytwarzaniu 
złącz  p-n  lub  n-p  w płytce  monokrystalicznej  przez 
kolejne  stosowanie  takich  procesów  jak  dyfuzja  i epi- 
taksja.  Na  płytce  o średnicy  ok.  5 cm,  wyciętej  z mo- 
nokryształu krzemu,  wytwarza  się  jednocześnie  (gru- 
powo) wiele  setek  lub  nawet  tysięcy  np.  tranzystorów 

0 praktycznie  identycznych  właściwościach  (il.  101, 
tabl.  25). 

technologia  Technologia  planarna  jest  bardzo  szybka  i ekono- 
planarna  miczna.  Doskonaląc  ją  osiągano  coraz  lepsze  para- 
metry wytwarzanych  elementów  i coraz  większą  ich 
różnorodność.  Dalszym  krokiem  było  przejście  do 
wytwarzania  na  ciągłym  podłożu  zespołów  elementów 
elektronicznych  wraz  z połączeniami  tak,  aby  tworzyły 
gotowe  miniaturowe  układy  — tzw.  układy  scalone. 
Nie  trzeba  wówczas  zaopatrywać  poszczególnych  ele- 
mentów w wyprowadzenia,  a następnie  łączyć  wy- 
prowadzeń ze  sobą.  Odpowiednio  zaprojektowane 
układy  można  wytwarzać  grupowo — jak  pojedyn- 
cze elementy.  Tak  narodziła  się  mikroelektronika, 
czyli  technika  projektowania  i wytwarzania  układów 
scalonych.  Obecnie  produkowane  są  układy  scalone 
zawierające  na  kawałku  krzemu  o wymiarach  rzędu 
5x5  mm  obwody  elektroniczne  zawierające  kilka- 
dziesiąt tysięcy  tranzystorów,  diod  i oporników, 
układ  scalony  W skład  układu  scalonego  wchodzą  elementy  czyn- 
ne, czyli  tranzystory,  oraz  bierne,  jak  diody,  oporniki 

1 kondensatory,  które  nie  mają  właściwości  przekształ- 
cania sygnałów  elektrycznych.  Elementy  czynne, 
a więc  tranzystory,  są  w układzie  scalonym  (tak  jak 
i w każdym  układzie  elektronicznym)  wzmacniaczami 
prądu  lub  napięcia  sygnałów  elektrycznych,  wzmac- 
niaczami mocy,  detektorami,  dyskryminatorami  czy 
też  generatorami  sygnałów  o określonym  kształcie 
i częstości.  Elementy  czynne  mają  wiele  parametrów 

elementy  opisujących  ich  właściwości,  jak  np.  współczynniki 
czynne  wzmocnienia,  przebieg  zależności  prądu  płynącego 
i bierne  przez  ten  element  od  przyłożonego  napięcia  (zależno- 


ści te  mają  charakter  nieliniowy),  czy  też  częstości, 
z jaką  dany  element  może  pracować  itp.  W odróżnie- 
niu od  elementów  czynnych,  elementy  bierne  są  w za- 
sadzie opisywane  przez  jedną  cechę  — jeden  parametr 
(np.  oporniki  — przez  wartość  oporu  elektrycznego, 
kondensatory  — przez  wartość  pojemności). 

Stopień  złożoności  układów  scalonych  określany  skale 
jest  mianem  skali  integracji.  Pierwsze  układy  scalone  integracji 
wyprodukowane  w USA  na  początku  lat  sześćdzie-  układów 
siątych  spełniały  proste  funkcje  i zawierały  kilka 
łub  kilkanaście  tranzystorów  i oporników.  Były  to 
układy  małej  skali  integracji  — SSI  (ang.  Smali  Scalę 
Integration). 

Następnym  krokiem  w historycznym  rozwoju  tech- 
niki układów  scalonych  były  układy  wykonujące  kilka 
funkcji,  jak  np.  wzmacniacz  pośredniej  częstotliwości 
i detektor  FM  (modulacji  częstotliwości)  mające  za- 
stosowanie w odbiornikach  radiowych,  czy  np.  układy 
cyfrowe  stosowane  w technice  maszyn  i urządzeń  cy- 
frowych. Układy  takie,  zawierające  powyżej  100  tran- 
zystorów oraz  podobną  liczbę  oporników  i diod,  są 
nazywane  układami  średniej  skali  integracji  MSI 
(ang.  Medium  Scalę  Integration). 

W ostatnich  latach  rozpoczęto  wytwarzanie  ukła- 
dów wielkiej  skali  integracji  (ang.  Large  Scalę  Inte- 
gratiori)y  to  znaczy  scalonych  układów  ^spełniających 
określone  funkcje.  Są  to  układy  zawierające  wiele 
tysięcy  tranzystorów  i elementów  biernych.  Produkuje 
się  w ten  sposób  np.  pamięci  o pojemności  od  64  do  pasnięci 
16  384  bitów,  a firma  IBM  wyposaża  swoje  komputery  półprzewod- 
w pamięci  centralne,  zbudowane  z układów  scalonych  mikowe 

0 pojemności  ponad  60  000  bitów.  Trzeba  przy  tym 
pamiętać,  że  jesteśmy  dopiero  na  początku  tej  drogi, 
pamięci  półprzewodnikowe  produkuje  się  zaledwie 
od  kilku  lat  i wielu  ekspertów  twierdzi,  że  w niedługiej 
przyszłości  stosowane  będą  wyłącznie  pamięci  pół- 
przewodnikowe. 

Innymi  układami  wielkiej  i bardzo  wielkiej  skali 
integracji  są  układy  stosowane  np.  w kieszonkowych 

1 stołowych  kalkulatorach,  minikomputerach,  syste- 
mach telefonicznych  i telekomunikacyjnych,  syste- 
mach informatycznych  i automatyki.  Najnowszym 
osiągnięciem  techniki  cyfrowych  układów  scalonych 

wielkiej  skali  integracji  są  mikroprocesory,  to  znaczy  mśkropro- 
układy  scalone  o możliwościach  obliczeniowych  cesory 
małych  maszyn  matematycznych.  Wiele  firm,  w 
szczególności  amerykańskich,  jak  Motorola,  Intel, 

Fairchild,  Texas  Instruments,  produkuje  zestawy  mi- 
krokomputerów składające  się  z kilku  układów  scalo- 
nych (mikroprocesorów,  pamięci,  układów  wejścio- 
wych i wyjściowych),  do  których  dołącza  instrukcje 
programowania.  Użytkownik  według  tych  instrukcji 
może  tak  zaprogramować  zestaw,  aby  spełniał  on  sa- 
modzielne zadania  obliczeniowo-sterujące,  jak  stero- 
wanie ruchem  ulicznym,  obliczanie  ceny  sprzedawa- 
nego towaru  i wydawanie  reszty,  sterowanie  procesa- 
mi technologicznymi  itp. 


Projektowanie  układów  scalonych 

Projektowanie  układów  wymaga  zastosowania  kom- 
puterów, gdyż  inaczej  czas  zaprojektowania  układu 
scalonego  byłby  niewyobrażalnie  długi  lub  wręcz  by- 
łoby to  niemożliwe  do  wykonania.  Oczywiście  właści- 
wym projektantem  układu  scalonego  jest  człowiek  — 
konstruktor.  Opracowano  wiele  różnych  programów 
obliczeniowych,  które  pozwalają  ocenić,  czy  zaprojek- 
towany układ  będzie  spełniał  swoją  funkcję  zgodnie 
z założonymi  parametrami,  uwzględniając  rozrzut 
właściwości  układu  wynikający  z warunków  produk- 
cji, wpływu  temperatury  i np.  warunków  pracy  ukła- 
du. Inne  programy  pozwalają  zaprojektować  roz- 


40  - Encyklopedia  fizyki  współczesnej 


625 


mieszczenie  elementów  w układzie  scalonym  tak,  aby 
zajmowały  one  jak  najmniejszą  powierzchnię,  dawały 
się  połączyć  jedną  warstwą  metalizacji  (chociaż  znane 
są  sposoby  wykonywania  połączeń  skrzyżowanych) 
i aby  połączenia  pomiędzy  elementami  układu  były 
zalety  i jak  najkrótsze.  Przy  projektowaniu  układów  scalo- 
ograniczenia  nych  wykorzystuje  się  następujące  zalety  technologii 
technologii  tych  układów: 

układów  — połączenia  o bardzo  dużej  niezawodności, 
scalonych  < — taka  sama  zależność  parametrów  od  warunków 

pracy  elementów, 

— możliwość  dobierania  elementów  o takich  właś- 
ciwościach i parametrach,  jakie  są  potrzebne. 

Istnieją  także  ograniczenia,  które  konstruktor  musi 
uwzględnić  w swoim  projekcie,  a mianowicie: 

— ograniczenie  maksymalnych  wartości  oporów 
i pojemności, 

— trudności  w uzyskaniu  tranzystorów  p-n-p  o pa- 
rametrach zbliżonych  do  tranzystorów  n-p-ny 

— występowanie  pasożytniczych  pojemności  oraz 
tranzystorów  p-n-p  (rys.  1)  ograniczających  częstość 
pracy  układu, 

— brak  możliwości  wykonywania  elementów  in- 
dukcyjnych w układzie  scalonym  wynikający  z nie- 
możności uzyskania  elementów  magazynujących  pole 
magnetyczne  w półprzewodniku. 

Niektóre  z tych  ograniczeń  są  już  usuwane.  Stoso- 
wanie np.  izolacji  dielektrycznej  (oddzielenie  wysp 
elementów  dwutlenkiem  krzemu  lub  przerwą  po- 
wietrzną) pozwala  na  znaczne  zredukowanie  pojem- 
ności pasożytniczych,  a co  za  tym  idzie  — osiągnięcie 
wyższych  częstości  pracy  układu.  Znane  są  także  takie 
układy,  które  mogą  zastąpić  elementy  indukcyjne  wy- 
twarzając określone  przesunięcie  fazowe  prądu  i na- 
pięcia. Do  takich  układów  należą  żyratory  oraz  układy 
o sprzężeniu  fazowym. 


Wytwarzanie  układów  scalonych 

Istnieje  kilka  zasadniczych  technik  wytwarzania 
układów  scalonych.  Ogromną  większość  produko- 
u kłady  wanyCh  na  świecie  układów  scalonych  stanowią  ukła- 
monolityczne  ^y  monolityczne,  czyli  takie,  w których  wszystkie 
elementy  są  wykonane  w jednym  kryształku  krzemu 
zwanym  strukturą,  o rozmiarach  rzędu  kilku  mili- 
metrów kwadratowych.  W układach  monolitycznych 
osiągane  jest  największe  zagęszczenie  (tzw.  gęstość 
upakowania)  elementów  elektronicznych  — obecnie 
na  kryształku  o wymiarach  ok.  5*  5 mm  można  zmieś- 
cić ponad  60  000  tranzystorów  tworzących  określony 
układ  elektroniczny.  Układy  wielkiej  skali  integracji, 
szczególnie  zouaowane  z tranzystorów  MOS,  zawie- 
rają prawie  wyłącznie  elementy  czynne  (np.  oporniki 
zajmują  zbyt  dużą  powierzchnię  krzemu,  szczególnie 
te,  które  mają  wartość  powyżej  10  kD). 
układy  poza  układami  monolitycznymi,  produkuje  się 
cienko-  w dość  ograniczonym  zakresie  układy  scalone  cienko- 
i grubo-  j grubowarstwowe  oraz  hybrydowe.  Układy  cienko- 
warstwowe warstwowe  wytwarza  się  przez  naparowanie  elemen- 
tów oraz  połączeń  między  nimi  w odpowiednich 
miejscach  podłoża  (szklana  lub  ceramiczna  płytka) 
w postaci  cienkich  warstw  różnych  materiałów  (nie- 
półprzewodników).  Układy  grubowarstwowe  wyko- 
nuje się  przy  użyciu  past  przewodzących  metodą  dru- 
u kłady  ku  sitowego.  Układy  hybrydowe  stanowią  połączenie 
hybrydowe  techniki  monolitycznej  i warstwowej,  gdyż  składają  się 
z dyskretnych  półprzewodnikowych  elementów  czyn- 
nych, a nawet  układów  mikroelektronicznych  doluto- 
wanych  do  połączeń  będących  ścieżkami  cienkich 
warstw  metalu  naparowanych  na  ceramicznym  po- 
dłożu. Oporniki  i kondensatory  w układach  hybrydo- 
wych są  wytworzone,  podobnie  jak  połączenia,  w po- 
staci cienkich  warstewek  odpowiedniego  materiału, 
naparowanych  na  podłoże. 

Układy  hybrydowe  stanowią  niewielki  procent 
wszystkich  produkowanych  na  świecie  układów  scalo- 
nych. Stosowane  są  one  jako  wzmacniacze  dużych 
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mocy  do  100  W,  przetworniki  analogowo-cyfrowe 
i cyfrowo-analogowe  o dużej  dokładności.  Wytwarza 
się  je  na  specjalne  zamówienia.  Układy  warstwowe 
mają  dziś  znaczenie  raczej  historyczne  i stanowią  jedy- 
nie niewiele  znaczący  margines. 

Monolityczne  układy  scalone  podzielić  można  ogól- 
nie na  wytwarzane  techniką  elementów  bipolarnych 
oraz  elementów  unipolarnych,  przy  czym  ostatnio 
zaznacza  się  tendencja  do  łączenia  tych  technik. 

Układy  scalone  bipolarne 

Elementami  czynnymi  w scalonych  układach  bipo- 
larnych są  tranzystory  bipolarne,  tzn.  dwuzłączowe 
elementy  n-p-n  (rzadziej  p-n-p\  których  nazwa  zwią- 
zana jest  z faktem,  że  udział  w przewodzeniu  prądu 
biorą  nośniki  ładunku  obu  rodzajów,  tj.  elektrony 
i dziury.  Przekrój  przez  strukturę  typowego  tranzy- 
stora n-p-n  w układzie  scalonym  ukazuje  rys.  1. 


Przykładowy  proces  wytwarzania  płytek  z układami 
scalonymi  przebiega  następująco : płytka  krzemu 
monokrystalicznego  o przewodnictwie  typu  p (płytka 
podłożowa)  jest  szlifowana,  polerowana  i trawiona 
chemicznie  w celu  usunięcia  wszelkich  nierówności 
powierzchni,  oczyszczenia  jej  i nadania  idealnej  gład- 
kości i równoległości  płaszczyzn.  Następnie  cała  po- 
wierzchnia płytki  zostaje  utleniona  w celu  wytworze- 
nia tzw.  maski  tlenkowej.  Taka  warstwa  tlenku  (ma-  raaska 
ska)  skutecznie  zapobiega  przedostawaniu  się  atomów 
pierwiastka  użytego  jako  domieszka  w procesie  dy- 
fuzji do  obszaru  krzemu  znajdującego  się  pod  nią. 

Obszary  krzemu,  do  których  chcemy  wprowadzić  daną 
domieszkę,  zostają  odsłonięte  w procesie  trawienia 
fotolitograficznego. 

Na  płytkę  krzemu  nakłada  się  emulsję  światłoczułą, 
przesłania  się  ją  maską  w postaci  szklanej  płytki  po-  proces  foto- 
krytej  czarną  emulsją,  na  której  • wytworzone  są  litograficzny 
w skali  1 : 1 wzory  geometryczne  stanowiące  topogra- 
fię struktury  układu  scalonego  i się  ją  naświetla.  Na- 
stępnie się  emulsję  światłoczułą  wywołuje.  Z miejsc 
nie  naświetlonych  emulsję,  wraz  ze  znajdującym  się 
pod  nią  tlenkiem,  usuwa  się  za  pomocą  odpowiednich 
rozpuszczalników.  Opis  powyższy  dotyczy  tzw.  emul- 
sji negatywowej.  Stosowana  jest  także  emulsja  pozy- 
tywowa, przy  użyciu  której  warstwa  tlenku  zostaje 
usunięta  z obszarów  naświetlonych.  Każdy  z tych 
rodzajów  emulsji  ma  swoje  określone  cechy  i wybór 
jednej  z nich  podyktowany  jest  określonymi  wymaga- 
niami technologicznymi. 

Opisana  powyżej  technika  trawienia  fotolitograficz- 
nego stosowana  jest  przy  wytwarzaniu  wszystkich 
obszarów  dyfuzyjnych  w krzemie  (w  strukturze).  Jako  wytwarzanie 
pierwsze  wytwarzane  są  tzw.  warstwy  podkolektoro-  warstw 
we  (zagrzebane,  ang.  Buried  Layer).  podkolekto- 

Obszary  warstw  podkolektorowych,  a także  obsza-  rowych 

ry  baz  i emiterów  tranzystorów,  oraz  obszary  izolują-  , — 

ce  poszczególne  elementy  układu,  są  wytwarzane  za  j 
pomocą  procesu  dyfuzji  w ciele  stałym.  Płytki  umiesz- 
czone  zostają  w piecu  o specjalnej  konstrukcji,  utrzy- 
mującym temperaturę  rzędu  1000°C  z dokładnością 
do  0,5°C.  Do  pojemnika  zawierającego  płytki  wpro- 
wadza się  w odpowiedni  sposób  gaz  (wodór  lub  azot) 
unoszący  atomy  odpowiedniego  pierwiastka  chemicz- 
nego, stanowiącego  domieszkę  dla  materiału  półprze- 
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wodnikowego,  jakim  jest  krzem.  W celu  wytworzenia 
obszarów  o typie  przewodnictwa  n stosuje  się  w tech- 
nologii układów  scalonych  arsen,  antymon  i fosfor; 
natomiast  do  wytworzenia  obszarów  o typie  przewod- 
nictwa p stosuje  się  bor.  Atomy  pierwiastka  domiesz- 
kującego osiadają  na  płytkach  i wnikają  w krzem 
w miejscach  odsłoniętych  (tzw.  okna  tlenkowe)  w pro- 
cesie trawienia  fotolitograficznego,  tworząc  obszary 
o wymaganym  typie  przewodnictwa,  a pomiędzy  nimi 
złącza  p-n.  Oczywiście  wprowadzone  atomy  domieszki 
nie  naruszają  budowy  krystalicznej  półprzewodnika. 

Warstwy  podkolektorowe  są  obszarami  o przewod- 
nictwie typu  u,  silnie  domieszkowanymi,  a więc  mają- 
cymi niski  opór.  Wytwarzane  są  one  w takich  miej- 
scach, że  obszary  baz  tranzystorów  n-p-n  znajdą  się 
dokładnie  nad  nimi.  Zadaniem  warstw  podkolektoro- 
wych  jest  usprawnienie  transportu  nośników  prądu 
(zmniejszenie  oporu  obszaru  łączącego).  Uzyskane 
dzięki  temu  zmniejszenie  oporu  kolektorów  powoduje 
polepszenie  wzmacniających  właściwości  tranzystora, 
zmniejszenie  napięcia  nasycenia  tranzystora,  zmniej- 
szenie pasożytniczej  pojemności  pomiędzy  kolektorem 
a podłożem,  czyli  „masą”  układu,  ograniczającej 
częstość  pracy  układu. 

Po  wytworzeniu  warstw  podkolektorowych  usu- 
nięty zostaje  tlenek  z całej  powierzchni  płytki  i zostaje 
ona  przygotowana  do  następnego  procesu  technolo- 
gicznego, to  jest  do  osadzania  warstwy  epitaksjalnej. 
Proces  epitaksji  polega  na  takim  osadzaniu  atomów 
(krzemu)  z fazy  gazowej  na  monokrystalicznym  podło- 
żu struktury,  aby  powstająca  warstwa  wiernie  i bez 
zniekształceń  zachowała  budowę  krystaliczną  podło- 
ża. Podwyższona  temperatura  procesu  (rzędu  1200°C) 
nadaje  atomom  osiadającym  na  podłożu  pewną  zdol- 
ność przemieszczania  się,  co  ułatwia  im  zajmowanie 
miejsc  określonych  przez  budowę  krystaliczną  krze- 
mu, a więc  umożliwia  wytworzenie  warstwy  będącej 
kopią  podłoża.  Wysoka  temperatura  procesu  epi- 
taksji powoduje  także  ruch  atomów  domieszkujących 
warstwę  podkolektorową,  co  w efekcie  daje  wybrzu- 
szenie w głąb  warstwy  epitaksjalnej. 

W wytworzonej  warstwie  epitaksjalnej  znajdować 
się  będą  wszystkie  elementy  czynne  i bierne  układu, 
zachodzi  więc  konieczność  wzajemnego  ich  odseparo- 
wania. W tym  celu  odsłonięte  za  pomocą  procesu 
fotolitograficznego  obszary  warstwy  epitaksjalnej  do- 
mieszkuje się  dyfuzyjnie  tak,  aby  wytworzyły  się 
obszary  izolacyjne  o przewodnictwie  typu  p łączące 
się  z podłożem.  Pozostałe  obszary  — o typie  n — 
mają  wtedy  kształt  odizolowanych  wysp.  W gotowym 
układzie  scalonym  obszary  izolujące  zostają  przyłą- 
czone do  najniższego  potencjału,  zaś  obszary  wysp  — 
do  potencjału  najwyższego.  W ten  sposób  poszczegól- 
ne wyspy  zostają  wzajemnie  oddzielone  przez  zapo- 
rowo spolaryzowane  złącza  p-n.  Ze  względu  na  rodzaj 
zastosowanej  izolacji  układy  takie  nazywane  są  ukła- 
dami z izolacją  złączową.  Nie  jest  to  optymalny  rodzaj 
izolacji  zarówno  ze  względu  na  zajmowaną  powierzch- 
nię płytki,  jak  i na  jej  jakość  (prądy  upływu,  napięcie 
przebicia,  pojemności  pasożytnicze);  jednakże  z po- 
wodu najłatwiejszego  wytwarzania  jest  on  w chwili 
obecnej  powszechnie  stosowany. 

Po  otrzymaniu  odseparowanych  obszarów,  następ- 
nym krokiem  prowadzącym  do  otrzymania  układu 
scalonego  jest  wytworzenie  poszczególnych  jego  ele- 
mentów. W tym  celu  po  otwarciu  odpowiednich  okien 
tlenkowych  do  obszaru  warstwy  epitaksjalnej  wpro- 
wadza się  dyfuzyjnie  taką  domieszkę,  aby  część  tych 
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Rys.  2.  Opornik  w układzie  scalonym 


obszarów  zmieniła  typ  przewodnictwa  na  p,  tworząc 
w ten  sposób  bazy  tranzystorów  n-p-n.  Jednocześnie 
w tym  samym  procesie  wytwarza  się  oporniki  w po- 
staci pojedynczych  pasków  o określonej  szerokości 
i długości  (rys.  2).  wytwarzanie 

Emitery  tranzystorów  powstają  przez  wytworzenie  emiterów 
w części  obszarów  baz  obszarów  o przewodnictwie  m p~rp 

typu  n.  Obszar  emitera  jest  domieszkowany  silniej  od  j 4 

obszaru  bazy  dla  uzyskania  większego  wzmocnienia  j ( 

prądowego  tranzystora,  ma  więc  znacznie  niższy  opór.  ^ 

Właściwość  tę  czasem  wykorzystuje  się  do  otrzymy- 
wania oporników  o małych  wartościach  oporu. 

W tym  samym  procesie  powstaje  silnie  domieszkowa- 
ny obszar  typu  n w miejscu,  gdzie  następnie  będzie 
wykonany  kontakt  kolektorowy  do  warstwy  epitak- 
sjalnej. Poprawia  to  znacznie  właściwości  kontaktu,  tranzystor 
W układzie  monolitycznym  można  wytworzyć  dwa  boczny 
rodzaje  tranzystorów  p-n-p:  tzw.  tranzystor  boczny,  (laterainy) 
czyli  laterainy,  oraz  tranzystor  podłożowy,  czyli  wer- 
tykalny. Tranzystor  boczny,  pokazany  na  rys.  3a, 
wytwarzany  jest  w ten  sposób,  że  jego  emiter  i kolek- 
tor wykonuje  się  jednocześnie  z bazami  tranzystorów 
n-p-n,  w związku  z czym  bazę  takiego  tranzystora 
stanowi  warstwa  epitaksjalna,  a oba  złącza,  kolekto- 
rowe i emiterowe,  mają  tę  samą  głębokość.  W tran- 
zystorach tych,  podobnie  jak  w wypadku  kolektora 
tranzystora  n-p-n  wytwarza  się  silnie  domieszkowany 
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Rys.  3.  Tranzystor  p-n-p  w układzie  scalonym:  a)  boczny,  b)  po- 
dłożowy 


obszar  dyfuzyjny  typu  w,  ułatwiający  kontakt  do  war- 
stwy epitaksjalnej  — bazy.  W takim  tranzystorze 
przepływ  nośników  w obszarze  bazy  odbywa  się  w 
kierunku  równoległym  do  powierzchni  struktury. 
Współczynnik  wzmocnienia  prądowego  takiego  tran- 
zystora oraz  maksymalna  częstość  jego  pracy  są 
znacznie  mniejsze  niż  dla  tranzystora  n-p-n. 

Nieco  lepsze  parametry  mają  tranzystory  podłożowe 
(rys.  3b),  które  powstają  z pasożytniczego  tranzystora 
p-n-p , składającego  się  z emitera  (obszar  typu  p , 
w którym  dodatkowo  wytwarza  się  obszar  typu  «, 
silnie  domieszkowany),  obszaru  n warstwy  epitak- 
sjalnej oraz  podłoża  (typu  p)  będącego  kolektorem 
tranzystora.  Tranzystory  podłożowe  mogą  pracować 
tylko  w układzie  ze  wspólnym  kolektorem,  co  stanowi 
poważne  ograniczenie  ich  zastosowania. 

Diody  w układzie  scalonym  są  uzyskiwane  przez 
wykorzystanie  złącza  p-n  pomiędzy  obszarami  baz 
i emiterów  (złącze  emiter-baza  ma  lepszą  charakte- 
rystykę w kierunku  przewodzenia  od  złącza  kolek- 
tor-baza).  Natomiast  kondensatory  w układzie  scalo- 
nym można  otrzymywać  wykorzystując  pojemność 
złącza  p-n  lub  też  jako  struktury  MOS,  gdzie  jedną 
okładkę  kondensatora  stanowi  np.  dyfuzyjna  war- 
stwa o przewodnictwie  typu  n (emiter),  drugą  okład- 
kę — warstwa  aluminiowa,  zaś  dielektrykiem  jest 
warstwa  tlenku  krzemu  Si02. 
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Jak  widać  z powyższego  przeglądu,  technologia 
planarna  umożliwia  uzyskanie  następujących  ele- 
mentów układu  scalonego:  1)  tranzystorów  n-p-n 
cechujących  się  w zależności  od  potrzeb  częstością 
maksymalną  pracy  rzędu  500  MHz  lub  mocą  rzędu 
kilku  watów,  2)  diod,  3)  oporników  o oporze  od  kil- 
kudziesięciu fi  do  kilkuset  kfi,  4)  kondensatorów 
o wartościach  rzędu  kilkudziesięciu  pF,  5)  tranzy- 
storów p-n-p  o współczynnikach  wzmocnienia  prą- 
dowego rzędu  10  i częstościach  granicznych  rzędu 
kilku  MHz. 

wytwarzanie  Gdy  wszystkie  elementy  układu  scalonego  są  już 
połączeń  wytworzone,  należy  wykonać  odpowiednią  sieć  po- 
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, łączeń  elektrycznych  pomiędzy  nimi.  Cała  płytka  zo- 
staje przykryta  warstwą  tlenku.  W procesie  fotolito- 
graficznym zostają  wytworzone  okna  tlenkowe 
* w miejscach,  gdzie  mają  powstać  kontakty  elektrycz- 


ne. Następnie  na  całą  płytkę  zostaje  nałożona  war- 
stwa aluminium,  z której  po  nowym  procesie  fotoli- 
tograficznym pozostają  tylko  ścieżki  metaliczne  sta- 
nowiące połączenia  pomiędzy  poszczególnymi  ele- 
mentami układu. 

Dalsze  etapy  otrzymywania  bipolarnych  układów 
scalonych,  tzn.  sprawdzanie  i obudowa  są  podobne, 
jak  w wypadku  niżej  opisanych  unipolarnych  ukła- 
dów scalonych. 


Układy  unipolarne 


Funkcję  analogiczną  do  tej,  jaką  w bipolarnych  ukła- 
dach scalonych  spełniają  tranzystory  n-p-n,  w ukła- 
dach unipolarnych  pełnią  tranzystory  połowę  typu 
MOS  (metal-tlenek-półprzewodnik,  ang.  Metal- 
tranzystor  Oxide-Semi-Conductor  Field-Effect-Transistor,  MOS- 
MOS  FET).  Proces  technologiczny  produkcji  układów 
scalonych  typu  MOS  jest  zasadniczo  identyczny 
z opisanym  poprzednio  procesem  technologii  planar- 
nej scalonych  układów  bipolarnych,  z tą  różnicą,  że 
potrzebny  jest  tylko  jeden  proces  dyfuzji,  w którym 
wykonywane  są  zarówno  źródło  jak  i dren  (rys.  4) 
tranzystora  MOS. 
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Rys.  4.  Tranzystor  MOS  w układzie  scalonym:  a)  tranzystor 
z bramką  metalową,  b)  tranzystor  z bramką  krzemową 

Powierzchnię  odpowiednio  przygotowanej  płytki 
monokrystalicznego  krzemu  utlenia  się.  Następnie 
w procesie  fotolitograficznym  odsłania  się  obszary, 
w których  mają  być  tranzystory  MOS.  Po  czym  na- 
kłada się  na  część  tych  obszarów  nową  warstwę  tlen- 
ku, ale  znacznie  cieńszą  od  pierwotnej.  Cienkie  war- 
bramki  stwy  tlenku  pokrywa  się  z kolei  polikrystalicznym 
tranzystorów  krzemem  odpowiednio  domieszkowanym  w celu 
MOS  uzyskania  dobrej  przewodności  elektrycznej.  W ten 
sposób  uzyskuje  się  bramki  tranzystorów  MOS. 
Przykładane  do  bramki  napięcie  wywołuje  w obszarze 
pod  nią  (w  tzw.  kanale)  pole  elektryczne,  którym 
można  wpływać  na  prąd  elektryczny  płynący  przez 
tranzystor  MOS. 

Bramka  jest  więc  elektrodą  sterującą  i spełnia 
funkcję  analogiczną  do  tej,  którą  w lampie  próżnio- 
wej spełnia  siatka  sterująca.  Istnieje  kilka  typów 


tranzystorów  MOS,  różniących  się  między  sobą  spo- 
sobem wytwarzania  bramki. 

W następnym  etapie  procesu  wytwarzania  tranzy- 
storów MOS  w układzie  scalonym  uzyskana  bramka 
krzemowa  służy  jako  maska  osłaniająca  kanał.  Za- 
letą takiej  technologii  jest  znaczne  zmniejszenie  po- 
jemności pasożytniczych,  a także  ułatwienie  procesu 
fotolitograficznego.  Bramki  z polikrystalicznego 
krzemu  można  także  wykorzystać  jako  dodatkowe 
połączenia  elementów  układu  scalonego  (szczególnie 
przydatne,  gdy  trzeba  stosować  połączenia  skrzyżo- 
wane). Niekiedy  wykonuje  się  bramki  z trudno  topli- 
wego  metalu,  jak  molibden  łub  tytan,  co  polepsza 
pewne  właściwości  tranzystorów  MOS,  lecz  technolo- 
gia ta  jest  znacznie  kosztowniejsza. 

Nie  przesłonięte  bramką  obszary  tranzystora,  tzw. 
źródło  i dren,  domieszkuje  się  w jednym  procesie 
dyfuzji,  a więc  mają  one  taki  sam  typ  przewodnictwa. 

W pojedynczym  tranzystorze  MOS  w zależności 
od  przyłożonego  napięcia  źródło  nośników  ładunku 
może  być  drenem,  czyli  ujściem  prądu,  natomiast 
w układzie  scalonym  zawsze  spełnia  tę  samą  funkcję. 

Standardowe  tranzystory  MOS  z bramką  metalową 
wykonuje  się  najczęściej  z aluminium,  ale  wtedy  ulega 
zmianie,  ze  względu  na  niską  temperaturę  topnienia 
aluminium,  kolejność  wykonywania  elementów.  Naj- 
pierw w procesach  fotolitograficznym  i dyfuzyjnym 
otrzymuje  się  dreny  i źródła,  a następnie  na  cienką 
warstwę  tlenku  nakłada  się  warstwę  aluminium  (zob. 
ił.  102,  tabl.  25). 

Rozróżniamy  dwa  rodzaje  tranzystorów  MOS 
z kanałem  typu  n i z kanałem  typu  p.  W tranzystorze 
z kanałem  n nośnikami  ładunku  są  elektrony,  nato- 
miast w kanale  p — dziury.  W jednym  układzie  sca- 
lonym można  wytwarzać  oba  rodzaje  tranzystorów 
MOS.  Układy  takie,  zwane  komplementarnymi  ukła- 
dami MOS  (COS/MOS  lub  CMOS)  mają  wiele  zalet, 
jak  np.  większą  szybkość  działania  niż  w zwykłych 
układach  MOS,  zmniejszone  zużycie  mocy,  co  jest 
szczególnie  ważne  w wypadku  układów  wielkiej  skali 
integracji. 

W porównaniu  z układami  bipolarnymi,  układy 
MOS  mają  mniejsze  wymiary  elementów  czynnych 
i nie  mają  izolacji  pomiędzy  nimi,  a więc  są  znacznie 
mniejsze.  Wadami  układów  unipolarnych  są:  wol- 
niejsze działanie  (pracują  na  niższych  częstościach) 
i stosunkowo  nieduża  wartość  prądów  wyjściowych, 
co  jest  poważną  wadą  w dużych  systemach  cyfro- 
wych. 

W układach  MOS  praktycznie  nie  ma  elementów 
biernych,  w razie  potrzeby  mogą  być  wytworzone 
w identyczny  sposób  jak  w układach  unipolarnych. 


Montaż  i pomiary  układów  scalonych 

Z chwilą  ukończenia  procesów  technologicznych 
wytwarzających  układy  scalone  (unipolarne  łub  bipo- 
larne) w płytce  półprzewodnikowej  rozpoczyna  się 
proces  montażu.  Jest  on  poprzedzony  pomiarami 
parametrów  elektrycznych  każdego  poszczególnego 
układu. 

Do  odpowiednich  punktów  metalizacji  doprowa- 
dzone są  cienkie  igły  stanowiące  część  skomplikowa- 
nego systemu  pomiarowego  złożonego  z zasilaczy 
prądowych  i napięciowych  oraz  przyrządów  pomia- 
rowych, sterowanych  określonym  programem  pomia- 
rowym. Program  taki,  złożony  z wielu  testów  para- 
metrów prądowych  i funkcjonalnych,  jest  tak  ułożo- 
ny, że  spełnienie  wszystkich  jego  wymagań  przez  dany 
układ  scalony  daje  duży  stopień  pewności,  że  układ 
taki  po  zamknięciu  w obudowie  będzie  działał  pra- 
widłowo. Układy  nie  spełniające  wymagań  programu 
są  odpowiednio  znakowane  i odrzucane  po  podzie- 
leniu płytki. 

Sprawdzone  układy  scalone  zamyka  się  w obudo- 
wach w celu  mechanicznego  zabezpieczenia,  zapewnie- 
nia niezawodności  działania  i umożliwienia  zainsta- 
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lowania  ich  w urządzeniach.  Przedtem  odpowiednie 
punkty  metalizacji  łączy  się  za  pomocą  złotych  dru- 
cików o grubości  0,025  mm  z zewnętrznymi  wyprowa- 
dzeniami obudowy  (il.  100,  tabl.  25).  Obudowane 
układy  scalone  podlegają  dokładnej  kontroli  para- 
metrów układu;  są  to  tzw.  badania  niezawodnościo- 
we, do  których  należy  także  np.  sprawdzenie,  jak 
działają  układy  po  wygrzewaniu  w temperaturze 
100°C  przez  1000  godzin  w czasie  zasilania  ich  ener- 
gią elektryczną. 
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Zastosowania  układów  scalonych 

Największe  zastosowanie  mają  układy  scalone 
w komputerach,  których  rozwój  stał  się  możliwy 
właśnie  dzięki  pojawieniu  się  układów  scalonych. 
Cyfrowe  układy  scalone,  głównie  typu  MOS,  mogą 
być  układami  logicznymi,  arytmetycznymi,  procesora- 
mi, pamięciami,  układami  sterującymi  urządzeniami 
peryferyjnymi  (jak  drukarki,  dziurkarki,  czytniki 
itp.).  Układy  scalone  są  podstawą  działania  kompu- 
terów, minikomputerów,  mikrokomputerów,  kalkula- 
torów i in.  Kalkulator  kieszonkowy  firmy  amerykań- 
skiej Hewlett-Packard,  mający  układ  scalony  (mikro- 
komputer) o wymiarach  rzędu  kilku  mm2,  wykonuje 
86  różnych  operacji  matematycznych,  ma  możliwość 
zapamiętania  dowolnego  programu  obliczeniowego 
składającego  się  z 49  operacji.  Ilustracja  9 (tabl.  3) 
przedstawia  w powiększeniu  strukturę  obwodu  scalo- 
nego mikrokomputera.  Układy  scalone  znalazły  też 
zastosowanie  w centralach  telefonicznych,  maszynach 
do  księgowania  i operacji  bankowych,  w systemach 
sterowania  produkcją,  w kontroli  przebiegu  procesów 
chemicznych,  w diagnostyce  medycznej,  w przyrzą- 
dach pomiarowych  itp. 

Mikrokomputery,  czyli  miniaturowe  maszyny  ma- 
tematyczne, znajdują  coraz  szersze  zastosowania  tam, 
gdzie  jeszcze  kilka  lat  temu  nie  myślano  o używaniu 
komputerów.  Mikrokomputer  sterujący  sygnalizacją 
świetlną  ruchu  ulicznego  będzie  uwzględniał  cha- 
rakterystykę poszczególnych  skrzyżowań,  lokalne 
przepisy,  a także  stale  zmieniające  się  czynniki, 
jak  natężenie  ruchu,  pora  dnia  i roku.  Mikrokompu- 
tery stosowane  w samochodach  kontrolować  będą: 
światła  samochodu,  stan  hamulców  i akumulatora, 
zapięcie  pasów  bezpieczeństwa  przez  jadących,  sy- 
stem przeciwpoślizgowy,  sterowanie  zapłonem,  regu- 
lację mieszanki  paliwowej,  zawartość  szkodliwych 
składników  w spalinach  oraz  zużycie  paliwa.  Rozwój 
telekomunikacji,  a szczególnie  komunikacji  satelitar- 
nej, nie  byłby  możliwy  bez  pojawienia  się  małych, 
niezawodnych,  zużywających  znikome  ilości  energii 
układów  przetwarzających  sygnały  W sprzęcie  woj- 
skowym, aparaturze  samolotowej  i kosmicznej  ukła- 
dy scalone  są  coraz  powszechniej  stosowane  ze  wzglę- 
du na  swą  niezawodność  i wykonywanie  skompli- 
kowanych funkcji  przy  bardzo  małym  zużyciu 
mocy. 

Także  w sprzęcie  przeznaczonym  do  powszechnego 
użytku,  jak  radioodbiorniki,  telewizory,  magneto- 
fony, gramofony,  bliski  jest  moment,  gdy  wszystkie 
funkcje  elektroniczne  przejęte  zostaną  przez  wielo- 
funkcyjne układy  scalone.  Przykład  zastosowania 
układów  scalonych  w sprzęcie  radiowo-telewizyjnym 
ukazuje  i!.  97  (tabl.  24).  Dzięki  układom  scalonym 
możliwa  stała  się  produkcja  zegarków  elektronicz- 
nych niezwykle  dokładnych  (il.  10,  tabl.  3),  wyświetla- 
jących w postaci  cyfr  i liter  godziny,  minuty,  sekundy, 
dzień  tygodnia,  miesiąc,  a nawet  różnicę  stref  czaso- 
wych i lata  przestępne  (zob.  też  il.  11,  tabl.  3). 

Istnieją  także  układy  scalone,  tzw.  wzmacniacze 
operacyjne,  mogące  wykonywać  oprócz  funkcji 
wzmacniania  sygnałów,  operacje  matematyczne  jak 
logarytmowanie,  całkowanie,  różniczkowanie.  Można 
je  zastosować  jako  części  składowe  złożonych,  czułych 
systemów  pomiarowych,  przetwarzania  sygnałów, 
analogowych  maszyn  matematycznych  itp. 


Przyszłość  układów  scalonych 

Prace  nad  doskonaleniem  układów  scalonych  prowa- 
dzone są  wielokierunkowo.  Ulepsza  się  istniejące 
technologie  w celu  podniesienia  wydajności  i obni- 
żenia cen  układów  scalonych.  Uzyskuje  się  to  głów- 
nie przez  stosowanie  coraz  większych  płytek  krzemo- 
wych (na  których  można  zmieścić  większą  liczbę  ukła- 
dów scalonych),  powiększanie  skali  integracji, 
zmniejszenie  obszarów  poszczególnych  elementów  w 
układzie  scalonym,  zmniejszanie  oddziaływań  pasoży- 
tniczych, itp.  Prowadzone  są  prace  nad  nowymi  tech- 
nologiami otrzymywania  układów  scalonych,  jak  np. 
implantacja  jonów,  polegająca  na  wytwarzaniu  żąda- 
nych obszarów  w strukturze  przez  wprowadzenie  ato- 
mów domieszek  w głąb  materiału  za  pomocą  bombar- 
dowania jonami  o dużej  energii.  Ogromne  znaczenie 
ma  rozwój  nowych  technik  fotolitograficznych,  po- 
zwalających na  uzyskiwanie  elementów  o coraz  mniej- 
szych rozmiarach,  porównywalnych  z długością  fali 
światła  widzialnego  (np.  opracowuje  się  procesy  che- 
micznego trawienia  plazmowego,  pozwalające  na 
zmniejszenie  rozmiarów  elementów  poniżej  1 pm). 
Prowadzone  są  też  badania  nad  zastosowaniem  pro- 
mieniowania rentgenowskiego  lub  wiązki  elektronów 
do  wytwarzania  pożądanej  topografii  układu  w mas- 
kach tlenowych. 

Oprócz  prac  zmierzających  do  opracowania 
ulepszonych  bądź  nowych  procesów  technologicznych, 
które  mogą  być  wykorzystywane  do  wytwarzania 
układów  scalonych  w obecnej  postaęi,  trwają  prace 
mające  przynieść  zupełnie  nowe  koncepcje  konstruk- 
cyjne. Prace  z dziedziny  mikroelektroniki  mają  na  celu 
budowę  coraz  bardziej  złożonych  układów  scalonych, 
spełniających  coraz  bardziej  skomplikowane  funkcje. 
Układy  takie  muszą  zawierać  coraz  więcej  elementów 
i coraz  poważniejszym  ograniczeniem  staje  się  ko- 
nieczność izolacji  poszczególnych  elementów  układu 
scalonego  rozpatrywanego  jako  zbiór  tranzystorów, 
diod,  oporników.  Obecnie  myśli  się  o wytwarzaniu 
takich  układów,  w których  odpowiednie  funkcje 
byłyby  realizowane  przez  nośniki  ładunku  przepływa- 
jące w materiale  półprzewodnikowym  nie  podzielo- 
nym na  poszczególne  obszary  typu  p i n,  tworzące  trady- 
cyjnie pojmowane  tranzystory  i diody.  Przepływ  ładu- 
nków elektrycznych  byłby  w odpowiedni  spcsób  kon- 
trolowany przez  przykładane  potencjały  elektryczne. 

Zwiastunem  tej  tendencji  są  układy  o sprzężeniu 
ładunkowym  (CĆD,  ang.  Charge  Coupled  Devices), 
w których  sygnał  jest  przenoszony  przez  ruch  nośni- 
ków ładunku  odpowiednio  sterowanych  oddziaływa- 
niem zewnętrznym  w ciągłym  ośrodku  półprzewod- 
nikowym, bez  wyraźnie  określonych  elementów  czyn- 
nych. Już  w tej  chwili  produkowane  są  pamięci  o du- 
żej pojemności  (16  kilobitów)  w technice  CCD. 
Układy  takie  otwierają  niewątpliwie  drogę  nowej  ro- 
dzinie przyrządów  półprzewodnikowych  — rodzinie 
bloków  funkcjonalnych. 

W ten  niezwykle  szeroki  zakres  prac  naukowo-ba- 
dawczych są  zaangażowane  wielkie  zespoły  naukow- 
ców i inżynierów  dysponujących  najnowocześniejszy- 
mi osiągnięciami  elektroniki,  fizyki,  chemii  i inżynierii 
materiałowej.  W połowie  lat  osiemdziesiątych  mają 
zostać  wprowadzone  do  produkcji  układy  o bardzo 
wielkiej  skali  integracji  (VLSI  od  ang.  Very-Large 
Scalę  Integratioń ) zawierające  powyżej  miliona  ele- 
mentów czynnych,  a zapowiedzią  tego,  co  przyniosą 
najbliższe  lata,  może  być  fakt  wyprodukowania 
w 1979  r.  w laboratoriach  firm  japońskich  pamięci  pół- 
przewodnikowej o pojemności  1 Mb  (1  milion  bitów). 

A.  Ambroziak  Półprzewodnikowe  układy  scalone.  Warszawa 
1966;  K.  Sadźmirowski,  J.  Pieńkos,  W.  Piestrzyński  Cyfrowe 
układy  MOS- LSI,  Warszawa  1979;  M.  Białko  Układy  mikro - 
elektroniczne , Warszawa  1969;  J.  Eimbinder  Zastosowania  linio- 
wych układów  scalonych , Warszawa  1974;  A.  Filipkowski  Mikro - 
elektroniczne  układy  scalone , Warszawa  1966;  E.  Keonjian 
Mikroelektronika , Warszawa  1967;  Z.  Kulka,  M.  Nadachow- 
SKI  Liniowe  układy  scalone  i ich  zastosowanie , Warszawa  1975; 
W.  Marciniak  Przyrządy  półprzewodnikowe  i układy  scalone. 
Warszawa  1979;  J.  Millman,  C.  Hal  ki  as  Układy  scalone  analo- 
gowe i cyfrowe,  Warszawa  1976. 
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Generacja  mikrofal 

Janusz  Konopka 


Oddziaływanie  promieniowania  elektromagnetycz- 
nego z ośrodkami  materialnymi  jest  jednym  z podsta- 
wowych narzędzi  badawczych  fizyki.  Spośród  różnych 
zakresów  widmowych  mikrofale,  a zwłaszcza  fale 
milimetrowe  i submilimetrowe  (tzn.  zakres  fal  od 
1 cm  do  0,1  mm)  były  najdłużej  niedostępne  dla  ba- 
dań — głównie  z powodu  trudności  technicznych 
w ich  wytwarzaniu. 

Prawdziwy  rozwój  techniki  generacji  fal  centyme- 
trowych i milimetrowych  nastąpił  dopiero  w ostatnim 
trzydziestoleciu,  w ostatnim  zaś  dziesięcioleciu 
opanowano  dziedzinę  wytwarzania  fal  submilime- 
trowych,  w ten  sposób  została  wypełniona  jedna  z 
ostatnich  „dziur1  * w paśmie  generowanych  spójnie  fal 
od  drgań  podakustycznych  do  fal  świetlnych.  Należy 
podkreślić,  że  głównym  stymulatorem  rozwoju  techni- 
ki mikrofal  był  radar  i systemy  radiokomunikacyjne. 

Ostatnie  lata  przyniosły  również  zasadnicze  zmia- 
ny w sposobie  generacji  mikrofal.  Poprzednio  wszyst- 
kie typy  oscylatorów  mikrofalowych  wykorzystywa- 
ły oddziaływanie  wiązki  elektronów  w próżni  z mikro- 
falowymi obwodami  rezonansowymi  (tzw.  rezona- 
torami wnękowymi)  przy  ewentualnym  dodatkowym 
przyłożeniu  stałego  pola  magnetycznego.  W 1963  r.  — 
dzięki  odkryciu  J.  B.  Gunna  — okazało  się,  że  spójne 
drgania  elektryczne  w zakresie  mikrofal  mogą  być 
emitowane  przez  pewne  kryształy  półprzewodnikowe, 
źródła  W chwili  obecnej  do  najważniejszych  źródeł  mikro- 
mikrofał  fal  zaliczyć  należy  ciągle  jeszcze  stosowane  lampy 
mikrofalowe:  klistrony,  karcinotrony  (lampy  z falą 
wsteczną)  i magnetrony,  urządzenia  półprzewodni- 
kowe: oscylator  Gunna,  zwany  inaczej  generatorem 
z przeniesieniem  elektronów,  oraz  różne  konstrukcje 
półprzewodnikowych  diod  lawinowych,  a ostatnio 
także  tranzystory  bipolarne  i tranzystory  połowę. 

Artykuł  niniejszy  stawia  sobie  za  cel  omówienie 
zasad  generacji  mikrofal  za  pomocą  najbardziej  dziś 
popularnych  i mających  duże  znaczenie  praktycz- 
ne urządzeń,  jakimi  są  klistron  refleksowy  i generator 
Gunna  zbudowany  na  krysztale  arsenku  galu. 


Klistron  refleksowy 

Próby  podwyższenia  częstości  generacji  oscylato- 
rów zbudowanych  przy  użyciu  lamp  elektronowych 
(triody  i tetrody)  wykazują,  że  istnieje  pewna  częstość 
graniczna,  której  nie  można  przekroczyć  zmieniając 
konstrukcję  czy  też  zmniejszając  wymiary  lamp. 
ograniczenia  Jedną  z przyczyn  jest  fakt,  że  powiększenie  często- 
lamp  elektro-  ści  rezonansowej  obwodu  oscylatora  wiąże  się  ze 
nowych  zmniejszaniem  jego  indukcyjności  lub  pojemności. 

Pojemność  jednak  nie  może  być  mniejsza  niż  pojem- 
ność międzyelektrodowa  lampy,  graniczna  zaś  indu- 
kcyjność  sprowadza  się  do  indukcyjności  doprowa- 
dzeń lampy  plus  indukcyjności  najkrótszych  połączeń 
między  końcówkami  elektrod.  Drugą  podstawową 
przyczyną  istnienia  częstości  granicznej  jest  skoń- 
czony czas  przelotu  elektronów  od  katody  do  anody. 
Oscylatory  triodowe  nie  mogą  sprawnie  pracować, 
jeśli  ten  czas  przelotu  przekracza  choćby  tylko  małą 
część,  np.  V10  okresu  oscylacji,  niezależnie  od  tego,  ja- 
kie się  poczyni  modyfikacje  w elementach  czy  dostro- 
jeniu obwodu  rezonansowego. 

Wymienione  trudności  nie  występują  w innego  typu 
lampach,  tzw.  klistronach.  Cechą  wyróżniającą  kli- 
strony spośród  pozostałych  lamp  elektronowych  jest 
specjalna  metoda,  za  pomocą  której  napięcie  wej- 
ściowe kontroluje  ruch  elektronów  w lampie.  W od- 
różnieniu od  zwyczajnych  lamp,  w których  elektroda 
sterująca  (siatka)  określa  liczbę  elektronów  przelatu- 
jących od  katody  do  anody  w jednostce  czasu,  na- 
pięcie wejściowe  w klistronie  oddziałuje  jedynie  na 
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prędkość  lotu  elektronów  przy  niezmienionej  ich 
liczbie.  Z tego  względu  klistrony  nazywane  są  lampami 
z modulowaną  prędkością. 

Istnieje  wiele  typów  klistronów  w zależności  od  ich 
przeznaczenia,  zakresu  częstości  i dostarczanej  mocy. 

Do  najbardziej  znanych  należą:  klistron  dwuwnęko- 
wy,  stosowany  na  ogół  jako  wzmacniacz  i generator 
wielkich  mocy,  oraz  najpopularniejszy  dotychczas 
generator  mikrofal,  klistron  refleksowy.  budowa 

Klistron  refleksowy  przedstawiony  jest  schematycz-  klisfronu 
nie  na  rys.  1.  Jak  widać,  przestrzeń  katoda-siatka, 
która  w zwyczajnych  lampach  elektronowych  kontro- 


Rys.  1.  Klistron  refleksowy  w przedstawieniu  schematycznym. 
W obszarze  niebieskim  panuje  próżnia  typowa  dla  lamp  elek- 
tronowych (10“*  Pa).  Zasilacz  rezonatora  dostarcza  napięcia 
przyspieszającego  elektrony.  Napięcie  to  musi  być  stabilne  i za- 
wiera się  w granicach  od  300  do  5000  V przy  prądach  od  10  mA 
wzwyż,  zależnie  od  typu  klistronu.  Zasilacz  reflektora  wytwarza 
pole  elektrostatyczne  hamujące  elektrony.  Zasilacz  pracuje  bez- 
prądowo  przy  napięciach  od  100  do  1000  V zależnie  od  typu 
klistronu.  Musi  on  być  niezwykle  stabilny,  gdyż  decyduje  o sta- 
bilności częstości  drgań  mikrofalowych  wytwarzanych  przez  kli- 
stron. Napięcie  żarzenia  wynosi  na  ogół  6,3  V przy  prądach  od 
0,6  do  3 A 

luje  prąd  anodowy,  została  tu  zastąpiona  przez  trzy 
oddzielne  obszary.  Każdy  z obszarów  pełni  inną  funk- 
cję, można  więc  mówić  o swoistym  podziale  pracy. 
Obszar  pierwszy,  rozciągający  się  od  katody  do  rezo- 
natora wnękowego,  wykorzystywany  jest  do  nadania 
elektronom  pełnego  przyspieszenia  w stałym  polu  elek- 
trycznym o natężeniu  E rzędu  wielu  tysięcy  woltów 
na  metr.  Drugi  obszar  stanowi  przewężenie  cylin- 
drycznego lub  toroidalnego  rezonatora  wnękowego 
i jest  przysłonięty  najczęściej  metalową  siatką,  przez 
którą  mogą  swobodnie  przelatywać  elektrony.  Obszar 
ten  nazywamy  szczeliną  rezonatora  lub  szczeliną  w.cz. 
(wielkiej  częstości).  Nie  ma  tutaj  pól  stałych,  jest  na- 
tomiast zmienne  pole  elektryczne  o częstości  własnej 
rezonatora  wnękowego. 

Tu  można  sobie  zadać  pytanie,  skąd  się  bierze  pole 
wielkiej  częstości  w rezonatorze?  Jaki  jest  początek 
procesu  generacji  mikrofal?  Odpowiedź  na  to  pytanie 
trudno  jest  znaleźć  w podręczniku  czy  monografii 
traktującej  opisywany  w tym  rozdziale  temat.  Wy- 
nika to  zapewne  z faktu,  że  za  istotne  uważa  się  za- 
zwyczaj to,  co  się  dzieje  w tzw.  stanie  ustalonym. 
Trwa  on  poniżej  1 ps  i jest  bardzo  trudny  do  zaobser- 
wowania. 


Proces  narastania  pola  elektromagnetycznego  w re- 
zonatorze klistronu,  jeśli  pominąć  pole  szumów  ter- 
micznych, związany  jest  z przelotem  przezeń  pierw- 
szych ładunków  elektrycznych,  które  zdąży  wyemi- 
tować katoda.  Szybko  poruszający  się  elektron  sta- 
nowi impuls  prądu  elektrycznego  o czasie  trwania 
równym  czasowi  przelotu  przez  szczelinę  rezonatora. 
Energia  takiego  impulsu  jest  sumą  energii  drgań 
o wielu  częstościach.  Im  krótszy  impuls,  tym  wyższe 
częstości  są  w nim  zawarte  (lub  jak  się  czasem  mówi  — 
tym  szersze  jest  jego  widmo  fourierowskie).  Łatwo 
więc  znaleźć  w tym  widmie  również  częstości  własne 
rezonatora.  Wiemy  następnie,  że  rezonator  raz  po- 
modulacja  budzony  wykonuje,  jak  potrącona  palcem  struna, 
prędkości  wiele  okresów  drgań.  W ten  sposób  powstaje  pole  elek- 
elektronów  tromagnetyczne,  które  może  wpływać  na  ruch  elek- 
tronów przelatujących  przez  rezonator  w czasie 
późniejszym,  jak  to  opisano  w dalszej  części  tego  roz- 
działu. Pole  eletromagnetyczne  zmienia  kierunek  co 
pół  okresu  drgań  rezonatora,  może  więc  przyspieszać 
bądź  opóźniać  elektrony.  W obszarze  tym  mamy  za- 
tem do  czynienia  z modulacją  prędkości  elektronów. 
Szerokość  szczeliny  jest  bardzo  mała,  na  ogół  nie  prze- 
kracza 100  jim. 

Trzeci  obszar,  rozciągający  się  od  zewnętrznej 
okładziny  rezonatora  do  tzw.  reflektora,  zwany  jest 
obszarem  unoszenia  lub  przestrzenią  odbijającą. 
Sam  reflektor  jest  elektrodą  w postaci  metalowego 
krążka  i połączony  jest  ze  źródłem  napięcia  ujemnego 
w stosunku  do  katody.  Wytwarza  więc  poie  elektrycz- 
ne silnie  hamujące  elektrony.  Z reguły  elektrony 
zawracają  w kierunku  szczeliny  wielkiej  częstości  nie 
osiągnąwszy  elektrody  reflektora.  W obszarze  tym  nie 
ma  pól  zmiennych  i na  wszystkie  elektrony  — nie- 
zależnie od  prędkości,  jaką  mają  przy  wejściu  do  ob- 
szaru unoszenia  — działa  jednakowa  siła,  równa  co 
do  wielkości  iloczynowi  ładunku  i natężenia  pola,  eE. 
Ponieważ  prędkości  elektronów  przy  wejściu  w prze- 
strzeń odbijającą  są  różne,  występuje  efekt  grupowania 
czy  też  paczkowania  elektronów.  Proces  ten,  zasadni- 
czy dla  pracy  klistronu,  wymaga  bliższego  omówienia, 
grupowanie  Elektrony  o największej  prędkości  dolatują  naj- 
elektronów  bliżej  reflektora  i potrzebują  najdłuższego  czasu, 
aby  powrócić  do  szczeliny  rezonatora.  Odwrotnie 
jest  z elektronami  wchodzącymi  w obszar  unoszenia 
z prędkością  najmniejszą.  W ten  sposób  paczka  tworzy 
się  wokół  elektronu  przechodzącego  przez  szczelinę 
rezonatora  w chwili,  gdy  pole  w.cz.  zmienia  się  z przy- 
spieszonego na  opóźniające. 

Ruch  elektronów  jest  analogiczny  do  ruchu  kul 
wyrzuconych  w górę  przeciw  siłom  ziemskiego  pola 
grawitacyjnego.  Kula  wyrzucona  z dużą  prędkością 
wzniesie  się  wyżej  niż  kula  wyrzucona  z prędkością 
mniejszą  i będzie  potrzebować  dłuższego  czasu,  aby 
dotknąć  z powrotem  powierzchni  Ziemi.  W ten  spo- 
sób kilka  kul  wyrzuconych  w różnych  momentach 
z różnymi  prędkościami  może  upaść  równocześnie  na 
Ziemię. 

Przy  pierwszym  przejściu  przez  szczelinę  rezonatora 
liczba  elektronów  przyspieszanych,  tzn.  pobierają- 
cych energię  od  pola  w.cz.,  jest  średnio  taka  sama  jak 
liczba  elektronów  opóźnionych,  tzn.  oddających  ener- 
gię polu  w.cz.  Bilans  energetyczny  jest  więc  równy 
zeru.  Przy  powrocie  do  szczeliny  rezonatora,  tzn.  po 
procesie  paczkowania,  bilans  energetyczny  może  być 
dodatni  lub  ujemny,  zależnie  od  tego,  czy  paczka  bę- 
dzie spowolniona  czy  przyspieszona  przez  pole.  Oczy- 
wiście największy  zysk  energii  oscylacyjnej,  a tym 
samym  maksimum  generowanej  przez  klistron  mocy 
mikrofalowej,  wystąpi,  gdy  środek  paczki  przecho- 
dzić będzie  przez  szczelinę  w momencie  największego 
spowolnienia. 

Łatwo  wykazać,  że  maksima  mocy  mikrofal  gene- 
rowanej przez  klistron  wystąpią  wówczas,  gdy  czas 
przebywania  elektronów  w przestrzeni  odbijającej 
wynosić  będzie  n+zU  okresu  drgań  rezonatora.  Wy- 
dedukować  to  można  również  dla  n = 0 na  podsta- 
wie rys.  2. 


Rys.  2.  Wykresy  obrazujące  proces  grupowania  się  elektronów 
w klistronie  refleksowym.  Dolny  wykres  obrazuje  prędkość  po- 
numerowanych elektronów  (/,  2,  J,  ...)  w czasie  opuszczania 
szczeliny  rezonatora,  tj.  przy  wejściu  w obszar  unoszenia.  Wy- 
kres górny  pokazuje  lot  tych  samych  elektronów  w obszarze  uno- 
szenia w funkcji  czasu,  aż  do  powrotu  do  szczeliny  rezonatora. 
Elektron  4 , nie  przyspieszany  przez  pole  w.cz.,  powraca  razem 
z elektronami  3 i 5 po  upływie  około  3/4  okresu  drgań  rezonatora. 
Elektrony  te  są  silnie  spowalniane  przez  pole  w.cz.,  a tracona 
przez  nie  energia  kinetyczna  przemienia  się  w energię  oscylacji 
mikrofalowych 


Czas  przebywania  elektronów  w przestrzeni  odbi- 
jającej regulować  można  bezpośrednio,  za  pomocą 
zmian  napięcia  reflektora,  lub  pośrednio  — przez 
zmianę  napięcia  przyspieszającego. 

Chociaż  spełnienie  warunku  na  czas  przejścia  jest 
konieczne  do  uzyskania  oscylacji,  nie  oznacza  to,  że 
warunek  ten  jest  dostateczny.  Jeśli  liczba  elektronów 
przelatujących  przez  szczelinę  w jednostce  czasu,  czyli 
inaczej  mówiąc  — prąd  wiązki  elektronów  jest  zbyt 
mały,  energia  dostarczana  przez  „małe”  paczki  elek- 
tronów może  nie  być  dostateczna  do  przezwyciężenia 
strat  energii  w samym  obwodzie  rezonatora  i strat 
wynikających  ze  sprzężenia  rezonatora  ze  światem 
zewnętrznym  (obciążeniem).  Zatem  przekroczenie 
pewnego  minimum  prądu  wiązki  jest  drugim  koniecz- 
nym warunkiem  otrzymania  oscylacji.  Gdy  obydwa 
warunki  są  spełnione,  klistron  dostarcza  energii  mi- 
krofal do  obciążenia. 

Czas  przejścia  elektronów  przez  obszar  unoszenia  czas 
zależy,  jak  już  wspomniano,  od  napięcia  reflektora  przejścia 
Kri  napięcia  przyspieszającego  K0.  Oscylacje  powstaną  elektronów 
przy  pewnych  przedziałach  wartości  tych  parame- 
trów. Przedziałom  tym  można  przypisać  określoną 
liczbę  całkowitą  «,  która  jest  miarą  czasu  przebywa- 
nia elektronów  w przestrzeni  odbijającej,  liczonego 
w okresach  drgań  własnych  rezonatora.  Oscylacje  od- 
powiadające różnym  n zwane  są  modami,  trybami 
lub  rodzajami  pracy  klistronu  (nie  należy  ich  mylić 
z rodzajami  drgań  występujących  we  wnękach  rezo- 
nansowych). 
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Mody  pracy  typowego  klistronu  refleksowego  ge- 
nerującego falę  długości  1 cm  przedstawione  są  na 
rys.  3.  Należy  dodać,  że  rozkład  i szerokość  poszcze- 
gólnych modów  zależy  również  od  konstrukcji  kli- 
stronu (geometrii  szczeliny  rezonatora  i przestrzeni 
odbijającej  oraz  od  częstości).  Z rys.  4 widać,  że  za- 
równo moc,  jak  i częstość  w dużym  stopniu  zależy 
od  napięcia  reflektora.  Na  rys.  5 przedstawiono  spo- 
soby modulacji  mikrofal  generowanych  przez  kii- 
stron  w granicach  pojedynczego  modu  — pokazano 
zarówno  modulację  amplitudy  (AM),  jak  i modulację 
częstości  (FM).  Możliwość  łatwej  modulacji  ma  za- 
sadnicze znaczenie  przy  zastosowaniu  klistronów. 
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Rys.  3.  Wykres  modów  pracy  typowego  klistronu  refleksowego 
na  zakres  fal  I cm.  Obszary  szare  odpowiadają  przedziałom 
oscylacji  dla  poszczególnych  modów  n od  4 do  11.  (Praca  urzą- 
dzenia w obszarze  poniżej  linii  przerywanej  prowadziłaby  do 
uszkodzenia  reflektora  przez  bombardujące  elektrony) 


MHzU 
■2.  + 100  - 


<D 

^ -100 


1 1 IL^. 

-100  -200  -300  -400  V 

napięcie  reflektora  Vf 

Rys.  4.  Wykresy  mocy  generowanej  przez  klistron  dla  modów 
4 , 5,  6,  7 z rys.  3 przy  ustalonym  napięciu  przyspieszającym 
1000  V.  Na  dole — odchylenie  (dewiacja)  częstości  generowanej 
od  częstości  odpowiadającej  maksimum  mocy  dla  danego  modu 
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Rys.  5.  "Sposoby  modulacji  mikrofal  generowanych  przez  klistron 
refleksowy:  a)  modulacja  amplitudy  (AM)  przy  ustalonej  czę- 
stości/możliwa jest  tylko  za  pomocą  fali  prostokątnej;  b)  mo- 
dulacja częstości  (FM).  Gdy  dewiacja  jest  niewielka  (rzędu  kilku 
MHz)  częstość  / jest  proporcjonalna  do  napięcia  modulującego 
przy  prawie  stałej  mocy  P 


Moc  mikrofal  generowanych  przez  klistron  w ra-  moc 
mach  danego  modu  zależy  również  w znacznym  stop-  mikrofal 
niu  od  sprzężenia  z obwodami  zewnętrznymi,  czyli 
z obciążeniem.  Wpływ  obciążenia  na  kształt  modu 
ilustruje  rys.  6.  Przy  słabym  sprzężeniu  (obciążeniu) 


Rys.  6.  Wpływ  obciążenia  na  kształt  modu  klistronu  refleksowego 
i dewiację  częstości  dla  punktów  połowy  mocy:  a)  obciążenie 
zbyt  wielkie;  b)  obciążenie  optymalne;  c)  obciążenie  za  małe 


rezonator  klistronu  ma  większą  dobroć,  mod  jest 
szeroki,  a zmiany  częstości  przy  zmianach  Vr  są 
w okolicy  maksimum  mocy  nieznaczne.  Oczywiście 
moc  dostarczana  przez  klistron  jest  wówczas  również 
mała.  Przy  zwiększaniu  sprzężenia  przechodzi  się 
przez  obszar,  gdzie  mod  jest  jeszcze  dość  szeroki, 
a dostarczana  moc  — duża.  Dalsze  zwiększanie  sprzę- 
żenia z rezonatorem  prowadzi  do  spadku  mocy 
i znacznego  zwężenia  modu  przy  dużych  niestabil- 
nościach  częstości,  wynikających  przede  wszystkim 
z małej  dobroci  silnie  obciążonego  rezonatora. 

Rozważania  powyższe  obrazuje  prosta  zależność 
ilościowa,  wiążąca  zmiany  częstości  pracy  klistronu 
z odchyleniami  fazy  q>  paczki  elektronów  powracają- 
cych do  szczeliny  rezonatora  od  fazy  optymalnej 
<p  = 0 dla  mocy  maksymalnej  oraz  z dobrocią  rezo- 
natora Q (czyli  stosunkiem  energii  elektromagnetycz- 
nej w nim  nagromadzonej  do  sumy  energii  strat): 

A f/f  = tgq>l2Q. 

Klistron  refleksowy  ma  stosunkowo  małą  sprawność 
przetwarzania  energii  prądu  stałego  na  energię  mi- 
krofal. Sprawność  ta  nie  przekracza  na  ogół  kilku  % sprawność 
i jest  mniejsza  dla  klistronów  małej  mocy.  Zależy  ona 
od  napięć  zasilających  i częstości  oraz  od  ukształto- 
wania geometrycznego  klistronu.  Sprawność  klistro- 
nów na  fale  milimetrowe  nie  sięga  zazwyczaj  1%. 

Do  dziś  nie  powiedziano  jeszcze  ostatniego  słowa, 
jak  krótkie  fale  może  generować  klistron  refleksowy. 

Modele  wytwarzane  seryjnie  generują  fale  ok.  1 mm 
przy  mocach  kilku  miliwatów.  Największą  wadą  kli- 
stronów refleksowych  jest  wąski  zakres  przestrajania 
mechanicznego  i elektronicznego  (na  ogół  nie  prze- 
kracza kilkunastu  procent).  Dużą  niedogodnością 
jest  również  konieczność  stosowania  skomplikowa- 
nych zasilaczy,  dostarczających  trzech  stabilnych  na- 
pięć. Napięcie  przyspieszające,  które  w klistronach 
na  fale  milimetrowe  jest  rzędu  kilku  kV,  i napięcie 
reflektoia  muszą  być  bardzo  dokładnie  stabilizowane. 

W zakresie  fal  poniżej  1 mm  jedynymi  lampami  karcinotrony 
mikrofalowymi  mającymi  znaczenie  praktyczne  są 
tzw.  lampy  z falą  wsteczną,  zwane  inaczej  karcino- 
tronami.  Dzięki  nim  osiągnięto  zawrotną  granicę  ge- 
neracji fali  ok.  0,3  mm  długości,  a więc  zbliżoną  do 
częstości  pracy  lasera  cyjanowodorowego  (HCN). 


Generator  Gunna 

Jeszcze  przed  kilku  laty  wykorzystanie  tranzystorów 
do  generacji  mikrofal  ograniczone  było  do  zakresu 
poniżej  1 GHz.  Obecnie  w układach  tranzystorowych 
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osiąga  się  częstość  generacji  ok.  30  GHz,  a przy 
10  GHz  uzyskuje  się  moce  rzędu  100  mW,  a więc 
w wielu  wypadkach  wystarczające.  W mikrofalowych 
generatorach  tranzystorowych  wykorzystuje  się  jako 
element  sprzężenia  zwrotnego  zewnętrzne  rezonatory 
generatory  wnękowe  lub  paskowe  i w swej  zasadzie  działania  ge- 
tranzysto  neratory  te  nie  różnią  się  zasadniczo  od  generatorów 
rowe  stosowanych  na  niższych  częstościach.  . 

Oprócz  generatorów  tranzystorowych  istnieje  cała 
klasa  generatorów  półprzewodnikowych  działających 
na  zasadzie  wytwarzania  w płytce  półprzewodnikowej 
tzw.  oporu  ujemnego.  Należą  do  niej  różne  typy  diod 
lawinowych,  które  mogą  współpracować  z obwodami 
mikrofalowymi  aż  do  częstości  ok.  100  GHz,  oraz 
tzw.  generatory  Gunna.  Te,  choć  oferują  mniejsze 
generatory  moce  i mniejsze  sprawności  przetwarzania  energii  niż 
z oporem  diody  lawinowe,  pozwalają  na  uzyskiwanie  bezkon- 
ujemnym  kurencyjnej  (w  porównaniu  z innymi  generatorami 
półprzewodnikowymi)  czystości  spektralnej  wytwa- 
rzanego promieniowania  (szerokość  linii  poniżej 
1 kHz  przy  częstości  10  GHz). 

Niezwykle  interesująca  zasada  działania  generato- 
rów Gunna,  jedynych  urządzeń  półprzewodnikowych 
generujących  mikrofale,  a nie  zawierających  złącz 
p-n,  związana  jest  ze  specyficzną  strukturą  pasmową 
niektórych  półprzewodników  2-  i 3-składnikowych. 

Jak  klistron  wyróżnia  się  oryginalnością  swej  za- 
sady działania  wśród  lamp  elektronowych  — modu- 
lacją prędkości  .i  grupowaniem  elektronów  w prze- 
strzeni unoszenia,  tak  generator  Gunna  wyróżnia  się 
spośród  urządzeń  półprzewodnikowych  przenosze- 
niem elektronów  z niższego  do  wyższego  minimum 
pasma  przewodnictwa  (gorące  elektrony)  i tworze- 
niem się  ruchomych  domen  bardzo  silnego  pola  elek- 
trycznego wewnątrz  półprzewodnika. 

Jest  rzeczą  wiadomą,  że  jeśli  w jakimś  obwodzie 
elektrycznym  znajduje  się  element  o oporze  ujemnym, 
to  w obwodzie  tym  mogą  się  wzbudzić  oscylacje.  Opór 
ujemny  nie  jest  cechą  powszechnie  spotykaną  w 
przyrodzie.  Najczęściej  (można  tu  przytoczyć  jako 
przykład  wszystkie  metale)  prąd  płynący  przez  ma- 
teriał jest  proporcjonalny  do  przyłożonego  napięcia, 
jak  to  widać  na  rys.  7a.  Spełnione  jest  wtedy  po- 
wszechnie znane  prawo  Ohma.  W pewnych  materia- 


a)  b) 

Rys.  7.  Opór  dodatni  i ujemny.  Normalny  przewodnik  elektrycz- 
ności ma  opór  dodatni  w tym  sensie,  że  prąd  rośnie  ze  wzrostem 
napięcia  (a);  opór/?  — tg<?+  > 0.  W pewnych  materiałach  moż- 
liwa jest  sytuacja  taka,  że  ze  wzrostem  napięcia  prąd  najpierw 
rośnie,  a potem  maleje,  aby  przy  dalszym  wzroście  napięcia  znów 
zacząć  wzrastać  (b).  Obszar  (niebieski),  w którym  prąd  maleje 
przy  rosnącym  napięciu  zwany  jest  obszarem  różniczkowego 
oporu  ujemnego ; w tym  obszarze  opór  R = tg  < 0 


opór  łach  możliwy  jest  jednak  inny  przebieg;  ze  wzrostem 
ujemny  napięcia  prąd  najpierw  rośnie,  a następnie  maleje 
pomimo  dalszego  wzrostu  napięcia.  Gdy  napięcie 
rośnie  jeszcze  bardziej,  prąd  ponownie  zaczyna  ro- 
snąć, jak  to  przedstawiono  na  rys.  7b.  Obszar,  w któ- 
rym prąd  maleje  przy  wzroście  napięcia,  nazywamy 
obszarem  ujemnego  oporu  lub  ściślej  — różniczko- 
wego oporu  ujemnego  ( dV/dI<0 ). 

Krzywą  z rys.  7b  udałoby  się  uzyskać,  gdyby  przy- 
spieszając elektrony  w półprzewodniku  przez  przyło- 
żenie pola  elektrycznego,  można  było  jakimś  sposo- 


bem wycofać  je  z procesu  przewodnictwa  (np.  gdy 
osiągną  pewną  energię  kinetyczną).  Taką  możli- 
wość daje  użycie  arsenku  galu  (GaAs).  Płytka  z tego 


Rys.  8.  Zasadniczy  element  generatora  Gunna:  płytka  mono- 
krystaliczncgo  arsenku  galu.  Na  kryształ  naniesione  są  kontakty 
omowe,  do  których  zamocowane  są  elektrody.  Napięcie  V musi 
być  dostatecznie  duże  (5-15  V),  aby  spowodować  w półprzewod- 
niku powstanie  obszaru  o różniczkowym  oporze  ujemnym 


materiału  stanowi  podstawowy  element  generatora 
Gunna  (rys.  8).  Struktura  pasmowa  arsenku  galu  (-► 
Półprzewodniki  str.  533)  jest  następująca:  ponad  nor- 
malnie zajętym  pasmem  przewodnictwa,  w którym  wżycie 
elektrony  są  bardzo  ruchliwe,  znajduje  się  inne  pasmo,  arsenku 
w którym  elektrony  nie  dają  się  łatwo  przyspieszać,  galu 
(Ściśle  rzecz  biorąc,  mamy  do  czynienia  z jednym 
pasmem,  które  ma  dwa  minima  dla  różnych  wartości 

wektora  falowego  k , przedzielone  lokalnym  maksi- 
mum). W porównaniu  z elektronami  w paśmie  niż- 
szym są  one  właściwie  nieruchome.  Ich  wkład  do 
prądu  (/  = e Ęnm)  płynącego  przez  półprzewodnik 

jest  minimalny  — właśnie  ze  względu  na  małą  pręd- 
kość v.  W ten  sposób,  jeśli  zwiększymy  napięcie  przy- 
łożone do  płytki  arsenku  galu,  prąd  wzrośnie  i dziać 
się  tak  będzie  aż  do  momentu,  w którym  energia  elek- 
tronów osiągnie  taką  wartość,  że  będą  się  one  mogły 
przedostać  do  pasma  wyższego.  Przy  dalszym  wzro- 
ście pola  elektrony  w paśmie  podstawowym  poruszać 
się  będą  coraz  prędzej,  podczas  gdy  elektrony  pobu- 
dzone do  wyższego  pasma  wypadną  z procesu  prze- 
wodzenia prądu.  Jeśli  liczba  elektronów  przecho- 
dzących do  górnego  pasma  będzie  duża,  prąd  zmaleje 
pomimo  dalszego  wzrostu  napięcia. 

Oprócz  arsenku  galu  jest  jeszcze  kilka  związków 
półprzewodnikowych  o strukturze  pasmowej  odpo- 
wiedniej do  tego,  by  mógł  w nich  wystąpić  efekt  oporu 
uiemnego.  Z badań  optycznych  wiadomo,  że  wyższe 
pasmo,  w którym  elektrony  są  bardzo  mało  ruchliwe, 
występuje  na  ogół  w odległości  ok.  1j 3 eV  od  normal- 
nego pasma  przewodnictwa  (lub  wyżej).  Z prostych 
obliczeń  wynika,  że  pole  elektryczne  potrzebne  do 
spowodowania  znacznego  przepływu  elektronów  do 
górnego  pasma  musiałoby  być  bardzo  duże  tak 
duże,  że  wskutek  strat  na  ciepło  Joule’a  mogłoby  wy- 
stąpić silne  przegrzanie,  a nawet  stopienie  materiału. 

Generatory  Gunna  działają  w sposób  stabilny  i dłu- 
gotrwały dzięki  pewnemu  faktowi  wynikającemu 
wprost  z zasad  elektromagnetyzmu.  W krysztale 
w którym  w jakimś  miejscu  wytwarza  się  obszar  o opo- 
rze ujemnym,  rozkład  pola  staje  się  natychmiast  nie-  domeny 
jednorodny.  W szczególności  w płytce  półprzewodni-  P©sa  el- 
kowej wytwarza  się  mały  obszar  zwany  domeną,  w trycznego 
którym  pole  jest  dostatecznie  silne,  aby  przenieść 
elektrony  do  górnego  pasma,  podczas  gdy  w pozosta- 
łej części  płytki,  poza  domeną,  pole  jest  małe.  Dome- 
na nie  jest  tworem  przestrzennie  stabilnym.  Pchana 
siłami  zewnętrznego  pola  elektrycznego  przemieszcza 
się  przez  półprzewodnik  od  elektrody  ujemnej  do  do- 
datniej, gdzie  znika,  a na  jej  miejsce  tworzy  się  nowa 
domena,  na  ogół  w pobliżu  elektrody  ujemnej.  Pro- 
ces ten  się  powtarza,  dopóki  do  półprzewodnika  przy- 
łożone jest  odpowiedniej  wielkości  napięcie. 

Określenie  rozkładu  pola  elektrycznego  wewnątrz 
płytki  półprzewodnikowej  jest  jednym  z głównych 
problemów  teorii  oscylatorów  Gunna.  Przyczyny  two- 
rzenia się  ruchomych  domen  można  w sposób  bardzo 
uproszczony  wyjaśnić  następująco:  W materiale  o do- 
datnim oporze  różniczkowym  mamy  do  czynienia 
z odpychaniem  się  ładunków  jednoimiennych  (elek- 
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tronów).  Każde  zaburzenie  w postaci  zagęszczenia 
ładunku  przestrzennego  zanika  wykładniczo  ze  stałą 
czasu  równą  czasowi  tzw.  relaksacji  dielektrycznej: 
Tr  = e/ertfiy  gdzie  e jest  przenikalnością  elektryczną, 
n — koncentracją  nośników  ładunku,  p — ich  ruch- 
liwością. 

Tworzenie  się  w jakimś  miejscu  półprzewodnika 
obszaru  o różniczkowym  oporze  ujemnym  powoduje 
zagęszczanie  elektronów  w tym  obszarze.  Czas  re- 
laksacji dielektrycznej  staje  się  ujemny,  ładunek  zaś 
przestrzenny  rośnie  w czasie  z prędkością  e^tr 
Pole  elektryczne  związane  z rosnącym  ładunkiem 
przestrzennym  jest  skomplikowaną  funkcją  czasu  i po- 
łożenia wewnątrz  półprzewodnika,  którą  obliczyć 
można  jedynie  za  pomocą  maszyn  cyfrowych.  Przy- 
kład rozkładu  pola  elektrycznego  dla  polaryzacji  pod- 
kry tycznej  (różniczkowy  opór  dodatni)  i polaryzacji 
nadkrytycznej  (różniczkowy  opór  ujemny)  podają 
rys.  9a  i 9b.  kierunek  ruchu 


Rys.  9.  Pole  elektryczne  w arsenku  galu  przy  polaryzacji : a)  pod- 
kry tycznej,  b)  nadkrytycznej,  gdy  zaczyna  się  tworzyć  obszar 
o oporze  ujemnym.  Rysunek  pokazuje  prawdopodobny  kształt 
domeny  pola  elektrycznego;  domena  porusza  się  przez  kryształ 
z prędkością  zbliżoną  do  prędkości  unoszenia  elektronów.  Li- 
niami przerywanymi  oznaczono  położenie  elektrod 


Dla  lepszego  wyjaśnienia,  jak  powstaje  niejednorodny  rozkład 
pola  elektrycznego  w półprzewodniku,  podać  można  przykład 
z dziedziny  pokrewnej.  W półprzewodniku  lub  np.  w gazie  może 
się  pojawić  opór  ujemny,  jeśli  przez  przyspieszenie  elektronów  do 
bardzo  wysokiej  energii,  w czasie  zderzeń  tych  elektronów  z ato- 
mami wystąpi  jonizacja  atomów,  czyli  nagły  wzrost  liczby  elek- 
tronów (powielanie).  Gdy  efekt  ten  nastąpi,  napięcie  potrzebne 
do  przepływu  prądu  określonej  wielkości  zmaleje.  (Efekt  ten  na- 
zywany jest  w różnych  kontekstach  przebiciem  elektrycznym  lub 
przebiciem  lawinowym).  Charakterystyka  prądowo-napięciowa 
w tym  wypadku  ma  również  obszar  oporu  ujemnego,  z tym  za- 
strzeżeniem że  tym  razem  prąd  jest  wielowartościową  funkcją 
napięcia  (pola  elektrycznego)  — w odróżnieniu  od  charaktery- 
styki z rys.  7,  gdzie  napięcie  było  wielowartościową  funkcją  prądu. 

Podczas  jonizacji  lawinowej  czy  przebicia  różne  obszary  pół- 
przewodnika przenoszą  różne  prądy,  tworzą  się  jakby  włókna 
prądowe.  Krańcowym  tego  przykładem  jest  wyładowanie  elek- 
tryczne (iskrzenie)  w gazie  lub  uderzenie  pioruna,  stanowiące 
wąskie  włókna  przewodzące  niemal  cały  prąd,  podczas  gdy  po- 
została objętość  gazu  przewodzi  prąd  bardzo  mały.  Iskra  elek- 
tryczna jest  w pewnym  sensie  domeną  prądową  w odróżnieniu 
od  domeny  pola  elektrycznego  występującej  w oscylatorze  Gunna. 

Opisana  zasada  działania  generatora  Gunna  jest 
dziś  powszechnie  akceptowana,  potwierdziło  ją  wiele 
dodatkowych  doświadczeń.  Oscylacje  są  mało  zależne 
od  zmian  temperatury  kryształu,  zewnętrznego  pola 
magnetycznego  czy  sposobu  zamocowania  kontak- 
tów. Oscylator  ma  w pewnym  sensie  własną  częstość 
rezonansową,  związaną  z czasem  przejścia  domeny 
przez  kryształ,  a tym  samym  — z wymiarami  płytki 
półprzewodnika.  W grubych  próbkach  GaAs  obser- 
wowano generację  równocześnie  na  kilku  częstościach, 
co  jest  niewątpliwie  związane  z jednoczesnym  istnie- 
niem kilku  domen  w różnych  miejscach  kryształu. 
Częstość  generacji  jest  oczywiście  zależna  od  natęże- 
nia pola  elektrycznego,  a więc  od  napięcia  przyłożo- 
nego do  kryształu.  Stwarza  to  możliwość  łatwego 
przestrajania  czy  modulacji  generatora. 

W używanych  w praktyce  oscylatorach  Gunna  sto- 
suje się  zewnętrzny  rezonator  mikrofalowy  o znacznej 
dobroci ; polepsza  on  znakomicie  czystość  spektralną 
generowanych  mikrofal  i stwarza  możliwość  prze- 
strajania mechanicznego.  Jest  to  związane  z wekto- 
rowym dodawaniem  się  pól  zmiennych  o znacznej 
amplitudzie  do  stałego  pola  elektrycznego,  a tym  sa- 
mym — z wpływaniem  na  czas  i miejsce  powstawania 
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i zanikania  domen.  Powstawanie  i wzrost  domen  moż- 
na kontrolować  przez  odpowiednie  kształtowanie 
rozkładu  pola  mikrofalowego  wewnątrz  kryształu. 
W krańcowym  wypadku  doprowadzić  można  w ten 
sposób  do  ograniczenia  natężenia  pola  elektrycznego 
(wysokości  domen)  do  określonej  wielkości.  Taki  ro- 
dzaj pracy  nazywa  się  rodzajem  LSA  (. Limited  Space- 
Charge  Accumulation ) i odznacza  się  znacznie  wyższą 
sprawnością.  Tak  np.  przy  częstości  rzędu  5 GHz 
dochodzi  ona  do  15%,  podczas  gdy  zwykłe  generatory 
Gunna  przetwarzają  energię  ze  sprawnością  kilku 
procent. 

Jeśli  chodzi  o fluktuacje  amplitudy  i częstości,  to 
już  dziś  oscylator  Gunna  konkuruje  z powodzeniem 
z klistronem  refleksowym.  Produkowane  seryjnie  ge- 
neratory Gunna  mogą  dostarczać  mocy  rzędu  setek 
miliwatów  przy  pracy  ciągłej  i rzędu  pojedynczych 
kilowatów  przy  pracy  impulsowej  i częstości  kilku 
GHz.  Górna  granica  częstości  generowanych  mikro- 
fal jest,  jak  dotychczas,  jeszcze  niższa  niż  klistronów, 
lecz  uzyskano  już  moc  ok.  20  mW  na  częstości  100 
GHz.  Moc  otrzymywaną  z generatorów  Gunna  ogra- 
nicza przede  wszystkim  konieczność  odprowadzania 
ciepła  od  elementu  półprzewodnikowego.  Generator 


b) 

Rys.  10.  Porównanie  konstrukcji  klistronu  refleksowego  na 
pasmo  8 mm  (36  GHz)  i generatora  Gunna  na  ten  sam  zakres 
częstości.  Generator  Gunna  jest  niemal  20-krotnie  mniejszy  niż 
klistron  refleksowy.  Jego  małe  wymiary  powodują  duże  trudności 
w odprowadzaniu  ciepła.  Lepsze  odprowadzanie  ciepła  umożliwia 
zastosowanie  dużych  elektrod  miedzianych  (radiatorów) 
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Gunna  jest  tzw.  dwójnikiem,  tj.  ma  tylko  dwie  koń- 
cówki. Prostota  strukturalna  dwójników  implikuje 
prostotę  zasilania  generatora  Gunna  (tylko  jeden  za- 
silacz niskonapięciowy)  i prostotę  współpracujących 
z nim  obwodów  elektrycznych. 

Porównanie  konstrukcji  generatora  Gunna  z kli- 
stronem  obrazuje  rys.  10.  Należy  podkreślić,  że  mało 
złożona  konstrukcja  generatora  półprzewodnikowego 
technologia  kryje  w sobie  wyrafinowaną  technologię  wytwarzania, 
wytwarzania  Sam  arsenek  galu  musi  być  niezwykle  czysty  i jedno- 
generatorów  rodny,  z minimalną  ilością  defektów  strukturalnych. 

Gunna  Kontakty  omowe  do  próbki  kryształu  czynnego  mu- 
szą mieć  bardzo  mały  opór  i są  naparowywane  z re- 
guły na  cienką  warstwę  powierzchniową  silnie  do- 
mieszkowaną tzw.  płytkimi  domieszkami.  Techno- 
logia wytwarzania  generatorów  Gunna  może  być 
w znacznym  stopniu  zautomatyzowana  (wzrost  mono- 
kryształu GaAs  z fazy  gazowej  lub  ciekłej,  implantacja 
domieszek  w okolicach  kontaktów,  naparowywanie 


kontaktów  i mocowanie  elektrod).  Cały  proces  pro- 
dukcyjny odbywa  się  przy  zachowaniu  warunków 
niezwykłej  czystości. 

Wskutek  kosztownej  technologii  wytwarzania,  ge- 
neratory półprzewodnikowe  nie  są  — wbrew  prze- 
widywaniom— wielokrotnie  tańsze  od  klistronów. 
Sytuacja  jednak  może  się  radykalnie  zmienić  wobec 
ciągle  rozszerzającego  się  kręgu  zastosowania  mikro- 
fal i potanienia  technologii  wytwarzania  generatorów 
Gunna  w związku  z ich  masową  produkcją.  Dalszy 
rozwój  generatorów  półprzewodnikowych  doprowa- 
dzi niewątpliwie  w najbliższych  latach  do  rewolucji 
w technice  mikrofalowej  podobnej  do  tej,  która  się 
już  dokonała  w elektronice  niższych  częstości  przez 
kolejne  wprowadzenie  tranzystorów  i układów  sca- 
lonych. T 

B.  G.  Bosch,  R.  W.  H.  Engelmann  Przyrządy  półprzewodni- 
kowe z efektem  Gunna>  Warszawa  1980;  R.  Litwin,  M.  Suski 
Technika  mikrofalowa , Warszawa  1972;  A.  Smoliński  Mikrofa- 
lowa elektronika  ciała  stałego , Wrocław  1973. 


Komputer  jako  narzędzie  pracy  fizyka 


Wojciech  Wójcik 

Elektroniczne  maszyny  matematyczne  są  jednym 
z symboli  obecnej  epoki  rozwoju  techniki.  Rozwój 
ich  był  i jest  nadal  niezwykle  szybki,  nieomal  każdy 
miesiąc  przynosi  nowe,  ciekawe  rozwiązania  tech- 
niczne i technologiczne  w tej  dziedzinie. 

Elektroniczne  maszyny  matematyczne  możemy  po- 
dzielić na  cyfrowe,  analogowe  i hybrydowe.  Maszyny 
cyfrowe  pozwalają  na  operacje  na  liczbach  zapisanych 
w postaci  skończonych  ciągów  cyfr,  w odróżnieniu 
od  maszyn  analogowych,  które  operują  na  wielko- 
ściach mających  charakter  ciągły.  Najczęściej  przy- 
kłada się  na  wejście  maszyny  analogowej  napięcie 
elektryczne.  Maszyny  hybrydowe  posiadają  cechy 
obu  wymienionych  typów  maszyn.  W dalszej  części 
zajmiemy  się  wyłącznie  omówieniem  maszyn  cyfro- 
wych, jako  maszyn  matematycznych  najczęściej  w fi- 
zyce stosowanych.  Coraz  szerzej  przyjmuje  się  obec- 
komputery  nie  nazwa  „komputer”,  która  oznacza  elektroniczną 
maszynę  cyfrową;  w takim  znaczeniu  używać  bę- 
dziemy dalej  tego  terminu. 

Szybki  rozwój  informatyki  sprawił,  że  komputer 
stał  się  dziś  powszechnie  stosowanym  narzędziem 
pracy  w wielu  gałęziach  gospodarki  narodowej,  nauki 
i techniki.  Fizyk  wykorzystuje  wszystkie  najistotniej- 
sze własności  komputera,  poczynając  od  jego  zdol- 
ności rozwiązywania  zadań  numerycznych,  a kończąc 
na  możliwości  przetwarzania  danych,  modelowania 
czy  statystycznej  analizy  wyników  pomiarów.  Bardzo 
często  doświadczenie  wymaga  użycia  komputera  jako 
urządzenia  sterującego  i jednocześnie  analizującego 
wyniki  pośrednie.  Jest  to  tzw.  technika  pracy  w czasie 
rzeczywistym  lub  na  „linii”  ( on-line ).  Tak  szeroki  za- 
kres zastosowania  komputerów  w fizyce  stwarza  ko- 
nieczność posługiwania  się  różnymi  typami  kompute- 
mini-  rów,  o różnych  parametrach  technicznych.  Skonstruo- 
komputery  wano  całą  nową  klasę  tzw.  mini-komputerów,  głównie 
z myślą  o obsłudze  procesów  sterowania  w czasie  rze- 
czywistym do  zadań  wymagających  czasochłonnych 
obliczeń  numerycznych  stosuje  się  duże  komputery., 
dysponujące  odpowiednio  pojemną  pamięcią  we- 
nętrzną  i umożliwiające  wykonywanie  1-2  milionów 
operacji  arytmetycznych  w ciągu  sekundy.  Rozwią- 
zanie układu  100  równań  liniowych  ze  100  niewiado- 
mymi trwa  wówczas  kilka  sekund.  To  samo  zadanie 
zajęłoby  rachmistrzowi  posługującemu  się  zwykłym 
arytmometrem  kilka  lat.  Współczesne  systemy  kom- 
puterowe umożliwiają  rozwiązywanie  zadań,  których 
ze  względu  na  dużą  liczbę  parametrów  nie  można  roz- 
wiązać w inny  sposób.  Warto  jednak  pamiętać,  że 
komputer  jest  jedynie  zautomatyzowanym  aiytmo- 
metrem,  umożliwiającym  wykonywanie  operacji  aryt- 


metycznych i logicznych  z olbrzymią  szybkością* 

O tym,  czy  przy  użyciu  komputera  rozwiązane  zo- 
stanie zadanie  obliczeniowe,  decyduje  wiedza  i do- 
świadczenie programisty,  który  musi  opracować  pro- 
cedurę prowadzącą  do  rozwiązania  problemu  (tzw. 
algorytm),  a następnie  przetłumaczyć  ją  na  ciąg  in-  algorytm 
strukcji  (rozkazów)  zrozumiałych  dla  komputera. 
Umiejętność  programowania  znacznie  ułatwia  korzy- 
stanie z komputera  i przyspiesza  uzyskiwanie  wyni- 
ków, nie  trzeba  bowiem  korzystać  z pośrednictwa  za- 
wodowych programistów . Wprowadzenie  do  po- 
wszechnego użytku  tzw.  języków  algorytmicznych 
znacznie  ułatwiło  opanowanie  sztuki  programowania. 
Powszechnie  używa  się  również  gotowych  algoryt- 
mów i programów  standardowych  przygotowanych 
z myślą  o szerokim  kręgu  użytkowników.  O przydat- 
ności komputera  decydują  nie  tylko  jego  parametry 
techniczne,  ale  również  zestaw  standardowych  prog- 
ramów (biblioteka  programów). 


Rozwój  techniki  obliczeniowe]  — od  liczydła 
do  komputera 

Najstarszym  i najwcześniej  używanym  przez  ludzkość 
liczydłem  są  palce  (fakt,  że  się  obecnie  posługujemy 
układem  dziesiętnym  jest  potwierdzeniem  tej  tezy). 

Na  tej  samej  zasadzie  odliczania  oparta  jest  konstruk- 
cja liczydeł,  których  wiele  odmian  przetrwało  do  dnia 
dzisiejszego.  Istotnym  krokiem  naprzód  w konstrukcji 
maszyn  liczących  była  maszyna  matematyczna 
(ii.  103,  tabl.  26),  zbudowana  w 1652  r.  przez  B.  Pascala. 

Przy  jej  konstrukcji  Pascal  wykorzystał  fakt,  że  sy- 
stem dziesiętny  jest  systemem  pozycyjnym.  Podobnie 

jak  wszystkim  późniejszym  arytmometrom  mechani-  arytmometr 
cznym,  maszynie  Pascala  brakło  pamięci  wewnętrznej  mechaniczny 
dla  przechowywania  wyników  pośrednich.  Aby  wy- 
konać ciąg  działań: 

2,5  -3,55+5,2  -3,5  + 1,5  -2,1  = 30,225, 

nieodzowne  było  użycie  ołówka  i papieru  dla  zapamię- 
tania wyników  pośrednich,  czyli  wyników  poszczegól- 
nych mnożeń,  a dopiero  potem  można  było  wykonać 
dodawanie.  Cechą  charakterystyczną  omawianej 
techniki  obliczeniowej  jest  duża  strata  czasu,  związana 
z ręcznym  wprowadzaniem  liczb  do  maszyny  oraz  za- 
pisywaniem wyników  pośrednich  i końcowych.  Praw- 
dziwą rewolucją  w dziedzinie  automatyzacji  obli- 
czeń było  wykorzystanie  elektroniki  do  konstrukcji  arytmome  r 
arytmometru.  Pierwsze  elektroniczne  arytmometry  elektroniczny 
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(„Mark  I”  i „Eniac”)  zbudowano  w Stanach  Zjedno- 
czonych w latach  1944-45.  Posiadały  one  urządzenie 
wczytujące  instrukcje  przygotowane  uprzednio  na  per- 
forowanych taśmach  papierowych.  Wykonywanie  in- 
strukcji odbywało  się  sekwencyjnie,  w miarę  ich  wczy- 
tywania. Istotnym  krokiem  naprzód  w automatyzacji 
obliczeń  było  wprowadzenie  przez  amerykańskiego 
matematyka,  J.  von  Neumanna,  cyfrowego  sposobu 
przedstawiania  rozkazów  i umieszczenie  ich  bezpo- 
eSektroniczna  średnio  w pamięci  maszyny.  W ten  sposób  powstało 
maszyna  pojęcie  programowanej  elektronicznej  maszyny  cy- 
cyfrowa  frowej  — komputera.  Wzbogacenie  zestawu  rozka- 
zów przez  wprowadzenie  instrukcji  skoku  (bezwarun- 
kowego i warunkowego)  stworzyło  możliwość  korzy- 
stania z komputera  jako  uniwersalnego  narzędzia  do 
prowadzenia  obliczeń  numerycznych.  Wprowadzenie 
operacji  logicznych  umożliwiło  jego  zastosowanie  do 
przetwarzania  danych. 


Elementy  składowe  współczesnego 
komputera 

Na  ii.  104  (tabl.  26)  przedstawiono  typowy  komputer 
średniej  klasy.  Składa  się  on  z wielu  elementów,  z któ- 
jednostka  rych  najważniejszym  jest  tzw.  jednostka  centralna, 
centralna  Zawiera  ona  arytmometr,  pamięć  wewnętrzną,  układ 
sterowania,  rejestry  pamięciowe,  adresowe  i modyfi- 
kacyjne.  Wr  arytmometrze  wykonywane  są  operacje 
arytmetyczne  (dodawanie,  odejmowanie,  mnożenie 
i dzielenie),  operacje  logiczne  (negacja,  alternatywa, 
koniunkcja)  oraz  tzw.  operacje  przesuwania, 
pamięć  W pamięci  wewnętrznej  przechowywane  są  rozkazy 
wewnętrzna  (program)  oraz  liczby  (dane).  Pamięć  zbudowana 
jest  z układu  elementów  ferromagnetycznych,  z któ- 
rych każdy  może  się  znajdować  w jednym  z dwu  sta- 
bilnych stanów  namagnesowania.  Przypisując  stanom 
tym  odpowiednio  wartości  0 i 1,  można  stosować 
dwójkowy  (binarny)  zapis  liczb.  Zaletą  tego  typu  pa- 
mięci jest  krótki  czas  odczytu  i zapisu  informacji 
(rzędu  1 jis)  oraz  możliwość  dosyć  ścisłego  upako- 
wania rdzeni  ferrytowych.  Warto  wspomnieć,  że  obec- 
nie pracuje  się  intensywnie  nad  wprowadzeniem  do 
masowej  produkcji  nowych  typów  pamięci,  np.  pa- 
mięci półprzewodnikowych  lub  laserowych.  Zaletą 
pamięci  półprzewodnikowych  jest  możliwość  uzyska- 
nia krótszych  czasów  odczytu  i zapisu  informacji  oraz 
zwiększona  odporność  na  uszkodzenia  mechaniczne. 
Jest  to  ważne  w dziedzinie  mini-komputerów,  szcze- 
gólnie — instalowanych  w samolotach,  satelitach  i in- 
nych urządzeniach  narażonych  na  wstrząsy.  Pamięci 
laserowe  nie  wyszły  obecnie  poza  stadium  badań  la- 
boratoryjnych. 

Układ  sterowania  koordynuje  działanie  jednostki 
centralnej  przez  realizację  rozkazów  pobieranych  z pa- 
mięci wewnętrznej  komputera.  Rejestry  pamięciowe 
służą  do  przekazywania  informacji  z pamięci  wewnę- 
trznej do  arytmometru  i z arytmometru  do  pamięci 
wewnętrznej,  rejestry  adresowe  i modyfikacyjne  służą 
do  wyznaczania  adresu  informacji  zawartej  w pamięci 
wewnętrznej. 

Oprócz  jednostki  centralnej  komputer  musi  być 
pamięć  wyposażony  w urządzenia  peryferyjne  i pamięci  ma- 
zewnętrzna  sowę,  czyli  zewnętrzne  pamięci  o dużej  pojemności. 

Są  to  urządzenia  elektroniczno-mechaniczne,  umożli- 
wiające wprowadzenie  danych,  wprowadzenie  wyni- 
ków oraz  przechowywanie  dużych  zbiorów  danych. 
Na  ii.  104  (tabl.  26)  widzimy  również  konsolę  opera- 
torską z monitorem  ekranowym,  na  którym  operator 
obserwuje  pracę  całego  systemu  i w razie  konieczności 
wprowadza  zmiany  i poprawki. 


Programowanie,  czyli  wykorzystanie 
możliwości  komputera 

Korzystanie  z komputera  wymaga  przygotowania  ze- 
stawu danych  oraz  programu,  czyli  zbioru  instrukcji 


zrozumiałych  dla  układu  sterowania  komputera.  Na  języki 
ogół  programy  przygotowuje  się  w jednym  z języ-  algorytmicz- 
ków  algorytmicznych,  takich  jak  fortran,  algol,  cobol,  ne 
apl/I.  Ułatwiają  one  posługiwanie  się  komputerem 
niezawodowym  programistom,  niepotrzebna  jest  bo- 
wiem wówczas  szczegółowa  znajomość  budowy  i za- 
sady działania  konkretnego  typu  komputera.  W ję- 
zykach algorytmicznych  zapis  operacji  arytmetycz- 
nych nie  różni  się  praktycznie  od  zapisu  algebraicz- 
nego; ułatwia  to  nie  tylko  programowanie,  ale  rów- 
nież publikowanie  algorytmów  w postaci  gotowej  do 
wprowadzenia  do  komputera,  a jednocześnie  bardzo 
przejrzystej  i czytelnej  dla  użytkownika.  Program, 
wprowadzony  do  komputera  w języku  algorytmicz- 
nym, jest  następnie  tłumaczony  przez  specjalny  pro-  translator 
gram,  zwany  translatorem,  na  ciąg  instrukcji  pod- 
stawowych, czyli  na  język  wewnętrzny  komputera. 

W języku  tym  każda  instrukcja  składa  się  z części 
operacyjnej  i adresowej.  W części  operacyjnej  zawarta  język 
jest  informacja  o tym,  jaka  operacja  i jakiego  typu  wewnętrzny 
modyfikacje  mają  być  wykonane,  natomiast  część 
adresowa  określa  komórki,  na  których-  zawartości 
ma  być  dokonana  operacja.  Formą  pośrednią  po- 
między językiem  wewnętrznym  a językami  algoryt-  język 
micznymi  jest  tzw.  język  symboliczny.  Pozwala  on  na  symboliczny 
wygodny  zapis  instrukcji  podstawowych  komputera 
przez  użycie  skrótów  mnemotechnicznych  na  ozna- 
czenie nazw  operacji  oraz  symboli  alfanumerycznych 
na  określenie  adresów.  Wyznaczanie  wartości  adre- 
sów dokonywane  jest  automatycznie  w czasie  wpro- 
wadzania programu  do  pamięci  komputera,  przez  co 
unika  się  wielu  niedogodności  programowania  w ję- 
zyku wewnętrznym,  a korzysta  się  ze  wszystkich  zalet 
tego  języka. 


Zastosowanie  komputerów  w fizyce 

Numeryczne  rozwiązywanie  równań  fizyki  umożliwia 
szybkie  uzyskanie  odpowiedzi  na  podstawowe  dla 
fizyka  pytanie,  czy  rozwiązanie  zgodne  jest  z obser- 
wacją. Do  rozwiązywania  lego  typu  zagadnień  stosuje 
się  klasyczne  metody  numeryczne,  a bardzo  często 
łączy  się  je  z zagadnieniami  modelowania  i symulacji. 

Na  rys.  1 przedstawiono  przykład  modelowania 
procesu  ewolucji  galaktyki.  Problem  polegał  na  roz- 
wiązaniu równań  ruchu  zespołu  50  000  gwiazd,  roz-  modelowanie 
mieszczonych  w postaci  wirującego  dysku  o stałej 
gęstości  gwiazd.  Początkowo  układ  ten  znajdował  się 
w równowadze  radialnej,  lecz  z biegiem  czasu  poja- 
wiała się  wyraźna  anizotropia  układu  (rys.  1).  Porów- 
nanie wyników  tego  modelowania  z obserwacjami 
galaktyk  przedstawiono  na  ii.  106  i 107  (tabl.  26). 

Przykład  ten  stanowi  doskonałą  ilustrację  zastosowa- 
nia komputera  do  rozwiązania  problemu,  którego  nie 
można  było  rozwiązać  w inny  sposób.  Podobne  za- 
gadnienia spotykamy  w hydrodynamice  (rys.  2),  aero- 
dynamice czy  mechanice  ośrodków  ciągłych.  Rysu- 
nek 3 przedstawia  modelowanie  dyfrakcji  fali  uderze- 
niowej i wytwarzanie  się  stanu  ustalonego.  Zagadnie- 
nie to  ma  swoje  praktyczne  zastosowanie  m.in.  w ba- 
daniach z dziedziny  astronautyki,  pozwala  bowiem 
przewidzieć  jak  się  zachowa  kabina  statku  kosmicz- 
nego przy  wejściu  w górną  warstwę  atmosfery. 

Metoda  Monte  Carlo  (metoda  prób  losowych)  metoda 
służy  do  analizy  procesów  przypadkowych  (stochas-  Monte  Carlo 
tycznych).  Pozwala  ona  symulować  zachowanie  się 
układu  zależnego  od  zespołu  parametrów,  których 
wartości  podlegają  postulowanym  funkcjom  rozkładu. 

Metoda  Monte  Carlo  stosowana  była  od  dawna 
i szczególnie  często  cytowany  jest  przykład  jej  zasto- 
sowania do  wyznaczania  wartości  liczby  n.  Procedura 
polegała  na  rzucaniu  igły  na  odpowiednio  polinio- 
wany stół.  Jeśli  odległości  pomiędzy  kolejnymi  linia- 
mi równe  były  długości  igły,  to  stosunek  liczby  rzu- 
tów, przy  których  igła  przecinała  którąkolwiek 
linię,  do  liczby  wszystkich  rzutów  dążył  do  wartości  7t 
w miarę  wzrostu  liczby  rzutów.  Wprowadzenie  kom- 
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Rys.  1.  Modelowanie  procesu  ewolucji  galaktyki.  Symulowany  układ  zawiera  50  000  gwiazd,  rozmieszczonych  w postaci  wirującego  dy- 
sku o stałej  gęstości  gwiazd.  Jednostką  czasu  jest  okres  obrotu 


puterów  przekształciło  metodę  Monte  Carlo  z cieka- 
wego zastosowania  praw  statystyki  matematycznej 
w potężne  narzędzie  badań  naukowych  w wielu  dy- 

a) 


scyplinach  wiedzy.  Komputer  bowiem  pozwolił  na 
zautomatyzowanie  procesu  otrzymywania  liczb  loso- 
wych oraz  umożliwił  wykonanie  skomplikowanych 
obliczeń  wymaganych  przez  tę  metodę.  Olbrzymi 
wzrost  zainteresowania  metodą  Monte  Cario  datuje 
się  od  czasu  zastosowania  jej  do  badań  reakcji  roz- 
szczepienia ciężkich  jąder.  Wymienić  w tym  miejscu 
należy  prace  nad  konstrukcją  pierwszej  bomby  ato- 
mowej w USA  oraz  nad  konstrukcją  pierwszego  reak- 
tora jądrowego.  Wprowadzone  wówczas  przez  von 
Neumanna  i Ulama  metody  są  obecnie  uważane  za 
podstaw-owe  w tej  dziedzinie. 

Obecnie  zakres  zastosowania  metody  Monte  Carlo 
w fizyce  jest  niezwykle  szeroki,  od  wyznaczania  war- 


Rys.  2.  Przykład  modelowania  cyfrowego  spadającej  kropli  na 
powierzchnię  cieczy:  a)  kolejne  fazy  tego  procesu,  b)  fotografia 
rzeczywistego  procesu 
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Rys.  3.  Modelowanie  procesu  dyfrakcji  fali  uderzeniowej  i wy- 
tworzenia się  stanu  stacjonarnego  przy  wejściu  stożka  o kącie 
rozwarcia  30°  do  jednorodnego  ośrodka  gazowego  z prędkością 
ponaddżwiękową 
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tości  całek  wielokrotnych  — po  symulacyjne  metody 
badania  przebiegu  procesów  fizycznych  o charakterze 
stochastycznym.  Dziś  nie  sposób  sobie  wyobrazić 
projektu  układu  doświadczalnego,  którego  podsta- 
wowe parametry  nie  byłyby  przebadane  metodą  sy- 
mulacji rzeczywistych  procesów  fizycznych.  Dzięki 
temu  odpada  konieczność  przeprowadzania  prób 
i konstruowania  modeli  i prototypów,  a koszty  kon- 
strukcji aparatury  ulegają  znacznej  obniżce. 

W fizyce  doświadczalnej  często  występuje  koniecz- 
ność przeprowadzania  statystycznej  analizy  wyników 
doświadczenia.  Wyniki  pomiarów  (kompletny  ma- 
teriał statystyczny)  zapisywane  są  w postaci  dużych 
zbiorów  informacji  przechowywanych  w pamięciach 
masowych.  Analiza  polega  na  obliczaniu  dla  każdego 
indywidualnego  pomiaru  interesującej  nas  wielkości, 
a następnie  — na  sporządzeniu  dla  niej  rozkładu  gę- 
stości prawdopodobieństwa.  Parametry  określające 
ten  rozkład  (wartość  średnia,  dyspersja  itp.)  związane 
są  na  ogół  z wielkościami  fizycznymi  lub  poszukiwa- 
nymi parametrami.  Porównując  uzyskane  wyniki 
z przewidywanymi  teoretycznymi,  możemy  weryfi- 
kować hipotezy  stosując  znane  testy  statystyczne. 


Rys.  4.  Przykład  dopasowania  metodą  najmniejszych  kwadratów 
krzywej  rezonansowej  (typu  Breita-Wiegnera)  do  danych  do- 
świadczalnych, przy  założeniu  istnienia  tla  nierczonansowego 


Weryfikacja  hipotez  może  polegać  również  na  dobra- 
niu takich  wartości  parametrów,  przy  których  wyniki 
teoretyczne  najlepiej  opisują  istniejącą  sytuację  do- 
świadczalną. Do  rozwiązania  tego  typu  problemów 
stosuje  się  metody  optymalizacji  nieliniowej.  Rozwią- 
zanie problemu  sprowadza  się  wówczas  do  znalezie- 
nia minimum  pewnego  funkcjonału.  Przykład  zagad- 
nienia dopasowania  krzywej  (hipoteza)  do  danych 
doświadczalnych  przedstawiono  na  rys.  4. 


Automatyzacja  pomiarów  i praca  w czasie 
rzeczywistym 

Zastosowanie  komputerów  umożliwiło  automatyzację 
pomiarów  parametrów  torów  cząstek  elementarnych 
ze  zdjęć  z komór  śladowych.  Nail.  105  (tabl.  26)  przed- 
stawiono automat  pomiarowy  „Polly”,  zbudowany 
w Stanach  Zjednoczonych.  Proces  pomiaru  sterowa- 
ny jest  przez  komputer  i tylko  wówczas,  gdy  kompu- 
ter nie  może  przeprowadzić  analizy  kształtu  toru  i do- 
konać obliczenia,  żąda  on  dodatkowych  informacji 
od  operatora.  Istnieje  wiele  aparatów  pomiarowych, 
a zasady  ich  działania  są  bardzo  podobne.  Na  ogół 
są  to  urządzenia  prototypowe  lub  — ze  względu  na 
swoje  specyficzne  zastosowanie  — produkowane  w 
małych  seriach. 

W fizyce  jądrowej  i fizyce  cząstek  elementarnych 
łączy  się  obecnie  coraz  częściej  technikę  licznikową 
z techniką  cyfrową,  przy  czym  komputer  wprowadza 
się  jako  element  sterujący  całością  doświadczenia. 
Sprawdza  on  wówczas  działanie  wszystkich  elemen- 
tów układu  liczników,  steruje  pracą  tego  układu,  do- 
bierając optymalne  parametry,  oraz  przeprowadza 
analizę  danych  na  bieżąco,  w trakcie  trwania  do- 
świadczenia. Stosowanie  komputerów  do  sterowania 
układami  licznikowymi  stało  się  tak  powszechne,  że 
powstała  cała  rodzina  wyspecjalizowanych  kompute- 
rów (tzw.  mini-komputerów),  szczególnie  nadających 
się  do  tego  celu. 


Sieci  abonenckie 

Coraz  powszechniej  stosuje  się  obecnie  duże  zestawy 
komputerowe,  które  wraz  z końcówkami  abonencki- 
mi i siecią  łączności  tworzą  tzw.  sieci  abonenckie. 
Końcówki  abonenckie  służą  do  wprowadzania  pro- 
gramów i danych  oraz  do  drukowania  wyników  obli- 
czeń. Sieci  abonenckie  pozwalają  najefektywniej  wy- 
korzystać zespół  komputerów  i mogą  obsługiwać 
wielu  użytkowników.  Stosuje  się  różnego  typu  koń- 
cówki abonenckie,  ale  najwygodniejszą  formą  prowa- 
dzenia obliczeń  jest  korzystanie  z systemów  inter- 
akcyjnych. Pozwalają  one  na  natychmiastową  reali- 
zację programu  (dialog:  człowiek-maszyna)  i uzy- 
skanie odpowiedzi  w postaci  wykresu  lub  tabeli  na 
monitorze  ekranowym  (tabl.  26,  ii.  108).  Jeśli  w prog- 
ramie jest  błąd,  programista  ma  możliwość  zrobienia 
poprawki  i posłania  ponownie  programu  do  wyko- 
nania. Na  ogół  połączenia  komputerów  z końcówkami 
abonenckimi  dokonywane  są  przy  użyciu  łączy  tele- 
komunikacyjnych. Istnieją  systemy  umożliwiające 
wykorzystanie  do  tych  celów  normalnej  sieci  telefo- 
nicznej. Aby  się  połączyć  z komputerem,  wystarczy 
wykręcić  odpowiedni  numer  i po  uzyskaniu  połącze- 
nia rozpocząć  pracę  w trybie  interakcyjnym.  Być  może 
w niedalekiej  przyszłości  spełni  się  marzenie  niektó- 
rych fizyków,  by  przy  pomocy  miniaturowych  koń- 
cówek abonenckich  można  było  każdej  chwili  ko- 
rzystać z systemów  komputerowych. 

N.  P.  Buslenko  i in.  Metoda  Monte  Carlo , Warszawa  1967; 
D.  Potter  Metody  obliczeniowe  fizyki.  Warszawa  1977. 
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AKUSTYKA 

Przedmiot  i zakres  akustyki  Badanie  ośrodków  za  pomocą 
ultradźwięków  Akustyczne  fale  powierzchniowe  i ich  zastoso- 
wanie Holografia  akustyczna  Akustyczne  zjawiska  kwantowe- 
Modelowanie  obiektów  akustycznych  • Fale  uderzeniowe  Hałas 


Przedmiot  i zakres  akustyki 


Dziedzina  zjawisk  fizycznych,  którą  obejmuje  współ- 
czesna akustyka  jest  niewspółmiernie  szeroka  w po- 
równaniu z tym,  co  znane  było  jako  dział  akustyki 
klasycznej  fizyki  w końcu  XIX  i początku  XX  w. 
a ograniczało  się  do  fal  sprężystych  słyszalnych  (gr. 
akustikos  — dotyczący  słuchu).  Obecnie  przedmio- 
tem akustyki  są  wszystkie  zjawiska  związane  z roz- 
chodzeniem się  fal  sprężystych  w różnych  ośrodkach, 
we  wszystkich  stanach  skupienia  materii,  w pełnym 
zakresie  częstości  drgań  możliwych  w przyrodzie. 
Zakres  ten  obejmuje  infradźwięki  (poniżej  słyszalności 
od  ułamków  herca  do  16  Hz),  dźwięki  (słyszalne  — 
od  16  Hz  do  16  kHz),  ultradźwięki  (powyżej  słyszal- 
ności — od  16  kHz-109  Hz)  oraz  hiperdźwięki  (po- 
wyżej 109  Hz  aż  do  częstości  granicznej  wyznaczonej 
przez  nieciągłą  strukturę  atomową  materii  rzędu 
1013-1014  Hz). 

Opis  zjawisk  akustycznych  w tak  szerokim  zakre- 
sie częstości  nie  może  być  jednolity;  mimo  tej  samej 
natury  fal  sprężystych  w całym  zakresie,  różnią  się 
one  jednak  długością  fali.  Przy  opisie  wielu  procesów 
akustycznych,  ośrodek,  w którym  rozchodzą  się  fale 
sprężyste  może  być  traktowany  jako  ciągły.  Opis  taki 
nazywa  się  klasycznym.  W wielu  jednak  wypadkach 
założenie  ciągłości  ośrodka  nie  może  być  spełnione, 
np.  wtedy,  gdy  własności  molekularne  (nieciągłe) 
ośrodka  mają  istotne  znaczenie  (-►  Akustyczne 
zjawiska  kwantowe). 

Klasyczny  opis  wielu  zagadnień  akustyki  można 
jedynie  traktować  jako  dostateczne  przybliżenie, 
szczególnie  w zakresie  dźwięków  słyszalnych,  jest  on 
jednak  niewystarczający  dla  ultradźwięków  o dużych 
częstościach  i hiperdźwięków,  gdzie  musi  być  brana 
pod  uwagę  nieciągła  struktura  ośrodka  (-►  Wzbu- 
dzenia elementarne  w ciałach  stałych).  Mówiąc  do- 
kładniej, taki  przybliżony  opis  jest  niewystarczający 
wówczas,  gdy  droga  swobodna  drobin  staje  się  po- 
równywalna z długością  fali  (np.  w bardzo  rozrzedzo- 
nych gazach),  albo  gdy  odstępy  międzymolekularne 
czy  międzyatomowe  stają  się  porównywalne  z długo- 
ścią fali,  jak  np.  przy  rozchodzeniu  się  hiperdźwięków 
w ciałach  stałych  (-*►  Akustyczne  zjawiska  kwantowe). 

W akustyce  klasycznej  opartej  na  teorii  ośrodków 
ciągłych  wiele  zagadnień  można  rozwiązać  za  pomocą 
liniowych  równań  różniczkowych  o pochodnych 
cząstkowych,  niektóre  jednak  problemy  wymagają 
bardziej  skomplikowanego  opisu  matematycznego. 
Ścisłe  równania  mechaniki  ośrodków  ciągłych  (w  tym 
akustyki)  są  nieliniowe  a ich  rozwiązanie  przedstawia 
tak  duże  trudności  matematyczne,  że  mimo  wielu  wy- 
siłków nie  udało  się,  jak  dotąd,  uzyskać  pełnych  wy- 
ników. Na  ogół  trzeba  zadowolić  się  teoriami  przy- 


bliżonymi. Z tego  powodu  rozwój  współczesnych  za- 
gadnień akustyki  możliwy  jest  w ścisłym  związku  zdoś- 
wiadczeniem,  które  w ostatnich  latach,  szczególnie 
w odniesieniu  do  akustycznych  zjawisk  o dużej  ener- 
gii (jak  np.  fale  uderzeniowe)  pozwala  na  konfron- 
tację, uzasadnienie  i uzupełnienie  wyników  tych 
przybliżonych  obliczeń. 

W wielu  współczesnych  laboratoriach  fizycznych 
na  świecie  prowadzi  się  intensywne  badania  akustycz- 
nych zjawisk  o dużej  energii  (zjawisk  nieliniowych) 
i wyznacza  się  wielkości  charakteryzujące  nieliniowe 
własności  ośrodków  gazowych,  ciekłych  i stałych. 

Warto  zauważyć,  że  wiele  rozwiązań  teoretycznych, 
szczególnie  w zakresie  nieliniowym,  wykorzystywa- 
nych od  lat  na  potrzeby  akustyki,  przenosi  się  ostatnio 
do  zagadnień  optyki  nieliniowej  (— ► Optyka  nieli- 
niowa), które  pojawiły  się  w ostatnim  10-leciu  dzięki 
wynalezieniu  źródeł  światła  o bardzo  dużej  (gigan- 
tycznej) mocy  i użyciu  ich  do  badania  materii. 

Relatywistyczne  ujęcie  teorii  ośrodków  ciągłych 
znajduje  zastosowanie  w zagadnieniach  astrofizycz- 
nych, np.  w badaniach  atmosfer  gwiazdowych,  w 
szczególności  Słońca,  i wiąże  się  z zagadnieniem  pro- 
mieniowania elektromagnetycznego  tych  obiektów. 
W warunkach  ziemskich  ujęcie  takie  stosuje  się  do 
opisu  niektórych  zagadnień  plazmy. 

Teoria  ośrodków  ciągłych  w zastosowaniu  do  hy- 
drodynamiki tzw.  „dwuprędkościowej”  (pierwsza 
i druga  prędkość  dźwięku)  daje  makroskopowy  opis 
ruchu  cieczy  nadciekłej,  jaką  jest  np.  ciekły  hel  w tem- 
peraturach bliskich  0 K (-*  Nadpłynność). 

Przy  rozpatrywaniu  fal  sprężystych  rozróżnia  się 
ośrodek  idealny  (bezstratny  czyli  niedysypatyw- 
ny),  w którym  fale  sprężyste  nie  ulegają  tłumieniu, 
oraz  ośrodek  rzeczywisty  (stratny  czyli  dysypatywny), 
w którym  fale  zanikają  (ulegają  tłumieniu)  w miarę 
rozchodzenia  się.  Ośrodki  rzeczywiste  można  trakto 
wać  jako  idealne  (szczególnie  w wypadku  fal  spręży- 
stych o małych  częstościach)  z dobrym  dla  pra- 
ktycznych celów  przybliżeniem  (np.  dźwięki  słyszal- 
ne w powietrzu  na  odległościach  kilkunastu  me- 
trów). 

Teoria  ośrodków  ciągłych  i fale 
sprężyste 

Antoni  Śliwiński 

Tradycyjnie  do  teorii  ośrodków  ciągłych  zalicza  się 
mechanikę  płynów  (cieczy  i gazów)  czyli  hydrodyna- 
mikę, teorię  sprężystości  i plastyczności  ciał  stałych 
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oraz  inne  dyscypliny  szczegółowe  przyjmujące  za 
punkt  wyjścia  założenie,  że  mikroskopowe  nieciągłości 
materii  nie  mają  wpływu  na  rozpatrywane  zjawiska 
fizyczne  w skali  makroskopowej.  Do  takich  szczegó- 
łowych dyscyplin  należy  również  tzw.  akustyka  kla- 
syczna, która  w sposób  fenomenologiczny  opisuje 
mechanizm  rozchodzenia  się  fal  sprężystych  w ośrod- 
kach ciągłych.  U podstaw  tej  teorii  leży  traktowanie 
materii  jako  środowiska  ciągłego  bez  wnikania  w jej 
rzeczywistą  budowę  nieciągłą  (atomy,  cząsteczki), 
cząstka  Wyrazem  ciągłości  ośrodka  jest  to,  że  możemy  go 
ośrodka  w myśli  podzielić  na  dowolnie  małe  elementy  obję- 


Rys.  1.  Taki  element  objętości  nazywamy  cząstką  ośrodka  lub 
cząstką  akustyczną.  Jest  to  jej  położenie  równowagi.  Przy  zabu- 
rzeniu cząstka  przesuwa  się  w miejsce  x — a+£ 


max.  amplituda  drgań 


max.  amplitudy  min.  amplitudy 


ruchu  tłoka 


zgęszczeń  i rozrzedzeń  lub  sprężeń  i rozprężeń  ośrodka  w rurze, 
c)  fotografia  cieniowa  fali  ultradźwiękowej  w dużej  objętości 
cieczy 
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tości  o takich  samych  własnościach,  jak  cala  rozważa  - 
na  jego  objętość.  Taki  mały  element  objętości  oś- 
rodka stanowi  elementarny  obiekt  podlegający  pra- 
wom mechaniki  i termodynamiki,  musi  więc  być  na 
tyle  duży,  aby  mieściło  się  w nim  wiele  molekuł  czy 
atomów,  dla  których  wewnątrz  niego  spełnione  by- 
łyby prawa  statystyczne  (-*  Fizyka  statystyczna),  aby 
słuszne  były  prawa  termodynamiki,  oraz  na  tyle  mały, 
aby  można  go  potraktować  jako  nieskończenie  mały 
z punktu  widzenia  opisywanych  zjawisk.  W rozwa- 
żaniach zjawisk  fizycznych  taki  element  objętości  na- 
zywamy cząstką  ośrodka  (rys.  1),  a przy  rozpatrywa- 
niu fal  sprężystych  — cząstką  akustyczną.  Analiza 
ruchu  cząstki  ośrodka  pod  wpływem  działających  na 
nią  sił  pozwala  opisać  zjawiska  odkształceń  dyna- 
micznych, w szczególności  przepływów  ośrodków 
(płynnych)  i rozchodzenia  się  fal  sprężystych. 

Istotą  ruchu  falowego  jest  zależność  czasowo-prze- 
strzenna  przemieszczania  się  zaburzenia  przez  ośro- 
dek. Zaburzenie  rozchodzi  się  tak,  że  każda  z cząste- 
czek ośrodka  wykonuje  ruch  dookoła  położenia 
równowagi,  przekazując  energię  sąsiednim  cząstkom 
zajmującym  inne  położenia  w przestrzeni  i drgającym 
w odpowiednio  przesuniętych  w czasie  chwilach  na- 
stępnych. Stany  ruchu  powtarzają  się  okresowo 
w przestrzeni  (co  długość  fali  X)  oraz  w czasie  (co 
okres  T ) — rys.  2,  przy  czym  X = cTf  gdzie  c — 
prędkość  rozchodzenia  się  zaburzenia  czyli  prędkość 
fazowa. 

Źródłem  fal  sprężystych  w ośrodkach  ciągłych  są 
mechaniczne  układy  drgające  umieszczone  w nich. 

Energia  drgań  tych  układów  zostaje  zamieniona  na  kula  ' 
energię  fali  akustycznej.  Przykładem  drgającego  pulsująca 
układu  generującego  falę  sprężystą  może  być  wspom- 
niana już  wyżej  kula  pulsująca  (rys.  3)  otoczona 
ciągłym  ośrodkiem  sprężystym.  Układ  taki  jest  rów- 
noważny z układem  hipotetycznym,  tzw.  źródłem 
punktowym,  które  można  sobie  wyobrazić  jako  gra- 
nicznie małą  kulę  pulsującą  dla  r ->  0,  gdzie  r — pro- 
mień kuli. 


Rys.  3.  Poglądowe  przedstawienie  kuli  pulsującej  jako  źródła 
kulistej  fali  sprężystej 

Drgania  kuli  pulsującej  odbywają  się  w ten  sposób, 
że  jej  promień  zmienia  się  okresowo  z częstością  v, 
przy  czym  środek  kuli  pozostaje  nieruchomy.  Po- 
glądowo można  sobie  wyobrazić  kulę  pulsującą  jako 
gumowy  pęcherzyk  napełniony  powietrzem,  który  na 
skutek  np.  periodycznych  wahań  temperatury 
w pierwszym  półokresie  rozszerza  się,  równomiernie 
pęcznieje,  a w drugim  półokresie  kurczy  się. 

Fale  sprężyste  w ośrodku  opisuje  równanie  falowe, 
które  wyprowadza  się  z podstawowych  równań  teorii 
ośrodków  ciągłych.  Są  to:  równania  ruchu  (we  współ- 
rzędnych Eulera  lub  Lagrange’a)  dla  cząstki  aku- 
stycznej pobudzonej  do  drgań  przez  siły  wywołane 
zaburzeniem  ośrodka,  równanie  ciągłości  ośrodka 


(lub  inaczej  równanie  zachowania  masy)  oraz  równa- 
nie stanu  termodynamicznego  (najczęściej  równanie 
adiabaty). 

Najogólniejszą  formę  tych  równań  wyprowadza  się 
dla  ośrodka  stałego  anizotropowego,  przyjmując  za 
podstawę  ogólne  prawo  Hooke’a,  które  wyraża  linio- 
wą zależność  odkształceń  od  naprężeń.  W ciałach 
stałych  anizotropowych  własności  sprężyste  zależą  od 
kierunku.  Jest  to  charakterystyczne  szczególnie  dla 
monokryształów,  w których  decydującą  rolę  odgrywa 
stopień  regularności  sieci  krystalicznej.  Im  bardziej 
uboga  symetria  danego  kryształu,  tym  więcej  wyróż- 
nionych kierunków,  dla  których  własności  sprężyste 
(stałe  sprężyste,  a co  za  tym  idzie  i prędkości  dźwięku) 


są  różne.  Własności  sprężyste  izotropowych  ciał  sta- 
łych są  jednakowe  dla  różnych  kierunków.  Ciała  izo- 
tropowe mogą  być  albo  amorficzne,  których  struktu- 
ra sieci  przestrzennej  jest  przypadkowa  — podobnie 
jak  w cieczy,  albo  polikrystaliczne,  w których  istnieje 
duża  ilość  przypadkowo  zorientowanych  ziaren  kry- 
stalicznych, czyli  krystalitów.  W teorii  ośrodków 
ciągłych  zakładamy,  że  rozmiary  tych  krystalitów,  jak 
również  komórek  elementarnych  w monokryształach 
są  małe  w porównaniu  z cząstką  akustyczną. 

W najprostszym  przypadku  zagadnienie  rozchodzę-  rozchodzenie 
nia  się  fal  sprężystych  w ośrodku  rozpatruje  się  je-  się  fal 
dnow'y miarowo  zakładając,  że  czoło  fali  jest  nieogra-  sprężystych 
niczone.  Zaburzenie  ośrodka  przedstawia  wtedy  falę 


b) 


kierunek  wychylenia  x 

3*.  X 

► x a)  kierunek  rozchodzenia  się  fali 

kierunek  rozchodzenia  się  fali 


Rys.  4.  Poglądowe  przedstawienie  przesunięcia  cząstek  akustycznych  (a,  b)  oraz  atomów  w nieograniczonym  ośrodku  stałym  (c,  d) 
w przypadku  fali  podłużnej  (a,  c)  i fali  poprzecznej  (b,  d)  o odległość  równą  jednej  długości  fali 
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41  - Encyklopedia  fizyki  współczesnej 


przesunięcie 


płaską.  Czoło  fali  przesuwa  się  w jednym  kierunku, 
np.  x (rys.  4)  tak,  że  dla  każdej  wartości  współrzędnej 
x wszystkie  ruchy  cząstek  akustycznych  względem 
pozostałych  współrzędnych  y i z są  te  same.  W nieo- 
graniczonej przestrzeni  trójwymiarowej  rozpatruje 
się  jako  najprostsze  fale  kuliste  (czołem  fali  jest  po- 
wierzchnia kulista)  (rys.  3). 

W czasie  rozchodzenia  się  fali  sprężystej  cząstki 
ośrodka  wykonują  ruch  drgający  względem  swych 
położeń  równowagi.  Jeżeli  ruch  ten  odbywa  się  w tym 
fale  samym  kierunku,  w jakim  rozchodzi  się  fala,  to  falę 
podłużne  nazywamy  podłużną  (rys.  4a),  a jeśli  odbywa  się  pro- 
stopadle do  kierunku  fali,  to  nazywamy  ją  poprzecz- 
ną (rys.  4b).  Fale  sprężyste  w płynach  są  najczęściej 
falami  podłużnymi.  Fale  poprzeczne  występują 
głównie  w ciałach  stałych,  choć  mogą  istnieć  w bardzo 
lepkich  cieczach  (są  jednak  silnie  tłumione), 
współrzędne  Do  opisu  ruchu  fali  podłużnej  rozpatrywanej 
Lagrange'a  w ośrodku  płynnym  można  podejść  dwojako.  Albo 
i Eulera  rozpatrujemy  przesunięcie  określonej  cząstki  z jej  po- 
łożenia równowagi  badając  dalej  jej  prędkość  » przy- 
spieszenie, albo  obserwujemy  własności  ośrodka 
w wybranym  punkcie  określając  przesunięcie,  pręd- 
kość i przyspieszenie  płynu  w tym  punkcie,  bez  wzglę- 
du na  to,  które  cząstki  przechodzą  przez  punkt  roz- 
patrywany w różnych  czasach  obserwacji.  W zależ- 
ności od  tego  którą  koncepcję  przyjmiemy  za  punkt 
wyjścia,  w pierwszym  przypadku  mamy  do  czynienia 
ze  współrzędnymi  Lagrange’a  lub  tzw.  współrzędnymi 
materialnymi  (współrzędne  związane  z daną  cząstką), 
w drugim  przypadku  (rys.  5)  ze  współrzędnymi  Eulera 
lub  tzw.  przestiz.ennymi  (współrzędne  związane 
z punktem  przestrzeni). 
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kierunek  rozchodzenia  się  fali 


Rys.  5.  Porównanie  współrzędnych  Lagrange’a  i Eulera:  a)  wy- 
kres przesunięcia  cząstki  ośrodka  we  współrzędnych  Lagrange’a 
a oraz  współrzędnych  Eulera  xt  b)  jednowymiarowa  deformacja 
elementu  objętości  we  współrzędnych  Lagrange’a  i Eulera 


Różnica  wynikająca  z tych  dwóch  sformułowań 
odgrywa  istotną  rolę  dopiero  przy  bardzo  dużych  na- 
tężeniach fal  (np.  fal  o amplitudzie  skończonej  oma- 
wianych w akustyce  nieliniowej)  nie  ma  natomiast 
znaczenia  przy  małych  natężeniach  (fal  o małej  ampli- 
tudzie omawianych  w akustyce  liniowej). 

Rozważmy  element  ośrodka  (cząstkę  akustyczną) 
w spoczynku  — położenie  równowagi  określa  współ- 
rzędna a (rys.  1 , 5,  6).  Gdy  pojawi  się  w ośrodku  za- 
burzenie (fala  sprężysta),  cząstka  zmieni  swoje  po- 


łożenie na  x , przy  czym  x = a-j-£,  gdzie  £ oznacza 
przesunięcie  cząstki. 

Prędkość  cząstki  we  współrzędnych  Lagrange’a 
uL(a , ()  możemy  więc  wyrazić  następująco: 

L dx  ć£ 

a z kolei  przyspieszenie  jako 
duL  _ 

~~dT  ~ dt 2 ’ 


położenie  równowagi 

^ da 


siła 

wymuszająca=0 
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ośrodek  w równowadze 
wychylenie  £ >=  o 


I 

M 
I I 


ośrodek  zaburzony 
wychylenie  £ > 0 
rozprężenie  ośrodka 


Rys.  6.  Schemat  przesunięć  cząstek  akustycznych  w fali  podłużnej 
i przedstawienie  tego  za  pomocą  modelu  składającego  się  z jed- 
nakowych mas  związanych  jednakowymi  sprężynkami  o współ- 
czynnikach sprężystości  k:  a)  w równowadze,  b)  w fazie  zgęsz- 
czenia,  c)  wykres  zmian  przesunięcia  w czasie,  d)  w fazie  rozrze- 
dzenia 
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równanie 
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Przyjmując,  że  £ jest  wielkością  małą,  dowolną 
współrzędną  Lagrange*a  qL  można  rozwinąć  w szereg 
i wyrazić  przez  współrzędne  Eulera  ąE 


q\ayt)  = qE(xt  t ) 


z-a+ł(x,t) 


0 


+ 


dqE(x,  /) 
dx 


£(*»  0+  ••• 


W szeregu  tym  napisaliśmy  tylko  dwa  pierwsze  wy- 
razy (kreska  z podaną  u dołu  wartością  a oznacza,  że 
chodzi  o wartość  qE  przy  * równym  podanej  war- 
tości). 

Podobnie  można  wy  razić  współrzędne  Eulera  q 
przez  współrzędne  Lagrange’a  qL : 


qE(xtt)  = qL(a,t) 


a-z-t(a.  I) 


= qL(a,  t) 


dcfya,  t) 

da 


Ha,  t)+... 


Widzimy,  że  przesunięcie  f występuje  w obydwu  ukła- 
dach współrzędnych.  We  współrzędnych  Lagrange’a 
jest  ono  rozumiane  jako  przesunięcie  cząstki  począt- 
kowo umieszczonej  w a i dlatego  jest  funkcją  a i t. 
We  współrzędnych  Eulera  £ jest  przesunięciem  chwi- 
lowym dowolnej  cząstki  umieszczonej  w miejscu  a; 
tutaj  £ jest  funkcją  x i t. 

Rozważmy  sytuację  dynamiczną.  Rys.  6a  przedsta- 
wia element  objętości  ośrodka  dadydz  w spoczynku. 
Załóżmy,  że  fala  płaska  przesuwa  się  w prawo  po- 
przez ośrodek  tak,  że  w danej  chwili  cząstki,  znajdu- 
jące się  początkowo  w spoczynku  w miejscu  a prze- 
suwają się  na  odległość  £,  a cząstki  znajdujące  się  po- 
czątkowo w spoczynku  w miejscu  a -{-da  przesuwają 
się  o odległość  £-}-*/£.  Ponieważ  nowe  położenia  ścia- 
nek elementu  ośrodka  mogą  być  zapisane  jako  xL 
i xL-\-dxLy  więc  objętość  elementu  dV  można  wyrazić 
jako  dV  = dxLdy  dz  (ponieważ  nie  ma  ruchu  w kie- 
runku y i z,  to  nie  ma  potrzeby  rozróżnienia  dla  tych 
kierunków  współrzędnych  Lagrange’a  od  Eulera). 
Całkowita  masa  płynu  w objętości  dV  jest  ta  sama 
w obydwu  wypadkach,  czyli 


q0  da  dy  dz  = QLdxLdy  dzt 

gdzie  q0  oznacza  gęstość  ośrodka  w spoczynku, 
a ql  — gęstość  płynu  przesuniętego.  Stąd  wynika 
równanie  ciągłości  w postaci  następującej : 


lub  — uwzględniając  związek  xL  = fl  + £ — 

<» 

Sformułowanie  Lagrange’a  pozwala  bardzo  łatwo 
napisać  równanie  ruchu.  Jeśli  po  lewej  stronie  ele- 
mentu działa  ciśnienie  pLy  a po  prawej  stronie  pL+ 
+(cpLldxL)dxLy  wówczas  siła  wypadkowa  działająca 
na  cząstkę  akustyczną  (element  płynu)  wynosi 
(—dpL/dxL)dxLdy  dz  (jest  skierowana  w prawo)  i rów- 
nanie ruchu  ma  postać: 


dpL 

dxL 


<22£ 

dxLdydz  = ę0dadydz,-^- 


dpL  dxL  dpL  ć?2£ 

Ub  ~ IbŹ  ' Ha  Ja  ~ e°~JF’ 


(2) 


gdzie  da  dy  dz  jest  masą  cząstki  akustycznej. 

Z doświadczenia  wynika,  że  proces  zmian  ciśnienia 
i gęstości  w fali  akustycznej  jest  z punktu  widzenia  ter- 


modynamiki procesem  adiabatycznym,  jak  to  wykazał 
P.S.  Laplace  w 1816  r.;  do  tego  czasu,  począwszy  od 
I.  Newtona  (1687  r.),  uważano  falę  dźwiękową  za 
proces  izotermiczny.  Prędkość  dźwięku  dla  procesu 
adiabatycznego  c2  = (dpL/ĆQL) ad. 

Ponieważ  dla  gazu  równanie  adiabaty  ma  postać 
p = /?0(e/eo)v,  gdzie  y = CP/CV,  Cv  — ciepło  właściwe 
przy  stałej  objętości,  Cv  — ciepło  właściwe  przy  sta- 
łym ciśnieniu,  więc 

, _ i?pL\  r/>o  / e \T~‘_  yp«  \ 

1 /•!  Co  Uo/  Po  / 8i  r1  — 

1 1 ^ 577 1 


Równanie  ruchu  przekształcimy  następująco: 


ć2£ 

2p  = 

/ 1 

BqL 

dt* 

\ Co  / 

da 

\ co  1 Je'- 

da 

C2 

</2£ 

e°-t 

i 

da 2 

(*+*)“ 

da 2 ’ 

gdzie  c0  = ]/ ypjoo  — prędkość  rozchodzenia  się  fali 
o małej  amplitudzie  (w  przypadku  liniowym). 

Jeżeli  w mianowniku  pominiemy  pochodną  dę/da 
jako  małą  w'  porówmaniu  z 1,  np.  w powietrzu  przy 
głośnej  rozmowie  d£/ćto  jest  rzędu  10-3,  to  równanie 
(3)  staje  się  zwykłym  równaniem  falowym 


a2£  _ 2 <?2£ 

St*  C°  ca*  ' 


(4) 


Rozwiązaniem  tego  równania  jest  funkcja  £ = 
= £0sin(o>/  — ka)y  gdzie  co  — częstość  kołowa,  k — 
stała  propagacji,  przy  czym  c o = 2nv  oraz  k = 2ti/A, 
gdzie  v — częstość  drgań  fali, ).  — długość  fali. 

Wykresem  tego  wzoru  na  wychylenie  jest  sinusoida 
przedstawiona  na  rys.  6d  oraz  2a. 

Wyraz  3£/<5a  można  pominąć,  gdy  |££/&?|  <ś  1,  co 
oznacza  że  u0/c0<ś  1,  gdzie  u0  = «>£<> — amplituda 
prędkości  cząstki  akustycznej  i to  jest  równoważne 
warunkowi  !£|  < X (por.  akustyczne  zjawiska  linio- 
we). Te  ostatnie  związki  wynikają  z przeliczeń,  jeśli 
£ = £0sin(co/—  ka). 

Jeżeli  ten  rozważany  warunek  jest  spełniony,  to  nie 
ma  potrzeby  odróżniać  współrzędnych  Lagrange'a 
od  współrzędnych  Eulera  i można  zmienną  a zastąpić 
przez  a*.  W zakresie  tego  przybliżenia  zjawiska  aku- 
styczne są  liniow-e,  a wów'czas  gdy  wyrazu  d£/da  nie 
można  pominąć  w porównaniu  z 1,  zjawiska  przebie- 
gają nieliniowo. 

Zjawiska  falowe  w ośrodkach  ciągłych  ograniczo- 
nych przebiegają  inaczej  niż  w ośrodkach  nieograni- 
czonych, zwłaszcza  gdy  rozmiary  ograniczonego 
ośrodka  stają  się  porównywalne  z długością  fali. 
Szczególnie  wyraźnie  występuje  to  w odniesieniu  do 
ciał  stałych,  kiedy  istnienie  ograniczenia  prowadzi  do 
nowych  typów  fal  sprężystych.  Na  przykład  w ośrod- 
ku, którym  jest  długi  pręt,  powstają  fale  dylatacyjne 
(rys.  7),  fale  skrętne  (rys.  8)  i fale  giętne  (rys.  9).  Innym 
przykładem  fal  w ośrodku  ograniczonym  są  fale  po- 
wierzchniowe (-*  Akustyczne  fale  powierzchniowe 
i ich  zastosowania),  z których  najbardziej  znanymi  są 
tzw.  fale  Rayleigha  (na  powierzchni  granicznej  ośrod- 
ka stałego  lub  ciekłego  i powietrza).  Fale  Stonleya 
(na  powierzchni  rozdzielającej  dwa  ośrodki  stałe),  fale 
Lamba  zwane  również  płytowymi  (powstają  w bla- 
chach, niegrubych  płytach,  powłokach  itp.  o gru- 
bościach porównywalnych  z długością  fali).  Fale  po- 
wierzchniowa, szczególnie  w zakresie  mikrofalowym, 
w ostatnich  latach  często  są  stosowane  w takich  urzą- 
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przypadek 

\d^/da\  «ć  1 


wpływ  ogra- 
niczenia 
ośrodka 


dzeniach,  jak  ultradźwiękowe  linie  opóźniające,  de- 
flektory  i modulatory  optyczne  (-►  Akustyczne  zja- 
wiska kwantowe). 


a) 


Rys.  7.  Fale  dylatacyjne  w pręcie:  a)  rozkład  chwilowy  defor- 
macji, b)  schemat  rozkładu  naprężeń 


Rys.  8.  Fale  skrętne  w pręcie 


Rys.  9.  Fale  giętne  w pręcie : a)  chwilowy  rozkład  deformacji 
b)  schematyczny  rozkład  naprężeń 


dyfrakcja  na 
przeszkodach 


powstawanie 
dźwięku  w 
wirach 


Ograniczenia  ośrodków  powodują  poza  tym  po- 
wstawanie odbić  lub  załamań  fal  sprężystych  na  tych 
granicach.  W płynach  zjawiska  te  przebiegają  w spo- 
sób dość  prosty,  w ciałach  stałych  są  bardziej  złożone. 

Ilustracja  151  (tabl.  41)  przedstawia  fotografię  fali 
ultradźwiękowej  ulegającej  załamaniu  przy  przejściu 
z jednego  ośrodka  ciekłego  do  drugiego,  ił.  154  (tabl. 
41)  natomiast  falę  ulegającą  załamaniu  i odbiciu  przy 
przejściu  przez  płytkę  mosiężną  zanurzoną  w wodzie. 
W pierwszym  przypadku  mamy  pojedynczą  falę  pa- 
dającą i pojedynczą  falę  załamaną.  W drugim  przy- 
padku podłużna  fala  padająca  na  płytkę  pod  wybra- 
nym kątem  wzbudza  w niej  falę  Lamba,  która  z kolei 
wypromieniowuje  falę  wtórną  na  swej  drodze. 

Wystąpienie  w ośrodku  ciągłym  obszarów  nie- 
ciągłych porównywalnych  z długością  fali  prowadzi 
do  zjawiska  dyfrakcji  (ugięcia)  fal  sprężystych.  Przy- 
kład dyfrakcji  fali  ultradźwiękowej  na  przeszkodzie 
walcowej  przedstawia  ii.  152  (tabl.  41). 

Bardzo  często  fale  akustyczne  w ośrodkach  płyn- 
nych powstają  przy  przepływie.  Szczególnie  silnym 
źródłem  fal  dźwiękowych  są  zawirowania  strumienia 
ośrodka  (turbulencja).  W zakresie  słyszalnym  wiele 
hałasów  jest  tego  pochodzenia.  Na  il.  153  (tabl.  41)  po- 
kazano przykładowo  powstawanie  fal  akustycznych 
w wirach  strumienia  powietrza  wypływającego  z dyszy. 


Akustyczne  zjawiska  liniowe 

Antoni  Śliwiński 

Zjawiska  związane  z rozchodzeniem  się  fal  spręży- 
stych w ośrodkach  ciągłych,  gdy  zaburzenia  (zmiany 
ciśnienia,  gęstości)  są  małe,  w porównaniu  z wiel- 
kościami określającymi  stany  równowagi,  rozpatruje 
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się  w liniowym  przybliżeniu  uzyskując  zadowalającą 
zgodność  z doświadczeniem.  Zakłada  się,  że  wielkości 
charakteryzujące  pole  akustyczne  są  wzajemnie  do 
siebie  proporcjonalne,  a własności  ośrodka  opisane 
są  przez  współczynniki  stałe  niezależnie  od  wielkości 
zaburzenia.  Takie  założenie  jest  tym  dokładniej  speł- 
nione, im  mniejsze  są  zaburzenia  sprężyste  ośrodka, 
mówi  się  więc  często  o akustycznych  zjawiskach  linio- 
wych jako  o falach  o małej  amplitudzie  (lub  amplitu- 
dzie nieskończenie  małej)  w przeciwieństwie  do  fal 
o dużej  amplitudzie  (lub  amplitudzie  skończonej) 
w akustycznych  zjawiskach  nieliniowych. 

Amplitudy  przesunięcia  cząstki  akustycznej  w po- 
wietrzu w zakresie  dźwięków  słyszalnych  są  stosun- 
kowo małe  i wahają  się  od  rzędu  dziesiętnych  części 
milimetra  dla  subiektywnie  dużych  natężeń,  do  rzędu 
miliardowych  części  milimetra  dla  natężeń  ledwie 
dostrzegalnych  przez  ucho.  Na  przykład  gwizd  loko- 
motywy wywołujący  uczucie  bólu  w uszach  (próg  bó- 
lu, częstość  ok.  1000  Hz)  powoduje  przesunięcie  czą- 
stki akustycznej  w powietrzu  o ok.  10~3  mm.  Fala 
o tej  samej  częstości,  która  jest  zaledwie  słyszalna 
(próg  słyszalności)  ma  amplitudę  przesunięcia  rzędu 
10-9  mm.  Na  rys.  10  podane  są  przykładowo  wartości 
ciśnień  akustycznych  p oraz  natężeń  dźwięku  I w po- 
wietrzu w całym  zakresie  słyszalnym  (od  progu  sły- 
szalności do  progu  bólu)  dla  częstości  1000  Hz.  Wiel- 
kości te  wyrażone  są  również  (środkowy  słupek)  w po- 
wszechnie używanej  w akustyce  skali  logarytmicznej 
(decybelowej).  Za  pomocą  tej  skali  określa  się  względ- 
ne wartości  ciśnień,  czy  natężeń  jako  tzw.  poziom 
L(dB)  ciśnienia  lub  natężenia  dźwięku,  zgodnie  z re- 
lacjami ; 

L{  dB)  = lOlg  7//0  = 10  1 g(plpo)2  = 20  łgplpo, 

gdzie  dla  fali  płaskiej  / = p*Iqc,  q — gęstość,  c — 
prędkość  dźwięku,  70  = 10“ 12  W/m2  oraz  p0  = 2*  10“ 5 
N/m2  odpowiadają  wartościom  progu  słyszalności. 
Dla  poziomów  powyżej  100  dB  efekty  nieliniowe  stają 
się  już  mierzalne. 
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Rys.  10.  Porównanie  wartości  ciśnienia  akustycznego  i natężenia 
dźwięku  / wyrażonych  w skali  liniowej  i w skali  decybelowej  lo- 
garytmicznej (L) 


Pojęcie  wielkości  amplitudy  określamy  względem 
długości  fali  akustycznej  i zjawiska  akustyczne  mo- 
żemy uważać  za  liniowe,  jeżeli  amplituda  przesunię- 
cia £ jest  znacznie  mniejsza  od  długości  fali  |£|  ^ L 
Wtedy  procesy  rozchodzenia  się  fal  sprężystych 
w ośrodku  opisuje  równanie  falowe  : 

dH  _ 2<?2£ 

8t2  C 8y2  ’ 

którego  rozwiązaniem  dla  przypadku  jednowymiaro- 
wego jest  fala  płaska  (tabl.  155,  ił.  41): 

£ = £0sma>(/— 
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1 o dużej 
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Natomiast  dla  przypadku  trójwymiarowego  rozwią- 
zaniem jest  fala  kulista 


gdzie  r — promień  fali,  £'  — przesunięcie  cząstki  dla 
fali  kulistej.  Amplituda  fali  kulistej  Yjr  zależy  od- 
wrotnie proporcjonalnie  od  odległości  od  źródła, 
gdzie  ś'0  — amplituda  na  powierzchni  źródła  (kuli 
pulsującej)  dla  r = r0. 

Istotne  dla  zjawisk  liniowych  w polu  akustycznym 
fali  płaskiej  jest  to,  że  pomiędzy  wielkościami  charak- 
teryzującymi pole  akustyczne:  przesunięciem  cząstki 
I,  prędkością  cząstki  dźjdt,  względnymi  zmianami 
gęstości  <5  = AqIq  i ciśnieniem  akustycznym  p zacho- 
dzą związki : 

W = ^cos"('-^)  = -^cos“('-y)- 

6 = <$0coscoj/—  p = /?0COSco|/— 

gdzie  £0a>  = dźjdt  — amplituda  prędkości  cząstki 
akustycznej,  60  — amplituda  względnych  zmian 
gęstości,  po  — amplituda  zmian  ciśnienia  akustycz- 
nego. 

Stosunek  ciśnienia  akustycznego  p do  prędkości 
cząstki  dĘjdt  jest  wielkością  stałą  dla  fali  płaskiej 
i charakterystyczną  dla  danego  ośrodka;  nazywa  się 
oporem  akustycznym  właściwym  ośrodka  i wynosi 

p![^r  ) = eoC* 

gdzie  o0  — gęstość  ośrodka  w równowadze  (niezabu- 
rzonego). 

Charakterystyczne  dla  zjawisk  liniowych  jest  to,  że 
kształt  fali  nie  zależy  od  odległości  od  źródła.  Ośro- 
dek, w którym  to  zachodzi,  nazywa  się  akustycznym 
ośrodkiem  liniowym.  Zakłada  się,  że  taki  ośrodek  jest 
ośrodkiem  idealnym,  tzn.  z jednej  strony  jest  zdolny 
odkształcać  się,  aby  przenieść  zaburzenie,  zaś  z dru- 
giej strony  jego  własności  przy  deformacjach  nie  ule- 
gają zmianie,  co  oznacza,  że  np. 

9o  ~ Qo-r^Qy  PXP+fy, 

czyli  zmieniona  wielkość  prawie  nie  różni  się  od  wiel- 
kości przy  równowadze,  przed  zaburzeniem.  Konsek- 
wencją tych  założeń  jest  to,  że  matematyczny  opis 
zjawisk  jest  taki  sam  zarówno  we  współrzędnych 
Lagrangeła  jak  i we  współrzędnych  Eulera. 

W stosunku  do  akustycznych  zjawisk  liniowych 
obowiązuje  zasada  tzw.  superpozycji  liniowej,  co 
oznacza,  że  przy  spotkaniu  się  kilku  fal,  fala  wypad- 
kowa jest  sumą  fal  składowych.  Spotykające  się  fale 
interferują  między  sobą  (nakładają  się)  w obszarze 
wzajemnego  przenikania  się,  jednak  nie  powstają 
żadne  fale  dodatkowe  w wyniku  tego  wzajemnego  od- 
działywania (oddziaływania  fonon-fonon).  Interferen- 
cja fal  jest  typowym  zjawiskiem  liniowym  (il.  156, 
tabl.  41)  (— ► Holografia  akustyczna). 

Przy  analizie  zjawisk  dyfrakcyjnych  (ugięcia  fal)zwy- 
kle  zakłada  się,  że  spełniona  jest  zasada  superpozycji 
liniowej  (zasada  Huygensa)  i pole  dyfrakcyjne  jest 
wynikiem  nałożenia  na  siebie  fal,  które  na  skutek  ugię- 
cia zmieniły  kierunek  rozchodzenia  się  (il.  157,  tabl. 
41).  Falę  złożoną  (wypadkową)  można  wyrazić  jako 
sumę  składowych  o różnych  częstościach  niezależnych 
od  siebie  (rys.  11). 

W odniesieniu  do  źródeł  akustycznych  (układów 
drgających)  jak  również  przetworników  akustycznych 
(układów  przetwarzających  energię  akustyczną  na 
inne  rodzaje  energii)  mówimy,  że  są  liniowe,  jeśli  pro- 
cesy w nich  zachodzące  nie  zależą  od  amplitudy  drgań 
lub  amplitudy  sygnałów  przenoszonych.  Własności 


Rys.  11.  Przykład  fali  złożonej  z dwóch  składowych  o różnych 
częstościach:  a)  schemat  superpozycji,  b)  widmo  prążkowe 


takich  układów  można  opisać  za  pomocą  współczyn- 
ników stałych  (rys.  12). 

W układach  liniowych: 

— drgania  okresowe  są  stabilne  (tzn.,  że  małe  dzia- 
łania na  układ  powodują  małe  zmiany  jego  ruchu), 

— drgania  swobodne  układów  tłumionych  gasną, 

— w układzie  o n stopniach  swobody  istnieje  tylko 
n częstości  własnych  (rezonansowych), 

— częstości  własne  układu  zależą  tylko  od  współ- 
czynników charakteryzujących  układ. 

Przykładem  liniowego  układu  akustycznego  jest 
tzw.  rezonator  Helmholtza  (rys.  13);  drgania  po- 
wietrza w szyjce  rezonatora  zależą  tylko  od  masy 
akustycznej  ma  = od/s,  podatności  akustycznej  ca  = 
— yjyPo  i oporu  akustycznego  ra  = rjszy  gdzie  q0  — 
gęstość,  l — długość  szyjki  rezonatora,  s — po- 
wierzchnia przekroju  szyjki,  r — opór  mechaniczny 


Rys.  12.  Liniowy 
mechaniczny  układ 
drgający  o jednym 
stopniu  swobody; 
k — współczynnik 
sprężystości  — sprę- 
żyny, r opór  me- 
chaniczny 


rezonator 

Helmholtza 


Rys.  13.  Liniowy  akustyczny  układ  drgający  (rezonator  Helm- 
holtza): a)  schemat  budowy;  V0  objętość,  i długość  szyjki,  i po- 
wierzchnia przekroju  szyjki, p ciśnienie;  b)  drgania  tłumione  takie- 
go układu 


p -sygnał  wejściowy 

sygnał  wyjściowy  (napięcie  U) 

/\  ■ 

(ciśnienie  akustyczne  pQ  ) 

U-  Sp0 

przetwornik 
liniowy  (mikrofon) 

Rys.  14.  Przykład  mikrofonu  jako  przetwornika  liniowego 
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Na  rys.  15  przedstawiono  przykład  pomiaru  po- 
jedynczego tonu  o częstości  1000  Hz  w powietrzu  za 
pomocą  mikrofonu  i oscyloskopu  (układ  liniowy) 
przy  dwóch  różnych  odległościach  od  źródła.  Jak 
widać,  na  skutek  zwiększenia  odległości  od  źródła 
dźwięku  zmniejszyła  się  tylko  amplituda  dźwięku, 
a sinusowa  postać  sygnału  nie  uległa  zniekształceniu. 
W przypadku  tego  słabego  sygnału  powietrze  można 
uważać  za  ośrodek  liniowy.  Na  rys.  16  przestawiony 
jest  podobny  pomiar  dla  dźwięku  złożonego,  którego 
charakter  widma  również  nie  ulega  zmianie  przy  zmia- 
nie odległości. 


Rys.  15.  Odebrany  mikrofonem  czysty  ton  w powietrzu  w dwóch 
odległościach  od  źródła:  a)  0,5  m,  b)  5 m 


Rys.  t6.  Odebrany  mikrofonem  dźwięk  złożoRy  w powietrzu 
w dwóch  odległościach  od  źródła:  a)  0,5  m,  b)  5 m 

tarcia  wprowadzający  tłumienie,  V0  — objętość  rezo- 
natora, Po  — ciśnienie  w równowadze, 
mikrofony  Przykładem  liniowych  przetworników  akustycznych 
głośniki  mogą  być  dobre  (nie  zniekształcające)  mikrofony  lub 
głośniki,  których  stosunek  sygnału  odbieranego  do 
przekazywanego  jest  wielkością  stałą  niezależną  od 
wielkości  tego  sygnału  (rys.  14). 

V}p  = S = const; 

S — nazywa  się  skutecznością  (lub  czułością)  mikro- 
fonu i nie  zależy  od  wielkości  sygnału. 
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Akustyczne  zjawiska  nieliniowe 

Antoni  Ś/iwiński 

Zjawiska  akustyczne  nie  przebiegają  liniowo,  gdy 
zaburzenie  sprężyste  ośrodka  jest  duże  w porównaniu 
z wielkościami  określającymi  jego  stan  równowagi. 

W zjawiskach  nieliniowych  nie  można  przyjąć  zało- 
żenia, że  amplituda  wychylenia  cząstki  akustycznej 
w fali  sprężystej  jest  bardzo  mała  w porównaniu  z dłu- 
gością fali  (|£|  » ź).  W zjawiskach  nieliniowych 
mamy  do  czynienia  z tzw.  falami  o amplitudzie  skoń- 
czonej, w przeciwieństwie  do  fal  o amplitudzie  nie- 
skończenie małej,  w zjawiskach  liniowych,  a opis 
matematyczny  ich  rozchodzenia  się  uzyskuje  się 
jako  rozwiązanie  nieliniowych  równań  różniczko- 
wych. Istotą  akustycznych  zjawisk  nieliniowych 
jest  to,  że  stosunki  pomiędzy  wielkościami  cha- 
rakteryzującymi pole  akustyczne  nie  są  stałe, 
lecz  zależą  od  wielkości  zaburzenia.  Im  wię- 
ksze zaburzenie,  tym  większe  są  efekty  nieliniowe. 

Typowymi  akustycznymi  zjawiskami  nieliniowymi 
są:  zniekształcenia  frontu  falowego  w miarę  przebiegu 
przez  ośrodek  (rys.  17)  oraz  występowanie  ciśnienia 
promieniowania  fali  (ciśnienia  wywieranego  przez 
czoło  fali  na  ośrodek)  powodującego  stały  przepływ 
ośrodka  w kierunku  rozchodzenia  się  fali  sprężystej 
tzw.  „wiatr  akustyczny”  (il.  163,  tabl.  42).  Do  aku- 
stycznych zjawisk  nieliniowych  należą  również  takie 
zjawiska  jak  kawitacja  ultradźwiękowa,  fale  uderze- 
niowe, oddziaływania  dźwięku  z dźwiękiem  (oddzia- 
ływania fonon-fonon),  przy  których  zasada  superpo- 
zycji nie  jest  spełniona. 

W zakresie  dźwięków  słyszalnych  efekty  nieliniowe 
są  bardzo  rzadko  brane  pod  uwagę.  Są  one  mierzalne 
dopiero  przy  poziomach  natężeń  dźwięku  powyżej 
100  dB  i występują  np.  przy  przelotach  samolotów 
odrzutowych,  szczególnie  przy  przekroczeniu  bariery 
dźwięku,  gdy  powstaje  fala  uderzeniowa  (ang.  boom 
lub  franc.  bang , rys.  18),  przy  wybuchach  i innych  sil- 
nych a krótkotrwałych  (impulsowych  lub  udarowych) 
zjawiskach  akustycznych. 

Zjawiska  nieliniowe  stają  się  szczególnie  wyraźne 
w zakresie  ultradźwięków,  ponieważ  w miarę  wzrostu 
częstości,  a więc  zmniejszenia  się  długości  fali,  uzy- 
skanie dużych  amplitud  w porówaniu  z długością 
fali  jest  stosunkowo  coraz  łatwiejsze. 

Uwzględnienie  efektów  nieliniowych  w matema- 
tycznym opisie  fal  sprężystych  wymaga  wyrazów 
wyższych  rzędów  i opis  wyraźnie  zależy  od  tego  czy 
używamy  podejścia  Lagrange’a,  czy  też  Eulera. 

W odniesieniu  do  gazów  równanie  falowe  z uwzględ- 
nieniem efektów  nieliniowych  we  współrzędnych 
Lagrangc’a  ma  postać  (równanie  3): 

równanie  fal 

cl  d2£  sprężystych 

Ht*  ~ i SB  \Y+1  * w gazach 

+ I 

W przypadku  cieczy  równanie  stanu  p ==  p(q , *S), 
gdzie  p — ciśnienie,  q — gęstość,  S — entropia,  przyj- 
muje się  w postaci  rozwinięcia  w. szereg  Taylora: 


Rys.  17.  Postępujące  zniekształcenie  fali  w przypadku  dużej 
amplitudy,  a)  Schemat:  / — blisko  źródła  — kształt  sinusoidalny; 
2 — w pewnej  odległości  od  źródła  — kształt  piłowaty  ale  jeszcze 
ciągły;  3 — w odległości  krytycznej  L*  — fala  stała  się  nieciągła, 
b)  Odebrany  mikrofonem  sygnał  L — 130  dB  czystego  tonu 
(1000  Hz)  w powietrzu  i jego  zniekształcenie:  Ib  w odległości 
0,5  m od  źródła;  2b  w odległości  2,5  m od  źródła;  3b  w odległości 
5 m od  źródła 


wirialne 

równanie 

stanu 


(|l) 

\ C>Q 


P =Po  + 
+ 


co  można  przy  pominięciu  wyrazów  wyższego  rzędu 
niż  drugi  zapisać  jako 


Rys.  18.  Fala  uderzeniowa.  Źródło  dźwięku  (zaburzenia)  porusza 
się  szybciej  niż  dźwięk:  a)  fotografia  cieniowa  poruszającej  się 
kuli  karabinowej:  b)  schemat  rozchodzenia  się  fal  dźwiękowych 
(kulistych)  i tworzenie  się  frontów  fali  uderzeniowej,  gdy  źródło 
porusza  się  z prędkością  większą  od  prędkości  dźwięku 


A,  B — nazywają  się  pierwszym  i drugim  współczyn- 
nikiem wirialnym  i zależą  od  temperatury,  p0  i &>  od- 
powiadają równowadze  ośrodka.  A = ę0^o»  natomiast 

(Bp  \,/# 

BI  A = 2Q0c0(dclcp)stp-p0 , gdzie  c = \^JS  ^ —jest 

prędkością  dźwięku.  Stosunek  B/A  jest  miarą  efektów 
nieliniowych  w cieczach.  Wprowadzenie  go  do  rów- 
nania falowego  (B/A  = y— 1)  prowadzi  do  równania 


cH  ci  e*ę 

e,t  = (i+*)s- 

Rozwiązanie  tego  równania  daje  wzór  na  prędkość 
rozchodzenia  się  fali  sprężystej  o skończonej  ampli- 
tudzie 

c = cjl  + (fl/ 2A)(ulc0)], 

co  oznacza,  że  zależy  ona  od  prędkości  cząstki  aku- 
stycznej u = Bę/Bt.  Prędkość  cząstki  akustycznej  u 
jest  wielkością  okresowo  zmienną  i zmienia  fazę  co 
pół  okresu  fali  (rys.  17a  (2))  przyjmując  odpowiednio 
wartości  Ą-u  w fazie  zagęszczenia  i —w  w fazie  roz- 
rzedzenia (dla  fali  podłużnej).  Z powyższego  wzoru 
wynika,  że  fala  porusza  się  w fazie  zgęszczenia  z pręd- 
kością c = c0(l+bu),  a więc  szybciej,  natomiast 
w fazie  rozrzedzenia  z prędkością  c = c0(l  — bu), 
a więc  wolniej  (w  tych  wzorach  przyjęto  b = Bf2Ac0). 
Prowadzi  to  do  deformacji  kształtu  fali  wraz  z odle- 
głością przebywaną  przez  falę,  przy  czym  deformacja 
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fala 

uderzeniowa 


równanie  fal 
sprężystych 
w cieczach 


zniekształ- 
cenia frontu 
falowego 


ta  narasta  do  pewnej  odległości  krytycznej,  przy  której 
fala  przyjmuje  kształt  przedstawiony  na  rys.  17a(3), 
odpowiadający  doścignięciu  rozrzedzenia  przez  zgę- 
szczenie.  W rzeczywistości  efekt  wyprzedzania  nie 
może  zachodzić  dalej,  gdyż  istnieje  skok  od  zgęszcze- 
nia  do  rozrzedzenia  i równowaga  możliwa  jest  tylko 
jako  nieciągłość  ośrodka  w tym  miejscu  — tworzy  się 
fala  uderzeniowa  (udarowa).  Odległość  krytyczna  dla 
utworzenia  takiego  frontu  udarowego  wynosi 


XQ0C0 


gdzie  X — długość  fali,  pa  — amplituda  ciśnienia  aku- 
stycznego przy  źródle.  Zniekształcenie  frontu  falowe- 
go jest  wyrazem  powstawania  wyższych  harmonicz- 
nych rozchodzącej  się  fali.  Istnienie  składowych  har- 
monicznych można  wykazać  przez  ich  odfiltrowanie 
z fali  głównej.  Michajłow  i Szutiłow  (wg  których  jest 
analiza  160  z tabl.  42)  byli  pierwszymi,  którzy  zastosowali 
zniekształceń  metoc*ę  optyczną  do  analizy  nieliniowych  zniekształ- 
~ ceń  fal  ultradźwiękowych.  Zasadę  takiej  analizy  wy- 
jaśnia poglądowo  rys.  19.  W przypadku  fali  akustycz- 
nej o małym  natężeniu  (rys.  19a)  jej  kształt  jest  sinu- 
soidalny i wtedy  rozkład  natężeń  światła  ugiętego  jest 
symetryczny  względem  wiązki  nieugiętej,  natomiast 
w przypadku  fali  akustycznej  o dużym  natężeniu 


się  w ostatnich  latach  bardzo  wiele  uwagi.  Większość 
prac  dotyczy  wyznaczania  stałych  elastycznych  wyż- 
szych rzędów  oraz  analizy  niedoskonałości  siatki 
krystalicznej  (-*  Wzbudzenia  elementarne  w ciałach 
stałych).  Zjawisko  powstawania  wyższych  harmonicz- 
nych przy  rozchodzeniu  się  fali  ultradźwiękowej 
w ciałach  stałych  zostało  wykorzystane  do  parame- 
trycznego wzmacniania  fal  ultradźwiękowych. 


Akustyczne  procesy  molekularne 

Antoni  Śliwiński 

Akustyczne  procesy  molekularne  występują  jako  od- 
działywanie fali  sprężystej  przechodzącej  przez  ośro- 
dek z jego  drobinami.  Oddziaływanie  to  polega  na 
wymianie  energii  pomiędzy  falą  a poszczególnymi 
stopniami  swobody  drobin  (rys.  20).  W zależności 
od  częstości  fali  sprężystej  oddziaływanie  może  być 
procesem  bardziej  lub  mniej  nieodwracalnym  z punktu 
widzenia  przenoszenia  energii  przez  falę,  dlatego 
w różnych  zakresach  częstości  procesy  molekularne 
w różnym  stopniu  wpływają  na  tłumienie  (absorpcję) 
fali  akustycznej.  W niektórych  zakresach  częstości 
wpływ  ten  jest  bardzo  duży  i jego  wynikiem  jest  wy- 
stępowanie charakterystycznego  dla  danego  ośrodka 


(rys.  19b)  jej  kształt  jest  zdeformowany,  piłokształtny 
i rozkład  natężeń  światła  ugiętego  jest  niesymetryczny 
(por.  il.  160,  tabl.  42). 

ciśnienie  Działanie  ciśnienia  promieniowania,  które  powo- 
promienio-  ^uJ*e  PrzeP*yw  ośrodka  (il.  163,  tabl.  42)  w kierunku 
wania  ma  specyficzny  charakter  na  granicy  dwóch  oś- 
rodków. W szczególności  na  granicy  ciecz-powietrze, 
gdy  falę  ultradźwiękową  dużej  mocy  promieniuje  się 
pionowo  do  góry  (il.  162,  tabl.  42),  powstaje  nad  swo- 
bodną powierzchnią  cieczy  charakterystyczna  fon- 
tanna. Wytrysk  fontanny  następuje  wtedy,  gdy  siły 
pochodzące  od  ciśnienia  promieniowania  przewyższą 
siły  napięcia  powierzchniowego.  Wysokość  fontanny 
jest  tym  większa,  im  większe  jest  natężenie  fali  ultra- 
dźwiękowej. Kierunek  działania  siły  na  granicy  dwóch 
ośrodków  zależy  od  stosunku  wartości  gęstości  ener- 
gii akustycznej  w tych  ośrodkach.  Gdy  Wx  > W2 
(W x — gęstość  energii  w ośrodku,  w którym  znajduje 
się  źródło  fali,  W2 — gęstość  energii  w drugim  ośrod- 
ku), to  siła  wywołująca  fontannę  działa  zgodnie 
z biegiem  fali,  natomiast  gdy  W2  < Wu  to  siła  ma 
zwrot  przeciwny  do  biegu  fali.  W przypadku  szcze- 
gólnym, gdy  fala  ultradźwiękowa  przechodzi  przez 
granicę  ośrodków  bez  odbicia,  to  natężenia  fali 
w obydwu  ośrodkach  są  sobie  równe  i zachodzi  zwią- 
zek 

Wxcx  = W2c2y 

gdzie  cx  i c2  — prędkość  rozchodzenia  się  dźwięku 
odpowiednio  w ośrodku  pierwszym  i drugim.  Wynika 
stąd,  że  dla  cx  > c2  będzie  W2  > Wx  (siła  ciśnienia 
promieniowania  przeciwna  do  biegu  fali),  a dla  cx  < c2 
będzie  Wz  < Wx  (siła  zgodna  z biegiem  fali).  Gdy  gra- 
niczą ze  sobą  dwa  ośrodki  ciekłe  nie  mieszające  się  ze 
sobą,  to  w zależności  od  rodzaju  ośrodka  mogą  za- 
chodzić obydwa  przypadki  (il.  161,  tabl.  42). 

Efektom  nieliniowym  w ciałach  stałych  poświęca 
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Rys.  19.  Schematyczne 
przedstawienie  kształ- 
tu fal  przy  dyfrakcji 
światła  na  fali  ultra- 
dźwiękowej: a)  przy 
małym  natężeniu  fa- 
li ultradźwiękowej,  b) 
przy  dużym  natężeniu 
fali  ultradźwikowej 


fala  akustyczna 


fala  akustyczna 
o zmniejszonej  energii 


energia  zostaje  odebrana 
przez  wewnętrzne  stopnie 
swobody  cząsteczek 
(oscylacyjne  i rotacyjne) 


Rys.  20.  Schemat  procesu  tłumienia  fali  akustycznej  przez  pro- 
cesy molekularne  w ośrodku 


maksimum  tłumienia.  Zwykle  towarzyszy  temu  poja- 
wienie się  dyspersji  prędkości  rozchodzenia  się  fali, 
czyli  jej  zależności  od  częstości. 

W klasycznym  opisie  zjawisk  akustycznych  nie 
bierze  się  pod  uwagę  procesów  molekularnych,  które 
zachodzą  przy  zmianach  stanu  ośrodka,  gdy  prze- 
chodzi przez  niego  fala  sprężysta. 

Tłumienie  fal  dźwiękowych  w ośrodku  opisuje  się 
za  pomocą  tzw.  amplitudowego  współczynnika  tłu- 
mienia a,  który  wyraża  względny  zanik  amplitudy  na 
jednostkę  przebytej  przez  falę  drogi : 

dA  j 

- = —adx, 

A 

gdzie:  ,4— amplituda  fali  sprężystej,  dA—  zmiana 
amplitudy  na  drodze  dx , minus  oznacza,  że  amplituda 
maleje,  lub  za  pomocą  tzw.  energetycznego  współ- 
czynnika tłumienia  y,  przy  czym  y = 2a,  gdyż  przyj- 
muje się  (w  zakresie  akustycznych  zjawisk  liniowych), 
że  natężenie  fali,  równe  liczbowo  energii  przepływa- 
jącej przez  jednostkę  przekroju  w jednostce  czasu, 
jest  proporcjonalne  do  kwadratu  amplitudy. 


efekty 
nieliniowe 
w ciałach 
stałych 


amplitudowy 
i energetycz- 
ny współ- 
czynnik 
tłumienia 


klasyczny 

współczynnik 

tłumienia 


W ujęciu  klasycznym  przyjmuje  się,  że  jedynymi 
czynnikami  wpływającymi  na  tłumienie  dźwięku  są 
lepkość  (tarcie  wewnętrzne)  ośrodka  oraz  przewod- 
nictwo cieplne  (w  mniejszym  stopniu  promieniowanie 
cieplne).  Zgodnie  z obliczeniami  przeprowadzonymi 
przez  Stokesa  oraz  Kirchhoffa  tzw.  klasyczny  współ- 
czynnik tłumienia  dźwięku  powinien  być  wprost  pro- 
porcjonalny do  kwadratu  częstości  fali  akustycznej 
zgodnie  z wzorem 


a = 


gdzie:  v jest  częstością  fali  dźwiękowej,  i? — współ- 
czynnikiem lepkości  stycznej,  q — gęstością,  c — 
prędkością  dźwięku,  x — cp/cv , cp  jest  ciepłem  właści- 
wym przy  stałym  ciśnieniu,  cv  — ciepłem  właściwym 
przy  stałej  objętości.  Zatem  a/v2  = a powinno  być 
niezależne  od  częstości  fali,  ale  już  stosunkowo  dawno 
stwierdzono  (Nieklapajew  i Lebiediew  w 1911  r.),  że 
współczynnik  tłumienia  a'  w niektórych  gazach  a tak- 
że i cieczach  wykazuje  odstępstwa  od  wzoru.  Rysunek 
21  pokazuje  takie  odstępstwo  w C02  w temperaturze 
pokojowej.  Absorpcję  dźwięku  inną  niż  przewiduje 
to  akustyka  klasyczna  można  w zadowalający  spo- 
sób wyjaśnić  za  pomocą  molekularnej  (relaksacyjnej) 
teorii  absorpcji  dźwięku. 


r p Rys.  21.  Porównanie  wartości  doświadczalnych  (kropki)  współ- 
czynnika tłumienia  dźwięku  u — od  w dwutlenku  węgła  z wyni- 
kami obliczeń  na  podstawie  wzoru  klasycznego  (krzywa  przery- 
wana) i wzoru  relaksacyjnego  (krzywa  ciągła) 


Współczynnik  tłumienia  fal  sprężystych  a oraz 
prędkość  rozchodzenia  się  dźwięku  c w danym  oś- 
rodku są  wielkościami  dla  niego  charakterystycznymi. 
W ujęciu  klasycznym  nie  tylko  a'  = a/v2,  ale  również 
c nie  powinno  zależeć  od  częstości.  Jeżeli  w ośrod- 
kach rzeczywistych  pojawia  się  zależność  od  częstości, 
to  możemy  wyciągnąć  wniosek,  że  jest  to  wynik  mole- 
kularnych oddziaływań  ośrodka  z falą  sprężystą. 
Akustyczne  procesy  molekularne  są  różne  w zależ- 
ności od  reakcji  ośrodka  na  pobudzenie  energią  fali 
akustycznej.  W cieczach  i gazach  spotykamy  głównie 
relaksację  termiczną  i strukturalną,  zwaną  inaczej 
objętościową. 

relaksacja  W pierwszym  przypadku  są  to  procesy  związane 
termiczna  z wymianą  energii  pomiędzy  falą  a poszczególnymi 
stopniami  swobody  ruchu  cząsteczek  (zewnętrzny- 
mi — translacyjnymi,  wewnętrznymi  — rotacyjnymi 
i oscylacyjnymi).  Są  one  analogiczne  do  procesów 
aktywacji  termicznej  tych  stopni  swobody,  polegają- 
cych na  uzyskiwaniu  przyrostów  energii  kinetycznej 
poszczególnych  cząsteczek  na  skutek  zmian  tempera- 
tury. 

relaksacja  W drugim  przypadku  są  to  procesy  związane  z wy- 
strukturalna  mianą  energii  pomiędzy  falą  a cząsteczkami  lub  zespo- 
łami cząsteczek  (asocjatami)  w taki  sposób,  że  nastę- 
puje zmiana  struktury  molekularnej,  np.  jest  to  prze- 
chodzenie jednych  struktur  w drugie  (przegrupowania 
atomów),  albo  dysocjacja  czyli  rozpad  cząsteczek  lub 
ich  zespołów,  a czasami  jest  to  proces  odwrotny,  czyli 
asocjacja  (łączenie). 


Procesy  relaksacji  polegają  na  opóźnieniu  reakcji 
zaburzonego  ośrodka  (odchylonego  od  stanu  równo- 
wagi) względem  samego  zaburzenia  (fali  sprężystej), 
o pewien  czas  r zwany  czasem  relaksacji  potrzebnym 
na  powrót  do  równowagi.  Wynikiem  tego  opóźnienia 
jest  przesunięcie  fazowe  powstające  między  falą  (ciś- 
nieniem akustycznym)  a reakcją  ośrodka,  a więc  zmia- 
nami temperatury,  zmianami  ruchu  wewnętrznych 
stopni  swobody,  zmianami  struktury  itp.  Konsekwen- 
cją tego  opóźnienia  fazowego  jest  dodatkowe  tłumie- 
nie fali  akustycznej;  energia,  która  wzbudziła  układ 
molekularny  i jest  z opóźnieniem  przez  niego  odda- 
wana (w  innej  fazie)  nie  może  być  z powrotem  przez 
falę  przejęta. 

Tej  absorpcji  relaksacyjnej  równolegle  towarzyszy 
dyspersja  prędkości  dźwięku,  tj.  jej  zależność  od  czę- 
stości fali.  Jest  ona  wynikiem  tego,  że  dla  różnych  czę- 
stości omówione  wyżej  przesunięcia  fazowe  są  różne. 

W przypadku  relaksacji  strukturalnej  (przy  tworze- 
niu się  i rozpadaniu  asocjatów  np.  za  pośrednictwem 
wiązania  wodorowego  w wodzie,  alkoholach  i wielu 
innych  cieczach,  w polimerach,  przy  przejściach  fazo- 
wych itd.)  obserwuje  się  stosunkowo  dużą  dyspersję 
dźwięku,  natomiast  przy  relaksacji  termicznej  (np. 
przy  wzbudzaniu  rotacyjnych  stopni  swobody  cząste- 
czek związków  organicznych  w różnych  stanach  izo- 
merycznych) dyspersja  prędkości  dźwięku  jest  mała, 
niekiedy  zupełnie  niemierzalna. 

Wyrażenie  na  współczynnik  tłumienia  a'  z uwzględ- 
nieniem określonego  procesu  molekularnego  zależ- 
nego od  częstości  można  przedstawić  następująco: 


gdzie  stała  B — odpowiada  klasycznej  części  tłumie- 
nia, natomiast  drugi  składnik  zdaje  sprawę  z dodat- 
kowego tłumienia  molekularnego  (relaksacyjnego) 
arei/v2,  A — stała,  v — częstość  fali  akustycznej,  vm  — 
tzw.  częstość  relaksacji,  przy  której  występuje  maksi- 
mum tłumienia  relaksacyjnego,  przy  czym 

1 cr 

Vm 7. > 

2TCT  Ca 

r — czas  relaksacji,  który  określa  czas  powrotu  sta- 
nu zaburzonego  do  stanu  równowagi,  cv  — ciepło 
właściwe  przy  stałej  objętości,  ca  — część  ciepła  właści- 
wego przy  stałej  objętości  związana  z wewnętrznymi 
stopniami  swobody  cząsteczki,  która  absorbuje  i od- 
daje (wypromieniowuje  z pewnym  opóźnieniem) 
energię  fali  akustycznej. 

Często  wprowadza  się  współczynnik  tłumienia 
(bezwymiarowy)  odniesiony  do  długości  fali  2: 


fi  = aX  = 

( c — prędkość  dźwięku).  Wówczas  w obszarze  rela- 
ksacji 

, , WVm 

Mnl  = ar*a  - AcVmi+{Vfv^  ~ 


V/Vm 

i+(v/Vmy; 


(6) 


^max  = Acvm/2  dla  v = vm,  czyli  dla  2kvt  x 1. 


Prędkość  dźwięku  w obszarze  relaksacji  określa  na- 
stępujący wzór  dyspersyjny 


c 

Co 


CO2  T2 
1 +CÓ2  T2 


(7) 


gdzie  co  = 2nv,  e = 1-cJ/cL  c0  jest  prędkością 
dźwięku  dla  małych  częstości  (co  -►  0)  poniżej  obsza- 
ru dyspersji,  a c « jest  prędkościądźwięku  dla  bar- 
dzo wysokich  częstości  (c  -►  oo)  powyżej  obszaru 
dyspersji. 


dyspersja 

prędkości 

dźwięku 


współczynnik 

tłumienia 

relaksacyj- 

nego 


wzór 

dyspersyjny 
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współczynnik  tłumienia  dźwięku  // 


Na  rys.  22  pokazane  są  przykładowe  zależności 
a ' = a/w2,  pTei  = arei  A i c/c0  jako  funkcje  częstości 
v w obszarze  relaksacji  zgodnie  z równaniami  (2-7). 

Dla  pojedynczych  procesów  molekularnych  (o  jed- 
nym czasie  relaksacji),  np.  w układzie  z dwoma  sta- 
nami konfiguracji  izomerowej  znajomość  i«max  oraz 
vm  wystarcza  do  scharakteryzowania  procesu.  /*max 
zależy  tylko  od  wielkości  termodynamicznych,  nato- 


częstość  v 

Rys.  22.  Zależność  wielkości  a/w2,  n ~ tnX  oraz  c/c0  od  częstości 
określone  przez  równania  (5),  (6)  i (7)  dla  pojedynczego  procesu 
relaksacji;  vmax  — 50  MHz,  c0  = 1,2- 10*  cm  s-1,  A = 
= 524  10-I7s*/cm,  B = 70  10-l7s!/cm  (wg  J.  Lamba) 


miast  vm  określone  jest  przez  kinetykę  procesu.  Na 
przykład  w układzie  złożonym  z dwóch  rodzajów  izo- 
merów fi max  związane  jest  z różnicą  energii  pomiędzy 
dwoma  stanami  odpowiadającymi  równowadze  kon- 
figuracyjnej, zaś  vm  określa  wysokość  bariery  poten- 
cjału dla  wewnętrznej  rotacji  drobiny.  fim ax  oraz 
podstawy  vm  są  przedmiotem  wielu  eksperymentalnych  pomia- 
spektrosko-  rów,  w szczególności  , bada  się  ich  zależność  od  tem- 
pii  ultra-  peratury  i ciśnienia.  Zależności  doświadczalne  pozwa- 
dźwiękowej  łają  wyznaczać  energię  aktywacji  oraz  parametry  ki- 
netyczne procesów  molekularnych.  Takie  postępo- 
wanie leży  u podstaw  spektroskopii  ultradźwięko- 
wej. Powyższy  opis  procesu  o jednym  czasie  relaksacji 
można  rozszerzyć  na  przypadek,  gdy  istnieje  więcej 
niż  jeden  obszar  relaksacji,  tzn.  odnieść  również  do 
procesów  o wielu  czasach  relaksacji. 

Na  rys.  23  podany  jest  schematyczny  spektrogram 
dla  bromku  izobutylowego,  który  pokazuje  różne 
procesy  relaksacyjne  w odpowiednich  obszarach 


częstość  v 

Rys.  23.  Zależność  współczynnika  tłumienia  fz  = aX  dla  bromku 
izobutylowego  od  częstości  v dla  dwóch  temperatur:  — I40°C 
i 0°C.  Pionowe  linie  odpowiadają  częstościom  relaksacyjnym 
vm  i tłumieniom  v dla  każdego  z procesów  relaksacyjnych. 
Linie  przerywane  przedstawiają  schematycznie  przebiegi  tłu- 
mienia n w różnych  zakresach  częstości,  w których  dominują 
procesy  relaksacyjne  związane  z wymianą  energii  fali  z różnymi 
stopniami  swobody  cząsteczki.  Niektóre  obszary  zachodzą  na 
siebie,  dają  się  jednak  rozdzielić  przy  obniżeniu  temperatury 
(wg  Litovitza  i Davisa) 
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częstości.  Porównanie  górnego  (dla  temperatury 
— 140°C)  i dolnego  (dla  temperatury  0°C)  rysunku 
pozwala  zauważyć,  jak  przesuwają  się  zakresy  relak- 
sacyjne w zależności  od  temperatury.  W praktyce  za- 
kres pomiarowy  jest  w skali  częstości  ograniczony; 
zmiany  temperaturowe  pozwalają  więc  odpowiednio 
przesuwać  położenie  na  skali  częstości.  Zmiany  ciś- 
nienia w gazach  wywołują  również  przesunięcie  ob- 
szarów relaksacyjnych.  Bada  się  wtedy  fi  w zależności 
od  stosunku  v(p , gdzie  p — ciśnienie  gazu. 

Zjawiska  relaksacji  strukturalnej  odgrywają  dużą 
rolę  przy  rozchodzeniu  się  ultradźwięków  w układach 
niejednorodnych,  np.  w pobliżu  przejść  fazowych, 
gdzie  obserwuje  się  występowanie  ostrego  maksimum 
tłumienia  dźwięku  oraz  charakterystycznego  mini- 
mum dla  prędkości  rozchodzenia  się  dźwięku  (rys.  24 
i 25). 


1 017s2/cm 


Rys.  24.  Zależność  od  temperatury  współczynnika  tłumienia 
tt(v2  i prędkości  rozchodzenia  się  c fali  ultradźwiękowej  o czę- 
stości 2 MHz  w alkoholu  etylowym  C2H5OH  w pobliżu  punktu 
krytycznego  (/*  = 243,1°C)  (przejścia  ciecz-para);  wg  N.  F.  Noz- 
driewa 


temperatura 

Rys.  25.  Zależność  prędkości  rozchodzenia  się  podłużnej  fali 
sprężystej  rozchodzącej  się  w kierunku  [ 1 00]  w NH4CI  w pobliżu 
punktu  przejścia  fazowego  „porządek”-,, nieporządek”  (wg 
P.D.  Lazaya) 

Bardzo  interesująco  przebiegają  akustyczne  pro- 
cesy molekularne  w ciekłym  helu  szczególnie  w po- 
bliżu punktu  A,  poniżej  którego  (w  helu  II)  występuje 
zjawisko  nadpłynności  (— ► Nadpłynność).  W ostatnich 
doniesieniach  w literaturze  spotyka  się  prace  doty- 
czące dalszych  faz  helu  — helu  111  i helu  IV.  Tłuma- 


relaksacja 
w pobliżu 
przejść 
fazowych 


akustyczne 
procesy 
molekularne 
w ciekłym 
helu 


czy  się  je  zwykle  za  pomocą  tzw.  modelu  dwucieczo- 
wego,  w myśl  którego  hel  II  jest  mieszaniną  dwu  cie- 
czy nie  oddziałujących  na  siebie:  jednej  normalnej 
a drugiej  kwantowej.  W myśl  tego  modelu  w helu  II 
powstają  dwie  fale  akustyczne  odpowiadające  tym 
dwu  cieczom.  Jedna  z nich  o prędkości  cx  — (dpjdę)* 
zwana  dźwiękiem  normalnymi  ub  „pierwszym  dźwię- 
kiem”, oraz  druga  o prędkości  c2  = (Qs!Qn)S*(c!TldS)pt 
zwana  „drugim  dźwiękiem”  (lub  naddźwiękiem), 
gdzie  p — ciśnienie,  q — gęstość,  przy  czym  e — Qn  + 
+qs  ( Qn  — gęstość  składowej  normalnej,  qs  — gęstość 
składowej  nadciekłej),  S — entropia,  T — tempera- 
tura. 

dźwięk  „Pierwszy  dźwięk”  jest  zwyczajną  falą  sprężystą, 
„pierwszy"  w której  obydwa  składniki  helu  II  poruszają  się  ra- 
zem i wykazują  periodyczne  zmiany  ciśnienia  i gę- 
stości (rys.  26a).  „Drugi  dźwięk”  co  do  swej  natury 
nie  jest  falą  dźwiękową  w sensie  zmian  gęstości  i ciś- 
nienia, jest  to  natomiast  fala  zmian  temperatury 
i entropii  przy  stałej  gęstości,  gdy  obydwa  składniki 
poruszają  się  względem  siebie  (rys.  26b). 


Rys.  26.  Schemat  ułożenia  cząstek  przy  rozchodzeniu  się  w helu 
II  dźwięku  pierwszego  (a)  i drugiego  (b).  Punkty  niebieskie 
i czarne  oznaczają  odpowiednio  cząstki  akustyczne  cieczy  nor- 
malnej i nadpłynnej 

dźwięk  Rozchodzenie  się  „drugiego  dźwięku”  w He  II  zo- 
„drugi"  stało  po  raz  pierwszy  zaobserwowane  przez  Pieszko- 
wa w 1944  r.  Wytwarzał  on  zmienną  temperaturę  za 
pomocą  zanurzonego  w He  II  drucika,  przez  który 
płynął  prąd  zmienny  o częstości  kilku  kHz  i odbierał 
falę  „drugiego  dźwięku”  za  pomocą  termopary  z fo- 
sforo-brązu. 

Rysunek  27  przedstawia  wynik  pomiaru  absorpcji 
„pierwszego  dźwięku”  w ciekłym  helu  (He)  fali  ultra- 


temperatura 

Rys.  27.  Tłumienie  dźwięku  pierwszego  o częstości  12  MHz 
w ciekłym  helu  w pobliżu  punktu  przemiany  X.  Linia  przerywana 
(pozioma)  oznacza  tłumienie  obliczone  w oparciu  o teorię  kla- 
syczną (wg  Atkinsona) 


dźwiękowej  o częstości  12  MHz.  Powyżej  punktu  X 
w helu  I tłumienie  przebiega  zgodnie  z teorią  kla- 
syczną. W okolicy  punktu  X tłumienie  silnie  i anormal- 
nie wzrasta,  w okolicy  temperatury  1 K występuje 
bardzo  regularne  maximum  tłumienia.  Tego  rodzaju 
tłumienie  dźwięku  w ciekłym  helu  zostało  wyjaśnione 
przez  Landaua  i Kalatnikowa  na  gruncie  kwantowym 
jako  występowanie  dwóch  procesów  rozpraszania 
fononów  na  fononach  (proces  pięciofononowy)  oraz 
fononów  z rotonami  (kwanty  energii  rotacyjnej). 

Każdemu  z tych  procesów  odpowiada  określony  czas 
relaksacji : t //  oraz  rfr. 

Relaksacyjnemu  tłumieniu  w pobliżu  punktu  X od-  tłumienie 
powiada  również  wyraźna  dyspersja  fal  ultradźwię-  i dyspersja 
kowych  (rys.  28).  w pobliżu 

punktu  X 


nych  pomiarów  (wg  Atkinsona) 

Z uwagi  na  duże  analogie  przejścia  fazowego  X 
w ciekłym  helu  do  przejścia  ze  stanu  przewodnictwa 
do  nadprzewodnictwa  w metalach  (— ; ► Nadprzewod- 
nictwo) przeprowadza  się  również  w niektórych  labo- 
ratoriach na  świecie  badania  tych  przejść  metodami 
ultradźwiękowymi.  Ostatnio  analogię  tę  przeniesiono 
(de  Genne)  na  przejście  fazowe  smektyk  A-nema- 
tyk  w ciekłych  kryształach  (->  Ciekłe  kryształy). 
Ultradźwiękowe  badania  tego  przejścia  w ciekłym  tłumienie 
krysztale  CBOOA  (N-p-cyjanobenzilideno-/?-/i-ok-  w ciekłym 
tylooksyanilina)  wykazały  występowanie  maksimum  krysztale 
tłumienia  fa!  ultradźwiękowych,  którego  charakter 
odpowiada  przejściu  typu  X (rys.  29). 

Badania  akustycznych  procesów  molekularnych  są 
tym  ciekawsze,  im  większe  są  częstości  stosowanych 


Rys.  29.  Tłumienie  fali  ultradźwiękowej  o częstości  5 MHz 
w pobliżu  temperatury  tk  przejścia  smektyk  A-ncmatyk, 
w ciekłym  krysztale  CBOOA  (wg  R.  Bartolino,  F.  Scudieri, 
D.  Sctte  i A.  Śliwiński) 
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fal  sprężystych,  gdy  długość  fali  staje  się  bardziej 
współmierna  z rozmiarami  molekularnymi,  rozwijają 
się  więc  szczególnie  w zakresie  hiperdźwiękowym. 

W ciałach  stałych  odpowiednikiem  akustycznych 
procesów  molekularnych  są  oddziaływania  fali  sprę- 
żystej z atomami  sieci  krystalicznej  (->  Wzbudzenia 
elementarne  w ciałach  stałych)  i jej  defektami  oraz 
swobodnymi  nośnikami  ładunku. 

Akustyka  molekularna  jak  i kwantowa  bardzo  się 
w ostatnich  latach  rozwinęły  dzięki  coraz  to  większym 
możliwościom  eksperymentalnych  badań  ultradźwię- 
kowych i hiperdźwiękowych  w pełnym  zakresie 
widma  częstości  fal  sprężystych.  W wielu  laborato- 
riach na  świecie  (również  w Polsce)  prowadzi  się 
obecnie  badania  akustycznych  procesów  molekular- 
nych a wyniki  wykorzystuje  się  np.  w chemii,  biologii, 
czy  materiałoznawstwie. 


Ultradźwięki  i hiperdźwięki 

Antoni  Śliwiński 

Fale  sprężyste  o częstościach  powyżej  słyszalnych  to 
jest  powyżej  16  kHz  — częstość  taką  przyjmuje  się 
jako  granicę  słyszalności,  nazywa  się  ultradźwiękami 
(naddźwiękami),  przy  czym  terminem  tym  obejmuje 
się  zjawiska  do  częstości  10®  Hz.  Fale  sprężyste,  któ- 
rych częstość  przewyższa  10®  Hz,  nazywa  się  hiper- 
dźwiękami.  Hiperdźwiękowy  zakres  zjawisk  spręży- 
stych kończy  się  od  góry  naturalną  granicą  wyzna- 
granice  czoną  dla  danego  ośrodka  przez  częstość  odpowia- 
częstości  dającą  długości  fali  porównywalnej  z odstępami  mię- 
hipetr-  dzya tomowymi.  Fale  sprężyste  o mniejszych  dłu- 
dźwięków  gościach  nie  mogą  powstać,  gdy  znikają  warunki  ko- 
nieczne dla  ich  rozprzestrzeniania  się  (to  jest  znika 
możliwość  przekazania  zaburzenia  sprężystego  jako 
energii  mechanicznej  pomiędzy  atomami  w drodze 
bezpośredniej).  W kryształach  te  graniczne  częstości 
przypadają  w zakresie  1012-1013  Hz.  W powietrzu 
pod  normalnym  ciśnieniem  hiperdźwięki  właściwie 
nie  mogą  się  rozchodzić,  gdyż  już  przy  częstości 
10®  Hz  długość  fali  staje  się  porównywalna  ze  średnią 
drogą  swobodną  cząsteczek.  W cieczach  hiperdźwię- 
ki wytwarzane  są  przez  cieplne  fluktuacje  gęstości 
i teoretyczną  górną  granicą  jest  tutaj  1014  Hz. 

Hiperdźwięki  zostały  wydzielone  w osobną  grupę, 
której  dolną  granicą  jest  109  Hz,  ponieważ  dotych- 
czasowe metody  eksperymentalne  nie  pozwalały 
wytwarzać  i następnie  odbierać  fal  sprężystych  w oś- 
rodkach o częstościach  większych  niż  10®  Hz.  Gra- 
nica ta  jednak  przesuwa  się  coraz  wyżej  (w  mono- 
kryształach udało  się  wzbudzić  i odbierać  fale  sprę- 
żyste, których  częstość  wynosiła  8-1013  Hz).  Z dru- 
giej strony  częstości  fal  sprężystych  wzbudzonych 
przez  cieplne  drgania  atomów  w sieci  krystalicznej, 
ruchy  oscylacyjne  cząsteczek,  jak  również  cieplne 
fluktuacje  gęstości  w cieczach  obejmują  zakres  czę- 
stości powyżej  10®  Hz. 

własności  W przeciwieństwie  do  ultradźwięków,  które  wy- 
ultradźwię-  twarzamy  i odbieramy  jako  koherentne  (spójne)  wiąz- 
ków  i hi  per-  ki  fal  sprężystych,  hiperdźwiękowe  fale  cieplne  (tzw. 
dźwięków  debayowskie)  stanowią  zbiór  fal  niekoherentnych 
rozchodzących  się  we  wszystkich  możliwych  kierun- 
kach wewnątrz  ciała,  które  rejestrujemy  tylko  pośred- 
nimi metodami  wykorzystując  zjawiska  akustoop- 
tyczne  (->  Akustyczne  zjawiska  kwantowe). 

Ultradźwięki,  a tym  bardziej  hiperdźwięki,  odzna- 
czają się  małymi  długościami  fal,  np.  przy  częstości 
16  kHz  długość  fali  w powietrzu  wypada  ok.  2 cm, 
w cieczach  ok.  8 cm,  w ciałach  stałych  ok.  30  cm, 
natomiast  przy  10®  Hz  długość  fali  w powietrzu  byłaby 
ok.  3 *10- 4 cm,  w cieczy  rzędu  1,2- 10" 4 i w ciele 
stałym  4- 10“ 4 cm.  W zakresie  hiperdźwiękowym  dłu- 
gości fal  sprężystych  stają  się  porównywalne  z dłu- 
gościami światła  widzialnego  (400-800  nm),  w gra- 
nicznym przypadku  w ciałach  stałych  przy  częstości 
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10l2-1013  Hz  długości  fal  sprężystych  wynoszą  od 
5-0,5  nm. 

Niewątpliwie  małe  długości  fal  ultra-  i hiperdźwię- 
kowych zadecydowały  o specjalnym  ich  zastosowaniu. 

Dzięki  małym  długościom  fal  ultradźwięki  można 
wizualizować  za  pomocą  światła  (zjawiska  akusto- 
optyczne),  możnaje  ogniskować  i kształtować  w wiąz- 
ki o dobrej  kierunkowości  (->  Akustyka  morza, 

— ► Holografia  akustyczna)  i można  mówić  z dobrym 
przybliżeniem  o promieniach  ultradźwiękowych.  zastoso- 

Dzięki  małym  długościom  fal  a wysokim  często-  wanie  ultra- 
ciom  (natężenie  jest  proporcjonalne  do  kwadratu  czę-  dźwięków 
stości)  można  stosunkowo  łatwo  otrzymywać  ultra- 
dźwięki o dużym  natężeniu  (dziesiątki  W/cm2),  przy 
którym  pojawiają  się  zjawiska  nieliniowe  nie  wystę- 
pujące przy  falach  o małej  amplitudzie. 

Jeśli  długości  fal  ultradźwiękowych  stają  się  porów- 
nywalne z wielkością  niejednorodności  lub  ziarnisto- 
ści ośrodka,  w szczególności  z rozmiarami  określają- 
cymi jego  strukturę  molekularną,  wtedy  charakter 
rozchodzenia  się  tych  fal  zależy  wyraźnie  od  własności 
ośrodka.  Badając  prędkość  rozchodzenia  się  i tłumie- 
nia fal  ultradźwiękowych  możemy  określać  procesy 
molekularne  w różnych  ośrodkach  (— ► Badanie  oś- 
rodków za  pomocą  ultradźwięków).  Oddziaływa- 
nie fal  ultradźwiękowych  o dużych  częstościach 
ze  strukturą  ośrodka  prowadzi  do  wystąpienia  zja- 
wisk, które  wykazują  kwantowy  charakter  tych  pro- 
cesów. 

Do  wytwarzania  i odbioru  ultradźwięków  stosuje  przetworniki 
się  różne  urządzenia  zwane  przetwornikami  ultra-  ultradźwię- 
dźwiękowymi.  Przetwarzają  one  energię  określonego  ko  we 


Rys.  30.  Generator  Hartmanna  — źródło  periodycznych  zmian 
ciśnienia  z częstością  ultradźwiękową:  a)  schemat,  b)  fotografia 
cieniowa  wytwarzanej  fali.  Gaz  wypływa  z dyszy  z prędkością 
naddźwiękową.  Naprzeciwko  dyszy  ustawiony  jest  rezonator, 
który  powoduje  wzmocnienie  ciśnienia  akustycznego:  a)  schemat, 
b)  fotografia  wytworzonej  przez  niego  fali 


Rys.  31.  Piszczałka  Pohlmana-Jankowskiego.  Wypływająca 
z dyszy  D ciecz  wzbudza  drgania  rezonansowe  płytki  P o czę- 
stości ultradźwiękowej ; A , B — węzły  drgań  płytki 


układu  nieakustycznego,  drgającego  z częstością  ultra- 
dźwiękową, w energię  akustyczną  (przetworniki  na- 
dawcze — generatory  ultradźwiękowe)  lub  odwrot- 
nie — energię  akustyczną  w energię  innego  rodzaju 
(przetworniki  odbiorcze).  W zależności  od  rodzaju 
energii,  która  jest  przetwarzana  na  akustyczną  lub  od- 
wrotnie, rozróżniamy  generatory  łub  odbiorniki  ultra- 
dźwiękowe mechaniczne,  elektryczne,  magnetyczne, 
cieplne,  chemiczne  i optyczne.  Przetwornikami  odwra- 
calnymi nazywają  się  takie,  które  działają  w obydwu 
kierunkach  z równymi  sprawnościami.  Różne  rodzaje 
przetworników  ultradźwiękowych  dzieli  się  na  grupy 
biorąc  za  podstawę  zasadę  działania  wykorzystującą 
określone  zjawisko  fizyczne,  w którym  zachodzi  prze- 
twarzanie jednej  energii  w drugą. 

przetworniki  Przetworniki  mechaniczne  stanowiące  czyste  oscy- 

mechaniczne  latory  mechaniczne  jak  piszczałki,  syreny  (generatory) 
i radiometry  (odbiorniki)  są  w większości  przypadków 
nieodwracalne,  czyli  używane  albo  jako  nadajnik  albo 
jako  odbiornik.  Układy  takie  służą  najczęściej  do  wy- 
twarzania i odbioru  ultradźwięków  dużej  mocy  w za- 
kresie częstości  rzadko  kiedy  przekraczającym  50kHz. 
Generatory  tego  typu  mają  duże  zastosowanie  w oś- 
rodkach gazowych  (np.  syrena,  generator  Hartmanna 
widoczny  na  rys.  30  do  koagulacji  dymów)  i rzadziej 
ciekłych  (np.  piszczałka  Pohlmana-Jankowskiego 
widoczny  na  rys.  31  do  tworzenia  emulsji,  np.  homo- 
genizacji śmietanki). 

Szczególną  rolę  spełniają  przetworniki  umożliwia- 
jące wizualizację  pola  ultradźwiękowego  stosowa- 
ne w optosonice  (-►  Akustyczne  zjawiska  kwan- 
towe) i w holografii  akustycznej  (-*  Holografia  akus- 


tyczna). 

Radiometry  ultradźwiękowe  służą  do  pomiaru  na- 
tężenia fal  ultradźwiękowych  wykorzystując  ciśnienie 
promieniowania  wywierane  przez  falę  ultradźwiękową 
na  powierzchnię  prostopadłą  do  kierunku  rozchodze- 
nia się  (rys.  32). 

Przetworniki  piezoelektryczne  i elektrostrykcyjne 
działają  na  zasadzie  zjawiska  piezoelektrycznego  (wy- 
stępującego w monokryształach  piezoelektrycznych) 
i elektrostrykcyjnego  (występującego  w poi  ikry  szta- 
łach  piezoelektrycznych),  które  polegają  na  powsta- 
waniu deformacji  sprężystych  w wyniku  przyłożenia 
pola  elektrycznego.  Efekty  te  są  odwracalne  i wykorzy- 
tuje  się  je  w nadajnikach  i odbiornikach  ultradźwięko- 
wych w zakresie  częstości  od  20  kHz  do  10  GHz.  Tego 
rodzaju  przetworniki  zadecydowały  w ciągu  ostatnich 
50  lat  o olbrzymim  rozwoju  ultradźwięków.  Rysunki 
33  i 34  ilustrują  zastosowanie  płytki  piezoelektrycznej 


Rys.  32.  Radiometry  ultradźwiękowe : a)  w postaci  wahadła  (miarą 
ciśnienia  promieniowania  jest  kąt  wychylenia  określony  przez 
stosunek  <///);  b)  w postaci  wagi  hydrostatycznej  (miarą  ciśnienia 
promieniowania  jest  zmniejszenie  siły  wyporu  ciężarka) 


piezoelektrycznej  i posrebrzona  po  obu  płaskich  stro-  przetworniki 
nach)  jako  nadajnik  i jako  odbiornik.  Zwykle  tak  piezoeiektry- 
dobiera  się  grubość  płytki,  aby  wzbudzane  drgania  czne 
mechaniczne  odpowiadały  jej  drganiom  rezonanso- 
wym (gdy  d — ź/2).  Istnieje  więc  odwrotna  proporcjo- 
nalność pomiędzy  grubością  płytki  d a częstością 
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Rys.  33.  Wykorzystanie  efektu  piezoelektrycznego  w ultradźwię- 
kowym przetworniku  fal  podłużnych  (w  przypadku  kwarcu 
o cięciu  X):  jako  odbiornika  (a  i b)  oraz  nadajnika  (c  i d).  Roz- 
kład ładunku  powstającego  na  elektrodach  przy  ściskaniu  (a) 
oraz  przy  rozciąganiu  (b).  Zwiększenie  grubości  płytki  (c)  oraz 
zmniejszenie  grubości  płytki  (d)  wywołane  przez  przykładane 
napięcie 
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Rys.  34.  Wykorzystanie  efektu  piezoelektrycznego  w ultradźwię- 
kowym przetworniku  fal  poprzecznych  (w  przypadku  kwarcu 
o cięciu  Y):  jako  odbiornika  (a)  i (b)  oraz  nadajnika  (c)  i (d). 
Rozkład  ładunku  przy  ścinającym  odkształceniu:  dodatnim  (a) 
oraz  ujemnym  (b).  Odkształcenie  ścinające  ujemne  (c)  oraz  do- 
datnie (d)  wywołane  przez  przykładane  napięcie 


drgań  rezonansowych  v:  d = c/2v,  gdzie  c — pręd- 
kość dźwięku  w płytce.  Rysunek  35  pokazuje  przy- 
kład sprzężenia  płytki  piezoelektrycznej  z ośrodkiem. 


Rys.  35.  Sprzężenie  przetwornika  piezoelektrycznego  z ośrod- 
kiem: a)  przetwornik  w kontakcie  z cieczą;  b)  przetwornik  w kon- 
takcie z ciałem  stałym  — sprzężenie  poprzez  warstewkę  oliwy 
celem  lepszego  dopasowania,  u oznacza  napięcie  zmienne,  d — • 
grubość  płytki  równą  A/2  oraz  2a  — średnica  płytki  (zwykle  kilka 
centymetrów) 

do  którego  wprowadzamy  (lub  z którego  odbieramy) 
drgania  ultradźwiękowe.  przetworniki 

Przetworniki  magnetostrykcyjne  oparte  są  na  zja-  magneto- 
wisku  magnetostrykcji,  czyli  zmian  objętości  pod  strykcyjne 
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wpływem  pola  magnetycznego;  budowane  są  z ma- 
teriałów ferromagnetycznych  (metali  ferromagnetycz- 
nych lub  ferrytów).  W większości  wypadków  są  one 
używane  w zakresie  częstości  do  40  kHz,  chociaż  moż- 
na je  także  stosować  w zakresie  wyższych  częstości. 
Niekiedy  przetworniki  magnetostrykcyjne  stosuje  się 
w zakresie  megaherców,  a nawet  gigaherców.  Na  rys. 
36  przedstawiony  jest  prętowy  przetwornik  magneto- 

prętowy 


milimetrowej  do  określania  rozkładu  pola  ultradźwię- 
kowego w cieczach  (->  Fizyka  morza)  pracujący  do 
częstości  ok.  30  MHz. 

Do  wytwarzania  i odbioru  fal  ultradźwiękowych 
i hiperdźwiękowych  (o  częstościach  aż  do  1010  Hz) 
stosuje  się  specjalne  techniki,  które  rozwinęły  się  w 
ostatnich  latach  i ciągle  są  ulepszane.  Osiągnięciem 
w tej  dziedzinie  było  opracowanie  w 1958  r.  metody 


Rys.  37.  Ultradźwiękowy 
miniaturowy  mikrofon  ty- 
taniano-barowy  do  po- 
miaru rozkładu  poła  ultra- 
dźwiękowego o rozmia- 
rach kilku  milimetrów 


__  przewód  wewnętrzny 
^ osłona  metalowa 

izolator  akustyczny 
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baru 

elektrody  srebrne 


Rys.  36.  Schemat  działania  prętowego  przetwornika  magneto- 
strykcyjnego.  Stałe  pole  magnetyczne  o indukcji  B0  wprowadza 
magnetyczną  polaryzację  materiału,  zmienne  pole  magnetyczne 
o indukcji  Bi  powoduje  okresowe  wydłużenie  się  i kurczenie  pręta 


strykcyjny  pobudzany  elektromagnesem  w warunkach 
rezonansu. 

Istnieje  jeszcze  wiele  innych  rodzajów  przetworni- 
ków ultradźwiękowych  opartych  na  przykład  na  efek- 
tach termicznych,  używanych  zwłaszcza  do  pomiarów 
natężenia  fal  ultradźwiękowych,  lub  — na  efektach 
chemicznych,  służących  do  określania  na  przykład  wy- 
dajności ultradźwiękowych  procesów  chemicznych. 

W zakresie  mniejszych  częstości  stosowane  są  rów- 


wytwarzania  podłużnych  i poprzecznych  fal  w pręcie 
kwarcowym  przez  umieszczenie  go  w rezonatorze  mi- 
krofalowym (rys.  38).  Koniec  pręta  kwarcowego  (lub 
innego  kryształu  piezoelektrycznego)  umieszcza  się 
we  wnęce  rezonatora  mikrofalowego,  tak  jak  to  po- 
kazuje rys.  38b.  Energia  elektromagnetyczna  zostaje 
doprowadzona  do  rezonatora  za  pomocą  falowodu 
mikrofalowego.  Zmienne  pole  elektryczne  wywołuje 
odkształcenie  piezoelektryczne  w objętym  przez  sie- 
bie obszarze.  Fale  akustyczne  generowane  są  tylko 
w tym  obszarze,  a więc  w powierzchniowej  warstwie 


do  termometru  pręt  kwarcowy 


odbiorniki  Odbiorniki  ultradźwiękowe  można  podzielić  na 
wiązek  dwie  grupy:  na  duże  w porównaniu  z długością  fali, 
i sondy  które  służą  zwykle  do  odbioru  całej  wiązki  ultra- 
dźwiękowej (wtedy  są  większe  od  jej  przekroju  — re- 
jestrują wartość  sygnału  uśrednioną  na  całą  po- 
wierzchnię, rys.  32),  i na  bardzo  małe  w porównaniu 
z długością  fali  (np.  mniejsze  od  0,12),  i które  działają 
jak  sonda  i służą  do  określania  wartości  pola  ultra- 
dźwiękowego (ciśnienie  akustyczne,  prędkość  cząstki 
lub  natężenie)  w danym  punkcie.  Rysunek  37  przed- 
stawia piezoelektryczny  mikrofon-sondę  o średnicy 


Rys.  38.  Metoda  wytwarzania  hiperdźwięków  we  wnęce  mikro- 
falowej: a)  sprzężenie  pręta  piezoelektrycznego  z polem  elek- 
trycznym w rezonatorze  mikrofalowym,  b)  kompletny  układ  na- 
dawczo-odbiorczy 


poprzecznej  pręta  na  lewym  jego  końcu,  rozchodzą 
się  wzdłuż  niego  i odbijają  od  drugiego  końca.  W do- 
świadczeniu przedstawionym  na  rys.  38b  prawy  ko- 
niec pręta  umieszczony  jest  w bliźniaczej  wnęce  rezo- 
nansowej i fala  akustyczna  na  końcu  pręta  wzbudza 
drgania  mikrofalowe,  czyli  zostaje  odebrana  i zareje- 
strowana w układzie  odbiorczym.  Porównanie  sygna- 
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łu  odebranego  z sygnałem  nadanym  pozwala  wyzna- 
czyć tłumienie  fali  akustycznej  i jej  prędkość  w próbce. 
W innych  rozwiązaniach  opartych  na  metodzie  im- 
pulsowej rejestruje  się  sygnał  odbity  za  pomocą  tego 
samego  falowodu. 

Metoda  generacji  fal  hiperdźwiękowych  w pręcie 
piezoelektrycznym  umieszczonym  w rezonatorze  mi- 
krofalowym ograniczona  jest  do  badania  rozchodze- 
nia się  ich  w tym  samym  pręcie.  Przekazanie  fali  do 
innej  próbki  wiąże  się  z dużymi  stratami,  które  po- 
wstają na  granicy  zetknięcia  pręta  piezoelektrycznego 
z próbką,  nawet  przy  bardzo  dokładnym  doszlifowa- 
niu obydwu  powierzchni,  czy  też  stosowaniu  odpo- 
wiednich warstewek  sprzęgających.  Problem  genera- 
cji hiperdźwięków  w próbkach  z dowolnego  materiału 
przetworniki  został  rozwiązany  głównie  przez  zastosowanie  cien- 
cienko-  kich  warstw  magnetostrykcyjnych  lub  piezoelektrycz- 
warstwowe  nych,  które  osadza  się  bezpośrednio  (metodą  napyla- 
nia katodowego,  naparowania  lub  elektrolitycznie) 
na  powierzchni  próbki. 

Aby  materiał  mógł  stanowić  cienkowarstwowy 
przetwornik  piezoelektryczny  powinien  mieć  nastę- 
pujące własności:  duży  opór  elektryczny,  duży  stopień 
orientacji  krystalograficznej  przy  osadzaniu,  łatwość 
osadzania,  dużą  wartość  współczynnika  sprzężenia 
elektromechanicznego  (kwadrat  tego  współczynnika 
jest  równy  stosunkowi  otrzymanej  energii  mechanicz- 
nej drgań  do  wprowadzonej  energii  elektrycznej).  Ta- 
kim materiałem  okazał  się  siarczek  kadmu  i chociaż 
jego  współczynnik  sprzężenia  elektromechanicznego 
nie  jest  szczególnie  duży  w porównaniu  z innymi  ma- 
teriałami, jednak  dzięki  stosunkowo  dużej  łatwości 
osadzania,  zyskał  największą  popularność  (rys.  39). 
Warstewki  monokrystaliczne  mają  grubości  rzędu 
0,3-3  pm,  co  odpowiada  podstawowym  częstościom 
własnym  (grubość  równa  ż/2)  rzędu  109-1010  Hz. 


Rys.  39.  Przykład  wzajemnej  orientacji  kierunków  krystalogra- 
ficznych warstewki  piezoelektrycznej  CdS  lub  ZnS  oraz  jej 
podłoża  — pręta  Al2Oa  (wg  J.  de  Klerka) 

Rysunek  40  przedstawia  przykład  pobudzenia  cien- 
kowarstwowego przetwornika  piezoelektrycznego  w 
mikrofalowej  wnęce  rezonansowej  do  drgań  podłuż- 
nych (rys.  40a).  Rysunek  40b  przedstawia  fotografie 
mikrofalowych  rezonatorów  wnękowych  rozłożonych 
na  części.  Przedstawiony  tu  układ  jest  nadawczo-od- 
biorczy, składa  się  więc  z dwóch  identycznych  wnęk 
połączonych  ze  sobą  poprzez  badaną  próbkę;  jest  to 
metoda  przepuszczania.  Sygnał  wejściowy  doprowa- 
dza się  jednym  falowodem,  a wyjściowy  odprowadza 
się  drugim. 

przetworniki  Specjalny  rodzaj  przetworników  cienkowarstwo- 
z warstwą  wych  stanowią  układy  piezoelektryczne  półprzewod- 
zaporową  nikowe  z warstwą  zaporową.  Warstwa  zaporowa 
powstaje  przy  zetknięciu  metalu  i półprzewodnika 
(rys.  41)  albo  dwóch  półprzewodników  typu  p i n.  Po- 
nieważ poziomy  Fermiego  (poziomy  energetyczne,  dla 
których  prawdopodobieństwo  obsadzeń  elektronów 
w atomach  siatki  jest  50%)  (-►  Wzbudzenia  elemen- 
tarne w ciałach  stałych)  w metalu  i w półprzewodniku 


warstwowy  przetwornik 
piezoelektryczny  z CdS  (lub  ZnS) 
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Rys.  40.  Podwójny  rezonator  wnękowy  z próbką  i warstewkami 
nadawczą  i odbiorczą  dla  pobudzenia  drgań  podłużnych  — polo 
£s:  a)  schemat, b)  fotografia  rezonatora  (wg  J.  de  Klerka) 
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Rys.  41.  Tworzenie  się  warstewki  zaporowej  na  powierzchni 
zetknięcia  metalu  i półprzewodnika  (wg  Beechama):  a)  płytka 
metalu  i płytka  półprzewodnika  o różnych  poziomach  Fermiego, 
b)  wyrównanie  poziomów  Fermiego,  c)  przebieg  charakterystyki 
prądowo-napięciowej,  d)  schemat  przetwornika  z warstwą  za- 
porową, e)  schemat  przetwornika  z warstwą  dyfuzyjną 
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różnią  się  między  sobą,  powstaje  po  zetknięciu  płytek 
napięcie  kontaktowe,  które  jest  wynikiem  wyrówna- 
nia tych  poziomów.  Warstwa  zaporowa  stanowi  prze- 
strzeń wolną  od  ładunku,  który  zostaje  przesunięty 
poza  nią,  dzięki  temu  wytwarza  się  różnica  potencja- 
łów; jbst  ona  rzędu  1 V dla  przeciętnych  układów 
metal-półprzewodnik  (np.  arsenek  galu-złoto).  Wiel- 
kość napięcia  kontaktowego  (Va)  jest  wprost  propor- 
cjonalna do  różnicy  pracy  wyjścia  z metalu  (0m)  i pra- 
cy wyjścia  z półprzewodnika  (&p): 


gdzie  q — ładunek  elementarny  elektronu.  Warstwa 
ta  jest  bardzo  cienka  i ma  duży  opór  elektryczny,  przy 
czym  jej  otoczenie  jest  przewodzące.  Przyłożenie  ze- 
wnętrznego pola  elektrycznego  do  warstwy  zaporo- 
wej zmienia  jej  grubość. 

Jeżeli  użyty  półprzewodnik  jest  piezoelektrykiem, 
to  efekt  piezoelektryczny  będzie  możliwy  tylko  we- 
wnątrz warstwy  zaporowej,  a poza  nią  — gdzie  prób- 
ka przewodzi  — nie  będzie  występował  (zwarcie).  Gdy 
do  warstwy  przyłożymy  zmienne  napięcie  elektryczne, 
dzięki  efektowi  piezoelektrycznemu  będzie  ona  drgać 
generując  w próbce  falę  sprężystą.  Fala  sprężysta  prze- 
chodząc z warstwy  zaporowej  do  próbki  półprzewod- 
nika napotyka  ten  sam  opór  akustyczny,  gdyż  własno- 
ści mechaniczne  warstwy  zaDorowei  i próbki  półprze- 
wodnika są  takie  same  (ten  sam  ośrodek).  Dopaso- 
wanie jest  więc  doskonałe. 

Przetworniki  piezoelektryczne  z warstwą  zaporową 
są  stosowane  często  w układach  impulsowych;  wtedy 
zewnętrzne  pole  stałe  przykłada  się  też  tylko  impul- 
sowo, aby  nie  przegrzewać  układu. 

Interesujące  są  też  możliwości  wykorzystania  złą- 
cza nadprzewodzącego  (— ► Zjawiska  tunelowe  w nad- 
przewodnikach) do  generacji  i detekcji  fal  hiperdźwię- 
kowych.  Pozytywne  rezultaty  w tym  zakresie  uzyskali 
po  raz  pierwszy  Eisenmenger  i Dayem  w 1966  r. 

Zjawisko  Josephsona  polega  na  tym,  że  jeżeli  dwa 
ciała  nadprzewodzące  zbliżyć  do  siebie  zachowując 
między  nimi  przerwę  izolacyjną  rzędu  kilku  nanome- 
trów, to  przez  tę  przerwę  może  płynąć  prąd  w wyniku 
tunelowego  przejścia  elektronów  (zjawiska  tunelowa- 
nia) przez  przerwę  złącza.  Mogą  wystąpić  dwie  skła- 
dowe prądu  tunelowego:  stała  i zmienna.  Zjawisku 
tunelowego  przejścia  niesparowanych  elektronów 
przez  warstwę  izolującą  (przerwę  energetyczną)  mię- 
dzy dwoma  nadprzewodnikami  towarzyszy  dwustop- 
niowa emisja  fononów  relaksacyjnych  — w rezultacie 
zmiany  poziomów  energetycznych  elektronów,  które 
uległy  tunelowaniu,  i rekombinacyjnych  — w rezulta- 
cie łączenia  się  elektronów  w pary  (pary  Coopera). 
Emitowane  fonony  tworzą  falę  hiperdźwiękową.  Uży- 
wa się  tutaj  złączy  z nadprzewodników  o grubościach 
rzędu  100  nm  oddzielonych  przerwą  rzędu  1 nm  i po- 
wierzchni generującej  ok.  1 mm2. 

Do  uzyskania  zjawiska  tunelowania  niesparowa- 
nych elektronów  konieczna  jest  wstępna  polaryzacja 
elektryczna  złącza  nadprzewodzącego  takim  napię- 
ciem, aby  odpowiadało  ono  szerokości  przerwy  ener- 
getycznej (rys.  42a),  to  znaczy  żeby  był  spełniony  wa- 
runek V ^ 2 A\e,  gdzie  V — napięcie  przyłożone,  A — 
szerokość  przerwy  energetycznej,  e — ładunek  elek- 
tronu. Przy  przerwach  energetycznych  rzędu  1 MeV 
występujących  w znanych  nadprzewodnikach  uzysku- 
je się  fale  hiperdźwiękowe  o częstościach  od  100  GHz 
do  1 THz. 

Jeżeli  napięcie  V < 2A/e,  to  takie  samo  złącze  może 
służyć  do  detekcji  fal  hiperdżwiękowych  (rys.  42). 
Wtedy  absorpcja  fononów  wywołuje  wzbudzenie  elek- 
tronów przechodzących  (dzięki  zjawisku  tunelowa- 
nia) przez  przerwę  tworząc  prąd,  który  jest  proporcjo- 
nalny do  ilości  fononów  czyli  natężenia  fali  hiper- 
dżwiękowej. 

Dzięki  zastosowanym  metodom  superdużych  czę- 
stości bardzo  rozwinęły  się  w ostatnich  latach  badania 


ciała  stałego  metodami  akustycznymi  (-►  Akustyczne 
zjawiska  kwantowe). 

Ultradźwięki  w całym  zakresie  częstości  mają  ol- 
brzymie zastosowanie  techniczne,  każdy  jednak  rodzaj 


Rys.  42.  Półprzewodnikowy  model  poziomow  energetycznych  dla 
złącza  utworzonego  z dwóch  identycznych  nadprzewodników: 
a)  Generacja  fononów,  eV  ^ 2A ; energia  E\  tunelujących  elek- 
tronów jest  zawarta  w przedziale  J ^ Ei  ^ eV—2A.  Maksymalne 
energie  emitowanych  fononów  relaksacyjnych  (£/max)  i fono- 
nów rekombinacyjnych  (2J)  są  zaznaczone  przy  odpowiednich 
wężykowatych  strzałkach  oznaczających  poglądowo  akty  emisji 
fononów;  b)  Detekcja  fononów,  0 < eV  < 2d;  energia  absorbo- 
wanego fononu  (strzałka  wężykowata)  przechodzi  w energię 
wzbudzenia  tunelowego  elektronu 


zastosowań  związany  jest  z określonym  obszarem  czę- 
stości. 

Zastosowanie  ultradźwięków  może  być  czynne 
i bierne.  Zastosowanie  czynne  polega  na  stosowaniu 
średnich  i dużych  natężeń  powodujących  zmiany  nie- 
odwracalne lub  częściowo  nieodwracalne  w nadźwię- 
kawianym  ośrodku.  Zastosowanie  bierne  polega  na 
używaniu  tak  słabych  wiązek,  że  nie  wpływają  one  de- 
strukcyjnie na  ośrodek,  w którym  się  rozchodzą,  na- 
tomiast pozwalają  badać  jego  własności.  W czynnych 
zastosowaniach  zmiany  w ośrodku  związane  są  też  ze 
zjawiskami  nieliniowymi,  z których  najistotniejsze 
znaczenie  mają  kawitacja  ultradźwiękowa  i przepły- 
wy akustyczne. 

Powstającej  w silnym  polu  ultradźwiękowym  kawi- 
tacji polepjącej  na  tworzeniu  się  i zapadaniu  pęche- 
rzyków (il.  158,  tabl.  42)  towarzyszy  wiele  efektów 
wtórnych:  procesy  chemiczne,  luminescencja  ultra- 
dźwiękowa czyli  tzw.  sonoluminescencja  (il.  159,  tabl. 
42),  procesy  biologiczne  i inne. 

Użycie  ultradźwięków  dużej  mocy  pozwala  przepro- 
wadzać procesy  technologiczne,  które  innymi  meto- 
dami są  niewykonalne  lub  bardzo  skomplikowane,  jak 
np.  obróbka  twardych  i kruchych  materiałów,  spawa- 
nie materiałów  różniących  się  bardzo  własnościami 
(metale,  plastyki),  otrzymywanie  stopów  ze  składni- 
ków różniących  się  znacznie  temperaturami  topnienia 
i gęstościami  itp.  Ultradźwięki  przyspieszają  i polep- 
szają takie  procesy,  jak  oczyszczanie,  trawienie  po- 
wierzchni, otrzymywanie  zawiesin  oraz  otrzymywanie 
emulsji  i areozoli. 

Osobną  grupę  stanowi  zastosowanie  ultradźwięków 
w medycynie  i biologii.  W tej  dziedzinie  zastosowanie 
również  może  być  czynne  (działanie  na  tkanki  i orga- 
nizmy żywe,  przy  czym  dzięki  możliwościom  ognisko- 
wania ultradźwięków  działanie  takie  można  precyzyj- 
nie lokalizować),  jak  i bierne  — do  celów  diagno- 
stycznych. Terapia  i diagnostyka  ultradźwiękowa 
uczyniła  w ostatnich  kilku  latach  bardzo  duże  postępy 
i bardzo  rozpowszechnia  się  jej  zastosowanie.  Na  ilu- 
stracji 180  (tabl.  46)  podana  jest  fotografia  ultradźwię- 
kowego przyrządu  do  diagnostyki  oka  (oftalmografu) 
polskiej  konstrukcji.  Na  ilustracji  181  (tabl.  46)  po- 
kazany jest  obraz  ultradźwiękowy  płodu  w łonie  matki. 

Stosunkowo  niedawno  (od  kilku  lat)  w medycynie 
zaczęto  stosować  z dużym  powodzeniem  urządzenia 
oparte  na  zasadzie  Dopplera  do  obserwacji  elemen- 
tów ruchomych  w organizmie.  Tą  metodą  określa  się 
przepływ  krwi  w naczyniach  krwionośnych,  określa 
i wizualizuje  ruchy  zastawek  serca  itp. 

W zastosowaniu  biernym  oprócz  badań  nieniszczą- 
cych (->  Badania  ośrodków  za  pomocą  ultradźwię- 
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ków)  mających  na  celu  określenie  struktury  ośrodka 
lub  jego  defektów  istotne  jest  określenie  własności 
lepkosprężystych  wielu  materiałów.  Do  tego  celu  ko- 
nieczne jest  wykonanie  precyzyjnych  pomiarów  współ- 
czynnika tłumienia  a i prędkości  rozchodzenia  się 
dźwięku  c.  Na  il.  164  (tabl.  43)  mamy  np.  zestaw  po- 
miarowy do  wyznaczania  prędkości  i tłumienia  ultra- 
dźwięków w cieczach  w zakresie  częstości  1-60  MHz. 
Pomiary  tłumienia  i prędkości  dźwięku  ważne  są  w 
pełnym  zakresie  częstości  od  najniższych  do  najwyż- 
szych. W zakresie  hiperdźwiękowym  np.  (powyżej 
osiągalnej  eksperymentalnie  granicy  1010  Hz  dla  gene- 
racji i odbioru  koherentnych  fal  sprężystych)  tłumie- 
nie i prędkość  wyznacza  się  metodami  pośrednimi, 
np.  przez  zjawisko  rozpraszania  światła  Mandelszta- 
ma-Brillouina  (->  Akustyczne  zjawiska  kwantowe). 
Metody  te  m.in.  pozwoliły  zaobserwować  dyspersje 
prędkości  dźwięku  w cieczach  w zakresie  częstości 
1010-10u  Hz  i uzupełniły  w decydujący  sposób  wy- 
obrażenia fizyków  o stanie  ciekłym  materii,  który 
jak  dotąd  mniej  jest  poznany  niż  stan  gazowy  i ciało 
stałe  (kryształy). 


Infradźwięki 

Ignacy  Małecki 

lnfradźwiękami  nazywamy  drgania  ośrodka  gazowe- 
go lub  ciekłego  o częstościach  poniżej  słyszalnej. 
Zwykle  przyjmuje  się  umownie  jako  zakres  infradźwię- 
ków pasmo  o częstości  0,1-20  Hz.  W ostatnich  latach 
zainteresowanie  tego  typu  drganiami  bardzo  wzrosło, 
gdyż  w środowisku  współczesnego  człowieka  stano- 
wią one  ważny  czynnik  zakłócający. 

Fale  infradźwiękowe  działają  na  cały  organizm 
ludzki.  Wywołują  one  drgania  rezonansowe  klatki 
piersiowej,  przepony  brzusznej  i organów  trawienia. 
Schemat  zastępczy  ciała  człowieka  pokazuje  rys.  43. 
Powoduje  to  zaburzenia  systemu  oddychania,  a przy 
dłuższym  działaniu  prowadzi  do  chorób  układu  tra- 
wienia. Infradźwięki  mogą  też  powodować  zakłócenia 
organu  równowagi  i zmniejszenie  ostrości  widzenia. 
Istnieje  pewna  analogia  i addytywność  działania  infra- 


Rys  43.  Schemat  zastępczy  ciała  człowieka  jako  organu  drgają- 
cego: 1 odpowiada  głowie.  2 tchawicy,  3 klatce  piersiowej, 
4 brzuchowi,  5 kręgosłupowi,  6 miednicy,  7 nogom;  FtF3  ozna- 
czają siły  działające  w pozycji  siedzącej  i stojącej 


dźwięków  i alkoholu,  objawiająca  się  zmniejszeniem  odczuwanie 
szybkości  reakcji  nerwowych.  infradzwię- 

Granicę  bólu  i próg  odczuwania  wrażeń  pochodzą-  ków 
cych  od  infradźwięków  określa  się  podobnie,  jak  dla 
dźwięków  słyszalnych.  Im  niższa  częstość,  tym  bar- 
dziej te  dwie  granice  do  siebie  się  zbliżają,  widać  to  na 
rys.  44.  Ogólnie  można  rozróżnić  następujące  zakresy 
oddziaływania  infradźwięków  na  organizm  ludzki. 


Rys.  44.  Krzywe  równei  intensywności  odczuwania  infradźwię- 
ków w skali  względnej  od  1 do  5 (wg  Stevensa) 

Poniżej  120  dB.  W tym  zakresie  krótkie  działanie 
infradźwięków  nie  wywołuje  wrażeń  przykrych  i nie 
jest  szkodliwe.  Przy  dłuższym  działaniu  wystąpić 
mogą  jeszcze  mało  zbadane  ujemne  skutki  infra- 
dźwięków. 

Między  120-140  dB.  Przebywanie  w polu  infra- 
dźwiękowym powodować  może  lekkie  zakłócenie  pro- 
cesów fizjologicznych  i uczucie  nadmiernego  zmęcze- 
nia. . . 

Między  140-160  dB.  Już  przy  krótkim  (2  mm)  dzia- 
łaniu infradźwięki  powodują  nieprzyjemne  objawy 
fizjologiczne  (zakłócenie  zmysłu  równowagi,  wymio- 
ty). Dłuższe  działanie  spowodować  może  trwałe  usz- 
kodzenie organiczne. 

Powyżej  170  dB.  Stwierdzono  na  zwierzętach  śmier- 
telne działanie  infradźwięków,  spowodowane  prze- 
ważnie przekrwieniem  płuc.  „ . , 

Źródła  infradźwięków  podzielić  możemy  na  natu-  źródła  intra 
ralne  i sztuczne.  W naturze  główną  przyczyną  powsta-  dźwięków 
wania  infradźwięków  są  ruchy  powietrza  i wody.  Falo- 
wanie powierzchni  mórz  i oceanów  i prądy  podwodne 
wytwarzają  szumy  o maksimach  leżących  w widmie 
dźwięków  słyszalnych,  ale  wchodzących  również  w za- 
kres infradźwiękowy.  Prócz  tego  falująca  powierzch- 
nia morza  jest  źródłem  fal  infradźwiękowych  o bar- 
dzo niskich  częstotliwościach  (rzędu  0,2  Hz)  rozcho- 
dzących się  w atmosferze.  Inny  jest  mechanizm  po- 
wstawania infradźwięków  w wodospadach,  gdzie  re- 
zonans obszaru  między  skałą  a płaszczem  wodnym 
daje  czasem  wyraźne  maksima  szumu  w zakresie  in- 
fradźwiękowym. 

Ruchy  górnych  warstw  atmosfery  powodują  odbi- 
cia fal  powstających  na  powierzchni  morza.  Wyłado- 
wania atmosferyczne  są  źródłem  fali  infradźwiękowej 
towarzyszącej  grzmotowi.  Wiatr  opływający  wysokie 
budynki  także  generuje  fale  infradźwiękowe  o natęże- 
niu mogącym  przekraczać  100  dB. 

Wśród  źródeł  sztucznych  najsilniejszymi  są  wybu- 
chy atomowe  lub  termojądrowe.  Typowy  przebieg 
zmian  ciśnienia  wywołanych  wybuchem  atomowym 
pokazano  na  rys.  45.  Z natężenia  fali  infradźwiękowej 
wywołanej  wybuchem  wnioskować  można  o wielkości 

ładunku  wybuchowego.  . . . . . 

Najgroźniejszym  w przyszłości  źródłem  infradźwię- 
ków może  stać  się  transport  lotniczy.  W lotnictwie 
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*<2  - Encyklopedia  fizyki  współczesne) 


infradźwięki 
w lotnictwie 


poddźwiękowym  najhałaśliwsze  są  helikoptery  dające 
infradźwięki  zawierające  wyraźne  maksima  o często- 
ściach odpowiadających  liczbie  obrotów  śmigieł.  Sa- 
moloty naddźwiękowe  przy  przekraczaniu  bariery 
dźwięku  wytwarzają  falę  uderzeniową  o bardzo  dużej 
amplitudzie.  Maksimum  przenoszonej  energii  zależy 
od  wielkości  samolotu  — pościgowce  dają  fale  o mak- 
simum przy  20  Hz,  gdy  dla  ciężkich  samolotów  typu 
Concorde  maksimum  to  przypada  przy  ok.  2 Hz.  Sil- 
na fala  uderzeniowa  powodowana  jest  również  wy- 
strzeleniem ciężkich  rakiet.  Obserwowano,  że  przy 


Rys.  46.  Widmo  fali  powstającej  przy  odpalaniu  rakiety  Saturn 
w różnych  odległościach  od  miejsca  wybuchu  (odległość  podana 
w milach,  1 mila  = 1853  m) 


nie  sprzyjającym  rozkładzie  gradientu  temperatur 
w atmosferze,  fala  podmuchu  od  rakiety  uszkodzić 
może  budynki.  Na  rys.  46  pokazano  widmo  fali  po- 
wstałej przy  odpaleniu  rakiety  Saturn  V.  Pociągi  i ruch 
drogowy  dają  lokalne  pole  infradźwiękowe  w pasie 
ok.  200  m wokół  trasy  przejazdów. 

Na  statkach,  zwłaszcza  na  szybkich  jednostkach, 
nieprzyjemne  są  drgania  o częstości  infradźwiękowej 
przenoszone  od  silników  Diesla  poprzez  konstrukcję 
statku. 

W przemyśle  jednym  z głównych  źródeł  infradźwię- 
ków są  szybkie  przepływy  gazów,  np.  w dmuchawach 
wielkopiecowych  osiągają  one  poziom  120  dB.  Szcze- 
gólnie uciążliwe  mogą  być  drgania  rezonansowe  kana- 
łów wentylacyjnych. 

Narzędzia  udarowe,  jak  nitownice,  młoty  pneuma- 
tyczne i inne  wytwarzają  jednocześnie  infradźwięki 
i drgania  przenoszące  się  na  ręce  robotników.  Stwier- 
dzono, że  przyspieszenia  przekraczają  w tych  przypad- 
kach wielokrotnie  przyspieszenie  ziemskie  i działają 
szkodliwie  na  organizm. 

Systematyczne  badania  źródeł  fal  infradźwiękowych 
i ich  działania  na  żywe  organizmy  datują  się  zaledwie 
od  kilku  lat,  toteż  wielu  zjawisk  nie  wyjaśniono  do 
końca. 
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infradźwięki 
w przemyśle 


Badanie  ośrodków  za  pomocą 
ultradźwięków 


Ultradźwięki  umożliwiają  nieniszczące  badanie  ma- 
teriałów. Badaniem  makrostruktury  materiałów  zaj- 
muje się  defektoskopia,  mikrostrukturę  bada  się  ko- 
rzystając z metod  spektroskopii  ultradźwiękowej  i mi- 
krodefektoskopii . 


Spektroskopia  ultradźwiękowa 

Jerzy  Wehr 

Termin  spektroskopia  przyjął  się  od  dawna  w akusty- 
ce w odniesieniu  do  widmowej  analizy  dźwięków  (ba- 
danie zależności  natężenia  od  częstości)  i do  badania 
z tego  punktu  widzenia  ich  źródeł  lub  kanałów  prze- 
noszenia. Termin  spektroskopia  ultradźwiękowa  jest 
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stosunkowo  nowy  w fizyce.  Nadaje  mu  się  przeważnie  analogia  ze 
inne  znaczenie,  a mianowicie  znaczenie  analizy  zależ-  spektrosko- 
ności  współczynnika  tłumienia  i prędkości  fal  ultra-  pią  absorp- 
dźwiękowych  od  częstości  drgań  lub  innej  wielkości  cyjną 
równoważnej.  Tak  rozumiana  spektroskopia  jest  ana- 
logiczna do  różnych  rodzajów  spektroskopii  absorp- 
cyjnej w dziedzinie  promieniowania  elektromagne- 
tycznego. 

Tłumienie  i prędkość  rozchodzenia  się  fal  akustycz- 
nych o różnych  częstościach,  m.in.  ultradźwięko- 
wych, zależą  od  procesów  zachodzących  w skali  ato- 
mowej i cząsteczkowej  (->  Przedmiot  i zakres  akusty- 
ki, rozdział  Akustyczne  procesy  molekularne)  i tym 
samym  mogą  informować  o ich  przebiegu.  Mianowi- 
cie wystąpienie  maksimum  tłumienia  przy  określonej 
częstości  luD  wystąpienie  obszaru  dyspersji  prędkości 
dźwięku  (zależności  prędkości  od  częstości  drgań)  jest 
wynikiem  procesów  relaksacyjnych  związanych  ze 


współczynnik  tłumienia  /.£•  10 


zmianami  poziomów  energetycznych  układów  mole- 
kularnych. 

czas  Układ  (np.  zespół  atomów  w molekule)  może 
relaksacji  zostać  wytrącony  z równowagi  przez  biegnącą  falę 
ultradźwiękową  w ten  sposób,  że  odbiera  on  od  fali 
energię  (absorbuje)  przechodząc  w stan  wzbudzony. 
Powrót  układu  do  poprzedniego  stanu  równowagi  wy- 
maga określonego  czasu  (czas  relaksacji),  który  cha- 
rakteryzuje dany  układ.  Energia  wzbudzenia  oddawa- 
na jest  przy  powrocie  do  stanu  równowagi  w postaci 
ciepła. 

W ośrodku  złożonym  z wielu  molekuł  takich  proce- 
sów pojawia  się  wiele,  a jeśli  przy  tym  są  to  molekuły 
jednakowe,  to  wszystkie  te  procesy  mają  ten  sam  czas 
relaksacji.  Wypadkowy  wynik  oddziaływania  z falą 
ultradźwiękową  objawia  się  więc  dużym  selektywnym 
ubytkiem  energii  fali  i wystąpieniem  maksimum 
współczynnika  tłumienia  jumax  (j*  jest  bezwymiarowym 
współczynnikiem  tłumienia)  dla  określonej  częstości 
(rys.  1).  Częstość  odpowiadająca  temu  maksimum  w. 


zwana  częstością  relaksacji,  wyznacza  czas  relaksacji 
zgodnie  z wzorem  vr  ~ 1/t,  gdzie  r — czas  relaksacji. 
Częstość  vr  pokrywa  się  zwykle  z częstością  odpowia- 
dającą środkowi  obszaru  dyspersji  prędkości  dźwięku 
(rys.  2). 

Przebieg  zależności  współczynnika  tłumienia  od 
częstości  fi  (v)  jest  symetryczny  w funkcji  In  (v/vr) 
i stosunek  częstości,  leżących  powyżej  i poniżej  czę- 
stości relaksacji  vr,  dla  których /i  = 0,5^max,  wynosi 
dla  prostego  procesu  relaksacyjnego  ok.  13,9. 


Rys.  2.  Dyspersja  prędkości  c ( c0  — prędkość  dźwięku  dła  bardzo 
małych  częstości)  i tłumienie  relaksacyjne  w różnych  tempera- 
turach 


Pomiary  widm  relaksacyjnych  w funkcji  częstości 
drgań  wymagają  więc  pokrycia  bardzo  szerokich  za- 
kresów częstości,  co  związane  jest  z dużymi  trudnoś- 
ciami aparaturowymi. 

Częstość  relaksacji  ośrodka  gazowego  jest  funkcją 
gęstości  i temperatury.  Gdy  gaz  stosuje  się  do  prawa 
gazów  doskonałych,  zależność  od  gęstości  można  za- 
stąpić zależnością  od  ciśnienia.  W spektroskopii  ultra- 
dźwiękowej stosuje  się  więc  często  metodę  zmiennego 
ciśnienia  przy  ustalonej  częstości  i z kolei  skalę  ciśnie- 
nia przelicza  się  na  skalę  częstości  (rys.  1). 

Jeżeli  procesy  relaksacyjne  są  aktywowane  cieplnie, 
tj.  jeżeli  drgania  cieplne  powodują  fluktuacje  pozio- 
mów energetycznych  danych  konfiguracji  mikrostruk- 
tury, można  zależność  od  częstości  drgań  zastąpić 
zależnością  od  temperatury  T.  Najczęściej  przyjmuje  równanie 
się  w tym  celu,  że  częstość  vr  spełnia  równanie  Arrhe-  Arrheniusa 
niusa: 

Vr  = V0C~WlkT , 

gdzie  v0  jest  częstością  drgań  cieplnych,  energią 
aktywacji  procesu  relaksacyjnego,  k — stałą  Boltz- 
manna. 

Pomiary  współczynnika  tłumienia  jumax  w funkcji 
temperatury  i częstości  pozwalają  na  wyznaczenie 
energii  aktywacji  W. 

W ciałach  stałych  realizuje  się  najczęściej  pomiary 
współczynnika  tłumienia  fi  w funkcji  temperatury  dla 
niewielu  ustalonych  częstości  drgań.  W cieczach  po- 
miary fi  w funkcji  temperatury  są  ograniczone  wą- 
skim temperaturowym  zakresem  ciekłego  stanu  sku- 
pienia i typowe  są  pomiary  j*  w funkcji  częstości  przy 
ustalonych  temperaturach,  nie  przekraczających  tem- 
peratur krzepnięcia  i parowania. 

Rysunek  3 przedstawia  przykład  przesuwania  się 
maksimum  tłumienia  na  skutek  zmian  temperatury. 

Przy  wzroście  temperatury  maksimum  przesuwa  się 


Rys.  3.  Tłumienie  relaksacyjne  uwarunkowane  izomerią  obro- 
tową w 1,1, 2-trójchloroetan  ie 


w stronę  wyższych  częstości.  Obliczenie  z tego  prze- 
sunięcia energii  aktywacji  oparte  na  wzorze  Arrhe- 
niusa pozwoliło  ustalić,  że  wykryty  tutaj  eksperymen- 
talnie proces  relaksacji  w 1,1,2-trójchloroetanie  jest 
związany  z przechodzeniem  molekuł  z jednego  stanu 
izomerycznego  (o  niższej  energii)  w drugi  (o  wyższej 
energii). 

Jeżeli  bezwymiarowy  współczynnik  tłumienia  fal 
akustycznych  rośnie  w funkcji  częstości  v wolniej  niż 
pierwsza  potęga  v (szybszy  wzrost  ji  (v)  zdarza  się 
przeważnie  w wypadku  rozproszenia  fal  na  wtrące- 
niach, granicach  ziaren  itp.),  to  tłumienie  można  in- 
terpretować jako  skutek  procesów  relaksacyjnych 
w badanym  ośrodku  i można  zaproponować  dyskret- 
ny lub  ciągły  model  (widmo)  takich  czasów  relaksacji 
i takich  stratności  materiału,  który  zgadza  się  z wyni- 

659 


stratność  kami  pomiarów  (stratność  materiału  e = p/k  — Q~l , 
materiału  gdzie  Q jest  współczynnikiem  dobroci  materiału).  Na- 
leży jednak  podkreślić,  że  — po  pierwsze  — taki  model 
odnosi  się  tylko  do  zakresu  częstości  objętego  pomia- 
rami, a po  drugie  — może  istnieć  często  wiele  różnych 
widm  relaksacyjnych  odpowiadających  tym  samym 
wynikom  pomiarów.  Odtworzenie  widma  relaksacyj- 
nego ośrodka  z pomiarów  propagacji  fal  ultradźwię- 
kowych w ośrodku  jest  więc  niezupełne,  a gdy  widma 
są  bardziej  złożone  (gęste)  — jest  też  niejednoznaczne. 
Modele  widm  relaksacyjnych  łatwiej  jest  tworzyć, 
jeśli  przebieg  p w funkcji  v/p  (gdzie  p — ciśnienie)  czy 
T dzieli  się  na  wyraźne  maksima  (rys.  2).  W wyborze 
modelu  własności  relaksacyjnych  są  pomocne,  oprócz 
pomiarów  tłumienia,  również  pomiary  prędkości  pro- 
pagacji fal  ultradźwiękowych  c.  Dla  prostego  procesu 
relaksacyjnego  blisko  maksimum  p leży  punkt  prze- 
gięcia (środek  obszaru  dyspersji)  prędkości  fazowej 
i ekstremum  prędkości  grupowej.  Obserwacja  cha- 
rakterystycznych punktów  przebiegów  prędkości  po- 
maga rozdzielić  dyskretne  widmo  relaksacyjne  na 
właściwą  liczbę  składników. 


Rys.  4.  Wpływ  wyżarzenia  na  widmo  relaksacyjne  polikrystalicz- 
nego niobu 


zastosowania  Przykładami  zastosowań  spektroskopii  ultradźwię- 
kowej ciał  stałych  są:  badania  dyfuzji  atomów  gazu 
w metalach,  wyznaczanie  gęstości  dyslokacji  i średniej 


wartości  przewidywane 

xx -wyniki  otrzymane  doświadczalnie 

Rys.  5.  Pochłanianie  ultrakrótkich  fal  przez  monokryształ  oło- 
wiu w zależności  od  temperatury 
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długości  pętli  dyslokacyjnych,  badanie  koncentracji 
defektów  punktowych  i domieszek  w sieci  krystalicz- 
nej (rys.  4).  Spektroskopię  ultradźwiękową  stosuje  się 
również  do  badania  obszaru  przejścia  fazowego  od 
stanu  normalnego  do  stanu  nadprzewodzącego  (rys. 
5).  Tego  rodzaju  zmiany  obserwuje  się  wyraźnie  tylko 
w bardzo  czystych  materiałach.  Typowymi  zastoso- 
waniami w badaniach  cieczy  i gazów  są:  badanie  izo- 
merii (rys.  3),  badanie  przejść  monomer-dimer,  po- 
miary małych  koncentracji  domieszek  i składu  mie- 
szanin, wyznaczenie  prędkości  reakcji  chemicznych, 
badanie  dysocjacji  roztworów.  Niekiedy  celowe  jest 
łączenie  metod  spektroskopii  ultradźwiękowej  z in- 
nymi metodami  spektroskopii,  np.  z metodą  jądro- 
wego rezonansu  magnetycznego  czy  elektronowego 
rezonansu  spinowego  (-►  Akustyczne  zjawiska  kwan- 
towe). 


Defektoskopia  i mikrodefekto- 
skopia  ultradźwiękowa 

Bogumił  Linde 

Wdefektoskopiiimikrodefektoskopii  wykorzystuje  się  badanie  ma- 
wpływ  niejednorodności  materiału  na  prędkość  i tłu-  krostruktury 
mienie  rozchodzących  się  w nim  ultradźwięków.  Bada-  i mikrostruk- 
nie  materiału  polega  na  wprowadzeniu  do  niego  fali  tury 
ultradźwiękowej  i na  jej  odebraniu.  Do  wytwarzania 
i rejestrowania  ultradźwięków  służą  przetworniki 
piezoelektryczne  (wielkie  częstości)  oraz  magneto- 
strykcyjne  (małe  częstości).  Z czasu  przelotu  fali  w ma- 
teriale i z jej  tłumienia  lub  wzmocnienia  można  wnio- 
skować o rozmieszczeniu  i wielkości  niejednorodno- 
ści. Od  częstości  użytej  fali  zależy,  jakiej  wielkości  de- 
fekty można  w ten  sposób  wykrywać.  Np.  rozmiary 
ziaren  można  badać  stosując  fale  o wielkich  często- 
ściach, gdyż  ich  tłumienie  zależy  bardzo  silnie  od  wiel- 
kości ziaren.  Do  badania  makrostruktury  materia- 
łów, tj.  niejednorodności,  pęknięć,  wytrzymałości, 
twardości  itp.  stosuje  się  fale  ultradźwiękowe  o czę- 
stości 105-108  Hz.  Do  badań  mikrostruktury,  tj.  de- 
fektów punktowych  sieci  krystalicznej,  rozmiarów 
ziaren,  dyslokacji,  załamania  lub  przesunięcia  płasz- 
czyzn sieci  itp.  stosuje  się  ultradźwięki  i hiperdźwięki 
o częstości  1CF-1011  Hz. 

Istnieją  trzy  podstawowe  metody  badań  stosowane  metoda 
zarówno  w defektoskopii  jak  i mikrodefektoskopii.  echa 
Najbardziej  rozpowszechniona  jest  metoda  echa.  Po- 
lega ona  na  nadawaniu  krótkich  impulsów  ultradźwię- 
kowych i ich  odbiorze  po  odbiciu  od  niejednorodno- 
ści w badanej  próbce.  Odległość  defektu  określa  czas 
liczony  od  chwili  nadania  impulsu  do  jego  powrotu  po 
odbiciu  (rys.  6),  zaś  wielkość  tego  defektu  obrazuje 
amplituda  impulsu  odbitego.  Impulsy  obserwuje  się 


Rys.  6.  Metoda  echa:  a)  badana  próbka  z głowicą  nadawczo-od- 
biorczą Gno,  x oznacza  odległość  wady  od  powierzchni;  b)  oscy- 
iogram,  1 impuls  nadany,  2 impuls  odbity  od  wady,  3 impuls 
odbity  od  końca  próbki 


zwykle  na  ekranie  lampy  oscyloskopowej,  znając  zaś 
jej  podstawę  czasu  można  odczytać  odległość  czasową 
impulsu  nadanego  i odbitego,  a stąd  znaleźć  odległość 
wady  od  powierzchni  z prostego  wzoru : 2x  = c/, 
gdzie  x jest  odległością  wady  od  powierzchni,  c — 
prędkością  ultradźwięków  w badanym  materiale, 
/ — czasem  przelotu. 


metoda  Metoda  cienia  (przepuszczenia)  polega  na  pomiarze 
cienia  amplitudy  fali  ultradźwiękowej  za  wadą  po  przejściu 
przez  badany  materiał  (rys.  7).  Używa  się  w niej  dwóch 
głowic  — nadawczej  i odbiorczej.  Niejednorodności 
w badanym  materiale  powodują  osłabienie  energii  fal 
docierających  do  głowicy  odbiorczej.  Z różnicy  ampli- 
tudy impulsu  nadanego  i odebranego  wnioskuje  się 
o wielkości  wady.  Metodę  cienia  jak  i metodę  echa 
można  stosować  także  do  pomiaru  grubości. 


Rys.  7.  Metoda  cienia:  a)  próbka  bez  wady.  b)  badana  próbka 
z wadą;  Gat  głowica  nadawcza.  Go  głowica  odbiorcza,  c)  oscy- 
logramy  z zaznaczoną  różnicą  amplitud  AA 


metoda  Metoda  rezonansowa  polega  na  znalezieniu  kolej- 
rezonansowa  nych  częstości  rezonansowych  badanego  elementu. 

Zjawisko  rezonansu  zachodzi  wtedy,  gdy  grubość  G 
badanego  przedmiotu  jest  wielokrotnością  połowy 
długości  fali;  wówczas  G — cj2Afy  gdzie  d/jest  różni- 
cą dwóch  kolejnych  częstości  rezonansowych.  Metodę 
tę  stosuje  się  w pierwszym  rzędzie  do  pomiaru  grubo- 
ści, można  ją  też  stosować  do  wykrywania  rozwar- 
stwień, braków  przyczepności  w połączeniach  spawa- 
nych, lutowanych,  klejonych,  a także  istnienia  ko- 
rozji. 

metoda  Prócz  wymienionych  są  jeszcze  dwie  metody  defek- 
drgań  toskopii  stosowane  rzadziej.  Metoda  drgań  własnych 
własnych  opiera  się  na  badaniu  i analizie  drgań  własnych  ukła- 
du wzbudzonego  uderzeniem ; stosuje  się  ją  do  bada- 
nia układów  wielowarstwowych  (wad  samych  warstw 
i połączeń  sztywnych  między  warstwowych), 
metoda  W metodzie  impedancji  wykorzystuje  się  zależność 
impedancji  akustycznego  oporu  (impedancji)  wejściowego  układu 
od  obciążenia  na  jego  końcach.  Za  pomocą  tej  meto- 
dy można  wykrywać  zakłócenia  w sztywnych  połą- 
czeniach cienkiej  osłony  z masywnym  podłożem.  Bez- 
pośrednią miarą  zakłóceń  jest  zmiana  sił  reakcji  bada- 
nego urządzenia,  kóre  wzbudzają  w czujniku  drgania 
giętne  o częstości  dźwiękowej. 

Obecnie  rozwijają  się  metody  umożliwiające  bez- 
pośrednią obserwację  badanych  wad.  Znajdują  przy 
tym  zastosowanie  wskaźniki  oscyloskopowe  (rys.  8), 
za  pomocą  których  można  otrzymać  prezentacje  A,  B 
prezentacja  B (dokładniej  omówione  w paragrafie  Badanie  ośrod- 


ków  biologicznych  za  pomocą  metody  ecnajoraz  c. 


b> 


c) 


a) 


Rys.  8.  Wizualizacja  wad  za  pomocą  prezentacji  B:  a)  badana 
próbka  z głowicą  nadawczo-odbiorczą  Cno.  b)  ekran  lampy  oscy- 
loskopowej, c)  obraz  jak  w metodzie  echa 


Przy  zastosowaniu  prezentacji  C (rys.  9)  pręd- 
kość ruchu  plamki  podstawy  czasu  na  ekranie  jest 
proporcjonalna  do  prędkości  ruchu  głowicy  po  przed- 
miocie. Plamka  świeci  tylko  w miejscach  wykrytych 
wad.  Przy  zastosowaniu  odpow-iedniej  lampy  oscylo- 
skopowej obraz  może  być  utrzymany  na  ekranie  do- 
wolnie długo.  Pozwala  to  na  dokładną  ocenę  w'ad. 


Rys.  9.  Wizualizacja  wad  za  pomocą  prezentacji  C:  a)  badana 
próbka  z głowicą  G,  b)  ekran  lampy  oscyloskopowej 


Ultradźwiękowe  metody 
diagnostyczne 

Leszek  Fiłipczyński 

Warunki  rozchodzenia  się  fal  ultradźwiękowych  oraz 
zjawiska,  które  ich  rozchodzeniu  się  towarzyszą,  za- 
leżą od  takich  makro-  i mikroskopowych  właściwości 
ośrodków,  jak  sprężystość,  gęstość,  rozciągłość,  nie- 
jednorodność, anizotropia,  budowa  molekularna, 
a w-  przypadku  ruchu  ośrodka  zależą  od  jego  prędko- 
ści. Stąd  też  wynikają  możliwości  zastosowania  fal 
ultradźwiękowych  jako  narzędzia  badawczego  pozwa- 
lającego na  uzyskanie  o własnościach  materii  martwej 
i żywej  oraz  ojej  ruchu  cennych  informacji,  które  w in- 
ny sposób  zdobyć  bardzo  trudno,  a niekiedy  w ogóle 
nie  można.  W przypadku  ośrodków  biologicznych 
ultradźwięki  umożliwiają  nawet  wizualizację  wnętrza 
niedostępnego  dla  oka  bez  dokonywania  krwawego 
zabiegu,  a także  — co  jest  szczególnie  cenne  — bez 
żadnych  szkodliwych  skutków  ubocznych. 

Dzięki  temu  ultradźwięki  znalazły  obecnie  szerokie 
zastosowanie  diagnostyczne  w medycynie,  w takich  jej 
dziedzinach  jak  położnictwo,  kardiologia,  okulistyka, 
neurologia,  onkologia,  chirurgia  naczyniowa  itp. 

Te  wielkie  możliwości  stosowania  ultradźwięków 
w diagnostyce  medycznej  wynikają  z bardzo  korzyst- 
nych warunków  rozchodzenia  się  fal  ultradźwiękowych 
w tkankach  miękkich.  Tłumienie  fal  ultradźwięko- 
wych w tych  tkankach  jest  przeważnie  wprost  propor- 
cjonalne do  częstości  w dolnym  jej  zakresie  aż  do 
100  MHz,  podczas  gdy  w innych  ośrodkach  występuje 
szybszy  wzrost  tłumienia  z częstością.  Przy  częstości 
1 MHz  współczynnik  tłumienia  zawiera  się  w grani- 
cach od  0,1  dB/cm  (w  ciałku  szklistym  oka)  do  3,3 
dB/cm  (w  tkance  mięśniowej  w poprzek  włókien). 
Z tego  to  względu  do  badań  jamy  brzusznej,  gdzie  głę- 
bokość penetracji  dochodzi  do  30  cm,  stosuje  się  fale 
ultradźwiękowe  o częstości  ok.  2 MHz,  natomiast  do 
badania  oczu,  gdzie  głębokość  penetracji  wynosi  ok. 
3 cm,  stosowane  są  częstości  wyższe,  dochodzące  do 
20  MHz. 

W tkankach  miękkich  rozchodzą  się  praktycznie 
jedynie  podłużne  fale  ultradźwiękowe,  fale  poprzeczne 
są  bardzo  silnie  tłumione;  w tkance  kostnej  mogą  się 
rozchodzić  również  inne  typy  fal  ultradźwiękowych  — 
poprzeczne,  giętne  itp.  Ponieważ  prędkość  rozchodze- 
nia się  fal  ultradźwiękowych  w tkankach  miękkich 
wynosi  ok.  1500  m/s  zatem  w podanym  wyżej  zakresie 
częstości  długości  fal  ultradźwiękowych  wynoszą  od- 
powiednio 0,75-0,075  mm,  czyli  przekraczają  zaled- 
wie o trzy  lub  dwa  rzędy  wielkości  długość  fal  świetl- 
nych. Tak  krótkie  fale  można  łatwo  formować  w rów- 
noległe lub  skupione  wiązki,  których  wymiary  po- 
przeczne są  rzędu  1 mm;  zapewnia  to  rozdzielczość 
wystarczającą  do  celów  diagnostycznych. 

W ostatnich  latach  w mikroskopie  ultradźwięko- 
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prezentacja  C 


możliwości 

zastosowań 

diagnostycz- 

nych 


rozchodzenie 
się  ultra- 
dźwięków 
w tkankach 
miękkich 


wym  zastosowano  częstości  100  M Hz  i większe,  i uzy- 
skano rozdzielczość  odpowiadającą  minimalnej  od- 
ległości 25  pm.  Jednakże  bardzo  duże  tłumienie  ogra- 
nicza możliwość  badania  w ten  sposób  tkanek  do  gru- 
bości zaledwie  kilku  mm. 

opór  Następnym  bardzo  korzystnym  czynnikiem,  który 
akustyczny  umożliwia  zastosowanie  ultradźwięków  w diagnostyce 
tkanek  medycznej,  jest  fakt,  że  opór  akustyczny  właściwy 
miękkich  (równy  iloczynowi  gęstości  ośrodka  i prędkości  roz- 
chodzenia się  fali)  różnych  tkanek  miękkich  niewiele 
się  różni.  Wskutek  tego  fala  ultradźwiękowa  padająca 
prostopadle  na  granicę  dwóch  tkanek  prawie  całkowi- 
cie przez  nią  przenika,  zaledwie ok.  1 % energii  fali  pa- 
dającej odbija  się  od  granicy. 

Jeśli  się  stosuje  impulsy  fali  ultradźwiękowej,  to  po- 
wstaje niewielkie  echo,  które  jest  jednak  wystarczają- 
co duże,  by  po  wzmocnieniu  w układach  elektronicz- 
nych można  je  było  zarejestrować  na  ekranie  lampy 
oscyloskopowej.  Większość  energii  fali  ultradźwięko- 
wej przenika  coraz  dalej  w głąb  ośrodka  biologiczne- 
go z niewielką  stratą  energii  i daje  echa  od  każdej  na- 
wykrywanie  potkanej  na  swej  drodze  granicy  tkanek.  Dzięki  temu 
granic  mamy  możliwość  wykrycia  granic  wielu  różnych,  po- 
tkanek  łożonych  kolejno  za  sobą  tkanek  miękkich. 

Przeszkodą  nie  do  przeniknięcia  są  dla  fal  ultra- 
dźwiękowych wszelkie  obszary  wypełnione  gazami. 
Opór  akustyczny  właściwy  gazów  jest  bowiem  o kilka 
rzędów  wielkości  mniejszy  niż  tkanek  miękkich,  i dla- 
tego na  granicy  tkanka  miękka-gaz  następuje  prawie 
całkowite  odbicie  fali  ultradźwiękowej.  Podobne  zja- 
wisko, choć  w mniejszym  stopniu,  zachodzi  na  granicy 
tkanek  miękkich  i kostnych,  a znaczna  absorpcja  fal 
ultradźwiękowych  w tkankach  kostnych  utrudnia  ich 
badanie. 

Informacje  zawarte  w falach  ultradźwiękowych 

0 spenetrowanym  ośrodku  biologicznym  są  zakodo- 
wane w czasie  ich  przejścia,  amplitudzie,  częstości 

1 fazie.  Metoda  echa,  w której  się  stosuje  impulsy  fal 
ultradźwiękowych,  pierwsza  dała  pozytywne  wyniki 
w diagnostyce  ultradźwiękowej.  Czas  przejścia  fali 
i amplituda  są  podstawowymi  parametrami,  z których 
się  uzyskuje  informacje  o ośrodku  badanym  metodą 
echa.  W ultradźwiękowych  metodach  dopplerowskich 
źródłem  informacji  jest  częstość  fali,  a w ultradźwię- 
kowych układach  holograficznych  — faza  fali. 


układ  struktur  biologicznych 
pęcherz 

skóra  moczowy 


Badanie  ośrodków  biologicznych  za  pomocą 
metody  echa 

Informacje  uzyskane  w postaci  echa  impulsów  fal 
ultradźwiękowych  odbitych  od  granic  tkanek  można 
przedstawić  na  ekranie  oscyloskopowym  w różnych 

prezentacja  A prezentacjach.  Najprostsza  jest  prezentacja  A (rys. 

lOc),  w której  impulsy  ultradźwiękowe  (ściślej  — ich 
obwiednie)  odpowiednio  przetworzone  elektronicznie, 
przedstawiane  są  na  podstawie  czasu,  odpowiadają- 
cej głębokości  ciała. 

prezentacja  B Bardziej  złożoną  prezentacją,  dającą  obraz  rozkła- 
du anatomicznego  tkanek,  jest  prezentacja  B.  W tym 
wypadku  sygnały  odbite  wewnątrz  badanego  ciała 
modulują  jasność  lampy  oscyloskopowej;  natomiast 
podstawa  czasu  wykonuje  zazwyczaj  złożone  ruchy 
obrotowo-postępowe,  analogiczne  do  ruchów  wiązki 
ultradźwiękowej  przeszukującej  wnętrze  ciała  pacjen- 
ta. Echa  rozjaśniające  ekran  oscyloskopowy  tworzą 
wówczas  rysunek  złożonego  układu  anatomicznego 
tkanek. 

Na  rys.  lOd  przedstawiono  zasadę  prezentacji  B, 
w zastosowaniu  do  badania  struktur  biologicznych 
a na  ii.  181  (tabl.  46)  — przykład  jej  zastosowania. 
Obraz  oscyloskopowy  badanego  narządu  ciała  po- 
wstaje stopniowo  w miarę  przesuwania  przetwornika 
piezoelektrycznego  po  powierzchni  ciała  (trwa  to  za- 
zwyczaj kilkanaście  sekund).  Dzięki  zastosowaniu 
ekranu  oscyloskopowego  z długim  czasem  poświaty 
albo  zastosowaniu  układów  pamięciowych  obraz 
utrzymuje  się  wystarczająco  długo,  by  móc  postawić 


diagnozę  (w  celu  uzyskania  dokumentacji  badania 
można  go  również  fotografować). 

Odmianą  prezentacji  B jest  wizualizacja  w czasie 
rzeczywistym:  wiązka  ultradźwiękowa  wykonuje  ru- 
chy obrotowe  lub  postępowe  przeszukujące  wnętrze 
badanego  ciała  z szybkością  kilkunastu  razy  na  se- 
kundę. Jest  to  niezbędne  w celu  wizualizacji  struktur 
ruchomych  serca  lub  innych  narządów.  Innym  ty- 
pem prezentacji  umożliwiającym  rejestrastrację  ruchu 
struktur  ruchomych  serca  jest  prezentacja  My  wyka- 
zująca zarówno  pewne  cechy  prezentacji  Ay  jak  i B. 

Dopplerowskie  metody  badania  biologicznych 
struktur  ruchomych 

Drugą  grupę  metod  ultradźwiękowych  w diagnostyce 
medycznej  stanowią  metody  oparte  na  zjawisku  Dop- 
plera. Fale  ultradźwiękowe  padając  na  ruchome  struk- 
tury biologiczne  (jak  np.  bijące  serce  płodu  lub  płyną- 
ce ciałka  krwi),  ulegają  odbiciu  względnie  rozprosze- 
niu i zmieniają  swą  częstość.  Zmianę  częstości  można 
przetworzyć  elektronicznie  na  zakres  słyszalny  (po- 
zwala to  usłyszeć  np.  tętno  bijącego  płodu  w łonie 
matki)  lub  też  można  zmierzyć  ją  (a  na  tej  podstawie 
wyznaczyć  np.  prędkość  krwi  przepływającej  w naczy- 
niu krwionośnym). 

Dwie  odmiany  metod  dopplerowskich  znalazły 
obecnie  szerokie  zastosowanie.  W pierwszej  z nich  — 
w metodzie  fali  ciągłej  — przetwornik  piezoelektrycz- 
ny wytwarza  falę  ciągłą;  w drugiej  — zwanej  metodą 
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metoda 

impulsowa 


fale 

Rayleigha 


impulsową  — wytwarza  impulsy  fal.  Metoda  fali  ciąg- 
łej dostarcza  łączną  informację  o wszystkich  struktu- 
rach ruchomych  leżących  na  drodze  wiązki  ultra- 
dźwiękowej; powoduje  to  pewne  trudności  interpre- 
tacyjne, wtedy  gdy  wiązka  ultradźwiękowa  trafia  jed- 
nocześnie np.  na  tętnicę  i leżącą  głębiej  żyłę.  Wady  tej 
nie  wykazuje  bardziej  złożona  metoda  impulsowa, 
która  umożliwia  np.  pomiar  prędkości  krwi  w wybra- 
branym  zakresie  głębokości.  Dopplerowska  metoda 
impulsowa  dostarcza  ponadto  informacji  o czasie 
przejścia  imdulsów  ultradźwiękowych  w ośrodku, 
przez  co  umożliwia  jednoczesne  dokonywanie  pomia- 
rów średnicy  naczynia  krwionośnego  i rozkładu  pręd- 
kości krwi  wewnątrz  naczynia.  Umożliwia  to  wyzna- 
czanie prędkości  objętościowej  krwi  (wydatku)  w du- 
żych naczyniach  krwionośnych.  Istnieją  również  moż- 


liwości zastosow-ania  tej  metody  do  badania  przepły- 
wu krwi  wewnątrz  serca. 

Poważną  zaletą  ultradźwiękowych  metod  dcpple- 
rowskich  jest  możliwość  dokonywania  pomiarów 
prędkości  krwi  z powierzchni  ciała,  bez  konieczności 
dokonywania  krwawego  zabiegu,  choć  metody  te 
mogą  być  również  stosowane  podczas  operacji  na  od- 
krytych naczyniach  krwionośnych. 

Diagnostyka  ultradźwiękowa  w położnictwie  i chorobach  ko- 
biecych, L.  Filipczyński  i F.  Roszkowski  (red.).  Warszawa  1977; 
L.  Filipczyński  i in.  Przepływy  krwi.  Zarys  hemodynamiki 
i ultradźwiękowe  metody  dopplerowskie , Warszawa  1980;  L.  Fi- 
lipczyński i in.  Ultradźwiękowe  metody  badań  materiałów , 
Warszawa  1963;  I.  Małecki  Fizyczne  podstawy  akustyki  tech- 
nicznej, Warszawa  1964,  W.  F.  Nozdriew,  N.  W.  Fedorosz- 
czenko  Moliekularnaja  akustika,  Moskwa  1974;  Z.  Pawłowski 
Badania  nieniszczące , cz.  I,  Warszawa  1975;  W.P.  Mason  Phy- 
sical  Acoustics,  vol.  21,  part  A,  New  York  1965. 


Akustyczne  fale  powierzchniowe 
i ich  zastosowanie 

Antoni  Śliwiński 


Fale  powierzchniowe  są  to  fale  sprężyste,  rozchodzące 
się  na  powierzchni  ograniczającej  ośrodek,  który  po- 
za tą  powierzchnią  traktować  można  jako  nieogra- 
niczony. 

W zależności  od  charakteru  ograniczenia  mogą  po- 
wstawać różne  fale  powierzchniowe.  Wyróżnia  się 
cztery  ich  rodzaje:  fale  Rayleigha,  Stonleya,  Lamba 
i Love’a.  Najbardziej  znane  z nich  są  fale  Rayleigha 
i mówiąc  o falach  powierzchniowych  często  je  właśnie 


wierzchni  ciała  i normalne  do  niej  (głębokościowe). 
Składowe  głębokościowe  przesunięć  szybko  zanikają 
i nie  sięgają  głębiej  jak  na  trochę  więcej  niż  jedna  dłu- 
gość fali.  Poglądowe  przedstawienie  współdziałania 
tych  dwóch  składowych  w powierzchniowej  fali  Ray- 
leigha zaznaczone  jest  na  rys.  2.  Większą  amplitudę 
ma  składowa  poprzeczna  o drganiach  prostopadłych 
do  powierzchni.  Składowa  podłużna  jest  równoległa 
do  powierzchni  i jej  drgania  odbywają  się  równolegle 


Rys.  1.  Poglądowy  rozkład  drgań  cząsteczek  ośrodka  w powierzchniowej  fali  Rayleigha  na  zakłóconej  powierzchni  wody 


maksimum  maksimum  maksimum  maksimum 


Rys.  2.  Modelowe  przedstawienie  deformacji  ośrodka  w fali 
Rayleigha  na  powierzchni  ciała  stałego 


ma  się  na  myśli.  Są  to  fale  rozchodzące  się  na  swo- 
bodnej powierzchni  cieczy  lub  ciała  stałego  graniczą- 
cego z próżnią  lub  gazem  — takie  jak  np.  na  zakłóco- 
nej powierzchni  wody  (rys.  1)  lub  na  powierzchni  ciała 
stałego  (rys.  2).  Drgania  punktów  odpowiadają  ru- 
chom po  torach  eliptycznych  (w  przybliżeniu  koło- 
wych) w płaszczyźnie  pionowej,  równoległej  do  kie- 
runku rozchodzenia  się  fali.  W ciałach  izotropowych 
ruch  ten  można  rozłożyć  na  dwie  pary  składowych: 
podłużne  i poprzeczne  (ścinania)  równolegle  do  po- 


Rys.  3.  Przesunięcie  poprzeczne  i podłużne  cząstki  akustycznej 
w fali  Rayleigha  jako  funkcja  głębokości  z i odległości  wzdłuż 
kierunku  rozchodzenia  się  *.  Jako  jednostkę  przyjęto  długość 
fali 


składowa 
poprzeczna 
i podłużna 
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do  kierunku  rozchodzenia  się.  Składowe  poprzeczna 
i podłużna  są  zawsze  przesunięte  w fazie  o 90°.  Ten 
stosunkowo  skomplikowany  układ  przesunięć  w for- 
mie przestrzennego  wykresu  przedstawia  rys.  3. 

fale  Falami  Stonleya  nazywa  się  fale,  które  powstają  na 
Stonleya  powierzchni  rozdzielającej  dwa  ośrodki  stałe.  Mogą 
one  rozchodzić  się  tylko  przy  ściśle  określonych  sto- 
sunkach oporów  właściwych  (-►  Przedmiot  i zakres 
akustyki,  rozdz.  Teoria  ośrodków  ciągłych  i fal  sprę- 
żystych) obydwu  ośrodków.  Fale  te  są  bardzo  podob- 
ne do  fal  Rayleigha  co  do  rozkładu  na  składowe  pod- 
łużną i poprzeczną  oraz  charakteru  ich  wnikania 
w ośrodki  po  obu  stronach  powierzchni  rozdzielają- 
cej te  ośrodki. 

fale  Fale  Lamba,  które  często  nazywa  się  płytowymi, 
Lamha  powstają  w ośrodku  stałym  ograniczonym  dwiema 
równoległymi  powierzchniami  (np.  w blachach,  nie- 
grubych  płytach,  powłokach  itp.),  których  odległość 
wzajemna  jest  porównywalna  z długością  fali,  a nie 
przekracza  kilku  długości  fali.  Przesunięcia  cząstek  są 
wynikiem  nakładania  się  na  siebie  dwóch  fal  Ray- 
leigha biegnących  na  obydwu  powierzchniach  w tym 
samym  kierunku.  Fale  Lamba  rozłożyć  można  na  dwa 
podstawowe  typy:  o postaci  symetrycznej  i antysyme- 
trycznej  (rys.  4).  W płycie  o danej  i stałej  grubości, 
której  powierzchnie  ograniczające  są  płaszczyznami. 


Rys.  4.  Falc  Lamba:  a)  postać  symetryczna,  b)  postać  antysyme- 
tryczna  (roz  rozrzedzenie,  zg  zgęszczenie) 


może  powstać  wiele  fal  o określonych  postaciach  (pod- 
stawowe i wyższe  harmoniczne),  przy  czym  o powsta- 
niu danej  postaci  (sposobu  drgań,  czyli  modu)  fali 
decyduje  stosunek  grubości  płyty  do  długości  fali  po- 
przecznej lub  podłużnej.  Fale  Lamba  są  falami  dys- 
persyjnymi, to  znaczy,  że  ich  prędkość  fazowa  zależy 
od  częstości. 

fal©  Fale  Love’a  są  falami  poprzecznymi  rozchodzący- 
Love'a  mi  się  w układach  warstwowych.  Cząstki  akustyczne 
drgają  w nich  równolegle  do  powierzchni  warstwy 
i prostopadle  do  kierunku  rozchodzenia  się.  Są  to 
więc  fale  sprężyste  spolaryzowane  w płaszczyźnie  wy- 
znaczonej przez  ograniczenie  warstwy.  Schematyczny 
rysunek  fali  Loveła  w cienkiej  warstwie  spoczywają- 
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cej  na  grubszym  podłożu  (rola  podłoża  jest  tylko  po- 
mocnicza  — utrzymuje  ono  warstwę  w pozycji  pozio- 
mej) pokazuje  rys.  5.  Fale  Love'a  są  silnie  dyspersyjne. 


Rys.  5.  Fala  Love’a  w cienkiej  warstwie  umieszczonej  na  grubym 
podłożu 


Chociaż  znane  w fizyce  od  dawna,  akustyczne  fale 
powierzchniowe  stały  się  w ostatnim  dziesięcioleciu, 
szczególnie  fale  o wielkich  częstościach,  przedmiotem 
intensywnych  badań,  ponieważ  znalazły  zastosowanie 
w wielu  dziedzinach.  Stosuje  się  różne  metody  wytwa- 
rzania takich  fal,  w zależności  od  tego,  gdzie  mają  być 
zastosowane.  Fale  powierzchniowe  o częstościach 
mikrofalowych  zostały  wykorzystane  w nowej  techno- 
logii elektronicznej,  której  rozwój  opiera  się  na  ukła- 
dach scalonych  (->  Mikroelektronika),  w takich  urzą- 
dzeniach jak  np.  linie  opóźniające  dla  sygnałów  elek- 
trycznych, filtry  z programowanym  przesuwaniem 
fazy,  modulatory,  układy  do  kompresji  sygnałów, 
układy  wytwarzające  splot  dwóch  sygnałów  (fizyczny 
odpowiednik  splotu  w sensie  matematycznym),  de- 
fiektory  i modulatory  światła  (-*  Akustyczne  zjawiska 
kwantowe). 

Do  rozwoju  technologii  akustycznych  fal  po- 
wierzchniowych przyczyniło  się  opanowanie  kon- 
strukcji przetworników  elektro-akustycznych  (nadaj- 
ników i odbiorników  fal  powierzchniowych)  dla  du- 
żych częstotliwości. 

W jednym  ze  sposobów  wytwarzania  fal  Rayleigha 
wykorzystuje  się  zjawisko  piezoelektryczne  polegające 
na  tym,  że  w wyniku  działania  pola  elektrycznego  na 
powierzchni  kryształu  piezoelektrycznego  powstają 
naprężenia  mechaniczne.  Pobudza  się  elektrycznie 
powierzchnie  piezoelektryczne  tak,  aby  wytworzyć 
jednocześnie  dwie  składowe  — poprzeczną  i podłuż- 
ną, przesunięte  względem  siebie  w fazie  o 90°  (rys.  3). 
Warunki  takie  można  stworzyć  na  powierzchni  płytki 
piezoelektrycznej  odpowiednio  wyciętej  w stosunku 
do  osi  krystalograficznych,  przykładając  w specjalny 
sposób  pole  elektryczne. 

Odpowiednio  zmienne  odkształcenia  na  powierzch- 
ni piezoelektryka  wytwarza  się  za  pomocą  zmian  pola 
elektrycznego  w układzie  elektrod  (rys.  6)  osadzonych 
na  powierzchni  kryształu  w formie  dwóch  grzebienio- 
wych, wzajemnie  się  przenikających  układów  palcza- 
stych.  Położenie  tych  elektrod  należy  tak  dobrać,  aby 
powstające  na  powierzchni  piezoelektryka  naprężenia 
odpowiadały  kierunkom  tych  modułów  piezoelek- 
trycznych, które  decydują  o sprzężeniu  elektromecha- 
nicznym przy  generacji  fali  powierzchniowej  Ray- 
leigha w odpowiednim  kierunku.  Dla  danego  kryszta- 
łu jest  to  kierunek  ściśle  określony.  Istotne  przy  wy- 
tworzeniu fal  powierzchniowych  są : składowa  E2  pro- 
stopadła do  powierzchni  i składowa  E3  równoległa 
do  powierzchni.  Z rys.  6 widać,  że  maksimum  pola  E2 
pojawia  się  na  samych  palcach  elektrod  grzebienio- 
wych, podczas  gdy  maksimum  pola  E3  — pomiędzy 
nimi.  Ponieważ  kierunki  składowych  pola  elektrycz- 
nego E2  i E3  zmieniają  się  pomiędzy  przyległymi  para- 
mi palców  elektrod,  powstające  składowe  deformacji 
także  się  zmieniają;  przechodzą  na  przemian  od  zgęsz- 
czeń  do  rozrzedzeń  pomiędzy  kolejnymi  parami  pal- 
ców elektrod  i od  poprzecznych  drgań  skrętnych  prze- 
ciwnych do  ruchu  wskazówek  zegara  do  drgań  zgod- 
nych z ruchem  wskazówek  zegara  na  kolejnych  parach 
palców  elektrod. 
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Pewien  dodatkowy  przyczynek  do  procesu  genera- 
cji fal  powierzchniowych  Rayleigha  w materiałach 
ferroelektrycznych  (a  takim  jest  właśnie  LiNb03)  dają 
efekty  elektrostrykcyjne  wynikające  z istniejących  sil- 
nych wewnętrznych  pól  elektrycznych,  spowodowa- 
nych polaryzacją  spontaniczną.  Pola  te  są  modulowa- 
ne przez  przyłożone  pole  elektryczne  i wypadkowe 
naprężenia  są  wynikiem  nałożenia  się  na  siebie  efek- 
tów piezoelektrycznych  i elektrostrykcyjnych.  Zja- 
wisko elektrostrykcyjne  polega  na  objętościowym  od- 
kształceniu dielektryków  w zewnętrznym  polu  elek- 
trycznym; powstające  naprężenia  są  proporcjonalne 
do  kwadratu  natężenia  zewnętrznego  pola  elektrycz- 
nego, podczas  gdy  w zjawisku  piezoelektrycznym  na- 
prężenia są  wprost  proporcjonalne  do  natężenia  pola 
elektrycznego. 

W rozpatrywanym  układzie  generującym  po- 
wierzchniowe fale  Rayleigha  można  uzyskać  rezo- 
nans przy  takiej  częstości,  przy  której  odległość  d (rys. 
6b)  pomiędzy  środkami  przyległych  palców  elektrod 
staje  się  równa  połówce  długości  sprężystej  fali  po- 
wierzchniowej, to  jest  przy: 


gdzie  vr  — prędkość  rozchodzenia  się  fali  Rayleigha. 

W warunkach  rezonansu  składowe  odkształceń  £4 
w kierunku  oznaczonym  w krystalografii  jako  [2  3] 
oraz  e3  w kierunku  (3  3]  rozchodzą  się  jako  fale  po- 
wierzchniowe z prędkością  vr  od  każdego  palca  elek- 
trody w obydwu  kierunkach  i docierają  do  następnych 
przyległych  palców  elektrod  dokładnie  w czasie  po- 
trzebnym na  zmianę  kierunku  pól  elektrycznych  E2 
i E&.  W tych  więc  warunkach  składowe  odkształceń 
propagują  się  w fazie  ze  zmianami  pól  elektrycznych 
i wytwarzają  falę  powierzchniową  w obydwu  kierun- 
kach do  palców  elektrod.  Pozostałe  składowe  defor- 
macji niepożądane  dla  generacji  fal  powierzchniowych 
propagują  się  niezależnie  od  częstości  i stąd  w warun- 


*3 
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b) 

Rys.  6.  Metoda  wytwarzania  fal  Rayleigha  na  powierzchni  ma- 
teriału piezoelektrycznego  (LiNb03)  za  pomocą  elektrod  grze- 
bieniowych (palczastych):  a)  rozkład  naprężeń  (£»  i wartości 
modułów  piezoelektrycznych  (ć/y)  w krysztale  dla  generacji  fal 
Rayleigha  w kierunku  jc3,  b)  rozkład  poła  elektrycznego  na  po- 
wierzchni kryształu  LiNbC>3 


kach  rezonansu  są  znacznie  słabsze,  tym  niemniej  wy- 
raźnie występują. 

W większości  przetworników  powierzchniowych  dla 
fal  Rayleigha  szerokość  elektrod  palczastych  (poje- 
dynczych palców)  jest  rzędu  V4  długości  fali  A.  Gdy 
częstości  są  mniejsze  niż  300  MHz,  długość  fali  dla 
zwykle  stosowanych  materiałów  jest  większa  niż  10  pm 
i elektrody  wykonuje  się  konwencjonalnymi  metoda- 
mi fotoakwaforty  (połączenie  techniki  fotograficz- 
nej z techniką  akwaforty).  Przy  częstościach  wyż- 
szych (przy  1 GHz,  A a 3 pm)  — technika  nakłada- 
nia elektrod  jest  już  specjalna  i odbywa  się  elektro- 
nicznie. 

Za  pomocą  opisanej  metody  można  generować  fale 
Rayleigha  o częstościach  dochodzących  do  2 GHz. 

Fale  powierzchniowe  można  generować  również  wy- 
korzystując zjawisko  magnetostrykcji  na  powierzchni 
materiałów  magnetycznych,  takich  jak  np.  granat  itru 
lub  stosując  cienkie  warstwy  magnetyczne  na  podło- 
żach niemagnetycznych.  (Zjawisko  magnetostrykcji 
polega  na  zmianie  kształtu  i wymiarów  magnetyka 
podczas  magnesowania). 

Fale  Rayleigha  można  także  wytworzyć  w podłożu  przetworniki 
niepiezoelektrycznym  (np.  na  szkle)  pobudzając  po-  cifenkowar- 
lem  elektrycznym  za  pomocą  elektrody  palczastej  stwowe 
(rys.  7)  cienką  warstwę  piezoelektryczną,  napyloną  na 
powierzchnię  podłoża. 


Rys.  7.  Cienko- 
warstwowy piezoele- 
ktryczny przetwornik 
fal  powierzchniowych 
Reyleigha  (wg  J.  de 
Klerka) 


Dzięki  odpowiedniej  konstrukcji  przetworników  generacja  fal 
powierzchniowych  można  generować  fale  Love’a  i fale  Lamba 
Lamba.  Jako  przykład  na  rys.  8 przedstawiony  jest 
układ  do  generacji  warstwowej  symetrycznej  fali 
Lamba.  Palczaste  elektrody  umieszczone  są  we  wnę- 
trzu (w  płaszczyźnie  środkowej)  naparowa nej  war- 
stwy piezoelektrycznej.  Przyłożenie  pola  elektryczne- 
go wywołuje  symetryczne  deformacje  warstwy,  któ- 
rych rozkład  jest  zaznaczony  na  rysunku. 


elektroda  palczasta  , , 4 

. warstwa  piezoelektryczna 


Rys.  8.  Przetwornik  wytwarzający  fale  warstwowe  Lamba 


Jako  jeden  z wielu  możliwych  przykładów  zastoso- 
wań fal  powierzchniowych  do  formowania  sygnałów 
w układach  współczesnej  elektroniki  przedstawiono 
na  rys.  9 filtr  dopasowany  do  sygnału  modulowanego 
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Rys.  9.  Filtr  dopasowany  do  sygnału  modulowanego  częściowo 
wykorzystujący  fale  powierzchniowe:  a)  zasada  konstrukcji  i dzia- 
łania, b)  fotografia  filtru  dopasowanego  do  sygnału  modulowa- 
nego częstościowo  z jednym  przetwornikiem.  Prążki  przedsta- 
wiają pary  elektrod  palczastych  napylonych  na  podłożu  kwarco- 
wym. Filtr  taki  używany  jest  w układach  radarowych.  Skala  jest 
w centymetrach,  c)  odpowiedź  filtru  na  dopasowany  sygnał. 
Skala  2 ps  na  podziałkę 


filtry  częstościowo.  Filtr  taki  działa  na  zasadzie  linii  opóź- 
dyspersyjne  niającej,  za  pomocą  której,  dzięki  odpowiedniemu  za- 
gęszczeniu palców  elektrody  grzebieniowej,  prze- 
kształca się  np.  elektryczny  impuls  prostokątny  (tak 
jak  to  pokazano  na  rys.  9a)  na  modulowany  często- 
ściowo o prawie  stałej  amplitudzie.  Sygnał  elektrycz- 
ny za  pomocą  pierwszego  przetwornika  zostaje  zamie- 
niony na  akustyczną  falę  powierzchniową,  która  bieg- 
nie z prędkością  dźwięku,  to  jest  ok.  105  razy  wolniej 
niż  sygnał  elektryczny  biegnący  z prędkością  światła 
i zostaje  odebrany  przez  przetwornik  drugi,  zamienia- 
jący go  znów  na  sygnał  elektryczny  w postaci  odpo- 
wiednio zmienionej  w procesie  przetwarzania.  Dzięki 
różnym  możliwościom  konstrukcyjnym  za  pomocą 
takich  filtrów  (zwanych  dyspersyjnymi)  można  „obra- 


biać” sygnały  elektryczne  na  wiele  bardzo  przydat- 
nych w praktyce  sposobów,  nieosiągalnych  innymi 
metodami.  Przykładami  zastosowania  takiej  obróbki 
sygnałów  może  być  kompresja  lub  rozszerzenie  impul- 
sów w dziedzinie  czasu  i w dziedzinie  częstości,  jak 
również  konwolucja  czyli  uzyskiwanie  splotu  sygna- 
łów, przekształcanie  impulsów  z jednej  postaci  w dru- 
gą, kodowanie  sygnałów  za  pomocą  impulsów  i wiele 
innych. 

E.  Dieulesaint,  P.  Hartmann  Acoustic  surface  wave  filters , 
Ultrasonics,  11,  24  (1973);  S.  Kaliski  Drgania  i fale  w ciałach 
stałych , Warszawa  1966;  D.  P.  Morgan  Surface  acoustic  wave 
devices  and  applicationst  Ultrasonics  11,  121,  211,  255  (1973); 
A.  Śliwiński,  E.  Ozimek  Akustyka  laboratoryjna , cz.  3,  Warszawa 
1974;  L.  A.  Viktorov  Rayleigh  and  Lamb  W a ves,  New  York 
1967. 


Holografia  akustyczna 

Iwona  Wojciechowska 


Pod  koniec  lat  60-ych  XX  w.  powstała  nowa  metoda 
przestrzennej  wizualizacji  wnętrza  nieprzezroczystych 
dla  światła  obiektów  nazwana  holografią  akustyczną 
(od  greckich  słów  hólos  — 'cały’,  graphó  — 'piszę’, 
oraz  przymiotnika  akustyczny,  określającego  typ  fal 
służących  do  tego  zapisu). 

Podstawowymi  zjawiskami  fizycznymi,  wykorzysty- 
wanymi w tej  metodzie  są,  tak  jak  w holografii 
optycznej  (->  Holografia),  dyfrakcja  i interferencja. 
Zasada  otrzymywania  hologramów  jest  podobna  w 
obu  przypadkach,  z tym  że  zamiast  rozkładu  natęże- 
nia światła  w wyniku  interferencji,  mamy  do  czynienia 
w holografii  akustycznej  z rozkładem  natężenia  fali 
dźwiękowej.  W holografii  akustycznej  fale  akustyczne 
akustyczny  wykorzystywane  są  tylko  w pierwszym  procesie  — 
zapis,  tworzenia  hologramu,  natomiast  odtwarzanie  odbywa 
optyczne  się  za  pomocą  fal  świetlnych.  Hologram  otrzymany 
odtwarzanie  w wyniku  interferencji  dwóch  wiązek  — przedmioto- 
wej i odniesienia  (rys.  1),  zapisany  jest  w ośrodku 
czułym  na  zmiany  amplitudy  lub  natężenia  fali  akus- 
tycznej. Aby  obraz  akustyczny  stał  się  widzialny, 
odtwarzanie  musi  się  odbywać  za  pomocą  fal  świetl- 
nych. Techniczne  rozwiązanie  procesów  rejestracji 
i odtwarzania  w holografii  akustycznej  polega  na  od- 
powiednim wykorzystaniu  i dopasowaniu  zjawisk  od- 
działywania ośrodków  i światła  z falami  akustycznymi. 

Ze  względu  na  możliwości  odtwarzania  wnętrza 
nieprzezroczystych  dla  światła  przedmiotów  oraz 
przedmiotów  w nieprzezroczystych  ośrodkach,  jakie 


daje  holografia  akustyczna,  zastosowanie  jej  w róż- 
nych dziedzinach,  takich  jak  medycyna,  biologia,  geo- 
logia, geofizyka,  oceanologia,  hydrolokacja  itd.,  da- 
wałoby szerokie  możliwości  poznawcze.  Przy  pomocy 
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możliwości  holografii  akustycznej  istnieje  możliwość  badania 
zastosowania  przedmiotów  i struktur  o różnej  wielkości;  zdolność 
rozdzielcza  metody  zależy  bowiem  przede  wszystkim 
od  długości  fali  rejestrującej,  a fale  akustyczne  posia- 
dają długości  od  metrowych  do  mikronowych.  Dłu- 
gość fali  rejestrującej  musi  być  odpowiednio  dobrana 
do  rozmiarów  obiektu  i interesujących  w tym  obiek- 
cie szczegółów.  Im  większy  obiekt  tym  większą  można 
stosować  długość  fali.  Najbardziej  obiecującą  dziedzi- 
ną zastosowania  holografii  akustycznej  jest  diagnosty- 
ka medyczna,  np.  wykrywanie  ognisk  raka  w miękkich 
tkankach  ciała  ludzkiego  nie  osłoniętych  przez  kości. 
Poza  tym  holografia  akustyczna  znajduje  zastosowanie 
w defektoskopii  ultradźwiękowej  umożliwiającej  nie- 
niszczące badania  wewnętrznej  budowy  różnych  ciał. 
Opierając  się  na  zasadach  holografii  konstruuje  się 
specjalne  urządzenia  do  podwodnego  widzenia,  co 
w przyszłości  może  znacznie  zwiększyć  stopień  wy- 
korzystania bogactw  mórz  i oceanów. 

Bardzo  ważne  jest  to,  że  źródła  spójnych  fal  aku- 
stycznych znane  są  i stosowane  od  dawna,  a właśnie 
od  spójności  fali  przedmiotowej  i fali  odniesienia  za- 
leży wierność  odtwarzania  w holografii.  Fale  te  nie 
muszą  nawet  pochodzić  z tych  samych  źródeł,  bo  ge- 
neratory fal  akustycznych  mogą  pracować  niezwykle 
stabilnie.  Jak  widać,  zastosowanie  fal  akustycznych 
w holografii  ma  duże  zalety,  ale  są  też  poważne  trud- 
ności polegające  na  dobraniu  odpowiedniego  ośrodka 
rejestracja  rejestrującego  rozkład  ciśnienia  akustycznego  i układu 
fal  przetwarzającego  obraz  akustyczny  na  optyczny.  Od 
akustycz-  wielu  lat  bada  się  oddziaływania  fal  akustycznych  na 
nych  różne  ośrodki  — znane  są  chemiczne,  mechaniczne 
i elektryczne  zjawiska  zachodzące  w materii  pod  wpły- 
wem fal  dźwiękowych  (szczególnie  ultradźwięko- 
wych). Od  lat  30-ych  XX  w.  bada  się  oddziaływanie 
światła  i ultradźwięków  (-*  Akustyczne  zjawiska 
kwantowe). 

Istnieją  różne  detektory  rozkładów  pola  akustycz- 
nego i można  je  podzielić  w zależności  od  rodzaju 
zjawisk  jakie  wywołują  w ośrodkach  fale  akustyczne. 


Metody  rejestracji  pola  akustycznego 


Metoda 

Czułość 

progowa 

W/mMO-* 

Metody  chemiczne: 
bezpośrednie  oddziaływanie  na 
błonę  fotograficzną 

1-5 

papier  światłoczuły 
w wywoływaczu 

1,0 

Metody  termiczne : 
zmiana  stałej  fosforescencji 

0,05-0,1 

zmiana  fotoemisji 

0,1 

termoczułe  barwniki 

l 

ciekłe  kryształy 

10-10 

Metody  mechaniczne  i optyczne 
deformacja  powierzchni  cieczy 

+ przetwarzanie  światłem  spójnym 

10-3-10-5 

deformacja  powierzchni  ciała  stałego 

10-4 

Metody  elektronowe: 

przetworniki  piezoelektryczne  ułożone  w mo- 
zaikę lub  pojedynczy  śledzący  pole 

10-11 

elektronowe  śledzenie  przetwornika  piezoelek- 
trycznego (np.  kamera  Sokołowa) 

10-T 

Bardzo  ważną  cechą  detektorów  jest  czułość  progowa, 
czyli  minimalne  natężenie  ultradźwięków  potrzebne 
do  rejestracji  obrazu.  Poszczególne  metody  rejestracji 
mają  bardzo  różną  czułość  (tabela).  Jak  wynika 
z tabeli  największą  czułość  wykazują  metody  elektro- 
nowe oraz  przetworniki  akustooptyczne  z ciekłym 
kryształem.  Metody  elektronowe  stosowane  są  obec- 
nie najczęściej.  Trwają  natomiast  prace  nad  prze- 
twornikami ciekłokrystalicznymi,  które  nie  mają 
jeszcze  konstrukcji  technicznej  całkowicie  rozwiązanej. 

Ogólna  zasada  rejestracji  metodami  termicznymi 
termiczne  polega  na  tym,  że  niektóre  substancje  organiczne  są 
metody  bardzo  czułe  na  niewielkie  zmiany  temperatury.  Gdy 
rejestracji  do  ośrodka  wprowadza  się  falę  ultradźwiękową,  to 
na  skutek  pochłaniania  energii  akustycznej  występują 


lokalne  zmiany  temperatury  proporcjonalne  do  natę- 
żenia ultradźwięków.  Wraz  ze  zmianami  temperatury 
zmieniają  się  lokalnie  niektóre  własności  ośrodków, 
jak  np.  zdolność  do  fotoemisji  światła  (zmiana  barwy 
przepuszczalnego  światła  np.  w ciekłych  kryształach 
cholesterycznych). 

Już  wcześniej  stosowane  były  metody  mechaniczne  mechaniczne 
wykorzystujące  fakt,  że  fale  akustyczne  powodują  de-  i optyczne 
formację  powierzchni  cieczy,  wywierając  ciśnienie  na  metody 
tę  powierzchnię.  Schemat  układu  holograficznego  rejestracji 
opartego  na  tym  zjawisku  przedstawia  rys.  2.  Rozkład 
i wysokość  zmarszczek  na  powierzchni  cieczy  odpo- 
wiada rozkładowi  natężenia  I pola  ultradźwiękowego 
wytworzonego  na  skutek  interferencji  wiązki  przed- 
miotowej i wiązki  odniesienia.  Odległość  między 
zmarszczkami  d = /l/2sin0,  a ich  wysokość 


sin! . gdzie 
/.  A 

a jest  długością  fali  świetlnej 
.1  jest  długością  fali  akustycznej 

Rys.  3.  Schemat  wyjaśniający  odtwarzanie  hologramu  akustycz- 
nego w metodzie  deformacji  powierzchni  cieczy 


h = Ic/2n2yPs in20,  gdzie  Ay  X,  c są  długością,  częstotli- 
wością i prędkością  propagacji  fali  akustycznej,  y — 
współczynnik  napięcia  powierzchniowego,  S — kąt 
między  normalną  do  powierzchni  cieczy  a kierunkiem 
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padania  wiązki  przedmiotowej  i odniesienia  (rys.  3). 
Drgająca  i zmodulowana  powierzchnia  cieczy  oświet- 
lana jest  światłem  spójnym,  które  po  ugięciu  na  po- 
wierzchni cieczy  i przejściu  przez  odpowiedni  układ 
optyczny  (rys.  2)  odtwarza  obraz  przedmiotu.  Sprzę- 
żenia układu  optycznego  z monitorem  TV  umożliwia 
osiągnięcie  lepszej  jakości  obrazów  oraz  badania 
w tzw.  czasie  rzeczywistym  (tzn.,  że  odtwarzanie  obra- 
zu odbywa  się  równocześnie  z rejestracją),  co  ma 
ogromne  znaczenie  m.in.  w medycynie, 
elektronowe  Metody  elektronowe  mają  największą  czułość 
^metody  spośród  wszystkich  obecnie  stosowanych  metod  reje- 
rejesf  racji  stracji  i przetwarzania  obrazu  akustycznego.  W tych 
metodach  stosuje  się  jeden  przetwornik  śledzący  roz- 
kład pola  akustycznego  lub  mozaikę  małych  prze- 
tworników elektroakustycznych  (piezoelektrycznych. 


monitor  wzmacniacz 


synchronizacji 


Rys.  4.  Kamera  ultradźwiękowa  Sokołowa:  1 przetwornik  pie- 
zoelektryczny, 2 przedmiot,  3 soczewka  akustyczna,  4 wiązka 
elektronów,  5 powielacz  elektronów,  6 płyta  piezoelektryczna, 
7 układ  formujący  wiązkę  elektronów 


elektrostrykcyjnych  itp.).  Przetworniki  zamieniają 
sygnał  akustyczny  na  elektryczny,  sygnał  elektryczny 
przetwarzany  jest  dalej  na  optyczny.  Jednym  z roz- 
wiązań jest  kamera  Sokołowa  (rys.  4).  Fala  ultra-  kamera 
dźwiękowa  po  przejściu  przez  przedmiot  pada  na  Sokołowa 
płytę  piezoelektryczną,  indukując  na  niej  rozkład 
ładunków,  których  wartości  odpowiadają  rozkładowi 
amplitudy  fali.  Rozkład  ładunków  moduluje  natęże- 
nie śledzącej  wiązki  elektronowej,  zmodulowany  sy- 
gnał elektronowy  po  przejściu  przez  powielacz  prze- 
kazywany jest  na  monitor.  Czułość  większą  od  kamery 
Sokołowa  posiada  układ  mozaikowy  przetworników, 
na  których  napięcia  tworzą  matryce  sygnałów  elek- 
trycznych. Ta  z kolei  przetwarzana  jest  na  matrycę 
sygnałów  optycznych.  Urządzenia  takie  są  bardzo 
złożone  pod  względem  elektronicznym. 

W ciągu  ostatnich  kilku  lat  w holografii  akustycz- 
nej został  dokonany  ogromny  postęp  dzięki  minia- 
turyzacji obwodów  elektronicznych  i jest  nadzieja, 
że  holografia  akustyczna  jako  narzędzie  badawcze 
i diagnostyczne  wkroczy  do  nauki  i techniki  już  za 
kilka  lat.  Na  ii.  166  i 167  (tabl.  43)  przedstawione  są 
obrazy  przedmiotów  otrzymane  z hologramów  aku- 
stycznych. 

W chwili,  gdy  czytelnik  czyta  ten  skrótowy  opis 
i ogląda  wyniki  uzyskiwane  za  pomocą  holografii 
akustycznej,  zapewne  w którymś  z ośrodków  nauko- 
wych powstają  już  znacznie  lepsze  obrazy  od  przed- 
stawionych tutaj.  Postęp  w tej  dziedzinie  jest  bardzo 
duży  i należy  się  spodziewać  szybkiego  udoskonalenia 
metody. 

Akusticzeskaja  gołografija , red.  W.  G.  Prochorowa  (tłum. 
z jęz.  ang.)  Leningrad  1975;  P.  Alajs  Imagerie  et  holographie 
ułtrasonores , Rev.  de  Phys.  Appl. , suppl.  J.  de  Phys.  ,11,559  (1 976) ; 

A.F.  Metherell  i in.  Acoustical  Holography,  New  York  1969. 


Akustyczne  zjawiska  kwantowe 


akustyka  Akustyka  kwantowa  jest  bardzo  młodym  działem 
kwantowa  akustyki.  Chociaż  idea  kwantowego  przedstawienia 
energii  fali  akustycznej  jest  dosyć  dawna,  sięga  lat 
trzydziestych  (wprowadzenie  pojęcia  fononu  przez 
J.  Frenkla  w 1932  r.),  to  dopiero  od  mniej  więcej 
15  lat  stanowi  ona  wydzieloną  jednoznacznie  dziedzi- 
nę. Zdecydowały  o tym  odkrycia  bezpośrednich  od- 
działywań akustoelektronowych  (foton-elektron) 
i akustomagnetycznych  (fonon-spin,  zjawiska  aku- 
stycznego rezonansu  magnetycznego),  których  wy- 
jaśnienie wymagało  posłużenia  się  opisem  mechaniki 
kwantowej.  Okazało  się,  że  język  kwantowy  konieczny 
jest  do  opisu  rozchodzenia  się  zaburzeń  sprężystych 
w ciekłym  helu  (akustyczne  procesy  molekularne), 
a później  w wielu  innych  procesach,  jak  np.  oddziały- 
wanie fonon-foton  czy  fonon-fonon.  Oddziaływania 
te  są  przyczyną  powstawania  akustycznych  procesów 
nieliniowych  (-►  Przedmiot  i zakres  akustyki). 

Opis  kwantowy  jest  szczególnie  przydatny  do  wy- 
jaśnienia mechanizmu  rozchodzenia  się  fal  spręży- 
stych w ciałach  stałych  (->  Dynamika  sieci  krystalicz- 
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nej).  W modelu  klasycznym  ciała  stałego  węzły  sieci 
(atomy)  są  traktowane  jako  oscylatory  sprzężone 
(można  je  sobie  wyobrazić  jako  drgające  kulki  połą- 
czone sprężynami;  rys.  1,  między  którymi  energia 
przekazywana  jest  w sposób  ciągły.  Model  ten  jednak 
okazał  się  niewystarczający,  gdyż  w wielu  procesach 
(o  których  wspomniano  wyżej),  szczególnie  w niższych 
temperaturach,  energia  przekazywana  oscylatorom 
ma  charakter  kwantowy,  czyli  odpowiada  określonym 
kwantom  (porcjom)  energii  sprężystej. 

W modelu  kwantowym  ciała  stałego  poszczególne 
oscylatory  klasyczne  zastępuje  się  kwantowymi,  tj. 
takimi,  które  mogą  być  wzbudzone  przez  dostarczone 
im  kwanty  energii.  Obrazem  sieci  krystalicznej  z drga- 
jącymi atomami  jest  zbiór  takich  indywidualnych 
oscylatorów,  w którym  ich  poszczególne  stany  wzbu- 
dzone są  sobie  wzajemnie  przekazywane  jako  stru- 
mień kwantów  energii  (fononów).  Zbiór  tych  kwan- 
tów, poruszających  się  swobodnie  .w  sieci  krystalicz- 
nej, stanowi  tzw.  gaz  fononowy  (analogia  do  gazu 
elektronowego  w przewodnikach). 

Leżące  u podstaw  akustyki  kwantowej  pojęcie  fo-  fonon  — 
nonu  jako  kwantu  energii  fali  sprężystej  jest  analo-  kwant 
giczne  do  pojęcia  fotonu  jako  kwantu  energii  fali  energii 
elektromagnetycznej.  Jednak  foton  uważa  się  za  sprężystej 
cząstkę  elementarną  swobodną,  natomiast  fonon  jest 
tzw.  kwazicząstką,  czyli  przedstawia  wzbudzenie  ele- 
mentarne ściśle  związane  z układem  wielu  cząstek 
(np.  węzłów  sieci  krystalicznej,  zderzających  się  czą- 
steczek cieczy  czy  gazu).  Kwazicząstkę  można  tylko 
w przybliżeniu  traktować  jako  swobodną. 

Fononowi,  podobnie  jak  fotonowi,  przypisuje  się 
energię  E = hv , gdzie  h — stała  Plancka,  v — częstość 
drgań,  przy  czym  oba  te  rodzaje  cząstek  mają  spin 
całkowity  i podlegają  statystyce  Bosego-Einsteina. 


Jest  jednak  istotna  różnica,  polegająca  na  tym,  że  fo- 
tony mają  dwie  wartości  własne  spinu  odpowiadające 
dwom  stanom  polaryzacji  (skrętność  ±1),  natomiast 
spin  fononów  może  przybierać  wartości  —1,0,  -f  1 , 
co  odpowiada  dwom  sposobom  drgań  poprzecznych 

0 dwóch  stanach  polaryzacji  (skrętność  ±1)  oraz 
drganiom  podłużnym  (polaryzacja  0). 

Fononowi  przypisuje  się  także  pęd,  który  może  być 
określony  ściśle  jedynie  dla  węzłów  sieci  krystalicz- 
nej, a traci  sens  fizyczny  dla  „pustych”  przestrzeni 
między  węzłami  sieci.  Dlatego  traktując  fonon  jako 
swobodny,  mówimy  o kwazipędzie  fononu, 
fala  Rozchodzącą  się  falę  akustyczną  w modelu  kwan- 
akustyczna  towym  przedstawiamy  jako  strumień  fononów,  stąd 
— strumień  więc  gęstość  energii  fali  E wyrazić  można:  E = Nhv — 
fononów  _ a następnie  natężenie  fali  J — Ec  = Nhcocy 

gdzie  N — liczba  fononów  w jednostce  objętości, 
h — hf2n , co  — częstość  kołowa,  c — prędkość  rozcho- 
dzenia się  dźwięku. 

Akustyczne  efekty  kwantowe  występują  wyraźnie 
w wielu  oddziaływaniach,  jeżeli  energia  fononów  jest 
porównywalna  z energią  innych  kwantów,  przekazy- 
wanych np.  przez  elektrony,  magnony,  fotony  czy 
neutrony  w procesach  zderzeń. 

W oddziaływaniach  fonon-fonon  oddziaływanie 
jest  silniejsze,  gdy  długość  fali  akustycznej  staje  się 
porównywalna  z odległością  między  węzłami  sieci. 
Warunki  takie  zachodzą  przy  bardzo  wysokich  czę- 
stościach, rzędu  gigaherców  (GHz,  powyżej  10D  Hz), 
tj.  w zakresie  hiperdźwiękowym. 

Właściwe  rozumienie  procesów  oddziaływań  fal 
akustycznych  (zwłaszcza  wysokich  częstości)  z innymi 
mikroskopowymi  obiektami  fizycznymi  na  podstawie 
akustyki  kwantowej  umożliwiło  wykorzystanie  tych 
oddziaływań.  Na  przykład  oddziaływania  fonon-ele- 
ktron  wykorzystuje  się  w akustoelektronice  do  bez- 
pośredniego wzmacniania  ultradźwięków,  oddziały- 
wania fonon-foton  w układach  pamięciowych,  liniach 
opóźniających  (-*  Akustyczne  fale  powierzchniowe 

1 ich  zastosowanie),  faserach  kwantowych. 


Oddziaływania  fonon-elektron 

Antoni  Śliwiński 

Wzajemne  oddziaływania  fali  sprężystej  z polem  elek- 
trycznym zachodzą  głównie  w ośrodkach  posiadają- 
cych własności  piezoelektryczne.  Tego  rodzaju  włas- 
własności  ności  wykazują  kryształy  nie  mające  środka  symetrii 
piezo-  (należące  do  niecentrosymetrycznych  klas  krystalo- 
etektryczne  graficznych),  lecz  posiadające  oś  biegunową,  zwaną 
osią  piezoelektryczną.  W takich  kryształach  może  za- 
chodzić zjawisko  piezoelektryczne  polegające  na  tym, 
że  deformacje  mechaniczne,  zwłaszcza  wywołane 
wzdłuż  osi  biegunowej,  powodują  powstawanie  wol- 
nych ładunków  elektrycznych  polaryzujących  krysz- 
tał. Jest  to  tzw.  proste  zjawisko  piezoelektrycz- 
ne — w odróżnieniu  od  odwrotnego  zjawiska  piezo- 
elektrycznego, polegającego  na  wystąpieniu  defor- 
macji kryształu  pod  wpływem  zewnętrznego  pola 
elektrycznego  przyłożonego  wzdłuż  osi  biegunowej. 
Zjawisko  piezoelektryczności  jest  liniowe  i charak- 
teryzują je  moduły  piezoelektryczne,  które  są  okreś- 
lone jako  współczynniki  proporcjonalności  pomiędzy 
odkształceniem  a powstałym  natężeniem  pola  elek- 
trycznego. 

Fala  ultradźwiękowa  rozchodząca  się  w krysztale 
piezoelektrycznym  w kierunku,  w którym  moduł  pie- 
zoelektryczny jest  różny  od  zera,  powoduje  powsta- 
wanie wewnętrznych  zmiennych  pól  elektrycznych. 
Jeżeli  materiał  piezoelektryczny  jest  jednocześnie 
przewodnikiem  lub  półprzewodnikiem  elektrycznym, 
to  istniejące  w nim  swobodne  nośniki  ładunku  (np. 
elektrony  lub  dziury)  podlegają  silnemu  działaniu 
tych  zmiennych  pól  elektrycznych  (rys.  2). 

W dobrym  przewodniku  nośniki  ładunku  reagują 


na  działanie  pól  piezoelektrycznych  natychmiast  i zu- 
pełnie je  kompensują.  Warunki  takie  zachodzą  wów- 
czas, gdy  co*  > co , gdzie  co  — częstość  zmian  pola 
piezoelektrycznego  (równa  częstości  fali  ultradźwię- 
kowej), a co*  = oje , gdzie  cr  — współczynnik  przewód - 


Rys.  2.  Poglądowe  przedstawienie  mechanizmu  oddziaływania 
fali  sprężystej  z nośnikami  ładunku  w piezoelektryku:  a)  przy 
braku  sprzężenia,  b)  przy  silnym  sprzężeniu  i małej  prędkości 
vd  dryfu  nośników  w polu  elektrycznym,  c)  przy  silnym  sprzę- 
żeniu i prędkości  va  dryfu  nośników  równej  prędkości  fali  sprę- 
żystej c,  d)  przy  silnym  sprzężeniu  i prędkości  Vd  dryfu  nośników 
większej  od  prędkości  fali  sprężystej  c 


nictwa  elektrycznego,  e — przenikalność  elektryczna 
materiału;  można  wtedy  oczywiście  powiedzieć,  że 
materiał  jest  efektywnie  niepiezoelektryczny.  Jeżeli 
jednak  w piezoelektrycznym  materiale  przewodzą- 
cym będzie  spełniony  warunek : co*  < co,  to  reakcja 
nośników  ładunku  na  zmienne  pole  piezoelektryczne 
będzie  znacznie  wolniejsza.  Taki  stan  rzeczy  bywa 
często  w piezoelektrycznych  półprzewodnikach  (typu 
GdS,  ZnS)  w zakresie  wyższych  częstości  ultradźwię- 
kowych. Wtedy  pomiędzy  falą  ultradźwiękową  (stru- 
mieniem fononów)  a nośnikami  ładunków  występuje 
bardzo  silne  sprzężenie.  Jeśli  tymi  nośnikami  są  elek- 
trony, to  mają  one  tendencję  do  gromadzenia  się 
w miejscach,  gdzie  potencjał  elektryczny  pola  posiada 
minimum  i dzięki  temu  fala  sprężysta  może  pociągnąć 
je  za  sobą  (rys.  2b).  Jeżeli  próbkę  umieści  się  w sta- 
łym polu  elektrycznym  o kierunku  zgodnym  z kie- 
runkiem rozchodzenia  się  fali  sprężystej,  to  elektrony 
zaczną  dryfować  w tym  polu  i zmieni  się  sprzężenie 
pomiędzy  nimi  a falą  sprężystą.  W ten  sposób  ze- 
wnętrzne pole  elektryczne  pomaga  nośnikom  podążać 
za  falą,  przez  co  biegnąca  fala  ulega  mniejszemu  tłu- 
mieniu — traci  mniej  energii  na  oddziaływania  z elek- 
tronami (rys.  2c).  Inaczej  można  powiedzieć,  że 
energia  pola  zewnętrznego  za  pośrednictwem  nośni- 
ków ładunku  zostaje  przekazana  fali  akustycznej.  Przy 
odpowiednio  dużej  wartości  zewnętrznego  pola  elek- 
trycznego może  nastąpić  nie  tylko  skompensowanie 
tłumienia,  ale  nawet  wzmocnienie  biegnącej  fali  ultra- 
dźwiękowej kosztem  energii  zewnętrznego  pola  elek- 
trycznego (rys.  2d). 

Oddziaływanie  fali  ultradźwiękowej  z elektronami 
(lub  z innymi  nośnikami  ładunku)  możemy  rozpatry- 
wać jako  proces  zderzeń  fononów  i elektronów  (lub 
innych  nośników  ładunku).  Rozpatrzmy  najpierw 
sytuację,  w której  ośrodek  jest  półprzewodnikiem  i nie 
ma  zewnętrznego  pola  elektrycznego.  Zderzenia  są 
niesprężyste,  co  oznacza,  że  przy  zderzeniu  cała  ener- 
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współczynnik  gia  fononu  zostaje  przekazana  elektronowi.  Z zasady 
tłumienia  zachowania  pędu  można  obliczyć  zmiany  prędkości 
elektronów  wynikłe  ze  zderzeń  z fononami;  są  one 
równoznaczne  z pojawieniem  się  w półprzewodniku 
dodatkowego  prądu,  zwanego  akustoelektrycznym. 
Ubytek  energii  fononów  zużytych  na  wytworzenie 
tego  prądu  objawia  się  jako  tłumienie  biegnącej  fali 
sprężystej,  co  można  scharakteryzować  za  pomocą 
współczynnika  tłumienia  a. 

Jeżeli  z kolei  rozpatrzymy  sytuację,  w której  zostało 
przyłożone  pole  elektryczne  E o kierunku  zgodnym 
z biegiem  fali,  to  stwierdzimy,  że  na  swobodne  elek- 
trony w półprzewodniku  działa  dodatkowa  siła,  która 
je  wprawia  w ruch  (dryfowanie)  z prędkością  propor- 
cjonalną do  natężenia  pola  w kierunku  jego  działania 
i wynoszącą: 

Vd  = i*Ey 


gdzie  /i  jest  ruchliwością  elektronów,  przy  czym 
fx  = (< e/m)rt  gdzie  e — ładunek  elektronu,  m — masa 
elektronu,  r — średni  czas  życia  elektronów  między 
zderzeniami. 

Współczynnik  tłumienia  fali  sprężystej  w obecności 
pola  a*:  ma  inną  wartość  niż  bez  pola.  Zależność  tłu- 
mienia fali  ultradźwiękowej  od  pola  elektrycznego 
w procesie  oddziaływań  fonon-elektron  opisuje 
wzór: 

a e = a(ł  —Vd!c\ 

gdzie  c jest  prędkością  fali  ultradźwiękowej  w półprze- 
wodniku. Z tego  wzoru  wynika,  że  współczynnik  tłu- 
mienia w obecności  pola  elektrycznego  <xe  może  być: 

dodatni  <xe  > 0,  gdy  v a < c,  (rys.  Ib) 

równy  zeru  oce  = 0,  gdy  va  = c,  (rys.  lc) 

ujemny  <xe  < 0,  gdy  va  > c.  (rys.  Id) 

wzmocnienie  W tym  ostatnim  przypadku  ujemny  współczynnik 
fali  tłumienia  oznacza  wzmocnienie  fali  sprężystej  kosz- 
sprężystej  tern  energii  zewnętrznego  pola  elektrycznego.  Aby 
wzmocnienie  nastąpiło,  pole  musi  przekroczyć  pewną 
wartość  krytyczną  E = Ek  odpowiadającą  va  = c, 
żeby  prędkość  dryfu  elektronów  przekroczyła  pręd- 
kość fononów  c.  Na  rys.  3 podany  jest  wykres  zależ- 
ności (xe  od  y — 1 — iydjć). 


Rys.  3.  Zależność  współczynnika  tłumienia  ultradźwięków  cce 
od  wartości  dryfowania  y 


Pierwsze  doświadczenia,  w których  uzyskano  bez- 
pośrednio wzmocnienie  fal  ultradźwiękowych  na  wy- 
żej opisanej  zasadzie,  przeprowadzili  w 1961  r. 
A.  R.  Hutson,  J.  H.  McFee  i D.  L.  White  w krysztale 
siarczku  kadmu  (CdS).  Ich  układ  pomiarowy  przed- 
stawia rys.  4. 

Przetworzony  przez  przetwornik  7,  sygnał  ultra- 
dźwiękowy, którego  amplitudę  można  regulować 
potencjometrem  decybelowym  (attenuatorem  /4J, 
przechodzi  przez  pręt  buforowy  do  kryształu  CdS. 
Sygnał  jest  odbierany  przez  przetwornik  72,  przy 
czym  jego  wzmocnienie  można  również  regulować, 
attenuatorem  A2.  Na  powierzchniach  kryształu  CdS 
znajdują  się  elektrody,  pozwalające  na  przykładanie 
zewnętrznego  pola  elektrycznego  £.  Kryształ  CdS 
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Rys.  4.  Schemat  układu  do  obserwacji  wzmocnienia  fal  ultradźwię- 
kowych w CdS  zastosowany  przez  A.  R.  Hutsona,  J.  H.  McFee 
i D.  L.  White ’a 

jest  fotoczuły,  co  można  dodatkowo  wykorzystać  do 
regulacji  stężenia  nośników  ładunku  w krysztale  oś- 
wietlając go  światłem  o różnym  natężeniu.  Można 
więc  regulować  współczynnik  przewodnictwa  a. 

Na  rys.  5 podana  jest  zależność  (uzyskana  przez  przykład  — 
wyżej  wspomnianych  autorów)  względnego  osłabienia  absorpcja 
poziomu  amplitudy  sygnału  (w  dB),  który  przeszedł  w CdS 
przez  próbkę  CdS,  od  przyłożonego  pola  elektrycz- 
nego E (pola  powodującego  dryf  elektronów).  Po- 
ziomem odniesienia  krzywych  przedstawionych  na 
rysunku  są  wartości,  jakie  się  uzyskuje  dla  kryształu 
nie  oświetlonego  (gdy  coa  = cr/e  = 0).  Widać,  że  gdy 
E < 700  V/cm,  absorpcja  jest  dodatnia  i wzrasta  ze 
wzrostem  pola  do  momentu,  w którym  prędkość 
dryfu  elektronów  v<t  staje  się  porównywalna  z pręd- 
kością fali  ultradźwiękowej  ( E & 700  V/cm).  Wtedy 
absorpcja  maleje,  staje  się  równa  zeru  i zmienia  znak 
na  przeciwny.  Gdy  E > 700  V/cm,  absorpcja  jest 
ujemna,  czyli  fala  ultradźwiękowa  ulega  wzmocnieniu. 

Na  rys.  6 jest  zapis  sygnału,  jaki  można  uzyskać 
w układzie  z rys.  4 po  stronie  odbiorczej,  gdy  w nie- 
obecności fali  ultradźwiękowej  przyłoży  się  krótko- 
trwały impuls  pola  elektrycznego  E > Ek.  W rezul- 
tacie oddziaływania  elektronów  z fononami  termicz- 
nymi powstanie  strumień  fononów  (koherentnych), 
które  tworzą  hiperdźwiękową  falę  sprężystą. 


A BiC 


Rys.  5.  Zależność  absorpcji  fal  ultradźwiękowych  (osłabienie  po- 
ziomu amplitudy  sygnaiu  w dB  względem  wartości  odpowiada- 
jącej próbce  nieoświetlonej)  w CdS  od  natężenia  pola  dryfują- 
cego: krzywa  A dla  da}(o  = 1,2  i częstości  15  MHz,  krzywa  B 
dla  o>oI<d  = 0,24  i częstości  45  MHz,  krzywa  C dla  dolca  = 0.21 
i częstości  45  MHz 


Rys.  6.  Powstanie  spontanicznego  impulsu  akustycznego  w CdS 
po  przyłożeniu  impulsu  pola  elektrycznego  przekraczającego  war- 
tość progową;  górny  przebieg  — impuls  pola,  dolny  przebieg  — 
sygnał  odebrany  przez  przetwornik  o częstotliwości  własnej 
15  MHz  (przebiegi  zaobserwowano  na  ekranie  oscyloskopu) 


Zjawiska  oddziaływania  fonon-elektron  stały  się 
od  kilkunastu  lat  przedmiotem  wielu  badań  i zasto- 
sowań w układach  akustoełektronicznych  o wzmoc- 
nieniu bezpośrednim  (— ► Akustyczne  fale  powierzch- 
niowe i ich  zastosowanie).  Badania  są  szeroko  rozwi- 
jane również  w Polsce,  gdzie  zostały  opracowane 
teoretycznie  i skonstruowane  urządzenia  nazwane 
faserami.  Wcześniej  były  skonstruowane  masery,  w 
których  zostało  wykorzystane  zarówno  zjawisko 
akustomagnetyczne,  jak  i oddziaływanie  fonon- 
elektron. 


Oddziaływania  fonon-fonon 

Antoni  Śliwiński 

Zjawisko  wzajemnego  oddziaływania  dwóch  fal  aku- 
stycznych (dwóch  wiązek  fononów)  nie  występuje 
przy  akustycznych  zjawiskach  liniowych,  przy  któ- 
rych obowiązuje  zasada  superpozycji;  przenikające 
przez  siebie  fale  nie  wytwarzają  żadnego  dodatkowe- 
go zaburzenia,  które  by  wychodziło  poza  obszar 
wzajemnego  przenikania  (w  tym  obszarze  może  za- 
chodzić interferencja;  rys.  7a).  Do  oddziaływania 
powstawanie  dochodzi  przy  zjawiskach  nieliniowych,  gdy  się  spo- 
fal  rozpro-  tykają  fale  o odpowiednio  dużej  amplitudzie.  Wtedy 
szonych  w wyniku  oddziaływania  pojawiają  się  fale  rozpro- 
szone (rys.  7b),  ich  częstości  są  sumą  lub  różnicą 
częstości  fal  pierwotnych,  które  się  spotykały.  Od- 


Rys.  7.  Poglądowe  przedstawienie  oddziaływania  fonon-fonon, 
czyli  rozproszenia  dźwięku  na  dźwięku:  a)  przenikanie  bez  wza- 
jemnego oddziaływania,  b)  przenikanie  i wzajemne  oddziały- 
wanie — powstaje  fala  rozproszona 


działywanie  jest  tym  silniejsze,  im  większa  jest  energia, 
a więc  im  wyższa  częstość  spotykających  się  fal  sprę- 
żystych. Przy  wyższej  energii  mogą  powstawać  także 
wyższe  harmoniczne  takich  fal  kombinacyjnych. 

W akustyce  kwantowej  energię  fali  akustycznej 
wyrażamy  jako  sumę  energii  fononów,  zatem  wymie- 
nione wyżej  procesy  możemy  rozważać  jako  wiele 
aktów  elementarnych  zderzeń  (rozproszeń)  fononów 


jednej  fali  z fononami  drugiej  fali.  Schematycznie  od- 
działywania fonon-fonon  można  przedstawić  jak  na 
rys.  8.  W zależności  od  warunków,  w których  następuje 
swobodne  zderzenie  fononów,  są  dwie  możliwości: 
albo  nowy  fonon,  który  powstaje,  będzie  miał  energię 
równą  energii  fononów  przed  zderzeniem,  albo  równą 
różnicy  ich  energii.  W procesie  oddziaływania  musi 
być  spełniona  nie  tylko  zasada  zachowania  energii, 
ale  również  zasada  zachowania  pędu  (pęd  fononu 

p = hq , gdzie  wektor  falowy  \q\  — 2k/A , A — długość 

fali,  h = hjln,  h — stała  Plancka,  p nie  jest  pędem 
w ścisłym  sensie,  ale  tzw.  pseudopędem  lub  kwazi- 
pędem,  bo  określony  jest  jedynie  z dokładnością  do 
wektora  sieci  odwrotnej  pomnożonego  przez  h.  Fono- 
ny swobodne  traktujemy  jak  cząstki  prawdziwe,  cho- 
ciaż są  to  kwazicząstki,  a więc  związane  z określo- 
nym układem  — zdefiniowane  jako  wzbudzenia  drgań 
węzłów  sieci  krystalicznej).  Spełnienie  zasad  zachowa- 
nia wymaga,  aby: 

hvx+hvt  = hv3  (zasada  zachowania  energii) 
oraz  — — — 

hqiJrhqz  — hqz (zasada  zachowania  pędu),  (1) 

gdzie  gu  q2,  qz  są  wektorami  falowymi  odpowiednich 
fononów.  Powstający  w wyniku  oddziaływania  fonon 
będzie  miał  ściśle  określony  kierunek.  W odniesieniu 
do  tych  dwu  przykładów  pokazanych  na  rys.  8 można 
powiedzieć,  że  w pierwszym  nastąpiło  zwiększenie 
energii  pierwszego  fononu  o energię  drugiego  (wzmoc- 
nienie fali),  natomiast  w drugim  — zmniejszenie 
energii  pierwszego  fononu  o energię  drugiego  (absor- 
pcja, a w następstwie  tłumienie  fali).  Opisany  tu 
proces  oddziaływania  fonon-fonon  nazywa  się  pro- 
cesem normalnym  (procesem  N)  lub  trójfononowym 


Rys.  8.  Oddziaływanie  fonon-fonon:  a)  fonon  rozproszony  zwięk- 
szył energię,  b)  fonon  rozproszony  zmniejszył  energię 


W sieci  krystalicznej  ciała  stałego  proces  oddzia- 
ływania fonon-fonon  wymaga  przy  powstaniu  nowe- 
go fononu  uwzględnienia  — w myśl  zasady  zachowa- 
nia pędu  — rekacji  kryształu  (odrzutu  przy  wypro- 
mieniowaniu  fononu),  wobec  czego  trzeba  napisać: 

hq1Ą-hq1  = hq^+hG,  gdzie  hG  oznacza  pęd  krysz- 
tału jako  całości;  jest  to  proces  czterofononowy 
zwany  procesem  U (niem.  Umklapp  ‘nakładanie',  co 
w tym  wypadku  odnosi  się  do  dodania,  dołożenia 

pędu  hG).  Spełnienie  zasady  zachowania  pędu  wy- 
maga, aby  wypadkowy  pęd  hq+hG  nie  wychodził 
poza  pierwszą  strefę  Brillouina,  tj.  poza  ten  obszar 
w przestrzeni  wektora  falowego,  w którym  energia 
zmienia  się  w sposób  kwasi-ciągły  (na  granicach  tej 
strefy  zmienia  się  ona  skokowo).  Strefa  Brillouina 
wiąże  się  ściśle  z odstępami  atomowymi  w sieci  kry- 
stalicznej i określona  jest  przez  składowe  wektora  G, 
Które  np.  w wypadku  struktury  regularnej  wynoszą: 

Gx  = ± — , Gy  = ± — , Gz  = ± — , gdzieś  — stała 
a a a 

sieci  (-*  Wzbudzenia  elementarne  w ciałach  stałych). 

Jeżeli  wiązka  fal  sprężystych  pochodzi  z jednego 
źródła,  to  zwykle  stanowi  zbiór  fononów  koherent- 
nych (jest  spójna).  Przykładem  niespójnej  wiązki  fo- 
nonów jest  strumień  ciepła  (zbiór  fononów  termicz- 
nych, zwanych  też  debayowskimi). 

Efekty  rozpraszania  ultradźwięków  na  ultradźwię- 
kach (fononów  koherentnych  na  fononach  koherent- 
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rozpraszanie  nych)  w ciele  stałym  zaobserwowali  Su-Fen,  L.  K.  Za- 
fononów  rembo  i W.  A.  Krasilnikow  w 1962  r.,  badając  po- 
koherentnych  wstawanie  fali  rozproszonej  o częstości  sumacyjnej. 

na  fononach  Rysunek  9 przedstawia  blokowy  schemat  doświad- 
koherentnych  czenia.  Dwa  nadajniki  ultradźwiękowe  Tx  i T2  pobu- 
dzane do  drgań  z generatorów  Gx  i Gz  promieniują 
fale  ultradźwiękowe  o częstościach  vx  i v2,  które  się 
przenikają  w walcowym  bloku  ciała  stałego  (alumi- 
nium) pod  kątem  a.  Rozproszoną  pod  kątem  y falę 
o częstości  kombinacyjnej  rejestruje  rezonansowy 
odbiornik  R.  Odebrany  sygnał  elektryczny  — po 
przejściu  przez  filtry  Fx  i F2  i rezonansowy  wzmac- 
niacz W — rejestruje  się  na  oscylografie,  którego 
podstawa  czasu  jest  zsynchronizowana  za  pomocą 
modulatora  M,  sterującego  również  generator  Gx. 
Jeżeli  generatory  Gx  i G2  pracują  impulsowo,  trzeba 
zagwarantować  takie  warunki,  aby  wysłane  impulsy 
spotkały  się  ze  sobą.  Wygodniej  jest  więc  pracować 
z jedną  falą  ciągłą  (jak  to  zaznaczono  na  rys.  9), 


Rys.  9.  Schemat  układu  do  obserwacji  rozproszenia  dźwięku  na 
dźwięku.  C,  i C2  generatory  drgań,  7\  i T2  nadajniki  ultradźwię- 
ków, Vt  i V3  mierniki  napięcia,  Rx,  Rt  i R rezonansowe  odbiorni- 
ki Fx  i F2  filtry,  W wzmacniacz,  O oscylograf,  M modulator 

a drugą  impulsową.  Sygnał  rozproszony  będzie  też 
impulsowy.  Do  bloku  aluminiowego  wprowadzono 
dwie  fale  poprzeczne  T(v)  o równych  częstościach 
i w wyniku  ich  oddziaływania  odebrano  jako  falę 
rozproszoną  falę  podłużną  L( 2v)  o częstości  dwu- 
krotnie wyższej,  zgodnie  ze  schematem: 

T(v)+T(v)  L(2v),  (2) 

odpowiadającym  procesowi  trój  fononowemu  okre- 
ślonemu równaniami  (1).  Na  oscylogramie  (rys.  10) 
widać  kolejne  impulsy  sygnałów  fali  rozproszonej. 

Na  podstawie  zjawisk  oddziaływania  fonon-fonon, 
szczególnie  w teorii  ciała  stałego,  wyjaśnia  się  wiele 
zjawisk  fizycznych  — jak  rozszerzalność  cieplna, 
oporność  termiczna  sieci,  utrzymywanie  się  równo- 
wagi termicznej  — przy  czym  jest  to  możliwe  tylko 
wtedy,  gdy  fale  sprężyste  (fonony  termiczne)  wytwa- 
rzane przez  drgania  sieci  zachowują  się  nieliniowo, 
anharmonicz-  Cecha  ta  nazywa  sfę  anharmonicznością  sieci  i może 
ność  sieci  być  wyrażona  przez  zależność  prędkości  dźwięku  od 
naprężeń,  co  jest  równoważne  z zależnością  częstości 

drgań  fononu  ą o danej  polaryzacji  (sposobie  drgań) 
od  naprężeń  (-*■  Wzbudzenia  elementarne  w ciałach 
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Rys.  10.  Oscylogramy  drugiej  harmonicznej  powstałej  w wyniku 
rozproszenia  impulsu  poprzecznej  fali  ultradźwiękowej  o czę- 
stości 3 M Hz  na  ciągłej  fali  ultradźwiękowej  o takiej  samej  czę- 
stości zgodnie  z relacją  (2).  kolejne  impulsy  fali  roz- 

proszonej, M sygnał  odniesienia 

stałych).  Mówiąc  bardziej  obrazowo,  im  wyższa  tem- 
peratura, tym  bardziej  wzrasta  amplituda  drgań  sieci, 
a przy  dużej  amplitudzie  drgania  przestają  być  har- 
moniczne i przechodzą  w anharmoniczne,  czyli  takie, 
w których  siły  działające  przestają  być  wprost  pro- 
porcjonalne do  wychylenia,  a zależą  od  wyższych  jego 
potęg  (są  to  akustyczne  zjawiska  nieliniowe). 

Anharmoniczne  oddziaływania  pomiędzy  fononami  rozpraszanie 
w ciałach  stałych  powodują  pochłanianie  fal  ultra-  fali  ultra- 
dźwiękowych (rozpraszanie  fononów  fali  ultradźwię-  dźwiękowej 
kowej  — koherentnych,  na  fononach  termicznych  — na  fononach 
niekoherentnych)  we  wszystkich  ciałach  stałych,  termicznych 
a szczególnie  w izolatorach,  gdzie  nie  ma  absorpcji 
pochodzącej  od  swobodnych  elektronów,  czyli  od- 
działywania fonon-elektron. 

Rysunek  1 1 przedstawia  typowy  wykres  tłumienia 
fali  ultradźwiękowej  w zależności  od  temperatury, 
tłumienia  spowodowanego  rozproszeniem  na  fono- 
nach termicznych  w ciele  stałym.  Mechanizm  roz- 
praszania fali  ultradźwiękowej  na  fononach  termicz- 
nych zależy  od  stosunku  ich  średniej  drogi  swobod- 
nej do  długości  fali  ultradźwiękowej.  Gdy  droga  swo- 
bodna / fononu  jest  mała  w porównaniu  z długością 
fali,  / X (rys.  12a),  a vxt  <ś  1,  to  na  fonony  wpły- 


Rys.  11.  Zależność  tłumienia  ultradźwięków  o częstości  rzędu 
GHz  w rubinie  (A!2Os)  od  temperatury.  Obszar  A — efekt  roz- 
proszenia na  fononach  termicznych  jest  do  pominięcia;  obszar 
B — tłumienie  rośnie  jak  T9;  obszar  C — tłumienie  prawie  nie 
zależy  od  temperatury,  TXr  T2  fale  poprzeczne,  L fala  podłużna 


wa  tylko  niewielki  gradient  naprężenia  spowodowany 
falą  ultradźwiękową.  I odwrotnie,  gdy  / < 2 (rys.  12b), 
vxt  > 1,  należy  wyobrazić  sobie  falę  ultradźwiękową 
jako  strumień  fononów,  które  biegną  razem  z fono- 
nami termicznymi,  przy  czym  jedyne  oddziaływanie 
polega  na  zderzeniach.  Średnia  droga  swobodna 
fononów  określona  przez  zderzenia  fonon-fonon  jest 
bardzo  silnie  malejącą  funkcją  temperatury  przy 
niskich  temperaturach. 


a) 


b) 


Kys.  12.  Stosunki  pomiędzy  drogą  swobodną  fononu  termicznego 
1 i długością  fali  ultradźwiękowej  A,  która  ulega  tłumieniu: 
a)  ł « A,  b)  / > A,  c)  / = A 


Istnieje  taki  obszar  temperatur,  gdzie  / x X (rys. 
12c),  a vrt  X 1,  i wtedy  oddziaływania  stają  się  bar- 
dzo silne,  zderzenia  bardzo  częste,  przy  czym  procesy 
zderzeń  mają  charakter  relaksacyjny. 

Obszar  vrt  <ś  1 nazywamy  albo  obszarem  termo- 
elastycznym,  albo  obszarem  Akhiesera,  albo  obszarem 
lepkości  fononowej,  natomiast  obszar,  gdzie  vrt  > t, 
nazywa  się  obszarem  Landaua-Rumera.  Obszary  te 
rozgranicza  obszar  pośredni,  gdy  vrt  # 1. 
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Dział  fizyki  obejmujący  zjawiska  związane  z oddzia- 
ływaniami fotonów  z fononami,  czyli  oddziaływaniem 
fal  świetlnych  z falami  ultra-  i hiperdźwiękowymi, 
nosi  nazwę  akustooptyki.  Praktycznym  zastosowa- 
niem efektów  akustooptycznych  zajmuje  się  optoso- 
nika. 

Oddziaływanie  fali  świetlnej  z falą  akustyczną  roz- 
chodzącą się  w ośrodku  sprężystym  może  prowadzić 
do  zjawisk,  które  nie  tylko  zależą  od  rodzaju  i cech 
użytego  światła  i fal  akustycznych  (moncchromatycz- 
ność,  zakres  częstości,  natężenie  wiązki,  polaryzacja 
itp.),  ale  także  od  rodzaju  środowiska  (ciała  izotopo- 
we, kryształy)  i geometrii  eksperymentu. 

I tak  np.  fala  akustyczna  rozchodząca  się  w ośrod- 
ku powoduje  jego  sprężyste  odkształcenie,  a pod 
wpływem  powstałych  naprężeń  ośrodek  ten  się  zmie- 
nia, pojawia  się  dodatkowa  anizotropia  (zjawisko 
fotosprężystości  lub  efekt  elastooptyczny).  Na  przy- 


kład w kryształach  normalnie  nieczynnych  optycznie 
pojawia  się  dwójłomność  wymuszona.  Światło  roz- 
chodzące się  w płaszczyźnie  prostopadłej  do  wymu- 
szonej osi  optycznej  kryształu  ulega  podwójnemu  za- 
łamaniu i zmienia  charakter  polaryzacji.  Fala  aku- 
styczna. rozchodząc  się  w ośrodku,  powoduje  poja- 
wienie się  okresowego  (z  okresem  tej  fali)  przestrzen- 
nego rozkładu  współczynnika  załamania  światła.  Fala 
świetlna,  przechodząc  przez  taki  ośrodek  prostopadle 
lub  pod  małym  kątem  do  fali  akustycznej  (rys.  13a), 
ulega  dyfrakcji  analogicznie  jak  na  optycznej  siatce 
dyfrakcyjnej ; powstaje  symetryczny  obraz  dyfrakcyj- 
ny składający  się  z szeregu  maksimów  interferencyj- 
nych. 

Analogia  do  optycznej  płaskiej  siatki  dyfrakcyjnej 
nie  jest  jednak  pełna,  gdyż  rozkład  natężeń  w poszcze- 
gólnych prążkach  światła  ugiętego  zależy  od  natężenia 
fali  akustycznej ; dodatkowo  światło  ugięte  ma  zmie- 
nioną częstość  w wyniku  efektu  Dopplera.  Zjawisko 
to  obserwuje  się,  gdy  długość  fal  akustycznych  jest 
dużo  większa  niż  długość  fal  świetlnych;  nosi  ono 
nazwę  dyfrakcji  Ramana-Natha. 


Rys.  13.  Schemat  ugięcia  światła  na  fali  ultradźwiękowej:  a)  ugię- 
cie typu  Ramana-Natha,  b)  ugięcie  typu  Bragga 


Przy  użyciu  silnych  monochromatycznych  w-iązek 
światła  (np.  promieniow-ania  laserów)  na  powyższy 
efekt  nakładają  się  nieliniowe  efekty  optyczne,  pro- 
wadzące np.  do  wytwarzania  wyższych  harmonicz- 
nych światła.  W rezultacie  ulega  zmianie  uzyskany 
obraz  dyfrakcyjny  — pojawiają  się  dodatkowe  mak- 
sima interferencyjne.  Przy  przejściu  fali  świetlnej 
przez  pole  akustyczne  o wysokiej  częstości  skierowane 
pod  pewnym  kątem  (kąt  Bragga)  do  fali  świetlnej 
obserwuje  się  obraz  dyfrakcyjny  składający  się  tylko 
z jednego  prążka  dyfrakcyjnego.  Zjawisko  to  nosi 
nazwę  akustooptycznej  dyfrakcji  Bragga  (rys.l3b). 

Monochromatyczna  wiązka  światła,  przechodząc 
przez  ośrodek,  może  także  ulec  rozproszeniu  na  nie- 
jednorodnościach wywołanych  termicznymi  fluktu- 
acjami gęstości  (cieplne  fale  akustyczne  o częstościach 
hiperdźwiękowych  — fonony  termiczne).  W zjawisku 
tym  obserwujemy  zmianę  kierunku  rozchodzenia  się 
światła  pod  kątem  Bragga  z jednoczesną  zmianą 
częstości  (składowa  stokesowska  i antystokesowska). 
Zjawisko  rozproszenia  na  fononach  akustycznych- 
jest  analogiczne  do  znanego  z optyki  rozpraszania 
ramanowskiego  na  fononach  optycznych  (->  Wzbu- 
dzenia elementarne  w ciałach  stałych).  Natężenie 
światła  rozproszonego  jest  proporcjonalne  do  natę- 
żenia światła  padającego.  Rozproszenie  tego  typu 
nosi  nazwę  rozproszenia  Mandelsztama-Brillouina 
(rys.  14). 

Jeśli  się  stosuje  bardzo  silne  wiązki  światła  mono- 
chromatycznego (np.  promieniowania  laserów  im- 
pulsowych), rozproszenie  światła  na  fononach  ter- 
micznych ma  nieco  inny  charakter.  W świetle  roz- 
proszonym obserwuje  się  tylko  składową  stokesow- 
ską,  której  natężenie  nie  jest  liniową  funkcją  natężenia 
fali  padającej,  a jednocześnie  obserwuje  się  powsta- 
wanie fali  o częstości  hiperdźwiękowej.  Fala  hiper- 
dźwiękowa  powstaje  kosztem  energii  fali  świetlnej. 
Efekt  ten  nosi  nazwę  wymuszonego  rozproszenia 
Mandelsztama-Brillouina. 
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Rys.  14.  Rozproszenie  Mandelsztama-Brillouina:  a)  typowy  zestaw  doświadczalny  służący  do  obserwacji,  b)  fotografia  światła  rozpro- 
szonego otrzymanego  przy  użyciu  interferrometru  Fabry’ego-Perota,  c)  schemat  analizy  częstościowej ; B — składowa  Brillouinowska, 
C — składowa  centralna 


Optosonika 

Iwona  Wojciechowska 

Powstanie  tej  nowej  dziedziny  (ok.  1960  r.),  wykorzy- 
stującej zjawiska  akustoopyczne,  związane  jest  z roz- 
wojem techniki  wytwarzania  różnego  typu  fal  aku- 
stycznych, rozszerzeniem  zakresu  częstotliwości  w 
kierunku  MHz  i GHz  oraz  powstaniem  źródeł  światła 
spójnego. 

Dzięki  efektom  akustycznym  można  uzyskać  am- 
plitudową, fazową  oraz  przestrzenną  (lub  ich  kom- 
binację) modulację  wiązki  laserowej.  Metody  modu- 
lacji i odpowiednio  zmodulowane  światło  spójne  zna- 
lazły już  szerokie  zastosowanie  w badaniach  mikro- 
i makrostruktury  materii,  w nowoczesnej  elektronice, 
przy  formowaniu  impulsów  świetlnych,  w komuni- 
kacji laserowej  (->  Lasery  — zastosowanie.  Opto- 
elektronika półprzewodnikowa),  w mikroskopach 
ultradźwiękowych,  holografii  akustycznej,  rejestracji 
i odczycie  danych  pamięci  cyfrowych  i in.  Wyko- 
rzystanie zjawisk  akustooptycznych  do  badania  ma- 
terii umożliwia  wyznaczenie : stałych  fotosprężystych, 
współczynników  sprężystości,  lepkości,  energetycz- 
nych poziomów  wzbudzenia  termicznego,  własności 
elektrycznych  i magnetycznych  drobin  ośrodka  i in. 
Omówimy  teraz  przykładowo  niektóre  sposoby  zasto- 
sowania zjawisk  akustooptycznych. 

Współczesne  zainteresowanie  zastosowaniem  świa- 
tła laserowego  skierowało  uwagę  uczonych  na  sprawę 
migawka  wytwarzania  impulsów  świetlnych  o wielkiej  mocy 
ultradźwię-  i krótkim  czasie  trwania  (->  Ultrakrótkie  impulsy 
kowa  świetlne).  Jednym  z układów  stosowanych  do  wytwa- 
rzania impulsów  świetlnych  jest  migawka  ultradźwię- 
kowa, której  działanie  przedstawiają  rys.  15  i 16. 


Układ  ten  jest  bardziej  efektywny  i prostszy  od  roz- 
wiązań mechanicznych,  a czas  trwania  i częstość  im- 
pulsów laserowych  można  regulować  częstotliwością 
ultradźwięków. 
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Rys.  15.  Refrakcja  wiązki  świetlnej  na  fali  ultradźwiękowej  o dłu- 
gości większej  od  średnicy  wiązki  światła  d < A.  Sinus  kąta  re- 
frakcji wynosi  sinćfo  « (2nnll  A)  cos  cot,  gdzie  n jest  maksymalną 
zmianą  współczynnika  załamania  ośrodka  co  — częstość  kołowa 
fali  ultradźwiękowej 


Metoda  oparta  na  zjawisku  rozpraszania  światła  badanie  akus 
laserowego  na  akustycznych  falach  powierzchnio-  tycznych 
wych  jest  bardzo  efektywną  metodą  pomiaru  stałych  fal  powierz- 
propagacji  fal  powierzchniowych  w różnych  warun-  chniowych 
kach  (różne  parametry  ośrodka,  inny  typ  przetworni- 
ków elektroakustycznych  itp.).  Podstawowy  schemat 
tej  metody  przedstawiony  jest  na  rys.  17.  Pomiar 
ogranicza  się  do  dokładnego  wyznaczenia  kątów  6m 
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Rys.  16.  Schemat  układu  doświadczalnego  — laser  rubinowy 
z migawką  ultradźwiękową 


dawczy  i odbiorczy 
przetwornik  mikrofalowy 


wiązka  światła 
zwierciadlana 


fotopowielauz 


wiązki  ugięte 


Rys.  17.  Badanie  fal  powierzchniowych;  sin  6,n  = sin  0o-ł- 
+myfAs , m » 0,  ±1,  ±2,  ...  rząd  dyfrakcji,  l długość  fali 
świetlnej,  A»  długość  fali  powierzchniowej.  Jeżeli  0X  = 0Ol  to 
aresin  yl2As  ~ {da  kąt  Bragga) 


i rozkładu  natężenia  rozproszonego  światła,  z tych 
wielkości  wyznacza  się  np.  prędkość  propagacji 
i tłumienie. 

Stałe  sprężysto-optyczne  ośrodków  można  mierzyć 
wykorzystując  dyfrakcję  światła  na  falach  objęto- 
ściowych. W tym  celu  stosuje  się  zarówno  dyfrakcję 
Ramana-Natha,  jak  i dyfrakcję  Bragga. 

Rysunek  18  przedstawia  schemat  układu  służącego 
do  pomiaru  stałych  sprężysto-optycznych  ciała  sta- 
łego. Mierzy  się  kąt  dyfrakcji,  na  podstawie  którego 
można  wyliczyć  długość  fali  ultradźwiękowej,  z tego 
prędkość  propagacji,  a następnie  odpowiednie  wiel- 


Rys. 18.  Schemat  układu  do  pomiaru  wielkości  sprężysto-optycz- 
nych ciała  stałego 


pomiar 

stałych 

sprężysto- 

-optycznych 

ośrodka 


okienka 
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kości  charakteryzujące  ośrodek  (np.  moduły  sprę- 
żystości, przeniicatność  elektryczną  itd.).  Tłumienie 
fali  ultradźwiękowej  wyznacza  się  z rozkładu  natęże- 
nia światła  przed  i za  komorą  ultradźwiękową; 
można  w ten  sposób  otrzymać  informacje  o wewnętrz- 
nej strukturze  ośrodka  i o procesach  zachodzących 
w ośrodku  (->  Badania  ośrodków  za  pomocą  ultra- 
dźwięków). 

Zalety  optosonicznych  metod  badania  materii : 
badania  te  nie  niszczą  materiału  badanego;  dają  moż- 
liwość stosowania  niewielkich  próbek;  śledzenie  za- 
chowania się  wąskiej  wiązki  światła  umożliwia  otrzy- 
manie rozkładów  punktowych  i badanie  nieliniowych 
własności  ośrodków. 

Zastosowanie  odwrotne  (tzn.  do  znanych  ośrodków) 
wyżej  opisanych  układów  daje  możliwość  dowolnej 
modulacji  i odchylania  wiązki  światła  (defiektory 
światła).  Modulatory  ultradźwiękowe  są  w nowo- 
czesnej elektronice  stosowane  do  formowania  sygna- 
łów elektrycznych  pośrednio,  poprzez  formowanie 
sygnałów  optycznych.  Defiektory  i modulatory  zna- 
lazły zastosowanie  w optycznych  pamięciach  maszyn 
cyfrowych.  Pojemność  pamięci  optycznych  (hologra- 
ficznych) z ultradźwiękowymi  deflektorami  jest  zbli- 
żona do  pojemności  pamięci  innych  typów,  a pręd- 
kość rejestracji  i odtwarzania  danych  jest  w nich 
większa  (odpada  bezwładność  układów  mechanicz- 
nych). Na  rys.  19  przedstawiony  jest  układ  pamięci 
holograficznej  z ultradźwiękowymi  modulatorami 
i deflektorami,  służącymi  do  nadania  żądanego  prze- 
biegu czasowo-przestrzennego  wiązki  laserowej.  In- 
formacja (obraz  przedmiotu)  zostaje  zarejestrowana 


ultradźwię- 

kowe 

modulatory 
i defiektory 
światła 


deflektor 


Rys.  19.  Układ  pamięci  holograficznej  z modulatorami  i defiek- 
torami  akusto-optycznymi 


na  materiale  światłoczułym  lub  termoplastycznym, 
powstaje  mikrohologram.  Zapisem  lub  odczytem 
żądanej  informacji  kieruje  układ  kontrolny  za  po- 
średnictwem odpowiednich  deflektorów,  odchylają- 
cych w żądany  sposób  wiązkę  przedmiotową  i (lub) 
odniesienia. 

Bardzo  ważna  jest  możliwość  wizualizacji  nie-  wizualizacja 
przezroczystych  dla  światła  przedmiotów  za  pomocą  nieprzezro- 
fal  akustycznych.  Stosuje  się  do  tego  metodę  dyfrakcji  czystych 
Bragga.  dla  światła 

Przedstawiony  na  rys.  20  układ  akustooptyczny  przedmiotów 
służy  do  otrzymywania  obrazów  przedmiotów  nie- 
przezroczystych „oświetlanych”  ultradźwiękami  o wy- 
sokiej częstotliwości.  Rozkład  natężenia  światła  w 
ugiętej  wiązce,  po  wyjściu  z komory  ultradźwiękowej 
rejestrowany  na  monitorze  TV,  odpowiada  rozkłado- 
wi pola  akustycznego  rozproszonego  na  przedmiocie. 

Na  ekranie  powstaje  optyczny  obraz  przedmiotu. 

Układ  ten,  dostosowany  do  fal  ultradźwiękowych, 
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Rys.  20.  Układ  do  wizualizacji  nieprzezroczystych  przedmiotów 
metodą  dyfrakcji  Bragga 
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jest  jednym  z rozwiązań  przetwarzania  obrazu  aku- 
stycznego na  optyczny  w mikroskopach  ultradźwię- 
kowych. Zdolność  rozdzielcza  mikroskopu  ultra- 
dźwiękowego i jakość  otrzymywanych  z niego  obra- 
zów jest  prawie  taka  jak  obrazów  uzyskiwanych  za 
pomocą  mikroskopów  świetlnych  (il.  165,  tabl.  43). 
Przytoczone  przykłady  nie  obejmują  wszystkich  mo- 
żliwych rodzajów  zastosowania  optosoniki. 


Zjawiska  akustomagnetyczne 

Czesław  Lewa 

Do  zjawisk  akustomagnetycznych  zalicza  się  zjawi- 
ska fizyczne  polegające  na  zmianie  magnetycznych 
własności  substancji  pod  wpływem  zmiennej  w czasie 
deformacji  mechanicznej,  jak  również  zjawiska  od- 
wrotne, zwane  magnetostrykcją,  polegające  na  zmia- 
nie kształtu  i wymiarów  materiałów  magnetycznych 
podczas  ich  magnesowania.  Zjawiska  te  wykorzystu- 
je się  np.  w przetwornikach  magnetostrykcyjnych. 


Rys.  21.  Zależność  tłumienia  ultradźwięków  w niklu  od  indukcji 
magnetycznej 


Z mikroskopowego  punktu  widzenia  deformacja 
mechaniczna  może  wpływać  na  zachowanie  się  mo- 
mentów magnetycznych  całych  domen  magnetycz- 
nych w ferromagnetykach,  ponieważ  powoduje  ona 
przemieszczanie  ścian  domenowych,  co  z kolei  zmienia 
podatność  magnetyczną  materiałów.  Ruch  ten  jest 
przyczyną  zwiększonego  tłumienia  fal  akustycznych 
w materiałach  ferromagnetycznych  oraz  zależności 
tłumienia  i prędkości  rozchodzenia  się  fal  akustycz- 
nych w tych  materiałach  od  indukcji  magnetycznej 
(rys.  21).  Deformacja  mechaniczna  może  również 
wpływać  na  zachowanie  się  momentów  magnetycz- 
nych cząsteczek  lub  atomów,  jak  i momentów  magne- 
tycznych jąder  atomowych  (— ► Teoria  magnetyzmu). 

Zmiany  własności  magnetycznych  wywołane  defor- 
macją mechaniczną  w materiałach  magnetycznych 
powodują  — na  skutek  zjawiska  magnetostrykcji  — 
dodatkową  deformację  sprężystą  tych  materiałów. 
Zjawisko  to  nosi  nazwę  mechanostrykcji.  Fale  aku- 
styczne wywołują  więc  w środowisku  magnetycznym, 
nawet  w nieobecności  zewnętrznego  pola  magnetycz- 
nego, zmianę  kierunków  i wartości  spontanicznego 
namagnesowania  domen.  Towarzyszą  temu  zmiany 
wymiarów  materiału.  W materiałach  magnetycznych 
mechanostrykcja  może  powodować  odchylenia  od 
prawa  Hooke’a.  Ze  zjawiskiem  mechanostrykcji  wiąże 
się  również  wiele  innych  zjawisk  fizycznych  zachodzą- 
cych w magnetykach,  np.  zmiana  modułu  sprężystości 
pod  wpływem  pola  magnetycznego,  wpływ  naprężeń 
na  magnetostrykcję. 

Do  zjawisk  akustomagnetycznych  należy  również 
grupa  zjawisk  giromagnetycznych,  w których  się 
obserwuje  zależność  między  momentem  pędu  i mo- 
mentem magnetycznym  atomów,  np.  zjawisko  Bar- 
netta  — polegające  na  magnesowaniu  się  ferroma- 
gnetyków  poddanych  ruchowi  obrotowemu,  zjawisko 
Einsteina-de  Kassa-Richarda,  w którym  się  obser- 
wuje obrót  namagnesowanego  ciała  wokół  osi  po- 
krywającej się  z kierunkiem  pola  magnetycznego. 


Akustyczny  rezonans 
magnetyczny 

Czesław  Lewa 

Niektóre  substancje  umieszczone  w stałym  polu  ma- 
gnetycznym pochłaniają  selektywnie  (rezonansowo) 
energię  pola  akustycznego. 
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własności  Wiele  mikroelementów  materii  ma  własności  pa- 
paramagne-  ramagnetyczne  (para-  i diamagnetyki).  Takimi  ele- 
tyczne mikro-  mentami  są: 

obiektów  — atomy  lub  molekuły  posiadające  pewną  liczbę 
nie  sparowanych  elektronów,  np.  molekuły  Ó2,  NO, 

no2, 

— defekty  sieci  w kryształach, 

— swobodne  rodniki  chemiczne, 

— atomy  i jony  o nie  sparowanych  wewnętrznych 
powłokach  elektronowych,  np.  Fe,  Ni,  Co,  Cr,  Mn, 
Cu,  Ti,  V,  pierwiastki  ziem  rzadkich, 

a więc  elementy,  których  własności  paramagnetyczne 
wynikają  z odpowiedniego  stanu  powłok  elektrono- 
wych, oraz 

— jądra  atomowe  o nieparzystej  liczbie  protonów 
i neutronów  (kwantowa  liczba  spinowa  / przybiera 
wówczas  wartości  całkowite  od  1 do  6)  lub  nieparzy- 
stej liczbie  nukleonów  (/  przybiera  wartości  połówko- 
we od  XU  do  9/2), 

a więc  elementy,  których  własności  paramagnetyczne 
wynikają  z odpowiedniej  struktury  i stanu  jąder  ato- 
mowych. 

Umieszczenie  takich  elementów  w polu  magnetycz- 
nym (np.  w polu  ziemskim  albo  w polu  wytworzonym 
przez  nabiegunniki  magnesu  lub  przez  sąsiadujące 
elementy  materii  o własnościach  paramagnetycznych) 
wymusza  na  nich  przyjęcie  określonych  orientacji 
względem  tego  pola.  Należy  uwzględnić  również  mo- 
ment pędu,  którym  są  obdarzone  paramagnetyczne 
mikroelementy,  w wyniku  czego  ich  zachowanie  w 
polu  magnetycznym  podobne  jest  do  zachowania  bąka 
w polu  grawitacyjnym  (rys.  22).  Moment  pary  sił,  od- 


działywania momentu  magnetycznego  rozważanych 
elementów  z polem  magnetycznym,  wprawia  je  w 
precesja  ruch  procesyjny  (zwany  precesją  Larmora)  o prędkości 
Larmora  kątowej  proporcjonalnej  do  natężenia  pola  magne- 
tycznego H (rys.  23): 

(Ol  = yH, 

gdzie  y jest  współczynnikiem  giromagnetycznym  cha- 
rakteryzującym rozważany  rodzaj  elementów. 

Z praw  mechaniki  kwantowej  wynika,  że  elementy 
paramagnetyczne  mogą  przyjmować  tylko  takie  orien- 
tacje względem  kierunku  pola  magnetycznego,  przy 
jakich  energia  ich  oddziaływania  z tym  polem  jest 
całkowitą  wielokrotnością  hcou  tzn. 

E — —mcohhy 

gdzie  m to  magnetyczna  liczba  kwantowa,  h — stała 


Plancka  dzielona  przez  2ir.  Liczba  m może  przybie- 
rać wartości  od  —/do  -f/-  Oznacza  to,  że  każdy 
element  paramagnetyczny  może  przyjąć  jedną  z 
(2/4 1)  orientacji,  tzn.  może  się  znaleźć  w jednym  z 
(2/-fl)  stanów  energetycznych  (zwanych  poziomami 
zeemanowskimi). 

W próbce  zawierającej  wiele  elementów  paramag- 
netycznych umieszczonej  w polu  magnetycznym  wy- 
stępują wszystkie  możliwe  orientacje,  tzn.  zajęte  są 
wszystkie  poziomy  zeemanowskie.  W stanie  równo- 
wagi termicznej  najwięcej  momentów  magnetycznych 
przyjmuje  orientację  o najniższej  energii  ZTmin,  tzn. 
równoległą  do  kierunku  pola  magnetycznego,  naj- 
mniej zaś  — o najwyższej  energii  £max,  tzn.  anty- 
równoległą  do  pola  magnetycznego  (rys.  24). 

n2  " ! A Emax 


T) 


Rys.  24.  Zeemanowskie 
poziomy  energetyczne 
elementów  paramagne- 
tycznych (/  «=  1/a)  prób- 
ki w zewnętrznym  polu 
magnetycznym 


E 


min 


Zmiana  orientacji  może  zachodzić  tylko  skokowo, 
z zachowaniem  reguł  zwanych  w mechanice  kwanto- 
wej regułami  wyboru.  Według  nich  możliwe  są  tylko 
takie  zmiany  orientacji,  podczas  których  m zmienia 
się  o Am  — ±1,  tzn.  zmiany  prowadzące  do  przy- 
jęcia orientacji  bezpośrednio  sąsiadującej  z poprzed- 
nią. Inaczej  mówiąc  — energia  danego  elementu  mo- 
że ulec  zmianie  tylko  o 

AE  = E(m)-E{m±  1)  = ±hcoL  = hyH . 

Przejście  elementu  paramagnetycznego  z jednego  sta- 
nu energetycznego  do  sąsiedniego  może  nastąpić  w wy- 
niku absorpcji  lub  emisji  kwantu  energii  col h. 

Absorpcja  energii  przy  przejściach  między  zee- 
manowskimi poziomami  mikroelementów  paramag- 
netycznych stanowi  istotę  rezonansu  paramagnetycz- 
nego. Prawdopodobieństwo  emisji  energii  zależy  głów- 
nie od  oddziaływań  między  rozważanym  elementem 
paramagnetycznym  i pozostałymi  elementami  ma- 
terii w próbce. 

Zależnie  od  tego,  czy  własności  paramagnetyczne 
rozważanych  elementów  są  pochodzenia  elektrono- 
wego czy  jądrowego,  wprowadza  się  podział  na  dwie 
metody:  elektronowego  rezonansu  paramagnetycz- 
nego ERP  (skrót  ang.  EPR  — electronic  paramagne- 
tic  reionance)  i jądrowego  rezonansu  magnetycznego 
JRM  (skrót  ang.  NMR  — nuclear  magnetic  rezo - 
nance).  Podział  ten,  choć  z punktu  widzenia  przebiegu 
zjawiska  jest  czysto  formalny,  znajduje  uzasadnienie 
techniczne  (różne  są  zakresy  częstości  vl  = col/2k 
precesji  Larmora  mimo  zastosowania  takich  samych 
natężeń  pól  magnetycznych)  i naukowo-poznawcze 
(obie  metody  mają  różne  zastosowania  i dostarczają 
różnych,  często  uzupełniających  się  tylko  informacji 
naukowych). 

Porcje  energii  odpowiadające  rezonansowym  przej- 
ściom między  zeemanowskimi  poziomami  energe- 
tycznymi dostarczać  można  do  próbki  zawierającej 
omawiane  elementy  paramagnetyczne  w postaci 
kwantów  hco  promieniowania  elektromagnetycznego 
lub  fononów  ha>  promieniowania  mechanicznego 
(ultradźwiękowego).  Metody,  w których  się  wykorzy- 
stuje rezonansową  absorpcję  fononów,  noszą  odpo- 


poziomy  zee- 
manowskie 


rezonans 

paramagne- 

tyczny 


ERP 

i JRM 


677 


AERP 
i AJRM 


oddziaływa- 

nie 

fonon-spin 


relaksacja 

spin-sieć 


pierwsze  do- 
świadczenia 


wiednio  nazwy:  akustycznego  elektronowego  rezonan- 
su paramagnetycznego  (AERP)  i akustycznego  jądro- 
wego rezonansu  magnetycznego  (AJRM). 

Przekazanie  energii  fal  ultradźwiękowych  układowi 
elementów  paramagnetycznych  zachodzi  wówczas, 
gdy  w substancji  występuje  wewnętrzne  oddziaływa- 
nie między  tymi  elementami  a elementami  materii 
wprawionymi  w ruch  drgający  przez  falę  ultradźwię- 
kową, tzn.  gdy  występuje  sprzężenie  spin-sieć.  Uwa- 
żając energię  drgań  sieci  za  zbiór  fononów,  możemy 
proces  przekazywania  energii  traktować  jako  zbiór 
elementarnych  oddziaływań  fonon-spin.  Akustyczne 
drgania  wprawiają  w ruch  ładunki  elektryczne  oraz 
dipole  magnetyczne  zawarte  w substancji,  w wyniku 
czego  zostaje  w niej  wytworzone  zmienne  pole  elek- 
tromagnetyczne o częstości  równej  częstości  drgań 
akustycznych.  Gdy  częstość  drgań  v równa  się  czę- 
stości precesji  Larmora  vl , wytworzone  pole  elektro- 
magnetyczne wywołuje  przejścia  pomiędzy  pozio- 
mami zeemanowskimi  elementów  paramagnetycz- 
nych. Prawdopodobieństwa  absorpcji  i emisji  energii 
w przeliczeniu  na  jeden  element  paramagnetyczny  są 
jednakowe.  W równowadze  termicznej  zbioru  ele- 
mentów paramagnetycznych  zawartych  w próbce 
liczba  obsadzeń  niższych  poziomów  zeemanowskich 
jest  wyższa.  Wystąpi  więc  rezonansowe  pochłanianie 
fali  akustycznej  o częstości  v = vl,  prowadzące  do 
wzrostu  liczby  obsadzeń  wyższych  poziomów  zce- 
manowskich,  a tym  samym  do  obniżenia  absorpcji 
fali  akustycznej. 

Oddziaływanie  fonon-spin  jest  również  odpowie- 
dzialne za  proces  odwTOtny  — przekazywanie  energii 
od  zbioru  elementów  paramagnetycznych  do  sieci, 
tzn.  za  proces  relaksacji  spin-sieć  charakteryzowany 
czasem  relaksacji  spin-sieć  7\.  Szybkość  tego  pro- 
cesu zależy  od  struktury  i dynamiki  molekularnej 
w materii.  Pomiary  czasów  relaksacji  dostarczają  więc 
cennych  informacji  o strukturze  i mikroskopowych 
procesach  molekularnych  zachodzących  w badanej 
substancji  w różnych  stanach  skupienia. 

Możliwość  wzbudzenia  układu  spinów  przez  fo- 
nony o częstości  rezonansowej  przewidzieli  niezależnie 
od  siebie  A.  J.  Kastler  (w  1952  r.)  i S.  A.  Altshuler 
(w  1955  r.). 

W pierwszych  doświadczeniach,  wykonanych  przez 
W.  G.  Proctora  i jego  współpracowników  w 1956  r., 
obserwowano  absorpcję  fononów  przez  zmianę  róż- 
nicy obsadzeń  poziomów  zeemanowskich  w próbce 
nadźwiękawianej  rezonansową  falą  ultradźwiękową, 
tzn.  metodą  akustycznego  nasycenia.  Absorpcję  fo- 
nonów określano  ze  zmian  absorpcji  sygnału  elek- 
tromagnetycznego w obecności  pola  ultradźwięko- 
wego i bez  niego.  Fonony  rezonansowe  fali  ultra- 
dźwiękowej, wzbudzając  elementy  paramagnetyczne 
do  wyższych  poziomów  energetycznych,  powodują 
częściowe  nasycenie  układu  i obniżenie  absorpcji 
sygnału  elektromagnetycznego.  Tak  w opisywanym 
eksperymencie,  jak  i w późniejszych  badaniach,  naj- 
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Rys.  25.  Schemat  układu  impulsowego  do  obserwacji  AJRM 
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częściej  do  tego  celu  stosowano  tradycyjne  urządze- 
nia do  JRM  i ERP  z wbudowanym  nadajnikiem  ultra- 
dźwiękowym. 

Pierwsze  obserwacje  absorpcji  fali  akustycznej 
przez  jony  paramagnetyczne  wykonywane  były  w 
1959  r.  przez  E.  H.  Jacobsena  i współpracowników. 

Na  rys.  25  przedstawiono  schemat  układu  impul- 
sowego do  obserwacji  AJRM.  Silne  pole  magnetyczne 
H ma  kierunek  prostopadły  do  płaszczyzny  rysunku. 
Impuls  elektromagnetyczny  o częstości  vl  jest  po- 
dawany przez  cewki  nadajnika.  Nadźwiękowienie 
próbki  uzyskuje  się  z przetwornika  ultradźwiękowego. 
Za  pomocą  cewki  odbiorczej,  nawiniętej  na  próbce, 
rejestruje  się  wymuszony  w próbce  impuls  i jego  zani- 
kający transjent.  Amplituda  tego  impulsu  (zwanego 
sygnałem  precesji  swobodnej)  jest  proporcjonalna  do 
różnicy  obsadzeń  poziomów  zeemanowskich.  Ma- 
leje ona  po  nadźwiękowieniu  próbki  falą  o częstości 
rezonansowej.  Na  rys.  26  pokazano  sekwencję  im- 
pulsów stosowaną  w doświadczeniu  Proctora.  Po 
przyłożeniu  impulsu  elektromagnetycznego  a i zare- 
jestrowaniu sygnału  precesji  swobodnej  o amplitudzie 
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Rys.  26.  Impulsy  elektromagnetyczne  a i sygnały  precesji  swobod- 
nej dla  próbki  nie  nadźwiękowionej  A0  i nadźwiękowionej  A 


A0  przykładano  impuls  ultradźwiękowy.  Absorpcja 
energii  akustycznej  przez  elementy  paramagnetyczne 
przeszkadza  ich  powrotowi  do  stanu  równowagi.  Po 
wyłączeniu  sygnału  ultradźwiękowego  mierzy  się 
amplitudę  sygnału  precesji  swobodnej  A,  uzyskanego 
przez  wprowadzenie  kolejnego  impulsu  elektro- 
magnetycznego. Stosunek  amplitud  sygnału  precesji 
swobodnej  następującego  po  sygnale  ultradźwięko- 
wym A do  amplitudy  sygnału,  gdy  nie  ma  ultradźwię- 
ków A0t  jest  miarą  stosunku  obsadzeń  poziomów- 
zeemanowskich  w tych  dwu  wypadkach. 

Metody  AJRM  i AERP  są  szeroko  stosowane  w ba- 
daniach materiałów  krystalicznych,  natomiast  nie 
udało  się  dotychczas  osiągnąć  powodzenia  w zasto- 
sowaniu ich  do  cieczy  i ciał  amorficznch. 

Metoda  AERP  została  również  zastosowana  w fa- 
serach  kwantowych. 


Fasery 

Mieczysław  Szustakowski 

Faserami  nazywa  się  układy  generujące  dźwięki  wy- 
sokich częstości  — hiperdźwięki.  Nazwa  faser  została 
wprowadzona  przez  polskiego  uczonego  S.  Kaliskie- 
go w 1969  r.  i utworzona  z pierwszych  liter  wyrazów 
angielskich  określających  zasadę  działania  kwanto- 
wych generatorów  hiperdźwięków  — Fonon  Ampcali- 
fitionby  Stimulated  Emission  of  Radiation. 

Rozróżnia  się  dwa  rodzaje  faserów:  fasery  aku- 
stoelektryczne,  w których  wykorzystuje  się  oddziały- 
wanie fonon-elektron,  i fasery  kwantowe,  często  zwa- 
ne maserami  fononowymi  albo  akustycznymi,  w któ- 
rych wykorzystuje  się  oddziaływanie  fonon-spin. 


Fasery  akustoelektryczne 

W faserach  akustoelektrycznych  generacja  drgań  na- 
stępuje w wyniku  wzmocnienia  spontanicznych  drgań 
sieci  (fononów  termicznych)  przez  dryfujący  strumień 
elektronów  w kryształach  piezopółprzewodnikowych. 

Podstawowym  elementem  fasera  akustoelektrycz- 
nego  jest  płytka  piezopółprzewodnikowego  kryształu 
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budowa  (nP-  CdS,  Cd  Se,  ZnO)  o powierzchni  kilku  mm2  i gru- 
fasera  bości  ułamka  mm.  Oś  c (oś  heksagonalna)  kryształu 
akusto-  skierowana  jest  prostopadle  do  powierzchni  płytki, 
•lektrycz-  Dokładnie  wypolerowane  równoległe  boki  płytki  po- 
nego  kryte  są  cienką  warstwą  metalu  (rys.  27a).  Warstwy 
metaliczne  tworzą  kontakty  omowe  z kryształem 
i umożliwiają  doprowadzanie  stałego  pola  elektrycz- 
nego E zwanego  napięciem  dryfu.  Napięcie  to  powo- 
duje ruch  elektronów,  a efekt  piezoelektryczny  sprzę- 
ga dryfujący  strumień  elektronów  ze  spontanicznie 
drgającą  siecią  kryształu.  Gdy  napięcie  dryfu  prze- 
kroczy wartość  progową  E>EP,  przy  której  prędkość 
elektronów  osiąga  prędkość  równą  prędkości  fal  aku- 
stycznych w krysztale,  amplituda  drgań  atomów  sieci, 
których  kierunek  ruchu  jest  zgodny  z kierunkiem  dry- 
fu  elektronów,  będzie  narastać  (przebieg  tego  procesu 


b)  odległość  od  brzegu  kryształu 
Rys.  27.  Faser  akustoelcktryczny : a)  schemat  budowy,  I kryształ 
piezopółprzewodnikowy,  2 warstwa  metalu,  3 kontakty  omowe, 
b)  narastanie  amplitudy  fali  akustycznej  w zależności  od  kierunku 
ruchu  fali  względem  kierunku  dryfu  elektronów 


został  już  dokładnie  omówiony  w-  rozdziale  pt.  Od- 
działywania fonon-elektron).  W ten  sposób  z nieupo- 
rządkowanych, termicznych  drgań  sieci  ^pstaje  wy- 
generowana podłużna  fala  akustyczna  (a  w w-ypadku 
impulsowego  napięcia  dryfu  — paczka  falowa),  która 
po  dojściu  do  ścianki  kryształu  z dodatnią  elektrodą 
odbija  się  i biegnie  w kierunku  przeciwnym  do  dryfu 
elektronów,  jak  na  rys.  27b.  Amplituda  fali  akustycz- 
nej biegnącej  w kierunku  przeciwnym  do  strumienia 
elektronów  jest  tłumiona,  ale  znacznie  słabiej  niż  jest 
wzmacniana,  gdy  biegnie  w kierunku  elektrody  do- 
datniej, czyli  oddziaływanie  fonon-elektron  nie  jest 
symetryczne  względem  kierunku  ich  wzajemnego  ru- 
chu. Niesymetryczność  oddziaływania  powoduje,  że 
amplituda  wielokrotnie  odbitej  fali  akustycznej  rośnie 
i dopiero,  gdy  zaczynają  występować  efekty  nieliniowe 
uruchamiające  dodatkowe  mechanizmy  tłumienia, 
osiąga  poziom  nasycenia,  tzn.  ustala  się  stan  równo- 
wagi między  wzmocnieniem  i tłumieniem  fali  aku- 
stycznej. Narastanie  amplitudy  (wzmocnienie  dry- 
fowe)  obejmuje  tylko  te  drgania,  których  częstość  ko- 
łowa co  spełnia  warunek  rezonansu  określony  przez  od- 
ległość L między  ściankami  płytki: 
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gdzie:  n = 1,  2,  3...,  vPt  v0  oznacza  prędkości  fali  aku- 
stycznej zgodnej  i przeciwnej  do  kierunku  dryfu,  y — 
różnicę  faz  powstałą  przy  odbiciu. 

Faser  generuje  ciąg  drgań  akustycznych  zwanych 
modami  o częstości  rówmej  wielokrotności  częstości 
podstawowej  (częstość  podstawowa  przy  n = 1). 
Wzbudzonym  drganiom  akustycznym  w piezopół- 
przewodzącym  ośrodku  towarzyszy  pole  elektryczne 
o tej  samej  częstości  wywołane  efektem  piezoelek- 
trycznym. Dlatego  ze  ścianki  kryształu  prostopadłej 
do  kierunku  drgań  akustycznych  możemy  wyprowa- 
dzić drgania  w postaci  fal  akustycznych  przy  obcią- 
żeniu fasera  falowodem  akustycznym  łub  w postaci 
drgań  elekti*ycznych  przy  obciążeniu  obwodem  elek- 
trycznym. 


Rys.  28.  Oscylogram  widma  drgań  fasera  akusioelcktrycznego: 
a)"  drgania  jednomodowe,  b)  drgania  wiclomodowc 


Rysunek  28  przedstawia  zdjęcie  z oscyloskopu  ana- 
lizatora widma  drgań  fasera  skonstruowanego  na 
bazie  kryształu  CdS.  Dobierając  odpowiednie  na- 
pięcie pola  dryfu  i rozmiary  próbki  można  uzyskać 
jednomodową  pracę  na  częstości  podstawowej  (rys. 
28a)  lub  pracę  wielomodową  (rys.  28b).  Piki  napięcia 
na  rys.  29b  odpowiadają  różnym  częstościom  drgań  — 
modom. 

Kryształy  CdS,  CdSe  są  fotoczułe,  tzn.  że  gęstość 
dryfującego  w nich  strumienia  elektronów  (przewod- 
ność) można  regulować  za  pomocą  oświetlenia.  Przy 
oświetleniu  światłem  o długości  fali  bliskiej  krawędzi 
absorpcji  (np.  dla  CdS  X — 520-530  nm)  światło  wni- 
ka tylko  na  głębokość  kilkudziesięciu  mikrometrów, 
i wytwarza  przypowierzchniowy  warstwę  przewo- 
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dzącą.  Przyłożenie  do  tak  oświetlonej  płytki  napięcia 
dryfu  powoduje  powstanie  fal  powierzchniowych.  Są 
to  poprzeczne  fale  akustyczne  o amplitudzie  zanika- 
jącej z głębokością  od  powierzchni  oświetlonej,  których 
wychylenia  cząstek  (polaryzacja  drgań)  są  równoległe 
do  tej  powierzchni  (— ► Akustyczne  fale  powierzchnio- 
we i ich  zastosowanie). 

pierwsze  Pierwsze  modele  faserów  zostały  opracowane  w la- 
modele  tach  1969-72.  Schemat  modelu  fasera  opracowanego 
faserów  w Polsce  w 1970  r.  przedstawia  rys.  29.  Podstawowe 
parametry  tego  fasera  akustoelektrycznego  są  nastę- 
pujące: kryształ  CdS  o wymiarach  0,66  x 1,67  x 
X 1,70  mm,  częstość  pracy  21703048  Hz,  napięcie 
wyjściowe  0,2  mV,  napięcie  dryfu  80  V,  prąd  dryfu 


barwny,  7 oświetlacz  z żarówką,  8 okno  do  oświetlenia  kryształu 

0,3  mA,  stałość  częstości  Aflf  — 4 -lO-6  na  godzinę, 
czas  ustalania  się  częstości  przy  oświetlonym  krysztale 
ok.  1 h.  Fasery  akustoelektryczne  nie  znalazły  jednak 
szerszego  zastosowania  w technice  z powodu  małej 
stabilności  termicznej  częstości  drgań  oraz  koniecz- 
ności chłodzenia  ich  i oświetlenia. 


Fasery  kwantowe 

generacja  W faserach  kwantowych  generacja  hiperdźwięków 
hiper-  następuje  w wyniku  emisji  fononów  przy  przejściach 
dźwięków  na  niższe  poziomy  energetyczne  mikroelementów  pa- 
ramagnetycznych. Faser  kwantowy  działa  na  zasa- 
dzie podobnej  jak  maser  (-►  Spektroskopia  mikrofa- 
lowego rezonansu  rotacyjnego)  z tą  tylko  różnicą,  że 
funkcję  fotonów  w maserze  spełniają  w faserze  fono- 
ny, dzięki  czemu  zostaje  wygenerowaną  fala  akusty- 
czna zamiast  fali  elektromagnetycznej,  która  powsta- 
je w maserze. 

budowa  Podstawowym  elementem  fasera  kwantowego  jest 
fasera  paramagnetyczny  kryształ,  w którego  dielektrycznej 
kwantowego  osnowie  umieszczone  są  jony  pierwiastków  przejścio- 
wych (około  0,05%)  z niesparowanym  spinem  elektro- 
nowym np.  Al203Cr+3.  W zewnętrznym  polu  magne- 
tycznym momenty  magnetyczne  jonów  przyjmują 
tylko  określone  kierunki  orientacji  względem  pola 
magnetycznego,  co  odpowiada  różnym  dyskretnym 
poziomom  energii.  Zmiana  kierunku  orientacji  spinu 
odpowiadająca  przejściu  z niższego  poziomu  na  wyż- 
szy wymaga  dostarczenia  energii  równej  różnicy 
poziomów,  (Ea—Eb),  natomiast  w sytuacji  odwrotnej 
uzyskuje  się  kwant  energii  o częstości  kołowej  co  = 
= (Ea  — Eb)h.  Uzyskane  w ten  sposób  kwanty  energii 
mogą  być  wyemitowane  w postaci  fotonów  — wów- 
czas mówimy  o efekcie  maserowym,  lub  fononów  — 
efekt  faserowy  (oddziaływanie  akustomagnetyczne). 

Faser  kwantowy  został  opracowany  przez  uczonych 
amerykańskich  na  początku  lat  60.  Możliwość  gene- 
racji fononów  za  pomocą  oddziaływania  spin-fonon 


w paramagnetycznych  kryształach  przewidział  w 
swych  pracach  w 1961  r.  C.  Kittel,  później  w 1963  r. 

E.  B.  Tucker  uzyskał  eksperymentalne  potwierdzenie 
tego  efektu.  Do  budowy  fasera  kwantowego  Tucker  faser 
użył  monokryształu  Al2Ó3Cr3+.  Dolne  poziomy  ener-  Tuckera 
getyczne  jonów  Cr3+  w rubinie  są  dubletami  Cramersa 
rozdzielonymi  w zerowym  polu  magnetycznym  przer- 
wą energetyczną  ok.  38,6  m'1.  W polu  magnetycznym 
H dublety  rozszczepiają  się  tworząc  cztery  poziomy 
energetyczne.  Przy  orientacji  pola  pod  kątem  54°44' 
do  osi  c rubinu  (trygonalna  oś)  rozszczepienia  pozio- 
mów przyjmują  postać  jak  na  rys.  30.  Różnice  energii 


między  poziomami  1-2  i 2-4  są  jednakowe.  W stanie 
równowagi  termodynamicznej  największa  liczba  jo- 
nów zajmuje  najniższe  poziomy  energetyczne.  Zmianę 
gęstości  obsadzeń  poziomów,  czyli  tzw.  inwersję  ob- 
sadzeń niezbędną  dla  uzyskania  akcji  faserowej, 
otrzymał  Tucker  za  pomocą  pola  elektromagnetycz- 
nego (pola  pompującego)  o częstości  24  GHz  od- 
powiadającej różnicy  poziomów  energetycznych  1-2 
i 3-4.  Schemat  ideowy  fasera  kwantowego  konstrukcji 
Tuckera  przedstawia  rys.  31.  Do  czoła  rubinowego 
walca  przyklejony  był  przetwornik  piezoelektryczny 
mający  formę  płytki  kwarcowej  milimetrowej  gru- 
bości. Przetwornik  służył  do  detekcji  pola  akustycz- 
nego i był  umieszczony  w rezonatorze  mikrofalowym. 


pompa 


Rys.  31.  Schemat  głowicy  fasera  kwantowego  Tuckera 


Cały  układ  badawczy  został  zanurzony  w ciekłym 
helu  o temperaturze  4,2  K.  Najpierw  badano  oddzia- 
ływanie pola  akustycznego  z układem  spinów,  na- 
dźwiękawiając  kryształ  paramagnetyczny  podłużną  falą 
akustyczną.  Zaobserwowano  wzmocnienie  fali  aku- 
stycznej rzędu  10%  na  częstości  9,3  GHz.  Na  tejże 
częstości  otrzymano  generację  podłużnych  fal  aku- 
stycznych o odebranej  mocy  elektromagnetycznej 
10" 11  W,  co  odpowiada  mocy  akustycznej  rzędu 
10" 7 W lub  amplitudzie  deformacji  rzędu  10"8.  Wzbu- 
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dzające  pole  elektromagnetyczne  (pole  pompujące) 
miało  moc  40  mW,  a temperatura  kryształu  była  po- 
niżej 4,2  K. 

Na  podstawie  częstości  otrzymanych  drgań  stwierdzo- 
no, że  efekt  generacji  fononów  otrzymuje  się  w wy- 
niku przejść  między  poziomami  3-2.  Przejścia  te  są 
indukowane  przez  termiczne  drgania  sieci  o częstości 
odpowiadającej  różnicy  energii  między  poziomami 
3-2 , co  interpretuje  się  jako  wzmocnienie  drgań  sieci 
o tej  częstości.  Podobnie  jak  w faserze  akustoelek- 
trycznym  wzmocnieniu  ulegają  te  rodzaje  fal  aku- 
stycznych, dla  których  długość  pręta  paramagnetycz- 
nego jest  całkowitą  wielokrotnością  połowy  długości 
fali  akustycznej.  Generator  kwantowy  generuje  wiele 


Rys.  32.  Oscylogram  pokazujący  drgania  na  wyjściu  fasera  kwan- 
towego: a)  drgania  w stanie  przejściowym  po  włączeniu  pola 
pompy,  b)  zdudnienia  dwóch  sąsiednich  rodzajów  (modów) 
drgań,  częstość  dudnień  240  kHz 


mody 

fasera 

kwantowego 


rodzajów  (modów)  drgań,  a różnica  częstości  między 
sąsiednimi  modami  wynosi  Af  = v/2L.  Przy  prędkości 
v = 1,2  106  m/sek  i długości  L — 0,0254  m różnica 
częstości  w faserze  Tuckera  wynosiła  236  kHz.  Na 
oscylogramie  rys.  33b  zarejestrowano  częstość  zdud- 
nień  dwóch  sąsiednich  modów,  która  wynosiła 
240  kHz.  Za  pomocą  odbiornika  heterodynowego 


stwierdzono,  że  pasmo  generacji  fasera  kwantowego 
wynosiło  1 1 ,4  MHz.  Na  oscylogramie  rys.  32  poka- 
zano typową  dla  fasera  fluktuację  wyjściowego  sygna- 
łu związaną  z początkiem  generacji.  Fluktuacja  sygna- 
łu poprzedza  ustalenie  się  stanu  stacjonarnej  generacji 
pokazanego  na  rys.  32b.  Nowsze  opracowanie  modelu  faser  Gana- 
fasera  przedstawił  w 1974  r.  E.  M.  Ganapolski.  Faser  polskiego 
Ganapolskiego  zbudowany  jest  również  na  rubinie 
(Al203Cr3+)  o podobnych  parametrach  i orientacji 
co  faser  Tuckera.  Innowacją  jest  rozwiązanie  technicz- 
ne układu  wzbudzania  ośrodka  paramagnetycznego 
(rezonatora  pola  pompującego)  i detekcji  (lub  genera- 
cji) drgań  akustycznych.  Jako  detektora  drgań  użyto 
cienkowarstwowego  przetwornika  piezoelektrycznego 
z ZnO  napylonego  bezpośrednio  na  kryształ  rubinu. 

Ganapolski  wykorzystywał  faser  do  badania  wzmoc- 
nienia podłużnych  fal  akustycznych  pobudzanych 
przetwornikiem  ZnO  na  częstości  9,3  GHz.  Częstość 
pola  pompy  wynosiła  23,4  GHz.  Otrzymane  wzmoc- 
nienie fal  akustycznych  wynosiło  0,9  dB/cm  przy  tem- 
peraturze 1,7  Ki  koncentracji  chromu  Cr3+  0,028%. 

Natomiast  przy  koncentracji  chromu  0,05%  wzmoc- 
nienie wynosiło  tylko  0,4  dB/cm.  W swych  badaniach 
Ganapolski  stwierdził  zależność  oddziaływania  fo- 
non-spin  od  koncentracji  jonów  parametrycznych, 
kąta  orientacji  kryształu  względem  pola  magnetycz- 
nego, mocy  pompy  i temperatury. 

Prace  badawcze  nad  faserami  kwantowymi  trwają 
nadal.  Obecnie  dąży  się  do  uzyskania  akcji  faserowej 
w kryształach  piezoelektrycznych,  np.  w LiNb03: 

Cr3+(Fe3+).  W tym  wypadku  drgania  akustyczne  moż- 
na będzie  odbierać  bezpośrednio  z kryształu  para- 
magnetycznego pomijając  stosowanie  dodatkowych 
przetworników,  które  na  częstościach  gigahercowych 
powodują  duże  straty  akustycznej  energii  fasera. 

Fasery  kwantowe  a szczególnie  zjawisko  oddziały- 
wania fonon-spin  są  wykorzystywane  w badaniach 
akustoelektron owego  rezonansu  paramagnetycznego  AERP 
(AERP). 

Acoustic  Surface  Wave  and  Acousto-optic  Devices  T.Kallard 
(ed.),  New  York  1971;  R.  T.  Beyer,  S.  V.  Letcher  Physical 
Ultrasonics,  New  York  1969;  I.  Małecki  Podstawy  teoretyczne 
akustyki  kwantowe. /,  Warszawa  1972;  W.  P.  Mason  Physical 
Acoustics , vol.  1-12,  New  York  1964-76;  A.  Śliwiński,  E.  Ozi- 
mek Akustyka  laboratoryjna , cz.  3,  Warszawa  1974;  R.  Truell 
i in.  Ultrasonics  Methods  in  Solid  State  Physics,  New  York  1969; 

J.  W.  Tcjcker,  V.  W.  Rampton  Microwa\e  Ultrasonics  in  Solid 
State  Physics , Amsterdam  1972  (tłum.  ros.  Moskwa  1975). 


Modelowanie  obiektów 
akiastycznycł! 

Stefan  Czarnecki 


W badaniach  akustycznych  szeroko  stosuje  się  me- 
todę doświadczalna  zwaną  modelowaniem  obiektów 
akustycznych.  Polega  ona  na  zastąpieniu  badanych 
obiektów  przez  inne,  których  parametry  można  łatwo 
zmieniać  w celu  poszukiwania  rozwiązań  optymal- 
nych. Metoda  ta  rozpowszechniona  jest  w pracach 
badawczych,  jak  również  w pracach  projektowych. 

Badany  obiekt  można  odwzorowywać  za  pomocą 
modeli  cyfrowych  lub  analogowych, 
modele  Modele  cyfrowe  wymagają  pełnego  opisu  matema- 
cyfrowe  tycznego  badanego  obiektu,  w celu  odpowiedniego 
zaprogramowania  komputera.  Szeroko  stosowana 
technika  komputerowa  zapewnia  uniwersalność  mo- 
delowania oraz  możliwość  automatycznego  poszuki- 
wania rozwiązań  optymalnych  przez  zastosowanie 
odpowiednich  kryteriów  optymalizacji.  Wadą  mode- 
lowania cyfrowegojest  mały  kontakt  człowieka  z kom- 
puterem, co  utrudnia  proces  śledzenia  toku  procesu 
modelowania. 

modele  Kontakt  człowieka  z komputerem  jest  znacznie 
analogowe  większy  w wypadku  modelowania  analogowego,  któ- 


rego dodatkową  zaletą  jest  możliwość  analizy  badane- 
go obiektu  bez  znajomości  jego  pełnego  opisu  mate- 
matycznego. 

Modelowanie  obiektów  akustycznych  metodami 
analogowymi  realizowane  jest  najczęściej  za  pomocą 
maszyn  analogowych  lub  hybrydowych,  względnie 
za  pomocą  modeli  geometrycznych. 

Model  analogowy  jest  odwzorowaniem  badanego 
obiektu  w postaci  układu  zastępczego,  opisywanego 
takimi  samymi  zależnościami  matematycznymi  co 
rzeczywiste  układy  modelowe  i o parametrach  wza- 
jemnie proporcjonalnych.  Modele  te  mają  duże  zna- 
czenie dydaktyczne,  gdyż  dają  proste,  syntetyczne 
spojrzenie  na  rozpatrywany  obiekt,  a dzięki  odpo- 
wiedniemu doborowi  układu  zastępczego  lub  jego 
modyfikacji  umożliwiają  polepszenie  cech  obiektu 
badanego. 

Często  stosowanym  modelem  analogowym  jest  mo-  model  geo- 
del  geometryczny.  Model  geometryczny  przedstawia  metryczny 
badany  obiekt  w zmienionej  skali  (najczęściej  zmniej- 
szonej), przy  czym,  żeby  był  spełniony  warunek  wza- 
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modeli 


modele 

optyczne 


fale  ciśnie- 
niowe 


jemnej  proporcjonalności  parametrów,  musi  być 
spełniona  zależność: 

n = l0/Im  = Vm/v0> 


gdzie  n jest  współczynnikiem  skali,  /0  i lm  — odpo- 
wiednio liniowym  wymiarem  obiektu  i modelu,  vm 
i v0  — częstością  pomiarową  obiektu  i modelu.  Ba- 
danie modelowe  obiektu  w funkcji  częstości  pociąga 
za  sobą  konieczność  odwzorowania  charakterystyk 
częstościowych  właściwości  akustycznych  materiałów 
(np.  współczynnika  pochłaniania)  lub  właściwości 
ośrodka  (współczynnika  tłumienia  fali  akustycznej 
przez  powietrze),  co  jest  dosyć  trudne  zwłaszcza  przy 
dużych  współczynnikach  skali.  Warunkiem  efektyw- 
nego korzystania  z modeli  geometrycznych,  jest  ich 
bardzo  precyzyjne  wykonanie,  co  pociąga  za  sobą 
dość  duże  koszty. 

Wymienione  powyżej  wady  i zalety  poszczególnych 
modeli  sprawiają,  że  każdy  z nich  może  być  stosowany 
do  odmiennych  celów. 

xModelowanie  cyfrowe  stosowane  jest  np.  do  obli- 
czeń tłumików  hałasu  metodą  elementu  skończonego. 
Badany  tłumik  dzielony  jest  na  obszary  o znanych 
lub  nie  znanych  warunkach  brzegowych,  w wyniku 
czego  otrzymujemy  rozwiązanie  układu  kilkudzie- 
sięciu równań  algebraicznych.  Modelowanie  analo- 
gowe przydatne  bywa  przy  modelowaniu  przetworni- 
ków elektroakustycznych  (głośników,  mikrofonów, 
czujników)  lub  filtrów  akustycznych  używanych  w 
tłumikach  hałasu.  Do  analizy  tych  urządzeń  wyko- 
rzystywane są  również  elektryczne  modele  analogowe. 

Modelowanie  geometryczne  stosowane  jest  przede 
wszystkim  do  badania  sal,  badania  wnętrz  urbani- 
stycznych oraz  badania  przegród  izolacyjnych  (-► 
Hałas). 

Do  badania  sal  wykonuje  się  model  w zmniejszonej 
skali  i stosuje  się  sygnał  o odpowiednio  wyższej  czę- 
stości; bada  się  w ten  sposób  rozkład  fal  odbitych 
w zależności  od  kształtu  sali  jak  i rozłożenia  materia- 
łów dźwiękochłonnych. 

Szeroko  rozpowszechnione  są  badania  techniką 
impulsową,  która  umożliwia  określenie  nie  tylko  roz- 
kładu fal  odbitych,  lecz  również  odstępów  czasu  do- 
chodzenia kolejnych  fal  odbitych,  co  ma  bardzo  duże 
znaczenie  dla  akustyki  wnętrz. 

Wygodną  metodą  jakościową  badania  sal  (ilościową 
nie,  gdyż  nie  ma  proporcjonalności  parametrów) 
mogą  być  realizowane  za  pomocą  modelu  optycznego, 
którego  kształt  odpowiada  kształtowi  sali.  Własności 
odbijające  ścian  odwzorowane  są  za  pomocą  po- 
wierzchni lustrzanych,  natomiast  własności  pochła- 
niające — za  pomocą  powierzchni  matowych.  Wiązki 
fal  akustycznych  zastąpione  są  wiązkami  świetlnymi 
wychodzącymi  z punktowego  źródła  światła.  Foto- 
grafia uzyskanego  rozkładu  fal  odbitych  (zob.  obok) 


Fotografia  rozkładu  fał  odbitych  uzyskanego  w modelu  optycz- 
nym 


umożliwia  znalezienie  obszarów  zagęszczenia  i roz- 
rzedzenia energii  fal  odbitych,  co  można  korygować 
poprzez  zmianę  kształtu  modelu  lub  zmianę  roz- 
mieszczenia powierzchni  matowych. 

Modele  urbanistyczne  przedstawiają  w zmniejszo- 
nej skali  wycinek  wnętrza  urbanistycznego  złożonego 
z arterii  komunikacyjnych  i zabudowy  oraz  odpo- 
wiednio odwzorowują  źródła  hałasu  z uwzględnieniem 
zarówno  ich  rozmiarów,  jak  i zakresu  częstości.  Celem 
badań  jest  projektowanie  takiej  lokalizacji  budynków 
mieszkalnych  i budynków  ekranujących,  by  hałas 
arterii  komunikacyjnych  dochodzący  do  wnętrza 
budynków  mieszkalnych  był  jak  najmniejszy.  Badania 
te  utrudnia  konieczność  stosowania  dużego  współ- 
czynnika skali,  co  przesuwa  znacznie  zakres  częstości 
w modelu  i w dużym  stopniu  uniemożliwia  odwzoro- 
wanie współczynnika  tłumienia  powietrza,  który 
zmienia  się  wraz  z częstością. 

Badania  modelowe  własności  izolacyjnych  przegród 
i osłon  przeciwdźwiękowych  nie  wymagają  tak  dużej 
zmiany  skali  częstości,  gdyż  nie  jest  konieczne  sto- 
sowanie dużych  współczynników  skali.  Utrudnieniem 
w tego  rodzaju  badaniach  powodującym  to,  że  wyniki 
mają  charakter  przybliżony  stanowi  nieharmonicz- 
ność  rozkładu  częstości  drgań  własnych  płyt  i jego 
zależności  od  sposobu  zamocowania,  wskutek  czego 
zmiana  wymiarów  badanego  obiektu  nie  zmienia 
proporcjonalnie  częstości  rezonansowych.  Dlatego 
też  — szczególnie  w wypadku  osłon  — badania  mo- 
delowe są  przydatne  w stosunku  do  materiałów  i obiek- 
tów silnie  tłumionych,  dla  których  wpływ  częstości 
rezonansowych  odgrywa  mniejszą  rolę. 


modele 

urbani- 

styczne 


badania 
modelowe 
przegród 
i osłon 


Fale  uderzeniowe 

Wiktor  Jung  owski 


Fala  uderzeniowa  jest  frontem  gwałtownego  wzro- 
stu ciśnienia,  temperatury,  gęstości  i prędkości  ośrod- 
ka ciągłego,  którym  może  być  gaz,  ciecz  lub  ciało 
stałe.  Gwałtowność  tego  wzrostu  powoduje  nieod- 
wracalność przemiany  przy  sprężaniu  ośrodka  przez 
falę  uderzeniową.  Oznacza  to,  że  ośrodek  rozprężony 
z powrotem  do  ciśnienia  początkowego  ma  tempera- 
turę wyższą  od  początkowej.  Wzrost  wymienionych 
wyżej  wielkości  nie  pociąga  za  sobą  nieodzownie  ich 
obniżenia,  tak  jak  w fali  akustycznej  lub  fali  na  po- 
wierzchni cieczy,  kiedy  to  ośrodek  zostaje  przemiesz- 
czony względem  stałego  średniego  położenia.  W tzw. 
falach  ciśnieniowych  nawet  znaczne  sprężanie  lub 
rozprężanie  ośrodka  odbywa  się  stopniowo  i prze- 
miany są  odwracalne.  W falach  akustycznych  przy- 
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rosty  ciśnienia  są  bardzo  małe  a prędkość  stała  (za- 
leżna od  ściśliwości  ośrodka). 

W falach  ciśnieniowych  zgęszczeniowych  i w falach 
uderzeniowych  wyróżniamy  czoło  fali,  tzn.  stronę, 
od  której  rozpoczyna  się  wzrost  ciśnienia,  i tyj  fali  — 
miejsce,  w którym  wzrost  ten  się  kończy.  Analogicz- 
nie czołu  rozrzedzeniowej  fali  ciśnieniowej  odpo- 
wiada początek  spadku  ciśnienia,  a tyłowi  — koniec. 

Prędkość  fali  uderzeniowej  względem  ośrodka  jest  prędkość 
zawsze  większa  od  prędkości  dźwięku  i rośnie  z jej  ud©-  _ 
natężeniem,  określonym  stosunkiem  przyrostu  ciśnie-  rzeniowej 
nia  do  ciśnienia  przed  falą.  W gazach  prędkość  ta 
może  przekraczać  wielokrotnie  prędkość  dźwięku, 
w cieczach  i ciałach  stałych,  nawet  jeśli  fale  mają 
bardzo  duże  natężenie,  jest  z nią  porównywalna. 


Prędkość  dźwięku  w gazach  o umiarkowanej  tem- 
peraturze jest  na  ogół  mniejsza,  a w cieczach  większa 
od  1 km/s,  natomiast  w ciałach  stałych  osiąga  kilka 
km/s.  Na  przykład  prędkość  dźwięku  przy  tempera- 
turze 20 °C  wynosi  w powietrzu  0,34  km/s,  w w-odzie 
1,46  km/s  i w stali  4,99  km/s.  Stosunek  prędkości  fali 
liczba  uderzeniowej  do  prędkości  dźwięku  przed  nią  jest 
Macha  nazywany  liczbą  Macha  Ms.  W wypadku  jądrowej 
eksplozji  w powietrzu  Ms  ma  wartość  ponad  3000, 
co  odpowiada  prędkości  fali  ok.  1000  km/s.  Ze  wzro- 
stem natężenia  fali  uderzeniowej  rośnie  temperatura 
za  jej  czołem  i w gazach  może  wynosić  od  kilkuset 
do  milionów  K.  Dolnej  granicy  odpowiada  fala  poru- 
szająca się  przed  kulą  karabinową,  a górnej  — fala 
wywołana  wspomnianą  wyżej  eksplozją  jądrową. 

Fale  uderzeniowe  powstają  na  skutek  gwałtownego 
wyzwolenia  energii,  np.  przy  eksplozji  materiału  wy- 
buchowego lub  eksplozji  jądrowej,  pęknięciu  zbior- 
nika z parą  lub  gazem  o wysokim  ciśnieniu,  wyłado- 
źródła  fal  waniu  elektrycznym,  wybuchu  wulkanu,  wypływie 
uderzenio-  gazu  lub  pary  z prędkością  naddźwiękową.  Ciała  po- 
wych  ruszające  się  z prędkością  nadźwiękową  względem 
ośrodka,  takie  jak  meteoryty,  pojazdy  kosmiczne, 
pociski  lub  samoloty,  są  również  źródłem  fal  uderze- 
niowych. Fala  uderzeniowa  jest  wtedy  wywołana 
ruchem  ciała  w ośrodku  stawiającym  opór.  W wyniku 
tego  ciało  albo  zmniejsza  prędkość,  tak  np.  jak  kabina 
pojazdu  kosmicznego  w atmosferze  (energia  kine- 
tyczna kabiny  zamienia  się  w fali  uderzeniowej  na 
ciepło),  albo  porusza  się  ze  stałą  prędkością,  tak  jak 
samolot  napędzany  silnikami.  Wówczas  siła  oporu 
jest  pokonywana  kosztem  energii  wyzwolonej  z pa- 
liwa. Zawsze  jednak  powstanie  lub  istnienie  fali  ude- 
rzeniowej musi  mieć  źródło  energii.  W pobliżu  źródła 
fale  mogą  być  bardzo  silne,  ale  rozprzestrzeniając  się 
zmniejszają  swoje  natężenie  (i  prędkość)  i stopniowo 
zanikają,  przeradzając  się  w słabe  zaburzenia  aku- 
styczne. Proces  zanikania  dokonuje  się  na  najdłuższej 
drodze  w gazach,  na  krótszej  w cieczach  i najkrótszej 
w ośrodkach  stałych. 

znaczenie  fal  Zjawisko  fizyczne,  jakim  jest  fala  uderzeniowa, 
uderzenio-  ma  dla  człowieka  różnorodne  znaczenie.  Jako  nie- 
wych  kontrolowana  siła  przyrody  fala  uderzeniowa  może 
stanowić  zagrożenie.  Można  tu  wymienić  fale  ude- 
rzeniowe spowodowane  wyładowaniem  energii  elek- 
trycznej w atmosferze  (uderzenie  pioruna),  ruchem 
meteorytu  w pobliżu  powierzchni  Ziemi  z prędkością 
naddźwiękową  i jego  upadkiem  oraz  wypływem  ga- 
zów i lawy  podczas  wybuchu  wulkanów.  Takimi  nie- 
kontrolowanymi zjawiskami  przyrody  są  rówmież 
trzęsienia  Ziemi  wywołujące  fale  typu  fali  uderzenio- 
wej biegnące  w płaszczu  i skorupie  ziemskiej  lub  fale 
powodujące  ruch  olbrzymich  mas  w'ody  w oceanach 
(fale  tsunami),  a także  huragany  lub  tajfuny  powodu- 
jące powstawanie  na  powierzchniach  mórz  i oceanów 
stromych  fal  podobnych  do  fali  przypływu.  Kontro- 
lowane przez  człowieka  fale  uderzeniowe  mogą  być 
środkiem  niszczenia,  bądź  pomocą  w kształtowaniu 
terenu,  zarówno  na  powierzchni  Ziemi  jak  i w jej 
wnętrzu,  czy  też  na  dnie  zbiorników  wodnych, 
zastosowanie  Możliwość  wytwarzania  wysokich  ciśnień  i ternpe- 
faS  ude-  ratur  za  pomocą  fal  uderzeniowych  znalazła  wiele 
rzeniowych  zastosowań.  Na  pierwszym  miejscu  należy  wymienić 
instalacje  badawcze:  rury  uderzeniowa,  niektóre  tu- 
nele aerodynamiczne  i wyrzutniki,  służące  do  badań 
opływu  ciał  z dużymi  prędkościami,  badań  własności 
gazów  itp.  Bezpośrednie  praktyczne  zastosowanie 
znalazły  fale  uderzeniowe  w instalacjach  zapłonowych, 
w których  wytwarzają  wysoką  temperaturę  gazu,  jako 
źródła  dźwięku  o bardzo  wysokim  poziomie  (uzyski- 
wane za  pomocą  oscylujących  fal  uderzeniowych),  w 
badaniach  geologicznych  (rejestracja  ruchu  fal  w 
gruncie  wywołanych  wybuchami  w różnych  punktach 
badanego  terenu),  przy  produkcji  diamentów  z gra- 
fitu przez  poddawanie  go  bardzo  wysokiemu  ciśnie- 
niu, w tłoczeniu  blach  (poddawanych  działaniu  fal 
uderzeniowych  wytworzonych  w wodzie  przy  wy- 
buchu), w wykonywaniu  otworów  (impulsowym 


strumieniem  cieczy  o bardzo  dużej  prędkości)  oraz 
w wytwarzaniu  silnych  wibracji  elementów  mechanicz- 
nych. 

Ze  względu  na  liczbę  współrzędnych  opisujących 
ruch  fali  względem  ośrodka  można  rozróżnić  fale 
jedno-,  dwu-  i trójwymiarowe.  Fale  jednowymiarowe 
— to  fale  płaskie,  cylindryczne  i kuliste  (rys.  1).  Wy- 
kresy na  rys.  1 przedstawiają  zmianę  położenia  * fali 
w czasie  /,  poczynając  od  chwili  początkowej  t = 0 
do  t = t\  inaczej  mówiąc  — linię  ruchu  fali.  Rysunki  linia  ruchu 
pod  wykresami  uwidoczniają  tylko  położenia  po-  fali 
czątkowe  i końcowe  faii  uderzeniowej.  Można  wyka- 
zać, pomijając  tłumiące  działanie  lepkości  gazu,  że 
prędkość  fali  płaskiej  jest  stała,  a cylindrycznej  i ku- 
listej maleje  w miarę  oddalania  się  od  punktu  wyjścio- 
wego. Wszystkie  te  fale  napotykając  obiekt,  który 
powoduje  ich  odbicie  i dyfrakcję,  mogą  się  przero- 
dzić w fale  dwu-  lub  trójwymiarowe. 


Rys.  1.  Linie  ruchu  fal  uderzeniowych  (wykresy  x-t)  obrazujące 
położenie  w czasie:  a)  fali  płaskiej,  b)  cylindrycznej,  c)  kulistej. 

Kolorem  niebieskim  zaznaczono  obszary  wysokiego  ciśnienia 

W odniesieniu  do  fal  uderzeniowych  występują-  fale  o małym 
cych  w gazie  nasuwa  się  podział  na  fale  o małym  na-  natężeniu 
tężeniu,  w których  temperatura  pozostaje  na  umiarko- 
wanym poziomie  i odgrywają  rolę  tylko  stopnie  swo- 
body związane  z przesunięciami  i obrotami  molekuł, 
oraz  na  fale  o dużym  natężeniu,  w których  tempera- 
tura jest  na  tyle  wysoka,  że  zostają  wzbudzone  stop- 
nie swobody  związane  z drganiami  atomów  w mole- 
kule, dysocjacją,  wzbudzeniem  atomu  i jonizacją. 

W pierwszym  wypadku  do  osiągnięcia  przez  gaz  sta- 
nu równowagi  termodynamicznej  wystarcza  kilka 
zderzeń.  Grubość  fali  (Ii  na  rys.  2)  jest  wówczas 
rzędu  drogi  swobodnej  molekuły  (w  warunkach  at- 
mosferycznych Lx  x 0,02  jim).  W drugim  wypadku 
natomiast  osiągnięcie  stanu  równowagi  po  wzbudzę-  fale  o dużym 
niu  wymaga  liczby  zderzeń  większej  o kilka  rzędów  natężeniu 
wielkości  i wówczas  za  warstwą  Ix  znajduje  się  znacz- 
nie grubsza  strefa  I2,  w której  parametry  gazu  ulegają 
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dalszej  zmianie,  aż  do  osiągnięcia  przez  gaz  stanu  rów- 
nowagi termody  namicznej. 

Podobną  strukturę  ma  fala  detonacyjna,  w której 
za  warstwą  Lx  występuje  strefa  spalania,  a więc  strefa 
reakcji  chemicznej.  Jeżeli  ogrzany  gaz  za  falą  uderze- 
niową silnie  promieniuje,  to  parametry  gazu  przed 
falą  zmieniają  się  w miarę  jej  zbliżania,  w wyniku 
ogrzewania  się  gazu.  W plazmie  mogą  pojawić  się 
także  fale  uderzeniowe,  w których  poza  ciśnieniem 


Rys.  2.  Zmiana  parame- 
trów gazu  (ciśnienia,  gę- 
stości, temperatury  i pręd- 
kości) w fali  uderzeniowej 
o małym  natężeniu  (krzy- 
wa niebieska)  i fali  uderze- 
niowej o dużym  natężeniu 
(krzywa  czarna),  biegną- 
cych w dodatnim  kierun- 
ku osi  x;  Li  grubość  fali 
o małym  natężeniu,  LŁ-f  L, 
grubość  fali  o dużym  na- 
tężeniu 


gazu  odgrywają  rolę  siły  wywołane  obecnością  pola 
magnetycznego,  zależne  od  przenikalności  magnetycz- 
nej plazmy,  natężenia  przepływającego  w niej  prądu 
elektrycznego  i natężenia  pola  magnetycznego, 
fałe  W przestrzeni  kosmicznej  wiatr  słoneczny,  będący 
uderzeniowe  strumieniem  cząstek  wyrzuconych  przez  Słońce  i po- 
w przestrzeni  ruszających  się  z prędkością  naddźwiękową  (ok.  400 
kosmicznej  km/s),  przy  zetknięciu  z ziemskim  polem  magnetycz- 
nym powoduje  powstanie  fali  uderzeniowej.  W istnie- 
jących tam  warunkach  silnego  rozrzedzenia  cząstek, 
fala  uderzeniowa  wożę  mieć  grubość  tysięcy  kilome- 
trów. Fala  taka  powstaje  nie  w wyniku  zderzeń  czą- 
stek, lecz  jedynie  w wyniku  oddziaływań  elektromag- 
netycznych. Oddziaływania  te  powodują,  że  tempera- 
tura za  frontem  fali  jest  co  najmniej  dziesięciokrotnie 
wyższa  niż  w wietrze  słonecznym  przed  nim.  Powsta- 
nie fali  uderzeniowej  zmienia  strukturę  magnetosfery 
w sposób  mogący  ulegać  fluktuacjom  w czasie,  ponie- 
waż własności  wiatru  słonecznego  zależą  od  aktywno- 
ści Słońca.  Jest  to  przyczyną  zjawisk  obserwowanych 
bezpośrednio  na  Ziemi,  takich  jak  burze  magnetyczne 
czy  zorze  polarne.  Źródłem  fal  uderzeniowych  w prze- 
strzeni kosmicznej  są  również  wybuchy  słoneczne. 

Rozpatrując  fale  uderzeniowe  w układzie  odnie- 
sienia związanym  z obiektem,  na  który  oddziałują, 
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rozróżniamy  fale  biegnące,  stacjonarne  i oscylujące. 
Oczywiście  układ  odniesienia  nie  zmienia  własności 
fa!  ani  związków  między  parametrami  ośrodka  przed 
i za  falą.  Zależą  one  od  względnej  prędkości  fali 
i ośrodka.  Natomiast  dla  obiektu,  na  który  działa 
fala,  jest  istotne,  czy  przemieszcza  się  ona  względem 
niego  czy  też  nie. 


Fale  biegnące 

Jeżeli  gaz  o wysokim  ciśnieniu  (obszary  niebieskie  na 
rys.  1)  jest  oddzielony  ścianką  od  otoczenia,  to  pęk- 
nięcie ścianki  powoduje  wypływ  gazu  i utworzenie  się 
fali  uderzeniowej.  Ilustracja  170  (tabl.  45)  przedstawia 
obraz  przepływu,  odpowiadający  rys.  lc,  otrzymany 
metodą  smug  (nazywaną  również  metodą  Teplera, 
w której  wykorzystuje  się  zależność  kąta  odchylenia 
promienia  świetlnego  od  pierwszej  pochodnej  gęstości 
gazu),  po  upływie  150  ps  od  pęknięcia  szklanej  kuli 

0 średnicy  5 cm.  Kula  była  wypełniona  powietrzem 

1 pękła  przy  ciśnieniu  3,6  MPa.  Na  zdjęciu  widzimy 
kulistą  falę  uderzeniową  Sy  front  C wypływającego 
z kuli  powietrza  i popękaną  ściankę  G kuli.  Przepływ 
powietrza  wydostającego  się  pomiędzy  fragmentami 
ścianki  z wnętrza  kuli  jest  silnie  burzliwy,  w odróż- 
nieniu od  przepływu  powietrza  otaczającego  kulę 
i wprawianego  w ruch  przez  falę  uderzeniową.  Frag- 
menty ścianki  kuli,  z powodu  swojej  bezwładności, 
są  niewiele  przesunięte  względem  początkowego  po- 
łożenia. 

Podobne  zjawiska  występują  przy  przerwaniu  prze- 
pony w rurze  uderzeniowej  — urządzeniu  służącym 
m.in.  do  wytwarzania  i badania  fal  uderzeniowych. 
Wzdłuż  rury  przemieszcza  się  wtedy  płaska  fala  ude- 
rzeniowa (rys.  la).  Źródłem  fali  uderzeniowej  jest 
również  gwałtowne  otwarcie  zaworu  oddzielającego 
gaz  o różnych  ciśnieniach.  Wypływ  gazów  procho- 
wych, po  opuszczeniu  lufy  przez  pocisk,  wywołuje 
silną  falę  uderzeniową  S2  (il.  174,  tabl.  45).  Pocisk  jest 
słabo  widoczny  w ciemnych  gazach  prochowych,  jego 
wierzchołek  znajduje  się  blisko  fali  S2.  Fala  uderze- 
niowa Sx  powstała  wcześniej  i jest  wynikiem  dyfrakcji 
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Rys.  3.  Powstawanie  fali  uderzeniowej  wskutek  ruchu  tłoka  (a) 
i przebiegi  w czasie  ciśnień  (b)  mierzonych  przetwornikami  a i b 
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prostopadłej  fali  uderzeniowej  wytworzonej  w lufie 
przed  pociskiem.  Obie  fale  i ich  odbicia  od  Ziemi  oraz 
otaczających  obiektów  są  głównymi  źródłami  sły- 
szanego przy  wystrzale  huku. 

Mechanizm  generowania  fali  uderzeniowej  przez 
poruszający  się  w przewodzie  pocisk  lub  tłok  jest 
następujący.  Tłok,  znajdujący  się  w chwili  początko- 
wej w spoczynku,  zostaje  wprawiony  w ruch  działającą 
nań  różnicą  ciśnień  i gwałtownie  przyspiesza.  Po- 
pychając stykający  się  z nim  gaz  wytwarza  on  słabe 
zaburzenia  zgęszczeniowe  biegnące  wzdłuż  przewodu. 
Zastępując  ciągły  przyrost  prędkości  tłoka  przyro- 
stami skończonymi  możemy  przedstawić  jego  linię 
ruchu  i przemieszczanie  się  zaburzeń  w sposób  poka- 
zany na  rys.  3a.  Prędkość  zaburzeń  względem  prze- 
wodu jest  sumą  prędkości  gazu  i prędkości  dźwięku 
w gazie.  Ponieważ  w miarę  rozpędzania  się  tłoka  ro- 
sną obie  prędkości  (prędkość  dźwięku  na  skutek 
podwyższania  się  temperatury  sprężanego  gazu),  to 
zaburzenia  wytworzone  później  doganiają  wcześniej- 
sze, i czoło  fali  ciśnieniowej  staje  się  coraz  bardziej 
strome  tworząc  falę  uderzeniową.  Znajdujące  się  w 
ściance  przewodu  przetworniki  ciśnienia  a i b umoż- 
liwiają zarejestrowanie  na  ekranie  oscyloskopu  prze- 
biegów ciśnienia  w czasie  (rys.  3b).  Jak  widać,  dla 
danej  prędkości  tłoka  przyrost  ciśnienia  w fali  ude- 
rzeniowej jest  mniejszy  niż  w izentropowej  fali  ciśnie- 
niowej (pq<Pa\  co  powoduje  powstanie  zaburzeń 
rozrzedzeniowych  (rys.  3a).  Przyczyną  tego  jest  wzrost 
entropii,  wynikający  z nieodwracalnej  zamiany  części 
energii  mechanicznej  na  cieplną  w fali  uderzeniowej. 

Płaska  fala  uderzeniowa,  biegnąca  wzdłuż  przewo- 
du o stałym  przekroju,  zmniejsza  stopniowo  swoje 
natężenie  na  skutek  tarcia  gazu  o ściankę.  Gdy  fala 
biegnie  wzdłuż  przewodu  o perforowanej  ściance  (np. 
w tłumiku  hałasu  wylotowego  gazu  o wysokim  ciśnie- 
niu lub  w tłumiku  odrzutu  lufy  działa),  to  ulega  ona 
osłabieniu  także  z powodu  wypływu  gazu  do  otocze- 
nia. Na  zdjęciu  (ii.  168,  tabl.  44)  przepływu  perforowa- 
ną rurą  z szybami  optycznymi  w części  centralnej  są 
widoczne : płaska  fala  uderzeniowa  SQ  w przewodzie, 
front  C gazu  wypływającego  przez  otwory  z prędkością 
krytyczną  (czyli  równą  prędkości  dźwięku),  wywo- 
łane tym  zaburzenia  akustyczne  W sięgające  do  zakrzy- 
wionej fali  uderzeniowej  poruszającej  się  na  zewnątrz 
przewodu. 

Płaska  fala  uderzeniowa  trafiając  na  zmianę  prze- 
kroju przewodu  lub  inną  przeszkodę  ulega  odbiciu 
i dyfrakcji,  powstaje  złożony  układ  fal.  Na  zdjęciu 
(il.  169,  tabl.  44)  wykonanym  metodą  cieni  (wykorzy- 
stuje się  zależność  kąta  odchylenia  promienia  świetl- 
nego od  drugiej  pochodnej  gęstości  gazu)  jest  widocz- 
ny fragment  pola  przepływu  w kanale  o przekroju 
prostokątnym,  którego  ściany  boczne  wykonano  ze 
szkła  optycznego.  Można  wyróżnić:  płaską  falę  ude- 
rzeniową S0  biegnącą  wzdłuż  kanału  ponad  pionowo 
ustawionym  klinem,  odbitą  od  pochyłej  ścianki  klina 
falę  S2  i powstałą  w wyniku  dyfrakcji  fali  płaskiej  za- 
krzywioną falę  $x.  Z linii  (na  zdjęciu  punkt)  przecię- 
cia tych  fal  wychodzi  powierzchnia  (na  zdjęciu  krzy- 
wa) C nieciągłości  temperatury  i gęstości  gazu,  która 
łączy  się  z wirem  V przy  ostrzu  klina.  Ponadto  słabo 
widoczne  jest  czoło  fali  rozrzedzeniowej  R , biegną- 
cej pod  prąd  pomiędzy  pochyłą  ścianką  klina  a falą 
uderzeniową  S2. 

Przejście  fali  uderzeniowej  przez  kanał  może  sta- 
nowić fazę  początkową  ustalania  się  przepływu.  Na- 
stępuje to  wówczas,  gdy  są  utrzymywane  stałe  warun- 
ki zasilania.  Na  il.  175  (tabl.  45)  są  widoczne  kolejne 
zmiany  struktury  przepływu  za  płaską  falą  uderze- 
niową, prowadzące  do  utworzenia  stacjonarnych, 
skośnych  fal  uderzeniowych  w początkowym  odcinku 
kanału.  Ich  obecność  wskazuje,  że  przepływ  jest  nad- 
dźwiękowy.  Prędkość  fali  płaskiej  na  wejściu  do  ka- 
nału jest  rzędu  1 km/s.  Na  ostatnim  zdjęciu  widać 
dyfrakcję  fali  po  wyjściu  z kanału. 

Samolot  lecący  z prędkością  naddźwiękową  wy- 
twarza układ  fal  uderzeniowych  i rozrzedzeniowych. 


które  w wyniku  wzajemnego  oddziaływania  docierają 
do  powierzchni  Ziemi  jako  tzw.  fala  N,  o dwóch  fala  N 
skokowych  przyrostach  ciśnienia  odbieranych  przez 
ucho  ludzkie  jako  dwa  odgłosy  (rys.  4)  z przerwą  ź 
wynoszącą  dla  samolotu  myśliwskiego  0,1  s a dla 
dużego  samolotu  transportowego  0,35  s.  Wielkość 
przyrostu  ciśnienia  i poziom  wytwarzanego  dźwięku 
zależą  od  wielu  czynników,  np.  od  ciężaru  i wymia- 
rów samolotu,  wysokości  i prędkości  lotu,  rozkładu 
temperatury  w atmosferze,  turbulencji  powietrza. 


Rys.  4.  Fala  ciśnieniowa  N wytwarzana  przez  samolot  lecący 
z prędkością  naddźwiękową 


przyspieszenia  samolotu  i ukształtowania  powierzch- 
ni Ziemi.  Dodatni  przyrost  ciśnienia  w fali  N może 
w szczególnych  wypadkach  być  równoważny  nisz- 
czącemu działaniu  huraganu  (o  prędkości  ok.  35  m/s) 
na  ludzi,  pojazdy,  budynki  i środowisko  naturalne. 

Za  tolerowane  obciążenia  uważa  się  obciążenia  od- 
powiadające silnemu  wiatrowi  (prędkość  12  m/s). 

Jeżeli  występują  one  jednak  często,  np.  w rejonach 
lotnisk,  to  mogą  przyspieszać  starzenie  się  budynków, 
a ponadto  przez  nagłe  pojawianie  się  powodować  wy- 
padki pojazdów  oraz,  ze  względu  na  hałas,  wywoły- 
wać u ludzi  nerwice  i choroby  serca.  Aby  zapewnić 
bezpieczne  warunki  życia  na  Ziemi  wprowadza  się 
różne  ograniczenia  dotyczące  lotów  samolotów  nad- 
dźwiękowych. 

Istotne  jest  określenie  parametrów  gazu  za  falą  parametry 
uderzeniową:  prędkości,  temperatury,  ciśnienia  i gę-  gazu  za  falą 
stości.  Natężenie  fali  uderzeniowej  zależy  od  prędkości  uderzeniową 
jej  ruchu  względem  gazu.  Jeśli  ruch  fali  uderzeniowej 
będziemy  rozpatrywać  względem  nieruchomego  u- 
kładu  odniesienia  (rys.  5a),  to  jej  prędkość  można  wy- 
razić przez  sumę  prędkości  gazu  przed  falą  i prędkości 
fali  względem  gazu  (ux-r1V).  Wyróżnimy  obszar  1 
przed  falą  i obszar  2 za  falą.  W obszarze  1 prędkość 
gazu  oznaczymy  przez  ux  i prędkość  dźwięku  przez  au 
a w obszarze  2 — przez  u2  i a2,  przy  czym  ii2>ux 
i a2>ax.  Jak  już  wspominaliśmy  prędkość  fali  uderze- 
niowej względem  gazu  przed  jej  czołem  jest  zawsze 
naddźwiękową,  czyli  W>ax>  a więc 

u1+łV>u1+a1. 

Można  również  wykazać,  że 

ux+ W < u2+a2. 

Z nierówności  tych  wynika,  że  fala  uderzeniowa  doga- 
nia zaburzenia  akustyczne  biegnące  przed  nią  i jest 
doganiana  przez  biegnące  za  nią,  co  oznacza  wchła- 
nianie przez  falę  zaburzeń  biegnących  w jej  otoczeniu. 

Zwiążmy  teraz  układ  odniesienia  z ruchomą  falą; 
w układzie  tym  ruch  gazu  jest  ustalony  (jak  w wy- 
padku fali  stacjonarnej)  a jego  prędkość  jest  równa 
-W  w obszarze  / i u2-  (ux+  W)  w obszarze  //  (rys. 
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Rys.  5.  Ruch  fali  uderzeniowej  i gazu:  a)  w układzie  nieruchomym, 
b)  w układzie  związanym  z falą 


5b).  Stosując  do  gazu  przepływającego  przez  falę  ude- 
rzeniową zasady  zachowania  masy,  pędu  i energii 
otrzymamy  następujące  równania: 


QlW  = Qt[W±{Ul-U2)l  (1) 


Pi+QxW>  = p2+Q2l  W±(Ul-u2)]\  (2) 


W2 

~Y~ 


+h  i = 


[^fa-*2)]2 

2 


(3) 


w których  q jest  gęstością  gazu,  p — ciśnieniem, 
a h — entalpią  ( h = e-f-(/>/g),  gdzie  e — energia  we- 
wnętrzna). Znak  plus  odnosi  się  do  fali  biegnącej 
w dodatnim  kierunku  osi  x9  jak  na  rys.  5a,  natomiast 
minus  — do  fali  biegnącej  w kierunku  przeciwnym, 
parametry  W wypadku  słabych  fal  uderzeniowych  (o  małym  na- 
gazu  — fale  tężeniu),  tzn.  w zakresie  ciśnień  i temperatur,  przy 
słabe  których  wartości  ciepła  właściwego  (przy  stałym  ciś- 
nieniu i przy  stałej  objętości)  i ich  stosunek  x można 
przyjąć  za  stałe  dla  danego  gazu,  z powyższych  rów- 
nań uzyskuje  się  zależności  wyznaczające:  przyrost 
prędkości  gazu 


(4) 


stosunki  temperatur  bezwzględnych  (T  = 273-j-/°C) 


= 1-f 


2(*-l) 


(*+ 1)2 
stosunki  ciśnień 

*-  = i 

Pi 

stosunki  gęstości 


■"•‘'A?-'*-"}’ 

(5) 

• Źi  M 1); 

(6) 
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gdzie  Ms  = W jax  jest  liczbą  Macha  fali  uderzeniowej. 
Wyrażenia  (4)— (7)  są  słuszne  dla  fali  płaskiej,  cylin- 
drycznej i kulistej. 

Obliczmy  na  przykład  parametry  gazu  za  falą  i po 
jej  odbiciu  od  przeszkody,  tzn.  za  falą  odbitą,  w wy- 
padku fali  o Ms  — 2 (wywołanej  pęknięciem  zbiornika 
z gazem  będącym  podciśnieniem  kilku  MPa  lub  eks- 
plozją bomby  czy  pocisku),  biegnącej  w nierucho- 
mym (ux  = 0)  powietrzu  (x  = 1,4)  o temperaturze 
t ! = 15°C  = 340  m/s)  i ciśnieniu  0,1  MPa.  Z zależ- 

ności (4)-(6)  mamy  u2  — 425  m/s,  ł2  = 213°C  i p2  = 
= 0,45  MPa.  Fala  trafiająca  na  przeszkodę  ulega  od- 
biciu, a prędkość  przepływu  za  nią  maleje  do  zera 
(rys.  6).  Wykorzystując  warunek  u3  = 0,  z (4)  możemy 
obliczyć  Ms  fali  odbitej,  a z (5)  i (6)  znaleźć  odpo- 
wiednio t3  = 446°C  i p3  = 1,5  MPa.  Otrzymane  war- 
tości wskazują,  że  nawet  fala  uderzeniowa  o małym 
natężeniu  stwarza  poważne  obciążenia  obiektów  sto- 
jących na  jej  drodze;  w rozpatrywanym  przykładzie 
obciążenie  153  t/m2  ściany  jest  obciążeniem  niszczą- 
cym każdy  budynek. 


Rys.  6.  Odbicie  płaskiej  fali  

uderzeniowej  od  ściany  X 

W wypadku  fal  uderzeniowych  o dużym  natęże- 
niu, gdy  wartości  ciepła  właściwego  zmieniają  się 
wraz  z ciśnieniem  i temperaturą,  parametry  gazu  za 
falą  możemy  wyznaczyć  bezpośrednio  z równań 
(1)— (3),  wykorzystując  tablice  lub  wykresy  podające 
zależności  entalpii  od  gęstości  i ciśnienia  dla  danego 
gazu. 


Fale  stacjonarne  (nieruchome) 

W strumieniu  gazu  wypływającym  z dyszy  i rozpędzo- 
nym do  prędkości  naddźwiękowej  mogą  powstawać 
stacjonarne  fale  uderzeniowe  o różnych  kształtach  — 
zależnie  od  stosunku  ciśnienia  zasilania  do  ciśnienia 
otoczenia.  Na  il.  173  (tabl.  45)  jest  widoczny  strumień 
gazu  wypływający  z prędkością  krytyczną  z dyszy 
zbieżnej  o przekroju  kołowym  i osiągający  dalej 
prędkość  naddźwiękową  (stosunek  ciśnień  7,5).  W po- 
bliżu dyszy  powstaje  baryłkowa  ta  fala  uderzeniowa 
zakończona  płaską  falą  uderzeniową,  zwaną  dyskiem 
Macha.  Przy  wypływie  do  kanału  z dyszy  zbieżnej 
o przekroju  prostokątnym  powstaje  układ  skośnych 
fal  uderzeniowych  (il.  171,  tabl.  45),  rozpoczynający 
się  od  miejsca,  w którym  granica  strumienia  styka  się 
ze  ścianką  kanału  (lewa  strona  fotografii).  Prążki 
oznaczają  linie  stałej  gęstości  gazu;  ich  zagęszczenie 
świadczy  o dużej  zmianie  gęstości.  Obraz  prążków 
w otoczeniu  wylotu  dyszy  D wskazuje  na  malejącą  gę- 
stość rozprężającego  się  gazu,  a ich  zagęszczenie  na  li- 
niach skośnych  — na  wzrost  gęstości  gazu  przy  prze- 
pływie przez  falę  uderzeniową. 

Ruch  bryły  ze  stałą  prędkością  naddźwiękową 


obciążenie 
obiektów 
przez  falę 
uderzeniową 


dysk 

Macha 


skośne  fale 
uderzeniowe 


odsunięta 
fala  uderze- 
niowa 


stożkowa 
fala  uderze- 
niowa 


parametry 
prostopadłej 
fali  uderze- 
niowej 


w nieruchomym  gazie  powoduje  utworzenie  fali  ude- 
rzeniowej, stacjonarnej  względem  bryły.  Identyczna 
sytuacja  ma  miejsce,  gdy  nieruchoma  bryła  jest  opły- 
wana przez  gaz.  Takie  fale  są  widoczne  na  il.  177,  178, 
172,  176  (tabl.  45  i 46).  Przed  kulą  (ii.  177),  poruszają- 
cą się  z prędkością  nieco  większą  od  prędkości  dźwię- 
ku, w odległości  trochę  większej  od  jej  średnicy  po- 
wstaje zakrzywiona  i odsunięta  fala  uderzeniowa  S&, 
a na  kuli  następuje  oderwanie  warstwy  przyściennej 
gazu  i tworzy  się  silnie  burzliwy  obszar  zastoju  W.  Za 
odsuniętą  falą  uderzeniową  przepływ  względem  kuli 
jest  poddźwiękowy,  ale  przy  opływie  kuli  prędkość 
wzrasta  ponownie  do  naddźwiękowej.  Fakt  ten  i wy- 
chylenie granicy  obszaru  zastoju  na  zewnątrz  powodu- 
je powstanie  stożkowej  fali  uderzeniowej  St.  Zakrzy- 
wiona i odsunięta  fala  uderzeniowa  Sb  powstaje  rów- 
nież przed  zaokrąglonym  stożkiem  (il.  178)  poruszają- 
cym się  w powietrzu  z prędkością  naddźwiękową. 
Fala  ta  znajduje  się  blisko  stożka.  Ponadto  są  widocz- 
ne: fala  rozrzedzeniowa  R przy  podstawie  stożka, 
burzliwy  obszar  zastoju  T , stożkowa  fala  uderzeniowa 
St  wywołana  zakrzywieniem  się  granicy  śladu  aerody- 
namicznego oraz  fale  akustyczne  W spowodowane 
burzliwością  w tym  śladzie. 

Ilustracja  172  przedstawia  opływ  kabiny  kosmicznej 
z hiperdźwiękową  prędkością  (badanie  modelowe 
prowadzone  w tunelu  aerodynamicznym).  Za  odsu- 
niętą falą  uderzeniową  jest  widoczny  jarzący  się  gaz 
o wysokiej  temperaturze  (5000°C). 

Fale  uderzeniowe  powstające  przy  płaskim  opływie 
romboidalnego  profilu  (kąt  ostry  wynosi  14°)  z nad- 
dźwiękową prędkością  widoczne  są  na  il.  176.  Zczoło- 
wej  krawędzi  wychodzą  skośne  fale  uderzeniowe, 
a w rejonie  krawędzi  bocznych  widać  fale  rozrzedze- 
niowe. 

Parametry  prostopadłej  fali  uderzeniowej  można 
wyznaczyć  w prosty  sposób  w nieruchomym  układzie 
odniesienia  (rys.  5b).  Równania  zachowania  w tym  u- 
kładzie  są  następujące : 


QlUi  = CllUlU 

(la) 

Pl+QlUl  — Pll+guuu, 

(2a) 

(ut/D+hi  = (wiV2)+*n; 

(3a) 

ui  i un  — prędkości  gazu  za  i przed  falą.  Z powyższych 
równań  zamiast  wzoru  (4)  wyznaczamy  związeK  mię- 
dzy liczbami  Macha  przed  i za  falą 

MU  - («,*+  •^i)/(^ri 1 ) • <*> 

Do  określenia  stosunków  temperatur,  ciśnień  i gęs- 
tości wykorzystujemy  zależność  (5),  (6)  i (7)  podsta- 
wiając do  nich  Ms  — Mi. 

Ze  wzoru  (8)  wynika,  że  Mn  — Mu  gdy  Mi  ==  1, 
co  oznacza,  że  przy  przepływie  z prędkością  dźwięku 
nie  powstaje  stacjonarna  fala  uderzeniowa,  podob- 
nie jak  przy  M — 1 ruchoma  fala  uderzeniowa  staje 
się  zaburzeniem  akustycznym.  Gdy  Mi  -*  oo,  to  Mn 
— y ]/(«— l)/2x,  co  przy  x = 1,4  daje  Mn  ->  0,378. 
A więc  zakresowi  1 < M < oo  odpowiada  zakres 
l > Mn  > 0,378.  Ze  wzorów  (6)  i (7)  wynika,  że 
pujpi  ->  oo,  lecz  en/gi  ->(*-hl)/(*-l)a  przy  * = 1,4 
qhIqi  ->6.  Z powyższych  rozważań  wynika,  że 
przepływ  przed  prostopadłą  falą  uderzeniową  jest 
zawsze  naddźwiękowy  (Mi  > 1),  a za  nią  poddźwię- 
kowy  (Mn  < 1)  oraz,  że  adiabatyczne  sprężanie  gazu 
w fali  uderzeniowej  może  zwiększyć  gęstość  tylko 
w ograniczonym  zakresie  w odróżnieniu  od  sprężania 
izentropowego,  przy  którym  wzrost  gęstości  nie  jest 
ograniczony. 

Wykorzystując  równania  zachowania  w odniesieniu 
do  skośnej  fali  uderzeniowej  wywołanej  zmianą  kie- 
runku płaskiego  przepływu  o kąt  0 (rys.  7)  można 
wykazać,  że  zależności  między  parametrami  gazu 
przed  i za  falą  są  identyczne  jak  dla  fali  prostopadłej, 
jeżeli  się  rozpatruje  składowe  prędkości  w kierunku 
prostopadłym  do  fali  skośnej.  Możliwość  występo- 


wania skośnej  fali  uderzeniowej  jest  ograniczona  za- 
kresem wartości  M1iO.  Z równań  zachowania  wynika 
równanie  rodziny  krzywych,  z których  każda  odpo- 
wiada określonej  prędkości  gazu  przed  skośną  falą  biegunowe 
uderzeniową,  a opisuje  wektor  prędkości  gazu  za  falą  skośnej  fali  _ 
w zależności  od  kąta  0.  Krzywe  te,  nazywane  biegu-  uderzeniowej 


x 

Rys.  7.  Skośna  fala  uderzeniowa  przy  opływie  klina 


nowymi  skośnej  fali  uderzeniowej,  przedstawia  się 
na  ogół  w układzie  współrzędnych  u i v będących 
składowymi  w kierunku  odpowiednio  x i y prędkości 

gazu  Vy  lub  w układzie  współrzędnych  bezwymiaro- 
wych u = uja*  i v = v/a*.  ( a * krytyczna  prędkość 
dźwięku,  tzn.  prędkość  odpowiadająca  liczbie  Ma- 
cha M = 1).  Równanie  biegunowej  w tym  układzie  ma 


postać: 


(«i-w2)2(wi«2-l) 


ul  — UiU2-\-i 


(9) 


równanie 

biegunowej 


Parametrem  jest  tu  ux  równe  Vu  ponieważ  kierunek 
przepływu  niezakłóconego  pokrywa  się  z osią  x,  a więc 
vx  — 0.  Na  rys.  8 przedstawiono  biegunową  fali  u- 
derzeniowej  opisaną  wzorem  (9).  Przy  danej  wartości 


Vu  w zakresie  0 < 0 < 0™ ax,  istnieją  dwa  rozwią- 
zania określone  np.  punktami  2'  i 2".  Pierwsze  z nich 
odpowiada  mniejszej  zmianie  prędkości  niż  drugie, 
a więc  słabszej  fali  uderzeniowej.  Jak  wynika  z rysun- 
ku, za  słabszą  falą  przepływ  jest  nadal  naddźwiękowy 
(Vi  > 1),  a za  silniejszą  — poddźwiękowy  (Vz  < 1). 
Jeżeli  0 = 0max,  istnieje  tylko  jedno  rozwiązanie, 
a dla  0 > <3max  nie  ma  rozwiązania  dla  skośnej  fali 
uderzeniowej.  Stwierdzono  doświadczalnie,  że  przy 


Rys.  9.  Odsunięta  fala 
uderzeniowa  przy  opły- 
wie klina 


opływie  klina  swobodnym  strumieniem  występuje  opłYw^**na 
tylko  słaba  fala,  natomiast  w kanale  zamkniętym, 
jeśli  się  wytworzy  odpowiedni  poziom  ciśnienia  za 
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falą  uderzeniową,  można  wymusić  pojawienie  się 
silniejszej  fali.  Gdy  0 > 0max  występuje  fala  odsunię- 
ta (rys.  9),  jak  przed  bryłą  tępą  (ii.  172,  177,  178) 
a prędkość  K'2"  gazu  za  nią,  w miejscu  gdzie  jest  ona 
prostopadła,  określa  punkt  2'"  (rys.  8). 

Skośna  fala  uderzeniowa  ulega  odbiciu  od  ściany 
narzucającej  kierunek  przepływu  (rys.  10).  Prędkość 
V3  za  falą  odbitą  zależy  od  Vz  i odchylenia  strug 
z powrotem  o kąt  6.  Gdy  biegunowa  wychodząca 
z punktu  2 (rys.  lOb)  nie  przecina  osi  odciętych,  to 
odbicie  nie  jest  możliwe  odbicie  fali  skośnej  i wówczas  pow- 
Macha  staje  tzw.  odbicie  Macha  (porównaj  dysk  Macha  na 


stwę  laminarną  (czyli  uwarstwioną,  nieburzliwą)  pod 
prąd  powodując  wprost  jej  grubości,  a nawet  oderwa- 
nie od  ściany  i utworzenie  obszaru  wypełnionego  wi- 
rami. Pogrubianie  warstwy  poddźwiękowej  działa  na 
przepływ  naddźwiękowy  jak  zakrzywienie  ściany  wy- 
twarzając falę  zgęszczeniową,  która  w pewnej  odleg- 
łości przeradza  się  w falę  uderzeniową  A.  Fala  padają- 
ca docierając  do  oderwanej  warstwy  poddźwiękowej 
powoduje  z kolei  jej  odchylenie  w kierunku  ściany,  co 
jest  przyczyną  powstawania  fali  rozrzedzeniowej. 
Zetknięcie  się  warstwy  ze  ścianą  generuje  falę  zgęsz- 
czeniową, która  przeradza  się  w falę  uderzeniową  B. 
W wyniku  tych  wszystkich  procesów  poddźwiękowa 
warstwa  staje  się  grubsza  i burzliwa..  Ostatecznie 
w stosunkowo  niewielkiej  odległości  od  ściany  fale 
uderzeniowe  A i B oraz  znajdująca  się  między  nimi  fala 
rozrzedzeniowa  spotykają  się  i tworzą  pojedynczą, 
odbitą  falę  uderzeniową. 


Fale  oscylujące 


Rys.  10.  Odbicie  skośnej  fali  uderzeniowej  (a)  i odpowiednie 
biegunowe  (b) 

ii.  173,  tabl.  45)  składające  się  z trzech  fal  uderzenio- 
wych A,  B,  Ci  powierzchni  N nieciągłości  prędkości, 
gęstości  i temperatury  gazu  (rys.  11).  Prędkość  V2  jest 
w tym  wypadku  zbyt  mała,  aby  przy  danym  kącie  0 
mogła  utworzyć  się  odbita  skośnie  fala  uderzeniowa. 
Podobnie  przy  wypływie  z dyszy  nie  jest  możliwe  od- 
bicie stożkowej  fali  uderzeniowej  w osi  symetrii  i po 
obu  jej  stronach  powstają  struktury  przepływu  (il.  173) 
odpowiadające  schematowi  na  rys.  11. 


N 


Rys.  11.  Odbicie  Macha;  A,  B,  C fa- 
le uderzeniowe,  N powierzchnia  nie- 
ciągłości prędkości,  gęstości  i tempe- 
ratury gazu 

wpływ  Rozpatrując  fale  uderzeniowe  występujące  w po- 
warstwy  bhżu  opływanych  powierzchni  nie  zawsze  można  po- 
przyściennej  mijać  obecność  warstwy  przyściennej  wywołanej  lep- 
kością gazu,  tzn.  cienkiej  warstwy,  w której  prędkość 
przepływu  rośnie  gwałtownie  (od  zera  na  powierzchni) 
w miarę  oddalania  się  od  niej.  Wskutek  obecności 
warstwy  przyściennej,  odbicie  skośnej  fali  uderzenio- 
wej od  ciała  przebiega  w nieco  inny  sposób  niż  to 
pokazano  na  rys.  10.  Gdy  warstwa  ta  jest  bardzo 
cienka,  to  można  jej  wpływu  nie  uwzględniać.  Jak  już 
wiadomo,  stacjonarna  fala  uderzeniowa  pojawia  się 
tylko  w przepływie  naddźwiękowym  (M  > 1),  a więc 
musi  się  kończyć  na  granicy  warstwy  (rys.  12),  w któ- 
rej gaz  porusza  się  z prędkością  poddźwiękową  {M  < 
< 1).  Wskutek  tego  wzrost  ciśnienia  występujący  za 
falą  uderzeniową  przenika  przez  poddźwiękową  war- 


f.  zgęszczeniową 

w laminarna 
M<  1 


obszar  oderwania 


Rys.  12.  Współoddziaływanie  skośnej  fali  uderzeniowej  z war- 
stwą przyścienną 
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Rys.  13.  Przykłady  przepływu  pulsującego  z oscylującymi  falami 
uderzeniowymi:  a)  opływ  profilu  lotniczego  z prędkością  około- 
dżwiękcwą,  b)  opływ  cylindra  z iglicą  z prędkością  hiperdźwię- 
kową,  c)  wypływ  z prędkością  naddźwiękową  z dyszy  na  cylinder, 
d)  przepływ  dyszą  zbieżno-rozbieżną 


Stacjonarne  fale  uderzeniowe  występujące  w prze- 
pływie burzliwym  nie  są  nigdy  idealnie  nieruchome. 
Wskutek  pulsacji  prędkości  związanej  z burzliwością 
drgają  one  ze  znaczną  częstością,  ale  z bardzo  małą 
amplitudą.  W pewnych  jednak  wypadkach  w stacjo- 
narnym naddźwiękowym  przepływie  mogą  pojawić  się 
silne  oscylacje  fal  uderzeniowych,  przy  których  wy- 
stępują duże  zmiany  położenia  oraz  natężenia  fal, 
a czasem  nawet  ich  chwilowy  zanik. 

Ilustracja  179  (tabl.  46)  ukazuje  zmiany  (w  czasie 
jednego  okresu)  struktury  przepływu  w kanale  o prze- 
kroju prostokątnym  zasilanym  w sposób  ciągły  przez 
dyszę  zbieżną.  Gdy  ciśnienie  w obszarze  zastoju  tuż 
przy  dyszy  jest  małe,  to  w strumieniu  występuje  poje- 
dyncza zakrzywiona  fala  uderzeniowa  (il.  179a).  Na- 
stępnie strumień  odrywa  się  od  ściany  kanału  (il. 
179b),  ciśnienie  rośnie,  a fala  zanika.  Stopniowo  two- 
rzy się  struktura  komórkowa  (il.  179r,  d),  która  w mia- 


M>  i 
a)  a‘ 


Ał»l 


b) 

granica  strumienia 


puisacje  fal 
stacjonar- 
nych 


struktura 

komórkowa 


rę  spadku  ciśnienia  przeradza  się  z powrotem  w falę 
uderzeniową  (il.  179e,  f,  g)  i cykl  się  powtarza.  W tym 
wypadku  pulsacja  przepływu  przejawia  się  zasadniczy- 
mi zmianami  jego  struktury  oraz  silną  oscylacją  ciś- 
nienia w całym  kanale. 

mechanizm  Mechanizm  opisanej  pulsacji  przepływu  jest  praw- 
pułsacji  dopodobnie  następujący.  Przy  pewnej  wartości  sto- 
przepływu  sunku  ciśnienia  zasilania  do  ciśnienia  w obszarze 
zastoju  przy  dyszy,  rejon  przyklejenia  strumienia 
do  ścianki  kanału  powinien  znajdować  się  w okreś- 
lonym miejscu  zapewniającym  stałość  ilości  gazu 
w obszarze  zastoju.  Inaczej  mówiąc,  ilość  gazu  wy- 
pływająca wskutek  mieszania  z obszaru  zastoju  musi 
być  równa  ilości  dopływającej  z powrotem  z rejonu 
przyklejenia.  Odpowiadająca  wspomnianemu  stosun- 
kowi ciśnień  struktura  strumienia  jest  jednak  niesta- 
bilna i wskutek  wzajemnego  oddziaływania  może 
tworzyć  się  tzw.  pętla  sprzężenia  zwrotnego  między 
ciśnieniem  w obszarze  zastoju,  strukturą  strumienia 
i położeniem  rejonu  przyklejania.  Przypadkowe  za- 
burzenie obniżające  ciśnienie  w obszarze  zastoju 
zwiększa  rozprężanie  strumienia  przy  dyszy  i odpływ 
gazu  z tego  obszaru,  co  z kolei  pogłębia  dalej  ob- 
niżenie ciśnienia.  W rezultacie  rejon  przyklejenia 
i związana  z nim  fala  uderzeniowa  przesuwa  się  pod 
prąd  w kierunku  dyszy.  Ciśnienie  za  falą  uderzenio- 
wą rośnie  na  tyle,  że  poddźwiękowa  warstwa  odrywa 
się  od  ściany  i pojawia  się  silny  powrotny  przepływ 
do  obszaru  zastoju,  powodujący  wzrost  ciśnienia. 
W rezultacie  strumień  przy  dyszy  zwęża  się,  a rejon 
przyklejenia  oddala  od  niej.  Stopniowo  w-skutek 
wzrostu  ciśnienia  prędkość  przepływu  w kanale  roś- 


nie, a odpływ  z obszaru  zastoju  zwiększa  się,  to  z kolei 
pow-oduje  obniżenie  się  ciśnienia  i cykl  się  powtarza. 

Przy  danym  stosunku  przekroju  dyszy  do  przekroju 
kanału  pulsacja  przepływu  ma  pewne  pasmo  częstości 
ale  największe  amplitudy  oscylacji  ciśnienia  i fal 
uderzeniowych  występują  przy  określonej  długości 
kanału,  który  odgrywa  rolę  rezonatora. 

Podobnego  typu  oscylacje  fal  uderzeniowych  są  wysiępo- 
obserwowane  np.  przy  okołodźwiękowym  (M  nieco  wanie 
większe  od  jedności)  opływie  profilu  lotniczego  (rys.  fal  oscylują- 
ca), przy  hiperdźwiękowym  (M  > 1)  opływie  ciała  cych 
tępego  z iglicą  (rys.  13b),  przy  napływie  strumienia 
naddźwiękowego  na  przeszkodę  (rys.  13c)  bądź  przy 
wypływie  z dyszy  zbieżno-rozbieżnej,  tzw.  dyszy  La- 
vala.  Wszystkie  te  przypadki  odznaczają  się:  niesta- 
bilnymi w danych  warunkach  strukturami  fal  uderze- 
niowych, oddzielających  obszar  naddźwiękowy  od 
poddźwiękowego,  obecnością  warstwy  mieszania  na 
granicy  obszaru  oderwania  (rys.  13a,  b,  d)  lub  na  gra- 
nicy strumienia  (rys.  13c)  oraz  wzmożonym  wytwa- 
rzaniem hałasu  o dyskretnych  częstościach.  Regularne 
i silne  pulsacje  przepływu  występują  wtedy,  gdy  istnie- 
je sprzężenie  zwrotne  między  poszczególnymi  obsza- 
rami przepływu,  z wystarczającym  wzmocnieniem  od- 
działywań. Zakresy  częstości  oscylacji  fal  są  zależne  od 
wymiarów  geometrycznych  ciał  i parametrów  prze- 
pływającego gazu. 

1. 1.  Glass  Fale  uderzeniowe  i człowiek,  Warszawa  1980;  W.  M. 

Jungowski  Some  sclf  induced  super  sonie  flov<  oscillations,  J.  Próg. 

Aerospacc  Sci.  18,  151  (1978);  A.H.  Shapiro  The  Dynamics  and 
Thermodynamics  of  Compressible  Fluid  Flowy  New  York  1955-54; 

J.  B.  Zieldowicz,  J.  P.  Rajzer  Fizyka  udarnych  wołn  i wysoko - 
tiempieraturnych  gid rod  i na  m iczes  k ich  jawlenij,  Moskwa  1966. 
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Hałasem  jest  każdy  dźwięk,  który  działa  ujemnie 
na  człowieka.  Oddziaływanie  to  może  mieć  charakter 
przeszkadzający,  uciążliwy  lub  szkodliwy,  co  zale- 
ży przede  wszystkim  od  natężenia  hałasu  oraz  czasu 
jego  oddziaływania  na  człowieka. 

Hałasy  przeszkadzające  powodują  zmęczenie,  u- 
tudniają  wypoczynek,  rozpraszają  uwagę,  zmniej- 
szają zrozumiałość  mowy,  a także  u niektórych  ludzi 
mogą  działać  ujemnie  na  psychikę.  Hałasy  uciążliw-e 
o większym  natężeniu  lub  działające  w sposób  długo- 
trwały — oprócz  wymienionych  wyżej  skutków  są 
przyczyną  okresowego,  odwracalnego  przytępienia 
słuchu,  a także  stają  się  źródłem  schorzeń  o pod- 
łożu nerwicowym.  Hałasy  szkodliwe  prowadzą  do  cał- 
kowitej głuchoty  i wywołują  poważne  schorzenia 
o podłożu  nerwicowym.  Ponadto  prawie  całkowicie 
uniemożliwiają  ustne  porozumienie  się. 

Ze  względu  na  charakter  przebiegu  ciśnienia  aku- 
stycznego w funkcji  czasu  (rys.  1)  hałasy  można  po- 
dzielić na:  periodyczne  i nieperiodyczne  — w za- 
leżności od  tego,  czy  w przebiegu  ciśnienia  akustycz- 
nego występują  lub  nie  występują  regularne  powta- 
rzalności, na:  stacjonarne  i niestacjonarne  — w zależ- 
ności od  tego,  czy  poziom  hałasu  jest  stały  lub  zmienny 
oraz  na  hałas  ciągły  i przerywany  — w zależności  od 
tego,  czy  hałas  jest  długotrwały,  czy  też  występuje  tyl- 
ko w pewnych  przedziałach  czasu.  Jeśli  przedziały 
te  są  bardzo  krótkie  (poniżej  1 s),  wówczas  hałas 
nosi  nazwę  hałasu  impulsowego. 

Hałasy  nie  są  przebiegami  sinusoidalnymi  (tona- 
mi), lecz  wykazują  strukturę  złożoną.  Każdy  hałas 
stacjonarny  można  poddać  analizie  Fouriera  i przed- 
stawić w postaci  rozkładu  poziomu  ciśnienia  akus- 
tycznego w funkcji  częstości,  czyli  w postaci  widma 
częstości.  W przypadku  przebiegów  periodycznych 
jest  to  rozkład  amplitud  o określonych  częstościach 
tworzący  widmo  prążkowe;  w przypadku  przebiegów 
nieperiodycznych  jest  to  widmo  ciągłe  (rys.  2),  uzyska- 


ne przez  obliczenie  wartości  poziomu  ciśnienia  aku- 
stycznego w odpowiednich  przedziałach  (pasmach) 
częstości  Af.  Przy  J/->  0 rozkład  poziomu  ciśnienia 
akustycznego  nazywa  się  gęstością  widma.  Przykładem 
hałasów  periodycznych  jest  gwizd  lokomotywy,  pisk 
hamulców' ; przykładem  hałasów  nieperiodycznych  — 
szum  płynącej  wody,  syk  pary,  hałas  silnika  odrzu- 
towego. 

Widmo  częstości  hałasów  niestacjonarnych  lub 
impulsowych  zmienia  się  w funkcji  czasu,  co  prowa- 
dzi do  konieczności  analizy  hałasu  zarówno  w zależ- 
ności od  częstości  jak  i czasu. 


Ocena  i pomiar  hałasu 

Ocena  hałasu  za  pomocą  w-ielkości  fizycznych  nie 
pokrywa  się  z odczuciem  subiektywnym  przez  człowie- 
ka. Stąd  też  wynika  konieczność  stosowania  dwóch 
rodzajów  kryteriów  oceny  hałasu : obiektywnej  — po- 
legającej na  pomiarze  parametrów  fizycznych  hałasu, 
oraz  subiektywnej  — prowadzącej  do  oceny  hałasu  za 
pomocą  jednej  wielkości,  która  przy  równoczesnym 
uwzględnieniu  kilku  czynników  odzwierciedlałaby 
w'  przybliżeniu  wrażenia  psychoakustyczne.  Kryteria 
subiektywne  określa  się  przez  uśrednienie  wyników 
badań  wielu  ludzi. 

Podstawową  wielkością  określającą  subiektywne 
odczucie  dokuczliwości  hałasu  jest  hałaśliw-ość  wy- 
rażana w noysach.  Zróżnicowanie  odczucia  stopnia 
hałasu  przy  różnych  częstościach  obrazują  krzywe 
jednakowej  hałaśliwości  (rys.  3).  Można  z nich  odczy- 
tać wartości  natężenia  dźwięku  lub  ciśnienia  akustycz- 
nego, przy  których  hałasy  o różnych  częstościach  są 
jednakowo  dokuczliwe. 

Częściej  stosowaną  wielkością  określającą  su- 
biektywne odczucie  dźwięków  jest  głośność.  Zmiany 
w odczuciu  głośności  są  proporcjonalne  w przybli-  95-105 
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częstość  v 

Rys.  2.  Rodzaje  widm  częstości  hałasu 

żeni  u do  ilorazu  natężeń  dźwięku,  a nie  do  ich  różnic, 
dlatego  głośność  wyraża  się  w skali  logarytmicznej 
(tak  jak  i wielkości  fizyczne  — natężenie  dźwięku 
i ciśnienie  akustyczne  Przedmiot  i zakres  aku- 
styki). 

Poziom  głośności  dźwięku  Ls  określony  jest  na- 
stępująco: 

u = 10  lg  A 

ls  o 

gdzie  ls  i Iso  subiektywnie  odczuwane  natężenie 

dźwięku  i subiektywnie  odczuwana  wartość  progo- 
wa (granica  słyszalności).  Poziom  głośności  czys- 
tych tonów  (dźwięków  sinusoidalnych)  lub  dźwięków 
wąskopasmowych  określa  się  w fonach  za  pomocą 


krzywych  jednakowego  poziomu  głośności,  tzw.  krzy- 
wych izofonicznych  (rys.  4).  Interpretuje  się  je  w 
sposób  analogiczny  jak  krzywe  jednakowej  hałaśli- 
wości. 

Do  oceny  hałasów  niestacjonarnych  lub  przerywa- 
nych stosuje  się  pojęcie  poziomu  ekwiwalentnego 
wyrażonego  zależnością : 

n 

= W ii4l>10Wł’ 

l-i 

gdzie  ti  jest  czasem  oddziaływania  hałasu  o poziomie 
Lu  T — całkowitym  czasem  oddziaływania  hałasu, 
q — współczynnikiem  zależności  od  charakteru  ha- 
łasu {q  = 3-4).  Do  pomiaru  poziomu  ekwiwalentnego 
używa  się  dozymetrów  hałasu  umożliwiających  o- 
kreślenie  czasu,  po  którym  przekroczony  jest  poziom 
dopuszczalny. 


100-110 
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Poziom  głośności  hałasu  nazywany  jest  zazwyczaj 
poziomem  hałasu.  Metody  pomiaru  hałasu,  które 
dawałyby  wyniki  odpowiadające  jego  odczuciu  su- 
biektywnemu można  podzielić  na  metody  bezpo- 
średnie, polegające  na  stosowaniu  przyrządu  z wbudo- 
wanym układem  korekcyjnym  uwzględniającym  wła- 
sności słuchu,  oraz  metody  pośrednie  polegające  na 
pomiarze  wielkości  fizycznych  z zastosowaniem  od- 
powiedniej interpretacji  wyników. 

W obu  metodach  podstawowymi  elementami  przy- 
rządu pomiarowego  są:  mikrofon,  który  daje  na  wyj- 
ściu wielkości  elektryczne  proporcjonalne  do  ciśnienia 
akustycznego,  wzmacniacz,  dzielnik  zakresów  wyce- 
chowany  w decybelach  oraz  przyrząd  wskazówkowy. 

Do  określenia  krzywych  korekcyjnych  dla  metod 
bezpośrednich  korzysta  się  z krzywych  jednakowego 
poziomu  głośności.  Jak  wynika  z rys.  4 krzywe  te 
nie  przebiegają  równolegle,  co  powoduje,  że  krzywe 
korekcyjne  filtru  uwzględniające  zmiany  czułości 
słuchu  w funkcji  częstości  powinny  mieć  różny 
kształt  przy  różnych  wartościach  poziomu  głośności. 
Dla  uproszczenia  stosuje  się  jedną  uniwersalną  krzy- 
wą korekcyjną,  tzw.  krzywą  A (rys.  5).  Zastosowanie 
w przyrządzie  pomiarowym  filtru  korekcyjnego  o po- 
wyższej charakterystyce  powoduje  mniejsze  wzmoc- 
nienie w zakresie  częstości  niskich,  a tym  samym  daje 
wynik  pomiaru  zbliżony  do  subiektywnej  oceny  po- 
ziomu głośności.  Dla  podkreślenia,  że  pomiar  został 
wykonany  przy  użyciu  filtru  korekcyjnego  A uzyskane 
wyniki  podawane  są  w dB  (A).  Oprócz  krzywej  A sto- 
sowane są  również  inne  krzywe  korekcyjne,  z których 
najnowsza  jest  krzywa  D (rys.  5)  uwzględniająca  krzy- 
we jednakowej  hałaśliwości. 


Rys:  5.  Krzywe  korekcyjne  dla  poziomów  głośności  hałasu 
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Najprostszą  metodą  pośrednią  oceny  hałasu  jest 
metoda  liczb  N (rys.  6).  Metoda  ta  wymaga  zmierze- 
nia widma  częstości  hałasu,  które  przy  zastosowaniu 
tej  samej  skali  decybelowej  nanosi  się  na  krzywe  N. 
Widmo  częstości  mierzy  się  w pasmach  oktawowych, 
tzn.  takich,  których  szerokość  pasma  przepuszczania 
filtru  fi~f2  wyrażona  jest  stosunkiem  fjf%  = 2,  lub 
w pasmach  73-oktawowych,  którym  odpowiada  sto- 
sunek częstości  skrajnych  filtru  fjf2  ~ Yl.  Pomiar 
polega  na  przełączaniu  kolejnych  filtrów  i odczyty- 
waniu wartości  poziomu  ciśnienia  akustycznego  dla 
poszczególnych  pasm  częstości,  reprezentowanych 
przez  częstość  zawartą  w środku  pasma. 

Liczbę  N mierzonego  hałasu  wyznacza  się  z prze- 
cięcia jego  widma  częstości  z najwyżej  położną 
krzywą  N.  Przykład  dwóch  widm  częstości  naniesiony 
na  rys.  6 wskazuje,  że  dla  hałasu  reprezentowanego 
przez  widmo  I (krzywa  przerywana)  otrzymamy  liczbę 
N wynoszącą  95  dB  (N  95).  Dla  hałasu  reprezentowa- 
nego przez  widmo  II  (krzywa  ciągła)  otrzymamy  N 
100.  Wynika  stąd,  że  subiektywnie  hałas  II  jest  głoś- 
niejszy od  hałasu  I,  mimo  że  maksymalna  wartość 
poziomu  ciśnienia  akustycznego  widma  hałasu  II 
jest  o 11  dB  niższa  od  wartości  maksymalnej  widma 
hałasu  I. 


Rys.  6.  Krzywe  N oceny  hałasu  z naniesionymi  i wiamami  hała- 
sów I i II 


Podstawową  zaletą  skali  dB(/f)  jest  prostota  po- 
miaru. Z wyników  pomiaru  hałasu  w dB  (A)  nie  wynika 
jednak,  w jakim  zakresie  częstości  hałas  jest  subiek- 
tywnie najgłośniejszy.  Informacja  ta,  bardzo  istotna 
dla  wstępnej  oceny  metod  zmniejszenia  hałasu,  za- 
warta jest  pośrednio  w liczbach  N.  Dlatego  też  skalę 
dB(/f)  stosuje  się  powszechnie  przy  ocenie  hałasu, 
natomiast  skalę  liczb  N — przy  opracowywaniu 
koncepcji  wyboru  metod  zabezpieczeń  przeciw- 
dźwiękowych.  Między  poziomem  hałasu  L wyrażonym 
w dB  (A)  i wyrażonym  w liczbach  N istnieje  związek 

Ln  ~ LdB(A)  5 dB. 

W celu  uwzględnienia  dodatkowych  czynników,  od 
których  zależy  subiektywne  odczucie  hałasu,  do  oceny 
hałasu  w liczbach  W stosuje  się  odpowiednie  popraw  ki 
zestawione  w tabeli. 

Osoby  narażone  na  długotrwałe  działanie  hałasów 
są  poddawane  co  jakiś  czas  kontrolom  jakości  słuchu. 


Poprawki  AL  do  dopuszczalnych  wartości  liczb  N oceny 
hałasu 


Warunki 

Poprawka  AL 

Pora 

6-22  h 

0 

dnia 

22-6  h 

-10 

Czas  działania  hałasu 

powyżej  50% 

0 

<%  doby) 

12-50% 

+ 5 

3-12% 

+ 12 

75-90 


80-90 
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Są  to  tzw.  pomiary  audiometryczne  polegające  na  wy- 
znaczaniu różnicy  między  progiem  słyszalności  osoby 
badanej  a uśrednionym  progiem  słyszalności  Osób 
o normalnym  słuchu.  Sygnały  testujące  o różnych  czę- 
stościach i różnych  poziomach  doprowadzane  są  za 
pomocą  słuchawek  osobno  do  ucha  prawego  i lewego. 
Zadaniem  osoby  badanej  jest  zasygnalizowanie  mo- 
mentu usłyszenia  dźwięku.  Na  rys.  7 pokazane  są 
przykładowo  trzy  krzywe  audiometryczne  otrzymane 
po  przebadaniu  osób  o normalnym  słuchu  (krzywa  A) 
oraz  o małym  (krzywa  B)  i dużym  (krzywa  Q uszko- 
dzeniu słuchu.  Krzywe  B i C obrazują  najczęstsze 
przypadki  uszkodzenia  słuchu  wywołanego  działaniem 


Rys.  7.  Przykłady  krzywych  audiometrycznych;  A — osoby  o nor- 
malnym słuchu,  B — osoby  o małym  uszkodzeniu  słuchu,  C — 
osoby  o dużym  uszkodzeniu  słuchu.  L jest  różnicą  między  pro- 
giem słyszalności  osoby  badanej  a uśrednionym  progiem  słyszal- 
ności osób  o normalnym  słuchu 


80-95 


hałasu.  Jest  to  tzw.  trauma,  która  objawia  się  selek- 
tywnym ubytkiem  słuchu  w zakresie  częstości  ok. 
4000  Hz.  Ponieważ  próg  słyszalności  osób  zdrowych 
zmienia  się  z wiekiem,  dlatego  jako  odniesienie  przy 
pomiarach  audiometrycznych  stosowane  są  krzywe 
odpowiednio  skorygowane  do  wieku  osoby  ba- 
danej. 

Jednym  ze  skutków  ujemnego  działania  hałasu  na 
człowieka  jest  utrudnienie  zrozumiałości  mowy  ludz- 
kiej wpływające  w zasadniczy  sposób  na  ogranicze- 
nie możliwości  porozumienia  się,  co  w efekcie  prowa- 
dzi do  zmniejszenia  wydajności  pracy. 


Zrozumiałość  mowy  Z,  wyrażona  przez  stosunek 
liczby  jednostek  fonetycznych  odebranych  prawidło- 
wo do  całkowitej  liczby  jednostek  ocenianych,  zależy 
bardzo  silnie  od  różnicy  poziomu  mowy  Lm  i poziomu 
szumu  Lszy  co  ilustruje  rys.  8. 
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Źródła  hałasu 


Źródła  hałasu  można  podzielić  na  dwie  podstawo- 
we grupy:  hałasy  pochodzenia  mechanicznego,  wy- 
wołane drganiami  mechanicznymi,  i hałasy  pocho- 
dzenia przepływowego  (aerodynamiczne  lub  hydro- 
dynamiczne), wywołane  nieregularnościami  przepły- 
wającej strugi.  Nieregularnościami  tymi  mogą  być  wiry 
powstające  przy  przepływie  burzliwym  (turbulent- 
nym)  lub  pulsacje  ciśnienia  występujące  np.  przy  prze- 
pływach naddźwiękowych  lub  w procesie  spalania. 

Przykładem  hałasów  pochodzenia  mechanicznego 
może  być  stuk  maszyny  do  pisania,  skrzypienie  drzwi, 
audycja  z głośnika,  przykładem  hałasów  przepływo- 
wych— syk  pary,  hałasy  instalacji  wodociągowych, 
odgłos  strzału.  W praktyce  występują  często  hała- 
sy pochodzenia  mieszanego,  wywołane  zarówno  dzia- 
łaniem drgań  mechanicznych  jak  i przepływem,  np. 
hałas  samochodu,  odkurzacza  czy  piły  tarczowej. 

W procesie  powstawania  hałasu  dużą  rolę  odgry- 
wają układy  rezonansowe,  które  w przypadku  bezpo- 
średniego sprzężenia  ze  źródłem  mogą  — w zależnoś- 
ci od  warunków  współdziałania  — silnie  wzmacniać 
lub  tłumić  składowe  pewnych  częstości  odpowiadają- 
ce częstościom  rezonansowym  rezonatorów.  W przy- 
padku wzmocnienia  — powstają  w widmie  częstości 
wyraźne  maksima,  które  spowodować  mogą  znaczny 
wzrost  głośności  hałasu. 

W zależności  od  źródła  i wpływu  układów  rezo- 
nansowych widmo  częstości  hałasu  może  być  różne. 

Widmo  hałasu  mechanicznego  kształtowane  jest 
przez  charakter  drgań  elementów  mechanicznych  jak 
również  przez  warunki  jego  promieniowania,  czyli 
zamiany  energii  mechanicznej  na  energię  akustyczną. 
Ostrość  występujących  maksimów  w widmie  częstości 
zależy  od  stopnia  tłumienia  układów  rezonansowych. 
Im  tłumienie  jest  większe,  tym  maksima  mniej  ostre. 

Gdy  przepływ  strugi  odbywa  się  w warunkach  ruchu 
turbulentnego  (przy  przekroczeniu  liczby  Reynoldsa), 
wytwarzany  hałas  ma  charakter  szumu,  czyli  nie  wy- 
kazuje wyraźnych  maksimów  w widmie  częstości.  Jed- 
nak w widmie  częstości  hałasu  aerodynamicznego  wy- 
stępują często  ostre  maksima,  wywołane  bądź  włas- 
nościami rezonansowymi  układu  przepływowego  (re- 
zonans rur  i komór),  bądź  wzajemnym  oddziaływa- 
niem pola  aerodynamicznego  z polem  akustycznym. 
Oddziaływanie  to  prowadzi  do  akustycznego  sprzęże- 
nia zwrotnego,  które  przy  zgodności  faz  powoduje 
tworzenie  się  regularnych  wirów,  będących  źródłem 
hałasu  o odpowiedniej  częstości.  Jednym  z częściej 
występujących  wypadków  generacji  tego  typu  hałasu 
jest  przepływ  powietrza  w rurociągu,  wewnątrz  któ- 
rego znajduje  się  ostrze.  Wówczas  na  tle  szumu  wy- 
nikającego z przepływu  pojawia  się  wyraźne  mak- 
simum, którego  częstość  można  wyliczyć  ze  wzoru 
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gdzie  Sh  jest  liczbą  Strouhala,  która  dla  prędkości 
przepływu  vp  < 50  m/s  zawiera  się  w granicach  0,15- 
0,3,  zaś  a — wymiarem  poprzecznym  przeszkody. 

Ostre  maksima  w widmie  częstości  występują  tak- 
że przy  wpływie  z przewodu,  gdy  wypływający  gaz 
gwałtownie  się  rozpręża.  Powstaje  wówczas  struktu- 
ra komórkowa  strumienia  na  zewnątrz  przewodu  (rl. 
179,  tabl.  46),  która  powoduje  generację  hałasu  z wy- 
raźnym maksimum  przy  jednej  częstości  wyrażonej 
zależnością:  c 

M]/'p-pk  ’ 
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gdzie  c jest  prędkością  rozchodzenia  się  dźwięku, 
d — średnicą  wylotu  rurociągu,  P — stosunkiem 
ciśnienia  występującego  przy  wylocie  rurociągu  do 
ciśnienia  panującego  na  zewnątrz,  pk  = 1,89  jest 
wartością  krytyczną  tego  stosunku,  przy  której  dla 
powietrza  w temperaturze  20°C  prędkość  przepływu 
równa  jest  prędkości  rozchodzenia  się  dźwięku. 


95-115 


Hałas,  jak  każdy  dźwięk,  rozchodzi  się  w ośrod- 
kach płynnych  (w  gazach  i cieczach)  w postaci  fal 
podłużnych  oraz  w ciałach  stałych  w postaci  fal 
podłużnych  lub  poprzecznych.  Hałasy  rozchodzące 
się  w ciałach  stałych  zwane  dźwiękami  materiałowy- 
mi przenoszą  się  dość  łatwo  przez  sztywne  konstruk- 
cje i w efekcie  zmniejszają  skuteczność  działania 
przegród  ograniczających  propagację  dźwięków  po- 
wietrznych. Przykładem  wpływu  propagacji  dźwięków 
materiałowych  jest  przenoszenie  się  drgań  silników 
od  wind  przez  konstrukcję  budynku,  przenoszenie  się 
drgań  silnika  autobusu  przez  karoserię.  Ponieważ 
tłumienie  dźwięków  materiałowych  wzrasta  propor- 
cjonalnie do  częstości,  największy  ich  wpływ  występuje 
w zakresie  częstości  niskich,  a szczególnie  infra- 
dźwięków. 


Środowisko  akustyczne 
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W zależności  od  warunków  w jakich  przebywa  czło- 
wiek narażony  na  działanie  hałasu,  hałasy  dzieli  się 
na:  przemysłowe, komunikacyjne  i mieszkaniowe.  Po- 
ziomy hałasów  wytwarzanych  przez  niektóre  urządze- 
nia przemysłowe  i przez  środki  komunikacji  oraz  po- 
ziomy hałasów  mieszkaniowych  zaznaczone  są  (w 
decybelach)  przy  odpowiednich  rysuneczkach  na  mar- 
ginesach. 

Część  społeczeństwa  narażona  jest  w sposób  sy- 
stematyczny w warunkach  pracy  na  działanie  hałasów 
przemysłowych;  charakteryzuje  je  na  ogół  duże  natę- 
żenie i długotrwałe  działanie.  Są  one  często  przy- 
czyną trwałych  ubytków  słuchu  i poważnych  schorzeń. 
Na  podstawie  badań  przyjęto,  że  największą  dopusz- 
czalną wartością  poziomu  hałasu  stacjonarnego  dzia- 
łającego na  człowieka  w sposób  długotrwały  jest  90 
dB(/0  lub  N 85.  Poziom  hałasów  trwających  krócej 
może  przykraczać  te  wartości  (rys.  9). 


czas 


Rys.  9.  Zależność  dopuszczalnych  wartości  poziomów  hałasu  od 
czasu  jego  trwania 


Obecnie,  coraz  większy  problem  stanowią  hałasy 
komunikacyjne,  gdyż  działają  na  ludność  w sposób 
masowy.  Do  hałasów  komunikacyjnych  należą  ha- 
łasy wewnętrzne  — działające  na  obsługę  pojazdu  i pa- 
sażerów, i hałasy  zewnętrzne,  szczególnie  uciążliwe 
w aglomeracjach  miejskich. 

Bardzo  uciążliwe  są  hałasy  odczuwane  w mieszka- 
niach, zakłócające  spokojny  tryb  życia  mieszkańców 
zarówno  w dzień  jak  i w nocy.  Poziom  hałasów  miesz- 
kaniowych nie  powinien  przekraczać  w dzień  40 
dB(/4),  natomiast  w nocy  30  dB04).  W pewnych  sy- 
tuacjach dopuszcza  się  poziom  o 5 dB  wyższy. 

Głównymi  źródłami  hałasów  mieszkaniowych  są  ha- 
łasy komunikacyjne,  hałasy  przemysłowe  oraz  hałasy 
wewnątrzbudynkowe  (hałasy  instalacji  wodnej  i cen- 
tralnego ogrzewania,  windy,  zsypu  na  śmieci,  hała- 
sy pochodzące  od  sąsiadów  i punktów  usługowych  jak 
warsztaty,  restauracje,  sklepy). 
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Tłumienie  hałasu 

Zmniejszenie  hałasu  oddziałującego  na  aparat  słucho- 
wy człowieka  można  uzyskać  następującymi  sposoba- 
mi: ograniczając  generacje  hałasu,  ograniczając  pro- 


pagacje hałasu,  stosując  indywidualne  zabezpieczenia 
aparatu  słuchowego. 

Ograniczenie  generacji  hałasu  uzyskuje  się  dzię- 
ki konstruowaniu  urządzeń  cichobieżnych,  co  stano- 
wi najbardziej  skuteczny  sposób  zmniejszenia  od- 
działywania hałasu  na  człowieka. 

Zmniejszenie  hałasu  mechanicznego  uzyskuje  się 
dzięki  odpowiednim  konstrukcjom  i tolerancji  wyko- 
nania. Ponadto  hałas  zmniejsza  się  ograniczając  po- 
wierzchnie promieniujące  fale  akustyczne,  stosując  ma- 
teriały o dużym  tłumieniu  wewnętrznym,  w celu  ogra- 
niczenia przenoszenia  się  dźwięków  materiałowych 
oraz  dąży  się  do  zmniejszenia  ujemnego  wpływu  rezo- 
nansów. 

Zmniejszenie  hałasu  aerodynamicznego  można 
uzyskać  przez  zmniejszenie  prędkości  przepływu  oraz 
ograniczenie  dużych  zmian  ciśnienia.  Wymagania  te 
prowadzą  jednak  często  do  zmniejszenia  sprawności 
urządzeń  przepływowych,  co  ogranicza  ich  stosowa- 
nie. Dlatego  też  stosuje  się  również  inne  środki  pole- 
gające na  doborze  kształtu  elementów  wirujących 
i kanałów  przepływowych,  a przede  wszystkim  na  uni- 
kaniu ostrych  krawędzi  i załamań.  Przez  dobór  odpo- 
wiedniego kształtu  urządzenia  lub  jego  elementów 
można  uzyskać  ograniczenie  wpływu  częstości  rezo- 
nansowych jak  również  zmniejszenie  skuteczności  pro- 
mieniowania hałasu. 

W celu  ograniczenia  propagacji  hałasu  stosuje  się 
przegrody  przeciwdźwiękowe.  W przemyśle  są  to 
zazwyczaj  ekrany,  obudowy  maszyn  i urządzeń  lub  ka- 
biny przeciwdźwiękowe  dla  personelu.  W budownic- 
twie przegrodami  izolacyjnymi  są  ściany,  stropy,  okna 
i drzwi.  Przegrody  izolacyjne  muszą  zapewniać  od- 
powiednią izolacyjność  dla  dźwięków  powietrznych 
i dla  dźwięków  materiałowych. 

Izolacyjność  dla  dźwięków  powietrznych  przegród 
jednorodnych  wyrażona  w decybelach  jest  proporcjo- 
nalna do  częstości,  a także  do  masy  przegrody  na 
jednostkę  powierzchni.  Stawia  to  wymagania  stoso- 
wania przegród  ciężkich.  Lekkie  konstrukcje  o dobrych 
własnościach  izolacyjnych  można  uzyskać  stosując 
przegrody  wielowarstwowe. 

W celu  polepszenia  izolacyjności  dla  dźwięków  ma- 
teriałowych unika  się  sztywnych  połączeń  konstruk- 
cyjnych, które  tworzą  tzw.  mostki  akustyczne.  W tym 
celu  maszyny  i urządzenia  instaluje  się  na  podkła- 
dach antywibracyjnych  lub  amortyzatorach.  W bu- 
downictwie stosowane  są  specjalne  konstrukcje, 
wśród  których  bardzo  dobre  własności  wykazują  tzw. 
pływające  podłogi. 

Ograniczenie  propagacji  hałasu  uzyskuje  się  rów- 
nież stosując  ekrany  przeciwdźwiękowe.  Ekranem  na- 
zywamy umieszczoną  na  drodze  fali  cienką  przeszko- 
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Rys.  10.  Ekran  przeciwdźwiękowy  zastosowany  na  szosie  w Szwaj- 
carii 
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dę  o wymiarach  większych  od  długości  fali,  za  którą 
powstaje  cień  akustyczny.  Efektywność  cienia  aku- 
stycznego jest  zmniejszona  wskutek  ugięcia  fal, 
które  docierają  za  przeszkodę.  Wielkością  charakte- 
ryzującą działanie  ekranu  jest  jego  efektywność  wy- 
rażona zależnością: 

JL  = 10  lg(E0/£«)  dB, 

gdzie  Eu  jest  energią  akustyczną  docierającą  do  wy- 
branego punktu  położonego  za  ekranem  po  jego  za- 
instalowaniu, E0  — energią  docierającą  do  tego  sa- 
mego punktu  przed  zainstalowaniem  ekranu.  Ponie- 
waż skuteczność  IL  ekranu  wyrażona  w decybelach 
jest  proporcjonalna  do  częstości,  działanie  ekranów 
jest  tym  skuteczniejsze,  im  wyższa  jest  częstość  fal 
akustycznych. 

Ekrany  są  stosowane  w ha  łach  przemysłowych 
w pobliżu  źródeł  dźwięku  lub  w pobliżu  stanowisk 
pracy,  a także  w pobliżu  tras  komunikacyjnych  w 
celu  zmniejszenia  poziomu  hałasu  docierającego  do 
budynków  (rys.  13).  Efektywność  działania  jest  rzę- 
du 5-15  dB. 

W przestrzeni  ograniczonej  lub  w pomieszczeniach 
zamkniętych  fale  akustyczne  trafiające  na  powierzch- 
nie ograniczające  odbijają  się  powiększając  tym  samym 
energię  akustyczną  we  wnętrzu.  Według  teorii  po- 


głosowej Sabine’a  natężenie  dźwięku  fal  odbitych 
w pomieszczeniu  wyrażone  jest  zależnością  : 

4 w 

/ = ę-U-Wr), 

OCśr  S 

gdzie  aśr  jest  średnim  współczynnikiem  pochłaniania 
powierzchni  ograniczającej  pomieszczenie,  V — jego 
objętością,  S — całkowitym  polem  powierzchni  o- 
graniczających.  W celu  obniżenia  wpływu  fal  odbitych 
wprowadza  się  do  pomieszczenia  materiały  dźwięko- 
chłonne, które  powiększają  wartości  aśr-  Materiały 
te  bywają  mocowane  na  suficie  i na  ścianach  lub  za- 
wieszane w postaci  tzw.  pochłaniaczy  przestrzennych. 
W praktyce  powyższą  metodą  uzyskuje  się  obniżenie 
poziomu  hałasu  o 5-10  dB. 

Gdy  nie  jest  możliwe  dostateczne  obniżenie  hałasu 
przez  ograniczenie  jego  generacji  i propagacji,  za- 
chodzi konieczność  chronienia  słuchu  przez  stoso- 
wanie indywidualnych  wkładek  do  uszu  lub  stosowa- 
nie słuchawek  przeciwdźwiękowych.  Urządzenia  te 
wykazują  lepsze  własności  dla  zakresu  częstości  wy- 
sokich, przy  których  mogą  obniżać  poziom  hałasu 
działającego  na  aparat  słuchowy  człowieka  w grani- 
cach 20-30  dB.  Należy  jednak  pamiętać,  że  hałas 
szczególnie  w zakresie  niskich  częstości,  oddziałuje 
na  cały  organizm,  w związku  z tym  stosowanie  za- 
bezpieczeń indywidualnych  jest  tylko  półśrodkiem. 
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Przedmiot  i problemy  biofizyki 

mo!ekyiarne| 

Kazimierz  Wierzchowski 


Szybki  rozwój  nauk  przyrodniczych  w minionym 
ćwierćwieczu  doprowadził  do  uformowania  się  mole- 
kularnego nurtu  badań  w biologii  (biologia  moleku- 
larna), wyłaniając  w naturalny  sposób  pytanie,  czy 
fizyka  jako  nauka  o formach  materii,  ich  ruchu  i wza- 
jemnym oddziaływaniu  może  również  wyjaśnić  wła- 
ściwości biologicznej  formy  istnienia  materii  i tym 
samym  przyczynić  się  do  wyjaśnienia  zjawiska  życia. 
Opis  budowy  i organizacji  procesów  życiowych  ko- 
mórki (->  Organizacja  procesów  życiowych  komór- 
ki), stworzony  przez  nauki  biologiczne  pokazuje,  że 
forma,  w jakiej  występuje  materia  w układach  biolo- 
gicznych, radykalnie  różni  się  wieloma  swoistymi 
cechami  od  form  materii  nieożywionej. 

Z punktu  widzenia  budowy  chemicznej  komórka 
jest  wysoce  niejednorodnym  układem  złożonym 
z kwazikrystalicznych  ciał  zbudo  wanych  z liniowych 
makrocząsteczek  organicznych  oraz  z cieczy  stano- 
wiącej roztwór  wodny  związków  organicznych  i nie- 
organicznych. W układzie  tym  zachodzą  zorganizo- 
wane w przestrzeni  i czasie  setki  reakcji  chemicznych, 
katalizowanych  swoiście  przez  zespoły  katalizato- 
rów — białek  enzymatycznych.  Ich  ostatecznym  wy- 
nikiem jest  cykliczna  reprodukcja  całego  układu  wg 
własnego  planu  genetycznego  zakodowanego  w struk- 
turze DNA.  Procesy  te  mogą  przebiegać  tylko  w wa- 
b komórka  runkach  ciągłej  wymiany  materii  i energii  z otocze- 
jako  układ  niem.  Komórka  jest  więc  — z termodynamicznego 
otwarty  punktu  widzenia  — układem  otwartym,  przy  tym 
samosterowanym  i samoreprodukującym  się.  Pewne 
odchylenia  od  planu  genetycznego  spow-odowane 
spontanicznymi  fluktuacjami  regulacji  aparatu  ge- 
netycznego lub  jego  uszkodzeniami  przez  czynniki 
zewnętrzne  mogą  prowadzić  do  pojawienia  się  ko- 
mórek o zmienionych  nieco  właściwościach  (mutan- 
ty). Lepsze  przystosowanie  mutantów  do  warunków 
środowiska  może  z kolei  być  przyczyną  dodatniej 
selekcji  wyróżniających  je  cech  w populacji.  Istotną 
cechą  elementarnej  formy  istnienia  materii  ożywionej, 
jaką  jest  komórka  biologiczna,  jest  więc  również 
zdolność  do  ewolucji. 

Z fizycznego  punktu  widzenia  komórka  stanowi 
zatem  układ  otwarty  złożony  z dużej  liczby  wzajem- 
nie oddziałujących  różnych  klas  elementów,  spośród 
których  wiele  reprezentowanych  jest  przez  stosunko- 
wo małą  ich  liczbę.  Oddziaływanie  elementów  zbio- 
ru prowadzi  do  ich  uporządkowania,  tj.  do  organi- 


zacji w przestrzeni  i czasie.  Zachowanie  się  takiego 
układu  niewątpliwie  podlega  prawom  dynamiki. 

Fizyka  nie  dysponuje  dotychczas  metodami  pozwala- 
jącymi na  ilościowy  (matematyczny)  opis  zachowania 
się  takich  układów  i na  przewidywanie  właściwości 
makroskopowych  układu  oparte  na  znajomości  jego 
budov/y  mikroskopowej.  Uw'aża  się,  że  jedynie  na 
gruncie  termodynamiki  procesów  nieodwracalnych, 
rozpatrującej  zachowanie  się  układów  otwartych 
w stanie  odbiegającym  od  stanu  równowagi,  można 
przewidywać  warunki  powstania  organizacji  czaso- 
wo-przestrzennej  reagujących  ze  sobą  chemicznie 
cząsteczek,  a więc  uzyskiwać  pewien  wgląd  w po- 
wiązania molekularnego  i makroskopowego  poziomu 
organizacji  układów  i mechanizm  ewolucji  makro- 
cząsteczkowych układów  chemicznych  w samorepro- 
dukujące  się  układy  prekomórkowe.  Wskazują  na  to 
teoretyczne  badania  M.  Eigena  oraz  I.  Prigogine'a, 
w-yróżnione  nagrodą  Nobla  (1977  r.) 

W ogólnym  opisie  budowy  molekularnej  i funkcjo- 
nowania komórki  stworzonym  przez  nauki  biolo- 
giczne, cechy  samosterowności,  samoreprodukcji 
i zdolności  do  ewolucji  związane  są  w dużym  stopniu 
z właściwościami  chemicznymi  i fizycznymi  kilku  klas 
liniowych  polimerów  stanowiących  podstawowe 
elementy  budowy  komórek:  białek,  kwasów  nuklei- 
nowych, fosfolipidów  i polisacharydów.  W środowisku 
wodnym  cząsteczki  ich  mają  zdolność  do  samoorga- 
nizacji w uporządkowane  przestrzennie  formy  konfor- 
macyjne  i supercząsteczkowe  układy  zw.  organellami  organelle 
komórkowymi  oraz  do  specyficznych  oddziaływań  komórkowe 
fizycznych  ze  związkami  nieorganicznymi  i organi- 
cznymi uczestniczącymi  pośrednio  lub  bezpośrednio 
w reakcjach  biochemicznych. 

Wyjaśnienie  tych  szczególnych  właściwości  biopo- 
limerów z punktu  widzenia  ich  budowy  chemicznej 
stanowi  niewątpliwie  klucz  do  poznania  molekular- 
nych mechanizmów  procesów  komórkowych  prze- 
biegających przy  ich  udziale.  Dzięki  metodom  fizycz- 
nym możliwy  był  szybki  rozwój  biologii  molekular- 
nej : wyjaśnienie  na  początku  lat  50-ych  zasady  prze- 
strzennej organizacji  białek  (L.  Pauling,  nagroda 
Nobla  w 1954  r.)  i DNA  (F.  Crick,  i J.  Watson,  na- 
groda Nobla  1962  r.).  Fizyka  w coraz  większym  stop- 
niu uczestniczy  w badaniach  z tego  zakresu.  W ten 
sposób  wyodrębnia  się  i kształtuje  biofizyka  moleku-  biofizyka 
larna,  nauka  opisująca  doświadczalnie  i teoretycznie  molekularna 
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strukturę  i właściwości  makrocząsteczek  biopolime- 
rów w nieuporządkowanym  i w różnych  uporządko- 
wanych konformacyjnie  stanach  termodynamicznych, 
przejścia  między  stanami,  wzajemne  oddziaływania 
i oddziaływania  z małocząsteczkowymi  składnikami 
środowiska  wodnego  komórki  oraz  organizację 
w supercząsteczkowe  organelle  komórkowe.  Na  tej 
podstawie  poszukuje  się  wyjaśnienia  elementarnych 
mechanizmów  funkcji  spełnianych  przez  biopolimery 
oraz  procesów  ich  regulacji. 

W dalszym  ciągu  artykułu  przedstawimy  podsta- 
wowe zagadnienia  i problemy  badawcze  tak  rozumia- 
nej biofizyki  molekularnej. 


Stan  nieuporządkowany 
makrocząsteczek  w roztworach 


zmiany  długości  wiązań  i wielkości  kątów  między  ni-  konfiguracja 
mi  (kątów  torsyjnych).  Drgania  skrętne  wywołujące  i konformacja 
zmianę  względnego  położenia  grup  atomów  połączo- 
nych wiązaniem  pojedynczym,  czyli  zmianę  konfor- 
macji cząsteczki,  przedstawia  się  jako  zmiany  kąta 
torsyjnego  (inaczej  kąta  dwuściennego,  wewnętrznej 
rotacji,  konformacyjnego).  Nie  zachodzą  one  swobod- 
nie, ponieważ  między  nie  związanymi  bezpośrednio 
atomami  obu  grup  występują  oddziaływania  typu  van 
der  Waalsa  i oddziaływanie  elektrostatyczne,  których 
charakter  (przyciągające  lub  odpychające)  i energia 
zależy  od  efektywnego  promienia,  odległości  i rodzaju 
atomów.  W rezultacie  cząsteczka  może  przyjmować 
izomeryczne  postacie  przestrzenne  (konformacje)  od- 
powiadające minimom  funkcji  energii  opisującej  ob- 
rót. Izomerię  rotacyjną  najprostszych  cząsteczek  wę- 
glowodorów: etanu  i n-butanu  ilustruje  rys.  1.  Jeżeli 
energie  poszczególnych  trwałych  izomerów  są  takie 


Stan  nieuporządkowany  makrocząsteczek  w roztwo- 
rach cechuje  zdolność  zmian  organizacji  przestrzen- 
nej tworzących  je  łańcuchów  pod  wpływem  czynni- 
ków zmieniających  ich  energię  wewnętrzną.  Makro- 
skopowe cechy  ich  budowy:  wielkość  i kształt,  są 
więc  miarą  tej  organizacji  oraz  zachodzących  w niej 
zmian  pod  wpływem  czynników  zewnętrznych. 


Badania  kształtu  makrocząsteczek 

Informacji  o wielkości  i kształcie  makrocząsteczek 
w roztworach  dostarczają:  badania  makroskopowych 
badania  właściwości  roztworów,  zależnych  od  parametrów 
roztworów  budowy  znajdujących  się  w nich  cząsteczek,  np.  bada- 
nie lepkości  lub  ciśnienia  osmotycznego ; bezpośred- 
nie pomiary  wielkości  charakteryzujących  procesy 
transportu  cząsteczek:  swobodną  dyfuzję  i sedymen- 
tację w polu  sił  odśrodkowych;  badania  rozpraszania 
światła  w szerokim  zakresie  kątów  obserwacji  oraz 
rozpraszania  promieniowania  rentgenowskiego  pod 
małymi  kątami.  Zależność  mierzonych  wielkości 
od  parametrów  kształtu  makrocząsteczek  jest  na 
ogół  bardzo  złożona.  W rezultacie  opisujące  te  za- 
leżności funkcje  można  otrzymać  w postaci  analitycz- 
nej tylko  dla  uproszczonych  modeli  cząsteczek.  Naj- 
częściej stosowane  przybliżenia  sprowadzają  kształt 
makrocząsteczek  do  sferoid  o różnych  promieniach 
obrotu  i stosunkach  osi,  jak  kula,  elipsoidy  obrotowe 
o różnym  stosunku  osi  oraz  sferoidy  o trzech  różnych 
osiach. 

Kształt  makrocząsteczek  łańcuchowych  w roztwo- 
rach, w warunkach,  w których  nie  przyjmują  one 
rozmiary  uporządkowanych  konformacji,  jest  zbliżony  do  bez- 
kłębka  ładnie  zwiniętego  kłębka  nici.  Rozmiary  jego  zależą 
od  budowy  chemicznej  polimeru,  rodzaju  rozpusz- 
czalnika i temperatury.  W roztworach  wodnych  poli- 
merów biologicznych,  takich  jak  białka  i kwasy  nu- 
kleinowe, które  mają  budowę  polielektrolitów,  roz- 
miary cząsteczek  zależą  również  od  stężenia  jonów 
wodorowych  i stężenia  elektrolitu  (od  siły  jonowej 
roztworu).  Badania  zmian  rozmiarów  kłębka  w zależ- 
ności od  tych  czynników  wskazują  na  jego  luźną  or- 
ganizację i dużą  giętkość  łańcucha. 


Giętkość  łańcuchów  polimerów  liniowych 

Giętkość  liniowych  cząsteczek  polimerów  wynika 
z ich  budowy  chemicznej,  umożliwiającej  przyjmowa- 
nie przez  nie  wielu  różniących  się  geometrią  form 
izomerycznych  (giętkość  termodynamiczna),  które 
mogą  przechodzić  szybko  jedna  w drugą  pod  wpły- 
wem drgań  cieplnych  (giętkość  kinetyczna).  Cząstecz- 
ka chemiczna  nie  jest  układem  sztywnym.  Zachodzą 
w niej  różnego  rodzaju  drgania  atomów  lub  grup 
atomów  bez  zmiany  jej  zasadniczej  budowy  elektro- 
nowej, tzn.  konfiguracji.  Towarzyszą  im  niewielkie 
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Rys.  1.  Izomery  rotacyjne:  a)  Względne  położenie  wiązań  C — H 
obu  grup  CH,  etanu  CH, — CH,  (rzut  na  płaszczyznę  prostopadłą 
do  wiązania  C — C)  w izomerach  trans  (/),  cis  (//)  i skręconym 
(///);  cząsteczka  etanu  posiada  trójkrotną  oś  symetrii  wzdłuż 
wiązania  C — C,  tak  więc  pełny  obrót  grupy  CH,  generuje  na 
przemian  trzy  izomery  trans  o najniższej  energii  oraz  trzy  izo- 
mery cis  o najwyższej  energii,  b)  Funkcja  potencjalna  opisująca 
obrót  ma  postać  U = xUU(t  (1— cos  3<p),  gdzie  U0  jest  to  bez- 
względna wysokość  bariery  energetycznej  oddzielającej  stany 
trans.  Dla  etanu  wysokość  bariery  między  izomerami  cis  i trans 
wynosi  12  kJ/mol.  c)  Izomeria  rotacyjna  n-butanu;  wysokość 
bariery  między  izomerami  trans  i skręconym  wynosi  3,7  kJ/mol. 
Grupa  CH,  oznaczona  jest  na  rzucie  kropką 


same  (jak  w przypadku  etanu),  występują  one  oczy- 
wiście z jednakowym  prawdopodobieństwem.  W przy- 
padku /j-butanu  energie  izomerów  trans  i skręconego 
są  różne  i ich  udział  w populacji  cząsteczek  określony 
jest  różiicą  ich  energii  AE . Wysokość  bariery  energe- 
tycznej AE  oddzielającej  sąsiadujące  stany  konforma- 
cyjie  determinuje  szybkość  procesu  zmiany  konfor- 
macji. 

W wypadku  obrotów  wokół  pojedynczych  wiązań 
AE  jest  rzędu  kilkunastu  J/mol.  Wówczas  zgodnie 
z przewidywaniami  teorii  reakcji  chemicznych  czas  izomery 
trwania  procesu  zmiany  konformacji  jest  rzędu  10-10  s.  geometrycz- 
Podobnie  drgania  skrętne  polimeru  liniowego  wywo-  ne 
łują  izomeryzację  geometryczną  jego  łańcucha.  Ze 
względu  na  dużą  liczbę  rotacyjnych  stopni  swobody 
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łańcuch  główny  polimeru  może  przyjąć  ogromną  licz- 
bę różnych  przypadkowych  ułożeń  w przestrzeni  od- 
powiadających różnym  jego  izomerom  geometrycz- 
nym (konformerom),  z których  żaden  nie  jest  szcze- 
gólnie uprzywilejowany.  Na  przykład  cząsteczka  poli- 
etylenu CH3(CH2)nCH3  złożona  z n — 100  merów  ma 
3 100  możliwych  izomerów  geometrycznych,  ponieważ 
obrót  wokół  każdego  z wiązań  C — C prowadzi  do 
powstania  trzech  izomerów.  Oczywiście  w wypadku 
makrocząsteczek  białek  (— ► Białka)  czy  kwasów  nukle- 
inowych (— ► Kwasy  nukleinowe),  o bardziej  złożonej 
budowie  niż  polietylen,  liczba  wiązań  przypadających 
na  jedno  ogniwo  łańcucha,  wokół  których  mogą 
występować  obroty,  jest  znacznie  większa.  Reszta 
peptydowa  może  przyjmować  w zależności  od  budowy 
chemicznej  do  30,  a reszta  nukleotydowa  — aż  do 
200  różnych  izomerycznych  konformacji.  Zwiększa  to 
radykalnie  liczbę  teoretycznie  możliwych  form  izo- 
merycznych łańcucha  w porównaniu  z polimerami 
syntetycznymi  o prostej  na  ogół  budowie  chemicznej. 
Formy  te  różnią  się  jednak  znacznie  energią,  tak 
że  tylko  niektóre  z nich  realizują  się  w normalnych 
warunkach  w roztworach  wodnych  polipeptydów  i po- 
linukleotydów. 


Statystyczny  opis  kształtu  makrocząsteczek 

Rozróżnienie  tak  dużej  liczby  izomerów  makro- 
cząsteczek metodami  doświadczalnymi  nie  jest  możli- 
we. Pozwalają  one  tylko  na  określenie  średniego 
kształtu  cząsteczki.  Zatem  opis  właściwości  konforma- 
cyjnych  nieuporządkowanych  polimerów  liniowych 
wymaga  zastosowania  metod  statystycznych.  Roz- 
ważenie procesu  izomeryzacji  polietylenu  (rys.  2) 
wyjaśnia  dążność  cząsteczki  do  zwijania  się  w tzw. 
kłębek  statystyczny.  W roztworze  pod  wpływem  sił 
osmozy  kłębek  ulega  rozwinięciu  w stosunku  do 
stanu,  jaki  osiągnąłby  w próżni.  Miarą  stopnia  roz- 
winięcia kłębka,  a więc  jego  rozmiarów,  może  być 
średnia  odległość  h między  końcami  zwiniętego  łań- 
cucha, tj.  między  pierwszym  i ostatnim  jego  atomem. 
W statystycznej  teorii  izomerii  geometrycznej  poli- 
merów jest  ona  określona  za  pomocą  funkcji  roz- 
kładu W(Ji)dhy  równej  prawdopodobieństwu  znale- 
zienia odległości  między  końcami  łańcucha  w prze- 

00 

dziale  h i h + dh;  oczywiście  jW(h)dh  = 1.  Sredn 

o 

kwadrat  odległości  A,  równy  iloczynowi  liczby  ogniw 
łańcucha  n i kwadratu  długości  b ogniwa : <A2>  = 
= nb2y  jest  proporcjonalny  do  wyznaczonego  doś- 
wiadczalnie (np.  na  podstawie  pomiaru  lepkości  lub 
badania  rozproszenia  światła)  średniego  kwadratu 
promienia  obrotu  całej  cząsteczki.  W wypadku  „ideal- 
nego” polimeru,  mającego  swobodę  obrotów  (tzn. 
obroty  mogą  występować  bez  zmian  energii)  funkcja 
W(h)  ma  postać  zbliżoną  do  funkcji  Gaussa.  Rozkład 
ogniw  jego  łańcucha  jest  początkowo  sferycznie  sy- 
metryczny, jednakże  bardzo  szybko  przyjmuje  po- 
stać zbliżoną  do  sferoidy  o trzech  różnych  osiach 
bezwładności. 

W polimerach  rzeczywistych  obroty  są  oczywiście 
zahamowane  przez  oddziaływania  wewnątrzcząstecz- 
kowe.  Oddziaływania  te  są  również  przyczyną  korela- 
cji kątów  rotacyjnych  sąsiadujących  i blisko  położo- 
nych ogniw,  czyli  mają  charakter  oddziaływań  koope- 
ratywnych. W zwiniętej  nici  polimeru  występują  także 
oddziaływania  dalekiego  zasięgu  między  ogniwami 
odległych  części  łańcucha.  W rezultacie  część  prze- 
strzeni w obrębie  kłębka  zajęta  przez  dane  ogniwo 
jest  niedostępna  dla  pozostałych  ogniw  łańcucha. 
Jest  to  tzw.  objętość  wyłączona,  zwiększająca  oczy- 
wiście rozmiary  rzeczywistego  kłębka  w stosunku  do 
kłębka  „idealnego”.  W polielektrolitach  odpychanie 
elektrostatyczne  ładunków  jednoimiennych  wywołuje 
dodatkowe  zwiększenie  objętości  kłębka.  Uwzględnie- 
nie w funkcji  W{h)  tych  czynników  jest  konieczne 
do  poprawnego  opisu  jego  konformacji. 


Zaproponowanie  fizycznego  modelu  zachowania 
się  rzeczywistego  polimeru  wymaga  oczywiście  zna- 
jomości geometrii  budowy  jego  ogniw  (długości 
wiązań,  kątów  walencyjnych),  a także  znajomości 
energii  potencjalnej  jako  funkcji  obrotów  ogniw 
wokół  łączących  je  wiązań  oraz  energii  oddziaływań 
elektrostatycznych  zarówno  wewnątrz  łańcucha,  jak 
i z otaczającymi  go  jonami  elektrolitu  obecnego  w roz- 
tworze. Parametry  geometrii  ogniw  łańcucha  określa 
się  na  podstawie  wartości  odpowiednich  parametrów 
cząsteczek  monomerów  lub  ich  analogów,  wyznacza- 
nych w kryształach  tych  związków  metodą  rentgeno- 
grafii  strukturalnej.  Zakres  zmienności  kątów  rota- 
cyjnych w pobliżu  ich  najbardziej  prawdopodobnych 
wartości,  względne  energie  poszczególnych  konfor- 
macji oraz  bariery  energetyczne  obrotów  określa  się 
badając  zależne  od  konformacji  właściwości  spek- 
troskopowe takich  modelowych  cząsteczek  w funkcji 
temperatury. 

Można  je  również  oszacować  teoretycznie  oblicza- 
jąc energie  całkowite  różnych  konformacji  obracające- 
go się  ogniwa  polimeru  przy  użyciu  półempirycznych 
metod  mechaniki  kwantowej  (-►  Chemia  kwantowa). 
Punktem  wyjściowym  do  obliczenia  energii  oddziały- 
wań elektrostatycznych  wewnątrz  łańcucha  oraz  od- 
działywań z chmurą  otaczających  go  w roztworze  ła- 
dunków jest  teoria  elektrolitów  Debye*a-Huckla, 


model 

budowy 

polimeru 


polietylen  — 
przykład 
izomeryzacji 
rotacyjnej 


Rys.  2.  Izomeryzacja  rotacyjna  polietylenu  CH3(CHS)»CH„: 
a)  rotacja  wokół  wiązania  — C<a>  kolejnego  wiązania  — 

— C<4> ; przy  ustalonym  położeniu  wiązań  — CW  i CW — C<3> 

trzecie  wiązanie  Ct3> — C*4>  może  przyjąć  dowolne  położenie  na 
pow  ierzchni  stożka  o kącie  rozwarcia  26  (n  — 0 — kąt  walencyjny 
między  wiązaniami  C — C bliski  tetraedryczpemu,  tj.  109°28'). 
Czwarte  z kolei  wiązanie  O4* — O*-*  może  przyjąć  dowolne  poło- 
żenie na  powierzchni  stożków  opisanych  wokół  każdego  z poło- 
żeń wiązania  trzeciego.  Tak  więc  w miarę  oddalania  się  wiązań 
wzdłuż  łańcucha  polietylenu  rośnie  dowolność  orientacji  jego 
wiązań  w przestrzeni.  Liniowy  łańcuch  dąży  do  przyjęcia  postaci 
kłębka  statystycznego,  bezładnie  zwiniętego  (zobacz  rys.  b),  które- 
go rozmiary  można  wyrazić  za  pomocą  odległości  h między  jego 
końcami 
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oparta  na  liniowym  przybliżeniu  rozkładu  gęstości  ła- 
ładunku.  Gęstość  powierzchniowa  ładunku  elektro- 
statycznego na  cząsteczkach  silnie  zjonizowanych  po- 
lielektrolitów  jest  jednak  często  tak  duża,  że  wystę- 
pują efekty  nieliniowe,  których  uwzględnienie  jest 
bardzo  trudne.  Teoria  roztworów  wodnych  stężonych 
elektrolitów  i polielektrolitów  nie  jest  jeszcze  dosta- 
tecznie rozwinięta. 

teoria  Dotychczas  opracowano  kilka  statystyczno-termo- 

Flory'ego  dynamicznych  i statystyczno-mechanicznych  teorii 
właściw-ości  nieuporządkowanych  makrocząsteczek 
w roztworach  rozcieńczonych  (w  roztworach  rozcień- 
czonych można  pominąć  oddziaływania  międzyczą- 
steczkowe)  — interpretują  one  poprawnie  wyniki  ba- 
dań doświadczalnych. 

Bardzo  wiele  wniosły  badania  P.  J.  Flory ’ego  wyróż- 
nione w 1974  r.  nagrodą  Nobla.  W teorii  Flory’ego 
przyjmuje  się,  że  łańcuch  rzeczywistego  polimeru  jest 
złożony  z segmentów  o wirtualnej  długości  /,  obejmu- 
jących dwa  lub  więcej  sąsiadujących  ogniw,  między 
którymi  zachodzą  oddziaływania  kooperatywne. 
Względne  obroty  tak  zdefiniowanych  N segmentów 
traktuje  się  jako  swobodne,  czyli  średni  kwadrat  odle- 
głości h równa  się: 

<A2>  = oc2M2. 

Współczynnik  a w tym  wyrażeniu  opisuje  efekt  obję- 
tości wyłącznej.  W odpowiednio  dobranym  rozpu- 
szczalniku, sprzyjającym  wystąpieniu  oddziaływań  da- 
lekiego zasięgu,  i w odpowiedniej  temperaturze  wzmo- 
żone oddziaływania  wewnątrzcząsteczkowe  kompen- 
sują efekt  objętości  wyłączonej.  W warunkach  tych, 
w tzw.  punkcie  0,  współczynnik  a jest  równy.  Inny- 
mi słowy,  drugi  współczynnik  wirialny  ciśnienia  osmo- 
tycznego  jest  wówczas  równy  zeru,  roztwór  zacho- 
wuje się  jak  roztwór  idealny  i ciśnienie  osmotyczne 
jest  opisywane  przez  równanie  Van’t  Hoffa.  Wystę- 
puje więc  tutaj  analogia  do  punktu  Boyle'a  dla  ga- 
zów rzeczywistych.  Wyniki  teoretycznych  obliczeń  na- 
leży zatem  porównywać  z wynikami  doświadczalny- 
mi otrzymanymi  w punkcie  0.  Teoretyczne  oblicze- 
nie współczynnika  a jest  bardzo  trudne.  Przybliżone 
metody  jego  wyznaczania  pozwalają  na  sprowadzenie 
wyników  otrzymanych  dla  roztworów  nieidealnych 
do  warunków  w punkcie  d. 

przejście  Podstawowym  problemem  fizyki  roztworów  biopo- 
cząsteczek  w limerów  jest  wyjaśnienie,  w jaki  sposób  ich  cząstecz- 
ko nf  o rmacje  ki  przechodzą  ze  stanu  kłębka  statystycznego  w wy- 
kwazikrysta-  soce  uporządkowane  kwazi krystaliczne  konformacje 

liczne  właściw-e  ich  funkcjonalnemu  stanowi  in  vivo.  Do- 
tyczy to  zarówno  układów  in  vitro  jak  i przebiegu 
tego  procesu  w komórce  równolegle  z syntezą  łań- 
cuchów. Cząsteczki  w postaci  kłębka  statystycznego 
nie  mogą  krystalizować.  Muszą  przyjąć  przedtem 
jedną  z dostępnych  im  sn  konformacji  o najniższej 
w danych  warunkach  energii  swobodnej  ( s — liczba 
możliwych  izomerów  geometrycznych  pojedynczego 
ogniwa,  n — liczba  ogniw).  Osiągnięcie  przez  którąś 
z cząsteczek  w roztworze  w sposób  przypadkowy 
konformacji  zbliżonej  geometrycznie  do  jej  konfor- 
macji obserwowanej  w krysztale  nie  oznacza  bynaj- 
mniej, że  konformacja  ta  wyróżnia  się  niższą  energią 
swobodną.  Dopiero  w warunkach  sprzyjających  od- 
powiedniej organizacji  cząsteczek  rozpuszczalnika 
w warstwie  solwatacyjnej  (warstwie  częściowo  upo- 
rządkowanego rozpuszczalnika  wokół  cząsteczki 
związku  rozpuszczonego)  i wystąpieniu  silniejszych, 
a także  ukierunkowanych  oddziaływań  wewnątrz- 
cząsteczkowych  między  sąsiadującymi  ogniwami  łań- 
cucha, następuje  termodynamiczna  stabilizacja  takiej 
konformacji. 

Problemy  te  nie  mieszczą  się  już  w teorii  izomerii 
geometrycznej  polimerów.  Próby  opisu  tych  proble- 
mów wymagają  znajomości  konformacji  łańcuchów 
w stanach  uporządkowanych  makrocząsteczek  oraz 
uwzględnienia  energii  i kierunkowości  oddziaływań 
międzycząsteczkowych,  a także  kinetyki  izomeryzacji 
łańcuchów. 
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Stan  uporządkowany 
makrocząsteczek 


Badanie  struktury  metodami  dyfrakcji 
promieniowania  rentgenowskiego 

Zdolność  cząsteczek  białek,  kwasów  nukleinowych 
i polisacharydów  do  krystalizacji  z roztworów  wod- 
nych lub  skupiania  się  w parakrystaliczne  silnie 
uwodnione  włókniste  formy  stwarza  możliwość  bada- 
nia ich  przestrzennie  uporządkowanych  konformacji 
metodami  dyfrakcji  promieniowania  rentgenowskie- 
go (->  Badanie  struktury  kryształów).  Wyznaczenie 
na  tej  drodze  współrzędnych  atomów  tworzących  ma- 
krocząsteczkę jest  jednak  znacznie  bardziej  złożonym 
zadaniem  niż  w przypadku  małych  cząsteczek 
(-*  Osiągnięcia  krystalografii  białek).  Z analizy  dy- 
fraktogramów  można  otrzymać  uproszczoną  funkcję 
rozkładu  gęstości  elektronowej  w przestrzeni  trój- 
wymiarowej, która  posiada  maksima  w miejscach 
znajdowania  się  atomów  tworzących  cząsteczkę  (z  wy- 
jątkiem atomów  wodoru,  których  zdolność  rozpra-  wyznaczanie 
szająca  jest  zbyt  niska).  Metoda  wyznaczania  para-  geometrii 
metrów  geometrii  makrocząsteczki  polega  na  porów-  makro- 
nywaniu  doświadczalnego  rozkładu  gęstości  elektro-  cząsteczki 
nowej  z rozkładami  obliczonymi  na  podstawie  szeregu 
kolejno  uściślanych  modeli  jej  budowy  aż  do  uzyska- 
nia dostatecznie  dobrej  zgodności  między  obu  roz- 
kładami. Wyznaczenie  współrzędnych  atomów  czą- 
steczki możliwe  jest  więc  tylko  wówczas,  gdy  można 
zbudować  jej  model,  czyli  gdy  znana  jest  jej  budowa 
chemiczna  (rodzaj  i kolejność  występowania  poszcze- 
gólnych ogniw  w łańcuchu),  kąty  konformacyjne 
i długości  wiązań  łańcucha  głównego  i łańcuchów 
bocznych  poszczególnych  ogniw  oraz  struktura  pod- 
jednostkowa  (w  białkach  złożonych  i w wielołańcu- 
chowych  formach  włóknistych).  W przypadku,  gdy 
nie  jest  znana  kolejność  występowania  (sekwencja) 
ogniw  w łańcuchu  polimeru,  udaje  się  tylko  określić 
zasadnicze  cechy  przestrzennego  rozkładu  atomów 
w makrocząsteczce : jego  symetrię  oraz  ułożenie  prze- 
strzenne łańcucha  głównego. 

Przykładem  takiego  postępowania  była  analiza  analiza  dy- 
dyfraktogramów  DNA  wówczas,  gdy  nieznana  była  fraktogra- 
jeszcze  sekwencja  występowania  zasad  we  włóknach  m^w  f>s\łA 
tego  zw-iązku.  Zaproponowany  na  podstawie  takiej 
analizy  w 1951  r.  przez  dwóch  uczonych  F.  Cricka  i J. 

Watsona  i obowiązujący  po  dzień  dzisiejszy  model 
organizacji  przestrzennej  cząsteczki  DNA  w postaci 
podwójnego  heliksu  (-►  Kwasy  nukleinowe)  najbar- 
dziej odpowiadał  symetrii  i gęstości  doświadczalnego 
rozkładu  elektronów.  Model  ten  znalazł  bezpośrednie 
potwierdzenie  dopiero  po  dwudziestu  pięciu  latach, 
gdy  wykazano  analogiczne  upakowanie  i konformację 
cząsteczek  dwunukleotydów  ApT  i GpC  w kryształach. 

Analiza  rentgenograficzna  struktury  makrocząste- 
czek napotyka  również  wiele  trudności  i ograniczeń 
wynikających  z ich  wielkości.  Funkcja  rozkładu  gę- 
stości elektronowej  nie  odzwierciedla  statycznej 
konformacji  pojedynczej  cząsteczki,  lecz  jest  super- 
pozycją rozkładów  odpowiadających  identycznie 
położonym  cząsteczkom  w komórce  elementarnej 
kryształu.  W dużych  cząsteczkach  interferencja  mię- 
dzy rozproszonymi  wiązkami  promieniowania  po- 
chodzącymi od  różnych  atomów  powoduje  spadek 
natężenia  refleksów  na  dyfraktogramach  (natężenie 
refleksów  jest  proporcjonalne  do  pierwiastka  kwadra- 
towego z liczby  atomów,  a nie  wprost  do  ich  liczby, 
jak  w wypadku  małych  cząsteczek).  Gdy  bada  się 
cząsteczki  o masie  M > 105  daltonów  liczba  obser- 
wowanych refleksów  jest  zbyt  mała  na  to,  aby  z anali- 
zy dyfraktogramów  określić  współrzędne  atomów. 

(Dalton  — stosowana  w biochemii  nazwa  jednostki  (dalton) 
masy  atomowej  u;  lu  jest  równa  Vi2  masy  jądra  izo- 
topu węgla  12C).  Makrocząsteczki  w krysztale  mogą 
różnić  się  szczegółami  ułożenia  łańcuchów  na  ich 
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obrazów 
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nych 
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ciężkiego 

atomu 


powierzchni  w wyniku  oddziaływania  z innymi  czą- 
steczkami tworzącymi  kryształ,  z cząsteczkami  wody 
krystalicznej  oraz  jonami  elektrolitu  obecnego  w roz- 
tworach. Powoduje  to  oczywiście  rozmycie  obrazów 
dyfrakcyjnych  i obniżenie  dokładności  analizy.  In- 
nym, istotnym  problemem  jest  wyznaczenie  przesunięć 
fazowych  między  padającą  i rozproszonymi  wiązkami 
promieniowania;  znajomość  przesunięć  fazowych  jest 
konieczna  dla  wyznaczenia  współrzędnych  atomów. 
Gdy  bada  się  małe  cząsteczki  zbudowane  z nie  więcej 
niż  100  atomów,  wówczas  określenie  przesunięcia 
fazowego  polega  na  wyborze  odpowiedniej  funkcji 
rozkładu  gęstości.  Natomiast  gdy  bada  się  makro- 
cząsteczki zbudowane  zazwyczaj  z przynajmniej  1000 
atomów,  wtedy  takie  bezpośrednie  określenie  fazy 
jest  niemożliwe.  Wprowadzenie  do  cząsteczki  silnie 
rozpraszającego,  ciężkiego  atomu  daje  dopiero  od- 
powiedni punkt  odniesienia.  W wypadku  cząsteczek 
białek  zawierających  związane  strukturalnie  atomy 
ciężkich  pierwiastków,  takich  jak  żelazo  (hemoglobina, 
miogiobina,  cytochromy,  wiele  enzymów  utleniająco- 
-redukujących  itp.)  problem  rozwiązany  został  przez 
przyrodę.  Jednakże  w wypadku  innych  białek  wpro- 
wadzenie takiego  atomu  w określone  miejsce  czą- 
steczki jest  zadaniem  niełatwym. 

Badania  rentgenograficzne  struktury  makrocząste- 
czek są  bardzo  trudne  i pracochłonne.  Nawet  po 
wprowadzeniu  automatyzacji  pomiarów  i obliczeń 
za  pomocą  komputerów  rozwiązanie  problemu  struk- 
tury cząsteczki  białka  średniej  wielkości  wymaga  nie- 
jednokrotnie kilkuletniej  pracy  całego  zespołu  ba- 
daczy. Z tch  względów,  mimo  że  rentgenografia  stwa- 
rza ogromne  możliwości  poznawcze,  nie  jest  ona 
metodą  powszechnie  stosowaną  do  badania  struktury 
makrocząsteczek,  tym  bardziej,  że  wielu  związków  nie 
daje  się  otrzymać  w stanie  krystalicznym.  Dotych- 
czas zbadana  została  struktura  tylko  kilkudziesięciu 
spośród  tysięcy  białek  występujących  w przyrodzie. 
Wśród  nich  tylko  dla  kilkunastu,  o stosunkowa  małej 
masie  cząsteczkowej  i zawierających  na  ogół  struk- 
turalnie związane  atomy  ciężkich  pierwiastków,  udało 


się  określić  współrzędne  atomów,  dla  pozostałych 
białek  określono  tylko  ułożenie  łańcucha  peptydo- 
wego  w przestrzeni.  Niemniej  jednak  wyniki  krystalo- 
graficznych badań  biopolimerów  metodami  dyfrakcji 
promieniowania  rentgenowskiego  stanowią  zasadni- 
cze źródło  wiedzy  o ich  uporządkowanych  przestrzen- 
nie konformacjach.  Zaproponowane  na  ich  podstawie 
modele  budowy  różnych  chemicznie  klas  liniowych 
makrocząsteczek  są  pow  szechnie  stosowane  jako  pod- 
stawa interpretacji  zachowania  się  ich  w roztworach 
i in  vivo. 


Formy  przestrzennego  uporządkowania 
biopolimerów 

Najbardziej  rozpowszechnioną  formą  uporządkowa-  forma 
nia  przestrzennego  polipeptydów,  polinukleotydów  heliksu 
i polisacharydów  jest  ułożenie  głównego  łańcucha 
polimeru  wzdłuż  linii  śrubowej,  tj.  w postaci  heliksu. 

Wobec  ograniczonej  swobody  konformacyjnej  two- 
rzących te  polimery  ogniw  zapewnia  ona  maksymalne 
upakowanie  atomów  odpowiadające  minimum  energii 
układu.  Łańcuchy  boczne  zależnie  od  swojej  budowy 
chemicznej,  wzajemnych  oddziaływań  oraz  periodycz- 
ności  występowania  wzdłuż  łańcucha  głównego  mody- 
fikują parametry  geometryczne  heliksu  i umożliwia- 
ją powstawanie  bardziej  złożonych  form  helikalnych, 
takich  jak  np.  podwójny  heliks  DNA  lub  miozyny  czy 
potrójny  heliks  kolagenu  lub  hybrydu  DNA-RNA. 

Ogólnie  rzecz  biorąc  łańcuchy  przyjmują  formy  heli- 

kalne  w wyniku  występowania  sił  bliskiego  zasięgu 

między  sąsiadującymi  ze  sobą  ogniwami  łańcuchów 

(wiązania  wodorowe,  oddziaływania  van  der  Waalsa, 

oddziaływania  elektrostatyczne  polarnych  lub  zjoni- 

zowanych  grup).  Natomiast  oddziaływania  dalszego  formy  glo- 

zasięgu  między  odległymi  (w;zdłuż  osi  łańcucha)  jego  bularne 

elementami  powodują  powstawanie  form  globular- 

nych  białek  i kwasów  nukleinowych  (tRNA,  RNA 

fagów',  informacyjny  RNA  — o budowie  chemicznej 


kąt  konformacyjny  9 

Rys.  3.  Rozkład  konformacji  wiązania  peptydowego  w 15  globularnych  białkach  otrzymany  na  podstawie  badań  krystalograficznych : 
n#,#  liczba  konformacji  o danej  wartości  kątów-  konformacyjnych  (torsyjnych)  <p  i w przedziale  x = 10°;  linie  przerywane  odpowia- 
dają obszarom  przestrzeni  konformacyjnej,  w których  nie  stwierdzono  występowania  wiązań  peptydowych;  maksima  na  wykresie  od- 
powiadają konformacjom  typu  heliksu  a (wg  F.  M.  Pohl,  Chemistry  of  Macromolecules,  London  1974) 
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łańcucha  nie  sprzyjającej  przyjęciu  przez  niego  regu- 
larnej formy  helikalnej).  W cząsteczkach  globulamych 
łańcuchy  mogą  przyjmować  na  pewnych  odcinkach 
helikalne  lub  inne  właściwe  danej  klasie  makroczą- 
steczek konformacje  (np.  w przypadku  cząsteczek  bia- 
łek poza  formami  helikalnymi,  czyli  strukturami  a, 
struktury  p są  to  struktury  p).  Wiązania  wodorowe  i jonowe  do- 
datkowo spinają  lokalnie  uporządkowaną  globulę 
i w ten  sposób  przyjmuje  ona  kształt  właściwy  dla  łań- 
cucha (łańcuchów)  o danej  budowie  chemicznej.  In- 
nymi słowy  — indywidualną  cząsteczkę  cechuje  okre- 
ślony zespół  kątów  konformacyjnych  (współrzędnych) 
odpowiadających  jednemu  punktowi  wielowymiaro- 
wej przestrzeni  konformacyjnej.  W danej  klasie  poli- 
merów odchylenia  od  najbardziej  prawdopodobnych 
wartości  kątów  konformacyjnych  wałściwych  budowie 
poszczególnych  ich  ogniw  są  jednak  stosunkowo  nie- 
wielkie. Ilustruje  to  rys.  3,  na  którym  przedstawiony 
jest  rozkład  kątów  konformacyjnych  <p  i y>  łańcucha 
polipeptydowego  znalezionych  w kryształach  15 
białek  globulamych. 


Teoretyczne  badania  konformacji 

Doświadczalnym  badaniom  struktury  cząsteczek 
biopolimerów  w kryształach  towarzyszą  szybko  roz- 
wijające się  w ostatnich  latach  badania  teoretyczne. 
Ich  celem  jest  przewidywanie  konformacji  makro- 
cząsteczki o najniższych  wartościach  energii  poten- 
cjalnej na  podstawie  znajomości  budowy  chemicznej 
łańcucha  polimeru  oraz  oddziaływań  między  tworzą- 
cymi go  atomami.  Zadanie  sprowadza  się  do  znale- 
zienia funkcji  opisującej  zależność  energii  potencjal- 
nej układu  od  współrzędnych  wszystkich  atomów 
cząsteczki  w dopuszczalnym  zakresie  zmian  ich  war- 
tości. 

Podstawą  tego  typu  obliczeń  jest  model  budowy 
chemicznej  łańcucha  przyjęty  w teorii  izomerii  geo- 
metrycznej. Dopuszczalne  stereochemicznie  konfor- 
macje cząsteczki  definiuje  się  za  pomocą  kątów  torsyj- 
nych  opisujących  obroty  ogniw  wokół  wiązań  łań- 
opis  konfor-  cucha  głównego  polimeru  i grup  bocznych  w stosunku 
rnacji  makro-  do  osi  łańcucha;  podanie  ich  wartości  dla  wszystkich 
cząsteczki  kolejnych  ogniw  w łańcuchu  daje  opis  konformacji 
makrocząsteczki.  Jednakże  wykonanie  obliczeń  dla 
tak  dużych  układów  jest  jeszcze  technicznie  niemożli- 
we, zwłaszcza  że  należałoby  w nich  uwzględniać  rów- 
nież oddziaływania  między  odległymi  segmentami 
łańcucha  oraz  między  poszczególnymi  segmentami 
i cząsteczkami  roztworu.  Korzystając  jednak  z faktu, 
że  oddziaływania  określające  postać  funkcji  i energii 
potencjalnej  obrotu  wokół  danego  wiązania  w łań- 
cuchu głównym  zależą  w pierwszym  przybliżeniu 
tylko  od  wzajemnego  położenia  sąsiadujących  ze 


Rys.  4.  Opis  konformacji  łańcucha  polipeptydowego.  Grupa 
Uwupeptydowa,  w tym  przypadku  alanylowa,  wewnątrz  której 
występuje  korelacja  obrotów  wokół  wiązań  N — C (kąt  rotacyjny 
<p)  i C* — C'  (kąt  rotacyjny  ty)  podana  jest  na  niebieskim  tJc. 
Obrót  wokół  wiązań  N — C'  (kąt  rotacyjny  co  = 180°)  nic  za- 
chodzi w normalnych  warunkach  ze  względu  na  dużą  wysokość 
bariery  energetycznej  dla  obrotu  (JE  w 80  kJ/moI) 


sobą  ogniw,  można  obliczyć  energie  potencjalne  seg- 
mentów łańcucha,  w którym  występuje  korelacja 
kątów  obrotu.  W ten  sposób  przewiduje  się  najbar- 
dziej prawdopodobne  konformacje  podstawowych 
ogniw  łańcuchów.  Najwięcej  takich  obliczeń  wykona- 
no dotychczas  dla  białek.  Płaskość  wiązania  peptydo- 
wego  pozwala  opisać  izomerię  geometryczną  łańcucha 
za  pomocą  kątów  torsyjnych  ę?  i y>  (rys.  4).  Tak  więc 
segmentami  łańcucha,  których  rotacje  można  trakto- 
wać jako  praktycznie  swobodne,  są  dwupetydy  zde- 
finiowane przez  parę  kątów  i xpi  oraz  rodzaj  łań- 
cucha bocznego  R . Energia  konformacyjna  takich 
jednostek  zależy  w zasadzie  tylko  od  ich  chemicznej 
budowy,  tzn.  od  długości  wiązań  kowalencyjnych 
i kątów  między  nimi.  Parametry  geometryczne  tej 
budowy  muszą  być  wyznaczone  z niezależnych  badań 
krystalograficznych  dwupeptydów  lub  odpowiednich 
modelowych  związków.  Graficzne  przedstawienie 
energii  potencjalnej  układu  w funkcji  kątów  9?  i y 
przy  optymalnej  wartości  kąta  rotacyjnego  grupy 
bocznej  R stanowi  mapę  konformacyjną  dwupepty- 
du,  z której  można  odczytać  najbardziej  prawdopo- 
dobne jego  konformacje,  odpowiadające  najniższym  mapa  kon- 
wartościom  energii.  Energię  układu  można  obliczyć  formacyjna 
w sposób  przybliżony  metodami  klasycznymi  roz- 
dzielając funkcję  energii  potencjalnej  na  składowe 
pochodzące  od  różnego  typu  oddziaływań  między- 
atomowych  w cząsteczce  (wiązania  wodorowe,  van 
der  Waalsa,  elektrostatyczne,  dipol-dipol  indukowa- 
ny), dla  których  zależność  energii  oddziaływania  od 
parametrów  budowy  cząsteczki  można  podać  w po- 
staci analitycznej. 

Jednakże  od  czasu  opracowania  w połowie  lat 
60-ych  metod  mechaniki  kwantowej  przystosowanych 
do  badań  konformacyjnych  „dużych  układów”  (me- 
tody CNDO-2,  PCILO,  uwzględniające  wszystkie 
elektrony  walencyjne  n i a)  obliczenia  te  są  wykony- 
wane głównie  przy  ich  użyciu  (—►  Chemia  kwanto- 
wa). Mapa  konformacyjna  grupy  alanylowej,  obli- 
czona metodą  PCILO,  przedstawiona  na  rys.  5, 
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kąt  konformacyjny  <p 

Rys.  5.  Mapa  konformacyjna  reszty  alanylowej  białek,  wyniki 
obliczeń  otrzymano  metodą  PCILO;  przy  liniach  izoencrgetycz- 
nych  podane  są  wartości  energii  (od  1 do  7)  odniesionej  do  ogól- 
nego minimum  energii  cząsteczki,  wyrażone  w kcal/mol  (1  kcal  a 
« 4kJ,  7 kcal  « 29  kJ);  znak  -j-  oznacza  lokalne  minimum;  obszar 
konformacji  o energii  do  24  kj/mol  powyżej  ogólnego  minimum 
jest  zaznaczony  na  niebiesko.  Na  mapę  naniesiono  punkty  od- 
powiadające konformacjom  grupy  alanylowej  stwierdzonym 
w kilku  globulamych  białkach  na  podstawie  badań  krystalogra- 
ficznych (wg  A.  Pullman) 


pokazuje  dopuszczalne  jej  konformacje  w przedziale 
energii  0-25  kJ/mol.  Naniesione  zostały  na  nią  punkty 
odpowiadające  znalezionym  doświadczalnie  parom 
kątów  <p  i y>  dla  grupy  alanylowej  w krystalicznych 
białkach  globularnych.  Leżą  one  wprawdzie  w obrę- 
bie przewidzianego  teoretycznie  obszaru  konforma- 
cyjnej  stabilności  grupy  alanylowej,  jednakże  ich 
statystyczny  rozkład  w cząsteczkach  białek  nie  od- 
powiada tym  przewidywaniom.  Jest  to  wynik  oddzia- 
ływań dalszego  zasięgu,  których  w dotychczas  wyko- 
nywanych obliczeniach  nie  brano  świadomie  pod  uwa- 
gę. Podejmowane  są  obecnie  prace  mające  na  celu 
ich  uwzględnienie,  a także  — i to  przede  wszystkim  — 
uwzględnienie  wpływu  uwodnienia  i obecności  jonów 
w warstwie  solwatacyjnej  łańcuchów. 

Podobne  teoretyczne  badania  konformacji  „nie- 
zależnych’ł segmentów  łańcuchów  prowadzi  się  i dla 
opis  konfor-  innych  klas  biopolimerów  — kwasów  nukleinowych, 
mac] i DWA  polisacharydów,  fosfolipidów.  W przypadku  kwa- 
sów nukleinowych  nie  wyszły  one  poza  obliczenia 
map  konformacyjnych  poszczególnych  jej  fragmen- 
tów ze  względu  na  znacznie  większą  liczbę  stopni 
swobody  ogniw  nukleotydowych ; głównym  przed- 
miotem zainteresowania  są  dopuszczalne  ułożenia 
przestrzenne  łańcuchów  bocznych  względem  łań- 
cucha głównego,  decydujące  o geometrii  podwójnych 
hel  iksów  oraz  konformacje  pięcioczłonowych  pier- 
ścieni rybozy  i dezoksyrybozy. 

Badania  konformacji  makrocząsteczek 
w roztworach 

Ustalona  na  podstawie  danych  rentgenograficznych 
uśredniona,  statyczna  konformacja  makrocząsteczki 
w krysztale  odpowiada  określonemu  jej  stanowi  ter- 
modynamicznemu. Czy  jednak  stan  ten  jest  zachowa- 
ny przez  cząsteczki  biopolimerów  w roztworach 
wodnych  w warunkach  odpowiadających  trwałości 
termodynamicznej  ich  uporządkowanych  konfor- 
macji? Ogromna  liczba  geometrycznie  różnych  uło- 
żeń, które  może  przyjąć  łańcuch  polimeru,  nasuwa 
z kolei  pytanie,  czy  utworzona  w krysztale  lub  roz- 
tworze konformacja  makrocząsteczki  odpowiada 
globalnemu  minimum  energii  swobodnej  układu,  czy 
też  ma  ona  szereg  stanów  konformacyjnych  odpo- 
wiadających lokalnym  minimom  energii  swobodnej 
i oddzielonych  od  siebie  wysokimi  barierami  energe- 
tycznymi, tak  że  w określonych  warunkach  realizuje 
się  niekoniecznie  stan  najbardziej  prawdopodobny. 
Odpowiedzi  na  te  pytania  biofizyka  poszukuje  na 
drodze  badania  konformacji  makrocząsteczek  w roz- 
tworach, sił  odpowiedzialnych  za  ich  uporządko- 
wanie, trwałości  termodynamicznej  (denaturacja) 
i samoorganizacji  (renaturacja)  cząsteczek  ze  stanu 
kłębka  statystycznego.  Znajdują  w nich  zastosowanie 
praktycznie  wszystkie  metody  badania  kształtu 
i konformacji  cząsteczek,  jakimi  dysponuje  współ- 
czesna chemia  i fizyka. 

Przyjęcie  przez  łańcuch  polimeru  zdefiniowanej 
przestrzennie  konformacji  znajduje  swoje  odbicie 
w zewnętrznym  kształcie  cząsteczki  oraz  w jej  większej 
sztywności  w porównaniu  z formą  nieuporządko- 
badanie  waną.  Toteż  badanie  kształtów  i giętkości  makro- 
kształiu  cząsteczek  metodami  stosowanymi  w badaniach  ich 
i giętkości  form  nieuporządkowanych  umożliwia  w sposób 
pośredni  ocenę  charakteru  i stopnia  uporządkowania 
ich  łańcuchów.  Informacji  o konformacji  łańcuchów 
dostarczają  badania  spektroskopowe  właściwości  uwa- 
runkowanych symetrią  i względnym  położeniem  grup 
chromoforowych  (grup  o charakterystycznych  ce- 
chach widmowych).  Na  przykład  formy  helikalne 
badania  polipeptydów  i polinukleotydów  cechuje  ze  względu 
aktywności  na  właściwą  im  symetrię  budowy  duża  aktywność 
optycznej  optyczna  różniąca  się  znakiem  i wielkością  od  ak- 
tywności optycznej  ich  elementów  budowy  — amino- 
kwasów i nukleotydów  (różne  widma  dyspersji 
światła  spolaryzowanego  liniowo  lub  widma  absorpcji 


światła  spolaryzowanego  kołowo).  Inne  jeszcze  wła- 
ściwości optyczne  mają  warstwowe  struktury  fi  poli- 
peptydów. W helikalnych,  dwułańcuchowych  kon- 
formacjach polinukleotydów  warstwowo  ułożone 
pary  zasad  absorbują  znacznie  słabiej  promieniowa- 
nie nadfioletowe  niż  w bezładnie  zwiniętych  łańcu- 
chach (tzw.  efekt  hypochromowy).  Podobnie  wiele 
informacji  dotyczących  zarówno  uporządkowania 
większych  obszarów  makrocząsteczek  jak  i ich  frag- 
mentów uzyskuje  się  badając  właściwości  spektrosk-  badanie  wla- 
powe  określonych  atomów  lub  grup  atomów  (chro-  ściwości 
moforów)  i wykorzystując  zależność  ich  stanów  spi-  spektrosko- 
nowych  (spekstroskopia  jądrowego  rezonansu  mag-  powych 
netycznego  i elektronowego  rezonansu  paramagne-  chromoforów 
tycznego,  zjawisko  Móssbauera),  oscylacyjnych  (wid- 
ma absorpcyjne  w podczerwieni,  widma  Ramana) 
i elektronowych  (absorpcyjna  i emisyjna  spektrosko- 
pia w nadfioletowej  i widzialnej  części  widma)  od 
natury,  odległości  i orientacji  sąsiadujących  z nimi 
innych  atomów  i ich  grup.  Metody  te  pozwalają  na 
obserwację  zmian  zachodzących  w otoczeniu  chromo- 
forów w procesach  organizacji  i dezorganizacji  czą- 
steczek oraz  w wyniku  oddziaływań  ich  z innymi  czą- 
steczkami w roztworze.  Zakres  zastosowania  metod 
spektroskopowych  stale  wzrasta,  m.in.  dzięki  roz- 
wojowi metod  badawczych  i ich  podstaw  teoretycz- 
nych oraz  opanowaniu  techniki  wprowadzania 
w określone  miejsca  makrocząsteczek  małych  czą- 
steczek (wiązanych  kowalencyjnie  lub  w postaci 
specyficznych  kompleksów)  o szczególnie  czułych  na 
zmiany  w otoczeniu  i o wyróżniających  się  właściwo- 
ściach spektroskopowych.  Spełniają  one  funkcję 
sond  stanu  konformacyjnego  makrocząsteczki.  Żad- 
na jednak  z metod  badania  konformacji  makroczą- 
steczek w roztworach  nie  pozwala  na  wyznaczenie 
parametrów  geometrii  łańcucha. 

Złożoność  budowy  chemicznej  i wielkość  cząsteczek 
biopolimerów  narzuca  oczywistą  strategię  badań 
właściwości  ich  stanu  uporządkowanego  w roztwo- 
rach, polegającą  na  redukcji  wielkości  badanych 
układów.  Bada  się  zatem  określone  większe  fragmen-  badanie 
ty  natywnych  cząsteczek,  proste  elementy  ich  budo-  fragmentów 
wy  jak  monomery  lub  dimery  oraz  cząsteczki  two- 
rzące łańcuchy  boczne.  Przedmiotem  badań  są  rów- 
nież syntetyczne  modeie  naturalnych  łańcuchów 
o prostszej  chemicznie  i odpowiednio  zaprogramo- 
wanej budowie  i stopniu  polimeryzacji.  Badania 
właściwości  konformacyjnych  fragmentów  i modelo- 
wych cząsteczek  pozwalają  na  ocenę  roli  łańcuchów 
bocznych  monomerów  o różnej  chemicznej  budowie 
(grupy  alifatyczne  i aromatyczne  aminokwasów,  za- 
sady purynowe  i pirymidynowe  nukleotydów)  w for- 
mowaniu się  określonych  konformacji  polimerów\ 

Dostarczają  również  danych  dotyczących  fizycznego 
charakteru  i wielkości  energii  oddziaływań  określa- 
jących geometrię  i trwałość  tych  konformacji. 


Siiy  odpowiedzialne  za  organizację 
łańcuchów  makrocząsteczek 

Poznanie  sił  odpowiedzialnych  za  organizację  gięt- 
kich łańcuchów  polimerów  w uporządkowane  kon- 
formacje ma  zasadnicze  znaczenie  w zrozumieniu 
właściwości  ich  stanu  uporządkowanego. 

Ogólnie  rzecz  biorąc  oddziaływania  van  der  Waalsa 
i elektrostatyczne  między  atomami  fragmentów  budo- 
wy makrocząsteczek  odpowiedzialne  są  zarówno  za 
konformacje  łańcuchów  głównych  jak  i ich  prze- 
strzenne upakowanie  w uporządkowanych  formach 
makrocząsteczek.  Charakterystyczne  dla  danej  makro- 
cząsteczki rozmieszczenie  różnych  łańcuchów  bocz- 
nych wzdłuż  łańcucha  głównego  determinuje  wystą- 
pienie nieco  silniejszych,  kooperatywnych  oddziały- 
wań przyciągających  między  określonymi  fragmenta- 
mi jej  budowy  i przyjęcie  przez  nią  najbardziej  praw- 
dopodobnej energetycznie  i termodynamicznie  formy 
uporządkowania  przestrzennego.  Oddziaływania  te 
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mają  w tym  sensie  charakter  kierunkowy.  Wyróżnia 
się  wśród  nich  przede  wszystkim  oddziaływania  pro- 
wadzące do  utworzenia  tzw.  wiązań  wodorowych 
( — A-H — B — ) między  akceptorowymi  (A)  i donoro- 
wymi (B — H)  ugrupowaniami  atomów,  zawierającymi 
atomy  tlenu,  azotu  i siarki,  z których  jeden  związany 
jest  kowalencyjnie  z atomem  wodoru. 

W przyjętych  modelach  konformacji  łańcuchów 
polipeptydowych  i polinukleotydowych  wiązaniom 
wodorowym  przypisuje  się  rolę  oddziaływań  służą- 
cych wzajemnemu  rozpoznawaniu  się  i przestrzennej 
orientacji  segmentów  cząsteczki  sąsiadujących  ze  so- 
bą w tym  samym  łańcuchu  (np.  heliks  a polipepty- 
dów),  w przeciwległym  łańcuchu  (np.  podwójny 
heliks  DNA)  lub  oddalonych  od  siebie  (formy  globu- 
larne).  Szczegółowa  charakterystyka  stereochemicz- 
nych i termodynamicznych  warunków  ich  powsta- 
wania w układach  modelowych  oraz  określenie  ich 
energii  w zależności  od  typu  struktury,  w której  wy- 
stępują, jest  przedmiotem  licznych  prac. 

Specyficzne  właściwości  konformacyjne  biopoli- 
merów ujawniają  się  wyłącznie  w roztworach  wodnych, 
toteż  poznanie  hydratacji  makrocząsteczek  (wiązania 
się  z cząsteczkami  wody)  i roli  wody  w formowaniu 
się  i stabilizacji  uporządkowanych  struktur  zajmuje 
szczególnie  istotne  miejsce  we  współczesnych  bada- 
niach. Utworzeniu  specyficznych,  wewnątrzcząstecz- 
kowych  wiązań  wodorowych  towarzyszy  usunięcie 
cząsteczek  wody  związanej  podobnymi  wiązaniami 


stopniu  uporządkowania 
< S°  (gaz) 


globularnej 


Rys.  6.  Molekularny  i termodynamiczny  model  oddziaływań  hyd- 
rofobowych między  grupami  alifatycznymi  w roztworze  wodnym: 
a)  Schemat  rozpuszczania  cząsteczek  węglowodoru  alifatycznego 
w wodzie ; ograniczona  rozpuszczalność  węglowodoru  alifatycz- 
nego W HjO,  tzn.  AGrozo  = AHro7.it—  T(ASmnt  + J-Sbydrofob  ^ 0 
(gdzie  G — energia  swobodna  Gibbsa,  H — entalpia)  wynika 
z obniżenia  się  entropii  układu  JShydroto*  = S°  — S%  (gaz)  < 0 
na  skutek  wzrostu  uporządkowania  cząsteczek  wody  wokół 
cząsteczek  węglowodoru  ( AHrozp  < 0 jest  to  entalpia  rozpusz- 
czania, JSkom  « 0 — zmiana  entropii  konfiguracyjnej  węglowo- 
doru, i S$  (gaz)  — cząstkowe  entropie  związku  w roztworze 
oraz  w fazie  gazowej),  b)  Schemat  agregacji  cząsteczek  węglowo- 
doru oraz  c)  grup  alkilowych  łańcuchów  bocznych  liniowego  poli- 
meru. Agregacja  jest  procesem  termodynamicznie  korzystnym, 
tzn.  JGagr  = d//a(tr—  TAS*gv<  0,  ponieważ  towarzyszy  mu  du- 
ży przyrost  entropii  układu  JSagr  = JSkonr-f  J(JShy<irofob)  > 0 
spowodowany  usunięciem  cząsteczek  wody  z warstwy  solwatacyj- 
nej  otaczającej  agregujące  grupy  i cechującej  się  wyższym  stopniem 
uporządkowania  molekularnego  niż  sam  rozpuszczalnik 
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wodorowymi  z grupami  akceptorowymi  (A)  i do- 
norowymi (B — H)  polimerów.  Bilans  energetyczny 
procesów  zerwania  istniejących  wiązań  wodorowych 
A**H — O — H i B — H*  OH2  i utworzenia  nowych 
wiązań  A - • H — B wnosi  swój  wkład  do  zmiany  energii 
swobodnej  układu.  Procesy  te  są  jednak  ciągle  nie- 
wystarczająco zbadane  termochemicznie  i zinterpre- 
towane termodynamicznie.  Udział  wody  w powsta- 
waniu natywnych  konformacji  biopolimerów  przeja- 
wia się  jednak  przede  wszystkim  w skłonności  nie- 
polamych  ich  fragmentów  budowy  do  skupiania  się 
z wytworzeniem  bezpośrednich  kontaktów  i usunię- 
ciem cząsteczek  wody  z ich  powierzchni  (oddziaływa- 
nia hydrofobowe).  Procesowi  temu  towarzyszy  znacz- 
ny wzrost  entropii  układu,  który  decyduje  o obniżeniu 
jego  energii  swobodnej,  stanowiąc  zatem  siłę  napędo- 
wą reorganizacji  struktury  molekularnej  (rys.  6). 

W cząsteczkach  białek  globularnych  oddziaływa- 
nia hydrofobowe  powodują  skupianie  się  we  wnętrzu 
globuli  segmentów  łańcuchów  polipeptydowych, 
zbudowanych  z aminokwasów  mających  grupy  wę- 
glowodorowe jako  łańcuchy  boczne.  W cząsteczkach 
kwasów  nukleinowych  oddziaływania  hydrofobowe 
są  jedną  z przyczyn  warstwowej  organizacji  par  za- 
sad we  wnętrzu  podwójnego  heliksu.  Odpowiedzialne 
są  one  również  za  dwuwarstwową  organizację  fosfo- 
lipidowych  błon  komórkowych  (-►  Błony  komórko- 
we). Zaproponowane  dotychczas  molekularne  mode- 
le oddziaływań  hydrofobowych,  a także  oparta  na 
nich  terrnodynamiczno-statystyczna  interpretacja  wła- 
ściwości roztworów  zawierających  cząsteczki  orga- 
niczne o budowie  zbliżonej  do  elementów  budowy 
biopolimerów,  tylko  w sposób  przybliżony  wyjaśniają 
doświadczalnie  obserwowane  ich  właściwości.  Przy- 
czyną takiego  stanu  rzeczy  jest  niezadowalający  po- 
stęp badań  termochemicznych  i badań  struktury  roz- 
tworów wodnych.  Brak  jest  nawet  poprawnej  mole- 
kularnej teorii  stanu  ciekłego  wody. 

Trwałość  uporządkowanych  konformacji  biopoli- 
merów, których  łańcuchy  mają  właściwości  polielek- 
trolitów,  zależy  oczywiście  od  stanu  oddziaływań  elek- 
trostatycznych w układzie  makrocząsteczka-jony 
elektrolitów  obecnych  w roztworze.  Elektrostatyczne 
odpychanie  się  ujemnie  naładowanych  grup  fosfo- 
estrowych  sąsiadujących  ze  sobą  w cząsteczkach  kwa- 
sów nukleinowych  obniża  stabilność  konformacji  po- 
dwójnego heliksu.  Obecne  w roztworze  kationy  sil- 
nych elektrolitów,  takich  jak  NaCl,  KC1,  MgCI2, 
skupiają  się  wokół  ujemnie  naładowanych  centrów 
i ekranują  je.  Ponieważ  gęstość  powierzchniowa  ujem- 
nego ładunku  podwójnego  heliksu  DNA  jest  większa 
niż  pojedynczej  nici  polinukleotydowej,  kationy  są  sil- 
niej wiązane  przez  formy  uporządkowane  kwasów  nu- 
kleinowych, wywierając  wpływ  stabilizujący  je.  Ana- 
logicznie jest  stabilizowana  obecnością  kationów 
warstwowa  budowa  fosfolipidowych  błon  biologicz- 
nych. In  vivo  oprócz  kationów  metali  Na+,  K+, 
Ca+2,  Mg+2  itd.  stabilizujący  wpływ  na  DNA  wy- 
wierają również  dodatnio  naładowane  grupy  poliamin 
i białek  zasadowych  obecnych  w chromatynie. 

Ponieważ  energia  oddziaływań  elektrostatycznych 
jest  odwrotnie  proporcjonalna  do  przenikalności 
dielektrycznej  e ośrodka  rozdzielającego  ładunki 
elektryczne,  a wartość  e pozbawionego  wody  apo- 
larnego  wnętrza  globuli  białkowej  jest  znacznie  mniej- 
sza niż  wody,  zatem  energia  elektrostatyczna  we 
wnętrzu  globuli  jest  przynajmniej  o jeden  rząd  wiel- 
kości większa  niż  na  jej  powierzchni.  Toteż  przycią- 
gające oddziaływania  elektrostatyczne  między  do- 
datnio i ujemnie  naładowanymi  ogniwami  — ami- 
nokwasami (wiązania  jonowe)  odgrywają  istotną 
rolę  w fałdowaniu  łańcuchów  polipeptydowych  i sta- 
bilizacji globularnych  makrocząsteczek. 

W wielu  białkach  spełniających  funkcje  transpor- 
towe (np.  hemoglobina,  cytochromy)  lub  katalitycz- 
ne (np.  enzymy  uczestniczące  w reakcjach  utleniania 
i redukcji)  jony  metali  ciężkich,  takich  jak  Fe,  Mo, 
Co,  Mn,  Zn,  specyficznie  i trwale  związane  w warun- 
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kach  fizjologicznych,  odgrywają  rolę  centrów  wiążą- 
cych i katalitycznych.  Zmiany  stanu  utlenienia  jonu 
metalu  wywołują  w nich  zmiany  konformacyjne, 
przystosowujące  cząsteczki  do  udziału  w kolejnym 
etapie  cyklu  transportowego  lub  katalitycznego. 

Niespecyficzne  i specyficzne  oddziaływania  jonów 
metali  z cząsteczkami  biopolimerów  kontrolujące  ich 
konformacje,  a tym  samym  i funkcje  w komórce,  są 
od  wielu  lat  przedmiotem  systematycznych  badań 
doświadczalnych  i teoretycznych,  obecnie  dalekich 
jeszcze  od  zakończenia. 


Dynamika  uporządkowanych  konformacji 
biopolimerów 


Stan  termodynamiczny  i trwałość  uporządkowanych 
konformacji  makrocząsteczek  określone  są  sumą  bar- 
dzo wielu  słabych  oddziaływań  wewnątrzcząsteczko- 
wych  i międzycząsteczkowych  ze  składnikami  roz- 
f luktuacje  tworu  wodnego.  W rezultacie  w cząsteczka  !;  wystę- 
konforma-  pują  termiczne  fluktuacje  konformacyjne  wywołujące 
cyjne  odchylenia  kątów  konformacyjnych  od  wartości  naj- 
bardziej prawdopodobnych  w „statycznej”  konfor- 
macji w stanie  krystalicznym.  Fluktuacje  te  mają  naj- 
prawdopodobniej charakter  drgań  własnych  układu, 
określonych  budową  chemiczną  łańcucha  i jego  prze- 
strzenną organizacją.  Nadają  one  makrocząsteczkom 
właściwości  układów  stochastycznych.  O występo- 
waniu fluktuacji  świadczą  przede  wszystkim  obserwa- 
cje wskazujące  na  to,  że  pewne  grupy  funkcjonalne 
białek  i kwasów  nukleinowych,  ukryte  — wg  danych 
krystalograficznych  — w ich  wnętrzu,  są  dostępne 
przez  krótkie,  1G”3-10~®  s,  okresy  czasu  dla  różnych 
reakcji  chemicznych  (np.  wymiana  atomów  wodoru 
i deuteru),  bądź  dla  oddziaływań  fizycznych  z cząstecz- 
kami obecnymi  w roztworze  (np.  gaszenie  fluorescen- 
cji  określonych  grup  przez  tlen).  Poznanie  „widma 
fluktuacji  konformacyjnych”  makrocząsteczek,  tzn. 
zależności  częstości  fluktuacji  od  energii  aktywacji, 
oraz  przypisanie  poszczególnym  częstościom  okre- 
fluktuacjo  ślonych  zmian  w budowie  makrocząsteczek  będzie 
a mechanizm  miało  istotne  znaczenie  dla  wyjaśnienia  mechaniz- 
rozpoznawa-  mów  specyficznego  rozpoznawania  przez  makro- 
nia  cząsteczki  innych  makrocząsteczek,  a także  małych 
cząsteczek,  w trakcie  spełniania  właściwych  im  funkcji 
w komórce.  Dotychczas  jednak  jeszcze  bardzo  nie- 
wiele wiadomo  o tych  fluktuacjach  z doświadczalnego 
punktu  widzenia.  Rozwój  technik  szybkich  pomia- 
rów kinetycznych  w przedziałach  czasu  mikro-  i na- 
nosekundowych  połączonych  ze  spektroskopowymi 
badaniami  zmian  konformacyjnych  rokuje  nadzieje 
na  postęp  w doświadczalnych  badaniach  dynamiki 
budowy  makrocząsteczek.  Podejmowane  są  również 
próby  teoretycznego  jej  opisu. 


Zmiany  stanu  uporządkowania 
makrocząsteczek 

Doświadczalne  badania  przebiegu  procesów  dezor- 
ganizacji przestrzennej  budowy  (denaturacji),  samo- 
organizacji i przejścia  cząsteczek  białek  i kwasów 
nukleinowych  oraz  ich  syntetycznych  modeli  z jed- 
nej uporządkowanej  konformacji  w drugą  dowodzą, 
że  zmiana  stanu  konformacyjnego  makrocząsteczki 
jest  procesem  odwracalnym  (jeżeli  nie  zachodzą  w niej 
zmiany  chemiczne),  kooperatywnym  i ma  charakter 
przejścia  fazowego  II  rodzaju.  Oznacza  to,  że  zmiany 
strukturalne  w makrocząsteczce  zachodzą  w sposób 
ciągły,  towarzyszy  im  ciągła  zmiana  entalpii  i skoko- 
wa zmiana  pojemności  cieplnej  układu.  Poznanie 
termodynamiki,  molekularnych  mechanizmów  i kine- 
tyki tych  procesów  dla  różnych  klas  biopolimerów 
i indywidualnych  makrocząsteczek  w poszczególnych 
klasach  oraz  ich  statystyczno-termodynamiczna  in- 
terpretacja ma  na  celu  otrzymanie  odpowiedzi  na 
dwa  zasadnicze  pytania : w jaki  sposób  można  przewi- 


dywać, opierając  się  na  znajomości  budowy  chemicz- 
nej cząsteczek,  ich  uporządkowane  konformacje? 
Jakie  są  elementarne  fizyczne  mechanizmy  ich  działa- 
nia w komórce  i jak  one  wynikają  z ich  właściwości 
konformacyjnych?  Dzisiaj  biofizyka  nie  jest  jeszcze 
w stanie  udzielić  zadowalającej  odpowiedzi  na  te 
pytania.  Systematyczne  badania  w tej  dziedzinie  zo- 
stały podjęte  stosunkowo  niedawno.  Jednakże  wyniki 
ich  pozwalają  już  na  sformułowanie  szeregu  ogólniej- 
szych wniosków  i hipotez. 

Szczególnie  wiele  informacji  dotyczących  mecha- 
nizmu samoorganizacji  makrocząsteczek  dostarczają 
obserwacje  spektroskopowe  procesu  relaksacji  upo- 
rządkowanych konformacji,  wytrąconych  z równowa- 
gi termodynamicznej  przez  skokową  zmianę  tempera- 
tury lub  ciśnienia  w roztworze.  Okazuje  się,  że  czas 
potrzebny  do  przyjęcia  przez  bezładnie  zwinięty 
kłębek  określonej  konformacji  jest  bardzo  krótki, 
zależy  jednak  oczywiście  od  wielkości,  charakteru 
i złożoności  budowy  chemicznej  cząsteczki.  Na  przy- 
kład jest  on  rzędu  10"8  s dla  formowania  się  helikal- 
nych  konformacji  najprostszych  polipeptydów  zbu- 
dowanych tylko  z jednego  rodzaju  aminokwasów. 
Natomiast  samoorganizacja  łańcuchów  naturalnych 
polipeptydów  w formy  głobulame  o złożonej  prze- 
strzennej organizacji  wymaga  od  0,01  do  kilku  se- 
kund. Tak  krótki  czas,  w którym  giętki  łańcuch  po- 
limeru przyjmuje  określoną  konformację  spośród 
ogromnej  liczby  izomerycznych  jej  odmian,  realizu- 
jących się  w stanie  kłębka  statystycznego,  świadczy 
o tym,  że  proces  organizacji  musi  przebiegać  przez 
ograniczoną  liczbę  stanów  pośrednich.  Można  łatwo 
obliczyć,  że  gdyby  proces  fałdowania  łańcucha  poli- 
peptydowego  zbudowanego  ze  150  aminokwasów 
miał  przebiegać  przez  „sprawdzanie”  w przypadkowy 
sposób  wszystkich  dostępnych  mu  konformacji  trwa- 
łoby to  wówczas  1026  lat!  Na  pojawienie  się  stanów 
przejściowych  w procesach  formowania  się  globular- 
nych  cząsteczek  białek  i tRNA  wskazują  obserwacje 
spektroskopowe,  analiza  profili  przejść  konformacyj- 
nych oraz  pomiary  czasów  relaksacji.  W białkach 
globularnych  obserwuje  się  występowanie  dwu  i wię- 
cej czasów  relaksacji  w obrębie  przejścia  kłębek 
^ globula.  Interpretacja  ich  na  podstawie  analo- 
gicznych doświadczeń  z polipeptydami  o konforma- 
cjach heliksu  a i warstwowej  struktury  fi  prowadzi  do 
wniosku,  że  pierwsze,  szybkie  stadium  fałdowania 
łańcucha  polipeptydowego  białka  polega  na  utworze- 
niu helikalnych  fragmentów.  Dużo  powolniejsze 
stadium,  ograniczające  szybkość  powstawania  globuli, 
wiąże  się  z formowaniem  struktury  /?  (rys.  8).  Po- 
dobnie w przypadku  tRNA  powstanie  globularnej 
formy  cząsteczki  rozpoczyna  się  od  utworzenia  szeregu 
odcinków  podwójnego  heliksu  między  komplemen- 
tarnymi odcinkami  tego  samego  łańcucha  (rys.  7). 
Najpowolniejszym  stadium  procesu  powstawania 
form  helikalnych  i warstwowych  jest  utworzenie 
zarodka  konformacji  właściwej  dla  danej  cząs- 
teczki (powstanie  wiązań  wodorowych  między  sąsia- 
dującymi resztami  peptydowymi  lub  między  komple- 
mentarnymi parami  zasad  w polinukleotydach),  od 
którego  poczynając  następuje  szybki,  kooperatywny 
proces  formowania  się  tej  konformacji  w całym  łań- 
cuchu. 

Przedstawiony  wyżej  model  procesu  samoorganiza- 
cji białek  globularnych  stanowi  podstawę  prób  teo- 
retycznego wyjaśnienia  konformacji  białek,  których 
struktura  w kryształach  została  ustalona  metodami 
dyfrakcji  promieniowania  rentgenowskiego.  Termo- 
dynamiczno-statystyczna  interpretacja  przejść  konfcr- 
macyjnych  (zcb.  niżej)  w odpowiednio  dobranych  mo- 
delowych połipeptydach  pozwala  na  określenie  para- 
metrów termodynamicznych  charakteryzujących  pra- 


Rys.  7.  Samoorganizacja  cząsteczki  tRNA:  powstawanie  formy 
globularnej  poprzedzone  jest  formowaniem  się  struktur  typu 
szpilki  od  włosów  o budowie  podwójnego  heliksu  między  kom- 
plementarnymi fragmentami  łańcucha  poiirybonukieotydowcgo 
(p  jest  symbolem  reszty  estrowej  kwasu  ortofosforowego) 
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wdopodobieóstwo  występowania  reszt  poszczególnych 
aminokwasów  w konformacjach  heliksu  a,  struk- 
tury fi  i mniej  regularnych  konformacjach  warunku- 
jących zaginanie  się  łańcuchów.  Następnie  stosując 
metody  termodynamiki  statystycznej  oblicza  się  dla 


kooperatywnego.  Wśród  biopolimerów  nie  stwier- 
dzono dotychczas  antykooperatywności,  tj.  a > 1. 
Dla  układów  o złożonej  budowie  nie  można  otrzymać 
rozwiązań  w postaci  analitycznej  ze  względu  na 
ogromne  trudności  matematyczne.  Dotyczy  to  zwłasz- 


kłębek  statystyczny 
łańcucha  poiipeptydowego 


Rys  8 Samoorganizacja  makrocząsteczek  globularnego  białka:  / proces  powstawania  zarodków  struktur  a-helikalnych,  pętli  i zagięć 
łańcucha  poiipeptydowego  w wyniku  lokalnych  oddziaływań  między  sąsiadującymi  ogniwami;  II  w wyniku  oddziaływań  między  odda- 
lonymi fragmentami  łańcucha  formują  się  centra  krystalizacji  globularnej  typu  szpilki  od  włosów ; ///powstanie  przejściowej  struktury 
głobularnej  w wyniku  połączenia  się  kilku  centrów  krystalizacji;  IV  ostateczne  uformowanie  się  konformacj i globuli  po  adjustacji  ką- 
tów konformacyjnych  łańcucha  i wzajemnych  orientacji  segmentów  do  wartości  odpowiadających  ogólnemu  minimum  energii  układu 


polipeptydu  o znanej  budowie  łańcucha  prawdopo- 
dobieństwo przyjmowania  przez  jego  segmenty  kon- 
formacji odpowiadających  tym  formom  uporządko- 
wania. Otrzymuje  się  dość  dobrą  zgodność  przewi- 
dywań teoretycznych  z danymi  krystalograficznymi. 

Statystyczno-termodynamiczna  teoria 
przejść  konformacyjnych 

Statystyczno-termodynamiczna  teoria  przejść  kon- 
formacyjnych została  opracowana  dla  wielu  jedno-, 
dwu-  i trójwymiarowych  układów  makrocząsteczko- 
wych i supercząsteczkowych  o właściwościach  ko- 
operatywnych. Opisuje  ona  przejścia  między  różnymi 
konformacyjnie  uporządkowanymi  stanami  łańcu- 
chów, między  danym  stanem  uporządkowanym  i i sta- 
nem kłębka  statystycznego,  a także  przejścia  pole- 
gające na  zmianie  wzajemnej  orientacji  lub  stopnia 
polimeryzacji  makrocząsteczek  tworzących  funkcjo- 
nalne kompleksy  nadmolekularne  zbudowane  z wielu 
identycznych  lub  różnych  podjednostek. 

Jeżeli  znana  jest  liczba  i dostępnych  makrocząstecz- 
ce lub  układowi  makrocząsteczek  stanów  konforma- 
cyjnych o energii  Et  i statystycznej  wadze  g\y  można 
obliczyć  funkcję  rozdziału  Q = Zgie~EilkT-  Wią- 
że ona  molekularne  i termodynamiczne  właściwości 
układu,  ponieważ  energia  swobodna  układu  G zależy 
następująco  od  jej  wartości:  G=  —RT\nQ.  Po- 
sługując się  rachunkiem  macierzowym  wyprowadza 
się  funkcję  analityczną  wiążącą  doświadczalnie  ob- 
serwowany stopień  przejścia  0 z parametrami  termo- 
dynamicznymi układu  — stałymi  równowagi,  i z tem- 
peraturą (ewentualnie  innym  parametrem  charak- 
teryzującym czynnik  przesuwający  tę  równowagę). 
W najprostszym  wypadku  przejścia  konformacyjnego 
realizującego  się  w dużym,  jednorodnym  i jednowy- 
miarowym układzie  (długi  łańcuch  zbudowany  z iden- 
tycznych ogniw,  dla  którego  można  pominąć  efekty 
brzegowe  w procesie  nukleacji,  czyli  tworzenie  się 
zarodka  konformacji),  parametrami  termodynamicz- 
nymi układu  są:  stała  równowagi  s procesu  wzrostu 
uporządkowania  po  nukleacji  oraz  stała  równowagi 
tego  ostatniego  procesu  as.  Współczynnik  a określa 
kooperatywność  układu.  Zależy  ona  wykładniczo  od 
zmiany  energii  swobodnej  procesu  nukleacji: 

a — e“Gn«ki/*r. 

Gdy  Gnuki  >0,  to  a < 1,  czyli  układ  jest  koopera- 
tywny, natomiast  gdy  Gnuki  = 0,  również  a — 0 
i zmiany  zachodzące  w układzie  nie  mają  charakteru 


cza  układów  trójwymiarowych,  takich  jak  białka 
globularne.  Udaje  się  jedynie  oszacować  metodami 
numerycznymi  przybliżone  wartości  parametrów 
termodynamicznych  uproszczonego  modelu  układu. 

Wszystkie  podstawowe  właściwości  termodyna- 
miczne układu  kooperatywnego  wyjaśnia  w prosty 
i jednocześnie  ogólny  sposób  teoria  przejść  konforma- 
cyjnych w układzie  jednowymiarowym,  opracowana 
przez  B.  Zimma  i J.  Bragga.  Oparta  jest  ona  na  mode- 
lu Isinga  jednowymiarowej  sieci  spinów  elektrono- 
wych ferromagnetyka,  rozważanym  w teorii  przejść 
fazowych  ferromagnetyk  ^ paramagnetyk  w punkcie 
Curie.  Model  ten  zakłada  występowanie  elementów 
układu  w dwóch  tylko  stanach  A i B oraz  koopera- 
tywność ograniczoną  do  oddziaływań  między  bez- 
pośrednio sąsiadującymi  ze  sobą  elementami.  Ozna- 
cza to,  że  i-ty  element  w sąsiedztwie  elementu,  np. 
w stanie  B wykazuje  tendencję  do  przyjęcia  tego  sa- 
mego stanu.  Model  ten  dobrze  opisuje  wiele  rzeczy- 
wistych układów,  np.  przejście  między  dwiema  helikal- 
nymi  konformacjami  poliproliny  I i II,  polegające 
na  izomeryzacji  cis-trans  wiązania  peptydowego 
(wówczas  wartości  0 równe  1 i 0 odpowiadają  for- 
mom I i II).  Dla  długiego,  jednorodnego  łańcucha 
spełniającego  założenia  takiego  modelu  wykres 
funkcji  6 = f(sy  as)  pokazuje,  że  ostrość  przejścia 
(nachylenie  krzywej)  zależy  od  wartości  a (rys.  9). 
Im  mniejsza  wartość  tego  współczynnika,  tym  większa 
jest  liczba  N0  — 1/j/cr  sąsiadujących  ze  sobą  ogniw 
zmieniających  jednocześnie  swoją  konformację  (tzw. 


stała  równowagi  s 

Rys.  9.  Zależność  stopnia  przejścia  konformacyjnego  9 od  stałej 
równowagi  s przy  różnych  wartościach  współczynnika  koopera- 
tywności  S(S  — 1 • 10-*,  10-4)  w jednowymiarowym  modelu  Isinga 
liniowego  polimeru 


zastosowa- 
nie modelu 
Isinga 
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długość  kooperatywna)  i tym  samym  ostrzejsze,  bar- 
dziej kooperatywne  przegięcie.  Oznacza  to,  że  w ukła- 
dach o silnej  kooperatywności  ( a rzędu  10"3-10~4) 
nawet  niewielka  zmiana  równowagi  3 ln  s/dx  wywoła- 
na działaniem  bodźca  x na  układ  (zmiana  ta  jest 
analogia,  proporcjonalna  do  ]/o  ) pociąga  za  sobą  rozległe  zmia- 
z układami  ny  konformacyjne.  Makrocząsteczkowe  układy  ko- 
przełączają-  operatywne  mogą  zatem  spełniać  analogiczne  funkcje 
cymi  jak  wyzwalające  układy  elektroniczne  (rys.  lOa).  Jeżeli 
funkcja  danego  układu  kooperatywnego  zależy 
od  jego  stanu  konformacyjnego  (np.  funkcje  katali- 
tyczne białek  enzymatycznych  lub  transportowe  bia- 
łek błon  komórkowych),  wówczas  bodźce  wyzwalają- 
ce w nim  przejścia  między  stanami  o dużej  i małej  ak- 
tywności spełniają  rolę  regulatorów  jego  działania. 
Układy  takie  zachowują  się  analogicznie  jak  elek- 
troniczne układy  wzmacniające,  takie  jak  np.  trioda 
lampowa  lub  odpowiedni  układ  tranzystorowy  (rys. 
lOb). 


Rys.  10.  Analogia  działania  między  elektronicznymi  a koopera- 
tywnymi układami  makromolekularnymi:  a)  Przełączanie: 

schemat  i charakterystyka  prądowo-napięciowa  diody  lampowej 
oraz  schemat  i charakterystyka  przejścia  konformacyjnego  wy- 
wołanego działaniem  bodźca  zewnętrznego  (T  oznacza  tempera- 
turę, pH  ujemny  logarytm  stężenia  jonów  wodorowych,  E pole 
elektryczne,  cx  — stężenie  ligandu).  b)  Wzmacnianie:  schemat 
i charakterystyka  prądowo-napięciowa  triody  lampowej  oraz 
schemat  allostcrycznej  regulacji  aktywności  enzymu  (T  i R stany 
enzymu  o niskiej  i wysokiej  aktywności  katalitycznej)  i wykres 
zależności  szybkości  reakcji  od  stężenia  substratu  (c*>  w obec- 
ności allosterycznego  aktywatora  (+)  i inhibitora  (-)  katalizy 


Czas  przebiegu  elementarnych  procesów  związa- 
nych z przemianami  konformacyjnymi  jest  rzędu 
czas  10_1°  s.  Całkowity  czas  przebiegu  przemiany  obejmu- 
przebiegis  jącej  wiele  ogniw  makrocząsteczki  jest  oczywiście  od- 
przemiany  powiednio  dłuższy,  jednakże  wystarczająco  krótki 
w skali  czasu  procesów  komórkowych  dla  zapewnie- 
nia sprawnej  kontroli  sterowania  tymi  procesami. 

Małocząsteczkowe  układy  molekularne,  w których 
zachodzą  rzeczywiste  przejścia  fazowe  I rodzaju  typu 
ciecz-kryształ  nie  mają  takich  właściwości.  Zmiany 
struktury,  a więc  i objętości  oraz  wszystkich  potencja- 
łów termodynamicznych,  następują  w nich  skokowo. 
Wymagają  one  znacznie  większych  energii  aktywacji 
i przebiegają  wobec  tego  znacznie  wolniej  niż  zmiany 
konformacyjne  w kooperatywnych  układach  makro- 
cząsteczkowych. 


Kooperatywne  właściwości  bio- 
polimerów a regulacja  ich  funkcji 

Cząsteczki  biopolimerów  spełniają  wszystkie  warunki 
układów  o dużym  stopniu  kooperatywności.  Zmiany 
ich  stanu  konformacyjnego  mogą  zachodzić  w wa- 


runkach fizjologicznych,  jeśli  chodzi  o temperaturę, 
stężenie  elektrolitów  oraz  stężenie  jonów  wodorowych. 
Rolę  bodźca  wyzwalającego  zmianę  stanu  równowagi 
termodynamicznej  makrocząsteczki,  oprócz  zmian 
temperatury  i stężenia  określonych  jonów,  może  od- 
grywać wiele  innych  czynników  fizycznych  i chemicz- 
nych. 

Energia  cząsteczek  polielektrolitów  — jako  ukła- 
dów elektrostatycznych  — zależy  od  wielkości  przy- 
łożonego pola  elektrycznego.  W wielu  peptydach 
obserwowano  in  vitro  przejścia  konformacje  wywoły- 
wane działaniem  pól  o potencjale  porównywalnym 
z potencjałem  błon  biologicznych  in  vivo. 

Wiadomo  również,  że  wiele  małocząsteczkowych 
i makrocząsteczkowych  ligandów  pełniących  w ko- 
mórce różnorodne  funkcje  regulacyjne  i kontrolne  ma 
większe  powinowactwo  do  jednej  z pozostających 
w równowadze  konformacji  polimeru  lub  jego  frag- 
mentu i wiążąc  się  z nim  przesuwa  równowagę  w kie- 
runku tej  konformacji.  Na  przykład  aminy  alifatycz- 
ne i białka  zasadowe  — histony,  odgrywające  istotną 
rolę  w organizacji  i funkcjonowaniu  chromatyny, 
stabilizują  podwójny  heliks  DNA.  Inne  białka  tzw. 
rozplatające,  które  uczestniczą  w procesie  replikacji 
DNA  fagów,  bakterii  i organizmów  wyższych  (np. 
białko,  będące  produktem  genu  32  bakteriofaga  T4), 
obniżają  temperaturę  przejścia  konformacyjnego 
DNA  heliks  kłębek.  Wiązanie  przez  cząsteczki 
białek  enzymatycznych  cząsteczek  substratów,  koen- 
zymów i regulatorów  allosterycznych  wywołuje  zmia- 
ny stanu  konformacyjnego  pewnych  obszarów  glo- 
buli białkowej. 

Przyczyną  zmian  stanu  termodynamicznego  makro- 
cząsteczek w procesach  oddziaływania  z innymi  cząs- 
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Rys.  11.  Generacja  i działanie  siły  w układzie  kooperatywnym: 
a)  generacja  siły  wywołana  zmianą  stanu  równowagi  konforma- 
cyjnej  heliks  kłębek  bezładny,  b)  po  związaniu  cząsteczki 
ligandu  A o większym  powinowactwie  do  kłębka  wzrost  swobod- 
nej energii  układu  wywołuje  jego  kontrakcję  /heiiks  > Im* bek 
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teczkami  jest  porównywalność  energii  oddziaływań 
wewnątrzcząsteczkowych  i międzycząsteczkowych. 
Dalszą  konsekwencją  tego  stanu  rzeczy  jest  sprzężenie 
energetyczne  różnych  ligandów  związanych  z różnymi 
fragmentami  makrocząsteczki.  Innymi  słowy,  dzia- 
łanie danego  bodźca  na  układ  może  wzmagać  lub 
niweczyć  jednoczesne  działanie  innego. 

Reakcja  kooperatywnego  układu  na  działanie  zew- 
nętrznego bodźca  w formie  przejścia  konformacyjnego 
może  z kolei  być  źródłem  generacji  siły : / = —SGfdx 
mechanicznej  (rys.  11),  osmotycznej,  chemicznej  lub 
elektrycznej.  Energia  swobodna  G makrocząsteczki 
w roztworze  jest  bowiem,  ogólnie  rzecz  biorąc,  funkcją 
jej  rozmiarów  liniowych,  gradientu  stężenia  jonów 
i wiążących  się  z makrocząsteczką  cząsteczek  związ- 
ków organicznych,  a także  powierzchniowego  po- 
tencjału elektrycznego.  Warunkiem  pojawienia  się 
takiej  siły  jest  oczywiście  anizotropowa  budowa  danej 
cząsteczki  jak  i większego,  otaczającego  ją  układu, 
gdyż  tylko  wówczas  działanie  bodźca  i reakcja  układu 
może  mieć  charakter  kierunkowy.  Praca  wykonywana 
działaniem  tych  sił  w komórce,  która  jest  układem  silnie 
anizotropowym,  jest  związana  z przemianą  różnych 
form  energii  chemicznej  związków  wysokoenergety- 
cznych, takich  jak  ATP  (o  wysokim  potencjale  chemi 
cznym),  stanowiących  podstawowe  źródło  energii  ko- 
mórki, w inne  formy  energii  chemicznej  (reakcje  enzy- 
matyczne), a także  w energię  osmotyczną  (aktywny 
transport  przez  błony  komórkowe),  mechaniczną 
(m.in.  skurcz  mięśnia)  i elektryczną  (potencjały 
błon  komórkowych).  Tak  więc  kooperatywne  przejścia 
konformacyjne  makrocząsteczek  stanowią  podstawę 
wielu  elementarnych  mechanizmów  funkcjonowania 
układów  komórkowych  na  poziomie  molekularnym, 
a także  funkcjonalnych  powiązań  układów  o ró- 
żnych funkcjach  biochemicznych  między  sobą. 


Regulacja  układów  enzymatycznych 

Dobrze  poznane  pod  względem  biochemicznym  i kine- 
tycznym procesy  regulacji  działania  enzymów  i kom- 
pleksów enzymatycznych  (— ► Białka)  dostarczają 
szczególnie  dużo  przykładów  powiązań  funkcjonal- 
nych, opartych  na  kooperatywnych  właściwościach 
cząsteczek  białek.  Zapewne  najprostszym  przykładem 
jest  ałlosteryczna  regulacja  aktywności  katalitycznej 
enzymów  zbudowanych  z pojedynczej  cząsteczki 
białka.  Wiązanie  przez  białko  w miejscu  odległym  od 
jego  centrum  katalitycznego  cząsteczki  efektora  reak- 
cji, powstającej  w innym  procesie  enzymatycznym 
lub  transportowanej  do  komórki  przez  otaczającą  ją 
błonę,  wywołują  zmianę  konformacyjną  w miejscu 
wiązania  substratu,  zwiększającą  lub  obniżającą  szyb- 
kość reakcji  enzymatycznej. 

Znacznie  bardziej  złożony  jest  kooperatywny  me- 
chanizm regulacji  enzymów  zbudowanych  z kilku 
cząsteczek  białek  tworzących  trwały  termodynamicz- 
nie kompleks.  W kompleksach  takich  mogą  zachodzić 
zmiany  wzajemnego  położenia  podjednostek,  wy- 
wołane lokalnymi  zmianami  konformacji  tych  pod- 
jednostek. Różnym  stanom  funkcjonalnym  takiego 
układu  odpowiadają  różne  konfiguracje  ułożenia  pod- 
jednostek w kompleksie.  W supercząsteczk owych 
kompleksach  białkowych  może  realizować  się  sprzę- 
żenie dwóch  różnych  reakcji  enzymatycznych.  Na 
przykład,  związanie  substratu  lub  uwolnienie  pro- 
duktu reakcji  w jednym  z centrów  katalitycznych  może 
wywoływać  zmianę  konformacyjną  w cząsteczce 
białka,  która  w wyniku  konformacyjnego  sprzężenia 
dalekiego  zasięgu  indukuje  aktywację  centrum  kata- 
litycznego innej  reakcji  biochemicznej.  Przypuszcza 
się,  że  tego  typu  mechanizm  może  być  odpowiedzial- 
ny za  sprzężenie  transportu  elektronów  i syntezy  ATP 
z ADP  w procesie  oddychania  w mitochondriach  (— ► 
Organizacja  procesów  życiowych  komórki).  Zmiana 
stanu  utlenienia  atomu  żelaza  w cytochromie  C,  jed- 
nym z białek  tworzących  łańcuch  transportu  elektro- 


nów, wywołuje  w nim  rozległą  zmianę  konformacyjną, 
która  reguluje  aktywność  ATPazy  — enzymu  sąsia- 
dującego z nim  w kompleksie  supercząsteczkowym. 
W ten  sposób  obywa  się  przemiana  chemicznej  energii 
substratów  łańcucha  oddechowego  w energię  ATP  — 
uniwersalne  źródło  energii  chemicznej  w komórce. 


Regulacja  funkcji  błon  komórkowych 

Zbliżone  swym  charakterem  do  przejść  fazowych 
ciekłych  kryształów  przejścia  konformacyjne  w po- 
dwójnych warstwach  fosfolipidowych  błon  komórko- 
wych (-►Błony  komórkowe.  Ciekłe  kryształy)  od- 
grywają prawdopodobnie  istotną  rolę  w regulacji  ich 
różnorodnych  funkcji.  Doświadczenia  z modelowymi 
błonami  pokazują,  że  w podwójnej  warstwie  lipido- 
wej duża  część  energii  swobodnej  układu  związana 
jest  z oddziaływaniami  elektrostatycznymi  polarnych 
i zjonizowanych  grup  fosfoestrowych  na  jej  powierz- 
chni. Zmiany  gęstości  powierzchniowej  ładunku,  a tym 
samym  i powierzchniowego  potencjału  elektrycznego 
błony,  wywołane  przesunięciem  równowagi  dysocjacji 
kwasowej  tvch  eruo  oraz  adsorpcją  na  ich  powierzchni 
jonów  metali  dwuwartościowych  (Ca++),  przesuwają 
równowagę  fazową  uporządkowania  łańcuchów  wę- 
glowodorowych we  wnętrzu  warstwy.  Obniżenie 
gęstości  ładunku  zwiększa  stan  uporządkowania  łań- 
cuchów, podczas  gdy  jego  wzrost  wywołuje  odwrotny  ( 
efekt.  Jony  Na+  i K*  obniżają  potencjał  powierzchnio- 
wy błony  zwiększając  stopień  dysocjacji  kwasowej 
grup  fosfoestrowych  i obniżając  temperaturę  przejścia 
fazowego.  Natomiast  jony  H+  i Ca++  ulegają  adsorp- 
cji na  powierzchni  błony,  redukują  jej  ujemny  ładu- 
nek powierzchniowy  i zwiększają  temperaturę  przejś- 
cia. Tak  więc  przejścia  fazowe  wywołane  w stałej  tem- 
peraturze działaniem  jednego  czynnika,  np.  H+,  Na+, 
zgodnie  z kooperatywnymi  właściwościami  układu 
wywołują  duże  zmiany  w równowadze  wiązania 
przez  błonę  wapnia  Ca++.  Błona  może  zatem  być 
kontrolowanym  rezerwuarem  jonów  wapnia,  odgry- 
wających istotną  rolę  regulacyjną  w wielu  procesach, 
np.  w regulacji  skurczu  mięśnia  oraz  w funkcjonal- 
nym sprzężeniu  rodopsyny  z zakończę  niami  syna- 
ptycznymi układu  nerwowego  w narządzie  wzroku. 

W naturalnych  błonach  biologicznych  cząsteczki 
białek,  spełniające  różnorodne  funkcje  enzymatyczne, 
transportowe  i sygnalizacyjne,  są  „zanurzone”  w war- 
stwach lipidowych.  Zapewnia  to  wzajemne  sprzężenie 
konformacyjne  warstwy  lipidowej  i białek  oraz  białek 
między  sobą,  a tym  samym  powiązanie  funkcjonalnej 
błony  i cząsteczek  białek. 


Regulacja  skurczu  mięśnia 

Innym,  bardziej  złożonym  przykładem  powiązań 
funkcjonalnych  zachodzących  dzięki  kooperatywnym 
zmianom  w molekularnej  organizacji  układu  jest 
włókno  mięśniowe.  W tym  wypadku  kooperatywne 
oddziaływania  elementów  jego  budowy  obejmują  całą 
komórkę.  Złożony  proces  przemiany  energii  chemicz- 
nej w energię  mechaniczną  w trakcie  skurczu  włókien 
mięśniowych  przejawia  się  jako  widoczne  pod  mikro- 
skopem przesuwanie  się  cienkich  (aktynowych)  fila- 
mentów  względem  nieruchomych  filamentów  grubych 
(miozynowych)  ku  centralnej  części  sarkomeru  (-► 
Molekularne  podstawy  skurczu  mięśnia).  Proces  ini- 
cjowany jest  przez  jony  Ca+2  uwalniane  z błony  sia- 
teczki sarkoplazmatycznej  komórki  mięśniowej  w wy- 
niku pobudzenia  przez  impuls  nerwowy.  Zarówno  na- 
pięcie mięśnia  jak  i szybkość  hydrolizy  cząsteczki  ATP 
(źródła  chemicznej  energii  dla  pracy  mięśnia),  związa- 
nej z miozyną,  krytycznie  zależą  od  stężenia  jonów 
wapnia  w sposób  typowy  dla  procesów  kooperatyw- 
nych (rys.  12). 

Kooperatywność  procesu  makroskopowego  jest 
wynikiem  ciągu  następujących  po  sobie  kooperatyw- 
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nych  zmian  w molekularnej  organizacji  włókna  mięś- 
niowego, inicjowanych  przyłączeniem  jonów  Ca+2  do 
jednej  z podjednostek  troponiny  — białka  regulujące- 
go skurcz,  składnika  fiJamentów  cienkich.  Związanie 


napięcie  mięśnia  7 =1 


Rys.  12.  Napięcie 
mięśnia  i aktywność 
miofibrylarncj  ATP- 
azy  w zależności  od 
stężenia  jonów  Ca+* 
(pCa+*  ujemny  loga- 
rytm  stężenia);  wg 
A.  Weber  Functional 
Linkage  in  Biomole- 
cular  Systems , New 
York  1975 


jonów  wapnia  wywołuje  przejście  konformacyjne  w 
troponinie,  które  pociąga  za  sobą  zmianę  położenia 
innego  białka  regulującego,  obecnego  w filamencie 
cienkim  — tropomiozyny,  względem  tworzących 
rdzeń  filamentu  czesteczek  aktyny.  W ten  sposób, 
w wyniku  przyłączenia  jonów  Ca2+  do  jednej  cząstecz- 
ki troponiny  zostają  odsłonięte  miejsca  reagowania 
z miozyną  w siedmiu  sąsiadujących  ze  sobą  monome- 
rach Iaktyny.  Łącząc  się  z globulamymi  zakończenia- 
mi cząsteczek  miozyny  w grubym  filamencie,  stano- 
wiącym część  tzw.  poprzecznych  mostków  miozyno- 
wych,  aktyna  przyspiesza  hydrolizę  ATP  w centrum 
katalitycznym  miozyny  zlokalizowanym  w mostku. 
W trakcie  hydrolizy  zachodzi  zmiana  konformacji  za- 
równo globulamej  jak  i liniowej  części  cząsteczki  mio- 


zyny tworzącej  mostek,  a jej  wynikiem  jest  przesunię- 
cie cienkiego  filamentu  względem  grubego.  Także 
uporządkow-anie  cząsteczek  miozyny  w grubym  fila- 
mencie, przejawiające  się  w helikalnym  ułożeniu  ich 
globularnych  zakończeń  wzdłuż  osi  filamentu,  ma 
charakter  kooperatywny  i kontrolowane  jest  przez  stę- 
żenie elektrolitu. 

Mimo  stosunkowo  dobrze  poznanej  molekularnej 
organizacji  włókien  mięśniowych  oraz  zachodzących 
w niej  w trakcie  skurczu  zmian,  ciągle  hipotetyczny  fizyczny 
jest  charakter  sił  powodujących  przesuwanie  się  fila-  model  skur- 
mentu  aktynowego.  Wiele  przesłanek  doświadczał-  ozu  mięśnia 
nych  wskazuje  na  istotne  znaczenie  w tym  procesie  od- 
działywań elektrostatycznych  między  cyklicznie  gene- 
rowanymi centrami  na  powierzchni  stykających  się 
filamentów  w trakcie  „włączania”  aktyny  przez  jony 
Ca+2  oraz  hydrolizy  ATP  w zakończeniach  mostków 
poprzecznych  miozyny  (powstają  wówczas  aniony 
dwufosforanu  adenozyny  i kwasu  fosforowego).  Rów- 
nież zmiany  w elastyczności  konformacji  mostków 
związane  z hydrolizą  ATP  niewątpliwie  odgrywają 
w nim  rolę.  Dzięki  elastyczności  budowy  filamentów 
pojawienie  się  siły  odpychającej,  skierowanej  po- 
przecznie do  nich,  musi  powodować  izometryczne  na- 
pięcie mięśnia  wzdłuż  osi  filamentów  i jego  skurcz 
w wyniku  przesunięcia  się  filamentów  cienkich.  Elek- 
trostatyczne oddziaływania  odpychające  między  fila- 
mentami  oraz  elastyczność  ich  budowy  leżą  u podstaw 
wielu  modeli  skurczu  mięśnia,  opisujących  fizjologicz- 
ne i termodynamiczne  właściwości  mięśni.  W mole- 
kularnym mechanizmie  skurczu  mięśnia  dopatrujemy 
się  obecnie  ogólniejszych  praw  rządzących  ukierun- 
kowanym ruchem  makrocząsteczek  w cytoplazmie. 

L.  A.  Blumenfeld  Problemy  fizyki  biologicznej , Warszawa  1978; 

W.  N.  Cwietkow  i in.  Struktura  makrocząsteczek  w roztworach , 

Warszawa  1968;  W.  Hoppe  i in.  Biophysik,  Berlin  1977;  H.  Mo- 
ra ^ wetz  Fizykochemia  roztworów  makrocząsteczek , Warszawa 
1970;  F.  O.  Schmitt  i in.  Functional  linkage  in  biomolecular 
systems , Nowy  Jork  1975;  M.  W.  Wolkensztein  Biologia  mole- 
kularna, Warszawa  1969;  M.  W.  Wolkensztein  Mofekularna- 
ja  biofizika , Moskwa  1975. 


Organizacja  procesów  życiowych 
komórki 

Tadeusz  Kłopotowski 


Planeta  nasza  zamieszkała  jest  przez  ogromną  liczbę 
różnych  gatunków  organizmów.  Różnią  się  one 
między  sobą  nie  tylko  wielkością  i kształtem,  lecz 
również  odmiennymi  warunkami  życia  oraz  stopniem 
złożoności  ich  budowy  i procesów  fizjologicznych. 

Zróżnicowanie  świata  żywego  rozpoczyna  się  od 
form  tak  prostych  jak  bakteriofagi  i wirusy,  które 
zawierają  jedynie  kwasy  nukleinowe  (RN A lub  DNA) 
i są  otoczone  warstwą  identycznych  cząsteczek  biał- 
kowych oraz  mają  struktury  niezbędne  do  wniknięcia 
lub  wstrzyknięcia  samych  tylko  kwasów  nukleino- 
wych do  komórek.  Bakteriofagi  i wirusy  nie  wykazu- 
ją żadnej  przemiany  materii  poza  komórkami.  DNA 
bakteriofagu  po  wniknięciu  do  komórki  jest  włącza- 
ny w określone  mu  miejsce  w chromosomie  albo  też 
zawarte  w tym  chromosomie  geny  podlegają  proceso- 
wi uaktywnienia.  W tym  drugim  wypadku  następują 
kolejno  zmiany  w metabolizmie  komórki:  produkcja 
swoistych  białek  regulatorowych  i enzymów,  replika- 
cja DNA  pasożyta,  uformowanie  nowych  bakteriofa- 
gów, które  po  rozpadzie  komórki  wydobywają  się  do 
otoczenia.  Po  napotkaniu  nowych  wrażliwych  komó- 
rek cykl  ten  się  powtarza  od  wniknięcia,  przez  mo- 
ment decyzji  — integracja  lub  ekspresja  informacji 
— do  stabilizacji  lub  mnożenia  się. 

Najprostszymi  organizmami,  czyli  jednostkami 
zdolnymi  do  samodzielnej  wegetacji,  są  bakterie.  Są 
to  twory  jednokomórkowe,  zdolne  do  samodzielnego 


metabolizmu  i reprodukcji  bez  związku  z innymi 
komórkami.  Istnieje  ogromna  liczba  gatunków  bak- 
terii. Różnią  się  one  swoją  budową  genetyczną, 
a przez  to  strukturą  poszczególnych  elementów  bu- 
dowy, przebiegiem  dróg  metabolicznych  i wymogami 
życiowymi.  Bakterie  autotroficzne  nie  wymagają  do 
życia  żadnych  związków  organicznych  z zewnątrz, 
inne  zwane  prototroficznymi,  wymagają  jedynie  glu- 
kozy. Niektóre  gatunki  bakterii  żyjące  w organizmach 
roślinnych  lub  zwierzęcych  wymagają  do  swego  wzro- 
stu również  i innych  związków  organicznych  z zew- 
nątrz, np.  witamin  i aminokwasów.  Ewolucja  wy- 
kształciła gatunki  bakterii  o różnych  możliwościach 
przystosowywania  się  do  zmiennych  warunków  zew- 
nętrznych: do  głodu  względnego  — przez  zatrzymanie 
jednych,  a uruchomienie  drugich  szlaków  metabo- 
licznych, do  życia  w ciemności  lub  wykorzystywania 
energii  świetlnej,  do  życia  w warunkach  tlenowych  lub 
beztlenowych.  Zakres  zdolności  adaptacyjnych  jest 
cechą  charakterystyczną  danego  gatunku  i jest  zde- 
terminowany genetycznie.  Ponieważ  materiał  gene- 
tyczny, DNA,  jest  narażony  na  mutacje,  czyli  przypad- 
kowe zmiany  składu  chemicznego,  wszystkie  gatunki, 
i to  nie  tylko  bakterii,  wykształciły  w procesie  ewo- 
lucji systemy  enzymatyczne  naprawy  tych  zmian. 

Informacja  genetyczna  dla  pełnego  cyklu  repro-  prokarionty 
dukcji  bakterii  oraz  różnych  procesów  metabolicz- 
nych i adaptacyjnych  zawarta  jest  w pojedynczych 
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kolistych  cząsteczkach  DNA.  Na  tej  podstawie 
wszystkie  zbadane  pod  tym  względem  bakterie  zo- 
stały nazwane  organizmami  prokariotycznymi  (pro- 
kariontami). 

eukarionty  Stojące  wyżej  w rozwoju  świata  żywego  organizmy 
eukariotyczne  (eukarionty)  mają  w każdej  komórce 
po  kilka  lub  nawet  kilkadziesiąt  różnych  chromoso- 
mów, będących  linearnymi  cząsteczkami  DNA, 
zwykle  w kompleksach  z białkami.  Stanowią  one  za- 
sadniczą część  jąder  komórkowych,  tworów  otoczo- 
nych błonami  o wybiórczej  przepuszczalności.  Naj- 
prostszymi eukariontami  są  drożdże  i niektóre  grzyby 
zdolne  do  bytu  jednokomórkowego.  Wszystkie  orga- 
nizmy wielokomórkowe,  zarówno  rośliny  jak  i zwie- 
rzęta, są  eukariontami. 

Komórki  organizmów  wyższych  są  zróżnicowane 
i tworzą  odrębne  tkanki,  czyli  zespoły  komórek  o ta- 
kiej samej  budowie  i funkcji.  Zróżnicowanie  komórek 
polega  na  tym,  że  mają  one  nie  wszystkie  funkcje  zako- 
dowane w ich  DNA,  ale  tylko  ich  część.  W porówna- 
niu z komórkami  prokariotycznymi  mają  one  ograni- 
czone zdolności  adaptacyjne,  a wiele  ich  funkcji 
nie  służy  ich  własnej  wegetacji,  lecz  celom  niezbęd- 
nym do  trwania,  rozwoju  lub  reprodukcji  całego  orga- 
nizmu. Kombinacje  tkanek  tworzą  wyspecjalizowane 
narządy,  takie  jak:  wątroba,  serce,  mózg. 
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Rys.  1.  Masa  składników  komórkowych  i komórek 


Złożoność  świata  żywego  i rozmaitość  struktury 
i funkcji  jego  podstawowych  elementów,  czyli  komó- 
rek, powoduje  oczywiste  trudności  we  wszelkich  pró- 
bach zwięzłego  przedstawienia  systemów  organizacji 
procesów  życiowych.  Trudności  te  są  tym  większe, 
że  tylko  niektóre  z tych  procesów  zostały  poznane 
na  tyle,  by  można  było  przedstawić  choćby  najważ- 
niejsze uczestniczące  w nich  cząsteczki,  a także  ich 
oddziaływania.  A jeśli  już  do  tego  doszło,  to  poznane 
procesy  mają  często  ograniczony  zasięg  występowania 
w świecie  żywym  (rys.  1). 


Strukturalne  elementy  komórek 


błony  Każda  komórka  jest  tworem  oddzielonym  od  środo- 
komórkowe  wiska  zewnęrznego  lub  innych  komórek  układem 
błon  (->  Błony  komórkowe).  Funkcja  tych  błon  polega 
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na  zabezpieczeniu  stałości  środowiska  wewnętrznego 
komórki  przez  ograniczenie  swobodnej  dyfuzji  skład- 
ników znajdujących  się  w jej  wnętrzu  na  zewnątrz, 
jak  również  związków  chemicznych,  znajdujących 
się  w otoczeniu,  do  wnętrza  komórki.  Ponadto,  błony 
te  stanowią  siedzibę  układów  transportujących  selek- 
tywnie związki  chemiczne  oraz  receptorów  służących 
do  rozpoznawania  zmian  środowiska  lub  innych,  bar- 
dziej swoistych  bodźców. 

Poszczególne  błony  danej  komórki  mają  różną  bu- 
dowę chemiczną  i mało  jeszcze  wiadomo  o poprzecz- 
nych powiązaniach  między  nimi.  U niektórych  bak- 
terii błona  najbardziej  zewnętrzna  jest  oddzielona  od 
tzw.  sztywnej  ściany  przestrzenią  peryplazmatyczną. 
Zachowuje  ona  własne  środowisko  osmotyczne,  lecz 
jest  względnie  łatwo  dostępna  dla  związków  chemicz- 
nych pochodzących  z zewnątrz.  W przestrzeni  pery- 
plazmatycznej  nie  zachodzą  żadne  reakcje  wymagające 
energii.  Zawiera  ona  enzymy  hydrolizujące  estry  lub 
naturalne  polimery,  a także  białka  uczestniczące 
w aktywnym  transporcie,  który  dopiero  w dalszych 
etapach  wymaga  nakładu  energii. 

Najpowszechniejszym  elementem  funkcjonalnym 
błon  komórkowych  są  liczne,  lecz  mało  poznane  kom- 
pleksy transportujące  selektywnie  proste  jony  lub  nie 
zjonizowane  związki  chemiczne.  Poznano  ich  właści- 
wości kinetyczne,  ale  tylko  w nielicznych  wypadkach 
udało  się  zidentyfikować  białka  uczestniczące  w tych 
procesach.  Stwierdzono  np.,  że  enzymy  fos  fory  lujące 
cukry  są  silnie  związane  z błonami  bakterii  i udowod- 
niono, że  fosforylacja  ta  jest  niezbędna  do  pobierania 
prostych  cukrów  z zewnątrz.  W błonach  komórek 
zwierzęcych  znajduje  się  enzym,  umożliwiający  do- 
starczanie energii  do  procesu  wymiany  kationów 
wbrew  gradientom  stężeń. 

W błonach  bakterii  zlokalizowane  są  enzymy  ukła- 
du oddechowego  niezbędnego  w gospodarce  energe- 
tycznej komórki  oraz  specjalne  struktury  przetwa- 
rzające energię  metaboliczną  na  ruch  rzęsek.  Dzięki 
temu  mogą  się  one  kierować  w stronę  większych  stę- 
żeń potrzebnych  im  związków  chemicznych.  Zdolność 
tę  nazwano  chemotaksją.  Układ  czuciowy  służący  do 
rozpoznawania  gradientów  tych  związków  lub 
związków  toksycznych  jest  zlokalizowany  w błonach, 
lecz  jedynymi  poznanymi  dotąd  składnikami 
tego  układu  są  wspomniane  wyżej  białka  prze- 
strzeni peryplazmatycznej , uczestniczące  również 
w aktywnym  transporcie. 

Wnętrze  komórki  stanowi  cytoplazma.  W płynnym 
składniku  cytoplazmy,  zwanym  ostatnio  cytosolem, 
zachodzą  procesy  metaboliczne.  W cytoplazmie  znaj- 
dują się  elementy  strukturalne,  takie  jak  jądro  oraz 
inne,  zwane  ogólnie  organellami.  Jądro  i organelle 
mają  własne  błony  o selektywnej  przepuszczalności, 
która  zapewnia  im  autonomię  środowiska  wewnętrz- 
nego. 

Zasadniczym  składnikiem  jąder  są  chromosomy, 
które  są  nośnikami  informacji  genetycznej.  Komórki 
eukariotyczne  mają  w jądrach  podwójne  komplety 
chromosomów  odziedziczone  po  rodzicach.  Dzięki 
temu  każdy  ich  gen  występuje  w dwu  wersjach  rodzi- 
cielskich. W danej  komórce  tylko  niektóre  pary  genów 
są  aktywne,  tzn.  podlegają  procesowi  transkrypcji, 
której  produktem  jest  komplementarny  mRNA  (-> 
Kwasy  nukleinowe). 

Aktywność  genów  jest  regulowana  w zależności  od 
bodźców  wewnętrznych  lub  zewnętrznych,  które  mo- 
gą być  m.in.  przenoszone  przez  rekacje  hormonów 
ze  swoistymi  receptorami  na  powierzchni  komórek. 
W jądrach  znajdują  się  składniki  układu  replikacji 
chromosomów  i ich  segregacji,  zapewniające  komór- 
kom potomnym  otrzymanie  takich  samych  kompletów 
chromosomów.  Tylko  niektóre  bardzo  wyspecjalizo- 
wane komórki,  np.  krwinki  czerwone  ssaków,  nie 
mają  jąder. 

Organellami  powszechnie  występującymi  w orga- 
nizmach eukariotycznych  są  mitochondria.  Ich  głów- 
ną, a może  nawet  jedyną  rolą  w komórce  jest  przetwa- 


cytoplazma 


jądro 


mitochondria 


chloroplasty 


cytosol 


rzanie  energii  chemicznej  metabolitów  w energię  wy- 
sokoenergetycznych pirofosforanowych  wiązań  ATP. 
/Elektrony  uwolnione  z utlenianych  związków  są 
przenoszone  wzdłuż  łańcucha  swoistych  białek,  w tym 
cytochromów  (-+  Białka),  o coraz  to  wyższych  po- 
tencjałach utleniania  i redukcji.  Przypuszcza  się,  że 
przestrzenne  usytuowanie  tych  białek  względem  siebie 
sprzyja  procesowi  transportu  elektronów.  Są  one 
zlokalizowane  na  ułożonych  równolegle  przegrodach 
nadających  obrazom  uzyskanym  za  pomocą  mikro- 
skopu elektronowego  charakterystyczny  wygląd. 
Ważnym  elementem  mitochondriów  jest  ich  błona, 
gdyż  jej  potencjał  jest  najistotniejszym  elementem 
w procesach  przekształcania  energii.  W komórce 
bakterii  funkcję  tę  spełnia  błona  komórkowa. 

Mitochondria  zawierają  własne  koliste  cząsteczki 
DNA  o wielkości  odpowiadającej  ok.  jednej  setnej 
chromosomu  bakterii.  Treść  genetyczna  tego  DNA 
najlepiej  jest  poznana  u drożdży  piekarskich,  będą- 
cych najprostszymi  organizmami  eukariotycznymi. 

Mitochondria  mają  odrębny  układ  biosyntezy  biał- 
ka. Jego  składniki  i właściwości  przypominają  bak- 
teryjny układ  biosyntezy  białka.  Podobieństwo  to 
dotyczy  np.  wielkości  rybosomów  oraz  wrażliwości 
biosyntezy  na  niektóre  antybiotyki.  Dało  ono  asumpt 
hipotezie,  że  we  wczesnych  etapach  ewolucji  doszło 
do  symbiozy  jakichś  prabakterii  i innych  komórek. 
W dalszych  jej  etapach  powstały  komórki  eukario- 
tyczne z mitochondriami  jako  reliktami  tych  pra- 
bakterii. 

Komórki  roślinne  zawierają  organelle  nazywane 
chloroplastami,  które  są  miejscem,  gdzie  przebiegają 
procesy  fotosyntezy.  Zasadniczym  ich  składnikiem 
są  barwniki,  takie  jak  chlorofil,  umożliwiające  wyko- 
rzystanie energii  słonecznej.  Podobnie  jak  mito- 
chondria, chloroplasty  zawierają  DNA  i mają  układ 
biosyntezy  białka  podobny  do  bakteryjnego.  Podobna 
jest  też  hipoteza  ich  powstania  w dawnych  etapach 
ewolucji. 

Wiele  ważnych  procesów  metabolicznych  zachodzi 
poza  omówionymi  już  elementami  strukturalnymi  ko- 
mórki, w jej  płynnym  składniku  — cytosolu.  Są  to 
zarówno  procesy  kataboliczne,  z których  najważniej- 
szym jest  glikoliza  czyli  przemiana  glukozy  poprzez 
estry  fosforowe  do  pirogronianu,  jak  i liczne  procesy 
anaboliczne,  polegające  na  syntezie  elementów  struk- 
tury komórkowej  z prostych  metabolitów. 

Najważniejszym  procesem  anabolicznym  jest  bio- 
synteza białka.  Głównymi  czynnikami  w tym  procesie 
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są  informacyjne  RNA,  tzw.  mRNA  (-+  Kwasy  nu- 
kleinowe), będące  rybonukleinowymi  wersjami  ge- 
nów, rybosomy,  tj.  makrocząsteczkowe  kompleksy 
swoistego  RNA  z kilkudziesięcioma  różnymi  biał- 
kami, kilkadziesiąt  różnych  tRNA,  z których  każdy 
jest  związany  z właściwym  mu  aminokwasem,  wiele 
białek  o swoistych  funkcjach  oraz  ATP  i GTP  (gua- 
nozynotrójfosforan)  jako  źródła  energii  dla  tworzenia 
wiązań  peptydowych.  W trakcie  procesu  translacji  są 
syntetyzowane  białka  wg  programu  zakodowanego 
w mRNA. 

U bakterii  proces  ten  zachodzi  w całej  cytoplazmie 
i nie  wykazuje  żadnej  szczególnej  lokalizacji.  W ko- 
mórkach eukariotycznych  natomiast  znaczna  część 
biosyntezy  białka  zlokalizowana  jest  na  powierzchni 
błoniastego  labiryntu  stanowiącego  tzw.  siateczkę 
endoplazmatyczną.  Ważną  jej  funkcją  jest  wytwarza- 
nie błony  jądrowej.  Przypuszcza  się,  że  związek  bio- 
syntezy białka  z siateczką  endoplazmatyczną  umożli- 
wia odpowiednie  rozprowadzenie  mRNA,  a także 
nowo  utworzonych  białek,  szczególnie  tych,  które 
mają  być  przemieszczone  w kierunku  powierzchni 
komórki  — ku  jej  błonom  lub  na  zewnątrz.  Białka  te 
zostają  przeniesione  do  innego  błoniastego  układu 
zwanego  aparatem  Golgiego.  W jego  woreczkowa- 
tych  elementach  (wakuolach)  białka  ulegają  mody- 
fikacjom, np.  glikozylacji  przez  przyłączenie  reszt 
cukrowych.  Wakuole  są  zróżnicowane  czynnościowo : 
jedne  służą  do  transportu  nowo  zsyntetyzowanych  bia- 
łek do  miejsca  ich  przeznaczenia  — tzn.  do  błony 
lub  na  zewnątrz  komórki,  inne  transportują  stamtąd 
związki  chemiczne  i jednocześnie  odpowiednio  je 
przekształcają.  Szczególnymi  wakuolami  są  lizosomy, 
zawierające  enzymy,  których  ostatecznym  przezna- 
czeniem może  być  zniszczenie  komórki  po  jej  obu- 
marciu. Inną  funkcję  mają  peroksysomy,  zawierające 
enzymy  katalizujące  utlenianie  związków  chemicz- 
nych przy  użyciu  nadtlenku  wodoru. 


Podstawowe  procesy 
metaboliczne 


Do  przebiegu  procesów  życiowych  wszystkich  ko- 
mórek jest  potrzebna  energia.  Pierwotnym  źródłem 
energii  dla  świata  żywego  na  Ziemi  jest  Słońce. 
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Rys.  2.  Schemat  przepływu  pary  elektronów  w procesie  foto- 
syntezy 
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fotosynteza  Energia  jego  promieniowania  jest  zamieniana  w chlo- 
roplastach roślin  i niektórych  bakterii  na  energię 
wysokoenergetycznych  wiązań  pirofosforanowych 
w cząsteczce  ATP,  będących  głównymi  nośnikami 
biologicznej  postaci  energii  (jest  to  tzw.  proces  foto- 
syntezy). W chloroplastach  znajdują  się  2 układy  zło- 
żone z chlorofilu  oraz  układów  przenośników  elektro- 
nów, różnych  dla  każdego  z tych  układów  (rys.  2). 
Absorpcja  fotonu  przez  chlorofil  układu  II  umożliwia 
hydrolizę  wody  i dostarczenie  wzbudzonego  elektronu 
do  łańcucha  utleniająco-redukujących  przenośników. 
Jego  przenoszenie  przez  kolejne  ogniwa  tego  łańcucha, 
aż  do  chlorofilu  układu  I powoduje  wytworzenie  dwu 
wysokoenergetycznych  wiązań  pirofosforanowych. 
Absorpcja  następnego  fotonu  przez  chlorofil  układu  I 
sprawia,  że  wzbudzony  elektron  dostaje  się  do  innego 
łańcucha  przenośników.  To  przenoszenie  elektronów, 
zgodnie  z ich  potencjałem  utleniania-redukcji  pro- 
wadzi do  redukcji  cząsteczki  NADP,  związku  będą- 
cego koenzymem  wielu  enzymów  utleniająco-re- 
dukujących (->  Białka).  Cząsteczka  NADP  może  ulec 
utlenieniu  w innym  układzie  przenośników  utlenia- 
jąco-redukujących, a część  zawartej  w niej  energii 
może  przejść  w energię  trzech  wysokoenergetycznych 
wiązań  pirofosforanowych  ATP. 

Zmagazynowanie  energii  słonecznej  w ATP  umoż- 
liwia przebieg  endoergicznej  reakcji  aktywacji  węgla- 
nu i przyłączenia  go  do  rybulozodwufosforanu.  W wy- 
niku tej  reakcji  powstają  dwie  cząsteczki  fosfoglice- 
rynianu.  Ich  przemiany  regenerują  rybulozodwufos- 
foran,  który  może  reagować  z następną  cząsteczką 
aktywnego  węglanu.  Sześciokrotne  powtórzenie  tego 
cyklu  prowadzi  w ogólnym  bilansie  przemian  do 
powstania  jednej  cząsteczki  glukozy, 
glikoliza  Glukoza  ulega  glikolizie,  dzięki  czemu  staje  się 
rodłem  zredukowanego  węgla,  tlenu  i wodoru  dla 
prawie  wszystkich  procesów  biosy ntetycznych  roślin. 
W ciemnościach  oraz  w tych  częściach  roślin,  które 
nie  mają  chloroplastów^  jest . ona  również  źródłem 
energii.  Tę  podwójną  funkcję  dostarczania  energii 
oraz  węgla  i wodoru  — spełnia  glukoza  również  i dla 
przeważającej  większości  innych  organizmów  ży- 
wych. 

Schemat  wykorzystania  glukozy  ma  niewiele 
wariantów  w świecie  żywym.  Przemiana  glukozy  wy- 
stępująca najpowszechniej,  została  zbadana  przez 
H.  Embdena,  O.  Meyerhofa  i J.  Parnasa  (rys.  3).  Po 
przyłączeniu  fosforanu  cząsteczka  tego  cukru  ulega 
kolejnym  przekształceniom,  w których  wyniku  pow- 
stają dwie  cząsteczki  pirogronianu,  a część  uwolnio- 
nej energii  zostaje  zachowana  w postaci  wysokoener- 
getycznych wiązań  ATP  i zredukowanych  cząsteczek 
NAD,  innego  koenzymu  reakcji  utleniania  — redukcji. 
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Rys.  3.  Szlak  przemian  glukozy  do 
pirogronianu 
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Odmienny  rodzaj  przemian  glukozy  prowadzi  przez 
estry  fosforanowe  mające  3,  4,  5,  6 lub  7 atomów 
węgla.  Są  to  w zasadzie  te  same  reakcje,  które  uczest- 
niczą w procesie  asymilacji  węglanu  i syntezie  glu- 
kozy. U organizmów  niezdolnych  do  fotosyntezy  ten 
cykl  fosfopentozowy  przemian  glukozy  służy  głównie 
do  produkcji  fosfory  boży,  potrzebnej  do  syntezy  kwa- 
sów nukleinowych  oraz  zredukowanego  NADP  nie- 
zbędnego dla  redukcyjnych  procesów  biosyntetycz- 
nych,  takich  jak  wiązanie  atmosferycznego  azotu 
u niektórych  bakterii  lub  synteza  kwasów  tłuszczo- 
wych u wszystkich  organizmów. 

Jednakże  najważniejszym ' i “najpowszechniejszym 
sposobem  odzyskiwania  energii  z glukozy  jest  proces 
przemian  pirogronianu.  Ulega  on  utlenieniu  i odłą- 
czaniu C02  z udziałem  kilku  koenzymów  i oczywiście 
swoistego  enzymu.  Produktami  tej  reakcji  są  acety- 
lo-koenzym  A,  zredukowany  NAD  i dwutlenek  węgla. 
Acetylo-koenzym  A reaguje  ze  szczawiooctanem. 
Powstający  z tej  reakcji  cytrynian  jest  metabolizo-  cyk! 
wany  w dalszych  etapach  cyklu  Krebsa.  Polega  on  na  Krebsa 
dziesięciu  reakcjach,  w wyniku  których  ze  szczawio- 
octanu  i acetylo-KoA  powstają  dwie  cząsteczki  dwu- 
tlenku węgla,  szczawiooctan  oraz  \ 3 równoważników 
wysokoenergetycznego  wiązania  pirofosforanowego 
w postaci,  m.in.,  zredukowanych  koenzymów  NAD, 

NADP  i FAD.  Przebieg  tych  reakcji  zob.  rys.  4. 
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W procesie  utleniającej  fosforylacji  zredukowane  utleniająca 
koenzymy  ulegają  utlenieniu  i przekazują  elektrony  fosforylacja 
do  układu  utleniająco-redukującego  złożonego  z kilku 
białek  (jest  to  schematycznie  przedstawione  na  rys.  5). 

Kolejne  ich  przeniesienie  do  ogniwa  o coraz  to  wyż- 
szym potencjale  utleniania-redukcji  powodują  wyda- 
lanie protonów  na  zewnątrz  błony  (mitochondriów, 
chloroplastów  lub  komórek  bakteryjnych).  Wytwarza 
to  potencjał,  który  jest  wykorzystywany  albo  bezpo- 
średnio do  procesów  transportu  przez  błony  albo  też 
do  reakcji  nieorganicznego  fosforanu  z ADP.  Na  sku- 
tek tej  reakcji  powstają  nowe  wysokoenergetyczne 
wiązania  pirofosforanowe.  Przedstawia  to  schema- 
tycznie rys.  6. 

ATP  jest  głównym  i najbardziej  bezpośrednim  metabolizm 
źródłem  energii  w procesach  metabolicznych  komór-  energetyczny 
ki,  w tym  dla  wszystkich  procesów  nieredukcyjnych. 

W wyniku  tych  reakcji  ulega  on  rozpadowi  na  ADP 
i fosforan  lub  AMP  i pirofosforan.  W niektórych 
reakcjach  bierze  udział  GTP,  lecz  jego  wiązania  wy- 
sokoenergetyczne pochodzą  przeważnie  z ATP. 

Jak  już  wspomniano,  w wielu  procesach  redukcyj- 
nych, takich  jak  wiązanie  azotu  atmosferycznego 


lub  synteza  kwasów  tłuszczowych  dawcą  energii  jest 
zredukowany  koenzym  NADP. 
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Rys.  5.  Łańcuch  oddechowy 
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Rys.  6.  Tworzenie  potencjału 
błony  w wyniku  przenoszenia 
elektronów  wzdłuż  łańcucha  od- 
dechowego i jego  zamiana  na 
wysokoenergetyczne  wiązania 
pirofosforanowe  ATP 


Cechy  metabolizmu  energetycznego  są  prawie  uni- 
wersalne dla  świata  żywego.  Natomiast  wykorzysta- 
nie energii,  a raczej  cele,  na  które  jest  wydatkowana, 
są  różne  i zależą  od  natury  komórek  i warunków  ich 
bytu.  Rośliny  i bakterie  fotosyntetyzujące  wykorzys- 
tują mineralne  źródła  azotu  i siarki.  Syntetyzują  one 
wszystkie  związki  organiczne  niezbędne  do  kon- 
strukcji komórek,  a także  do  pewnych  reakcji  na 
środowisko  zewnętrzne.  Natomiast  wiele  bakterii 
i grzybów  oraz  wszystkie  organizmy  zwierzęce  wy- 
magają do  życia  związków  organicznych  — glukozy, 
niektórych  aminokwasów  oraz  witamin.  Dzięki  ogra- 
niczaniu liczby  procesów  biosyntetycznych  zwierzęta 
zyskiwały  w coraz  większym  stopniu  mechanizmy 
zwiększające  ich  niezależność  od  środowiska.  Tak 
więc,  wszystkie  zwierzęta  zużywają  wiele  energii  na 
ruch  (— > Molekularne  podstawy  skurczu  mięśnia), 
a stałocieplne  również  na  utrzymanie  temperatury 
ciała. 

Cały  metabolizm  komórkowy,  w tym  i energetycz- 
ny, jest  rezultatem  reakcji  katalizowanych  przez  biał- 
ka o swoistym  działaniu  na  inne  związki  chemiczne, 
czyli  enzymy  (-*  Białka).  Wszystkie  reakcje  chemicz- 
ne tu  omawiane,  czy  wspominane,  są  katalizowane 
przez  swoiste  enzymy,  nie  wymieniane  tylko  dlatego, 
aby  zachować  jasność  tekstu. 

Każda  jednostkowa  reakcja  metabolizmu  jest  kata- 
lizowana przez  odrębny  enzym.  Rzadkimi  odstęp- 
stwami od  tej  reguły  są  reakcje  katalizowane  przez 
kilka  enzymów  o podobnej  funkcji  katalitycznej  oraz 
zupełnie  wyjątkowe  sytuacje,  kiedy  ten  sam  enzym 
katalizuje  dwie  różne  reakcje. 

Metabolizm  komórkowy  musi  być  koordynowany 
tak,  by  najbardziej  celowo  wykorzystać  dostępne  pro- 
dukty. W przeciwnym  wypadku  komórka  byłaby  wy- 
eliminowana w drodze  ewolucji  przez  inne,  bardziej 
sprawne.  Niezrównoważona  akumulacja  niektórych 
pośrednich  produktów  metabolizmu  prowadzi  bo- 
wiem nie  tylko  do  marnotrawienia  energii,  ale  również 
i do  pewnych  efektów  toksycznych.  Akumulacja  ga- 
laktozo-1 -fosforan u np.  zatrzymuje  całość  metaboliz- 
mu bakterii,  a u dzieci  z defektami  galaktozoepimera- 
zy  prowadzi  do  ogólnego  niedorozwoju,  niekiedy  śle- 
poty lub  nawet  śmierci. 

Rezultat  pracy  enzymu  zależy  od  stężenia  jego 
substratów.  Ciąg  reakcji  enzymatycznych,  np.  bio- 
synteza jakiegoś  aminokwasu,  przebiega  z wydajnoś- 
cią zdeterminowaną  przez  enzym  o najniższej  aktyw- 
ności. Jednakże  ewolucja  wykształciła  systemy  re- 
gulacyjne, działające  na  zasadzie  sprzężenia  zwrot- 
nego (inhibicja  zwrotna).  Ich  działanie  sprawia,  że 
raczej  zapotrzebowanie  na  produkt  końcowy  szlaku 
metabolicznego  niż  stężenia  jego  substratów  decydują 
o sumarycznej  wydajności.  Otóż  enzymy  kluczowe 
dla  wydajności  szlaków  metabolicznych,  są  to  z re- 
guły enzymy  katalizujące  pierwsze  reakcje  tych  szla- 
ków, mają  one  centra  niezależne  od  centrów  aktyw- 
nych, które  wykazują  powinowactwo  do  pewnych 
produktów  końcowych  szlaków  metabolicznych,  na- 
zywanych efektorami  inhibicji  zwrotnej.  Na  przykład 
pierwszy  enzym  biosyntezy  histydyny  — syntetaza  fos- 
forybozylo-ATP  ma  oprócz  centrum  aktywnego, 
w którym  reagują  kosubstraty  reakcji  ATP  i fosfo- 
rybozylopirofosforan,  inne  centrum,  do  którego 
wykazuje  powinowactwo  L-histydyna.  Przyłączenie 
L-histydyny  powoduje  taką  zmianę  konformacji 
enzymu,  że  centrum  aktywne  ulega  przestrzennej 
deformacji,  co  prowadzi  do  obniżenia  jego  zdol- 
ności katalizowania  syntezy  fosforybozylo-ATP.  En- 
zymy, a ogólniej  rzecz  biorąc  — białka,  które  mogą 
zmienić  swą  konformację  i aktywność  w wyniku 
współdziałania  z efektorami  biologicznie  korzystnymi, 
nazwano  allosterycznymi. 

Odrębny  mechanizm  regulacyjny  działa  dzięki  pro- 
cesowi syntezy  enzymów.  Struktura  poszczególnych 
enzymów  jest  zakodowana  w DNA  chromosomu  każ- 
dej komórki.  Odpowiedni  odcinek  DNA  nazywa  się 
genem  struktury. 
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W bezpośrednim  sąsiedztwie  genu  struktury  znaj- 
dują się  inne  geny,  które  określają  jego  ekspresję 
(aktywność).  Taka  funkcjonalna  jednostka  genomu 
operon  bakterii,  która  może  zawierać  większą  liczbę  genów 
struktury  nazywa  się  operonem.  Geny,  które  decydują 

0 ilości  wytwarzanych  enzymów  znajdują  się  zawsze 
w jednym  końcu  operonu  i ich  nadrzędne  działanie 
rozciąga  się  na  cały  operon. 

Znane  są  dwa  rodzaje  współdziałających  ze  sobą 
promotor  i nadrzędnych  genów  operonu.  Promotor  jest  genem 
operator  warunkującym  rozpoczęcie  transkrypcji  genów  struk- 
tury przez  polimerazę  RN  A.  Usunięcie  lub  deformacja 
struktury  promotora  przez  mutację  prowadzi  do  bra- 
ku transkrypcji  podległych  genów  struktury,  co  jest 
niezbędnym  warunkiem  w procesie  syntezy  odpo- 
wiednich enzymów. 

Drugi  z tych  genów  to  operator,  znajdujący  się 
między  promotorem  a genem  struktury.  Przyłączenie 
do  operatora  swoistego  białka  o odpowiedniej  kon- 
formacji allosterycznej  powoduje  wstrzymanie  trans- 
represor  krypcji.  To  białko,  zwane  represorem,  jest  kodowane 
przez  gen  nie  należący  do  operonu.  Jest  ono  produ- 
kowane stale  z taką  samą  szybkością.  Powoduje  to 
stały  naturalny  brak  transkrypcji  danego  operonu. 
Dopiero  gdy  w komórce  znajdą  się  związki  chemiczne 
zmieniające  konformację  represora  i powodujące  jego 
niezdolność  do  łączenia  się  z operatorem,  może  dojść 
do  ekspresji  genów  struktury  tego  operonu.  W ten 
sposób  jest  regulowana  ekspresja  operonu  laktozy 
niektórych  bakterii.  Pojawienie  się  w komórkach 
laktozy  prowadzi  do  powstania  metabolitów,  np. 
galaktozy,  które  łącząc  się  z represorem  tego  operonu 
zmieniają  jego  konformację,  przez  co  traci  on  zdol- 
ność do  wiązania  się  z operatorem.  W rezultacie 
tego  następuje  ekspresja  genów  struktury  operonu 
w postaci  tworzonego  swoistego  mRNA.  W układzie 
biosyntezy  białka  zachodzi  proces  translacji  informa- 
cji zawartej  w mRNA  i dochodzi  do  wytworzenia  od- 
powiednich enzymów.  W wypadku  operonu  lac  są 
to  (rys.  7):  /?-galaktozydaza  (gen  Z),  permeaza  (gen  Y ) 

1 transacetylaza  (gen  A).  Biologiczny  sens  tego  mecha- 
nizmu jest  oczywisty;  do  syntezy  enzymów  katabo- 
lizmu laktozy  dochodzi  tylko  wówczas,  gdy  laktoza 
znajdzie  się  w komórce. 


stan  represji 


a) 


Rys.  7.  Schemat  regulacji  operonu  laktozy  Escherichia  coli. 
Promotor  i operator  oznaczono  literami  p i o,  zaś  geny  struktury, 
kodujące  trzy  białka  operonu  literami  Z,  Y i A.  Aktywny  represor 
przedstawiono  w kształcie  półkola,  zaś  represor  allosterycznie 
zmieniony  przez  przyłączenie  efektora  ma  na  rysunku  kształt 
półksiężyca.  Cząsteczki  polimerazy  RNA  przestawiono  jako 
koła,  zaś  mRNA  jako  linie  krzywe,  a)  Stan  represji  jest  skutkiem 
przyłączenia  represora  do  operatora.  Uniemożliwia  to  funkcję 
polimerazy  RNA.  b)  Do  indukcji,  czyli  uaktywnienia  operonu 
dochodzi,  gdy  operator  jest  wolny,  gdyż  allosterycznie  zmieniony 
represor  nie  może  się  do  niego  przyłączyć.  Wówczas  kolejne  czą- 
steczki polimerazy  RNA  przyłączają  się  do  promotora,  a następ- 
nie posuwając  się  wzdłuż  DNA  operonu  syntetyzują  mRNA, 
mające  strukturę  komplementarną  do  jednej  z nici  genów  struk- 
tury 


represja  Jednakże,  kiedy  komórka  jest  dostatecznie  zao- 
kataboliczna  patrzona  w prostsze  źródło  węgla  i energii,  jakim  jest 
glukoza,  indukcja  enzymów  katabolizmu  laktozy 
ulega  ograniczeniu  przez  inny  mechanizm,  zwany  ka- 


taboliczną  represją.  Działa  on  na  ekspresję  wielu 
układów  enzymatycznych,  których  funkcja  polega  na 
katabolizmie  różnych  związków,  np.  aminokwasów, 
w produkty  mogące  służyć  jako  źródła  węgla  i energii. 

Pośrednim  efektorem  represji  katabolicznej  jest 
glukoza.  Jej  obecność  w komórce  bakterii  powoduje 
zmniejszenie  wytwarzania  cyklicznego  adenozynomo- 
nofosforanu  (cAMP)  przez  związaną  z błonami  ko- 
mórkowymi cyklazę  adenylową.  Szczegółowy  me- 
chanizm tego  wpływu  nie  jest  znany  i nie  wiadomo, 
co  jest  efektorem  działającym  na  cyklazę.  Jedyną 
znaną  funkcją  cyklicznego  AMP  u bakterii  jest  two- 
rzenie kompleksu  ze  swoistym  białkiem,  zwanym 
CRP.  Kompleks  ten  ma  powinowactwo  do  promo- 
torów i jego  związanie  z DNA  ułatwia  wiązania  się 
polimerazy  RNA  z promotorem,  a dzięki  temu 
zwiększenie  transkrypcji  operonu.  Dlatego  właśnie 
brak  cyklicznego  AMP  w obecności  glukozy  zmniejsza 
transkrypcję  operonów  katabolicznych. 

Reasumując,  ekspresja  operonu  laktozy  jest  regulo- 
wana zarówno  w zależności  od  obecności  substratów 
dla  enzymów  kodowanych  przez  ten  operon,  jak  i od 
zapotrzebowania  na  produkty  przemiany  tych  sub- 
stratów. 

Poznano  już  kilka  operonów  bakteryjnych.  Każdy 
z nich  różni  się  od  innych  rodzajem  oddziaływania 
białek  regulacyjnych  na  zapoczątkowanie  procesu 
transkrypcji  przez  polimerazę  RNA.  Od  operonu 
laktozy  najbardziej  się  różnią  te,  których  ekspresja 
wymaga  obecności  swoistych  białkowych  aktywato- 
rów. Ich  zdolność  do  aktywacji  procesu  transkrypcji 
zależy,  podobnie  jak  w wypadku  represora  operonu  — 
laktozy,  od  konformacji  allosterycznej.  Uzyskują  ją 
przez  wiązanie  odpowiednich  niskocząsteczkowych 
efektorów.  Różnica  między  nimi  polega  na  tym,  że 
związany  represor  zwiększa  ekspresję  swego  operonu 
przez  odłączenie  się  od  niego,  związany  zaś  z efek- 
torem aktywator  zwiększa  ekspresję  odpowiedniego 
operonu  przez  przyłączenie  się  do  jego  operatora. 

Poznanie  operonu  laktozy  uwidoczniło  jeden  ze 
sposobów,  w jaki  zachodzi  regulacja  metabolizmu 
w zależności  od  potrzeb  komórki.  Jednakże  nawet 
rozszerzony  model  operonu  stosuje  się  jedynie  do 
najprostszych  organizmów,  tj.  bakteriofagów  i bak- 
terii. Już  w drożdżach  regulacja  ta  przebiega  inaczej 
i na  razie  nie  jest  na  tyle  poznana,  by  można  ją  tu 
przedstawić  z podobną  ilością  niewątpliwych  szcze- 
gółów. 

Represja  glukozowa  nie  jest  jedynym  przykładem 
nadrzędnego  mechanizmu  regulacji  syntezy  enzy- 
mów u bakterii.  Wykryto,  że  jon  amonowy  działa 
jako  pośredni  efektor  represji  azotowej.  Reguluje  ona 
wydajność  procesów  prowadzących  do  wytwarzania 
jonu  amonowego  z innych  źródeł,  jak  np.  azotanu 
lub  azotu  atmosferycznego.  Bezpośrednim  efektorem 
represji  azotowej  jest  w niektórych  bakteriach  białko, 
a mianowicie  enzym,  syntetaza  glutaminy. 

Wpływ  regulacyjny  na  syntezę  niektórych  enzymów 
może  wywierać  skład  gazowy  atmosfery.  Tlen  hamuje 
w nieznany  sposób  syntezę  enzymów  redukcji  azo- 
tanu i azotu  atmosferycznego,  a indukuje  syntezę 
enzymów  utleniająco-redukujących,  która  też,  z dru- 
giej strony,  podlega  katabolicznej  represji.  Natomiast 
efekt  Pasteura,  czyli  zahamowanie  glikolizy  przez 
tlen  nie  zachodzi  wskutek  wpływu  tlenu  na  syntezę 
enzymów  glikolizy. 

W komórkach  organizmów  wyższych,  szczególnie 
zwierząt,  procesy  regulacyjne  są  bardziej  złożone. 
Przyczyną  tego  jest  chyba  fakt,  że  komórki  tych  or- 
ganizmów mają  mniejszą  samodzielność  i przebieg 
ich  metabolizmu  jest  kontrolowany  z punktu  widzenia 
interesu  całego  organizmu.  W związku  z tym  komórki 
zwierząt  są  ze  sobą  powiązane  systemem  informacji 
metabolicznej  i czynnościowej,  tzn.  za  pomocą  sys- 
temów, których  elementami  są  hormony  (— ► Białka). 
Molekularny  mechanizm  ich  działania  jest  bardzo 
słabo  poznany.  Receptory  poszczególnych  hormonów 
znajdują  się  tylko  w tych  komórkach,  które  mają  na 
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nie  reagować.  Receptory  hormoijów  sterydowych  mogą 
występować  wewnątrz  komórek,  natomiast  receptory 
innych  hormonów,  np.  insuliny  czy  adrenaliny  wy- 
stępują tylko  w błonach  komórkowych.  Ich  stymu- 
lacja przez  różne  hormony  zwiększa  aktywność  cyk- 
lazy  adenylowej  i ilość  produkowanego  przez  nią 
cyklicznego  AMP.  W komórkach  zwierzęcych  cyklicz- 
ny AMP  jest  aktywatorem  kinaz  białkowych,  czyli 
enzymów  przyłączających  grupy  fosforanowe  do 
białka.  Przypuszcza  się,  że  powstające  w wyniku  ich 
działania  pochodne  są  dalszym  ogniwem  łańcucha 
informacji  międzykomórkowej  i one,  w nieznany 
jeszcze  sposób,  kierują  przebiegiem  odpowiednich 
reakcji  metabolicznych.  Tych  kilka  informacji  o regu- 
lacji metabolizmu  w komórkach  zwierzęcych  nie  sta- 
nowi obrazu  tej  regulacji,  a raczej  ilustruje  jej  złożo- 
ność i niepełność  aktualnego  stanu  wiedzy. 

Wiadomo  niewątpliwie,  że  dwa  podstawowe  me- 
chanizmy regulacyjne,  a mianowicie  inhibicja  zwrot- 
na oraz  indukcja  enzymatyczna  zachodzą  w komór- 
kach zwierzęcych.  Stwierdzono  np.  że  aktywność 
pierwszego  enzymu  syntezy  puryn  wątroby  gołębia 
podlega  inhibicji  przez  niektóre  nukleozydotrójfos- 
forany.  Synteza  enzymu  wątroby  szczura  przyłącza- 
jącego grupę  hydroksylową  do  policyklicznych  węg- 
lowodorów może  być  wywoływana  przez  substraty 
tych  enzymów,  ale  również  przez  niektóre  hormony. 

Jednym  z mechanizmów  występujących  zarówno 
u bakterii,  jak  i u organizmów  wyższych  jest  zależ- 
ność syntezy  rybosomalnego  RNA  od  biosyntezy 
białka.  Brak  choćby  jednego  aminokwasu  u bakterii 
powoduje  zatrzymanie  translacji.  Wskutek  tego  do- 
chodzi do  przemiany  GTP  w pochodną  z grupą  piro- 
fosforanową  — PpGpp.  Związek  ten  zwiększa  trans- 
krypcję szeregu  operonów  kodujących  enzymy  proce- 
sów biosyntetyzujących  aminokwasy,  a zmniejsza 
transkrypcję  genów  kodujących  rybosomalny  RNA. 
Wykazano,  że  w fibroblastach,  niedojrzałych  komór- 
kach zwierzęcych,  zachodzi  podobna  zależność  syn- 
tezy rybosomalnego  RNA  od  sprawnego  przebiegu 
procesu  translacji. 

Uogólniając  sprawę  mechanizmów  regulacyjnych 
u zwierząt,  można  stwierdzić,  że  występują  u nich  me- 
chanizmy podobne  do  tych,  które  poznano  u bakterii 
i innych  prostych  makroorganizmów,  jak  również 
działają  jeszcze  inne  mechanizmy,  koordynujące  me- 
tabolizm wielu  komórek  w celu  zapewnienia  spraw- 
ności całego  organizmu. 
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Procesy  metabolizmu  umożliwiają  komórkom  uzyska- 
nie energii  i syntezę  składników  niezbędnych  do  ich 
wzrostu.  Jego  kulminacją  jest  podział  komórki, 
w którego  wyniku  powstają  dwie  komórki  potomne. 
Warunkiem  żywotności  tych  komórek  jest  otrzymanie 
informacji  genetycznej,  determinującej  całość  cyklu 
życiowego.  Zapewnia  to  zachodząca  uprzednio  re- 
plikacja materiału  genetycznego  w komórce  macie- 
rzystej. 

Proces  ten  ma  zasadniczo  inny  przebieg  u orga- 
nizmów protokariotycznych,  posiadających  pojedyn- 
czy kolisty  chromosom,  niż  u wyższych,  eukariotycz- 
nych organizmów,  mających  liczne  chromosomy, 
zawierające  liniowe  DNA  związane  z białkami  i to 
zamknięte  w jądrze,  które  ma  swoje  błony  i które  ma 
również  swój  cykl  podziałowy  (— ► Kwasy  nukleino- 
we). 

Proces  replikacji  przebiegający  w sposób  idealny 
zapewniałby  powstanie  dwu  identycznych  komórek. 
Jednakże  zasady  wchodzące  w skład  DNA  podlegają 
wielu  reakcjom  fizycznym  lub  w pewnych  warunkach 
nawet  chemicznym,  co  powoduje  zmiany  zdolności 
komplementacji  zasad  drugiego  łańcucha.  Te  kom- 


plementacyjne  niezgodności  są  rozpoznawane  przez 
swoiste  enzymy,  które  również  dokonują  korekt,  np. 
przez  wycięcie  zmienionych  zasad.  Powstałą  lukę  wy- 
pełnia z zachowaniem  zasady  komplementarności 
inny  enzym.  Komórki  dysponują  kilkoma  niezależ- 
nymi systemami  naprawy  zmian  w DNA,  lecz  mimo 
to  nie  wszystkie  zmiany  w DNA,  nazywane  mutacja- 
mi, mogą  być  naprawione.  Prowadzi  to  do  odmien- 
ności odpowiednich  elementów  informacji  genetycz- 
nej w komórkach  potomnych.  Mutacje  są  przypad- 
kowymi zmianami  w budowie  pojedynczych  kodonów 
lub  całych  ich  serii.  Zwykle  odbija  się  to  niekorzystnie 
na  zdolności  do  metabolizmu  lub  innych  bardziej 
złożonych  funkcji  komórek.  Na  przykład  zmiana 
w kodonie  aminokwasu  ważnego  dla  centrum  aktyw- 
nego jakiegoś  enzymu  biosyntezy  biotyny,  koenzymu 
szeregu  enzymów  przyłączających  węglan  do  innych 
związków,  powoduje,  że  enzym  ten  jest  nieaktywny, 
przez  co  komórka  jest  niezdolna  do  produkcji  biotyny 
i jej  żywotność  zależy  od  możliwości  uzyskania  tej 
biotyny  z zewnątrz.  Inne  geny  — kodujące  inne  enzy- 
my — biosyntezy  biotyny  — mogą  ulegać  mutacjom, 
które  nie  umniejszą  już  zdolności  życiowych  komórek, 
gdyż  enzymy  te  i tak  są  bezużyteczne.  Długi  ciąg  mu- 
tacji może  przekształcić  produkty  tych  genów  w inne 
enzymy.  Ich  użyteczność  zapewni  komórkom  pewną 
przewagę  w walce  o byt.  Ciągłe  występowanie  mutacji 
może  na  przestrzeni  tysięcy  pokoleń  doprowadzić  do 
powstania  nowych  odmian  gatunków,  a nawet  zupeł- 
nie nowych  gatunków. 

Ważnym  czynnikiem  w procesie  ewolucji  są  procesy 
przekazywania  materiału  genetycznego  poszczegól- 
nym bsobnikom. 

Bakterie  mają  wiele  mechanizmów  przekazywania 
materiału  genetycznego.  Transformacja  polega  na 
przenikaniu  z roztworu  DNA  pochodzącego  z rozpad- 
łych  bakterii.  Ulega  on  rekombinowaniu,  jeżeli  wy- 
kazuje dostateczny  stopień  homologii  z DNA  ko- 
mórki, w której  się  znalazł.  Inny  proces,  nazwany 
transdukcją  polega  na  tym,  że  niektóre  bakteriofagi 
przenoszą  DNA  bakterii,  w których  się  namnożyły, 
do  bakterii,  w których  się  znalazły.  Jeszcze  inny  pro- 
ces, zwany  koniugacją,  wymaga  obecności  plazmidów. 
Są  to  koliste  cząsteczki  DNA  zdolne  do  samodziel- 
nej replikacji  wewnątrz  bakterii  oraz  do  włączania 
się  do  chromosomu  bakterii.  Nadają  one  komórkom 
cechy,  określane  jako  męskie,  gdyż  umożliwiają  prze- 
noszenie DNA  do  komórek  nie  zawierających  tego 
plazmidu. 

We  wszystkich  trzech  wypadkach  los  przeniesione- 
go DNA  zależy  od  tego,  czy  nie  ulegnie  on  zniszczeniu 
przez  nukleazy.  Wszystkie  bakterie  mają  enzymy 
metylujące  niektóre  sekwencje  DNA  oraz  endonu- 
kleazy  rozpoznające,  czy  sekwencje  te  są  odpowiednio 
zmodyfikowane  przez  metylację.  Niezmetylowane 
sekwencje  są  przecinane,  co  umożliwia  działalność 
egzonukleaz  i hydrolizę  fragmentu  DNA,  rozpozna- 
nego jako  obcy  materiał  genetyczny.  Zjawisko  to 
nosi  nazwę  restrykcji.  Utrudnia  ona  wymianę  infor- 
macji genetycznej  między  różnymi  gatunkami  bak- 
terii, a nawet  różnymi  liniami  tego  samego  gatunku 
bakterii. 

Przeniesiony  materiał  genetyczny  u bakterii  ulega 
procesowi  nazwanemu  rekombinacją.  Ten  wieloeta- 
powy proces  polega  na  tym,  że  homologiczne,  czyli 
zasadniczo  podobne  fragmenty  dwuniciowego  DNA 
rozpoznają  się  w sposób,  który  do  dzisiaj  jest  jedną 
z największych  zagadek  biologii  molekularnej.  Roz- 
poznanie to  umożliwia  równoległe  ułożenie  homolo- 
gicznych odcinków.  Następnie  dochodzi  do  wzajem- 
nej wymiany  odcinków  o przypadkowej,  prawdopo- 
dobnie, długości.  Enzymy  biorące  udział  w rekom- 
binacji są  również  dotąd  nieznane. 

Wszystkie  trzy  procesy  — przenoszenia,  restrykcji 
i homologicznej  rekombinacji  — ograniczają  wymianę 
informacji  genetycznej  do  osobników  blisko  spokrew- 
nionych. Powoduje  to,  że  tylko  mutacje  akumulo- 
wane  w poszczególnych  liniach  genealogicznych  da- 
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nego  gatunku  mogą  się  sumować.  Powstające  rekom- 
binanty  podlegają  naturalnej  selekcji,  na  skutek  czego 
przeżywają  odmiany  najlepiej  dostosowane  do  wa- 
runków otoczenia. 

W ostatnich  latach  wykryto,  że  wiele  bakterii  i ich 
plazmidów  ma  szczególne  odcinki  DNA,  nazwane 
sekwencjami  insercyjnymi  lub  czynnikami  IS.  Ich 
właściwością  jest  zdolność  do  przemieszczania 
się  z jednego  miejsca  w chromosomie  na  drugie, 
znajdujące  się  albo  w tym  samym  chromosomie 
lub  w innej  cząsteczce  DNA  tej  samej  komórki, 
transpozony  Co  więcej,  przemieszczeniom  tym  podlegają  pary 
identycznych  czynników  IS  (a  poznano  już  kilka  ich 
rodzajów),  wraz  z odcinkiem  DNA,  zawartym  między 
nimi.  Te  tzw.  transpozony  są  jakościowo  różnym 
czynnikiem  ewolucyjnym.  Ich  przenoszenie  nie  odby- 
wa się  bowiem  na  zasadzie  homologicznej  wymiany, 
lecz  włączenia  w dowolne  miejsce  zupełnie  nowego 
i dodatkowego  materiału  genetycznego, 
zmienność  Nie  ma  dotąd  dowodów,  by  transformacja  czy  trans- 
u eukarion-  dukcja,  mogły  zachodzić  u organizmów  eukariotycz- 
tów  nych.  Niemniej  jednak,  międzyosobniczy  a wewnątrz- 
gatunkowy  proces  tworzenia  nowych  kombinacji 
informacji  genetycznej  zachodzi  dzięki  zróżnicowaniu 
płciowemu.  Komórki  wyższych  organizmów  mają 
podwójne  komplety  chromosomów.  Jedynie  komórki 
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Błona,  albo  membrana,  jest  to  warstwa  substancji 
oddzielająca  dwa  ośrodki  od  siebie.  Błona  różni  się 
od  obydwu  ośrodków  cechami  chemicznymi,  struk- 
turalnymi i funkcjonalnymi.  Na  ogół  błona  jest  cienka 
w porównaniu  z ośrodkami,  które  rozdziela. 

Wśród  różnorodnych  błon,  z jakimi  spotykamy  się 
w przyrodzie  nieożywionej  i ożywionej,  na  szczegól- 
fołony  ną  uwagę  zasługują  błony  komórkowe.  Błony  te, 
komórkowe  zwane  również  błonami  plazmatycznymi,  otaczają 
(plazmalycz-  żywe  komórki  wszystkich  rodzajów:  komórki  zwie- 
ne)  rzęce,  roślinne  i bakteryjne.  Komórki  zwierzęce  oto- 
czone są  jedynie  błonami  plazmatycznymi  (rys.  1). 
Natomiast  komórki  roślinne  i bakteryjne,  niezależnie 
od  błony  plazmatycznej,  pokryte  są  dodatkowo  osło- 
ną, zwaną  ścianą  komórkową  (rys.  2);  ściana  komór- 
kowa odgrywa  przede  wszystkim  rolę  osłony  mecha- 
nicznej i nie  będzie  dalej  rozpatrywana.  Błona  plaz- 
matyczna  oddziela  wnętrze  komórki  (protoplapnę) 
od  ośrodka  zewnętrznego  i umożliwia  zachowanie  jej 
indywidualności  zapobiegając  wymieszaniu  zawar- 


Rys.  1.  Schematyczne  przedstawienie  komórki  zwierzęcej 
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płciowe:  plemniki  i jaja,  mają  pojedyncze  komplety. 
Nowy  organizm,  powstający  w wyniku  zapłodnienia 
jaja,  ma  po  jednym  chromosomie  z każdej  pary  od 
jednego  z rodziców.  Stanowi  to  zupełnie  inną  kombi- 
nację cech  odróżniającą  go  od  rodziców.  Ponieważ 
każdy  plemnik  czy  jajo  jest  inną  praktycznie  kombi- 
nacją chromosomów  odziedziczonych  po  rodzicach 
rodziców,  a ogólna  ich  liczba  u człowieka  wynosi  23 
pary,  zróżnicowanie  potomstwa  tych  samych  rodzi- 
ców jest  bardzo  duże.  Powiększa  je  fakt,  że  podczas 
mejozy,  czyli  redukcyjnego  podziału  jądra  w czasie 
wytwarzania  komórek  płciowych,  dochodzi  do  re- 
kombinacji między  homologicznymi  chromosomami. 

Przytoczone  tu  dane  dowodzą,  że  zróżnicowanie 
płciowe  umożliwia  organizmom  eukariotycznym 
ogromną  zmienność  osobniczą.  Częstość  mutacji 
u organizmów  wyższych  jest  równie  duża,  jak  u bak- 
terii. Powstają  więc  podobne  warunki  do  procesów 
ewolucyjnych  przez  selekcję  osobników  lepiej  dosto- 
sowanych do  środowiska.  Jednakże  w skali  czasu  są 
one  powolniejsze  ze  względu  na  długość  życia  po- 
kolenia i rozmiary  populacji  organizmów  wyższych. 
Ewolucję  opóźnia  również  ich  większa  niezależność 
od  zmienności  środowiska.  Potrzeba  ewolucji  orga- 
nizmów wyższych,  szczególnie  człowieka,  jest  za- 
gadnieniem wykraczającym  poza  biologię. 


tości  komórki  z ośrodkiem.  Błona  umożliwia  rów 
nocześnie  konatakt  ze  światem  zewnętrznym  dzięk 
swojej  szczególnej  właściwości  polegającej  na  zdol- 
ności do  wybiórczego  przepuszczania  substancji. 


Grubość  błony  komórkowej  jest  rzędu  10  nm,  pod- 
czas gdy  liniowe  rozmiary  większości  żywych  komó- 
rek zawierają  się  w granicach  od  0,5  • 103  nm  do  104  nm, 
a więc  są  od  dwóch  do  trzech  rzędów  wielkości 
większe  od  grubości  błony. 

Pojęcie  błony  komórkowej  zostało  zaproponowane  wprowadzę- 
przez  C.  Nagaliego  w 1855  r.  na  podstawie  do-  nie  pojęcia 
świadczeń  nad  przenikaniem  do  wnętrza  komórek  błony 
pewnych  barwników.  Od  tego  czasu  przez  wiele  lat 
ścierały  się  poglądy  zwolenników  pojęcia  „błona 
komórkowa”  z poglądami  jego  przeciwników.  Ci 
ostatni  utrzymywali,  że  błona  komórkowa  nie  istnieje, 
a powierzchnię  komórki  charakteryzuje  jedynie  za- 
gęszczona warstwa  protoplazmy.  Obecnie  istnienie 
błony  komórkowej  nie  budzi  na  ogół  wątpliwości. 

Przyjmuje  się,  że  błona  plazmatyczna  jest  tworem 
o ściśle  określonej  strukturze  i o charakterystycznych 
właściwościach.  Za  istnieniem  błony  komórkowej 
przemawia  wiele  argumentów.  A więc  warstwy  po- 
wierzchniowe żywych  komórek  zawierają  przeważa- 
jącą (do  80%)  część  suchej  masy  komórek.  Przekłu- 
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cie  powierzchni  komórki  może  spowodować  wy- 
pływ protoplazmy  na  zewnątrz.  Po  wypłynięciu  za- 
wartości komórki  pozostaje  często  otoczka  utożsa- 
miana przeważnie  z błoną  (chociaż  najprawdopodob- 
niej to  nie  jest  sama  błona).  Można  również  izolować 
błonę  plazmatyczną  uszkadzając  komórkę  innymi  spo- 
sobami. Umieszczając  np.  komórkę  w ośrodku  wod- 
nym o niższym  ciśnieniu  osmotycznym  od  ciśnienia 
osmotycznego  protoplazmy  doprowadzamy  do  prze- 
pływu wody  do  wnętrza  komórki,  wzrostu  jej  obję- 
tości i pęknięcia.  Tego  rodzaju  postępowanie  stosuje 
się  przede  wszystkim  w stosunku  do  czerwonych 
ciałek  krwi  (erytrocytów);  zjawisko  pękania  krwinek 
pod  wpływem  różnicy  ciśnień  osmotycznych  i wyda- 
lania zawartości  tych  komórek  na  zewnątrz  nosi 
nazwę  hemolizy.  Po  hemolizie  w roztworze  pozostają 
blade  otoczki,  zw.  cieniami.  Przyjmuje  się,  że  cień 
zawiera  błonę  lub  jest  po  prostu  błoną  czerwonej 
krwinki.  Do  wyodrębnienia  błon  komórkowych  in- 
nych rodzajów  komórek  stosuje  się  inne  metody. 
A więc  komórki  bywają  np.  rozrywane  przy  pomocy 
ultradźwięków  lub  mechanicznych  homogenizatorów. 
Błony  lub  fragmenty  błon  oddziela  się  od  pozostałych 
składników  komórki  drogą  flotacji  (czyli  wypłukiwa- 
nia), wirowania  lub  ekstrahowania  w roztworach 
buforowych. 

Wątpliwości  dotyczące  istnienia  błony  pochodziły 
jednak  głównie  stąd,  że  nie  można  było  zobaczyć 
przekroju  błony.  Grubość  błony  jest  mniejsza  od 
zdolności  rozdzielczej  mikroskopu  optycznego  i do- 
piero zastosowanie  mikroskopu  elektronowego  poz- 
woliło „zobaczyć”  błonę,  ale  nie  w stanie  żywym. 
Technika  mikroskopii  elektronowej  wymaga  bowiem 
wielu  drastycznych  zabiegów,  które  prowadzą  co  naj- 
mniej do  zniszczenia  właściwości  życiowych  preparo- 
wanych komórek.  Przygotowanie  próbki  polega  na 
utrwaleniu  komórki  lub  jej  elementów  (np.  cieni) 
przy  pomocy  m.in.  czterotlenku  osmu,  odwodnieniu, 
wycięciu  ultracienkich  skrawków  (za  pomocą  mikro- 
tomu) nie  grubszych' niż  kilkadziesiąt  nm  Tzabarwie- 
niu  solami  ciężkich  metali,  np.  octanem  uranylowym.1 
Pod  mikroskopem  elektronowym  przekrój  komórki 
przedstawia  się  tak,  jak  ukazano  na  ii.  128  (tabl.  32). 
Na  zdjęciu  tym  można  wyróżnić  warstwę  powierz- 
chniową o charakterystycznej  strukturze.  Struktura 
ta  jest  przedstawiona  w sposób  schematyczny  na 
rys.  3.  Widzimy  tu  dwie  gęste  warstwy  przedzielone 
warstwą  słabiej  rozpraszającą  elektrony.  Sumaryczna 
grubość  tych  warstw  wynosi  od  7 nm  do  10  nm.  Ta 
trójwarstwowa  struktura  jest  traktowana  jako  obraz 
błony  komórkowej.  Interpretacja  mikrofotografii 
elektronowej  nie  jest  jednak  sprawą  prostą  i do  chwili 
obecnej  nie  można  na  jej  podstawie  określić  szcze- 
gółów budowy  błony. 

Błona  komórkowa  nie  jest  jedyną  błoną  spotykaną 
w układach  biologicznych.  Różnorodne  organelle  ko- 
mórkowe, jak  np.  jądro,  mitochondria,  lizosomy 
(a  w komórkach  roślinnych  chloroplasty  i wodniczki), 
są  zaopatrzone  we  własne  błony.  W cytoplazmie  ko- 
mórek roślinnych  i zwierzęcych  występuje  ponadto 
siateczka  śródplazmatyczna  (retikulum  endoplazma- 
tyczne),  która  jest  złożoną  siecią  błon  tworzących 
wewnątrz  komórki  obszary  o różnych  kształtach,  np. 
wąskie  kanały,  rurki,  okrągłe  pęcherzyki,  cysterny, 
i która  łączy  się  z błoną  jądra  i z błoną  komórkową 
(rys.  1). 

Poza  błonami  komórkowymi  i błonami  wewnętrz- 
nymi komórek  znamy  liczne  błony  tkankowe  złożone 
z żywych  komórek.  Należą  do  nich  m.in.  przepona 
jelitowa,  błona  nerki,  skóra  żaby  i wiele  innych. 

Układy  żywe  można  więc  traktować  jako  układy 
błon,  tworzące  zlokalizowane  obszary,  w których 
zachodzą  różnorodne  procesy  życiowe.  Podstawową 
i charakterystyczną  funkcją  błon  jest  regulacja  tran- 
sportu substancji  dzięki  zdolności  do  selektywnego 
przepuszczania  cząstek.  Wszystkie  komórki  nieustan- 
nie wymieniają  różnorodne  substancje  z otoczeniem. 
Wymiana  ta  jest  specyficzna,  ponieważ  tylko  niektóre 


związki  wnikają  i tylko  niektóre  wydostają  się  na 
zewnątrz.  Mechanizm  tej  wymiany  jest  związany,  jak 
się  uważa,  całkowicie  lub  niemal  całkowicie  z właści- 
wościami błon.  Zdolność  błon  do  kierowania  proce- 
sami przenikania  prowadzi  do  wielu  konsekwencji, 
np.  transport  jonów  przez  błony  jest  źródłem  pow- 
stawania napięć  elektrycznych  między  wnętrzem  ko- 
mórki i otoczeniem,  co  umożliwia  powstawanie  i roz- 
chodzenie się  impulsów  nerwowych  w komórkach 
nerwowych.  Właściwości  transportowe  błon  mito- 
chondriów  umożliwiają  uzyskiwanie  energii  z wiązań 
chemicznych  substancji  pokarmowych  przez  ich  utle- 
nianie w procesie  oddychania.  Błony  wewnętrzne 
chloroplastów  odgrywają  ważną  rolę  w uzyskiwaniu 
energii  w procesie  fotosyntezy  a retikulum  endoplaz- 
matyczne  — w syntezie  białek,  kwasów  tłuszczowych 
i fosfolipidów. 

Oprócz  wymienionych  tu  funkcji  błon,  znane  są 
jeszcze  inne  formy  ich  aktywności.  Ogólnie,  błony 
biologiczne  odgrywają  bezpośrednio  lub  pośrednio 
zasadniczą  rolę  w życiowych  procesach  organizmów 
żywych.  Na  ogół  uważa  się,  że  błony  komórkowe  sta- 
nowią równie  niezbędny  składnik  żywych  komórek 
jak  kwasy  nukleinowe.  Jeśli  np.  usuniemy  przy  po- 
mocy mikromanipulatora  jądro  komórki  ameby, 
uszkadzając  nieznacznie  błonę,  tak  że  zrośnie  się  ona 
szybko  i cytoplazma  nie  wydostanie  się  na  zewnątrz, 
a po  kilku  dniach  wprowadzimy  do  niej  jądro  po- 
chodzące z innej  ameby,  odzyskuje  ona  normalną 
zdolność  do  podziałów  i ruchów.  Natomiast  wszelkie 
trwałe  uszkodzenia  błony  komórkowej,  tzn.  takie, 
które  się  nie  regenerują,  prowadzą  do  śmierci  komórki. 

Błona  komórkowa  nie  jest  układem  statycznym, 
lecz  dynamicznym.  Zmienia  ona  stale  swoje  właści- 
wości pod  wpływem  różnorodnych  czynników,  a 
w szczególności  pod  wpływem  zmian  temperatury, 
ciśnienia  i składu  chemicznego  ośrodka,  w którym  się 
znajduje. 

Powszechne  występowanie  błon  oraz  ich  znaczenie 
w procesach  życiowych  jest  powodem  szerokiego  zain- 
teresowania strukturą  i funkcjami  błon  we  współ- 
czesnych badaniach  biologicznych,  biochemicznych 
i biofizycznych.  Szczególnie  istotna  jest  rola  badań 
biofizycznych,  ponieważ  podstawowymi  procesami 
badanymi  w membranologii  są  procesy  transportu 
substancji,  energii  i informacji  poprzez  błony  biolo- 
giczne, czyli  typowe  procesy  fizyczne,  które  mogą  być 
badane  jedynie  metodami  fizycznymi  i opisywane  przy 
pomocy  praw  fizycznych.  Podobnie  inne  badania 
z tego  zakresu,  jak  np.  badania  struktury  przestrzen- 
nej błon,  ich  właściwości  elektrycznych  itd.  mają 
typowy  charakter  fizyczny  i wobec  tego  należą  do 
kręgu  problemów  biofizycznych.  Badania  bioche- 
miczne błon  są  równie  rozległe  i dotyczą  budowy 
chemicznej  błon,  reakcji  chemicznych  zachodzących 
w błonach,  aktywnego  transportu,  zjawisk  enzyma- 
tycznych i innych.  Badania  biofizyczne  i biochemiczne 
w dużym  stopniu  uzupełniają  się,  a na  poziomie 
molekularnym  (np.  w zagadnieniu  oddziaływań  mię- 
dzy cząsteczkami  błony)  wzajemnie  się  przenikają. 
Biofizyka  i biochemia  umożliwiają  nowoczesny  rozwój 
biologii  w ogóle,  a biologii  błon  komórkowych 
w szczególności. 


regulacja 
transportu 
przez  błony 


inne  funkcje 
błon  biolo- 
gicznych 


badania 
biofizyczne 
i biochemicz- 
ne 


Lipidy  i białka  membranowe 


Badania  chemiczne  błon  izolowanych,  zarówno  błon 
komórkowych  jak  i błon  organelli  wewnątrzkomór- 
kowych, wskazują  na  dominujący  udział  w składzie 
chemicznym  błon  dwóch  typów  substancji:  lipidów 
(tłuszczowców)  i białek.  Z tego  względu  rozpatrzymy 
budowę  i właściwości  cząsteczek  lipidowych,  cząste- 
czek białkowych  oraz  właściwości  układów  lipid— 
woda  i lipid-białko. 

Lipidy  są  to  różnorodne  substancje,  które  charakte-  lipicly 

715 


ryzuje  mała  rozpuszczalność  w wodzie.  W ściśle 
chemicznym  sensie  są  to  związki  kwasów  tłuszczo- 
wych, przeważnie  estry  tych  kwasów  i jedno-  lub 
wielowodorotlenowych  alkoholi.  Lipidy  dzielą  się  na 
lipidy  proste  i złożone.  Pierwsze  są  wyłącznie  estrami, 
drugie  zaś  zawierają  ponadto  jeszcze  inne  związki 
organiczne.  W błonach  występują  przede  wszystkim 
różne  rodzaje  lipidów  złożonych.  Budowę  lipidów 
fosfolipidy  złożonych  omówimy  na  przykładzie  jednej  z grup 
tych  lipidów,  a mianowicie  na  przykładzie  fosfolipi- 


4 4 — 

o>  o> 

Rys.  4.  Cząsteczka  glicerolu 


£>  OS 


• atom 
węgla 

0 atom 
wodoru 


rolu  są  zastąpione  długołańcuchowymi  resztami  kwa- 
sów tłuszczowych,  np.: 
kwasu  mirystynowego  — CH3(CH2)12COOHf 
palmitynowego  — CH3(CH2)14COĆ>H, 
stearynowego  — CH3(CH2)10COOH, 
oleinowego  — CH3(CH2)-=CH(CH2)7COOH, 
linolowego 

— CH3(CH2)4CH=CHCH2CH=CH(CH2)7COOH 
(rys.  5)  i innych.  W rozważanych  lipidach  najczęściej 
spotykamy  łańcuchy  węglowodorowe  o parzystej 
liczbie  atomów  węgla,  zawierające  na  ogół  12  do  18 
atomów  węgla.  Nienasycone  (tzn.  zawierające  podwój- 
ne wiązania)  łańcuchy  węglowodorowe  występują 
powszechnie,  lecz  szczególnie  często  podwójne 
wiązania  spotykamy  w kwasach  tłuszczowych  o 18 
atomach  węgla  (z  jednym,  dwoma  lub  trzema  wią- 
zaniami podwójnymi). 

Trzecia  grupa  hydroksylowa  cząsteczki  glicerolu 
jest  zwykle  (w  omawianym  przypadku)  zastępowana 
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mirystynowy 
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palmitynowy 


kwas 

stearynowy 
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oleinowy 
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linolowy 


Rys.  5.  Przykłady  kwasów 
tłuszczowych ; oznaczenia  a- 
tomów  są  takie  same  jak  na 
rys.  4 


dów,  które  w poważnym  stopniu  wpływają  na  właści- 
wości błon  biologicznych.  Lipidy  te  są  pochodnymi 
cząsteczki  glicerolu  (rys.  4).  W fosfolipidach  zwykle 
dwie  grupy  hydroksylowe  ( — OH)  cząsteczki  glice- 


przez  grupę  polarną  (na  rys.  6a  jest  nią  reszta  fosfo- 
ranowa) lub  kombinacją  reszty  fosforanowej  i pewnej 
grupy  dodatkowej  (tak  jak  to  jest  przedstawione  na 
rys.  6b). 


Rys.  6.  Grupy  zastę- 
pujące grupę  hydro- 
ksylową cząsteczki 
glicerolu :a)  grupa  fo- 
sforanowa, b)  kombi- 
nacja grupy  fosfora- 
nowej i pewnej  grupy 
dodatkowej,  c)  grupa 
cholinowa,  + dodatni 
ładunek  elektryczny 


716 


Fosfolipidy  dzielą  się  na  kilka  klas.  Każda  klasa 
zawiera  część  złożoną  z łańcuchów  węglowodorowych 
(które  mogą  różnić  się  długością  i mogą  mieć  różne 
ilości  i różne  położenia  podwójnych  wiązań)  i część 
polarną  (o  charakterze  anionu,  kationu  lub  jonu 
obojnaczego).  W jednej  z klas  fosfolipidów,  w lecyty- 
nie, grupa  fosforanowa  związana  jest  z grupą  choli- 


cia  tej  części  lipidu  do  wody.  Łańcuchy  węglowodo- 
rowe jako  hydrofobowe  wystają  na  zewnątrz  po- 
wierzchni wody.  Kropla  fosfolipidu  rozlana  na  po- 
wierzchni wody  rozpływa  się  na  niej,  ponieważ 
grupa  polarna  każdej  cząsteczki  lipidowej  jest  przy- 
ciągana przez  wodę.  W efekcie  na  powierzchni  wody 
powstaje  w granicznym  przypadku — jeśli  tylko  po- 


Rys.  8.  Jeden  z rodzajów  lecytyny.  Przy  pomocy  okręgu  zaznaczono  część  polarną  cząsteczki. 
Pozostałe  oznaczenia  są  takie  same,  jak  na  rys.  4 


Rys.  7.  Ogólna  postać  lecytyny.  Oznaczenia 
są  takie  same,  jak  na  rys.  4 

nową  (rys.  6c).  Wobec  tego  cząsteczkę  lecytyny  można 
ogólnie  przedstawić  tak,  jak  na  rys.  7.  Cząsteczki 
lecytyny  różnych  rodzajów  zawierają  identyczne  grupy 
polarne  (w  tym  przypadku  obojnacze),  lecz  różnią 
się  charakterem  łańcuchów  węglowodorowych.  Je- 
den z rodzajów  lecytyny  jest  przedstawiony  na 
rys.  9. 

Jak  widać,  ogólną  właściwością  fosfolipidów  jest 
występowanie  grupy  polarnej  i niepolarnych  łańcu- 
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Rys.  10.  Warstwa  monomolekularna  cząsteczek  lipidowych  na 
granicy  faz  woda-powictrze 

wierzchnia  wody  jest  dostatecznie  rozległa  — lipido- 
wa warstwa  monomolekularna.  Cząsteczki  fosfolipi- 
dów w tej  warstwie  są  zorientowane  prostopadle  do  jej 
powierzchni  (rys.  10).  Warto  wspomnieć,  że  monomo- 
lekulame  warstwy  były  po  raz  pierwszy  badane  przez 
B.  Franklina,  który  w 1765  r.  obliczył  grubość  war- 
stwy oliwy  rozlanej  na  powierzchni  wody  w stawie 
i określił  ją  na  10“7  cala,  czyli  2,5  nm.  J.  W.  Rayleigh 
w 1890  r.  pierwszy  zasugerował,  że  warstwy  tego  ro- 
dzaju mają  charakter  monomolekularny,  a J.  Lang- 
muir  w 1917  r.  zwrócił  uwagę  na  specyficzną  orientację 
cząsteczek  lipidowych  w warstwie  powierzchniowej. 
Tak  więc  pomiędzy  fazą  wodną  i powietrzem  fosfoli- 
pidy mogą  tworzyć  monomolekulame  błony  o spe- 
cyficznych właściwościach.  Ogólniej  mówiąc,  między 
dwiema  fazami  o różnych  przenikalnościach  elek- 
trycznych powstaje  warstwa  lipidowa,  przy  czym  grupy 
polarne  tych  cząsteczek  są  zanurzone  w ośrodku 
o wyższej  przenikalności  elektrycznej,  a łańcuchy  hy- 
drofobowe— w ośrodku  o przenikalności  niższej. 
Łańcuchy  węglowodorowe  wystają  zatem  ponad  po- 
wierzchnię wody  w przypadku  warstwy  lipidowej 
utworzonej  między  wodą  i powietrzem  (jak  wspom- 
niano wyżej),  lub  między  wodą  i oliwą.  Natomiast 
grupy  polarne  cząsteczek  lipidowych  są  usytuowa- 
ne w powietrzu  w przypadku  warstwy  lipidowej  ufor- 
mowanej na  powierzchni  granicznej  między  fazą  lipi- 


lipidowa 

warstwa 

monomoie- 

kularna 


o== 

Rys.  9.  Schematy- 
czny sposób  przed- 
stawienia cząste- 
czek lipidowych 


chów  węglowodorowych.  W fosfolipidach  z reguły 
spotykamy  dwa  łańcuchy  kwasów  tłuszczowych, 
a w innych  rodzajach  lipidów  możemy  się  spotkać 
z jednym  lub  trzema  łańcuchami  węglowodorowymi. 
Schematycznie  przedstawiamy  cząsteczki  lipidów  na 
ogół  tak,  jak  na  rys.  8. 

Fosfolipidy  (i  inne  substancje  o podobnej  struktu- 
rze) nazywają  się  substancjami  amfifilnymi  ze  względu 
na  dualistyczny  charakter  oddziaływania  cząsteczek 
lipidowych  z wodą.  Grupa  polarna  cząsteczki  lipidu 
ma  charakter  hydrofilowy,  a łańcuchy  węglowodoro- 
we mają  właściwości  hydrofobowe.  Oddziaływanie 
elektrostatyczne  między  grupą  hydrofilową  cząsteczki 
fosfolipidu  i cząsteczkami  wody  prowadzi  do  wniknię- 


dową  i powietrzem  (jak  to  jest  np.  w bańkach  mydla- 
nych). Należy  zauważyć,  że  właśnie  cząsteczki  lipidów 
zawierających  grupę  polarną  i dwa  łańcuchy  węglo- 
wodorowe (jak  np.  lecytyna)  posiadają  szczególną 
zdolność  tworzenia  warstw  monomolekularnych  na 
granicy  faz  woda-powietrze.  Cząsteczki  lipidów  za- 
wierające grupę  polarną  i jeden  łańcuch  węglowodo- 
rowy mają  znaczną  zdolność  rozpuszczania  się  w wo- 
dzie i tworzenia  różnorodnych  układów  przestrzen- 
nych w wodzie,  ponieważ  wpływ  hydrofilowej  grupy 
polarnej  przeważa  nad  wpływem  hydrofobowych 
łańcuchów  węglowodorowych.  Natomiast  cząsteczki 
lipidowe  o trzech  łańcuchach  węglowodorowych 
w ogóle  nie  rozpuszczają  się  w wodzie. 
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W błonach  biologicznych  stosunek  zawartości  lipi- 
dów do  zawartości  białek  zależy  przede  wszystkim 
od  rodzaju  błony.  Np.  w błonie  komórkowej  czerwo- 
nych ciałek  krwi  ludzkiej  stosunek  ten  niewiele  się 
różni  od  jedności,  a w tzw.  błonie  mielinowej  komórek 
nerwowych  jest  wyjątkowo  duży  i wynosi  dziewięć 
do  jednego.  W wielu  błonach  innego  rodzaju  prze- 
waża z kolei  zawartość  białek  nad  zawartością  li- 
pidów. 

Ogólne  właściwości  cząsteczek  białka  oraz  struk- 
tura tych  makrodrobin  zostały  omówione  w artykule 
— ► Białka.  W błonach  występują  białka  różnych  ro- 
dzajów, jednak  pełnej  i ścisłej  ich  identyfikacji  nie 
udało  się  do  chwili  obecnej  przeprowadzić.  Wiadomo, 
że  zakres  molekularnych  rozmiarów  białek  w błonach, 
ich  skład  i rodzaj  konformacji  nie  wykazują  różnic 
w stosunku  do  białek  pochodzenia  niemembranowego. 
Natomiast  każda  błona  ma  inny,  charakterystyczny 
dla  siebie  skład  białkowy.  Większość  białek  pocho- 
dzenia membranowego  należy  do  białek  nierozpusz- 
czalnych w wodzie.  Białka  i lipidy  mogą  więc  tworzyć 
trwałe  układy  w środowisku  wodnym.  Wiązaniami 
występującymi  w tych  układach  są  wiązania  jonowe 
i hydrofobowe,  ale  szczegóły  oddziaływań  nie  są 
jeszcze  dokładnie  poznane.  Trudności  w identyfikacji 
białek  membranowych  pochodzą  stąd,  że  zabiegi 
chemiczne  mające  na  celu  wyodrębnienie  białek  z błon 
naturalnych  prowadzą  najczęściej  do  rozpadu  tych 
białek  na  aminokwasy.  Białka  występujące  w błonach 
grupuje  się  na  ogół  w dwóch  klasach:  w klasie  białek 
strukturalnych  (odgrywających  rolę  w budowie  błony 
biologicznej)  i białek  funkcjonalnych  (które  biorą 
udział  w wielu  procesach  metabolicznych,  m.in.,  jako 
enzymy). 


Modele  błon  komórkowych 


Doświadczenia  Gortera  i Grendela  (1925  r.)  polegają- 
ce na  wyekstrahowaniu  lipidów  z czerwonych  ciałek 
krwi  i utworzeniu  z nich  warstwy  monomolekularnej 
na  powierzchni  wody  wskazały,  że  warstwa  ta  ma 
powierzchnię  w przybliżeniu  dwukrotnie  większą  od 
powierzchni  krwinek.  Wyciągnięto  stąd  wniosek,  że 
błona  komórkowa  czerwonych  ciałek  krwi  (i  innych 
komórek,  jak  również  błona  organelli  komórkowych) 
jest  zbudowana  z dwumolekulamej  warstwy  lipido- 
wej. Ten  wniosek  leży  u podstaw  naszych  poglądów 
na  budowę  błon  biologicznych.  Pierwszym  naukowo 
uzasadnionym  modelem  błony  komórkowej  był  model 
DanieIIiego-Davsona  (1935).  Został  on  zbudowany 
na  podstawie  doświadczeń  Gortera-Grendela  i na 
podstawie  wyników  pomiarów  napięcia  powierzchnio- 
wego żywych  Won.  Pomiary  napięcia  powierzchnio- 
wego żywych  komórek  wykazały,  że  nie  przekracza 
ono  wartości  równej  2 10-3  Nm_1.  Ponieważ  napięcie 
powierzchniowe  czystych  lipidów  wynosi  około 
40  TO-3  Nm-1,  Danielli  i Davson  przyjęli,  że  obniże- 
nie napięcia  powierzchniowego  żywych  komórek 
w stosunku  do  napięcia  powierzchniowego  fazy  lipi- 
dowej pochodzi  od  białek  zaadsorbowanych  na  po- 
wierzchni lipidowej  części  błon  biologicznych.  Stąd 
powstał  model  przedstawiony  na  rys.  1 1.  Błona  w tym 
ujęciu  składa  się  z dwumolekulamej  warstwy  lipido- 
wej, w której  grupy  polarne  skierowane  są  na  zew- 
nątrz, a łańcuchy  węglowodorowe  stanowią  wnętrze 
warstwy;  na  obydwu  powierzchniach  tej  warstwy 
zaadsorbowane  są  cząsteczki  białka. 

Model  DanieIliego-Davsona,  mimo  licznych  zalet, 
nie  wyjaśnia  wszystkich  zjawisk  membranowych, 
w szczególności  nie  tłumaczy  pewnych  zjawisk  tran- 
sportowych. Dlatego  z upływem  lat  model  ten  uległ 
stopniowym  modyfikacjom.  W ostatnich  latach  z naj- 
większym uznaniem  spotkał  się  model  mozaikowy 
(Singer  i Nicholson,  Vanderkooi  i Green  Zahler  oraz 
Wallach).  W modelu  tym  zakłada  się,  że  cząsteczki 
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białek  występują  nie  tylko  na  powierzchniach  błony 
(jak  w modelu  Danielliego-Davsona),  lecz  również 
wnikają  w głąb  warstwy  lipidowej,  a nawet  przeni- 
kają ją  na  wskroś  (rys.  12).  Autorzy  modelu  mozai- 
kowego sugerują,  że  białka  przenikające  całą  błonę 
są  odpowiedzialne  m.in.  za  transport  pewnych  sub- 
stancji nierozpuszczalnych  w fazie  lipidowej  błony. 


Rys.  11.  Model  błony  Danielliego-Davsona : a)  płaski,  b)  prze- 
strzenny 


Koncepcja  modelu  mozaikowego  jest  poparta 
przede  wszystkim  doświadczeniami  wykonanymi  me- 
todą tzw.  wytrawiania  zamrożeniowego  lub  sublima- 
cyjnego (ang.  freeze  etching).  W metodzie  tej  błona 


wytrawianie  zostaje  nagle  zamrożona  w temperaturze  ciekłego 
zamrożenie-  azotu,  a następnie  „rozłupana’’  tak,  jak  to  schema- 
we  błon  tycznie  pokazano  na  rys.  13.  Błonę  dzieli  się  na  dwie 
warstwy  wzdłuż  powierzchni  przechodzącej  przez 
zakończenia  łańcuchów  węglowodorowych  w dwu- 
molekularnej  warstwie  lipidowej,  tam  gdzie  wiązania 
są  najsłabsze.  Odpowiednio  przygotowane  preparaty 


Rys.  13.  Poglądowy  rysunek  wskazujący,  jak  sobie  wyobrażamy 
„rozłupanie”  błony  zawierającej  dwumoiekularną  warstwę  lipi- 
dów wraz  z wbudowanymi  białkami 


ogląda  się  pod  mikroskopem  elektronowym.  Na  il. 
129  (tabl.  32)  widzimy  otrzymaną  w ten  sposób  mikro- 
fotografię „rozłupanej”  błony  (a  więc  zdjęcie  jednej 
z dwóch  warstw  błony)  erytrocytu.  Dla  porównania 
na  il.  130  (tabl.  32)  możemy  zobaczyć  analogicznie 
uzyskaną  mikrofotografię  pojedynczej  warstwy  lipido- 
wej otrzymanej  z dwuwarstwowej  błony  lipidowej  nie 
zawierającej  białek.  Na  il.  129  (tabl.  32)  widać  różno- 
rodne wypustki,  których  nie  ma  na  il.  130  (tabl.  32). 
Z tego  względu  przyjmuje  się,  że  wypustki  na  il.  129 
(tabl.  32)  przedstawiają  ślady  cząsteczek  białek  wnika- 
jących w głąb  błony. 

Obecny  pogląd  na  budowę  błony  komórkowej  jest 
wynikiem  różnorodnych  eksperymentów  i spekulacji. 
Błona  komórkowa  jest  na  ogół  wyobrażana  zgodnie 
z modelem  mozaikowym,  ale  niejako  twór  statyczny, 
lecz  dynamiczny.  Zachodzą  w niej  ciągłe  zmiany  po- 
legające m.in.  na  przemieszczeniach  cząsteczek  w bło- 
nie, na  zmianach  ich  konformacji,  na  zmianach 
orientacji  elementów  składowych  cząsteczek  i innych. 
Z tego  względu  i ze  względów  innych,  o których  częś- 
ciowo była  mowa  wcześniej,  bezpośrednie  badania 
żywych  błon  są  trudne,  lub  niekiedy  nawet,  na  dzisiej- 
szym poziomie  technik  eksperymentalnych,  niemożli- 
we. To  jest  przyczyną,  że  wiele  badań  doświadczal- 
błony  nych  prowadzi  się  nie  bezpośrednio  na  błonach  bio- 
modelowe  logicznych,  lecz  na  błonach  modelowych.  Dzięki 
równoległym  badaniom  błon  żywych  i błon  modelo- 
wych coraz  lepiej  poznajemy  rzeczywistą  strukturę 
i funkcje  błon  biologicznych.  W badaniach  obydwu 
rodzajów  błon  wykorzystuje  się  wiele  fizycznych 
metod  eksperymentalnych.  Należą  do  nich  metody 
spektroskopii  w podczerwieni  i ramanowskiej,  rentge- 
nografii ; używa  się  sondy  fluorescencyjne,  mikrosko- 
py elektronowe;  wykorzystuje  się  również  zjawiska 
rezonansu  jądrowego  i dichroizmu  kołowego. 

Do  błon  modelowych,  którymi  najczęściej  posłu- 
gują się  badacze  należą  monomolekularne  warstwy 
lipidowe,  dwumolekularne  warstwy  lipidowe  oraz 
obydwa  wymienione  rodzaje  błon  modyfikowane 
przy  pomocy  białek  innych  substancji. 

Monomolekularne  warstwy  lipidowe  są  wygodnym 
modelem  błony,  ale  odbiegają  znacznie  swymi  właści- 
wościami od  błon  komórkowych,  ponieważ  te  pierw- 
sze stykają  się  z ośrodkiem  wodnym  tylko  z jednej 
strony,  natomiast  błony  komórkowe  mieszczą  się 
między  dwoma  ośrodkami  wodnymi.  Ponadto,  jak 
wiadomo  z doświadczeń  Gortera  i Grendela,  błony 
komórkowe  składają  się  z dwumolekularnej  warstwy 
lipidowej,  a nie  warstwy  jednomolekularnej.  Tym 
tłumaczy  się  konieczność  poszukiwań  metody  otrzy- 
mywania dwumolekulamych  warstw  lipidowych  w 
warunkach  sztucznych.  Cel  ten  udało  się  zrealizować 
po  długotrwałych  badaniach  w latach  1962-64  poprzez 
formowanie  tzw.  błon  czarnych  i liposomów. 


Błony  czarne  formuje  się  w urządzeniach  typu  po  - błony 
kazanego  na  rys.  14.  Składa  się  ono  z dwóch  kon  - czarne 
centrycznych  komór:  wewnętrznej  (na  ogół  teflono  - 
wej)  zaopatrzonej  w otworek  o średnicy  około  1 mm 
oraz  zewnętrznej,  wykonanej  z materiału  przezro- 
czystego. Komory  napełnia  się  wodnym  roztworem 
elektrolitycznym,  a następnie  nakłada  się  na  otwór 
(np.  przy  pomocy  pipety)  warstwę  substancji  lipido- 
wej. Warstwa  ta  w zastosowanym  roztworze  zmniej- 
sza stopniowo  swoją  grubość  (rys.  15).  Grubość  tej 
warstwy  ocenia  się  przy  pomocy  mikroskopu,  do  któ- 
rego dochodzi  odbite  od  warstwy  lipidowej  światło. 

Odbita  wiązka  światła  białego  przyjmuje  początkowo 
barwę  szarą,  następnie,  wraz  ze  zmniejszaniem  się  gru- 
bości warstwy,  pojawiają  się  barwne  obrazy  interfe- 
rencyjne, aż  wreszcie  obraz  przyjmuje  barwę  czarną 
(stąd  pochodzi  nazwa  „błona  czarna”).  Dzieje  się  tak 
wtedy,  kiedy  grubość  błony  osiąga  wartość  mniej 
więcej  5-6  nm;  w tej  sytuacji  promienie  odbite  od  obu 
powierzchni  błony  znajdują  się  prawie  dokładnie 
w przeciwnych  fazach.  Po  uzyskaniu  barwy  czarnej 
proces  formowania  błony  zostaje  zak  ończony.  Ponie- 
waż długość  rozciągniętej  cząsteczki  lecytyny  wynosi 
około  8 nm,  otrzymane  wartości  potwierdzają  przy- 
puszczenie, że  uzyskana  błona  czarna  jest  błoną  dwu- 
molekularną. 


Rys.  14.  Układ  stosowany  do  formowania  czarnych  Won 


Rys.  15.  Kolejne  fazy  tworzenia  się  czarnej  błony 


Stopniowe  zmniejszanie  się  grubości  warstwy  lipi- 
dowej w procesie  formowania  się  błony  czarnej  za- 
chodzi spontanicznie  w raz  ze  zmniejszaniem  się  energii 
swobodnej  układu.  Szczegółowe  rozważania  teore- 
tyczne wskazują,  że  proces  ten  odbywa  się  przy  udzia- 
le elektrycznej  warstwy  podwójnej,  sił  Londona-van 
der  Waalsa  i sił  grawitacyjnych. 

Błony  dwumolekularne  w postaci  błon  liposomów 
można  wytworzyć  dzięki  temu,  że  większość  natural- 
nych fosfolipidów  dysperguje  (rozdrabnia  się)  w wo- 
dzie i w wodnych  roztworach  soli.  Powstają  przy  tym 
cząstki  sferyczne  i cylindryczne  o rozmiarach  zawie- 
rających się  w granicach  od  ułamków  milimetra  do 
kilkudziesięciu  nanometrów,  zwane  liposomami.  Każ- 
dy liposom  składa  się  z pewnej  liczby  dwumoleku- 
lamych  warstw  lipidowych  ułożonych  koncentrycz- 
nie i oddzielonych  od  siebie  warstwami  wody.  Naj- 
częściej liposomy  produkuje  się  przez  napromienianie 
lipidów  ultradźwiękami  lub  metodą  wytrząsania  lipi- 
dów w odpowiednim  roztworze  wodnym. 

Właściwości  błon  lipidowych  uzależnione  są  od  na- 
tury kwasów  tłuszczowych  występujących  w lipidach 
tworzących  daną  błonę  i od  oddziaływania  lipidów 
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między  sobą.  Im  dłuższe  są  łańcuchy  węglowodoro- 
we, tym  bardziej  błony  są  zwarte;  im  bardziej  są 
nienasycone,  tym  bardziej  ich  konstrukcja  jest  luźna. 

W zależności  od  temperatury  i wielu  innych  czyn- 
zacho wanie  ników  (np.  wzrostu  kwasowości  ośrodka)  stwierdza 
sięfiańcu-  się  różne  zachowanie  łańcuchów  węglowodorowych 
chów  węgfo-  tworzących  wnętrze  dwumolekularnych  warstw  lipido- 
wodorowych  wych.  W temperaturach  odpowiednio  niskich  łańcu- 
chy te  znajdują  się  w stanie  uporządkowanym,  są 
sztywne  w pewnym  stopniu  i usytuowane  równolegle 
względem  siebie.  W temperaturach  wyższych  (oraz 
pod  wpływem  innych  czynników)  uporządkowanie 
to  zanika  i błona  przechodzi  w stan  zbliżony  do  stanu 
płynnego.  Płynność  błon  pozwala  wytłumaczyć  obec- 
nie wiele  zjawisk  membranowych,  a w szczególności 
efekty  związane  z przenikaniem  substancji  przez 
błony  i efekty  związane  z działaniem  membranowych 
układów  enzymatycznych. 

Błony  modelowe  w postaci  czystych  błon  lipido- 
wych dostarczają  istotnych  informacji  dotyczących 
związków  między  strukturą  i funkcją  błon  modelo- 
wych, a te  z kolei  można  odnosić  w pewnym  zakresie 
do  wyjaśnienia  właściwości  błon  komórkowych.  Para- 
metry charakteryzujące  dwumolekulame  błony  lipi- 
dowe różnią  się  jednak  często  od  analogicznych  pa- 
rametrów żywych  błon  komórkowych.  Znacznie  le- 
psze przybliżenie  otrzymuje  się  poprzez  modyfiko- 
wanie czystych  błon  lipidowych  za  pomocą  białek. 
Takie  białka  np.  jak  walinomycyna  i gramicydyna 
wprowadzone  do  błon  lipidowych  zmieniają  właści- 
wości transportowe  tych  błon.  W szczególności 
transport  pewnych  jonów  odbywa  się  w tak  zmodyfi- 
kowanych błonach  w sposób  bardzo  zbliżony  do 
transportu  tych  samych  jonów  w pewnych  błonach 
komórkowych. 


Termodynamiczny  opis 
zjawisk  transportu 


Transport  substancji  rozpuszczonej  w elemencie  obję- 
tościowym roztworu  może  być  zrealizowany  trojako. 
Pierwsza  możliwość  polega  na  ruchu  całego  elementu 
objętościowego  — rozpuszczalnika  wraz  z substancją 
rozpuszczoną;  taki  przepływ  nazywa  się  przepływem 
objętościowym.  Druga  możliwość  — to  ruch  cząstek 
(na  ogół  cząsteczek  lub  jonów)  zachodzący  w wyniku 
ich  ruchu  cieplnego,  zwany  dyfuzją.  Trzecia  możli- 
wość — to  niedyfuzyjny  ruch  rozpuszczonej  substan- 
cji pod  wpływem  sił  zewnętrznych,  zwany  migracją, 
strumień  Wielkością  charakteryzującą  proces  transportu 
substancji  substancji  jest  strumień.  Przez  strumień  I substancji 
rozumiemy  stosunek  ilości  substancji  n przechodzącej 
w pewnym  czasie  przez  daną  powierzchnię  A do  tej 
powierzchni  i do  tego  czasu,  co  można  przedstawić 
za  pomocą  wyrażenia : 

1 dn 

l~~A~dT ' 

lub  równoważnie: 

I — cv, 

gdzie  v oznacza  prędkość  transportowanych  cząstek, 
c — stężenie  molarne. 

Zauważmy,  że  podane  równania  zostały  zapisane 
w sposób  skalarny,  ale  ogólnie  mają  one  charakter 
wektorowy,  gdyż  prędkość,  a wobec  tego  i strumień, 
są  wektorami. 

bodźce  Strumienie  powstają  pod  wpływem  różnych  czyn- 
termodynat-  ników,  zwanych  bodźcami.  Np.  strumień  dyfuzyjny 
miczne  powstaje  w zasadzie  pod  wpływem  gradientu  poten- 
cjału chemicznego  (albo,  w roztworach  nieskończenie 
rozcieńczonych,  gradientu  stężenia);  tzn.,że  gradient 
potencjału  chemicznego  jest  typowym  bodźcem  dla 
procesu  dyfuzji  (albo,  mówiąc  inaczej,  jest  bodźcem 


sprzężonym  ze  strumieniem  dyfuzyjnym).  Strumień 
objętościowy  jest  sprzężony  z gradientem  ciśnienia 
hydrostatycznego,  strumień  ładunków  elektrycz- 
nych — z gradientem  potencjału  elektrycznego,  stru- 
mień reakcji  chemicznej  (strumień  produktów  lub 
substratów)  — z powinowactwem  chemicznym.  Wię- 
kszość bodźców  wyraża  się  za  pomocą  gradientów, 
czyli  ma  charakter  wektorowy.  Ważnymi  wyjątkami 
są  termodynamiczny  strumień  reakcji  chemicznej 
i jego  termodynamiczny  bodziec,  które  są  skalarami. 
Termodynamicznym  strumieniem  reakcji  chemicznej 
jest  szybkość  reakcji  chemicznej,  a odpowiednim 
bodźcem  — powinowactwo  chemiczne. 

Uważamy,  że  dany  proces  transportu  jest  znany, 
jeśli  znamy  konkretną  zależność  pomiędzy  strumie- 
niem I i bodźcem  X , którą  ogólnie  zapiszemy  sym- 
bolicznie jako  funkcję/: 

/=/(*)- 

Często  sformułowanie  konkretnych  równań  tego 
typu  oraz  ich  rozwiązanie  jest  sprawą  trudną  lub  na 
dzisiejszym  poziomie  wiedzy  — niemożliwą  do  zrea- 
lizowania. Wiele  jednak  problemów  można  rozwiązać 
wykorzystując  liniową  termodynamikę  procesów  nie- 
równowagowych (nieodwracalnych).  Opiera  się  ona 
na  postulacie  głoszącym,  że  dla  dostatecznie  powol- 
nych procesów  (i  dla  procesów  stacjonarnych)  stru- 
mienie są  liniowymi  funkcjami  wszystkich  bodźców 
w układzie: 

U = 2 UkXk,  (1) 

k 


gdzie  Ii  oznacza  strumień  /-tej  substancji,  Xk  — A>ty 
bodziec,  a Lik  są  współczynnikami  liniowymi,  zwa- 
nymi współczynnikami  fenomenologicznymi.  Współ- 
czynniki te  są  niezależne  od  strumieni  i bodźców. 
Nazywają  się  one  współczynnikami  fenomenologicz- 
nymi prostymi,  jeśli  i = k,  a współczynnikami 
fenomenologicznymi  krzyżowymi,  jeśli  i ć k. 
Wszystkie  współczynniki  fenomenologiczne  muszą 
być  w zasadzie  wyznaczane  doświadczalnie.  Stru- 
mienie i bodźce  o tych  samych  wskaźnikach  są 
nazywane  wielkościami  sprzężonymi  lub  skoniugo- 
wanymi.  Równania  (1)  nazywają  się  równaniami 
fenomenologicznymi. 

Równania  fenomenologiczne  można  stosować  w 
konkretnych  zagadnieniach  uwzględniając  trzy  pod- 
stawowe zasady: 

— Drugą  zasadę  termodynamiki,  a właściwie  pe- 
wną jej  konsekwencję,  która  posiada  następującą  po- 
stać (dowód  pomijamy): 


dS 

dt 


= o. 


gdzie  S jest  entropią,  t — czasem,  dS/dt  — szybkością 
zmiany  entropii  wywołaną  nieodwracalnością  pro- 
cesów. 

— Zasadę  Onsagera,  która  mówi,  że  współczynniki 
krzyżowe  o przestawionych  wskaźnikach  są  sobie 
równe: 

Lik  = Lki  (i  # k). 


— Zasadę  Curie,  która  jest  ogólnym  prawem  przy- 
rody, a w zastosowaniu  do  naszych  rozważań  może 
być  sformułowana  następująco:  w układach  izotro- 
powych przyczyna  skalarna  nie  może  wywołać  skutku 
o charakterze  wektorowym.  A więc  np.  wektorowy 
strumień  dyfuzyjny  nie  może  być  w ośrodku  jedno- 
rodnym wywołany  skalarnym  bodźcem  chemicznym 
w postaci  powinowactwa  chemicznego. 

Równania  fenomenologiczne  (1)  dla  dwóch  stru- 
mieni i dla  dwóch  bodźców  przyjmują  postać: 


L\  — LxxXl+LvXz 
Ii  — L^X\'\- L^<iX<>. 


(2) 


Jak  widać  każdy  ze  strumieni  jest  uzależniony  nie 
tylko  od  bodźca  z nim  skoniugowanego,  lecz  również 
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od  bodźca  nieskoniugowanego.  Ponieważ  zgodnie 
z zasadą  Onsagera  L12  = L2 u przeto  obydwa  stru- 
mienie są  wzajemnie  sprzężone  i oddziałują  na  siebie. 
Jeśli  mianowicie  z drugiego  równania  określimy  X2 
i otrzymany  wynik  podstawimy  pod  X2  w równaniu 
pierwszym,  otrzymamy: 


co  wskazuje  na  bezpośrednie  sprzężenie  między 
obydwoma  strumieniami. 

zjawisko  Typowym  przykładem  fizycznym  takiego  sprzęże- 
termo-  niajest  zjawisko  termodyfuzji.  W zjawisku  tym  sprzę- 
dyfuzji  żone  Są  ze  sobą  strumienie  dyfuzyjny  i cieplny.  W re- 
zultacie, pod  wpływem  gradientu  temperatury,  do- 
chodzi do  powstania  procesu  dyfuzji. 

Kiedy  współczynniki  krzyżowe  są  równe  zeru,  to 
sprzężenia  między  strumieniami  nie  występują.  Np. 
jeśli  L12  = L*!  = 0,  to  z równań  (2)  pozostają  dwie 
niezależne  relacje:  Ix  = LnXi  oraz  I2  = L22X2. 

Formalizm  liniowej  termodynamiki  procesów  nie- 
równowagowych pozwala  opisać  pewne  zjawiska 
transportu  bliskie  stanom  równowagi.  Procesy  za- 
chodzące w stanach  odległych  od  stanu  równowagi 
próbuje  się  opisać  za  pomocą  metod  nieliniowej  ter- 
modynamiki procesów  nierównowagowych.  Przedsta- 
wienie nawet  elementów  tej  ostatniej  wykracza  poza 
zakres  niniejszego  opracowania. 

Przedstawione  wyżej  rozważania  o charakterze 
ogólnym  zostaną  w dalszym  wywodzie  wykorzystane 
do  opisu  pewnych  zjawisk  przenikania  substancji 
przez  błony  komórkowe. 


Przenikanie  substancji  przez 
błony  biologiczne 


Błona  komórkowa  stanowi  barierę  pomiędzy  ośrod- 
kiem zewnętrznym  a protoplazmą,  a w organizmach 
wielokomórkowych  stanowi  również  barierę  między 
sąsiednimi  komórkami.  Przez  błonę  tę  przenikają 
różnorodne  substancje  zarówno  z ośrodka  zewnętrz- 
nego do  wnętrza  komórki,  jak  i w kierunku  przeciw- 
nym. Substancje  przenikają  również  przez  błony 
biologiczne  innych  rodzajów. 

Wszystkie  błony  biologiczne  charakteryzuje  zdol- 
ność do  wybiórczej  przepuszczalności  substancji. 
Pewne  substancje  przenikają  z większą  szybkością, 
inne  z mniejszą,  a jeszcze  inne  nie  są  w ogóle  przepusz- 
czane przez  błonę.  Błony  biologiczne  nie  są  więc  bło- 
nami półprzepuszczalnymi,  ponieważ  umożliwiają 
transport  nie  tylko  rozpuszczalnika  (np.  wody),  lecz 
setek  innych  związków.  Charakter  przenikania  danej 
substancji  uzależniony  jest  od  aktualnego  stanu  błony 
i zmienia  się  wraz  ze  zmianami  błony  zachodzącymi 
pod  wrpływem  czynników  zewnętrznych. 

Istnieje  ogromna  różnorodność  procesów  przeni- 
kania ; można  je  podzielić  na  zasadnicze  dwie  klasy : 
procesy  przenikania  biernego  i procesy  przenikania 
aktywnego.  Procesy  przenikania  biernego  odbywają 
się  bez  nakładu  energii  zewnętrznej  — samorzutnie, 
natomiast  procesy  aktywne  wymagają  nakładu  energii 
(dostarczonej  z metabolicznych  reakcji  chemicznych). 
Procesy  przenikania  biernego  zachodzą  pod  wpływem 
różnych  bodźców,  takich  jak  np.  gradient  potencjału 
chemicznego,  gradient  stężenia,  gradient  potencjału 
elektrycznego.  W związku  z tym  rozróżniamy  takie 
procesy  biernego  transportu  jak  dyfuzja  prosta, 
elektrodyfuzja  i przenikanie  ułatwione.  Gdy  przeni- 
kanie zachodzi  wyłącznie  pod  wpływem  gradientu 
potencjału  chemicznego  lub  (dla  dostatecznie  małych 
stężeń)  gradientu  stężenia,  to  jest  to  tzw.  dyfuzja 
prosta.  Jeśli  nie  ma  oddziaływań  pomiędzy  strumie- 
niami danej  substancji  i ewentualnymi  innymi  stru- 
mieniami, to  zależność  między  strumieniem  i bodż- 
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cem  (równanie  1)  sprowadza  się  do  jednego  równania : 


h = lxd. 

Jeśli  bodźcem  jest  gradient  stężenia  dc}cx  (dla  procesu 
zachodzącego  w jednym  tylko  kierunku  osi  jc), 
a L = — Dy  to  otrzymamy  znane  prawo  dyfuzji 
prostej  (I  prawo  Ficka): 


gdzie  D jest  współczynnikiem  dyfuzji. 

Jeżeli  mamy  dwa  ośrodki  dobrze  mieszane  (miesza- 
dłami lub  metodą  wstrząsania),  tzn.  takie,  że  można 
pominąć  w rozważaniach  dyfuzję  w tych  ośrodkach, 
bo  mieszanie  zachodzi  szybciej  niż  dyfuzja  i jeżeli 
te  ośrodki  rozdzielone  są  błoną  (rys.  16),  to  dyfuzja 
będzie  się  odbywała  jedynie  wewnątrz  błony  i wobec 
tego  w równaniu  (3)  dcjdx  oznacza  gradient  stężenia 
wewnątrz  błony,  a D — współczynnik  dyfuzji  prze- 
nikającej substancji  przez  fazę  błony.  Jeśli  cząsteczka 
dyfunduje  przez  ciągłą  warstwę  lipidową,  to  ruch  jej 


ośrodek  dobrze 
mieszany 


ośrodek  dobrze 
mieszany 


Rys.  16.  Układ  zawierający  błonę  i dwa  dobrze  mieszane  roztwory 


Rys.  17.  Rozkład  potencjału  w obszarze  lipidowej  fazy  błony 


ma  charakter  przeskoków  z jednego  położenia  rów- 
nowagi do  następnego  poprzez  szereg  barier  potencja- 
łu (rys.  17).  Jeśli  proces  ma  charakter  stacjonarny 
i stężenie  w jednym  ośrodku  wynosi  cu  a w drugim 
c2  i jeśli  grubość  błony  oznaczymy  przez  Ax,  to 
równanie  (3)  przyjmuje  postać: 

/„  = -D~=  -PJc  = -P’J, z, 

D Ax 

gdzie  Ac  = cx— c2,  P (zwane  stałą  przenikania)  jest 
równe  D/Ax , An  jest  różnicą  ciśnień  osmotycznych 
pomiędzy  dwoma  ośrodkami  (ciśnienie  osmotyczne 
n dla  roztworów  nieskończenie  rozcieńczonych  wynosi 
RTc9  gdzie  R jest  stałą  gazową,  T — temperaturą 
bezwzględną,  a P'  = P/RT). 

Znamy  wiele  substancji,  które  przenikają  przez 
błony  żywych  komórek  zgodnie  z prawem  prostej 
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dyfuzji.  Nie  wiadomo  jednak,  czy  substancje  te  prze- 
nikają przez  ciągłą  fazę  lipidową  błony,  czy  też  przez 
hipotetyczne  pory  w błonie.  Wynika  to  stąd,  że  pro- 
ces dyfuzji  wyraża  się  w obydwu  przypadkach  takim 
samym  prawem.  Pewną  wskazówką  jest  stwierdzona 
doświadczalnie  zależność  między  szybkością  dyfuzji 
i składem  lipidowym  błony.  Im  więcej  nienasyconych 
lipidów  znajduje  się  w błonie  (im  mniej  zwarta  jest 
jej  struktura),  tym  szybciej  zachodzi  proces  dyfuzyj- 
nego przenikania  biernego. 

elektro-  Transport  jonów  wynikły  z równoczesnego  działa- 
dyf  uzja  nia  pola  elektrycznego  i gradientu  stężenia  nosi  nazwę 
elektrodyfuzji.  Różnica  potencjałów  elektrycznych 
powstaje  zawsze  w wyniku  różnic  w ruchliwościach 
jonów  (tzw.  potencjał  dyfuzyjny).  Ponadto  w błonach 
biologicznych  (a  często  i w sztucznych)  występuje 
napięcie  elektryczne,  którego  źródłem  są  nie  przenika- 
jące przez  błonę  jony  i ładunki  związane  z błoną 
(tzw.  potencjał  Donnana).  Suma  napięć  dyfuzyjnych, 
napięć  Donnana  i napięć  wywołanych  przenikaniem 
aktywnym  nazywa  się  potencjałem  membranowym. 
Przenikanie  jonów  przez  błony  żywych  komórek  czę- 
sto może  mieć  charakter  elektrodyfuzyjny,  ponieważ 
w układzie  żywa  komórka-ośrodek  często  może  wy- 
stępować równocześnie  gradient  potencjału  elektrycz- 
nego i gradient  stężenia.  W tym  wypadku  równania 
fenomenologiczne  (2)  dla  procesu  stacjonarnego  mogą 
być  przedstawione  następująco : 

Id  — Ldd  An-\-LDq><pdi(p 

I(p  — Lq>D~r 

gdzie  Id  jest  strumieniem  dyfuzyjnym,  An  — różnicą 
ciśnień  osmotycznych,  A<p  — różnicą  potencjałów 
membranowych,  /«,  — strumieniem  elektrycznym,  Idd* 
Ld<p  , L<p  D , h(pip  — odpowiednimi  współczynnikami  fe- 
nomenologicznymi. Równania  elektrodyfuzji  pozwa- 
lają m.in.  obliczyć  dla  wybranych  jonów  i przy  wielu 
upraszczających  założeniach,  napięcie  membranowe 
A<py  które  jest  źródłem  impulsów  nerwowych, 
przenikanie  Są  układy,  w których  transport  bierny  substancji 
ułatwione  zachodzi  z większą  szybkością,  niżby  to  wynikało 
z praw  poprzednio  omówionych;  jest  to  tzw.  przeni- 
kanie ułatwione.  Przykładem  może  być  m.in.  tran- 
sport glukozy,  która  przenika  przez  błonę  komórko- 
wą erytrocytów  mniej  więcej  5 razy  szybciej  niż  przez 
odpowiednią  warstwę  lipidową.  To  zjawisko  i wiele 
innych  podobnych  obserwacji  doprowadziło  do  sfor- 
mułowania pojęcia  nośników.  Nośnikami  są  przy- 
puszczalnie pewne  substancje  (do  dzisiaj  w ostateczny 
sposób  nie  zidentyfikowane,  choć  w pewnych  przy- 
padkach ich  istnienie  wydaje  się  niewątpliwe)  obecne 
tylko  wewnątrz  błony,  które  mogą  się  selektywnie 
wiązać  z cząstkami  przenikającymi,  tworząc  komplek- 
sy. Kompleksy  te  charakteryzuje  większy  współczyn- 
nik dyfuzji  w błonie  aniżeli  substancja  bez  nośnika. 
Rozpatrzymy  jeden  z możliwych  modeli  układu  noś- 
nikowego vrys.  18).  W modelu  tym  zakładamy,  ze 
nośniki  są  ruchome  i że  przy  jednej  z powierzchni 
błony  wiążą  się  bez  nakładu  energii  z cząsteczkami 
substancji  transportowanej  tworząc  kompleksy,  któ- 
re dyfundują  przez  błonę,  następnie  ulegają  dysocjacji 
przy  drugiej  powierzchni  błony.  Cząsteczki  substancji 


Rys.  18.  Przykładowy  model  układu  nośnikowego 
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transportowej  zostają  po  drugiej  stronie  błony, 
a nośniki  dyfundują  z powrotem  i proces  się  powta- 
rza. Można  wykazać,  że  strumień  jednokierunkowy 
wyraża  się  tu  następująco: 

i*] 

1 ~ ,m[S]+K’ 

gdzie  Im  i K są  pewnymi  stałymi,  S — stężeniem 
substancji  przenikającej  w ośrodku  zewnętrznym.  Jak 
widać  dla  dostatecznie  dużych  wartości  S (tzn.  jeśli 
S > K)  wartość  strumienia  przyjmuje  stałą  wartość 
I — Im.  Przebieg  zależności  strumienia  od  stężenia 
zewnętrznego  jest  przedstawiony  na  rys.  19.  Dla 
dostatecznie  dużych  stężeń  wszystkie  nośniki  zostają 
zaangażowane  w transport  substancji  S i wobec  tego 
dalsze  zwiększenie  stężenia  nie  może  doprowadzić  do 
wzrostu  strumienia  — następuje  nasycenie. 


Rys.  19.  Zależność  pomiędzy  strumieniem  i stężeniem  przenika- 
jącej przez  błonę  substancji  w transporcie  nośnikowym 


Przenikanie  bierne  każdego  rodzaju  może  zachodzić 
zgodnie  z gradientem  stężenia  substancji  przenikającej 
lub  też  wbrew  gradientowi  stężenia.  Np.  w procesie 
elektrodyfuzji  transport  jonów  może  odbywać  się 
wbrew  gradientowi  stężenia,  jeśli  tylko  w układzie  wy- 
stępuje odpowiednie  napięcie  elektryczne.  Możemy 
również  obserwować  przepływ  substancji  pomimo 
braku  różnicy  stężeń  tej  substancji.  Np.  wyobraźmy 
sobie  komórki,  które  w swej  błonie  zawierają  nośniki 
wiążące  się  zarówno  z pewną  substancją  A jak  i z 
pewną  substancją  B.  Jeśli  utrzymujemy  komórki 
w ośrodku  o wysokim  stężeniu  substancji  A (w  nie- 
obecności B)  tak  długo,  aż  strumień  wpływający  I„ p 
stanie  się  równy  strumieniowi  substancji  wypływają- 
cej  7^yp  z komórek,  to  strumień  netto  7^et  = 0. 
Jeżeli  teraz  dodamy  do  ośrodka  zewnętrznego  sub- 
stancję Bt  to  wówczas  wystąpi  konkurencja  substancji 
A i B o wykorzystanie  nośników.  Początkowo  kon- 
kurencja będzie  dotyczyła  jedynie  nośników  znajdu- 
jących się  w pobliżu  powierzchni  błony  od  strony 
ośrodka  zewnętrznego.  Dlatego  strumień  wpływający 
stanie  się  mniejszy  od  strumienia  wypływającego 
A?P  < 7wyp»  a więc  pojawi  się  strumień  netto  różny 
od  zera  (7net  ^ 0)  pomimo  braku  różnicy  stężeń  sub- 
stancji A. 

Przeważnie  prawom  transportu  biernego  podlegają 
substancje  o mniejszym  znaczeniu  fizjologicznym. 
Najważniejsze  z biologicznego  punktu  widzenia  sub- 
stancje (np.  jony  potasu  i sodu,  białka,  wiele  cukrow- 
ców) przenikają  aktywnie. 

Transport  aktywny  wymaga  dopływu  energii  swo- 
bodnej z jakiegoś  niezależnego  źródła;  przeważnie 
energii  tej  dostarczają  reakcje  metaboliczne.  Wobec 
tego  transport  aktywny  w błonach  biologicznych 
może  być  określony  jako  przepływ  dyfuzyjny  sprzę- 
żony z chemicznym  procesem  metabolicznym. 

Jednak  według  zasady  Curie  takie  sprzężenie  między 
wektorowym  strumieniem  dyfuzyjnym  i skalarnym 
strumieniem  chemicznym  w układzie  izotropowym 
jest  niemożliwe.  Stąd  sądzono,  że  przenikanie  aktyw- 
ne jest  specyficznym  procesem  biologicznym  nie  pod- 
legającym prawom  fizyki.  Rozwiązanie  tego  para- 
doksu wynika  z następującego  rozumowania. 
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Rozważmy  układ,  w którym  występuje  bodziec 
wektorowy  w postaci  różnicy  ciśnień  osmotycznych 
An  i bodziec  skalarny  w postaci  powinowactwa  che- 
micznego E oraz  strumień  dyfuzyjny  i i strumień 
reakcji  chemicznej  lr.  Równania  fenomenologiczne 
przyjmują  wówczas  postać: 

Id  — Ldd  An  + LnrE,  (4) 

Ir  = LtdA71  + LrrE, 

gdzie  Ldd,  Dnr>  Ltd , Lrr  są  odpowiednimi  współ- 
czynnikami fenomenologicznymi.  W układzie  izotro- 
powym nie  ma  sprzężeń,  więc  współczynniki  krzyżo- 
we znikają  i równania  sprowadzają  się  do  dwóch 
równań  niezależnych:  Id  = LddAtl  oraz  Ir  — LrrE , 
wskazujących,  że  w ośrodku  jednorodnym  mogą  wy- 
stępować jedynie  nie  oddziałujące  ze  sobą  strumienie. 
Stąd  należy  wnosić,  że  gdyby  błona  komórkowa  była 
tworem  izotropowym,  to  żadne  procesy  aktywne  nie 
mogłyby  w niej  powstawać.  Błona  jest  jednak  ukła- 
dem anizotropowym,  który  charakteryzuje  przestrzen- 
na i strukturalna  asymetria.  Z tego  względu  zasada 
Curie  przestaje  obowiązywać  (albo  też  mówiąc  ina- 
czej, strumień  reakcji  chemicznej  w odpowiednio  asy- 
metrycznym układzie  staje  się  strumieniem  ukierun- 
kowanym, a więc  wektorowym  i zasada  Curie  pozo- 
staje słuszna)  i w błonach  biologicznych  mogą  istnieć 
sprzężenia  między  dyfuzją  i reakcją  chemiczną;  w 
równaniach  (4)  współczynniki  krzyżowe  Ldt  i Ltd 
nie  znikają. 

Tak  więc  błona  żywa  ze  względu  na  swoją  asyme- 
trię umożliwia  sprzężenia  między  reakcjami  chemicz- 
nymi i aktywnym  transportem  substancji  i w konse- 
kwencji jest  odpowiedzialna  za  podstawowe  procesy 
życiowe.  Dzięki  powiązaniom  reakcji  chemicznej 
z procesem  transportu  istnieje  możliwość  regulacji 
dopływu  substancji  do  wnętrza  komórek  przy  pomocy 
subtelnych  zmian  w kinetyce  reakcji  chemicznych 
zachodzących  wewnątrz  błon  komórkowych.  W roz- 
ważanym zagadnieniu,  opierając  się  na  drugiej  zasa- 
dzie termodynamiki  możemy  napisać 

dS 

— — — — IdAhĄ-It  E > 0. 

dt 

Ostatnia  nierówność  prowadzi  do  wniosku,  że  stru- 
mień dyfuzyjny  sprzężony  z reakcją  chemiczną  może 
płynąć  w kierunku  przeciwnym  do  kierunku  działania 
jego  własnego  bodźca.  Z nierówności  tej  wynika,  że 
suma  obydwu  wyrazów  musi  być  większa  od  zera. 
Wobec  tego  jeden  z wyrazów  może  być  ujemny, 
jeśli  tylko  ten  drugi  jest  dodatni  na  tyle,  że  zapewnia 
dodatnią  wartość  sumy.  Jeśli  więc  wartość  wyrazu 
metabolicznego  IrE  jest  dostatecznie  duża,  to  iloczyn 
IdAtc  może  być  ujemny  (co  oznacza,  że  kierunki  Id 
i Atz  są  różne)  i tym  samym  może  zmniejszać  entropię. 
Przenikanie  aktywne  może  również  odbywać  się 
zgodnie  z gradientem,  np.  stężenia.  Zachodzi  ono  jed- 
nak w takich  razach  z większą  szybkością  aniżeli 
miałoby  to  miejsce  w procesie  dyfuzji.  Procesy  tego 
typu  spotyka  się  w żywych  komórkach.  Np.  mecha- 


nizmy aktywnego  transportu  mogą  być  uruchamiane 
w błonie  komórkowej  wówczas,  kiedy  konieczne  jest 
jak  najszybsze  wydalanie  trujących  produktów  roz- 
puszczonych wewnątrz  komórki. 

Przenikanie  aktywne  zachodzi  na  ogół  dzięki  energii 
wyzwalanej  w procesie  hydrolizy  kwasu  adenozyno- 
trój fosforanowego  (ATP).  Jest  to  związek  wysoko- 
energetyczny. Oderwanie  się  jednej  grupy  fosforowej 
od  ATP  prowadzi  do  wydzielenia  się  energii  potrzeb- 
nej do  podtrzymywania  procesu  aktywnego.  Powią- 
zanie tej  energii  z procesem  aktywnego  przenikania 
wynika  ze  stwierdzeń  doświadczalnych:  zahamo- 
wanie procesu  rozpadu  ATP  powoduje  wstrzymanie 
procesu  aktywnego  transportu.  Również  bilans  ener- 
getyczny wskazuje  na  ścisłe  powiązanie  pomiędzy 
energią  pochodzącą  z ATP  i procesem  transportu 
aktywnego.  Nie  wiadomo  jednak,  jak  dochodzi  do 
przekształcenia  energii  chemicznej  w energię  mecha- 
niczną transportu.  Istnieją  jedynie  liczne,  mniej  lub 
bardziej  uzasadnione  hipotezy  i spekulacje.  Najczęś- 
ciej przyjmuje  się,  że  przenikanie  aktywne  jest  reali- 
zowane przy  pomocy  nośników,  które  (inaczej  niż 
to  ma  miejsce  w biernym  transporcie  nośnikowym) 
wiążą  się  z transportowaną  substancją  dzięki  dostar- 
czonej energii  metabolicznej. 


ATP  — źródło 
energii  dla 
przenikania 
aktywnego 


Od  czego  zależy  dalszy  rozwój 
biofizyki  błon 


Błony  biologiczne  są  niezbędnym  składnikiem  wszy- 
stkich żywych  komórek  i organizmów  wielokomór- 
kowych. Liczne  funkcje  błon  związane  z podstawo- 
wymi funkcjami  życiowymi  — odżywianiem  się,  foto- 
syntezą, powstawaniem  i rozchodzeniem  się  impul- 
sów nerwowych,  procesami  metabolicznymi  — spro- 
wadzają się  przede  wszystkim  do  zdolności  regulo- 
wania procesów  transportu.  Matematyczny  opis 
procesów  transportu  jest  obecnie  utrudniony  z kilku  trudności 
co  najmniej  ważnych  powodów,  a przede  wszystkim  opisu  mate- 
z powodu  braku  dobrej  znajomości  budowy  i struk-  matycznego 
tury  błon;  zadowalającej  teorii  budowy  cieczy  i pełnej 
teorii  termodynamiki  procesów  nierównowagowych 
Gęśli  w ogóle  termodynamiczny  opis  może  być  sto- 
sowany do  układów  o rozmiarach  10  nm,  odpowia- 
dających grubości  błony).  Dalszy  rozwój  biofizyki 
błon  jest  więc  uzależniony  od  rozwoju  fizycznych 
metod  pomiarowych,  głównie  spektroskopowych, 
rozwoju  teorii  cieczy,  w szczególności  roztworów 
i rozwoju  termodynamiki  małych  układów,  względnie 
innych  ujęć  matematyczno-fizycznych  zagadnień. 
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komórkowych  w procesach  kontrolujących  ruch  i metabolizm  ko- 
mórek, Kraków  1970;  W.  Leyko  (red.)  Wykłady  z biofizyki,  t.  1, 

Łódź  1975;  A.  P.  M.  Lockwood  The  Membranę  of  Animal  Cells, 

London  1971;  S.  Przestalski  Opis  zjawiska  transportu  przez 
błony  biologiczne.  Postępy  Biologii  Komórki  2,  165  (1975); 
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Białka 

Kazimierz  Zakrzewski 

Chociaż  nie  potrafimy  zdefiniować,  czym  jest  życie, 
intuicja  na  ogół  bezbłędnie  pozwala  nam  odróżnić 
twory  żywe  od  martwych.  Skomplikowana,  lecz  har- 
monijna budowa,  celowe  reagowanie  na  bodźce  ze- 
wnętrzne, a przede  wszystkim  zdolność  do  rozmna- 
żania się,  do  odtwarzania  w organizmie  potomnym 
organizmów  rodzicielskich  to  nieodłączny  i nie- 
rozłączny zespół  cech  charakteryzujących  zjawisko 
życia.  Egzystencja  zaś  organizmu  jest  bezwzględnie 


uzależniona  od  jego  metabolizmu  — systemu  reakcji  metabolizm 
chemicznych  umożliwiających  przyswajanie,  prze-  organizmów 
twarzanie  i wykorzystywanie  substancji  z otoczenia 
jako  materiału  budulcowego  i źródła  energii. 

Wyjaśnienie  zasad  reakcji  metabolicznych  stworzy- 
ło podstawy  obecnego  burzliwego  rozwoju  nauk  bio- 
logicznych. Udowodnienie  zaś,  że  białka  są  zdefinio- 
wanymi i zróżnicowanymi  związkami  chemicznymi, 
a nie  bezpostaciową  i pasywną  masą  „biokoloidu”, 
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jak  niegdyś  sądzono,  oraz  że  enzymy  są  białkami, 
znaczenie  miało  znaczenie  przełomowe.  Enzymy,  białka  wy- 
białek  dla  kazujące  czynność  katalityczną,  umożliwiają  ko- 
życia  morkom  żywym  prowadzenie  złożonych  reakcji  che- 
micznych w wąskich,  dopuszczalnych  dla  życia  gra- 
nicach temperatury.  Bez  istnienia  enzymów  nie  był- 
by możliwy  metabolizm,  niemożliwa  byłaby  także 
replikacja  (odtwarzanie)  aparatu  genetycznego,  wa- 
runek rozmnażania  się  organizmów  i istnienia  życia 
na  ziemi.  Nie  tylko  jednak  enzymy  okazały  się  biał- 
kami, ale  również  wszystkie  inne,  dotąd  poznane  na- 
rzędzia molekularne  komórki:  specjalne  białka  od- 
powiedzialne są  za  transport  substancji  i ich  wymianę 
z otoczeniem,  inne  — za  odbieranie  i przekazywanie 
sygnałów  chemicznych  i fizycznych  o stanie  środo- 
wiska wewnętrznego  i zewnętrznego  oraz  za  koordy- 
nację funkcji  biologicznych.  Jeżeli  się  do  tego  doda, 
że  z białek  powstaje  też  zrąb  strukturalny,  układ 
składników  zapewniających  trwałą  a elastyczną  or- 
ganizację wewnętrzną  tworów  żywych,  to  stanie  się 
oczywiste,  że  mają  one  uniwersalne  znaczenie  dla 
życia. 


Budowa  białek 


czynność  optyczną  (rys.  2),  a z dwu  możliwych  stereo- 
izomeronów  w białkach  występują  tylko  L-a-amino- 
kwasy  (wyjątkiem  jest  tu  pozbawiona  czynności  opty- 
cznej glicyna,  która  ma  dwie  wartościowości  O podsta- 
wione atomami  wodoru : tabela).  Przyczyny,  dla  któ- 
rych przyroda  wybrała  tę  właśnie  możliwość,  są  nie 
znane.  Mogły  to  spowodować  warunki  panujące  na 
naszej  planecie  w okresie  powstawania  życia  na  ziemi, 
np.  charakter  pola  magnetycznego,  polaryzacja  świa* 
tła  słonecznego,  siły  związane  z obrotem  kuli  ziem- 
skiej wokół  osi.  Również  możliwe  jest,  że  konfigura- 


R 


nh2 


Rys.  2.  Struktura  przestrzenna  a-aminokwasów.  Tworzy  on 
tetraedr,  w którego  środku  znajduje  się  atom  węgla  C (niewi- 
doczny na  rysunku),  natomiast  grupy  aminowa,  karboksylowa 
i łańcuch  boczny  R rozmieszczone  są  w wierzchołkach  tetraedru 
zgodnie  z ruchem  wskazówek  zegara  w L-a-aminokwasach  i prze- 
ciwnie — w D-a-aminokwasach 


Wszechstronnym  funkcjom  białek  towarzyszy  ogro- 
mna różnorodność  ich  własności  fizycznych  i chemicz- 
nych — wielkości,  kształtu  i ładunku  elektrycznego 
cząsteczki,  barwy,  rozpuszczalności  itd.  Wspólną 
jednak  ich  cechą  jest  to,  że  zbudowane  są  z tych 
samych  dwudziestu  różniących  się  między  sobą  ami- 
nokwasów, połączonych  w długi  i nierozgałęziony 
łańcuch.  I to  właśnie  leży  u podstaw  różnorodności 
struktury  i funkcji  białek.  W łańcuchu  bowiem  każdy 
z dwudziestu  aminokwasów  może  występować  w do- 
wolnej pozycji  i wielokrotnie.  Proste  obliczenie  wska- 
zuje, że  w małym  białku,  zbudowanym  np.  ze  stu 
aminokwasów,  dwadzieścia  różnych  aminokwasów 
może  być  ułożonych  na  10130  sposobów,  może  więc 
dać  tyleż  różniących  się  rodzajów  cząsteczek.  Jest  to 
więcej  niż  wynosi  liczba  atomów  we  Wszechświecie, 
szacowana  na  1080,  ale  w przyrodzie  występuje  tylko 
niewielka  ich  część,  być  może  — ok.  1012  różnych 
białek.  Znacznie  więcej  było  ich  bez  wątpienia  wypró- 
bowywanych  w toku  ewolucji  i odrzuconych  jako  nie 
przyczyniających  się  do  przeżycia  gatunku.  Białka 
są  na  ogół  bardzo  dobrze  dostosowane  do  warunków 
bytowania  organizmów,  chociaż  są  i takie  — pro- 
dukty świeżych  lub  starszych  mutacji  — które  mają 
własności  niekorzystne,  oraz  białka  różniące  się  nieco 
od  optymalnych,  nie  pogarszające  szansy  przeżycia 
i jak  gdyby  oczekujące  na  ujawnienie  swoich  walo- 
rów wówczas,  gdy  się  zmienią  warunki  bytowania 
organizmu. 

aminokwa-  W przyrodzie  występuje  wiele  dziesiątków  różnych 
sy  — cegiełki  aminokwasów  (a  więcej  ich  można  otrzymać  synte- 
hudowy  tycznie),  lecz  białka  budowane  są  tylko  z tych  dwu- 
dziestu, które  mają  w zapisie  informacji  genetycznej 
odpowiednie  kodony  (->  Kwasy  nukleinowe).  Są  to 
a-aminokwasy  (rys.  1)  o charakterystycznej  i jedna- 
kowej konfiguracji  atomowej  przy  węglu  O,  lecz 
różniące  się  swymi  łańcuchami  bocznymi  (tabela). 
Ponieważ  cztery  wartościowości  węgla  C*  wysycone 
są  różnymi  podstawnikami,  a-aminokwasy  wykazują 
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N — C~C 
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OH 


H2N  • CH(R)  • COOH 


Rys.  1.  Wzór  strukturalny  a-aminokwasu  (u  dołu  w postać 
skróconej).  Aminokwasy,  podstawowe  cegiełk'  budowy  białka' 
są  związkami  organicznymi,  zawierającymi  w swojej  cząsteczce 
grupę  aminową  ( — NH,)  o własnościach  zasadowych  i grupę 
karboksylową  ( — COOH)  o własnościach  kwasowych.  Białka  bu- 
dowane są  z jednego  tylko  rodzaju  aminokwasów  — takich, 
w których  grupa  aminowa  i grupa  karboksylowa  znajdują  się 
przy  tym  samym  atomie  węgla,  oznaczanym  jako  C®;  zwane  są 
one  a-aminokwasami.  W pozycji  oznaczonej  R znajduje  się 
łańcuch  boczny  aminokwasu  (zob.  tabela).  Atomy  węgla  w łań- 
cuchu bocznym  oznacza  się  kolejnymi  literami  greckimi  P,  y itd. 
zaczynając  od  węgla  C«;  atom  węgla  grupy  kwasowej  oznacza 
się  jako  C' 


cja  L ma  jakąś  wyższość  nad  D albo  że  o wyborze 
konfiguracji  zdecydował  przypadek:  pierwszy  zdolny 
do  długotrwałej  samoreprodukcji  twór  mógł  być  zbu- 
dowany z L-a-aminokwasów  i uniemożliwił  wy- 
kształcenie się  innych  form  życia. 

Białka  syntetyzowane  są  w procesie  translacji 
(-►  Kwasy  nukleinowe)  przez  wyłączenie  cząsteczki 
wody  z grupy  — COOH  jednego  aminokwasu  i grupy 
NH2  następnego  (rys.  3).  Powstaje  między  nimi  wią- 
zanie peptydowe  (rys.  4),  ważny  czynnik  strukturo- 
twórczy  w białkach,  i formuje  się  łańcuch  polipepty- 
dowy.  W roztworze  wodnym,  jedynym  środowisku, 
w jakim  na  naszej  planecie  mogą  zachodzić  zjaw  iska 
życia,  przybiera  on  ukształtowanie  przestrzenne  uza- 
leżnione od  właściwości  wiązania  peptydowego  oraz 
od  kolejności  występowania  w polipeptydzie  rozma- 
itych łańcuchów  bocznych  aminokwasów  (rys.  3). 
Kolejność  ta,  zwana  sekwencją  aminokwasową  lub 
strukturą  pierwszorzędową  białka,  jest  bezpośrednim 
odzwierciedleniem  zapisu  informacji  genetycznej 
w genie  i determinuje  przestrzenne  ukształtowanie 
(konformację,  strukturę  wyższego  rzędu)  całej  czą- 
steczki. Struktura  wyższego  rzędu  sprawia,  że  w czą- 
steczce białka  przybliżają  się  do  siebie  aminokwasy, 
na  ogół  znajdujące  się  w odległych  miejscach  łańcucha 
polipeptydowego,  i powstają  charakterystyczne  dla 
danego  białka  ich  zgrupowania,  będące  centrami 
czynnymi  (np.  o funkcji  katalitycznej).  Dopiero  osta- 
tecznie ukształtowana  cząsteczka  białka  jest  zdolna 
do  spełniania  właściwych  funkcji  biologicznych,  a nie 
pierwotnie  syntetyzowany  łańcuch  pohpeptydowy. 
Sens  więc  biologiczny  zawarty  w zapisie  informacji 
genetycznej  ujawnia  się  nie  w sekwencji  aminokwa- 
sowej  białka,  ale  w jego  przestrzennym  ukształtowa- 
niu. 

W strukturze  przestrzennej  białka  występują  dwa 
elementy.  Jeden  z nich  zależy  od  ciągłego  powtarzania 
się  wzdłuż  łańcucha  głównego  układu  atomów 
— O — C' — N — (rys.  3),  identycznego  we  wszystkich 
białkach  i określającego  możliwości  konformacyjne 
łańcucha  głównego.  Elementem  drugim  jest  genetycz- 
nie ustalona  kolejność  różnych  aminokwasów,  ogra- 
niczająca te  możliwości  i nadająca  danemu  białku 
właściwą  mu  strukturę  i funkcję. 

Łańcuch  główny  ma  znaczną  swobodę  w przybie- 
raniu różnych  postaci  przestrzennych  w roztworze 
wodnym,  gdyż  wiązania  idące  do  węgla  C*  (rys.  3) 
są  nasycone  i pozwalają  na  swobodny  obrót  atomów 
wokół  ich  osi  — w odróżnieniu  od  sztywnego  i płas- 
kiego wiązania  peptydowego  (rys.  4).  Zmienne  kąty 
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H2N  • CH(R1)  • COÓH  \+  HgN  • CH(R2)  • COOH  — — H2N  • CH^}  * CO  * NH  • CH(R2)  • COOH 
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Rys.  3.  Podstawowa  budowa  białka.  Aminokwasy  łączą  się  ze  sobą  w łańcuch  w reakcji  polegającej  na  wydzieleniu  1 cząsteczki  wody 
z grupy  karboksylowej  jednego  aminokwasu  i grupy  aminowej  następnego  (wzór  w formie  skróconej  na  górze) . W powstającym  łańcuchu 
znikają  grupy  aminowe  i karboksylowe  przy  C*  z wyjątkiem  grupy  aminowej  pierwszego  aminokwasu  (tzw.  koniec  aminowy  lub  ko- 
niec N łańcucha)  i grupy  karboksylowej  ostatniego  (koniec  karboksylowy  czyli  koniec  C).  Rysunek  ukazuje  schematycznie  budowę 
związku  utworzonego  przez  7 reszt  aminokwasowych.  W schemacie  tym,  nie  odzwierciedlającym  budowy  przestrzennej  łańcucha  (z  wy- 
jątkiem faktu,  że  łańcuchy  boczne  odchodzą  naprzemiennie  w przeciwne  strony  od  łańcucha  głównego),  zaznaczono:  symbolem  ct 
atomy  C*,  atomy  azotu  (N),  siarki  (S),  tlenu  (O);  puste  duże  kółka  oznaczają  atomy  węgla  (ale  w pierścieniach  aromatycznych  np.  ty- 
rozyny, atomy  węgla  pominięto),  małe  kółka  — atomy  wodoru  (zaznaczone  tylko  na  grupach  skrajnych).  Nazwy  trójliterowe  amino- 
kwasów są  wpisane  dokładnie  pod  C*  danego  aminokwasu.  Związki  zbudowane  z dwu  reszt  aminokwasowych  nazywane  są  dwupep- 
tydami,  z trzech  — trójpeptydami  itd.  Związki  zbudowane  z kilku  do  kilkunastu  aminokwasów  określa  się  ogólnie  jako  oligopeptydy, 
a większe  — jako  polipeptydy.  Pojęcie  „białko”  jest  bardziej  ogólne  i mniej  precyzyjne:  obejmuje  ono  łańcuchy  polipeptydowe  (na  ogół 
dłuższe  niż  100-aminokwasowe)  a także  cząsteczki  zbudowane  z kilku  łańcuchów  polipeptydowych  oraz  polipeptydy  z przyłączonymi 
związkami  nie  mającymi  charakteru  aminokwasów.  Glikoproteidy  np.  są  łańcuchem  polipeptydowym  z przyłączonymi  resztami  cu- 
krowca, w metaloproteidach  zaś  występują  atomy  metalu  jako  integralny  składnik  danego  białka 


torysyjne  przy  O (rys.  5)  nie  mogą  przybierać  takich 
wartości,  które  by  przybliżyły  do  siebie  jakiekolwiek 
atomy,  nie  związane  chemicznie,  na  odległości  mniej- 


Rys.  4.  Wiązanie  pcptydowe.  Wiązanie  pcptydowe  — CO — NH — , 
powstające  przez  kondensację  grupy  karboksylowej  jednego 
aminokwasu  z grupą  aminową  innego  (zob.  rys.  3)  ma  zdeloka- 
lizowanc  elektrony,  tworzące  orbital  molekularny  rozciągający 
się  od  atomu  tlenu  poprzez  atom  węgla  C'  do  atomu  azotu  (ry- 
sunek na  dole).  Jego  skrajne  postacie  pokazuje  rysunek  na  górze. 
Rezonansowa  energia  stabilizacji  wiązania  peptydowego  wynosi 
ok.  88  105  J/mol  (21  kcal/mol)  i stanowi  przeszkodę  dla  obrotu 
atomów  wokół  osi  — C' — N — . W rezultacie,  wszystkie  atomy 
spięte  wiązaniem  peptydowym  znajdują  się  (w  przybliżeniu)  na 
jednej  płaszczyźnie.  Mogą  one  być  w układzie  trans  jak  na  ry- 
sunku dolnym  (atomy  C*  skierowane  w przeciwne  strony)  lub 
cis  (atomy  Ca  skierowane  w tę  samą  stronę).  W białkach  wiązanie 
peptydowe  ma  konfigurację  trans 

sze  niż  suma  ich  promieni  van  der  Waalsa  (->  Chemia 
kwantowa).  Cząsteczka  zaś  jako  całość  osiągnie  mo- 
żliwie najniższy  stan  energetyczny,  a więc  przybierze 
trwałą  konformację  (->  Przedmiot  i problemy  biofi- 
zyki molekularnej),  gdy  pomiędzy  możliwie  najwięk- 


szą liczbą  grup  — CO  i — NH  (jedynych  reaktywnych 
grup  w łańcuchu  głównym)  powstaną  wiązania  wo- 
dorowe (rys.  6).  Muszą  one,  ze  względu  na  sztywność 
wiązania  peptydowego,  tworzyć  się  pomiędzy  resztami 
aminokwasów  bardziej  od  siebie  odległymi,  a nie  ty- 
mi, które  są  ze  sobą  połączone  wiązaniem  peptydo- 
wym. Maksymalna  liczba  wiązań  wodorowych  może 
powstać  wtedy,  gdy  łańcuch  polipeptydowy  ma  sy- 


Rys.  5.  Łańcuch  polipeptydowy  — widok  perspektywiczny.  Ry- 
sunek ukazuje  jedną  resztę  aminokwasową  (między  niebieskimi 
kreskami)  i początki  dwu  reszt  sąsiadujących.  Płaszczyzny  wiązań 
peptydowych  zaznaczono  kolorem  niebieskim.  Czarna  gruba 
linia  wytycza  łańcuch  główny,  łańcuchy  boczne  pominięto,  zo- 
stawiając tylko  ich  pierwsze  węgle  (O*).  Atomy  wodoru  (małe 
kółka)  pozostawiono  tylko  przy  atomach  Ca  i N.  Łańcuch  po- 
lipeptydowy na  rysunku  znajduje  się  w postaci  maksymalnie  roz- 
ciągniętej. Zgodnie  z obowiązującą  konwencją,  kąt  torsyjny  wią- 
zania peptydowego  przyjęto  za  180°,  a w maksymalnie  rozciąg- 
niętym łańcuchu  kąty  torsyjne  0 i przyjęto  jako  również  ma- 
jące wartość  180°.  Obrót  płaszczyzn  w kierunku  strzałek  opisuje 
się  jako  wzrost  wartości  kątów  torsyjnych  0 i V 
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Aminokwasy 


Aminokwasy  hydrofobowe,  apolarne 
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Aminokwasy  hydrofilne,  połarnerniezjonizowane 
w warunkach  fizjologicznych 
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Aminokwasy  hydrofilne,  dodatnio  zjonizowane 
w warunkach  fizjologicznych 
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Niektóre  ważniejsze  produkty  potranslacyjnej  ** 
modyfikacji  aminokwasów 
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*Stan  jonizacji  polarnych  aminokwasów  podany  jest  tylko  w przybliżeniu, 
gdyż  w zależności  od  różnych  czynników  jonizacja  może  być  częściowo 
zahamowana  lub  może  się  pojawić. 


**Potranslacyjna  modyfikacja  aminokwasów  jest  wynikiem 
działania  enzymów  na  aminokwas  Już  wbudowany 
do  łańcucha  polipeptydowego:  dwie  cysteiny  po  utlenieniu 
ich  grup-SH  dają  cystynę,  z proliny  powstaje  hydroksypro- 
lina  itd.  Modyfikacji  takich  znanych  jest  kilkadziesiąt. 


metrię  śrubową  (-*  Budowa  kryształów),  a to  dzięki 
temu,  że  obrót  i translacja  kolejnych  reszt  aminokwa- 
sowych  stwarzają  warunki  do  odpowiedniego  zbli- 
żenia odległych  od  siebie  wiązań  peptydowych.  Drugą 
możliwością  osiągnięcia  maksymalnego  wysycenia 
wartościowości  potencjalnych  partnerów  wiązania 
wodorowego  jest  bliskie  ulokowanie  równolegle  uło- 
żonych łańcuchów  polipeptydowych  w postaci  roz- 
prostowanej (stosunki  przestrzenne  między  sąsiadu- 
jącymi w łańcuchu  polipeptydowym  resztami  amino- 
kwasów nazywane  bywają  strukturą  drugorzędową 
białka). 

Istnieje  kilka  teoretycznie  możliwych  struktur  łań- 
cucha polipeptydowego  o symetrii  śrubowej,  tj.  da- 
jących w efekcie  cząsteczkę  o kształcie  określanym 
prawoskręt-  jako  heliks.  W białkach  wykryto  tylko  heliksy  pra- 
ne a-heliksy  woskrętne,  należące  do  rodziny  zwanej  strukturami 
a (rys.  7).  Ponieważ  duże  wymiary  atomu  tlenu 
w grupie  — CO  bardzo  ograniczają  możliwości  uzwo- 
jenia łańcucha  głównego,  struktury  a mogą  mieć 


w jednym  całkowitym  zwoju  tylko  od  ok.  2 do  pra- 
wie 5 reszt  aminokwasowych.  Wiązania  wodorowe 
w nich  mogą  łączyć  odpowiednio  grupę  — CO  każ- 
dego wiązania  peptydowego  z grupą  — NH  trzeciego, 
czwartego,  piątego  lub  szóstego  aminokwasu.  Struk- 
tury a różnią  się  między  sobą  nie  tylko  liczbą  reszt 
aminokwasowych  w jednym  zwoju,  ale  także  pochy- 
leniem uzwojenia,  a to  sprawia,  że  w niektórych 
heliksach  wiązania  wodorowe  są  dosyć  naprężone 
i mało  trwałe.  Najbardziej  korzystne  warunki  do 
utworzenia  wiązań  wodorowych  pojawiają  się  w 
a-heliksie  (rys.  7b)  i on  też  najczęściej  bywa  obserwo- 
wany w białkach  (a  przynajmniej  tych,  które  zbadano 
krystalograficznie);  a-heliks  w białkach  często  zakoń- 
czony jest  krótkim  odcinkiem  310-heliksu  (rys.  7a). 
Lewoskrętnych  struktur  a w białkach  nie  wykryto. 
Występowanie  ich  jest  mało  prawdopodobne,  gdyż 
asymetrycznie  ulokowany  w L-a-aminokwasach  łań- 
cuch boczny  stanowi  przeszkodę  do  swobodnego 
uzwajania  się  łańcucha  w lewo.  Lustrzanym  odbiciem 
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0,17  nm 


0,1  nm 


Rys.  6.  Wiązanie  wodorowe.  Wiązanie  wodorowe  tworzy  atom 
wodoru,  znajdujący  się  między  dwoma  silnie  elektroujemnymi 
atomami.  W białkach  wiąże  ono  najczęściej  atomy  tlenu,  azotu 
i siarki  w rozmaitych  kombinacjach.  Na  rysunku  przedstawiono 
wiązanie  wodorowe  między  dwoma  atomami  tlenu,  z których 
znajdujący  się  po  lewej  stronie  nazywany  jest  donorem,  a po  pra- 
wej — akceptorem  wodoru.  Przy  akceptorze  zaznaczono  gęstości 
elektronowe  na  niebiesko,  a skala  odległości  podana  jest  pod  ry- 
sunkiem. Znaczenie  wiązania  wodorowego  dla  białek  polega  na 
tym,  że  działa  ono  na  stosunkowo  dużą  odległość  (0,25-0,30  nm) 
i jest  dosyć  silne  (1-3  -104  J/mol).  Istnienie  wiązania  wodorowego 
uzależnione  jest  od  odpowiedniego  zbliżenia  donora  i akceptora, 
ale  także  od  stanu  środowiska.  Przy  zmianie  jego  przenikalności 
elektrycznej,  kwasoty  i in.,  wiązanie  wodorowe  może  pęknąć  lub 
powstać,  co  wpływa  na  strukturę  białka  i uzależnia  ją  w ten  spo- 
sób od  zjawisk  chemicznych  zachodzących  w środowisku 


„plisowane  arkusze”;  rys.  9)  o bardzo  regularnym  struktury/? 
rozmieszczeniu  łańcuchów  bocznych.  W białkach 
mogą  one  mieć  nawet  bardzo  duże  rozmiary  (rys.  10) 
i wtedy  cały  arkusz  wykazuje  lekkie  skręcenie  płasz- 
czyzny w prawo,  a całość  struktury  układa  się  w 
kształt  zbliżony  do  cylindrycznego  (tzw.  /5-baryłka). 

Mniejsze  lub  większe  struktury  £ występują  we  wszy- 
stkich białkach  i odgrywają  w nich  szczególnie  ważną 
rolę.  Są  one  bowiem  znacznie  bardziej  sztywne  niż 
struktury  helikalne,  nadają  więc  białkom  dobre  wła- 
ściwości mechaniczne,  a jednocześnie  mogą  zape- 
wnić aminokwasom  o decydującym  znaczeniu,  np. 
w centrach  katalitycznych,  precyzyjnie  ustaloną  po- 
zycję. Struktury  helikalne  — w odróżnieniu  od  struk- 
tur — mają  charakter  bardziej  sprężysty,  ponieważ 
stabilizowane  są  wiązaniami  wodorowymi,  dosyć  od- 
pornymi na  rozciąganie  i tolerującymi  pewne  zmiany 
w położeniu  tworzących  je  partnerów.  Dlatego  to 
struktury  helikalne  odgrywają  dużą  rolę  w formo- 
waniu przestrzennego  kształtu  cząsteczki  białka  po 
zakończeniu  syntezy  łańcucha  polipeptydowego, 
a ostatecznej  cząsteczce  zapewniają  ruchliwość  kon- 
formacyjną,  dynamiczne  zmiany  stosunków  prze- 


Rys.  7.  Struktury  helikalne  w biał- 
kach — modele  atomowe  struktury 
3J0-heliksu  i a-heliksu.  Taśmą  nie- 
bieską zaznaczono  wyidealizowany 
przebieg  heliksu,  a grubą  kreską  — 
aktualny  układ  jego  łańcucha  głów- 
nego. Atomy  C*  są  zakropkowane, 
symbolami  N i O oznaczono  atomy 
azotu  i tlenu  wiązań  peptydowych, 
między  którymi  powstają  wiązania 
wodorowe  (kreski  przerywane).  Obie 
struktury  należą  do  struktur  a,  które 
opisuje  wzór: 


I | 

— C— {NH  • CH(R)  • COJn — N — ; 
n oznacza  liczbę  reszt  aminokwaso- 
wych  zamkniętych  w pętlę  wiąza- 
niem wodorowym,  w 1 pętli  zatem 
znajduje  się  3/i+4  atomów.  Struk- 
turę a wystarczająco  opisują  dwie 
liczby,  określające  liczbę  reszt  w jed- 
nym zwoju  i liczbę  atomów  w jednej 
pętli.  Np.  310-he!iks  ma  3 reszty  a- 
minokwasowe  w zwoju  i 10  atomów 
w pętli ; heliks  tradycyjnie  nazywany 
a-heliksem  ma  formalną  nazwę 
3,613-heliks.  a-heliks  ma  bardzo 
mało  zdeformowane  wiązania  wo- 
dorowe i on  to  głównie  występuje 
w białkach,  czasem  będąc  zakoń- 
czony krótkim  310-heliksem 


a -heliks 


struktury 

helikalne 


310-heliks 


prawoskrętnych  heliksów  zbudowanych  z L-a-ami- 
nokwasów  są  lewoskrętne  heliksy  zbudowane  z D-a- 
-aminokwasów,  a te  nie  są  w przyrodzie  ziemskiej 
do  tworzenia  białek  wykorzystywane. 

Drugą  regularną,  termodynamicznie  stabilną  kon- 
formacją łańcucha  polipeptydowego  są  struktury  £ 
(rys.  8).  Łańcuchy  polipeptydowe  są  w nich  prawie 
maksymalnie  rozprostowane,  ułożone  w stosunku  do 
siebie  równolegle  lub  przeciwrównolegle  i połączone 
wiązaniami  wodorowymi.  Mają  one  charakter  płas- 
kich, lekko  pofałdowanych  arkuszy  (stąd  ich  nazwa 


strzennych  między  różnymi  odcinkami  łańcucha  poli- 
peptydowego (— ► Przedmiot  i problemy  biofizyki 
molekularnej). 

W niektórych  białkach,  zwanych  fibrylarnymi,  czyli  białka 
włókienkowymi,  dominuje  regularna  konformacja  fibry larne 
(a  lub  jS)  większej  części  czy  nawet  całego  ich  łańcucha 
polipeptydowego.  Cząsteczka  białka  fibrylamego  ma 
wówczas  kształt  bardzo  wydłużony,  jak  np.  w biał- 
kach podporowych,  stanowiących  osnowę  zrębu 
strukturalnego  organizmów  wyższych  (np.  kolagen). 

Większość  jednak  białek  ma  cząsteczkę  o kształcie 
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Rys.  8.  Struktury  fi.  Prawic  rozprostowane  łańcuchy  polipepty- 
dowc  (odrębne  łańcuchy  lub  odcinki  tego  samego  łańcucha) 
mogą  wytworzyć  między  sobą  sieć  wiązań  wodorowych,  utrzy- 
mujących ich  układ  przestrzenny.  Na  rysunku  pokazano  wzory 
chemiczne  struktur  fi  o równoległym  lub  przeciwrównoległym 
przebiegu  łańcucha  (kierunek  określa  pozycja  jego  końca  N ). 
W układzie  przeciwrównoległym,  który  w białkach  występuje 
częściej,  wiązania  wodorowe  są  mniej  zdeformowane  niż  w ukła- 
dzie równoległym 


hiafka  zbliżonym  do  kulistego.  W białkach  takich,  określa- 
globularne  nych  jako  globularne,  konformacja  łańcucha  poli- 
peptydowego  jest  mieszana:  krótsze  lub  dłuższe  od- 
cinki o konformacji  a lub  p połączone  są  odcinkami 
o konformacji  nieregularnej  (stosunki  przestrzenne 
między  odcinkami  łańcucha  polipeptydowego  nazy- 
wane bywają  strukturą  trzeciorzędową  białka).  Me- 
chanizmy, które  kierują  części  łańcucha  polipepty- 
dowego ku  określonej  konformacji  nie  zostały  jeszcze 
dobrze  poznane  (— > Przedmiot  i problemy  biofizyki 
molekularnej),  dwa  jednak  czynniki  mają  szczególnie 
duże  znaczenie:  zróżnicowane  powinowactwo  amino- 
kwasów do  wody  oraz  rozmaitość  własności  chemicz- 
nych łańcuchów  bocznych. 

Grupy  polarne,  znajdujące  się  w łańcuchach  bocz- 
nych aminokwasów  hydrofitowych  (np.  — OH, 
— COOH;  tabela),  wiążą  cząsteczki  wody  i stąd  ich 


728 


termodynamicznie  faworyzowaną  pozycją  w czą- 
steczce białka  jest  ta,  która  im  zapewnia  dobry  kon- 
takt z wodą.  Odwrotnie  się  zachowują  węglowodo- 
rowe łańcuchy  boczne  aminokwasów  hydrofobo- 
wych: w środowisku  wodnym  otaczają  się  one  pa- 
rakrystaliczną  siatką  cząsteczek  wody,  co  powoduje 
spadek  entropii  wody  i wzrost  swobodnej  energii 
układu.  Układ  więc  dąży  do  maksymalnego  zmniej- 
szenia kontaktów  między  wodą  a apolarnymi  łań- 
cuchami bocznymi,  co  osiąga  przez  wydzielenie  ich 
w postaci  bezwodnych  skupień.  Przeciętny  łańcuch 
apolarny  aminokwasu  hydrofobowego  w skupieniach 
tych  zyskuje  ok.  17  kJ/moI  (4  kcal/mol)  swobodnej 
energii  stabilizacji,  głównie  kosztem  entropii  wody, 
której  cząsteczki  odzyskują  swobodę  przyjęcia  mniej 
uporządkowanego  rozmieszczenia.  W rezultacie  — 
cząsteczka  przybiera  kształt  „kropli  oliwy  w wodzie”: 
aminokwasy  polarne  lokują  się  na  powierzchni  w 
kontakcie  z wodą,  aminokwasy  apolarne  zaś  tworzą 
bezwodne,  silnie  skupione  wnętrze,  mające  bardziej 
charakter  ciała  stałego  niż  roztworu,  gdyż  upakowa- 
nie atomów  może  w nim  wynosić  do  75%  dostępnej 
przestrzeni. 

Na  ostateczne  ukształtowanie  przestrzenne  czą- 
steczki białka  szczególnie  duży  wpływ  mają  niektóre 
aminokwasy.  Prolina  np.  nie  może  być  ulokowana 
w prawoskrętnej  strukturze  a (ale  może  — w lewo- 
skrętnym  heliksie,  jak  np.  w kolagenie,  o czym  niżej) 
ze  względu  na  odmienną  niż  w innych  aminokwasach 
konfigurację  atomów  przy  węglu  C*.  Tworzący  się 
prawoskrętny  heliks  musi  ulec  przerwaniu  w miejscu, 
w którym  występuje  prolina,  i może  ponownie  po- 
wstać po  kilku  aminokwasach,  które  na  ogół  pozo- 
stają w konformacji  nieregularnej.  Występowanie 
takich  krótkich  nieregularnych  odcinków  za  proliną 
często  sprawiają,  że  następny  odcinek  helikalny  ma 
zupełnie  inny  kierunek  niż  poprzedni.  Aminokwasy 
o polarnych,  lecz  nie  zjonizowanych  grupach  w łań- 
cuchach bocznych,  np.  seryna,  asparagina  (tabela) 


aminokwasy 
hydrofitowe 
i hydrofo- 
bowe 


wpływ  pro- 
liny  na 
strwkturę 


Rys.  9.  Struktura  fi  układająca  się  tak  jak  pofałdowany  (pliso- 
wany) arkusz.  Łańcuchy  polipetydowe  w strukturach  fi  nic  są 
całkowicie  rozprostowane,  tj.  ich  kąty  torsyjne  <P  i (zob. 
rys.  5)  odbiegają  nieco  od  wartości  180°  (np.  w strukturze  przc- 
ciwrównoległej  = -140°,  a = 135°).  W rezułtacie  płasz- 
czyzna ograniczona  przez  łańcuch  główny  wykazuje  regularne 
załamania.  Wiązania  wodorowe  między  łańcuchami  (linie  prze- 
rywane) pozwalają  na  wytworzenie  bardzo  rozległych  arkuszy 
struktury  fi.  Łańcuchy  boczne  R skierowane  są  naprzemiennie 
w górę  i w dół  od  płaszczyzny  arkusza.  Na  rysunku  pokazano 
tylko  atomy  C®,  atom  wodoru  przy  C oraz  pierwszy  atom  łań- 
cucha bocznego  R.  Płaszczyzny  arkusza  struktury  wykazują  ten- 
dencję do  lekkiego  skrętu  w prawo  (nie  zaznaczoną  na  rysunku), 
co  czasem  prowadzi  do  powstania  tzw.  ^-baryłki  (zob.  rys.  10) 

utrudniają  tworzenie  regularnych  konformacji,  gdyż 
między  ich  grupami  polarnymi  a grupami  — CO 
czy  — NH  łańcucha  głównego  mogą  powstać  wiąza- 
nia wodorowe,  utrudniające  wytworzenie  wiązań  wo- 
dorowych potrzebnych  do  stabilizacji  struktury  a 
czy  p.  Jednocześnie  jednak  takie  wiązanie  wodorowe 
między  łańcuchem  bocznym  aminokwasu  a łańcu- 
chem głównym  utrwala  zwrot  łańcucha  głównego 
o ok.  180°  (zwany  zwrotem  p lub  zwrotem  typu 
szpilki  do  włosów)  i umożliwia  zapoczątkowanie 
struktury  p.  Całość  struktury  białka  stabilizowana  wiązania 
jest  rozmaitymi  wiązaniami,  wśród  których  szczegół-  stabilizujące 
nie  dużą  rolę  odgrywają  silne,  kowalencyjne  wiązania  strukturę 


wiązanie 


Rys.  10.  Topologia  struktur/?  — struktury/?  kilku  spośród  wielu  zbadanych  krystalograficznie  białek.  Grube  proste  strzałki  obrazują 
przebieg  łańcucha  głównego  polipeptydu,  znajdującego  się  w płaszczyźnie  struktury  (płaszczyzna  papieru),  a połączenia  między  odcinka- 
mi łańcucha  głównego  przedstawiają  linie  cienkie  pojedyncze  — jeżeli  przebiegają  pod  płaszczyzną  struktury  /?  i kreską  podwójną  — jeżeli 
przebiegają  nad  płaszczyzną.  W strukturach  fi  występują  dwa  rodzaje  połączeń:  łańcuch  polipeptydowy  może  opuścić  płaszczyznę  struk- 
tury fi  i powrócić  na  nią  z tej  samej  strony  (zwrot  typu  „szpilki  do  włosów”)  lub  też  powraca  ze  strony  przeciwnej  („przekrzyżowanie”). 
W rysunkach  górnych  nie  uwzględniono  ani  długości  ani  ich  konformacji.  Najmniejsze  struktury  fi  zbudowane  są  z łańcuchów  o prze- 
biegu przeciwrównoległym  (STB!  — inhibitor  enzymów  proteolitycznych  oraz  Liz  — enzym  lizozym),  a układy  równolegle  pojawiają  się 
dopiero  w strukturach  większych  (enzymy:  RNA-za  — rybonukleaza,  chymtr.  — chymotrypsyna,  karbpt.  — karboksypeptydaza,  oraz 
chlorofil  bakteryjny).  Większe  struktury  fi , a zwłaszcza  te,  które  mają  bardzo  regularny  przebieg  i brak  przekrzyżowań.  układają  się  cy- 
lindrycznie, w tzw.  fi  — baryłkę.  Połączenia  między  łańcuchami  w strukturze  /?  często  mają  charakter  helikalny  (rubredoksyna  — metalo- 
proteid  bakteryjny,  prealbumina  — białko  osocza  krwi,  izomeraza  FT  — enzym  przemiany  cukrowcowej) 


— S — S — (tzw.  mostki  dwusiarczkowe)  między  dwie- 
ma resztami  cysteiny  (rys.  11). 

Nie  wszystkie  polarne  reszty  aminokwasów  znajdu- 
ją się  na  powierzchni  i nie  wszystkie  apolarne  we- 
wnątrz cząsteczki  białka.  Tam,  gdzie  pozycja  danego 
aminokwasu  nie  odpowiada  jego  termodynamicznie 
faworyzowanej  lokalizacji,  w cząsteczce  białka  po- 
wstają lokalne  naprężenia,  mimo  że  jako  całość 
może  się  ona  znajdować  w minimum  energetycznym. 
Ma  to  bardzo  duże  znaczenie  dla  funkcji  biologicz- 
nej białka.  Skryte  w hydrofobowym  wnętrzu  grupy 
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dwusiarczkowe  wodorowe 
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Rys.  11.  Niektóre  wiązania  międzyłańcuchowe  w-  białkach.  Dwa 
odcinki  tego  samego  łańcucha  polipeptydowego  (linia  zygzako- 
wata na  niebieskim  tle)  mogą  się  ze  sobą  połączyć  wiązaniem  jo- 
nowym, dwusiarczkowym,  wodorowym  lub  hydrofobowym.  Są 
to  przykłady  najczęściej  w białkach  występujących  wiązań,  słu- 
żących do  stabilizacji  ich  struktury  trzeciorzędowej.  Wzory  reszt 
aminokwasów,  tworzących  dane  wiązanie,  podano  pod  schema- 
tem w skrótach  trójliterowych 


hydrofobowe 

[Val-Val] 


polarne  silniej  oddziałują  elektrostatycznie,  niż  gdyby 
się  znajdowały  w środowisku  wodnym,  mającym  dużą 
przenikalność  elektryczną.  W rezultacie  odgrywają 
one  dużą  rolę  w utrzymywaniu  struktury  przestrzen- 
nej białka  (np.  wtedy,  gdy  wiązanie  wodorowe  jest 
chronione  przez  bezwodne  środowisko),  a także  w jego 
właściwościach  katalitycznych  (gdy  w bezwodnym 
obszarze  wiązania  substratu  znajduje  się  nie  zjoni- 
zowana  grupa  — COOH,  mogąca  katalizować  prze- 
kształcenie kowalencyjne  substratu,  o czym  niżej). 
Apolarne,  lecz  powierzchniowo  ulokowane  łańcuchy 
boczne  dążą  do  uzyskania  bardziej  bezwodnego  oto- 
czenia przez  tworzenie  kompleksów  z innymi  biał- 
kami czy  z substancjami,  znajdującymi  się  w otacza- 
jącym roztworze,  a mającymi  cechy  hydrofobowe. 
Siła  takiego  wiązania  (stała  stabilności  kompleksu) 
uzależniona  jest  od  stopnia  dostosowania  (komple- 
mentarności)  powierzchni  hydrofobowej  białka  do 
substancji  wiązanej  (zwanej  ogólnie  ligandem).  Jest 
to  podłożem  molekularnym  najważniejszej  biologicz- 
nie funkcji  białka  — jego  zdolności  do  rozpoznawania 
swoistych  dla  niego  ligandów  w otoczeniu.  Właści- 
wość ta  jest  podłożem  wybiórczości  w działaniu  bia- 
łek (np.  receptorów,  enzymów,  transporterów),  a tak- 
że możliwości  samoorganizacji  białek  do  wysoko 
spolimeryzowanych  superstruktur  molekularnych. 


Rodzaje  białek 


Białka  — elastyczny  szkielet  organizmów 

Zrąb  organizmów  żywych  tworzy  subtelne  utkanie, 
w skład  którego  wchodzą  białka,  wielocukry,  czasem 
również  lipidy  oraz  krystaliczne  składniki  mineralne 
(np.  kości).  Białka  zwane  podporowymi  lub  struk- 
turalnymi tworzą  osnowę  zrębu : utrzymują  jego  orga- 
nizację, nadają  mu  spoistość  i sprężystość,  w ich 
sieci  ulokowane  są  komórki  produkujące  poszczegól- 
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białka  ne  składniki  zrębu.  Jednakże  rola  białek  struktural- 
strukturalne  nych  nie  jest  tylko  pasywna,  podtrzymująca.  Orga- 
nizm jest  plastyczny,  a w jego  ruchach  białka  struk- 
turalne często  są  składnikiem  czynnym.  Wreszcie  — 
oddziaływanie  białek  strukturalnych  z różnymi  skład- 
nikami ustroju,  lokalnymi  czy  dopływającymi  z krwią, 
sprawia,  że  stanowią  one  istotny  element  w integracji 
organizmu. 

Białka  strukturalne  z reguły  są  białkami  polime- 
rycznymi.  Zbudowane  są  z dużej  liczby  podjednostek, 
połączonych  ze  sobą  głównie  wiązaniami  niekowalen- 
cyjnymi  (często  polimer  jest  dodatkowo  wzmocniony 
wiązaniami  kowalencyjnymi,  np.  mostkami  dwu- 
siarczkowymi).  Utworzenie  polimeru  jest  procesem 
spontanicznym:  podjednostki  (monomery  lub  gdy 
najmniejsza  zdolna  do  samoorganizacji  podjedno- 
stka  nie  jest  pojedynczym  łańcuchem  poiipeptydo- 
wym  — protomery)  łączą  się  ze  sobą  (w  sposób  od- 
wracalny) tak,  że  ostatecznie  utworzona  superstruk- 
tura  molekularna  jako  całość  znajduje  się  w minimum 
energetycznym  i jest  trwała.  Układ  stabilizujących  ją 
wiązań  określa  stosunki  przestrzenne  między  pod- 
jednostkami  (tzw.  strukturę  czwartorzędową  białka), 
a ponieważ  białka  polimeryczne  budowane  są  z iden- 
tycznych lub  prawie  identycznych  podjednostek,  wy- 
kazują wysoką  regularność  swojej  organizacji  wewnę- 
trznej. Budowa  podjednostek  determinuje  zarówno 
budowę  białka  polimerycznego,  jak  jego  funkcję, 
we  wnętrzu  Wewnętrzny  szkielet  komórek  tworzy  siateczka 
komórek  — śródplazmatyczna  (— ► Błony  komórkowe)  oraz  — 
tu  bu  li  na  w komórkach  zawierających  jądro,  roślinnych  i zwie- 
rzęcych — system  delikatnych  rureczek,  zwanych 
mikrotubulami  (il.  114,  tabl.  28).  Mają  one  charakter 
tworów  pojedynczych  lub  podwójnych,  długości  ułam- 
ków mikrometra,  choć  czasem  znacznie  dłuższych. 
W aparacie  ruchowym  komórki,  np.  w witkach  ple- 
mników, mikrotubule  tworzą  precyzyjny  (i  spotykany 
w innych  białkach  strukturalnych)  splot  „9+2” 
(rys.  12),  sprzęgnięty  z cząsteczkami  enzymu,  do- 


Rys.  12.  Aparat  ruchowy  komórki.  Na  powierzchni  wielu  ko- 
mórek znajdują  się  długie  cienkie  wypustki,  będące  w stałym 
ruchu.  Ich  głównym  elementem  strukturalnym  i ruchowym  są 
mikrotubule.  Wypustki  te  stanowią  aparat  ruchowy  komórki, 
np.  witki  plemników,  lub  przesuwają  wzdłuż  powierzchni  ko- 
mórki płyn,  zawiesinę  czy  ciała  obce,  np.  rzęski  (ił.  116,  tabl.  28). 
Rzęski  i witki  mają  podobną  budowę:  dwie  centralne  mikrotu- 
bule pojedyncze  otoczone  są  przez  9 podwójnych  mikrotubuli, 
tworząc  tzw.  splot  „9  + 2”.  Liczne  inne  białka  zapewniają  trwa- 
łość całego  narządu,  a wśród  nich  znajduje  się  również  dyneina, 
enzym  udostępniający  energię,  zawartą  w ATP  (-*■  Organizacja 
procesów  życiowych  komórki)  dla  wykonania  pracy  mechanicz- 
nej. Ruch  rzęski  czy  witki  podobny  jest  do  ruchu  szybko  uderza- 
jącego bata.  Wywołany  on  jest  przez  kolejne  przesuwanie  się 
jednej  połowy  podwójnej  mikrotubuli  wzdłuż  jej  drugiej  połowy, 
która  pozostaje  nieruchoma  (il.  114,  tabl.  28) 


mikrotubula 
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starczającego  energii  koniecznej  do  wykonywania 
pracy  mechanicznej.  Mikrotubula  zbudowana  jest 
z podjednostek,  małego  globularnego  białka  zwanego 
tubuliną  (il.  116,  tabl.  28),  ułożonego  helikalnie  w 
ścianie  mikrotubuli.  Helikalny  układ  podjednostek 
sprawia,  że  dwa  końce  mikrotubuli  różnią  się  od 


trójłancuchowa 
lewoskrętny  he/iks  struktura  kolagenu 

Rys.  13.  Struktura  kolagenu.  Lewoskrętny  heliks  kolagenu  ma 
3 reszty  aminokwasowe  w jednym  zwoju.  Pochylenie  zwojów  jest 
znacznie  większe  niż  w analogicznej  strukturze  a (rys.  7),  w wyni- 
ku czego  łańcuchy  boczne  nie  stanowią  przeszkody  dla  uzwojenia 
w łcwo,  ale  grupy  — CO  i — NH  skierowane  są  na  zewnątrz 
heliksu  i nie  mogą  utworzyć  wewnątrzcząsteczkowych  wiązań 
wodorowych  charakterystycznych  dla  struktur  a.  Lewoskrętny 
heliks  kolagenu  może  być  ustabilizowany  tylko  wtedy,  gdy  trzy 
podobnie  ukształtowane  łańcuchy  polipeptydowe  zbliżą  się  do 
siebie  na  tyle,  by  powstały  między  nimi  wiązania  wodorowe. 
Z prawej  strony  ukazana  jest  trójłancuchowa  struktura  kolagenu 
(rysunek  nie  uwidacznia  tego,  że  struktura  trójłańcuchowa  jest 
jako  całość  lekko  skręcona  prawoskrętnie) 


siebie,  a to  jest  skojarzone  z jej  funkcją  biologiczną: 
mikrotubula  jest  kierunkowskazem  i organizatorem 
procesów  nadających  komórce  jej  anizotropię  — róż- 
nokierunkowość  jej  budowy  i czynności.  Mikrotubule 
formowane  są  w cytoplazmie,  z obfitego  zasobu 
podjednostek  zawsze  tam,  gdzie  ulega  polaryzacji 
struktura  i funkcja  komórki:  przy  wytwarzaniu 
wrzeciona  mitotycznego,  narządów  ruchu  przy  wydłu- 
żaniu ciała  komórki,  przy  sekrecji  enzymów  hormo- 
nów. 

Funkcja  mikrotubuli  jest  bezpośrednio  związana 
z podziałem  komórki  i jej  różnicowaniem  się;  pro- 
cesy te  ulegają  zahamowaniu  przez  różne  czynniki 
(m.in.  farmakologiczne),  które  uniemożliwiają  samo- 
organizację  wolnej  tubuliny  w mikrotubule  (znalazło 
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Rys.  14.  Powstawanie  włókna  kolagenu.  Łańcuchy  polipeptydo- 
we  kolagenu  powstają  na  rybosomach,  następnie  niektóre  reszty 
proliny  są  w nich  przekształcone  w reszty  hydroksyproliny  (ta- 
bela) i do  łańcucha  podstawiane  są  reszty  cukrowe.  Tak  zmody- 
fikowane łańcuchy  łączą  się  ze  sobą  wiązaniami  dwusiarczko- 
wymi  ( — S — ) na  jednym  końcu  w obszarze  tzw.  peptydów  usta- 
lających (faliste  końce).  Struktura  trójłańcuchowa  kolagenu 
ulega  w ten  sposób  stabilizacji  na  długości  ok.  1000  aminokwa- 
sów. Peptydy  ustalające  mające  inny  skład  aminokwasowy  niż 
reszta  łańcucha  (w  której  co  trzecim  aminokwasem  jest  glicyna) 
ulegają  skróceniu  przez  swoisty  enzym,  peptydazę  kolagenu, 
i cała  trójłańcuchowa  struktura  staje  się  zdolna  do  spontanicznej 
polimeryzacji.  Włókno  kolagenu  organizuje  się  w ten  sposób,  że 
wszystkie  cząsteczki  tropokolagenu  układają  się  równolegle 
i w tym  samym  kierunku,  a każda  z nich  jest  w stosunku  do  są- 
siednich przesunięta  o lf4  swojej  długości.  Ta  regularność  budow-y 
znajduje  swój  wyraz  w obrazach  uzyskanych  w mikroskopie 
elektronowym  (powiększenie  100  tys.  razy  — preparat  barwiony 
metalem,  30  tys.  razy  — preparat  napylany  metalem) 


to  zastosowanie  m.in.  w praktyce  przeszczepiania 
tkanek).  Mikrotubulc  występują  wyłącznie  u orga- 
nizmów posiadających  jądra  komórkowe  (brak  ich 
u bakterii);  u wszystkich  tych  organizmów  skład 
aminokwasowy  tubuliny  oraz  forma  i funkcja  mikro- 
tubuli  są  jednakowe.  Wskazuje  to,  że  tubulina  po- 
wstała jako  białko  o decydującym  znaczeniu  dla 
przekształcenia  się  organizmów  prostych,  bezjądrza- 
stych,  w organizmy  wyższe,  jądrzaste  i wielokomór- 
kowe. Geny  kontrolujące  syntezę  tubuliny  są  zapewne 
produktem  szczególnie  starannej  selekcji,  gdyż  jak 
się  wydaje,  przetrwały  bez  istotnych  zmian  ponad 
miliard  lat. 

między  ko-  Międzykomórkowy  zrąb  strukturalny  organizmów 
morkami — zwierzęcych  tworzy  kolagen,  białko  stanowiące  do 

kolagen  30%  masy  wszystkich  białek  ich  ustroju.  Długie,  silne 
i dosyć  sztywne  włókna  kolagenowe,  związane 
z substancją  podstawową  (z  białkami,  wielocukrami, 
materiałem  mineralnym),  są  osnową  wszystkich  ro- 
dzajów tkanki  łącznej  — kości,  chrząstek,  skóry  itd. 
Uniwersalne  znaczenie  kolagenu  dla  budowy  ciała 
zwierząt,  w zestawieniu  z jego  nie  spotykaną  w innych 
białkach  konformacją  (rys.  13),  wskazuje,  że  jest 
on  wynikiem  szczególnie  surowej  presji  selekcyjnej. 
Z tym  też  zapewne  jest  związany  niezwykle  złożony 
proces  formowania  włókna  kolagenowego,  w którym 
potranslacyjna  modyfikacja  łańcucha  polipepty- 
dowego  (modyfikacja  chemiczna  aminokwasów, 
zachodząca  po  zakończeniu  jego  biosyntezy)  odgrywa 
istotną  rolę. 

Włókno  kolagenowe  powstaje  spontanicznie  z pro- 
tomerów  tropokolagenu  (rys.  14),  jednakże  uformo- 
wanie tych  zdolnych  do  samoorganizacji  podjedno- 
stek  wymaga  działania  szeregu  enzymów,  mogących 
rozpoznać  wybrane  odcinki  sekwencji  aminokwaso- 
wej  w pierwotnie  syntetyzowanym  łańcuchu  polipep- 
tydowym.  Najpierw  niektóre  reszty  proliny  zostają 
przekształcone  w reszty  hydroksyproliny,  co  ułatwia 
lewoskrętne  uzwojenie  heliksu  (il.  114,  tabl.  28).  Kon- 
formacja ta  jest  jednak  nietrwała  i jej  powstanie 
byłoby  mało  prawdopodobne,  gdyby  końce  trzech 
łańcuchów  nie  zostały  połączone  ze  sobą  (w  obszarze 
tzw.  peptydów  ustalających;  rys.  14).  Wtedy  dopiero 
całemu  zespołowi  zostaje  nadany  zwijający  go  ruch 
obrotowy  (podobny  do  przędzenia  na  kołowrotku) 

0 nieznanym  mechanizmie,  ale  zapewne  przy  jednym 
końcu  ustabilizowanym,  i drugim  — ruchomym. 
Wreszcie  — peptydy  ustalające  są  odcinane  (przez 
następny  swoisty  enzym,  rozpoznający  ich  sekwencję) 

1 gotowy  tropokolagen  wydalany  jest  z komórki. 
W przestrzeni  pozakomórkowej  tropokolagen  spon- 
tanicznie polimeryzuje  (rys.  14)  w sposób  analogiczny 
do  tego,  jakim  się  posługuje  powroźnik  przy  splataniu 
liny:  ciągłość  całej  struktury  zapewnia  niewielkie 
przesunięcie  poszczególnych  jej  elementów  składo- 
wych w stosunku  do  siebie.  Samoorganizacja  włókna 
dokonuje  się  z ogromną  precyzją:  każda  cząsteczka 
tropokolagenu  jest  przesunięta  dokładnie  o 234+3 
aminokwasy  w stosunku  do  sąsiedniej.  To  drugie,  po- 
zornie mało  prawdopodobne  zdarzenie  w formowaniu 
włókna  kolagenowego  umożliwione  jest  przez  szcze- 
gólną sekwencję  jego  łańcucha : cząsteczki  tropokola- 
genu są  właśnie  o tyle  przesunięte,  że  wytwarza  się 
między  nimi  maksymalna  ilość  wiązań  niekowalencyj- 
nych,  a także  powstają  wiązania  kowalencyjne  między 
wcześniej  odpowiednio  zmodyfikowanymi  resztami 
lizyny. 

osłony  Osłony  zewnętrzne  organizmów  zwierzęcych  speł- 
zewnętrzne  niają  ważne,  lecz  mało  skomplikowane  zadania. 

Mają  one  też  dość  prostą  budowę,  nadającą  im  wy- 
różniające się  własności  mechaniczne  i znaczną  na 
ogół  odporność  na  czynniki  środowiskowe.  Ich  łań- 
cuch polipeptydowy  w całości  lub  w znacznej  części 
ma  jednolitą  konformację  — albo  strukturę  a,  albo 
strukturę  /?. 

jedwab  Przykładem  białka  osłonowego  o strukturze  jest 
jedwab,  z którego  stawonogi,  a głównie  owady  i pa- 
jęczaki budują  oprząd  i gniazda  oraz  tworzą  instru- 
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ment  lokomocyjny  — pajęczynę.  Elementem  nośnym 
włókna  jedwabiu  jest  fibroina,  białko  zbudowane 
z fałdowanych  arkuszy  o przeciwrównoległej  konfor- 
macji. W łańcuchu  polipeptydowym  fibroiny  na  dłu- 
gich odcinkach  występują  powtarzające  się  sekwencje 
(Gly-Ser-Gli-Ala-Gly-Ala)n.  Włókno  jedwabiu  utwo- 
rzone jest  z wielu  takich  arkuszy  nałożonych  na  siebie 
(i  wtopionych  w serycynę  — białko  o nieregularnej 
konformacji,  zwane  klejem  jedwabnym).  W rezulta- 
cie— we  włóknie  występują  regularne  zgrupowania 
łańcuchów  bocznych  glicyny  i alaniny  (rys.  15) 


siebie  pofałdowane  („plisowane”)  arkusze  fibroiny  (struktura  fi), 
model  otrzymany  na  podstawie  badań  krystalograficznych.  Re- 
gularne rozmieszczenie  powtarzających  się  wzdłuż  łańcucha 
głównego  reszt  — alaniny  (A)  i glicyny  (G)  — prowadzi  do  utwo- 
rzenia krystalicznej  struktury  białkowej 

0 charakterze  krystalicznym ; zgrupow-ania  te  nadają 
mu  miękkość  i giętkość  oraz  typowy  dla  jedwabiu 
piękny  połysk. 

Tam,  gdzie  sprężystość  ma  być  główną  cechą  ma- 
teriału osłonowego,  budowany  jest  on  z elastycznych 
a-heliksów.  Sposób  jednak,  w jaki  się  formuje  super- 
struktura  molekularna  o konformacji  a,  nadaje  jej  a-keratyna 
również  i inne  pożądane  cechy,  a zwłaszcza  odpor- 
ność na  zerwanie,  jak  to  ilustruje  przykład  a-keratyny 
(rys.  16).  Na  najniższym  szczeblu  samoorganizacji 
powstaje  protomer  (protofibryla,  rys.  16a),  będący 
superheliksem  trój  łańcuchowym  o splocie  liny.  Na 
szczeblu  następnym  protofibryle  asocjują  do  splotu 
„9+2”  (rys.  10),  konstrukcją  bardziej  podobnego  do 
kabla  niż  liny  i odpowiednio  silniejszego.  Dalsza  zaś 
organizacja  a-keratyny  zachodzi  dopiero  pod  wpły- 
wem potranslacyjnej  modyfikacji  jej  łańcucha  poli- 
peptydowego : reszty  cysteiny  utleniane  są  do  cystyn 

1 tworzą  mostki  dwusiarczkowe,  wzmacniające  heliksy 
wzdłuż  i łączące  je  poprzecznie  ze  sobą  i z substancją 
podstawową,  białkiem  bogatym  w cysteinę,  ale  nie 
mającym  regularnej  konformacji.  Włókno  keratyno- 
we  staje  się  w ten  sposób  odporne  na  zerwanie,  pozo- 
staje giętkie  i elastyczne,  natomiast  przy  bardzo 
dużej  ilości  mostków  dwusiarczkowych  jest  twarde, 
jak  na  przykład  w rogach,  kopytach  i paznokciach. 

We  wszystkich  białkach  strukturalnych  ogólna  za- 
sada ich  tworzenia  się  jest  jednakowa : spontaniczna 
polimeryzacja  podjednostek  do  wielkiej  superstruk- 
tury  molekularnej.  Znajduje  też  ona  zastosowanie 
w konstruowaniu  wielu  innych  białek,  np.  enzymów 
oligomerycznych  oraz  wirusów. 

Powstaje  pytanie,  dlaczego  przyroda  wybrała  ten  dlaczego 
sposób  konstruowania  białek  zamiast  syntetyzować  samoor- 
od  razu  jeden  bardzo  długi  łańcuch  polipeptydowy,  ganizacja? 
który  by  przecież  mógł  spełniać  identyczną  funkcję. 

Jedną  z przyczyn  jest  niewątpliwie  ogólna  tendencja 
ewolucji  do  maksymalnie  oszczędnego  gospodarowa- 
nia materiałem  genetycznym:  znacznie  mniej  DNA 
potrzeba  do  zakodowania  małej  podjednostki  i wbu- 
dowania w nią  wszystkich  potrzebnych  do  samoorga- 
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Rys.  16.  Włos:  a)  Przejście  od  pierwotnie  syntetyzowanego  łańcucha  polipeptydowego  poprzez  kolejne  stadia  organizacji  cząsteczek  do 
dojrzałego  włosa,  b)  Fotografia  włosa  ludzkiego  (powiększenie  ok.  300  razy,  mikroskop  elektronowy-  skanningowy)  wyłaniającego  się 
z mieszka  skórnego.  Widoczna  jest  zewnętrzna  powłoka  włosa,  utworzona  przez  ułożone  jak  łuska  rybia  płaskie  komórki  (obfitujące  w 
keratynę),  oraz  złuszczające  się,  też  bogate  w keratynę,  komórki  naskórka  (zaznaczone  strzałkami) 


pojawi  się  w łańcuchu  składającym  się  z wielu  tysięcy 
aminokwasów,  natomiast  krótkie  podjednostki  będą 
w znacznej  części  od  błędu  wolne.  Co  więcej  — pod- 
jednostka  z defektem  może  być  łatwo  pominięta  przy 
tworzeniu  superstruktury,  podczas  gdy  wycięcie  błęd- 
nego odcinka  sekwencji  wymaga  istnienia  aparatu, 
który  może  go  rozpoznać,  i enzymów  rozszczepiają- 
cych wiązania  peptydowe.  Wreszcie  — niekowalencyj- 
ny  sposób  łączenia  ze  sobą  podjednostek  sprawia,  że 
superstruktura  — przynajmniej  zanim  zostanie  usta- 
bilizowana wiązaniami  kowalencyjnymi  — jest  agre- 
gatem odwracalnym  i jej  powstawanie  staje  się  zależne 
od  aktualnego  stężenia  podjednostek,  co  umożliwia 
lepszą  kontrolę  procesu  samoorganizacji  i uzależnia 
go  od  różnych  czynników  ustrojowych. 


Białka  — narzędzia  transportu 

Złożony  układ  błon  selektywnie  przepuszczalnych 
sprawia,  że  wymiana  substancji  z otoczeniem  i ich 
wewnętrzne  przemieszczanie  w organizmach  żywych 
nie  zachodzi  przez  swobodną  dyfuzję,  ale  prawie  wy- 
łącznie przy  udziale  białek  transportowych.  Białka  te 
ułatwiają  przenoszenie  związków  nierozpuszczalnych, 
np.  tłuszczowców,  przyspieszają  zgodną  z różnicą 
stężeń  wędrówkę  związków  rozpuszczalnych,  np.  tlenu 
z płuc  do  tkanek,  i umożliwiają  ich  przenikanie 
wbrew  różnicy  stężeń,  np.  jonów  nieorganicznych 
przez  błony  komórkowe;  często  też  stanowią  one 
magazyn  substancji  drobnocząsteczkowych,  z którego 
komórka  czerpie  w miarę  potrzeby  (->  Organizacja 
procesów  życiowych  komórki ; zob.  też  Błony  komór- 
kowe). 

Funkcja  biologiczna  białka  transportowego  została 
wykształcona  przez  wytworzenie  w nim  swoistej  po- 
wierzchniowej konfiguracji  aminokwasów,  służącej 
za  centrum  wiązania  ligandu.  Centrum  to  determinuje 
wybiórczość  transportu  albo  bezpośrednio,  wiążąc 
ligandy  o pasującej  do  niego  konfiguracji,  albo  po- 
średnio— wiążąc  tzw.  grupę  prostetyczną,  związek 
niebiałkowy,  a często  atom  metalu,  stanowiący  właś- 
ciwe miejsce  przyłączania  ligandu.  Ligand  jest  wią- 
zany niekowalencyjnie,  tak  że  w jego  wysokich  stę- 
żeniach równowaga  reakcji  przesunięta  jest  na  stronę 
kompleksu  ligand-białko,  a w niskich  — ligand  się 
odłącza  (oddysocjowuje)  i białko  może  ponownie 
służyć  za  transporter. 


nizacji  wskazówek  niż  do  zakodowania  olbrzymiego 
łańcucha  polipeptydowego.  Maleje  także  szansa  błę- 
du, jeżeli  wynosi  ona  np.  1 0~3  na  1 aminokwas,  to  błąd 
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Przykładem  prostego  białka  transportowego  jest 
mioglobina  (rys.  17),  stanowiąca  magazyn  tlenu  w 
tkance  mięśniowej.  Zbudowana  jest  ona  z białka 
zwanego  globiną  i z tkwiącej  w kieszonce  globiny 
grupy  prostetycznej  — hemu.  Atom  żelaza  w hemie 
wiąże  tlen,  a funkcją  globiny  jest  utrzymanie  żelaza 
w stanie  dwuwartościowym  w czasie  tej  reakcji 


mioglobina 


(reakcja  odłączenia  elektronu  od  żelaza  ma  podwyż- 
szoną energię  aktywacji  w wyniku  hydrofobowego 
otoczenia  hemu).  Na  jedną  globinę  w mioglobinie 


hemoglobina  (podjednostka) 


Rys.  17.  Mioglobina  i hemoglobina : a)  budowa  mioglobiny,  b)  budowa  jednej  podjednostki  hemoglobiny  (jej  cala,  złożona  z 4 pod  jedno- 
stek cząsteczka  zob.  rys.  19).  Mioglobina  jest  białkiem  przenoszącym  tlen  z krwi  do  mięśni.  Hemoglobina  wykształciła  się  w toku  ewo- 
lucji z mioglobiny  jako  białko  transportujące  tlen  z płuc  do  tkanek.  Mioglobina  i podjednostki  hemoglobiny  zbudowane  są  z ok.  150 
aminokwasów,  a ich  łańcuch  polipeptydowy  w ok.  80%  jest  w konformacji  a-heliksu.  Zarys  przebiegu  łańcucha  w mioglobinie  pokazany 
jest  podwójną  przerywaną  limą,  w hemoglobinie  nieco  dokładniej,  z zaznaczonymi  atomami  C®.  Zarys  struktury  trzeciorzędowej  pokaza- 
ny niebieskim  koiorem,  wskazuje  na  daleko  idące  podobieństwo  tych  dwu  białek.  Odcinki  helikalne  oznaczone  są  literami  A,  B,  ...  (gruba 
przerywana  linia  na  rys.  a oznacza  oś  hehksu),  a odcinki  nieregularne,  łączące  beliksy.  dwiema  literami,  np.  EF  — między  helrksem  E i F 
Koniec  N cząsteczki  znajduje  się  przed  hcliksem  A (NA),  koniec  C — za  hełiksem  H (HC).  W kieszonce  uformowanej  przez  łańcuch  po- 
Iipcptydowy  znajduje  się  hem,  związek  zelazoorganiczny  (żełazoporfiryna  z centralnym  atomem  żelaza  — kulką  — i czterema  sprzężonymi 
pierścieniami  pięcioatomowyirn,  zob.  wzór  w kieszonce  hemoglobiny;  na  modelu  mioglobiny  hem  jest  zaznaczony  schematycznie).  Do 
hemu  jest  przyłączany  tlen  molekularny  Ot.  Atom  żelaza  hemu  jest  związany  koordynacyjnie  z óligandami,  dostarczającymi  po  jednej  pa- 
rzf  «urC^?^oCJ  d° jeg?  ?rt>Jtai‘  Cztery  z nich  pochodzą  z pierścieni  organicznych  (pyrolowych)  porfiryny,  jedna  z histydyny  tzw.  bliskiej, 
z hehksu  F (F8  na  modelu  hemoglobiny  i wzór  wpisany  w model  mioglobiny).  Szósta  para  elektronowa  w mioglobinie  pochodzi  z czą- 
steczki wody  (W),  skoordynowanej  z drugiej  strony  z histydyną  z heliksa  E (histydyna  „daleka”).  W hemoglobinie  w obecności  tlenu 
szósta  wartościowość  koordynacyjna  pozostaje  jak  się  zdaje  niewysycona;  w obecności  tlenu  molekularnego  02  para  elektronowa  do- 
starczana jest  przez  tlen.  W mioglobinie  tlen  molekularny  wchodzi  na  miejsce  wody.  Otoczenie  hemu  jest  hydrofobowe,  co  — wraz  ze 
sposobem  wiązania  hemu  z łańcuchem  polij>eptydowym  — zapewnia  to,  że  wiązanie  tlenu  przez  żelazo  nie  doprowadza  do  utlenienia 
zclaza  dwuwartosciowego  na  trójwartościowe,  a to  jest  warunkiem  spełniania  przez  hemoglobinę  i mioglobinę  ich  funkcji  transportowych 


krew  żylna  krew  tętnicza 


Rys.  18.  Wiązanie  tlenu  kooperatywne  i niekooperatywne.  Wy- 
kres pokazuje  zależność  między  ciśnieniem  cząstkowym  tlenu 
a stopniem  wysycenia  tlenem  cząsteczek  hemoglobiny  i mioglo- 
biny. Zależność  ta  jest  hiperbołiczna  (krzywa  m ) w przypadku 
mioglobiny,  która  wiąże  tlen  niekooperatywnie,  i sigmoidalna 
(krzywa  h)  w przypadku  hemoglobiny,  wiążącej  tlen  koopera- 
tywnie.  Wysokie  wysycenie  mioglobiny  tlenem  przy  niskiej  jego 
prężności  pozwala  jej  służyć  jako  magazyn  tlenu  dla  pracującego 
mięśnia  nawet  wtedy,  gdy  hemoglobina  prawie  całkowicie  tlen 
oddysocjowała 


przypada  jeden  atom  żelaza,  tak  że  może  ona  być 
albo  całkowicie  tlenem  wysycona,  albo  wolna  od 
tlenu.  Wysycenie  więc  mioglobiny  tlenem  przebiega 
zgodnie  z kinetyką  reakcji  bimolekulamej  i jest 
hiperboliczną  funkcją  stężenia  tlenu  w środowisku 
(rys.  18). 

W cząsteczce  białka  może  być  więcej  niż  jedno 
centrum  wiązania  ligandu  i wówczas  z reguły  oddzia- 
łują one  na  siebie.  Białka  takie  wykazują  koopera- 
tywność  wiązania  ligandów:  wysycenie  jednego  cen- 
trum może  ułatwiać  (kooperatywność  dodatnia)  lub 
utrudniać  (kooperatywność  ujemna)  wysycenie  na- 
stępnego. Krzywa  wysycenia  ma  wówczas  kształt 
esowaty  (sigmoidalny),  jak  to  ilustruje  reakcja  hemo- 
globiny z tlenem. 

Hemoglobina  i mioglobina  wykazują  daleko  idące 
podobieństwo:  mają  tę  samą  grupę  funkcyjną,  hem, 
i bardzo  zbliżoną  strukturę  trzeciorzędową  (rys.  17). 
Różnią  się  jednak  tym,  że  mioglobina  jest  monome- 
rem, a hemoglobina  tetramerem,  zbudowanym  z 
4 podjednostek  (rys.  19),  z których  każda  ma  zresztą 
sekwencję  aminokwasową,  wykazującą  bliskie  po- 
krewieństwo z sekwencją  mioglobiny.  Hemoglobina 
ma  cztery  hemy  w cząsteczce,  wiąże  więc  cztery  czą- 
steczki tlenu,  a kooperatywność  tego  wiązania  zależy 
od  kontaktów  między  podjednostkami.  Łańcuchy  po- 
lipeptydowe  hemoglobiny  wykształciły  się  z łańcucha 
mioglobiny  w wyniku  duplikacji  jej  genu  i nagroma- 
dzenia się  w nim  wielu  punktowych  mutacji  (-*  Kwa- 
sy nukleinowe).  Nie  zmienione  zostały  te  odcinki  se- 
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kwencji,  które  są  odpowiedzialne  za  podstawową 
funkcję  biologiczną  transportera  tlenu : wiązanie  tlenu 
i ochronę  dwuwartościowości  żelaza.  Powstały  jed- 
nak nowe  odcinki  sekwencji  sprawiające,  że  łańcuchy 
mogą  się  ze  sobą  wiązać,  i to  w taki  sposób,  że  mini- 


Hetero tropowe  oddziaływania  uzależniają  reakcje  te 
od  innych  czynników,  np.  produktów  przemiany  ma- 
terii czy  substancji  docierających  do  komórki  z ze- 
wnątrz. Współistnienie  w białku  izo-  i allosterycznych 
centrów  czyni  z niego  kluczowy  element  w regula- 
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Rys.  19.  Cząsteczka  hemoglobiny.  Hemoglobina  jest  tetra  mc  rem, 
tj.  białkiem  zbudowanym  z czterech  podjednostek,  złączonych 
niekowalencyjnie.  W jej  skład  wchodzą  dwie  podjednostki  a 
i dwie  fi,  mające  budowę  bardzo  podobną  do  siebie  i do  mioglo- 
biny  (zob.  rys.  17).  Cząsteczka  hemoglobiny  ma  obrys  prawie 
kulisty,  a podjednostki  są  w niej  rozmieszczone  symetrycznie 
(klasa  symetrii  222).  Na  rysunku  pokazano  prawdziwą  oś  sy- 
metrii (linia  ciągła)  i jedną  pseudooś  (linia  przerywana);  druga 
pseudooś  jest  prostopadła  do  płaszczyzny  papieru 


mum  energetyczne  osiągnięte  jest  w tetramerze. 
Reakcja  z tlenem  w jednej  podjednostce  wywołuje 
w niej  małą  zmianę  konformacji  (rys.  20),  pociągającą 
jednak  za  sobą  zerwanie  niektórych  kontaktów  mię- 
dzy podjednostkami.  Sąsiadujące  więc  podjednostki 
znajdują  sobie  nową,  korzystną  termodynamicznie 
konformację,  a cały  tetramer  uzyskuje  w związku 
z tym  nieco  zmienioną  strukturę  czwartorzędową: 
ze  sprężonej,  charakterystycznej  dla  stanu  beztleno- 
wego przechodzi  w rozluźnioną,  właściwą  dla  wiązań 
z tlenem  (rys.  21).  Najtrudniejszejest  wysycenie  tlenem 
pierwszego  hemu,  gdyż  musi  zostać  przełamana  ba- 
riera energii  stabilizacji  stanu  sprężonego  tetrameru. 
Każdy  jednak  następny  atom  tlenu  jest  coraz  łatwiej 
wiązany  (czwarty  — kilkaset  razy  szybciej  niż  pierw- 
szy), bo  tetramer  przeszedł  już  ze  stanu  sprężonego 
w rozluźniony.  Molekularny  mechanizm  koopera- 
tywności  polega  na  tym,  że  lokalna,  a wywołana 
przez  związanie  ligandu  zmiana  struktury  trzecio- 
rzędowej staje  się  bardziej  uogólnioną  zmianą  kon- 
formacji, w białkach  podjednostkowych  wyrażającą 
się  odmienną  strukturą  czwartorzędową. 

Oddziaływanie  takie  jak  między  hemami,  tj.  mię- 
dzy identycznymi  centrami  wiązania  (izosterycznymi), 
nosi  nazwę  oddziaływania  homotropowego.  W biał- 
kach istnieją  jednak  centra  o odmiennej  budo- 
wie (allosteryczne),  wiążące  inne  ligandy,  np.  w he- 
moglobinie— dwutlenek  węgla,  jony  wodorowe, 
kwas  fosfoglicerynowy.  Wpływają  one  na  wiązanie 
tlenu  (m.in.  usztywniając  sprężoną  strukturę  hemo- 
globiny). Oddziaływanie  na  siebie  centrów  o odmien- 
nej budowie  nazywa  się  oddziaływaniem  hetero- 
tropowym. 

Specyficzna  geometria  centrum  wiązania  ligandu 
nadaje  białkom  zdolność  wyszukiwania  właściwego 
ligandu.  Homotropowe  oddziaływania  dokładniej 
dopasowują  reakcje  asocjacji  (przyłączania)  i dyso- 
cjacji  (odłączania)  ligandu  do  aktualnych  potrzeb. 
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FG1  Asp 


Rys.  20.  Pierwszy  akt  przekształcenia  konformacyjnego  w hemo- 
globinie. Schemat  pokazuje  zmianę  stosunków  przestrzennych 
i wiązań  niekowalencyjnych  w hemoglobinie,  zachodzą  w wyniku 
związania  przez  nią  tlenu  molekularnego.  Oznaczenia  heliksów 
i niektórych  aminokwasów,  biorących  udział  w przekształceniu, 
jak  na  rys.  17.  W nieobecności  tlenu  (a)  atom  żelaza  (Fe)  znajduje 
się  nieco  poza  płaszczyzną  pierścienia  porhrynowego.  Wiążąc 
tlen  molekularny  (O*)  żelazo  przechodzi  w stan  niskospinowy 
i wsuwa  się  w płaszczyznę  porfiryny  (b).  Pociąga  to  za  sobą 
histydynę  „bliską”,  w wyniku  czego  heliks  F odsuwa  się  od 
heliksu  H i pęka  wiązanie  wodorowe  utrzymujące  tyrozynę  (HC2) 
w kieszonce  między  heliksem  H i F.  To  z kolei  osłabia  drugie  wią- 
zanie (solne,  między  histydyną  HC3  i kwasem  asparaginowym 
FG1),  utrzymujące  pozycję  końca  C podjednostki.  Słabną  wów- 
czas kontakty  między  podjednostkami  i ostatecznie  cała  struktura 
podjednostkowa  tetrameru  (jego  struktura  czwartorzędowa)  ulega 
rozluźnieniu,  co  ułatwia  wiązanie  następnych  cząsteczek  tlenu 
(zob.  rys.  21) 


Rys.  21.  Przekształcenie  konformacyjne  tetrametrycznej  hemoglo- 
biny. W hemoglobinie  w nieobecności  tlenu  podjednostki  mają 
charakterystyczną  strukturę  trzeciorzędową  (symbolicznie  ozna- 
czoną jako  kwadraty:  małe  — podjednostki  a,  duże  — fi).  Są  one 
połączone  ze  sobą  wieloma  wiązaniami  (cienkie  kreski)  a całość 
struktury  czwartorzędowej  jest  wzmocniona  przez  efektor  allo- 
steryczny,  związany  między  podjednostkami  a i fi.  Związanie 
tlenu  prowadzi  do  zerwania  części  wiązań  wewnątrzcząsteczko- 
wych  (rys.  20),  w konsekwencji  czego  zmienia  się  struktura  trze- 
ciorzędowa podjednostki,  która  tlen  związała  (symbolizuje  to 
zmiana  kształtu  kwadratowego  na  okrągły).  Pociąga  to  za  sobą 
rozluźnienie  kontaktów  między  podjednostkami  i ostatecznie  cały 
tetramer  przechodzi  z formy  „sprężonej”,  T (od  ang.  tense) 
w formę  „rozluźnioną”,  R (od  ang.  rełaxed).  Zmiana  struktury 
czwartorzędowej  zachodzi  głównie  jako  przesunięcie  jednego 
dimeru  afi  w stosunku  do  drugiego,  zmiany  stosunków  prze- 
strzennych między  a i fi  są  nieznaczne 
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cjach  metabolicznych  zarówno  wtedy,  gdy  funkcja 
wiązania  występuje  w nim  w stanie  czystym  (np. 
w białkach  transportowych),  jak  i wtedy,  gdy  sprzę- 
żona jest  ona  z inną  funkcją,  np.  katalityczną  (jak 
w enzymach). 

Białka  — narzędzia  regulowanej  katalizy 

Wczesnym  i krytycznym  stadium  katalizy,  tym,  które 
umożliwiło  wykształcenie  się  wszelkich  form  życia, 
było  utworzenie  enzymów,  białek  o funkcji  katali- 
enzymy  tycznej.  Enzymy,  jak  wszystkie  katalizatory,  przyspie- 
szają reakcje  chemiczne,  lecz  same  nie  są  w nich  zuży- 
wane. Działają  one  jednak  sprawniej  niż  sztuczne 
katalizatory,  a cechą,  która  je  uczyniła  uniwersalnym 
narzędziem  katalizy  biologicznej,  jest  wysoka  wybiór- 
czość ich  działania  oraz  możliwość  uzależnienia  akty- 
wności od  stanu  komórki  i od  rozmaitych  substancji 
w niej  obecnych,  m.in.  produktów  przemiany  materii. 
Gdyby  tak  nie  było,  metabolizm  stałby  się  chaotyczny, 
organizm  nie  mógłby  sprawować  kontroli  nad  zacho- 
dzącymi w nim  reakcjami  chemicznymi  i niemożliwa 
stałaby  się  celowa  odpowiedź  na  stale  zmieniające 
się  warunki  otoczenia.  Dlatego  też  wszystkie  właści- 
wie reakcje  chemiczne  w organizmie  żywym  przebie- 
gają przy  udziale  enzymów,  niezależnie  od  tego,  czy 
są  one  w warunkach  fizjologicznych  szybkie  czy  po- 
wolne. Komórka  zawiera  od  tysięcy  (bakterie)  do 
milionów  (organizmy  wyższe)  różnych  enzymów,  co 
stanowi  przeszło  połowę  wszystkich  jej  białek.  Każdy 
enzym  jest  wyspecjalizowany  co  do  reakcji,  jaką 
może  katalizować,  oraz  co  do  substratu  (czy  grupy 
podobnych  substratów),  na  który  może  działać. 
Tabela  przedstawia  nazwy  i podstawowe  własności 
najważniejszych  dotąd  poznanych  klas  enzymów. 

Enzymy 

Klasa  1:  Oksydoreduktazy  (ok.  2000  enzymów)  — katalizują  od- 
szczepienie  atomu  wodoru  lub  elektronu  od  jednych  związków 
i przeniesienie  ich  na  drugie.  Większość  utleniań  biologicznych 
rozpoczynają  dehydrogenazy  odłączające  atom  wodoru  od  grup 
. | alkoholowych  ( — CHOH),  aldehydowych  ( — CHO),  kwasowych 

Klasy  ę — COOH),  aminowych  ( — NH2),  tiolowych  ( — SH)  i wielu  in- 
enzymów  nych,  stanowiących  donory  wodoru.  Akceptorami  mogą  być 
liczne  koenzymy  i inne  związki.  Dehydrogenazy,  dla  ‘których 
akceptorem  wodoru  jest  tlen  molekularny  O.,  nazywane  są  oksy- 
dazami. W transporcie  elektronów  biorą  też  udział  rozmaite  biał- 
ka, zwłaszcza  cytochromy  i inne  metaloproteiny  (np.  zawierające 
atomy  miedzi,  molibdenu),  a także  flawoproteiny,  białka  z wiąza- 
niami — S — S — . 

Klasa  2:  Transferazy  (ok.  S00  enzymów) — katalizują  przenoszenie 
grup  chemicznych  z jednych  związków  na  drugie.  Przenoszona 
może  być  grupa  metylowa  ( — CHa),  aldehydowa,  kwasowa , amino- 
wa, reszty  kwasu  fosforowego,  aminokwasów,  cukrów,  nukleo- 
tydów  i in. 

Klasa  3:  Hydrolazy  (ok.  900  enzymów)  — katalizują  rozszczepie- 
nie wiązań  przy  udziale  cząsteczki  wody,  czyli  hydrolizę.  Dzia- 
łają na  wiązania  — C — O — , — C — N — , — C — C — , — C — Cl, 
— C — P — , — P — N — , — S — N — , — C — P — , np.  esterazy  hyd ro- 
li zu  ja  wiązanie  estrowe  ( — C — O — ),  peptydazy  — peptydowe 
( — C — N — ). 

Klasa  4:  Liazy  (ok.  300  enzymów)  — katalizują  wyłączanie  grupy 
chemicznej  ze  związku,  pozostawiając  w nim  wiązanie  podwójne. 
Działają  na  wiązania  — C — C — , -C — O — , — C — N — , — C — S — 
i inne. 

Klasa  5:  Izomerazy  (ok.  100  enzymów)  — katalizują  wewnętrzne 
przekształcenie  związku, strukturalne  lub  geometryczne,  np.  prze- 
kształcają izomer  L w d,  cis  w trans  (rys.  4),  przenoszą  w obrębie 
danego  związku  wiązania  podwójne  ( — C=C — ),  dwusiarczkowc 
(— S— S)  i in. 

Klasa  6:  Ligazy,  zwane  również  syntetazami  (ok.  70  enzymów) 
— katalizują  połączenie  dwu  cząsteczek  w nowy  związek.  Two- 
rzą one  m.in.  wiązania  — C — O — (np.  łączenie  aminokwasu  z 
tRNA),  — C — S — (np.  w działaniu  koenzymu  A)  — C — C — , 
— P — O — (np.  enzymy  naprawiające  uszkodzenia  w kwasach 
nukleinowych). 

Enzymy  są  białkami  o masach  cząsteczkowych  od 
tysięcy  do  kilku  milionów  daltonów.  Część  z nich 
(głównie  enzymy  wydzielane  z komórek  na  zewnątrz) 
jest  białkami  monomerycznymi,  zbudowanymi  z jed- 
nego łańcucha  polipeptydowego.  Większość  jednak 
są  to  białka  oligomeryczne,  złożone  z kilku  (a  czasem 
więcej)  podjedn ostek.  Masy  cząsteczkowe  enzymów 


monomerycznych  i podjednostek  enzymów  oligome- 
rycznych  mieszczą  się  w tych  samych  granicach  — od 
kilkunastu  do  ok.  80  tysięcy  daltonów. 

Wszystkie  enzymy  mają  wybiórczo  działające  cen- 
tra wiązania  różnych  ligandów.  Funkcja  biologiczna 
enzymu  określona  jest  przez  to  centrum,  z którym 
sprzężone  są  grupy  katalitycznie  czynne  i które  wraz 
z nimi  tworzy  tzw.  obszar  czynny  enzymu.  W obsza- 
rze tym  dokonuje  się  reakcja  chemiczna,  przyspiesza- 
na przez  dany  enzym  — przetworzenie  substratu  reak- 
cji w jej  produkt.  Oprócz  centrum  wiązania  tego  li- 
ganda,  który  jest  substratem  reakcji,  enzymy  mają 
zazwyczaj  jedno  (lub  więcej)  centrum  allosteryczne. 

Wiązane  tam  ligandy  mają  odmienną  od  substratu 
budowę  i nie  ulegają  przemianie  chemicznej  katalizo- 
wanej przez  dany  enzym.  Natomiast  wysycenie  cen- 
trum allosterycznego  przez  taki  ligand  wywołuje  lo- 
kalną zmianę  konformacyjną  w enzymie,  przenoszącą 
się  w okolice  obszaru  czynnego  i powodującą  — w efektory 
drodze  oddziaływania  heterotropowego  — zmianę  reakcji 
szybkości  katalizowanej  reakcji.  Ligandy  allosterycz-  enzymatycz- 
ne są  zazwyczaj  nazywane  efektorami  lub  modulato-  nych 
rami  reakcji  enzymatycznych. 

Wybiórczość  działania  enzymów,  zwana  ich  swo- 
istością substratową,  jest  niezwykle  wysoka,  nieosią- 
galna przy  pomocy  katalizatorów  sztucznych.  Są  en-  swoistość 
zymy  działające  na  jeden  tylko  związek  chemiczny  lub  substratowa 
na  jeden  z jego  izomerów  przestrzennych  czy  struk-  enzymów 
turalnych.  Czasem  swoistość  substratowa  enzymu 
może  być  szersza,  ale  zawsze  ograniczona  jest  do  jed- 
nego rodzaju  reakcji  i określonego  typu  wiązania  che- 
micznego (tabela).  U jej  podłoża  leży  specyficzna  geo- 
metria centrum  wiązania  substratu,  a zwiększa  się 
jeszcze  wskutek  wymagania,  by  podatne  na  katalizę 
wiązanie  było  dostępne  dla  grup  katalitycznie  czyn- 
nych, tj.  tych  grup  chemicznych  w enzymie,  które  do- 
konują zerwania  wiązań  kowalencyjnych  w substracie 
i utrwalają  ostateczną  strukturę  produktu.  Drobne 
nawet  różnice  konfiguracji  atomowych  wokół  podat- 
nego na  katalizę  wiązania  mogą  spowodować,  że 
związek  bardzo  podobny  do  substratu  nie  ulega  kata- 
lizie, pomimo  że  jest  wiązany  w obszarze  czynnym. 

Staje  się  on  tzw.  kompetytywnym  inhibitorem:  kon-  inhibitory 
kurując  z substratem  o centrum  wiązania,  uniemożli-  kompety- 
wia  związanie  substratu  i w rezultacie  hamuje  reakcję,  tywne 
Wiele  takich  związków  jest  wytwarzanych  w organiz- 
mie i odgrywają  one  ważną  rolę  w regulacji  procesów 


postęp  reakcji 

Rys.  22.  Zmiany  energetyczne  w przebiegu  reakcji  chemicznej 
katalizowanej  i niekatalizowanej.  Wykres  przedstawia  zmiany 
swobodnej  energii  reakcji  katalizowanej  (linia  ciągła)  i niekatali- 
zowanej (linia  przerywana).  Zaznaczono  poziomy  swobodnej 
energii  dla  substratu  (5),  związku  przejściowego  ( SP ) i produktu 
(P)  jako  funkcję  postępu  reakcji  chemicznej.  Opisana  wykresem 
reakcja  jest  spontaniczna,  gdyż  poziom  swobodnej  energii  sub- 
stratu jest  wyższy  niż  produktu.  Aby  jednak  substrat  przekształcił 
się  w produkt,  musi  powstać  związek  pośredni,  co  wymaga  do- 
prowadzenia odpowiedniej  ilości  energii  (energia  aktywacji 
Gakt).  Przy  wysokiej  barierze  energii  aktywacji  spontaniczna  reak- 
cja może  być  niezauważalna  w normalnych  warunkach  ciśnienia 
i temperatury.  W obecności  katalizatora  energia  aktywacji  jest 
mniejsza  i reakcja  przebiega  ze  znacznie  większą  szybkością 
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metabolicznych.  Syntetycznie  otrzymywane  inhibito- 
ry kompetytywne  znajdują  szerokie  zastosowanie  jako 
leki,  pestycydy  i inne  użyteczne  preparaty. 

Z wysoką  wybiórczością  działania  enzymów  kojarzy 
się  ich  druga  cecha,  odróżniająca  je  od  sztucznych  ka- 
talizatorów — zdolność  do  ogromnego  przyspieszania 
reakcji  chemicznych.  Reakcje  katalizowane  przez  en- 
zymy przebiegają  108  i więcej  razy  szybciej  niż  w obec- 
ności katalizatora  sztucznego.  Połączenie  tych  dwu 
cech  sprawia,  że  organizmy  są  w stanie  przeprowa- 
dzać w stosunkowo  niskiej  temperaturze  i przy  nor- 
malnym ciśnieniu  reakcje,  dla  których  technologia 
współczesna  musi  stosować  bardzo  drastyczne  i ob- 
ciążające naturalne  środowisko  warunki  (np.  katali- 
tyczna redukcja  azotu  powietrza  do  amoniaku), 
kataliza  W reakcji  chemicznej  cząsteczka  związku  ulega 
przekształceniu  kowalencyjnemu,  w wyniku  którego 
powstaje  produkt  reakcji,  związek  o innej  niż  substrat 
budowie,  różniący  się  od  niego  systemem  wiązań  ko- 
walencyjnych, a na  ogół  także  liczbą  i rodzajem  ato- 
mów. (W  odróżnieniu  od  tego  przekształcenie  kon- 


formacyjne  nie  wymaga  zajścia  reakcji  chemicznej, 
gdyż  nie  musi  się  zmienić  struktura  kowalencyjna  da- 
nego związku).  Aby  doszło  do  reakcji  chemicznej, 
cząsteczka  substratu  musi  się  zderzyć  niesprężyście  np. 
z inną  cząsteczką.  Powstaje  wówczas  tzw.  związek  powstawanie 
przejściowy  o budowie  pośredniej  między  substratem  związku 
a produktem,  nie  będący  zresztą  związkiem  chemicz-  przejŚciowe- 
nym  w zwykłym  tego  słowa  znaczeniu,  gdyż  jest  bar-  9° 
dzo  nietrwały  i szybko  rozpada  się  z wytworzeniem 
produktu  czy  produktów  reakcji.  Do  zderzeń  niesprę- 
żystych  zdolne  są  tylko  te  cząsteczki  substratu  (zwane 
aktywowanymi),  których  energia  kinetyczna  jest  wyż- 
sza od  średniej  energii  substratu  o wartość  określoną 
jako  energia  aktywacji  (rys.  22).  A ponieważ  ich  udział 
w całości  w warunkach  normalnych  jest  bardzo  nie- 
wielki (np.  10“14),  reakcje  chemiczne,  nawet  te,  które 
są  spontaniczne,  tj.  przebiegają  z ubytkiem  swobodnej 
energii,  zachodzą  bardzo  powoli,  a czasem  są  w ogóle 
niezauważalne. 

Katalizatory  przyspieszają  reakcje  chemiczne  dzięki 
temu,  że  spośród  wielu  możliwych  dróg  od  substratu 


modele 

atomowe 

enzymów 


b)  rybonukleaza  lizozym  papaina 

Rys.  23.  Modele  atomowe  enzymów:  a)  Model  cząsteczki  lizozymu  (zob.  rys.  24),  enzymu  rozszczepiającego  niektóre  wielocukry,  wyko- 
nany z modeli  atomów  uwzględniających  promienie  van  der  Waalsa.  Z lewej  strony  — lizozym  z jego  charakterystyczną  szczeliną,  miesz- 
czącą obszar  czynny;  zaznaczono  kilka  aminokwasów,  odgrywających  istotną  rolę  w katalizie  (rys.  24).  Z prawej  — ten  sam  model  lizo- 
zymu  z substratem  (zaznaczonym  na  niebiesko)  wypełniającym  szczelinę.  Gdy  substrat  wchodzi  w obszar  czynny,  brzeg  szczeliny  nieco 
się  na  niego  nasuwa,  a tryptofan  (Try  62)  przesuwa  się  o 75  nm  (na  rysunku  niewidoczne),  b)  Rozmieszczenie  atomów  łańcucha  głównego 
w’  trzech  enzymach  monometrycznych;  kolorem  niebieskim  zaznaczony  jest  ogólny  obrys  cząsteczki 
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p ^zjaJranae  d0  produktu  wybierają  tę,  która  jest  najbardziej  ko- 
fcatałizatora  rzystna  energetycznie.  Ich  działanie  polega  na  obniże- 
niu energii  aktywacji,  charakterystycznej  dla  danej 
reakcji  (rys.  22).  Katalizator  wiąże  aktywowaną  czą- 
steczkę substratu  na  swojej  powierzchni  w ten  sposób, 
że  oddziaływanie  między  grupami  czynnymi  kataliza- 
tora i substratu  staje  się  ułatwione.  W rezultacie  do- 
chodzi między  nimi  do  termodynamicznie  korzystnej 
reakcji  chemicznej,  stanowiącej  właściwy  akt  katali- 
tyczny: zerwaniu  ulegają  wiązania  stare  (substratu) 
i powstają  nowe,  właściwe  dla  produktu.  Produkt  się 
oddziela,  a katalizator  ponownie  może  wejść  w reak- 
cję z substratem.  Udostępniona  w akcie  katalitycz- 
nym swobodna  energia  przyczynia  się  w znacznym 
stopniu  do  obniżenia  energii  aktywacji  katalizowanej 
reakcji. 

Akt  katalityczny  w enzymach,  przynajmniej  tam, 
gdzie  to  było  dokładnie  zbadane,  wydaje  się  przebie- 
gać tak  samo  jak  w katalizatorach  sztucznych.  Naj- 
częściej jest  to  reakcja  nukleofilna,  czasem  elektrofil- 
na,  niejednokrotnie  prowadząca  do  powstania  ko- 
walencyjnego, nietrwałego  związku  między  substratem 
a katalizatorem.  Niemniej  efekt  działania  kata- 
lizatora sztucznego,  mierzony  wielkością  energii  ak- 
tywacji, jest  znacznie  słabszy  niż  enzymu.  W warun- 
kach normalnych  np.  nadtlenek  wodoru  („perhydrol”) 
rozpada  się  spontanicznie  na  wodę  i tlen  z energią 
aktywacji  ok.  72  kJ/mol  (18  kcal/mol);  w obecno- 
ści katalizatora  sztucznego,  czerni  platynowej,  ener- 
gia aktywacji  wynosi  ok.  50  kJ/mol,  a w obecności 
katalazy,  enzymu  swoistego  dla  reakcji  rozkładu  nad- 
tlenku wodoru,  energia  aktywacji  wynosi  zaledwie 
8 k J/mol  (szybkość  reakcji  rozkładu  w obecności  ka- 
talazy jest  ponad  108  razy  wyższa  niż  przy  czerni  pla- 
tynowej). Wobec  podobieństwa  mechanizmu  aktu 
katalitycznego  w enzymach  i w katalizatorach  sztucz- 
nych sam  akt  nie  może  być  wystarczającym  tłumacze- 
niem znacznie  większej  sprawności  enzymów. 

Katalizatory  sztuczne  wymagają  znacznego  dopły- 
wu energii,  by  można  było  osiągnąć  należytą  szybkość 
katalizowanej  reakcji,  gdyż  zachodzi  konieczność  akty- 
wowania bardzo  dużej  liczby  cząsteczek  substratu, 
niezbędnych  do  zapoczątkowania  reakcji  z kataliza- 
torem. Enzymy  nie  mogą  funkcjonować  w tak  dra- 
stycznych warunkach,  a wręcz  przeciwnie  — musiały 
być  tak  wykształcone,  by  miały  dużą  sprawność  w 
enzymy  środowisku,  w jakim  się  mogła  toczyć  ewolucja  materii 
w procesie  żywej  — w niskiej  temperaturze,  normalnym  ciśnieniu, 
ewolucji  w rozcieńczonym  roztworze  substratów.  Elementem 
struktury  białka,  który  sprawił,  że  pierwotnie  (w  ewo- 
lucji prebiotycznej,  zanim  się  pojawiły  organizmy) 
istniejące  katalizatory  chemiczne,  np.  metale  i związki 
metaloorganiczne,  przekształciły  się  w enzymy,  było 
prawdopodobnie  utworzenie  w białkach,  w bezpo- 
średniej bliskości  grupy  katalitycznie  czynnej,  cen- 
trum wiązania  substratu.  Centrum  to,  w dzisiejszych 
enzymach  komplementarne  raczej  w stosunku  do  sta- 
nu przejściowego  substratu  niż  podstawowego,  wiąże 
substrat  silnie  i może  go  wychwytywać  nawet  przy 
bardzo  jego  niskim  stężeniu  w środowisku.  Prawdo- 
podobieństwo reakcji  np.  między  dwiema  cząsteczka- 
mi jest  w takim  roztworze  bardzo  małe.  Gdy  jednak 
zostaną  one  upakowane  w centrum  wiązania,  to  tra- 
cą swobodę  ruchu  (rotacyjnego  i translacyjnego)  i 
znajdują  się  w bezpośredniej  bliskości  ze  sobą  i z enzy- 
mem, szybkość  więc  reakcji  bardzo  wzrasta.  Wskutek 
posiadania  swoistego  centrum  wiązania  substratu 
enzym  staje  się  niejako  maxwellowskim  „demonem” 
entropii:  wprowadza  chwilowy  stan  wysokiego  upo- 
rządkowania materii  bez  wydatkowania  (netto)  ener- 
gii. Jest  to  ważny  czynnik  w działaniu  enzymów,  być 
może  krytyczny  we  wczesnym  okresie  ewolucji.  Sam 
przez  się  nie  wystarcza  jednak  do  wyjaśnienia  całego 
ogromnego  przyspieszenia  reakcji  przez  enzym.  Więk- 
sze znaczenie  ma  tutaj  zdolność  enzymu  do  wykorzy- 
stania energii  wiązania  substratu  dla  umożliwienia 
przekształcenia  konformacyjncgo  i substratu,  i enzy- 
mu. Zjawisko  to  zostało  ujawnione  w ostatnim  dzie- 
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Rys.  24.  Substrat  w obszarze  czynnym  enzymu.  Schemat  pokazuje 
lokalizację  substratu  (zbudowanego  z 6 reszt  cukrowcowych) 
w obszarze  czynnym  lizozymu  (rys.  23).  Sześć  pierścieni  cukrow- 
cowych (nieregularne  sześciokąty  niebieskie)  jest  złączonych 
z wieloma  atomami  reszt  aminokwasowych  lizozymu  wiązaniami 
wodorowymi  (linie  kreskowane).  Podobszary  wiązania  dwu 
skrajnych  reszt  z każdego  końca  wielocukru  utrzymują  całą  jego 
cząsteczkę  w rozprostowanej  formie.  Dla  trzeciego  (od  góry) 
i czwartego  pierścienia  cukrowca  nie  ma  dosyć  miejsca  w obsza- 
rze czynnym,  są  one  skręcone  (ustawione  są  niemal  prostopadle 
do  płaszczyzny  papieru)  co  wprowadza  do  ich  wiązań  naprężenia, 
zwłaszcza  do  pierścienia  czwartego  od  góry.  Grupy  polarne  silnie 
elektroujemnych  aminokwasów,  Asp  52  i Glu  35  znajdujące  się 
w pobliżu  wiązania  między  czwartym  a piątym  pierścieniem, 
zrywają  to  wiązanie  i wielocukier  rozpada  się  na  dwie  części. 

sięcioleciu  dzięki  badaniom  rentgenowskim  nad  kry- 
stalicznymi enzymami  i ich  kompleksami  z substratem 
(a  ściślej  — z inhibitorami  kompetytywnymi,  analo- 
gami substratu).  Badania  te  w połączeniu  z badaniami 
biochemicznymi  i rozważaniami  ewolucyjnymi  dały 
po  raz  pierwszy  obraz  — może  jeszcze  niedoskonały, 
ale  wewnętrznie  spoisty  — mechanizmów  molekular- 
nych w działaniu  enzymów. 

Obszar  czynny  enzymu  jest  ulokowany  w zagłębie- 
niu (szczelinie,  kieszonce)  powierzchni  jego  cząsteczki 
(widoczne  na  rys.  23).  W obszarze  tym  istnieje 
zazwyczaj  kilka  podobszarów  (rys.  24),  komplemen- 
tarnych w stosunku  do  poszczególnych  części  sub- 
stratu lub  przyjmujących  różne  substraty,  gdy  enzym 
działa  więcej  niż  na  jeden  substrat  jednocześnie  (więk- 
szość reakcji  enzymatycznych  jest  dwusubstratowa, 
choć  często  dla  uproszczenia  pomija  się,  że  np.  woda  obszar 
jest  też  substratem  w wielu  reakcjach).  Specyficzna  czynny 
geometria  obszaru  czynnego  zmusza  substrat  do  przy-  enzymu 
jęcia  konformacji  odmiennej  od  tej,  którą  miał  w sta- 
nie wolnym  w roztworze.  Wprowadzone  zostają  w ten 
sposób  naprężenia  do  jego  cząsteczki : ulegają  zmianie 
kąty  wartościowości,  odległości  atomowe,  maleje  ener- 
gia stabilizacji  rezonansowej  niektórych  wiązań.  Czą- 
steczka się  zniekształca,  na  ogół  geometrycznie,  ale 


często  również  elektrostatycznie,  i przybliża  do  formy 
związku  przejściowego,  w której  jest  silniej  związana 
z enzymem.  Energia  wiązania  substratu  jest  też  wyko- 
rzystywana w lokalnych  zmianach  konformacji  en- 
zymu: katalitycznie  czynne  grupy  (w  enzymach,  w od- 
różnieniu od  katalizatorów  sztucznych  — często  jed- 
nocześnie elektro-  i nukleofilne)  zbliżają  się  do  strate- 
gicznie ważnych  miejsc  substratu,  przede  wszystkim 
tych,  w których  w stanie  przejściowym  pojawią  się 
formalne  lub  częściowe  ładunki.  Łatwo  już  wtedy 
zajdzie  właściwy  akt  katalityczny:  ostateczna  polary- 
zacja elektronów  w nietrwałym  związku  przejściowym, 
prowadząca  do  wytworzenia  trwałych  wiązań  kowa- 
lencyjnych produktu  reakcji. 

Nasilenie  zmian  konformacyjnych  w substracie 
i w enzymie  bywa  różne  w rozmaitych  reakcjach  enzy- 
matycznych. Gdy  substrat  ma  dużą  swobodę  zmiany 
swojej  konformacji,  jak  np.  wielocukier  (rys.  24),  to 
enzym  może  być  dosyć  sztywny  i może  ulegać  tylko 
bardzo  niewielkim  przekształceniom.  Wyraźne  nato- 
miast zmiany  konformacji  enzymu  zachodzą,  gdy 
rozrywane  wiązanie  jest  sztywne,  jak  np.  wiązanie 
peptydowe  (rys.  25).  Czasem  zaś  zmiany  konforma- 
cyjne  substratu  są  bardzo  małe,  natomiast  duże  jest 
przemieszczenie  w nim  ładunków  elektrostatycznych 
(rys.  27). 

enzymy  Mechanizm  katalizy  enzymatycznej  odzwierciedla 
a katalizatory  warunki,  jakie  biosfera  stawiała,  by  ewolucja  orga- 
tech  (liczne  nizmów  żywych  zachodziła  pomyślnie.  Bezwzględne 
wymagania  selekcji  biologicznej  doprowadziły  do 
utworzenia  katalizatorów,  działających  z niezwykłą 


sprawnością  w bardzo  wąskich  granicach  niskiej  tem- 
peratury i w niewielkim  stężeniu  substratów.  Człowiek 
w swoim  empirycznym  podejściu  nieświadomie  wyko- 
rzystał do  opracowania  katalizatorów  technicznych 
jedną  tylko  cechę  strukturalną  enzymów  — udział  me- 
talu w obszarze  czynnym,  cechę  bardzo  wielu  enzy- 
mów i praktycznie  wszystkich  katalizatorów  technicz- 
nych. Bogactwo  jednak  rozwiązań  ewolucyjnych  pro- 
blemu katalizy  jest  znacznie  większe.  Wiele  enzymów 
nie  zawiera  metalu  w swojej  cząsteczce,  a ich  grupy 
katalitycznie  czynne  nie  wykazują  — w odróżnieniu 
od  metalu  — aktywności  katalitycznej,  gdy  są  odłą- 
czone od  białka.  Nie  ulega  wątpliwości,  że  głębsze  po- 
znanie subtelnej  struktury  enzymów  i molekularnych 
mechanizmów  w ich  działaniu  dostarczy  przesłanek 
do  utworzenia  katalizatorów  technicznych  „drugiej  *■ 
generacji”,  opartych  na  wzorach  wypracowanych 
przez  przyrodę,  wydajniejszych  niż  dotychczasowe, 
nie  wymagających  tak  dużego  wkładu  energii  i mniej 
obciążających  naturalne  środowisko  człowieka. 

Szybkość  katalizy  enzymatycznej,  podobnie  jak  regulacja 
szybkość  innych  reakcji  w roztworach  wodnych,  za-  funkcji 
leży  od  stężeń  substratu,  produktu,  jonów  wodoro-  enzymów 
wych  oraz  od  temperatury,  potencjału  oksydoreduk- 
cyjnego,  lepkości  i in.  Czynniki  te  wpływają  na  prze- 
bieg reakcji  metabolicznych,  są  jednak  zbyt  mało 
swoiste  by  zapewnić  dostateczną  subtelność  regula- 
cji funkcji  enzymów.  Duże  natomiast  znaczenie  mają 
tu  swoiste  cechy  obszaru  czynnego  enzymów.  Enzym 
np.  może  skierować  przemianę  substratu  w określo- 
nym kierunku,  jeżeli  z kilku  enzymów  działających  na 


Rys.  25.  Zmiany  konformacyjne  enzymu  w czasie  katalizy.  Rysunek  przedstawia  część  (ok.  V*)  łańcucha  polipeptydowcgo  karboksypep- 
tydazy  (zob.  rys.  10),  enzymu  rozrywającego  ostatnie  od  końca  C wiązanie  peptydowe  w białkach.  Na  rys.  a)  widoczna  jest  szczelina  pro- 
wadząca do  obszaru  czynnego,  który  na  rys.  b)  wypełniony  jest  substratem  (dwupcptyd  Gli-Tyr,  puste  kółka  niebieskie).  Substrat  jest 
związany  swoim  końcem  N (grupą  — CO  glicyny)  z atomem  cynku  (Zn),  stanowiącym  integralną  część  obszaru  czynnego;  koniec  C 
substratu  (pierścień  tyrozyny)  znajduje  się  w hydrofobowej  kieszonce  obszaru  czynnego.  Związanie  substratu  wywołuje  znaczne  prze- 
mieszczenie trzech  reszt  ami nok waso wych,  zaznaczonych  pełnymi  kółkami  niebieskimi.  Grupa  hydroksylowa  Tyr  248  wiąże  dwoma  wią- 
zaniami wodorowymi  grupę  aminową  substratu  i grupę  — NH  jego  łańcucha  głównego.  Arg  145  wiąże  jego  grupę  karboksylową,  a grupa 
karboksylowa  GIu  270  atakuje  spolaryzowane  przez  związanie  z cynkiem  wiązanie  peptydowe  substratu 
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dany  substrat  jeden  przekształca  go  sprawniej  niż  inne. 
A także  w wielu  reakcjach  metabolicznych  (rys.  26) 
wytwarzane  są  produkty  będące  kompetytywnymi 
inhibitorami  różnych  enzymów,  co  stwarza  możliwość 
sprzężenia  rozmaitych  ciągów  reakcji  enzymatycz- 
nych ze  sobą.  Ważnym  czynnikiem  regulacji  dla  nie- 
których enzymów  są  koenzymy,  drobnocząsteczkowe 
związki  organiczne,  wiązane  przez  enzym  w jednym 
z podobszarów  czynnego  obszaru  i stanowiące  współ- 
substrat  w jego  działaniu  katalitycznym.  Koenzym 
wiąże  się  (kowalencyjnie)  z produktem  reakcji,  w tej 
postaci  oddysocjowuje  od  enzymu  i jest  transportowa- 
ny do  innych  enzymów.  Tam  produkt  zostaje  odłączo- 
ny od  koenzymu  i przetwarzany  dalej,  a koenzym  re- 
generuje się  i ponownie  wchodzi  w cykl  reakcji.  Za- 
sób koenzymów  w komórce  jest  niewielki  (większość 
z nich  stanowią  witaminy  i ich  pochodne),  tak  że  do- 
stępność koenzymu  dla  danej  reakcji  enzymatycznej 
staje  się  czynnikiem  kontrolującym  szybkość  całego 
ciągu  przemian  metabolicznych,  jak  np.  NAD  — w 
łańcuchu  oddechowym  (-*  Organizacja  procesów  ży- 
ciowych komórki). 

Praktycznie  nieograniczone  możliwości  regulacji 
funkcji  enzymu  wynikają  z oddziaływań  heterotropo- 
wych,  związane  z obecnością  w nim  centrów  alloste- 
rycznych:  uzależniają  one  bowiem  szybkość  katalizy, 
a nawet  jej  swoistość  nie  od  substratu  czy  produktu, 
ale  od  czynników  o zupełnie  innej  budowie.  Oddziały- 
wania heterotropowe  występują  zarówno  w enzymach 
monomerycznych,  jak  oligomerycznych  (często  nazy- 
wanych enzymami  allosterycznymi),  zwłaszcza  jednak 
silnie  są  rozwinięte  w tych  ostatnich.  Enzymy  bowiem 
monomeryczne  mają  na  ogół  tylko  jeden  obszar  czyn- 
ny w swojej  cząsteczce  (wyjątki  są  nieliczne),  podczas 
gdy  w enzymach  oligomerycznych  może  być  ich  tyle, 
ile  jest  podjednostek,  a więc  efektory  reakcji  wpływa- 
ją na  cały  system  oddziaływań  homotropowych.  Co 
więcej  — w enzymach  oligomerycznych  podjednostki 
nie  muszą  być  identyczne,  mogą  się  różnić  swoistością 
substratową,  a część  z nich  może  być  wyspecjalizowa- 
na jako  podjednostki  regulacyjne  pozbawione  funkcji 
katalitycznej,  tylko  hamujące  (czy  aktywujące)  funkcję 
podjednostki  katalitycznej  w oligomerze. 

Enzymy  oligomeryczne  zostały  w toku  ewolucji  tak 
wyselekcjonowane,  że  przynajmniej  jednym  efekto- 


Rys.  26.  Allosteryczne  sprzężenia  zwrotne  w biosyntezie.  Schemat 
pokazuje  powstawanie  kilku  różnych  aminokwasów  z kwasu 
asparaginowego  jako  substratu  (aminokwasy  oznaczone  skróta- 
mi trójliterowymi,  tak  jak  w tabeli;  Hse — homoseryna,  Asp-P04 
i Asp-CHO  — fosforan  asparatylu  i semialdehyd  asparatylu, 
odpowiednio).  Powstające  aminokwasy  (droga  biosyntezy  — 
strzałki  czarne,  kilka  grotów  na  strzałce  oznacza,  że  pominięto 
kilka  produktów  pośrednich)  stają  się  efektorami  allosterycznymi, 
hamującymi  (strzałki  niebieskie)  niektóre  wcześniejsze  etapy  ich 
biosyntezy 
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Rys.  27.  Elektronowe  przesunięcia  w enzymie  w czasie  katalizy. 
Chymotrypsyna  jest  enzymem  proteolitycznym  (proteazą),  tj.  roz- 
szczepiającym wiązania  peptydowe  w białkach.  W czasie  katalizy 
nie  ulega  ona  wyraźnym  przekształceniom  konformacyjnym 
(w  odróżnieniu  od  np.  karboksypeptydazy  — rys.  25)  ani  też  nie 
doprowadza  do  geometrycznego  naprężenia  w substracie  (w  od- 
różnieniu od  np.  lizozymu,  rys.  24).  Katalityczne  działanie  chy- 
motrypsyny  odbywa  się  głównie,  jeżeli  nie  wyłącznie,  w wyniku 
przesunięć  elektronowych  w enzymie  i w substracie:  a)  W obsza- 
rze czynnym  chymotrypsyny  (i  wielu  innych  proteaz  zwanych 
„sc^nawymi”)  występuje  aminokwas  seryna  w bezpośrednim  są- 
siedztwie histydyny  i kwasu  asparaginowego.  Aminokwasy  te  nie 
sąsiadują  ze  sobą  w sekwencji,  ale  są  zbliżone  przez  pofałdowania 
łańcucha  polipeptydowego  chymotrypsyny.  Substrat  jest  silnie 
wiązany  przez  enzym  w bezpośrednim  sąsiedztwie  układu  Asp- 
His-Ser  (od  góry  rysunku),  ft  atomy  C'  i N wiązania  peptydowego 
znajdują  się  w kontakcie  van  der  Waalsa  z grupami  czynnymi  en- 
zymu. Powoduje  to  przesunięcia  elektronowe  (niebieskie  strzałki) 
nadające  tlenowi  seryny  własności  nukJcofilne.  b)  Atak  nuklcofil- 
ny  na  grupę  — CO  substratu  prowadzi  do  utworzenia  wiązania 
kowalencyjnego  między  enzymem  a częścią  substratu  zaczynają- 
cą się  od  — CO  wiązania  peptydowego,  rozrywanego  przez  enzym. 
Histydyna  staje  się  donorem  wodoru  do  grupy  — NH  substratu,  a 
powstająca  amina  odłącza  się  od  obszaru  czynnego,  c)  Na  miejsce 
aminy  wchodzi  cząsteczka  wody,  hydrolizująca  wiązanie  kowa- 
lencyjne enzym-substrat.  d)  Druga  część  substratu  z utworzoną 
grupą  — COOH  odłącza  się  i enzym  jest  zregenerowany 
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Rys.  28.  Kompleks  wielocnzymowy.  Wiele  enzymów  oligomerycznych,  katalizujących  kolejne  etapy  w ciągu  reakcji  metabolicznych 
uformowało  się  w toku  ewolucji  w struktury  polimeryczne  zw.  kompleksami  wieloenzymowymi.  W kompleksach  tych  znacznie  sprawniej 
przekazywane  są  produkty  pośrednie  do  następnych  enzymów.  Rysunek  przedstawia  jeden  z takich  kompleksów  wieloenzymowych , 
dehydrogenazę  ketokwasów,  która  wprowadza  produkt  końcowy  przemian  cukrowych  i tłuszczowych,  kwas  pirogronowy,  do  cyklu 
Krebsa  (-+  Organizacja  procesów  życiowych  komórki).  Pokazane  są  modele  strukturalne  (kule  reprezentują  protomery)  oraz  zdjęcia  ob- 
razu otrzymanego  za  pomocą  mikroskopu  elektronowego.  Kompleks  zbudowany  jest  z trzech  enzymów  oligomerycznych:  enzymu  usu- 
wającego grupę  — COOH  kwasu  pirogronowego  i redukującą  jego  grupę  — CO  (Ex);  enzymu  utleniającego  produkt  poprzedniej  reakcji 
do  kwasu  octowego  (E2)  oraz  enzymu  przenoszącego  resztę  kwasu  octowego  na  koenzym  A (E3).  Ten  ostatni  związek  wchodzi  do  cyklu 
Krebsa.  Organizatorem  kompleksu  jest  E2,  zbudowany  z 8 protomerów  w układzie  sześciennym.  Przyłącza  on  na  swoich  ścianach  6 czą- 
steczek E3  (każda  złożona  z 4 protomerów)  oraz  na  krawędziach  12  cząsteczek  E,  (każda  złożona  z 2 protomerów).  Masa  cząsteczkowa 
kompleksu  wynosi  ok.  4,5  miliona  daltonów 


rem  reakcji  jest  produkt  końcowy  tego  ciągu  reakcji, 
w którym  dany  enzym  stanowi  stadium  początkowe 
(rys.  27).  Hamowanie  funkcji  enzymu  może  być  całko- 
wite lub  stopniowe.  Na  przykład  enzym,  który  synte- 
tyzuje glutaminę  i zapoczątkowuje  co  najmniej  6 róż- 
nych ciągów  reakcji  w przemianie  azotowej  bakterii, 
zbudowany  z 12  identycznych  podjednostek,  jest  czę- 
ściowo hamowany  przez  każdy  z 6 końcowych  pro- 
duktów, a całkowicie  — przez  wszystkie  razem.  Wiele 
jednak  enzymów  allosterycznych  ma  podjednostki 
nieidentyczne  i zwykle  zbudowane  z dimerycznych 
protomerów,  w których  jeden  monomer  jest  podjed- 
nostką  regulacyjną,  drugi  zaś  — katalityczną.  W di- 
merze  takim  podjcdnostka  katalityczna,  oddzielona 
od  regulacyjnej,  może  być  zupełnie  nieaktywna  lub  też 
może  wykazywać  całkowitą  aktywność.  Stąd  też  po- 
wstają dwie  klasy  enzymów  regulacyjnych  tego  typu: 
jedne  na  efektor  odpowiadają  zahamowaniem  aktyw- 
ności, drugie  — jej  wyzwoleniem. 

Nie  tylko  hamowanie  i aktywacja  są  rezultatem  od- 
działywań allosterycznych  w enzymach.  Zmiana 


struktury  trzeciorzędowej  może  doprowadzić  do  zmia- 
ny geometrii  centrum  wiązania  substratu,  pociągają- 
cej za  sobą  zmianę  swoistości  substratowej  enzymu. 
Przykładem  może  tu  być  dehydrogenaza  glutaminia- 
nowa,  enzym  sprzęgający  biosyntezę  aminokwasów 
z cyklem  kwasów  trój karboksylowych  Krebsa  (-►  Or- 
ganizacja procesów  życiowych  komórki),  który  może 
katalizować,  w zależności  od  efektora,  przyłączenie 
grupy  aminowej  do  a-ketoglutaranu  i tworzyć  kwas 
glutaminowy,  lub  do  pirogronianu  i tworzyć  alaninę. 
Enzym  ten  jest  zbudowany  z 6 identycznych  podjed- 
nostek i w roztworze  występuje  jako  heksamer  mogą- 
cy mieć  dwie  różne  postaci  (oktaedr  lub  piramida  try- 
gonalna,  — ► Budowa  kryształów).  W obecności  efekto- 
rów,  a także  niektórych  hormonów,  jedna  postać  hek- 
sameru  przechodzi  w drugą  z jednoczesną  zmianą 
swoistości  substratowej  enzymu. 

W enzymie  oligomerycznym  podjednostki  mogą  się 
od  siebie  różnić  swoistością  w stosunku  do  substratu. 
Enzym  nabiera  wówczas  właściwości  układu  (kom- 
pleksu) wieloenzymowego  (staje  się  tzw.  multienzy- 


zmiarta 
struktury 
d zmiana 
swoistości 
substratowej 


741 


mem).  Jednym  z najprostszych  jest  enzym,  który  syn- 
tetyzuje tryptofan,  zbudowany  z dwu  par  nieidentycz- 
nych  podjednostek  a2/?2.  Podjednostka  a katalizuje  po- 
wstanie indolu,  a podjednostka  fi  przyłącza  do  niego 
serynę,  tworząc  ostatecznie  tryptofan.  Aktywności  en- 
zymatyczne wolnych  podjednostek  są  raczej  niskie, 
a w kompletnym  enzymie  rosną  prawie  stukrotnie. 
Zespół  dwu  podjednostek  (a2&)  pozwala  na  efektywne 
sprzężenie  dwu  kolejnych  reakcji,  a podjednostki  wza- 
jemnie się  w nim  aktywują.  Te  korzystne  cechy  są 
w przyrodzie  szeroko  wykorzystywane  i bardzo  wiele 
kluczowo  ważnych  enzymów  uformowanych  jest 
w takie  kompleksy  wieloenzymowe  (rys.  28).  Składają 
kompleksy  się  one  z kilku  enzymów  oligomerycznych  i mają  ściśle 
waełoenzy-  określoną  budowę  przestrzenną,  w której  jeden  enzym 
mowę  tworzy  rdzeń  i jest  organizatorem  całości.  Przykładem 
kompleksu  może  być  dehydrogenaza  ketokwasów 
(rys.  28),  organizatorem  jej  jest  transacylaza  liponiano- 
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wa  (enzym  zbudowany  z 24  bardzo  podobnych,  może 
identycznych  podjednostek),  która  przyłącza  do  siebie 
po  12  cząsteczek  pozostałych  dwu  enzymów  (w  jej 
nieobecności  nie  agregują  one  ze  sobą).  W toku  ewo- 
lucji enzymy  wielofunkcyjne  tak  zostały  wyselekcjo- 
nowane, że  ich  częściami  składowymi  są  enzymy  oli- 
gomeryczne,  katalizując  kolejne  etapy  w danym  ciągu 
przemian  metabolicznych.  Stworzyło  to  możliwość 
bezpośredniego  przekazywania  produktów  jednych 
reakcji  do  enzymów  katalizujących  etap  następny,  bez 
strat  spowodowanych  dyfuzją  i konkurencją  innych 
układów  enzymatycznych. 

Większość  (ok.  95%)  zbadanych  enzymów  oligo- 
merycznych zbudowana  jest  z 2,4,6  lub  8 podjedno- 
stek. Protomery  ich  są  prawie  zawsze  identyczne  (choć 
mogą  się  składać  z dwu  lub  nawet  więcej  jednostek  — 
i to  niekoniecznie  identycznych),  a w oligomerze  znaj- 
dują się  w równoważnym  (pseudoidentycznym)  oto- 
czeniu. Swobodne  protomery  łączą  się  we  właściwą 
dla  danego  enzymu  strukturę  czwartorzędową,  bez 
tendencji  do  tworzenia  wyższych  polimerów,  co  wska- 
zuje na  to,  że  wszystkie  potencjalne  wiązania  między- 
protomerowe  są  w oligomerze  wysycone.  Ta  cecha 
w połączeniu  z małą  liczebnością  podjednostek  (i  ogra- 
niczeniem sterycznym  wynikającym  z konfiguracji 
L-a-aminokwasów)  sprawia,  że  możliwości  przestrzen- 
nego rozmieszczenia  podjednostek  w enzymie  oligome- 
rycznym  są  bardzo  ograniczone.  Tetramer  np.  może 
mieć  geometrię  kwadratu  lub  tetraedru,  heksamer  zaś 
i oktamer  mają  po  trzy  możliwości,  zawsze  ze  środ- 
kiem symetrii  i w układzie  zamkniętym  (a  nie  linio- 
wym i otwartym  — jak  wielkie  superstruktury  cha- 
rakterystyczne dla  białek  strukturalnych).  Czwarto- 
rzędowa struktura  oligomeru  zależna  jest  od  trzecio- 
rzędowej struktury  podjednostki,  a ta  zależy  od  obec- 
ności ligandu  (np.  efektora  allosterycznego)  w centrum 
wiązania.  Jeżeli  podjednostka  (w  najprostszym  ujęciu) 
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Rys.  29.  Krzepnięcie  krwi  jest  wynikiem  złożonej  sekwencji  reakcji  enzymatycznych  (kaskady),  wywołanych  m.in.  uszkodzeniem  tkanki, 
kontaktem  z ciałem  obcym  (na  lewo  na  górze),  a doprowadzającej  do  powstania  fibryny  (na  dole),  wysokospolimcryzowancgo,  nieroz- 
puszczalnego białka,  zorganizowanego  w rozległą  sieć,  w której  utkwione  są  komórki  krwi  (skrzep  krwi).  Rysunek  przedstawia  kolejną 
aktywację  5 enzymów  protolitycznych,  zw.  czynnikami  krzepnięcia  i oznaczonych  cyframi  rzymskimi,  cyfry  arabskie  — oznaczają  masy 
cząsteczkowe  w tys.  daltonów.  Każdy  z nich  występuje  w dwu  postaciach:  nieczynnego  prekursora  i czynnego  enzymu  (strzałka  prążko- 
wana pokazuje  przekształcenie  prekursora  w enzym).  Utworzony  enzym  modyfikuje  (strzałka  pojedyncza)  kowalencyjną  straukturę  pre- 
kursora następnego  enzymu  przez  nacięcie  w nim  kilku  wiązań  peptydowych  (grot  strzałki  wskazuje  na  obszar  ulegający  wycięciu).  Po 
usunięciu  odcinka  łańcucha  polipeptydowego  ujawnia  się  obszar  czynny  enzymu.  Przedstawione  czynniki  krzepnięcia  są  proteazami  se- 
rynowymi  (rys.  27),  a lokalizacja  katalitycznie  czynnych  reszt  asparaginy,  histydyny  i seryny  pokazana  jest  kropkami  na  schemacie  bu- 
dowy czynnika  X i II ; proste  czarne  kreski  na  schematach  wskazują  pozycje  wiązań  dwusiarczkowych,  utrzymujących  integralność  czą- 
steczki po  wycięciu  części  łańcucha.  Ostatnim  enzymem  w kaskadzie  jest  czynnik  II  (prekursor  — protrombina  i enzym  — trombina). 
Trombina  — ale  nie  pozostałe  czynniki  — atakuje  niektóre  wiązania  peptydowe  w fibrynogenie  (zacieniowane  na  modelu,  na  prawo  na 
dole)  i doprowadza  do  odszczepienia  od  niego  fibrynopeptydów  (na  dole).  Tak  zmodyfikowany  fibrynogen  polimeryzuje  spontanicznie  do 
fibryny.  W fibrynie  monomery  są  początkowo  połączone  wiązaniami  niekowalencyjnymi  (kreski  przerywane),  potem  jednak  zostaje  ona 
usztywniona  wiązaniami  kowalencyjnymi  (niewidoczne  na  rysunku) 
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Rys.  30.  Pobudzenie  metabolizmu  komórkowego  przez  hormon.  Wiele  hormonów  jest  wiązanych  na  powierzchni  komórki,  co  stanowi 
pierwszy  etap  oddziaływania  hormonu  na  komórkę.  Wyzwala  to  w komórce  wiele  procesów,  ale  hormon  już  nie  bierze  w nich  bezpośred- 
niego udziału.  W procesach  tych  zasadniczą  rolę  odgrywa  cykliczny  nukleotyd,  którego  synteza  jest  pobudzana  przez  związanie  podjed- 
nostki  regulacyjnej  enzymu,  cyklazy  nukleotydowej  (np.  cyklazy  przekształcającej  ATP  w cykliczny  nukleotyd  adenylowy  z uwolnieniem 
nieorganicznego  fosforanu  — na  lewo  u góry).  Aktywacja  cyklazy  przez  hormon  nie  jest  dobrze  poznana,  np.  nie  wiadomo  czy  podjed- 
nostka  regulacyjna  cyklazy  (R)  jest  receptorem  wiążącym  hormon  (jak  na  rys.),  czy  też  istnieją  jakieś  etapy  pośrednie.  Cykliczny  nu- 
kleotyd (cAMP),  zw.  „drugim  posłańcem”  w mechanizmie  działania  hormonów,  wprowadza  przy  udziale  enzymu  zw.  kinazą,  resztę 
fosforanową  (P  w kółku)  do  rozmaitych  białek  i aktywuje  je  w-  ten  sposób.  Rysunek  przedstawia  przekrój  ok.  ł/4  komórki  żywej  i ukazuje 
3 główne  ciągi  reakcji  aktywowanych  przez  hormon  za  pośrednictwem  cAMP:  1)  Aktywacja  przepuszczalności  błony  komórkowej  jest 
spowodowana  wprowadzeniem  reszty  fosforanowej  do  białka  blokującego  kanały  jonowe  i wywołaną  tym  zmianę  jego  konformacji; 
2)  aktywacja  enzymów,  na  przykładzie  aktywacji  przemiany  cukrowej,  w czym  biorą  udział  trzy  enzymy : kinaza  I aktywuje  kinazę  II,  a ta 
aktyw-uje  fosforylazę  glikogenu,  enzym  prowadzący  do  rozszczepienia  glikogenu  z wydzieleniem  glikozy;  3)  aktywacja  biosyntezy  białka; 
katalityczna  podjednostka  kinazy  (K)  przenika  przez  błonę  jądrową  i wprowadza  resztę  kwasu  fosforowego  do  białka  stabilizującego 
DNA,  co  w bliżej  nie  poznany  sposób  ułatwia  transkrypcję  genu 
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ma  tylko  dwie  możliwe  struktury  trzeciorzędowe  (jed- 
ną charakterystyczną  dla  stanu  wolnego,  drugą  — dla 
stanu  związania  z ligandem),  to  enzym  oligomeryczny 
będzie  miał  dwie  możliwe  struktury  czwartorzędo- 
we, odpowiadające  najbardziej  korzystnej  interakcji 
identycznych  podjednostek  w ich  dwu  wzajemnie  wy- 
kluczających się  formach.  Wysycenie  jednej  pedjedno- 
stki  ligandem  doprowadza  do  przekształcenia  jej 
struktury  trzeciorzędowej,  zmieniając  jednocześnie 
sposób,  w jaki  się  wiąże  ona  z pozostałymi  podjedno- 
stkami.  Uniemożliwia  to  utrzymanie  poprzedniej 
struktury  czwartorzędowej  i zmusza  cząsteczki  do 
zmiany  ich  konformacji  na  alternatywną.  Powstanie 
nowa  struktura  czwartorzędowa,  alternatywna  do  po- 
przedniej. Chwilowo  podjednostki  w niej,  z wyjątkiem 
pierwszej,  nie  są  wysyccne  ligandem,  ale  mają  zwięk- 
szoną łatwość  takiego  wiązania,  gdyż  nowa  ich  struk- 
tura trzeciorzędowa  posiada  taką  geometrię  centrum 
wiązania  jak  podjednostka,  która  jest  już  z ligandem 
skompleksowana.  Wiele  enzymów  (oraz  białek  trans- 
portowych, np,  hemoglobina,  str.  734)  tak  się  za- 
chowuje i efekt  allosteryczny  definiowano  pierwotnie 
właśnie  jako  zgrane  i symetryczne  przekształcenie 
wszystkich  podjednostek  oligomeru.  Dobrze  to  tłu- 
maczyło kinetykę  wielu  reakcji  enzymatycznych  i pro- 
cesów transportu.  Dziś  się  jednak  sądzi,  że  konforma- 
cja może  się  zmieniać  stopniowo  w kolejnych  podjed- 
nostkach  i że  symetryczne  przekształcenie  struktury 
czwartorzędowej  jest  tylko  skrajną  z wielu  możli- 
wości, sięgających  aż  do  dysocjacji  enzymu  oligome- 
rycznego  do  wolnych  podjednostek.  W każdym  jednak 
razie  funkcjonalność  architektury  enzymu  wyraża  się 
ścisłym  sprzężeniem  między  jego  strukturą  trzecio- 
i czwartorzędową,  stanowiącym,  że  aktywność  enzy- 


mu staje  się  zależna  i od  czynników,  które  wpływają 
na  układ  podjednostek  w polimerze,  i od  tych,  które 
modyfikują  konformację  podjednostki.  Zawsze  jednak 
ostatecznym  skutkiem  związania  ligandu,  substratu 
czy  efektora  jest  kooperatywne  wzmożenie  lub  zaha- 
mowanie katalizy  enzymatycznej. 

Allosteryczne  regulacje  polegają  w istocie  na  nieko-  kaskady 
walencyjnych  modyfikacjach  struktury  enzymu.  Stąd  enzymatycz- 
też  są  one  łatwo  odwracalne  i enzym  może  oscylować  ne 
pomiędzy  stanami  odpowiadającymi  wiązaniu  roz- 
maitych ligandów.  Często  jednak  potrzebna  jest  bar- 
dziej trwała  zmiana  własności  enzymu  — uruchomie- 
nie lub  zahamowanie  jego  aktywności  czy  uzależnienie 
go  (względnie  uniezależnienie)  od  pewnych  efektorów. 

Do  tego  celu  służą  kowalencyjne  potranslacyjne  mo- 
dyfikacje struktury  enzymu,  z reguły  nadrzędne  w sto- 
sunku do  działania  efektorów  allosterycznych.  Enzym 
może  być  modyfikowany  nieodwracalnie,  gdy  np.  roz- 
cięte zostaną  w nim  niektóre  wiązania  peptydowe 
(rys.  29),  albo  odwracalnie,  gdy  odpowiedni  system 
enzymatyczny  może  usunąć  grupy  modyfikujące  (rys. 

30).  W każdym  wypadku  — ściśle  określony  bodziec 
(jak  np.  uraz  powodujący  krzepnięcie  krwi  czy  hor- 
mon) (rys.  29  i 30)  wyzwala  kaskadowe,  wielostopnio- 
we układy  enzymatyczne  o potężnym  działaniu  bio- 
logicznym. 


Białka  — sygnały  i receptory  sygnałów 

W organizmach  zwierzęcych  funkcja  biologiczna 
wszystkich  komórek  jest  całkowicie  podporządkowa- 
na potrzebom  ustroju  jako  całości.  Nadrzędnym  inte- 
gratorem jest  system  nerwowy,  komunikujący  się 
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z komórkami  i tkankami  za  pośrednictwem  hormo- 
nów — grup  różnorodnych  chemicznie  substancji,  do 
hormony  i których  się  dzisiaj  zalicza  zarówno  hormony  w sensie 
neurotrans-  klasycznym  (tj.  produkty  gruczołów  wydzielania  we- 
mitery  wnętrznego),  jak  i tzw.  neurotransmitery,  czyli  związki 
wydzielane  przez  zakończenia  nerwowe.  Większość 
hormonów  stanowią  pochodne  aminokwasów  oraz 
oligo-  i polipeptydy,  ale  są  wśród  nich  także  związki 
nieaminokwasowe,  jak  sterydy.  Hormony  przekazują 
bodźce  nerwowe  od  jednej  komórki  nerwowej  do  dru- 
giej (np.  acetylocholina,  noradrenalina),  kontrolują 
metabolizm  (np.  insulina  — przemianę  cukrową),  doj- 
rzewanie i różnicowanie  komórek  (np.  hormony 
płciowe).  Hormony  są  sygnałami  chemicznymi,  wy- 
zwalającymi w komórkach  ich  utajone  lub  nie  w pełni 
ujawnione  możliwości  biologiczne  przez  aktywację 
tych  genów,  które  w nieobecności  hormonu  pozostają 
w stanie  represji,  a zawarta  w nich  informacja  gene- 
tyczna nie  znajduje  wyrazu  w produkcji  swoistego 
białka. 

receptory  Hormony  docierają  do  wielu  (niektóre  do  wszyst- 
kich) komórek  organizmu,  ale  tylko  tzw.  komórki  do- 
celowe dla  danego  hormonu  odpowiadają  na  jego 
obecność  charakterystyczną  aktywacją  swoich  funkcji 
biologicznych.  Komórki  bowiem  docelowe,  w odróż- 
nieniu od  innych,  zawierają  białka  zwane  receptorami, 
zdolne  do  silnego  i ściśle  wybiórczego  wiązania  właści- 
wego hormonu.  Receptory  hormonów  są  białkami 
o masach  cząsteczkowych  w przybliżeniu  od  ok. 
100  000  do  300  000  daltonów  (większe  zbudowane  są 
z podjednostek),  a ich  cząsteczka  ma  kształt  wydłużo- 
ny i charakter  wyraźnie  hydrofobowy.  Prawie  wszy- 
stkie receptory  hormonów  są  trwale  związane  z błoną 
komórkową  i wychwytują  hormony  z otaczającego 
komórkę  płynu.  Odmienne  są  tylko  receptory  hormo- 
nów sterydowych  (i  jak  się  zdaje,  hormonów  tarczycy), 
które  się  mogą  przemieszczać  w cytoplazmie  i pobie- 
rać stamtąd  sterydy,  wnikające  swobodnie  do  komór- 
ki poprzez  błonę. 

Receptor  wiąże  hormon,  ulega  przekształceniu 


Rys.  31.  Receptory  hormonów  sterydowych.  Hormony  stery- 
dowe (trójkąty),  w odróżnieniu  od  innych  hormonów  swobodnie 
przenikają  z krwi  do  komórki.  W cytoplazmie  napotykają  na 
swoiste  dla  nich  receptory,  białka  zbudowane  z dwu  podjedno- 
stek i mające  dwa  miejsca  wiązania  dla  danego  hormonu.  Utwo- 
rzenie kompleksu  hormon-receptor  modyfikuje  cząsteczkę  recep- 
tora tak,  że  może  ona  przeniknąć  przez  błonę  jądrową  i wiąże  się 
z białkami  stabilizującymi  DNA.  To  związanie  ponownie  mody- 
fikuje cząsteczkę  receptora:  dysocjuje  ona,  jedna  jej  podjednostka 
(lokalizacyjna)  pozostaje  związana,  druga  (aktywacyjna)  prze- 
nosi się  wzdłuż  nici  DNA  i w bliżej  nie  poznany  sposób  roz- 
luźnia strukturę  DNA,  ułatwiając  transkrypcję  określonego  genu 
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konformacyjnemu,  podobnie  jak  białka  transportowe 
i enzymy.  Receptor  nie  jest  jednak  transporterem  do- 
prowadzającym hormon  do  wrażliwego  nań  obszaru 


Rys.  32.  Immunoglobuliny  — białka  odpowiedzi  obronnej  orga- 
nizmu. a)  Immunoglobulina  zbudowana  jest  z 4 łańcuchów  poli- 
peptydowych:  dwóch  „ciężkich”  — H (od  ang.  heavy ),  złożonych 
z ok.  450  reszt  aminokwasowych,  i dwóch  „lekkich”  — L (od 
ang.  light),  złożonych  z ok.  220  reszt.  Cząsteczka  immunoglobu- 
liny ma  kształt  litery  \ z dwuKrotną  osią  symetrii  mięazy  parami 
łańcuchów  Hl.  Łańcuchy  H ciągną  się  przez  całą  długość  czą- 
steczki, łańcuchy  L — tylko  w-zdłuż  ramienia  litery  Y ; końce  N 
łańcuchów  znajdują  się  na  końcu  ramion  Y.  W sekwencji  amino- 
kwasowej  łańcuchów  powtarzają  się  sekwencje  po  około  110  ami- 
nokwasów, zw.  domenami,  spięte  pośrodku  wiązaniem  dwusiarcz- 
kowym  ( — S — ).  b)  Model  utworzony  na  podstawie  badań  kry- 
stalograficznych. Widać,  że  każda  z domen  stanowi  typową 
/ł-baryłkę  (rys.  10)  w układzie  łańcuchów  przeciwrównolcgłym 
(strzałki);  widoczne  jest  również  wiązanie  dwusiarczkowe  (czarny 
słupek).  Sekwencja  aminokwasowa  w domenach  C (od  ang. 
constant  'stały’)  jest  bardzo  podobna  u wszystkich  osobników 
danego  gatunku  i mało  się  różni  u rozmaitych  gatunków  kręgow- 
ców. Domeny  V (od  ang.  variable  'zmienny’),  przy  pewnym  po- 
dobieństwie ogólnym  sekwencji  do  domen  C,  mają  wyróżniające 
je  bardzo  krótkie  odcinki  sekwencji  „hiperzmiennych”  (linie  fa- 
liste na  rys.  a).  Te  hiperzmienne  sekwencje  są  wprowadzone  do 
cząsteczki  immunoglobuliny  w odpowiedzi  na  obecność  antygenu 
w organizmie  (mechanizm  genetyczny  tego  procesu  jest  zagad- 
kowy) i formują  w niej  obszar  wiązania  antygenu,  c)  Cząsteczka 
immunoglobuliny  ma  dwa,  zawsze  identyczne,  obszary  wiązania 
antygenu.  Wiążąc  się  z antygenem,  immunoglobulina  (przeciw- 
ciało — jeżeli  znany  jest  swoisty  dla  niej  antygen)  może  tworzyć 
rozległą  sieć  (np.  z lewej  strony  — sieć,  której  węzły  tworzą  de- 
terminanty antygenowe  na  powierzchni  bakterii),  wypadającą  ze 
środowiska  (np.  z krwi).  Cząsteczki  immunoglobuliny  mogą 
także  wiązać  się  na  powierzchni  bakterii,  wirusów  i in.  (na  dole 
pośrodku),  a następnie  — wiązać  je  z komórkami,  które  mają  na 
swojej  powierzchni  receptory  dla  ostatniej  czy  ostatnich  dwóch 
domen  stałych  immunoglobuliny.  Komórki  te  (np.  komórki 
żerne)  mają  zdolność  niszczenia  lub  unieszkodliwiania  rozmai- 
tych ciał  obcych,  mogących  przedostać  się  do  organizmu 
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nie  tylko 
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i odporność 


komórki  ani  też  nie  nabiera  własności  katalitycznych. 
W utworzonym  kompleksie  receptor  staje  się  prze- 
twornikiem otrzymanej  z hormonem  informacji  i czy- 
ni ją  zrozumiałą  dla  komórki.  Receptor  hormonów 
sterydowych  (rys.  31)  przekształca  się  w induktor  (de- 
represor,  ->  Organizacja  procesów  życiowych  komór- 
ki) i uruchamia  transkrypcję  genów.  Receptory  trwale 
związane  z błoną  komórkową  wywołują  ten  sam  efekt, 
ale  pośrednio:  wiążą  podjednostkę  regulacyjną  enzy- 
mu zwanego  cyklazą  nukleotydową  (rys.  30),  hamują- 
cą jej  podjednostkę  katalityczną,  i uruchamiają  ka- 
skadę enzymatyczną,  która  aktywuje  rozmaite  białka 
komórkowe  — enzymy,  białka  strukturalne  (układ 
tubulina-mikrotubule),  białka  jądra  komórkowego. 
Selektywność  działania  receptorów  hormonów  stery- 
dowych polega  prawdopodobnie  na  tym,  że  jedna  ich 
podjednostka  (rys.  31)  rozpoznaje  pewne  obszary 
(tzw.  miejsca  akceptorowe)  w chromatynie,  a druga 
rozluźnia  pobliski  obszar  zbitej,  tj.  spoczynkowej 
chromatyny.  Nie  wiadomo  jednak,  w jaki  sposób  za- 
chodzące w obszarze  błony  komórkowej  oddziaływa- 
nie przekształconego  receptora  innych  niż  sterydowe 
hormonów  z cyklazą  nukleotydową  doprowadza  do 
aktywacji  wybranych  genów. 

Hormony  są  sygnałem  chemicznym,  ale  analogicz- 
ny system  receptorów  funkcjonuje  w przetwarzaniu 
informacji  zawartej  w sygnale  fizycznym  (takim  re- 
ceptorem jest  np.  rodopsyna,  zwana  purpurą  wzroko- 
wą, w siatkówce  oka,  aktywująca  cyklazę  adenylową 
pod  wpływem  światła  widzialnego).  I nie  tylko  sygnały 
chemiczne  czy  fizyczne  są  w ten  sposób  rozpoznawa- 
ne, ale  również  sygnały,  których  natury  nie  potrafimy 
jeszcze  zdefiniować  w pojęciach  innych  niż  biologicz- 
ne. Należy  do  nich  zdolność  organizmów  wyższych  do 
rozróżniania  między  składnikiem  (substancją,  komór- 
ką) „swoim”  i „obcym”,  leżąca  u podłoża  immunolo- 
gicznych odczynów  obronnych. 

Ponieważ  wniknięcie  komórki  obcej  do  organizmu 
wielokomórkowego  stanowi  dla  niego  potencjalne 
niebezpieczeństwo,  w toku  ewolucji  organizmów  wyż- 
szych wykształcone  zostały  mechanizmy  zapobiegają- 
ce temu  zagrożeniu.  Typowym  ich  przykładem  jest 
produkcja  przeciwciał  — białek  należących  do  grupy 
immunoglobulin  (rys.  31)  — w odpowiedzi  na  zakaże- 
nie bakteryjne  czy  szczepienie  ochronne.  Przeciwciała 
mogą  również  powstać  po  wprowadzeniu  do  ojrganiz- 
mu  prawie  każdej  substancji  wielkocząsteczkowej  — 
pod  warunkiem,  że  nie  jest  ona  naturalnym  i prawid-' 
łowym  jego  składnikiem.  Wytworzone  przeciwciało 
wiąże  czynnik,  który  wzbudził  jego  produkcję  (tzw. 
antygen);  jest  to  wiązanie  niekowalencyjne,  ale  silne 
i o wybiórczości  często  przekraczającej  wybiórczość 
wiązania  substratu  przez  enzym. 

Obszar  wiązania  antygenu  (rys.  32)  jest  zagłębie- 
niem w cząsteczce  przeciwciała  utworzonym  wspólnie 
przez  A-końcowe  odcinki  łańcucha  ciężkiego  i łańcu- 
cha lekkiego,  czyli  znajduje  się  w domenie  zmiennej, 
a jego  geometrię  określają  łańcuchy  boczne  amino- 
kwasów hiperzmiennych  (rys.  32a).  Zagłębienie  to 
(w  cząsteczce  przeciwciała)  ma  wymiary  ok.  3,5  x 
x 1,5  x 1,0  nm,  tak  że  może  pomieścić  tylko  niewielką 
część  antygenu  wielkocząsteczkowego,  jego  tzw.  de- 
terminantę, liczącą  5-7  reszt  aminokwasów  czy  cuk- 
rów. Antygen  ma  zazwyczaj  wiele  determinant,  a prze- 
ciwciało wiąże  co  najmniej  dwa  antygeny  (rys.  32c), 
tak  że  powstający  kompleks  jest  agregatem  zbudowa- 
nym z wielu  cząsteczek.  Konformacja  przeciwciała 
ulega  w nim  zmianie,  wyrażającej  się  m.in.  usztywnie- 
niem połączeń  między  domenami  stałymi  (rys.  32b). 


W wyniku  zaś  tego  ulega  aktywacji  druga  funkcja 
przeciwciała  — funkcja  efektorowa:  przeciwciało  na- 
biera zdolności  do  wiązania  się  z błonami  komórek 
(np.  żernych,  trawiących  antygeny)  i z czynnikami 
znajdującymi  się  w osoczu  krwi,  a wyzwalającymi 
kaskadę  enzymatyczną  (tzw.  komplement,  czyli  do- 
pełniacz), niszczącą  spójność  błony  komórki  obcej. 
Przeciwciało  jest  receptorem,  który  rozpoznaje  sygnał 
obcości  w swojej  domenie  zmiennej,  a otrzymaną  in- 
formację przetwarza  w domenach  stałych  (rys.  32a,b) 
w postać  zrozumiałą  dla  wyspecjalizowanych  układów 
komórkowych  organizmu,  mogących  wyeliminować 
komórkę  czy  substancję  obcą. 

Za  zjawisko  odporności  odpowiedzialne  są  białe 
komórki  krwi  zwane  limfocytami.  Jedne  z nich  wytwa- 
rzają przeciwciała  i uwalniają  je  do  krwi  i innych  pły- 
nów ustrojowych;  odrębny  rodzaj  stanowią  limfocyty 
biorące  udział  w odczynach  alergicznych  w odrzuca- 
niu przeszczepów  tkankowych:  rozpoznają  one  anty- 
geny za  pomocą  swoich  receptorów,  związanych  z bło- 
ną komórkową.  Budowa  ich  jest  odmienna  (choć 

0 wielu  cechach  wspólnych)  niż  przeciwciał  i kontrolo- 
wane są  przez  odrębne  zespoły  genów.  Powstaje  w 
związku  z tym  pytanie,  jedno  z najważniejszych  we 
współczesnej  biologii : skąd  przeciwciało  czy  inny  re- 
ceptor „wie”,  że  dany  antygen  jest  obcy?  W jaki  spo- 
sób organizm  może  wyprodukować  tak  ogromną  ilość 
różnych  receptorów  (a  są  ich  zapewne  miliony),  roz- 
poznających praktycznie  wszystkie  determinanty  an- 
tygenowe, zarówno  naturalne,  jak  syntetyczne?  Nie- 
gdyś sądzono,  że  antygen  funkcjonuje  jak  matryca 
wytwarzająca  specyficzną  geometrię  obszaru  wiązania 
w nie  uformowanej  jeszcze  ostatecznie  cząsteczce  im- 
munoglobuliny.  Dziś  wiemy,  że  te  wszystkie  różne  re- 
ceptory istnieją  już  przed  pierwszym  kontaktem  orga- 
nizmu z antygenem,  w mało  zróżnicowanych  komór- 
kach macierzystych,  z których  powstają  immunolo- 
gicznie czynne  komórki,  limfocyty.  Antygen  jest  dla 
nich  sygnałem  wyzwalającym  — tak  jak  się  to  dzieje 
przy  pobudzeniu  komórki  przez  hormony  — podziały 

1 różnicowanie,  prowadzące  do  namnożenia  populacji 
komórkowej  zdolnej  do  swoistej  odpowiedzi  na  dany 
antygen.  Różnorodność  przeciwciał  (i  innych  tego  ro- 
dzaju receptorów  sygnału  obcości)  musi  więc  być  wy- 
nikiem działania  aparatu  genetycznego,  a genetyczna 
kontrola  biosyntezy  immunoglobulin  wydaje  się  wy- 
jątkową. Pojedynczy  łańcuch  polipeptydowy  immu- 
noglobuliny,  zarówno  lekki,  jak  ciężki,  jest  ciągły,  ale 
jego  dwie  funkcjonalnie  różne  części,  domena  zmienna 
i domena  stała,  są  pod  kontrolą  dwu  różnych  genów 
(ściślej:  zespołów  genów).  Ogólną  jednak  prawidło- 
wością biosyntezy  białka  jest  to,  że  jeden  łańcuch  po- 
lipeptydowy jest  kontrolowany  przez  jeden  gen.  W 
czasie  biosyntezy  immunoglobulin  nie  pojawiają  się 
odrębne  mRNA  (-»■  Kwasy  nukleinowe)  domeny 
zmiennej  i domen  stałych  ani  nie  występują  krótsze 
peptydy,  które  by  się  mogły  połączyć  w jeden  łańcuch 
(ciężki  lub  lekki)  po  zakończonej  translacji.  Można 
stąd  wnosić,  że  już  w obrębie  genetycznego  aparatu 
następuje  połączenie  genów  domeny  zmiennej  z genem 
(genami)  domen  stałych.  To  zapewne  dzięki  tej  szcze- 
gólnej właściwości  genów  immunoglobulin  do  do- 
meny zmiennej  mogą  się  włączać  krótkie  sekwencje 
aminokwasowe,  nadające  specyficzną  geometrię  cen- 
trum wiązania  antygenu.  Nie  wiadomo  jednak,  czy  w 
genach  domeny  zmiennej  zawarta  jest  informacja  na- 
byta w czasie  ewolucji  organizmu,  czy  też  powstaje  ona 
w wyniku  mutacji  somatycznych,  zachodzących  w ko- 
mórkach macierzystych  układu  odpornościowego. 
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Kwasy  nukleinowe 

Edward  Czuryio  i Magdalena  Fikus 

Najmniejszym  obiektem  żywym  jest  komórka.  Z te- 
oretycznych rozważań  biochemicznych  i biofizycz- 
nych  wynika,  że  najmniejsza  żywa  komórka  powinna 
mieć  średnicę  co  najmniej  50  nm,  a jej  sucha  masa  (ma- 
sa pozostała  po  odparowaniu  wody  z komórki)  po- 
winna by  się  składać  z ok.  1,5  min  atomów.  Średnica 
najmniejszej  żywej  komórki  znalezionej  przez  biolo- 
gów wynosi  ok.  100  nm  i jej  sucha  masa  zbudowana 
jest  z ok.  12  min  atomów. 

Ta  ogromna  liczba  atomów  połączona  jest  w czą- 
steczki, z których  znaczna  większość  to  cząsteczki  or- 
ganiczne, cząsteczki  zawierające  węgiel.  Węgiel  jest 
pierwiastkiem  czterowartościowym  i może  tworzyć 
wiązania  chemiczne  z czterema  innymi  atomami. 
Dzięki  temu  cząsteczki  organiczne  mogą  się  ze  sobą 
łączyć,  tworząc  tzw.  makrocząsteczki.  Makrocząstecz- 
ka, w której  się  powtarza  stale  określona  grupa  ato- 
mów (zwana  monomerem  lub  merem),  nazywa  się  po- 
limerem. Taka  makrocząsteczka  przypomina  łańcuch 
połączonych  ze  sobą  ogniw,  a proces  tworzenia  się  ta- 
kiego łańcucha  nazywa  się  polimeryzacją.  Można 
sobie  wyobrazić  łańcuch  (makrocząsteczkę)  zbudowa- 
ny z kilku  lub  kilkunastu  różnych  (pod  względem 
składu  chemicznego,  kształtu  lub  wielkości)  ogniw. 
Makrocząsteczka  zbudowana  z różnych  ogniw  nazy- 
wako  się  polimerem,  polimerem  złożonym  z kilku  uro- 
dzajów monomerów. 

W żywej  komórce  występuje  kilka  rodzajów  makro- 
cząsteczek — biopolimerów,  a każda  taka  makro- 
cząsteczka jest  kopolimerem  innej  grupy  związków  or- 
ganicznych; np.  makrocząsteczka  białka  (-*  Białka) 
zbudowana  jest  ze  związków  stanowiących  grupę 
aminokwasów  (istnieje  20  rodzajów  aminokwasów), 
cząsteczka  wielocukru  składa  się  z cząsteczek  tzw. 
cukrów  prostych. 

W dalszej  części  tego  artykułu  rozpatrzymy  budo- 
wę, strukturę  i funkcję,  jaką  spełniają  kwasy  nuklei- 
nowe — biopolimery  zbudowane  z merów  zwanych 
nukleotydami. 


Budowa  kwasów  nukleinowych 


W skład  kwasów  nukleinowych  wchodzą  atomy  wo- 
doru, węgla,  azotu,  tlenu  i fosforu.  Powtarzającymi 
się  jednostkami  kwasów  nukleinowych  są  nukleotydy, 
w których  skład  wchodzi  reszta  kwasu  fosforowego, 
cukier  i zasada.  W naturalnych  kwasach  nukleino- 
wych występują  dwie  różne  cząsteczki  cukru : ryboza 
i dezoksyryboza.  W zależności  od  tego,  jaki  cukier 
występuje  w kwasie  nukleinowym,  mówimy  o kwa- 
sach rybonukleinowych  lub  o kwasach  dezoksyrybo- 
nukleinowych (rys.  1).  Każdy  z tych  kwasów  zawiera 
cztery  zasady.  Kwas  rybonukleinowy  (RNA)  zawiera 
adeninę,  cytozynę,  guaninę  i uracyl,  kwas  dezoksyry- 
bonukleinowy (DNA)  — adeninę,  cytozynę,  guaninę 
i tyminę.  Odpowiednie  nukleotydy  oznaczamy  pierw- 
szymi literami  (dużymi)  nazw  zasady,  a dla  całkowite- 
go opisania  często  przed  nią  dodaje  się  małą  literę  r 
lub  d,  w celu  wskazania,  o jakim  rodzaju  nukleotydu 
mowa  (np.  rA,  dC  itp.). 

Podczas  łączenia  się  nukleotydów  w łańcuch  poli- 
nukleotydowy  reszta  kwasu  fosforowego  łączy  wiąza- 
niami kowalencyjnymi  atom  węgla  3' jednego  nukleo- 
tydu z atomem  węgla  5'  drugiego  nukleotydu  (rys.  1). 
W ten  sposób  powstaje  łańcuch  złożony  z dwu  rodza- 
jów ogniw,  które  występują  przemiennie,  a zasada  jest 
jak  gdyby  perełką  wiszącą  obok.  Kolejność  pojawia- 
nia się  po  sobie  poszczególnych  zasad  nie  jest  dowolna 
i jak  się  dowiemy  później,  ma  ona  ogromne  znaczenie 
dla  życia  całej  komórki  i organizmu. 


Rys.  1.  Łańcuchy  polinukleotydowe;  zasadę  umieszczono  w pro- 
stokącie, cukier  w pięciokącie,  a resztę  kwasu  fosforowego  w okrę- 
gu. W pierścieniu  cukrowym  podano  numerację  atomów  węgla, 
a)  Fragment  łańcucha  kwasu  dezoksyrybonukleinowego,  b)  Frag- 
ment łańcucha  kwasu  rybonukleinowego,  który  od  łańcucha 
kwasu  dezoksyrybonukleinowego  różm  są  tym,  że  w pierścieniu 
cukrowym  przy  atomie  węgla  2'  zamiast  wodoru  (H)  wystę- 
puje grupa  hydroksylowa  (OH),  c)  Scnemat  łańcucha  polinuklć- 
otydowego  (oznaczenia  analogiczne  jak  w punkcie  a) 


Struktura  kwasów 
nukleinowych 

Jedną  z podstawowych  cech  charakterystycznych 
struktury  biopolimerów  jest  kolejność  merów  w łań- 
cuchu makrocząsteczki  (w  wypadku  kwasów  nuklei- 
nowych kolejność  nukleotydów).  Jest  to  tzw.  sekwen- 
cja biopolimeru  lub  strifktura  pierwszorzędowa.  Na- 
stępną cechą  jest  ułożenie  poszczególnych  części  łań- 
cucha w przestrzeni,  czyli  tzw.  struktura  przestrzenna. 
Strukturę  przestrzenną  dzielono  na:  strukturę  drugo- 
rzędową — tworzenie  kształtów  śrubowych  odpowied- 
niego typu,  oraz  strukturę  trzeciorzędową  — ułoże- 
nie odcinków  śrubowych  i ewentualnych  odcinków 
nieśrubowych  względem  siebie.  Najnowsze  badania 
wykazały,  że  ten  podział  jest  sztuczny;  najczęściej 
tworzenie  się  spirali  i ich  wzajemna  orientacja  zależą 
tylko  od  sekwencji  i są  ściśle  uwarunkowane  odpo- 
wiednimi wymaganiami  fizycznymi.  Inaczej  mówiąc, 
przy  danej  sekwencji  i ściśle  określonych  warunkach 
tylko  jedna  struktura  będzie  najbardziej  ekonomiczna 
i najbardziej  trwała.  Strukturą  natywną  biopolimeru 
nazywamy  taką  strukturę,  która  zapewnia  jego  aktyw- 
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ność  biologiczną,  a więc  taką  strukturę  w jaKiej  wystę- 
puje w żywej  komórce. 

Istnieją  cząsteczki,  które  w komórce  łączą  się  po 
dwie  lub  więcej  i w takim  stanie  są  zdolne  spełniać 
swe  funkcje;  są  to  tzw.  struktury  nadcząsteczkowe. 


Struktura  DNA 

Na  podstawie  wyników  badań  rentgenograficznych 
prowadzonych  przez  M.  Wilkinsa  oraz  zebranych  do 
tego  czasu  wiadomości  chemicznych  i biochemicznych 
J.  D.  Watson  i F.  Crick  opracowali  w 1953  r.  model 
cząsteczki  DNA.  Zadanie  było  stosunkowo  łatwe,  po- 
nieważ wiadomo  było,  że  w skład  cząsteczki  DNA 
wchodzą  cztery  nukleotydy  oraz  że  liczba  nukleoty- 
dów A jest  równa  liczbie  nukleotydów  T,  liczba  zaś 
nukleotydów  C jest  równa  liczbie  nukleotydów  G.  Na 
tej  podstawie  stwierdzono,  że  tworzą  się  pary  nukleo- 
tydowe  utrzymywane  za  pomocą  wiązań  wodorowych 
(rys.  2).  Zjawisko  to  nazwano  komplementarnością 
nukleotydów. 

Cząsteczki  DNA  nie  tworzą  kryształów,  gdyż  są 
bardzo  duże,  a poza  tym  preparaty  DNA  najczęściej 
są  niejednorodne  pod  względem  długości  i składu 
nukleotydowego.  Ze  stężonych  roztworów  DNA  moż- 
na jednak  formować  włókna.  Włókno  takie  składa  się 
z wielu  cienkich  i długich,  równoległych  do  siebie  czą- 
steczek DNA.  Na  takie  włókna  można  skierować 
wiązkę  promieni  rentgenowskich,  a z zarejestrowane- 
go dyfrakcyjnego  obrazu  spróbować  odtworzyć  uło- 
żenie nukleotydów  w cząsteczce,  ustalić  jej  strukturę. 
Otrzymana  fotografia  (il.  118,  tabl.  29)  różni  się  od 
rcntgenogramu  wszelkich  kryształów.  Nie  można  na 
niej  znaleźć  refleksów  poszczególnych  atomów,  można 
jedynie  stwierdzić,  że  w cząsteczce  DNA  jest  powta- 
rzający się  element  strukturalny.  Należało  zatem  za- 
stosować inną  analizę  takiego  rentgenogramu  niż 
w wypadku  kryształów  (— ► Osiągnięcia  krystalografii 
białek). 

Przyjęto  istnienie  komplementarnych  par  zasad 
nukleinowych  i poszukiwano  takiej  struktury,  w któ- 
rej pary  te  powtarzałyby  się  periodycznie.  Następnie 
odtwarzano  dyfrakcyjny  obraz  dla  modelu  i porówny- 
wano go  z dyfrakcyjnym  obrazem  DNA  uzyskanym 
przez  Wilkinsa  (il.  118,  tabl.  29).  Podobieństwo  dy- 
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Rys.  2.  Komplementarne  pary  zasad  występujące  w heliksie 
DNA;  linią  przerywaną  zaznaczono  wiązania  wodorowe.  Liczby 
obok  atomów  wchodzących  w skład  pierścieni  oznaczają  nume- 
rację tych  atomów  odpowiednio  w zasadzie  purynowej  (dużej)  — 
adeninie  i guaninie,  oraz  w zasadzie  pirymidynowej  (malej)  — 
tyminie  i cytozynie 


frakcyjnego  obrazu  modelu  do  dyfrakcyjnego  obrazu  heliks 
cząsteczek  DNA  otrzymano  wtedy,  gdy  przyjęto  Watsona- 
strukturę  utworzoną  z dwu  nici  polinukleotydowych  Cricka 
skierowanych  antyrównolegle  i nawiniętych  na  po- 
wierzchnię walca  wzdłuż  prawoskrętnej  linii  śrubo- 
wej — heliksu.  Strukturę  taką  nazywamy  heliksem 
Watsona-Cricka.  Heliks  taki  (il.  1 17,  tabl.  29)  ma  śred- 
nicę 2 nm,  skok  3,4  nm  i skok  ten  utworzony  jest  przez 
10  par  nukleotydowych,  a zatem  na  jedną  parę  nukleo- 
tydów przypada  wycinek  heliksu  0,34  nm.  Płaszczyz- 
ny zasady  są  prostopadłe  do  osi  heliksu.  Ponieważ 
w obu  komplementarnych  parach  występuje  po  jednej 
zasadzie  „małej”  i po  jednej  „dużej”  średnica  heliksu 
jest  stała  na  całej  długości  cząsteczki. 

Widać  więc,  że  model  struktury  DNA  został  od- 
gadnięty a nie  ustalony  drogą  analityczną.  Dlatego  też 
jego  słuszność  była  przedmiotem  wielu  badań  kon- 
trolnych, których  wyniki  nie  pozwoliły  sformułować 
ważkich  zarzutów  podważających  zgodność  modelu 
z rzeczywistą  strukturą  DNA.  Natomiast  ustalono 
wiele  faktów,  które  potwierdzały  hipotezę  Watsona 
i Cricka  o helikalnej  budowie  makrocząsteczki  DNA 
i mechanizmie  przekazywania  informacji  genetycznej.  . 

Bardzo  ciekawe  doświadczenie  przeprowadzili  doświaccze- 
M.  Meselson  i E.  W.  Stahl,  którzy  stosując  ciężki  izo-  nio  Meselso- 
top  azotu  i prawo  Archimedesa  udowodnili  hipotezę  na  i Stahla 
Watsona  i Cricka.  Poświęćmy  temu  doświadczeniu 
nieco  więcej  uwagi. 

Kolonie  bakterii  E.  coli  hoduje  się  na  pożywce,  która 
zawiera  azot  15N,  a nie  zawiera  atomów  14N.  Po  pew- 
nym czasie  we  wszystkich  komórkach  bakteryjnych 
DNA  zawiera  zasady,  w których  występują  wyłącznie 
atomy  azotu  15N.  Masa  cząsteczkowa  tego  DNA  jest 
większa  od  masy  cząsteczkowej  DNA  bakterii  ho- 
dowanych na  normalnej  pożywce.  Różnica  między 
nimi  wynosi  ok.  1 % masy  cząsteczkowej  DNA.  Nie 
można  jej  stwierdzić  żadną  znaną  metodą  pomiaru  mas 
cząsteczkowych  polimerów,  gdyż  jest  ona  bardzo  ma- 
ła, mniejsza  od  dokładności  tych  metod.  Ponieważ 
przyrostowi  masy  M cząsteczkowej  nie  towarzyszy 
zmiana  objętości,  należy  przypuszczać,  że  zmieniła 
się  gęstość  cząsteczki.  Gęstość  DNA  zależy  od  pro- 
centowej zawartości  par  G-C  i waha  się  w granicach 
1,64-1,76  g/cm3.  Dokładność  pomiaru  gęstości  prepa- 
ratów DNA  jest  nie  mniejsza  niż  ±0,001  g/cm3. 

Gęstość  DNA  komórek  E.  coli  jest  następująca : gę- 
stość “N-DNA  wynosi  1,709  g/cm3, 15N-DNA  - 1,725 
g/cm3.  Gęstość  DNA  wyznacza  się  za  pomocą  wiro- 
wania w ultrawirówce  roztworu  tego  DNA  w stężo- 
nym (7,7M)  roztworze  chlorku  cezu  (CsCl).  Po  pew- 
nym czasie  wirowania  takiego  roztworu  jego  gęstość 
w różnych  miejscach  naczynia  wirowniczego  jest  róż- 
na. Zmiany  gęstości  zależą  w liniowy  sposób  od  odle- 
głości od  osi  obrotu,  tzn.  wirowanie  wytworzyło  linio- 
wy gradient  gęstości.  Jeśli  się  do  takiego  roztworu 
doda  małą  ilość  roztworu  DNA,  to  cząsteczki  tego 
DNA  będą  się  zbierały  w takim  miejscu  naczynia  wi- 
rowniczego, w którym  gęstość  roztworu  chlorku  cezu 
będzie  równa  gęstości  DNA.  Wynika  to  stąd,  że  na 
cząsteczkę  DNA  znajdującą  się  w roztworze  o więk- 
szej gęstości  będzie  działała  siła  wyporu  Archimedesa^ 
a na  cząsteczkę  znajdującą  się  w roztworze  o mniejszej 
gęstości  będzie  działała  siła  odśrodkowa. 

Badacze  przenosili  bakterie  E.  coli  hodowane  na 
pożywce  zawierającej  15N  na  pożywkę  zawierającą 
14N  i kontynuowali  hodowlę  przez  czas  równy  wzros- 
towi jednego  pokolenia  lub  dwu  pokoleń.  Z tych  bak- 
terii wydzielono  DNA  i wirowano  go  w roztworze 
CsCl.  Okazało  się,  że  DNA  z bakterii,  które  rosły  na 
pożywce  zawierającej  14N  przez  okres  wzrostu  jedne- 
go pokolenia,  ma  gęstość  równą  średniej  arytmetycz- 
nej gęstości  14N-DNA  i 15N-DNA.  Natomiast  DNA 
z bakterii,  które  rosły  na  pożywce  zawierającej  *4N 
przez  okres  równy  wzrostowi  dwu  pokoleń,  rozdziela 
się  na  dwie  warstwy,  przy  czym  gęstość  jednej  z nich 
jest  równa  gęstości  ł4N-DNA,  a gęstość  drugiej  war- 
stwy równa  się  gęstości  DNA  pierwszego  pokolenia 
bakterii.  Z wyników  tych  można  wyciągnąć  następują- 
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cy  wniosek:  w pierwszym  pokoleniu  bakterii  ich  DNA 
składa  się  z jednej  nici  zawierającej  zasady  z 14N  i jed- 
nej — z 15N.  W drugim  pokoleniu  część  bakterii  po- 
siada DNA  taki  jak  w pierwszym,  pozostała  zaś  część 
bakterii  posiada  DNA,  w którym  obie  nici  zawierają 
tylko  zasady  z 14N,  jest  to  ł4N-DNA. 
formy  Dalsze  badania  rentgenograficzne  włókien  DNA 
helikaflnych  wykazały,  że  parametry  heliksu  mogą  się  nieco  zmie- 
ONA  niać.  Wyróżnia  się  trzy  formy  helikalnych  DNA  we 
włóknach. 

W przypadku  włókien  utworzonych  z sodowej  po- 
tasowej lub  cezowej  soli  DNA  o wilgotności  względ- 
nej 75%  stwierdzono  formę  A.  Formę  A charakteryzu- 
forma  A je  się  skokiem  heliksu  2,8  nm,  zbudowanego  z 11  par 
nukleotydów,  których  zasady  są  nachylone  pod  kątem 
20°  do  osi  heliksu.  Podobną  strukturę  może  tworzyć 
dwuniciowy  RNA. 

W przypadku  soli  sodowej  DNA  o 92%  wilgotno- 
ści względnej  heliks  DNA  przyjmuje  parametry  iden- 
forma  B tyczne  jak  w modelu  Watsona  i Cricka  i tę  formę  na- 
zywamy formą  B. 

Wyniki  badań  przeprowadzonych  za  pomocą  in- 
nych metod  pozwalają  przypuszczać,  że  w roztworze 

0 małych  siłach  jonowych  DNA  tworzy  strukturę  zbli- 
żoną do  formy  B. 

forma  C Wyróżnia  się  również  formę  C utworzoną  przez  sól 
litową  DNA  o wilgotności  względnej  60%  (skok  he- 
liksu 3,1  nm,  który  wypełniony  jest  przez  9,3  par 
nukleotydów).  Zasady  tworzą  kąt  6°  z osią  heliksu. 
Heliks  DNA  przyjmuje  formę  C w roztworach  o wy- 
sokich stężeniach  soli  lub  w obecności  glikolu  etyle- 
nowego. 

Zbadano  również  parametry  heliksu  DNA  w hy- 
brydzie DNA-RNA.  Są  one  identyczne  jak  w przy- 
padku formy  A.  Ponieważ  helikalna  struktura  DNA 
utrzymywana  jest  głównie  przez  oddziaływania  war- 
stwowe i hydrofobowe  oraz  istniejące  wiązania  wo- 
dorowe, to  można  przypuszczać,  że  przejście  od  jednej 
formy  heliksu  do  innej  związane  jest  z różnym  wkła- 
dem poszczególnych  typów  oddziaływań  do  całkowi- 
tej energii  makrocząsteczki.  W praktyce  wkład  ten 
zmieniamy  przez  stosowanie  rozpuszczalników  odpo- 
wiedniej kompozycji  (zawartość  i rodzaj  soli,  pH,  za- 
wartość substancji  organicznych)  lub  też  przez  wpro- 
wadzenie do  roztworu  określonych  białek.  Można  więc 
przypuszczać,  że  w roztworze  cząsteczka  DNA  tworzy 
helikalną  strukturę  dynamiczną,  a jej  końcowymi 
formami  mogą  być  forma  A i B.  Ta  dynamiczna 
struktura  zapewnia  biologiczną  aktywność  DNA. 
W roztworach  mogą  się  tworzyć  struktury  pośrednie; 
niektóre  z tych  struktur  znaleziono  doświadczalnie 

1 stwierdzono,  że  są  to  struktury  metastabilne  i częściej 
występują  w DNA  bogatych  w pary  A-T. 

metody  wy-  W zależności  od  rodzaju  organizmu,  z którego  ko- 
znaczania  morek  pochodzi  DNA,  jego  masa  cząsteczkowa  zawie- 
masy  czą-  ra  się  w granicach  od  kilku  milionów  do  kilkunastu 
stoczkowej  miliardów  jednostek  masy  atomowej  (daltonów).  Do- 
kładne wyznaczanie  masy  cząsteczkowej  natywnego 
DNA  stanowi  dość  trudne  zagadnienie. 

Stosowanie  tradycyjnych  metod  hydrodynamicz- 
nych jest  niecelowe,  gdyż  łańcuchy  DNA  są  bardzo 
wrażliwe  na  występujące  napięcia  ścinające.  Inne  me- 
tody takie  jak  mikroskopia  elektronowa  czy  autora- 
diografia  wymagają  wstępnego  wzorcowania.  Z me- 
tod stosowanych  najlepsza  była  metoda  rozproszenia 
światła  pod  małymi  kątami.  Rozwój  techniki  lasero- 
wej stwarza  możliwość  zastosowania  do  badania 
współczynnika  dyfuzji  dużych  cząsteczek  dopplero- 
wskiego  przesunięcia  długości  fali  rozproszonego 
światła  laserowego.  Współczynnik  ten  wraz  ze  stałą 
sedymentacji  pozwala,  podobnie  jak  rozproszenie 
światła,  wyznaczyć  bezwzględną  masę  cząsteczkową. 
Inną  przeszkodą  na  drodze  do  wyznaczenia  masy  czą- 
steczkowej nat ywnego  DNA  są  trudności  w wyizolo- 
waniu nieuszkodzonych  cząsteczek.  W czasie  prepara- 
tyki DNA  narażony  jest  zarówno  na  napięcia  ścinają- 
ce jak  i na  działanie  enzywów  z grupy  nuideaz,  które 
mogą  trawić  łańcuch  DNA. 
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Niektórzy  badacze  uważają,  że  masa  cząsteczkowa 
DNA  w komórce  eukariontów  sięga  1,7 -1010  dalto- 
nów, a jego  cząsteczka  składa  się  z około  21  podjed- 
nostek o masie  8-108,  które  połączone  są  liniowo 
przez  odcinki  białkowe.  Właśnie  w miejscach  łączenia 
się  podjednostek  cząsteczka  bardzo  łatwo  ulega  rozer- 
waniu. W tym  przypadku  zakłada  się,  że  strukturą 
podjednostek  jest  właśnie  heliks  Watsona-Cricka. 

Komórki  prokariontów  zawierają  DNA  o masach 
cząsteczkowych  w granicach  od  106  do  10e  daltonów, 
a jego  struktura  przestrzenna  może  być  różna.  DNA  heiiksy 
tych  organizmów  może  być  dwuniciowym  heliksem  85niowe 
liniowym,  dwuniciowym  heliksem  kołowym  (kiedy  i kołowe 
końce  jego  łańcuchów  są  połączone  ze  sobą  fosfodw.u- 
estrowym  wiązaniem  kowalencyjnym)  bądź  też  wy- 
stępować w postaci  jednoniciowej  cząsteczki  koło- 
wej lub  jednoniciowej  cząsteczki  liniowej. 

Cząsteczki  dwuniciowego  DNA  kołowego  mogą 
tworzyć  superheliks  (tzn.  heliks  o odpowiednio  dużej 
średnicy  i dużym  skoku  linii  śrubowej)  utworzony 
z heliksu  Watsona-Cricka  (np.  DNA  niektórych  wi- 
rusów, plazmidowy  lub  chromosom  E.  coli).  W orga- 
nizmach wyższych  kołowy  DNA  dwuniciowy  wystę- 
puje w mitochondriach  i chloroplastach.  Struktura 
cząsteczek  DNA  jednoniciowego  liniowego  i kołowe- 
go prawdopodobnie  jest  zbliżona  do  struktury  RNA. 

Mimo,  że  struktura  przestrzenna  DNA  była  znana 
od  dawna,  to  przez  wiele  lat  nie  udawało  się  ustalić 
sekwencji  DNA  z dwu  podstawowych  przyczyn.  Po 
pierwsze  nie  znano  tak  specyficznych  dezoksyrybo- 
nukleaz  jak  rybonukleazy,  a po  drugie  otrzymane  pre- 
paraty DNA  były  mieszaniną  różnych  fragmentów 
natywnej  cząsteczki  DNA.  Dopiero  w 1977  r.  udało 
się  ustalić  sekwencję  DNA  bakteryjnego  wirusa  0X 
174.  Ten  DNA  koduje  9 znanych  białek  wirusa  0X 
174  i zbudowany  jest  z 5375  nukleotydów,  z czego 
około  10%  to  sekwencje  nie  wykorzystywane  w trans- 
lacji. Jest  to  jednoniciowy  DNA  kołowy  o masie  czą- 
steczkowej 1,6- 106  daltonów  i długości  około  0,6  pm, 
a zatem  jest  to  jeden  z najkrótszych  znanych  DNA. 

Cząsteczki  DNA,  których  masa  cząsteczkowa  jest 
rzędu  1010  daltonów  mają  długość  kilkunastu  milime- 
trów. Zrozumiałe  jest  więc,  że  cząsteczki  te  powinny 
być  w jakiś  sposób  „upakowane”,  aby  mogły  pomieś- 
cić się  w komórce,  a w przypadku  eukariontów  — w 
jądrze  komórkowym. 

W komórkach  eukariontów  DNA  znajduje  się  w 
chromosomach,  a te  z kolei  w jądrze  komórkowym. 

U różnych  gatunków  liczba  chromosomów  jest  różna'. 

Problem  w jaki  sposób  cząsteczka  DNA  rozmieszczo- 
na jest  w chromosomie,  pozostaje  nadal  otwarty. 

Wiemy,  że  dwuniciowy  heliks  ma  średnicę  2 nm,  a w 
komórce  oddziałuje  z białkami  i średnica  jego  zwiększa 
się  do  3 nm.  Przypuszcza  się,  że  cząsteczki  białka  od- 
działując z DNA  układają  się  w większej  (głębszej) 
bruździe  heliksu.  Prócz  tego  DNA  oddziałuje  z grupą 
białek  globularnych,  zwanych  histonami,  tworząc  histony 
z nimi  bardzo  specyficzne  kompleksy  o ściśle  określo- 
nej strukturze.  Kompleks  helikalnego  DNA,  histo- 
nów  i białek  niehistonowych  nazywamy  chromatyną.  chromatyna 

Znamy  pięć  rodzajów  białek  histonowych  (H'l,  H2a, 

H2b,  H3  i H4)  i ok.  20  białek  niehistonowych,  które 


Rys.  3.  Schemat  budowy  po- 
jedynczego nukleosomu.  Wi- 
doczne kule  symbolizują  glo- 
bule poszczególnych  białek 
histonowych 


wchodzą  w skład  chromatyny.  Sposób  oddziaływania 
i rola  białek  niehistonowych,  wchodzących  w skład 
chromatyny,  są  jeszcze  słabo  poznane.  Znacznie  wię- 
cej wiemy  o kompleksach  DNA  z histonami,  które 
nukleosomy  tworzą  tzw.  nukleosomy  (ii.  113,  tabl.  28).  W skład 
nukleosomu  wchodzi  po  dwie  cząsteczki  histonów 
H2a,  H2b,  H3  i H4  oraz  odcinek  heliksu  zawierający 
około  140  par  nukleotydowych  (rys.  3).  Ten  odcinek 
cząsteczki  DNA  tworzy  1,75  zwoju  superheliksu 
o średnicy  około  1 1 nm  i skoku  linii  śrubowej  około 
2,8  nm.  Nukleosom  ma  kształt  płaskiego  walca  o śred- 
nicy ok.  1 1 nm  i wysokości  ok.  5,7  nm.  Wyniki  te  uzy- 
skano z analizy  rentgenograficznej  kryształów  nukleo- 
somów  i są  one  zgodne  z wcześniej  uzyskanymi  wyni- 
kami za  pomocą  rozproszenia  promieni  rentgenow- 
skich pod  małymi  kątami  lub  rozproszenia  neutro- 
nów przez  roztwory  nukleosomów. 

Histon  HI  tworzy  kompleks  z nukleosomem,  ale 
nie  wiadomo,  w jaki  sposób  i jaka  jest  jego  rola.  Przy- 
puszcza się  jedynie,  że  nie  wpływa  on  na  strukturę 
nukleosomu.  Nie  jest  wykluczone,  że  kompleksuje  on 
z odcinkiem  heliksu  nie  biorącym  udziału  w superhe- 
liksie  i składającym  się  z ok.  40  par  nukleotydów. 
Przyjęcie  takiej  hipotezy  tłumaczyłoby  wyniki  badań 
biochemicznych,  z których  wynika,  że  powtarzającą 
się  jednostką  w chromatynie  jest  odcinek  heliksu  zło- 
żony z 200  par  nukelotydów. 


Struktura  RN  A 

Wydawało  się,  że  po  ustaleniu  helikalnej  struktury 
DNA  wyznaczenie  struktury  kwasów  rybonukleino- 
wych nie  będzie  przedstawiało  większych  problemów. 
Okazało  się  jednak,  że  przestrzenna  struktura  RNA 
w zasadniczy  sposób  różni  s i ę od  struktury  DNA.  Zna- 
my dwuniciowe  i jednoniciowe  cząsteczki  RNA. 
Struktura  oraz  wielkość  cząsteczki  zależą  od  funkcji, 
jaką  spełniają  kwasy  rybonukleinowe  w żywej  ko- 
mórce. Ze  względu  na  spełnianą  funkcję  kwasy  ry- 
bonukleinowe dzieli  się  na:  informacyjne  — mRNA, 
rybosomalne  — rRNA  i transportujące  — tRNA. 


Cząsteczki  tRNA  są  bardzo  małe,  gdyż  składają  się 
z 75-85  nukleotydów,  a ich  masa  cząsteczkowa  zawie- 
ra się  w granicach  30  000  daltonów,  stała  sedymen- 
tacji — ok.  4 S. 

Stała  sedymentacji  jest  to  wielkość  równa  stosunko- 
wi prędkości  osiadania  cząsteczek  do  przyspieszenia 
odśrodkowego  wywołującego  to  osiadanie,  a jedno- 
stką stałej  sedymentacji  jest  swedberg  (1  S = 10“13  s). 

Tak  małe  cząsteczki  jak  tRNA  nie  twForzą  włókien 
lecz  kryształy  i dzięki  temu  można,  podobnie  jak  w 
przypadku  białek  globularnych,  przeprowadzić  anali- 
zę fourierowską  rentgenogramów  i ustalić  położenie 
atomów  w przestrzeni.  Aby  jednak  tego  dokonać 
otrzymywane  monokryształy  powinny  być  odpowied- 
niej jakości  i trwałości.  Otrzymanie  takich  kryształów 
wymagało  około  dziesięciu  lat  pracy  naukowców  z kil- 
ku wyspecjalizowanych  laboratoriów  na  świecie. 
W międzyczasie  przeprowadzono  badania  innymi  me- 
todami, a najcenniejsze  wyniki  otrzymano  za  pomocą 
metody  rozproszenia  promieni  rentgenowskich  pod 
małymi  kątami  przez  roztwory  tRNA.  Dzięki  tym  wy- 
nikom można  było  wyznaczyć  kształt  cząsteczki,  tzn. 
wyznaczyć  taką  najmniejszą  pod  względem  objętości 
bryłę  geometryczną,  w której  by  się  mieściła  cała  czą- 
steczka tRNA.  Wprowadzając  wielkość  zwaną  elek- 
tronowym promieniem  bezwładności,  analogiczną  do 
promienia  bezwładności  układu  punktów  material- 
nych, można  było  przewidzieć  zagęszczenie  atomów 
w poszczególnych  częściach  cząsteczki.  Metoda  ta 
umożliwiła  obliczenie  masy  przypadającej  na  jedno- 
stkę długości  cząsteczki,  co  z kolei  pozwoliło  stwier- 
dzić, że  ta  jednoniciowa  cząsteczka  powinna  zawie- 
rać odcinki  helikalne  podobne  do  heliksu  Watso- 
na-Cricka,  lecz  utworzone  z jednego  łańcucha  polinu- 
kleotydowego. 

Pierwszy  model  struktury  przestrzennej  tRNA  opra- 
cowano w 1968  r.  W latach  następnych  udoskonalono 
stare  lub  proponowano  nowe  modele  tej  cząsteczki, 
pod  koniec  1974  r.  liczba  modeli  przekroczyła  20. 
Modele  te  różniły  się  głównie  ułożeniem  poszczegól- 
nych części  nici  polinukleotydowej  wewnątrz  czą- 
steczki, a więc  różnice  dotyczyły  tych  szczegółów 
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Rys.  4.  Makrocząsteczka  tRNA  przenoszącego  alaninę  w komórkach  drożdży:  a)  Kolejność 
nukleotydów  (w  tych  makrocząsteczkach  tRNA  występuje  wiele  zasad  różnych  od  zasad  A, 
C,  G i U ; zasady  te  nazywamy  zasadami  rzadkimi);  A adenina,  C cytozyna,  G guanina, 
U urydyna,  Gm  1-metyloguanina,  Gd  N2-dwumetyloguanina,  HgU-dwuhydrourydyna, 
T rybotymidyna,  ¥ pseudourydyna,  I inozyna,  lm  1-metyloinozyna,  CCA  ramię  aminokwa- 
sowe  (do  końca  3'  przyłączany  jest  aminokwas),  TC  ramię  posiadające  w swej  pętli  trójkę 
nukleotydów  T C,  AC  ramię  antykodonowe  (w  pętli  zaznaczono  trójkę  nukleotydów,  które 
są  komplementarne  do  kodonu  mRNA).  DHU  ramię  dwuhydrouracylowc,  s.a.  ramię  doda- 
tkowe (małe),  b)  Przestrzenny  model  makrocząsteczki  tRNA  wg  Kima,  1973  r. 
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struktury,  których  nie  można  było  ustalić  na  podsta- 
wie badań  rentgenograficznych  pod  małymi  kątami. 
Na  rys.  4b  przedstawiono  najnowszy  model  tej  czą- 
steczki, opracowany  na  podstawie  badań  rentgeno- 
graficznych kryształów  tRNA.  Większość  modeli 
opracowano  dla  przypadku  tRNA  transportującego 
alaninę  w komórkach  drożdży,  ponieważ  w 1965  r. 
R.W.  Holley  ze  współpracownikami  ustalili  sekwencję 
nukleotydów  w tym  tRNA  (rys.  4a).  Znajomość  sek- 
wencji w znacznej  mierze  ułatwiała  badania  struktural- 
ne, które  równocześnie  nie  traciły  na  ogólności,  gdyż 
struktura  wszystkich  tRNA  jest  identyczna.  Była  to 
pierwsza  cząsteczka  wśród  kwasów  nukleinowych, 
w której  ustalono  kolejność  nukleotydów.  W końcu 
1977  r.  znano  sekwencję  ok.  80  cząsteczek  tRNA  prze- 
noszących różne  aminokwasy  i pochodzących  z róż- 
nych organizmów. 

O strukturze  pozostałych  kwasów  rybonukleino- 
wych wiemy  znacznie  mniej,  a główną  przyczyną  tego 
jest  brak  metod  fizycznych  umożliwiających  badanie 
struktury  przestrzennej  jednoniciowych  cząsteczek 
o dużych  masach  cząsteczkowych. 

Cząsteczki  mRNA  stanowią  5-10%  ogólnej  zawar- 
tości kwasów  rybonukleinowych  w komórce.  Ich  masa 
cząsteczkowa  jest  bardzo  różna  i zawiera  się  w grani- 
cach 0,5* \QP-2‘  10*  daltonów,  co  jest  związane  z rolą 
biologiczną  tych  cząsteczek.  Korzystając  z doświad- 
czeń w ustalaniu  sekwencji  tRNA  rozpoczęto  ustale- 
nie sekwencji  mRNA.  Ustalono  sekwencję  mRNA 
z bakteriofaga  MS2  (bakteriofag  jest  to  wirus  zaka- 
żający bakterie),  który  ma  mRNA  kodujący  tylko  trzy 
białka.  Ustalono,  że  zawiera  ok.  3500  nukleotydów. 
Na  rys.  5 przedstawiono  sekwencję  wycinka  mRNA 
bakteriofaga  MS2,  kodującego  białko  złożone  z 129 
aminokwasów.  Wychodząc  z założenia,  że  istnieje 
maksymalna  liczba  wiązań  wodorowych  między  kom- 
plementarnymi parami  zasad  w łańcuchu  polinukleo- 
tydowym  (minimum  energii  konformacyjnej,  objaś- 
nione dalej),  zaproponowano  tzw.  strukturę  drugo- 
rzędową  tego  wycinka  mRNA.  Nie  wiemy  jednak, 
jak  poszczególne  odcinki  heliksu  są  zorientowane 
względem  siebie  w przestrzeni  oraz  względem  pozo- 
stałej (znacznie  większej)  części  cząsteczki. 


Najmniej  wiemy  o rybosomalnym  kwasie  rybonu-  rybosomalny 
kleinowym,  rRNA.  Zdołano  ustalić,  że  w jednej  ko-  kwas  rybo- 
mórce  istnieją  cztery  różne  typy  cząsteczek  tego  ro-  nukleinowy 
dzaju  kwasów  nukleinowych.  Ich  nazwy  wiążą  się  rRNA 
z szybkością  osiadania  w polu  sił  odśrodkowych  — 
stałą  sedymentacji.  Poszczególne  składniki  ryboso- 
malnego  RNA  to:  5S-RNA  o masie  cząsteczkowej 
ok.  3-104,  16S-RNA  (u  organizmów  wyższych 
18S-RNA)  o masie  cząsteczkowej  ok.  0,55*1 06, 

23S-RNA  (u  organizmów  wyższych  28S-RNA)  o ma- 
sie cząsteczkowej  ok.  1,2*1 06  daltonów.  Ustalono,  że 
28S-RNA  pewnej  linii  komórek  ludzkich  hodowa- 
nych w laboratoriach,  zwanych  komórkami  HeLa, 
składa  się  z co  najmniej  dwóch  łańcuchów;  jeden  krót- 
ki, składający  się  ze  140  nukleotydów,  posiada  stałą 
sedymentacji  ok.  5S.  Z powodu  braku  odpowiedniej 
nazwy  ta  czwarta  z kolei  cząsteczka  rybosomalnego 
RNA  nosi  na  razie  w literaturze  nazwę  „RNA  zwią- 
zane z 28S-RNA”.  Dotychczas  prowadzono  nad  tymi 
kwasami  głównie  badania  biochemiczne,  dzięki  któ- 
rym ustalono  sekwencje  5S-RNA  w kilkunastu  wypad- 
kach. Na  rys.  6 przedstawiono  jedną  z poznanych 
sekwencji  cząsteczki  5S-RNA  rybosomalnego  oraz 
jedną  ze  1 10  możliwych  struktur  drugorzędowych  tej 
cząsteczki  (wskazanie  odcinków  helikalnych  i tzw. 
odcinków  niestrukturowanych).  Z tych  110  struktur 
tylko  9 można  było  uznać  za  mało  prawdopodobne, 
wśród  pozostałych  101  szukano  dalej  takiej,  która  by 
była  prawdopodobna  w odniesieniu  do  innych  czą- 
steczek 5S-RNA  o znanej  sekwencji  i która  by  tłuma- 
czyła znane  fakty  chemiczne  i fizyczne.  Tak  np.  bada- 
nia za  pomocą  jądrowego  rezonansu  magnetycznego 
o wysokiej  rozdzielczości  wykazały,  że  w cząsteczce 
powinno  być  ok.  28  par  nukleotydów  połączonych 
wiązaniami  wodorowymi  (na  modelu  25  par),  a wśród 
nich  4 pary  A-U  (na  modelu  5 par  A-U).  W modelu 
cząsteczki  5S-RNA  należało  także  uwzględnić  krót- 
kie sekwencje,  które  nie  uczestniczą  w wiązaniach  wo- 
dorowych, lecz  wchodzą  w skład  odcinków  nieustruk- 
turowanych,  zwanych  pętlami,  oraz  inne  fakty  do- 
świadczalne. 
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Rys.  5.  Sekwencja  makrocząsteczki  mRNA  bakte-  ** 
riofaga  MS2.  Wycinek  zaznaczony  na  rysunku 
strzałkami  koduje  łańcuch  białka  złożony  z 129 
reszt  aminokwasowych.  Kropkami  zaznaczono 
wiązania  między  komplementarnymi  parami  nu- 
kleotydów, które  wchodzą  w skład  odcinków  he- 
likalnych. Kółeczkami  zaznaczono  wiązania  mię- 
dzy nietypowymi  parami  nukleotydów  wchodzą- 
cych do  heliksu 
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Rys.  6.  Płaski  model  cząsteczki  5S-RNA  (E.  coli ) oraz  kolejność 
nukleotydów  w jej  łańcuchu.  W modelu  postuluje  się  tworzenie 
trzech  par  U-G;  ich  wiązania  zaznaczono  na  rysunku  kropkami. 
Istnienie  par  U-G  jest  możliwe,  lecz  są  one  mniej  korzystne  ener- 
getycznie od  par  G-C.  Uważa  się,  że  część  zacieniowana  oddzia- 
łuje z 50S  składnikiem  rybosomu 


Jak  się  układają  poszczególne  części  tej  cząsteczki 
w przestrzeni,  na  razie  nie  wiemy;  należy  przypusz- 
czać, że  inne  jest  ułożenie  wówczas,  gdy  w roztworze 
znajdują  się  tylko  cząsteczki  5S-RNA,  a inne,  gdy 
wchodzą  one  w skład  rybosomu. 


Przejścia  konformacyjne 
w cząsteczkach 

kwasów  nukleinowych 

Jeśli  roztwór  dwuniciowych  heliksów  DNA  ogrzewać, 
zmieniać  pH  roztworu  lub  stosować  jakikolwiek  inny 
czynnik  wpływający  na  strukturę,  to  wiązania  wodoro- 
we między  komplementarnymi  zasadami  ulegają  ro- 
zerwaniu, a nici  polinukleotydowe  ulegają  rozdziele- 
niu. Proces  ten  zachodzi  spontanicznie  w przedziale 
ściśle  określonych  temperatur  lub  pH.  W przybliżeniu 
jest  to  przejście  fazowe  drugiego  rodzaju, 
dertsturacja  Rozdzielone  nici  polinukleotydowe  przyjmują  tzw. 

konformację  kłębkową,  w której  łańcuch  cząsteczki 
posiada  dużą  giętkość,  a ułożenie  poszczególnych  jego 
części  względem  siebie  jest  dość  dowolne.  Przejście  od 
struktury  helikalnej  do  struktury  kłębka  nazywamy 
przejściem  konformacyjnym  heliks-kłębek  lub  dena- 
turacją. 

Tworzenie  się  kłębków  obserwowano  bezpośrednio 
za  pomocą  mikroskopu  elektronowego.  Natomiast 
rozdzielenie  polinukleotydowych  nici  DNA  obserwo- 
wano za  pomocą  wirowania,  w gradiencie  gęstości 
CsCl,  natywnych  i zdenaturowanych  cząsteczek  DNA 
zawierającego  nici  1SN  i 14N  (patrz  wyżej).  Przed  dena- 
turacją  cząsteczka  DNA,  którego  jedna  nić  zawiera 
izotopy  azotu  15N,  a druga  14N,  posiada  gęstość 
1,717  g/cm3,  zaś  po  denaturacji  otrzymujemy  dwie 
warstwy,  z których  jedna  posiada  gęstość  1,724  g/cm3 
(nici  zawierające  izotop  14N),  a druga  1,740  g/cm3 
(nici  zawierające  izotop  15N).  Wzrost  gęstości  w obu 
przypadkach  spowodowany  jest  utworzeniem  kłęb- 
ka — struktury  o ściślejszym  upakowaniu  niż  he- 
liks. 

Przejście  konformacyjne  heliks-kłębek  jest  przej- 
ściem kooperatywnym,  tzn.  że  rozerwanie  wiązań  wo- 
dorowych między  komplementarnymi  parami  zasad 
następuje  na  odcinku  heliksu  o określonej  długo- 
ści, nie  mniejszej  niż  4 pary  zasad.  W przeciwnym 
wypadku  bilans  energetyczny  procesu  byłby  nieko- 
rzystny. 

W sprzyjających  warunkach  w wielu  miejscach  he- 
liksu mogą  powstawać  zalążki  denaturacji  — centra 
nukleacji,  które  z kolei  ułatwiają  denaturację  sąsiadu- 
jących odcinków  heliksu.  Jest  to  więc  proces  samona- 
si łający  się.  Powstawanie  wielu  zalążków  denaturacji 
potwierdza  niezwykle  szybko  zachodzący  proces  de- 


naturacji — DNA  o masie  cząsteczkowej  rzędu  108 
daltonów  ulega  denaturacji  w ciągu  około  1 minuty, 
podczas  gdy  denaturacja  postępująca  tylko  od  obu 
końców  trwałaby  kilkadziesiąt  dni. 

Taka  zmiana  struktury  wiąże  się  ze  zmianą  widma 
elektronowego,  lepkości  roztworu  i stałej  sedymenta- 
cji i innych  wielkości  fizykochemicznych  charakteryzu- 
jących strukturę  helikalną  DNA.  Obserwacje  tego 
procesu  prowadzi  się  przez  pomiary  odpowiedniej 
wielkości  w zależności  od  natężenia  czynnika  wywołu- 
jącego przejścia  strukturalne.  Otrzymuje  się  krzywą 
zależności  podobną  do  litery  S. 

Przejście  konformacyjne  zależy  od  wielu  właściwo-  znaczenie 
ści  DNA,  a jego  badanie  dostarcza  informacji  o sa-  badania 
mych  cząsteczkach  DNA.  Na  przykład  wykazano,  że  przejścia 
natywna  cząsteczka  DNA  posiada  dwukrotnie  więk-  konforma- 
szą  masę  cząsteczkową  niż  cząsteczka  zdenaturowana,  cyjnego 
co  z kolei  świadczy  o tym,  że  heliks  utworzony  jest 
z dwu  a nie  dowolnej  parzystej  liczby  nici  polinukleo- 
tydowych. 

Proces  przejścia  konformacyjnego  heliks-kłębek 
jest  analogiczny  do  procesu  topnienia  kryształu,  dla- 
tego często  mówi  się  o topnieniu  DNA,  zwłaszcza  jeśli 
czynnikiem  denaturującym  jest  temperatura.  Jeśli 
czynnikiem  wywołującym  przejście  konformacyjne 
jest  temperatura,  to  można  otrzymać  następujące  in- 
formacje. 

Można  wyznaczyć  temperaturę  przejścia  (topnie- 
nia) Tm  — temperaturę,  w której  50%  heliksu  zostało 
stopione. 

Można  wyznaczyć  szerokość  przejścia  konformacyj- 
nego (ATm)  — czyli  różnicę  odpowiadającą  stopieniu 
3/4  heliksu  i V*-  Jeśli  preparat  DNA  był  jednorodny, 
to  przejście  będzie  odbywało  się  w wąskim  przedziale 
temperatur.  Preparaty  niejednorodne  będą  się  charak- 
teryzowały dużymi  wartościami  ATm.  Szerokość 
przejścia  konformacyjnego  zależy  również  od  stężenia 
soli  w roztworze.  Przy  małych  siłach  jonowych  przej- 
ście odbywa  się  w szerszym  zakresie  temperatur,  a przy 
dużych  siłach  jonowych  w węższym. 

Energia  komplementarnej  pary  A-T  jest  mniejsza 
od  pary  G-C,  dlatego  też  wartość  Tm  jest  proporcjo- 
nalna do  zawartości  par  G-C  w heliksie.  Zatem  znając 
wartość  Tm  badanego  DNA  można  wyznaczyć  jaki 
procent  stanowią  w nim  pary  G-C.  Gdyby  zaś  w he- 
liksie były  długie  odcinki  różniące  się  w znaczny  spo- 
sób zawartością  par  G-C,  to  przejście  może  zachodzić 
wielostopniowo. 

Proces  odwrotny  do  procesu  denaturacji  nazywamy  denaturacja 
procesem  renaturacji  lub  przejściem  konformacyjnym 
kłębek-heliks.  Proces  ten  następuje  wtedy,  gdy  usu- 
niemy czynnik  powodujący  denaturację.  W omawia- 
nym powyżej  przypadku  będzie  to  obniżenie  tempera- 
tury. Z zasady  powinien  to  być  proces  fazowy  drugie- 
go rodzaju,  a w rzeczywistości  zależy  od  cech  renatu- 
rującego  DNA  i warunków,  w jakich  zachodzi  rena- 
turacja.  Łączenie  dwu  nici  polinukleotydowych  w pro- 
cesie renaturacji  zachodzi  w sposób  kooperatywny. 

Renaturacja  DNA  uwarunkowana  jest  procesem 
dyfuzji,  który  określa  prawdopodobieństwo  spotkania 
się  dwu  komplementarnych  nici  DNA.  Współczynnik 
dyfuzji  zależy  od  temperatury  i rozmiarów  cząstek  re- 
naturujących.  W niskich  temperaturach  (około  4°C) 
cząsteczki  DNA  będą  poruszały  się  w roztworze  naj- 
wolniej. W tym  zakresie  temperatur  najczęściej  spoty- 
kamy łączenie  się  fragmentów  dwu  łańcuchów  DNA 
o nieodpowiednich  sekwencjach,  ponieważ  nie  ma 
źródła  energii  umożliwiającej  rozerwanie  powstałych 
wiązań  wodorowych  między  kilkoma  nukleotydami. 

Współczynnik  dyfuzji  będzie  zmniejszał  się  wraz  ze 
wzrostem  ciężaru  cząsteczkowego  DNA  i będzie  ha- 
mował proces  renaturacji. 

Proces  renaturacji  będzie  zależał  również  od  siły  jo- 
nowej roztworu,  ponieważ  cząsteczki  DNA  posiadają 
znaczne  odpychające  się  ładunki  elektryczne.  Kationy 
znajdujące  się  w roztworze  ekranują  te  ładunki, 
zmniejszając  w ten  sposób  siły  odpychania  elektro- 
statycznego. 
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Prawdopodobieństwo  spotkania  się  dwu  komple- 
mentarnych nici  DNA  będzie  zależało  od  stężenia 
DNA  i czasu  trwania  renaturacji.  Im  większe  jest  stę- 
żenie DNA,  tym  mniejsza  jest  średnia  przebyta  droga 
konieczna  do  spotkania  innej  cząsteczki  DNA,  a im 
dłuższy  jest  czas  trwania  dyfuzji,  tym  dłuższa  jest 
średnia  przebyta  droga. 

Oprócz  zjawisk  dyfuzji  na  stopień  renaturacji  ma 
wpływ  sekwencja  DNA.  Na  przykład  znacznie  łatwiej 
będą  renaturowały  cząsteczki  typu  d(G)n-d(C)n  niż 
DNA,  w którym  występują  wszystkie  cztery  zasady 
i do  tego  połączone  w określonej  kolejności. 


Aktywność  biologiczna  kwasów 
nukleinowych  t 

Od  czasu,  gdy  w 1 944  r.  O.  T.  Avery  ze  współpracow- 
nikami udowodnili,  że  żywe  bakterie  mogą  wchłonąć 
DNA  pochodzący  z innych  bakterii  i uzyskać  w ten 
sposób  dziedzicznie  utrwaloną  nową  cechę  genetycz- 
ną, charakterystyczną  dla  bakterii  — dawcy  DNA,  na- 
gromadzono wiele  bezpośrednich  dowodów  doświad- 
DNA  — czalnych  na  to,  iż  DNA  jest  tą  substancją,  w której  się 
nośnik  infor-  zawiera  i w postaci  której  jest  przenoszona  informacja 
macji  gene-  genetyczna  żywych  organizmów. 

tycznej  Watson  i Crick,  postulując  strukturę  helikalną 
DNA,  zaproponowali  również  hipotetyczny  mecha- 
nizm wiernego  powielania  się  tej  struktury  poprzedza- 
jącego podział  komórki.  Lata,  które  nastąpiły  po  ogło- 
szeniu hipotezy  Watsona-Cricka,  były  latami  inten- 
sywnych badań  mechanizmów  rządzących  przekazy- 
waniem informacji  genetycznej  oraz  powielaniem, 
replikacją  materiału  genetycznego. 

Warto  może  zdać  sobie  sprawę  z fizycznych  rozmia- 
rów aparatu  genetycznego  żywych  organizmów.  W po- 
jedynczej somatycznej  komórce  organizmów  wyż- 
szych znajduje  się  wiele  cząsteczek  DNA,  różnych  pod 
względem  kolejności  nukleotydów  i długości  łańcu- 
cha. Gdyby  się  np.  wszystkie  takie  cząsteczki  zawar- 
te w komórce  ludzkiej  rozciągnęło  wzdłuż  prostej, 
w postaci  pojedynczego  heliksu  Watsona-Cricka, 
miałyby  one  łączną  długość  174  cm,  a ważyłyby  5 pi- 
kogramów.  Te  cząsteczki  DNA  zorganizowane  są 
w pewnych  okresach  życia  komórki  w struktury  zwane 
chromosomy  chromosomami;  w każdej  komórce  somatycznej  czło- 
wieka jest  46  chromosomów.  Długość  pojedynczej  czą- 
steczki DNA  składającej  się  na  największy  chromo- 
som wynosi  7,3  cm.  Sam  chromosom  ma  długość 
0,001  cm.  Już  zestawienie  liczb  wskazuje  na  to,  że 
DNA  musi  tworzyć  w chromosomie  zwarte  struktury, 
które  jednocześnie  dopuszczają  wierną  replikację 
DNA  przed  podziałem  komórki  i rozdział  powielo- 
nego DNA  między  dwie  potomne  komórki.  Niestety, 
mimo  iż  w tym  kręgu  zagadnień  pracuje  wielu  bada- 
czy, wiedza  o tych  strukturach  jest  jeszcze  niepełna. 

DNA  Łączna  długość  zawartych  w pojedynczej  komórce 
różnych  danego  organizmu  cząsteczek  DNA  nie  zawsze  zależy 
organizmów  °d  miejsca  tego  organizmu  na  drzewie  ewolucyjnym. 

I tak  np.  ssaki,  płazy  i gady  posiadają  podobny  zasób 
DNA,  ale  istnieją  również  płazy,  których  komórki  za- 
wierają 25  razy  więcej  DNA  niż  komórki  ssaków.  Po- 
nieważ część  łańcucha  DNA  w organizmach  wyż- 
szych odgrywa  rolę  strukturalną,  a nie  uczestniczy 
w przekazywaniu  informacji  genetycznej,  taka  sytua- 
cja jest  możliwa.  Jednak  ogólnie  biorąc,  w komórkach 
ptaków  i roślin  wyższych  jest  średnio  3 razy  mniej 
DNA  niż  w komórkach  ssaków,  w bakteriach  100- 
1000  razy  mniej,  w niektórych  małych  wirusach  — 
milion  razy  mniej.  Niemniej  jednak  w tej  ostatniej 
grupie  organizmów  DNA  musi  się  charakteryzować 
strukturami  wyższego  rzędu  niż  heliks  Watsona-Cri- 
cka; pojedyncza  cząsteczka  DNA  bakterii  E.  coli , sta- 
nowiąca jej  cały  aparat  genetyczny,  ma  0,12  cm  dłu- 
gości, podczas  gdy  sama  komórka  jest  tysiąc  razy 
krótsza. 


Informacja  genetyczna  komórki,  zakodowana  w jej 
DNA  wyrażana  jest  przez  syntezę  białek  tej  komórki. 

Białka,  enzymy  lub  elementy  strukturalne  (-*-  Białka) 
stanowią  o funkcjach  życiowych  komórki,  o jej  feno- 
typie. Ocenia  się,  że  w cyklu  życiowym  komórki  bak- 
teryjnej syntetyzowane  jest  ok.  3 tys.  różnych  białek, 
natomiast  w organizmie  człowieka  — ok.  5 min.  Moż- 
na obliczyć,  że  w gatunkach  żyjących  na  Ziemi  (ok. 

1,2  min)  produkowanych  jest  ok.  1012  różnych  rodza- 
jów białek  i 1010  różnych  rodzajów  kwasów  nukleino- 
wych. Tę  ogromną  liczbę  warto  porównać  z liczbą  ok. 

10*  organicznych  związków  chemicznych  syntetyzo- 
wanych dotychczas  przez  człowieka. 

W organizmach  wielokomórkowych  każda  komór- 
ka określonego  osobnika  zawiera  taki  sam  komplet 
cząsteczek  DNA.  Jednakże  wyspecjalizowane  tkanki 
produkują  wybrany  rodzaj  białek,  który  nie  jest  syn- 
tetyzowany w innych  komórkach  tego  samego  orga- 
nizmu. Tak  więc  w organizmach  wielokomórkowych 
muszą  istnieć  również  mechanizmy  wyboru  tych  in- 
formacji genetycznych,  które  powinny  być  realizowa- 
ne w zależności  od  wieku  organizmu  lub  specjalizacji 
danej  grupy  komórek,  tkanki.  Okazuje  się  również, 
o czym  wspomniano  wyżej,  że  nie  wszystkie  sekwencje 
DNA  organizmów  wyższych  mają  sens  genetyczny 
(realizowane  są  jako  białka),  niemniej  jednak  odgry- 
wają one  określoną  rolę  fizjologiczną.  Niektóre  ucze- 
stniczą w powstawaniu  struktur  DNA  wyższego  rzę- 
du niż  heliks  Watsona-Cricka. 

Zadziwiającą  cechą  żywej  komórki  jest  jej  zdolność 
do  bezbłędnej  niemal  samoreprodukcji  przez  setki  i ty- 
siące pokoleń.  Stabilność  DNA  przewyższa  większość  stabilność 
zapisów  informacji  pozostawionych  przez  ludzkość;  DNA 
bakterie  zachowały  cechy  biochemiczne  i morfologicz- 
ne podobne  do  cech  przodków  sprzed  milionów  lat. 

Jednocześnie  indywidualna,  konkretna  nić  cząsteczki 
DNA,  jest  tak  nietrwała  poza  organizmem,  że  ulega 
rozerwaniu  nawet  przy  przechodzeniu  przez  rurki 
szklane  o średnicy  milimetra.  Cząsteczka  DNA  może 
się  stać  również  celem  ataku  różnych  destrukcyjnych 
enzymów  znajdujących  się  w komórce,  jak  również 
ulegać  zmianom  chemicznym  pod  wpływem  takich 
czynników  zewnętrznych  jak  promieniowanie,  tem- 
peratura, niektóre  związki  przenikające  do  komórek. 

Zachowanie  zatem  genetycznej  stałości  gatunków  jest 
uwarunkowane  istnieniem  w żywych  organizmach 
skutecznych  układów  naprawczych,  które  szybko  usu- 
wają za  pomocą  enzymów  każde  lub  prawie  każde 
uszkodzenie  powstające  w DNA  i zapewniają  bez- 
błędne powielanie  DNA,  czyli  bezbłędną  replikację. 


Replikacja  DNA 

Replikacja  DNA  jest  procesem  złożonym  i do  dziś  nie 
do  końca  zrozumianym.  Najlepiej  poznane  są  pro- 
cesy replikacji  DNA  w bakteriofagach  i w bakteriach, 
mniej  wiadomo  o nich  w wyższych  organizmach,  posia- 
dających materiał  genetyczny  zlokalizowany  wewnątrz 
jądra  (eukariontach).  Nie  ulega  obecnie  wątpliwości, 
że  nawet  w najprostszych  organizmach  replikacja 
przebiega  w złożonym,  wieloskładnikowym  i wielo- 
enzymatycznym  kompleksie,  prawdopodobnie  związa- 
nym zc  strukturą  białkowo-lipidową  błony  komórko- 
wej. Nie  jest  łatwo  określić  składniki  takiego  kom- 
pleksu, gdyż  utrzymujące  go  w stanie  funkcjonalnym 
oddziaływania,  głównie  między  białkami,  należą  do 
oddziaływań  słabych,  kompleks  replikacyjny  ulega 
łatwo  rozpadowi  w czasie  prób  wydzielania  i oczysz- 
czenia jako  całości.  Z genetycznych  badań  replikacji 
w bakteriach  wiadomo  od  dość  dawna,  że  zależy  ona 
od  wielu  białek,  np.  co  najmniej  od  13  w £ coli , 
jednak  ich  rola  w replikacji  jest  w większości  przy- 
padków nieznana,  lub  w najlepszym  razie  nie  do  koń- 
ca wyjaśniona.  Zidentyfikowana  i oczyszczona  do  ho-  polimeraza 
mogenności  jest  polimeraza  DNA,  duże  białko  en-  DNA 
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Rys.  7.  Model  replikacji  DNA.  Dwa  komplementarne  łańcuchy 
macierzystego  DNA  ulegają  lokalnej  denaturacji,  tworząc  widełki 
replikacyjne.  Polimeraza  DNA  dobudowujc  łańcuchy  potomne 
do  rozdzielonych  łańcuchów  matrycy.  W dole  rysunku  ostatnia 
para  nukleotydów  (G-C)  została  narysowana  nie  symbolicznie, 
lecz  w postaci  odpowiednich  wzorów  chemicznych 


4$  - Encyklopedia  fizyki  współczesnej 
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zymatyczne,  które  syntetyzuje  z nukleotydów  po- 
tomne łańcuchy  DNA,  komplementarne  do  łańcu- 
chów macierzystych  (widać  to  na  rys.  7 i 8).  Kolejność 
nukleotydów  łańcucha  macierzystego  wyznacza  jed- 
noznacznie kolejność  nuekleotydów  w łańcuchu 


Rys.  8.  Autoradiogram  kolistej  cząsteczki  DNA  bakteryjnego, 
w trakcie  replikacji  (powiększenie  ok.  240  razy).  Hodowane  na 
nieradioaktywnym  podłożu  bakterie  przeniesiono  na  pożywkę 
zawierającą  znakowany  promieniotwórczym  izotopem  (trytem) 
nukleotyd,  który  polimeraza  DNA  wbudowała  do  replikowanego 
DNA.  Odcinki  intensywnie  zaczernione  przedstawiają  DNA  zna- 
kowany w obu  łańcuchach  podwójnej  spirali  (dwie  linie  czarne 
na  rysunkowym  schemacie  objaśniającym),  odcinki  jaśniejsze 
przedstawiają  DNA  znakowany  w jednym  łańcuchu  (linie  nie- 
biesko-czarne na  schemacie).  Zdjęcie  przedstawia  sytuację  przy 
końcu  drugiej  rundy  replikacji  po  dodaniu  izotopu 

potomnym  dzięki  zacnowaniu  zasady  komplemen- 
tamości  nukleotydów  jednego  łańcucha  do  nukleoty- 
dów drugiego.  Przypomnijmy,  że  naprzeciw  nukleo- 
tydu  A zostanie  wbudowany  do  nowego  łańcucha 
nukleotyd  T,  a naprzeciw  nukleotydu  G — nukleo- 
tyd C. 

replikacja  Z jednej  cząsteczki  macierzystej  powstają  zatem 
pólkonser-  dwie  identyczne  cząsteczki  potomne  DNA,  każda  zło- 

watywna  żona  z jednego  łańcucha  macierzystego  i jednego  no- 
wo syntezowanego.  Mechanizm  ten  nazwano  replika- 
cją  półkonserwatywną.  W wielu  badanych  systemach 
replikacyjnych  wykazano  istnienie  białek  specyficznie 
destabilizujących  strukturę  heliksu  Watsona-Cricka, 
wiążących  się  kooperatywnie  i specyficznie  z pojedyn- 
czołańcuchowym  DNA,  ułatwiających  denaturację 
macierzystego  DNA  w rejonie  replikacji.  Jedno  z bia- 
łek rozplątujących  podwój  nołańcuchowy  DNA  hy- 
drolizuje  jednocześnie  ATP  (-►  Organizacja  proce- 
sów życiowych  komórki),  jego  funkcja  życiowa  jest 
nieznana.  Odkryto  również  niezbędny  w replikacji 
enzym,  gyrazę  (inaktywacja  gyrazy  powoduje  na- 
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tychmiastowe  zatrzymanie  replikacji),  która  badana 
in  vitro  podwyższa  liczbę  superhelikalnych  zwojów 
DNA,  ułatwiając  w ten  sposób  w innym  rejonie  DNA 
rozplątanie  skrętów  heliksu  Watsona-Cricka.  Ten 
enzym  również  wymaga  jednoczesnej  hydrolizy  ATP. 

Wśród  pozostałych  białek  identyfikowanych  jako 
uczestniczące  w procesach  replikacji  wiele  wywołuje 
również  hydrolizę  niektórych  wysokoenergetycznych 
niskocząsteczkowych  substancji.  Wydzielająca  się 
wówczas  energia  prawdopodobnie  zużywana  jest  na 
wprowadzenie  allosterycznych  zmian  w białkach  kom- 
pleksu replikacyjnego,  rozkręcenie  podwójnego  helik- 
su DNA,  ułatwia  utrzymywanie  się  replikacyjnych  ze- 
społów białkowych  w całości.  Żadne  z odkrytych  do- 
tychczas białek  nie  dostarcza  samo  wg  ilościowych 
ocen,  wystarczającej  energii  do  tych  procesów. 

Interesującą  cechą  wszystkich  znanych  polimeraz 
DNA  jest  to,  że  nie  potrafią  one  rozpocząć  syntezy 
nowego  łańcucha  DNA.  Prawdopodobnie  syntezę 
taką  rozpoczyna  inny  enzym,  polimeraza  RNA, 
budująca  na  wzorcu,  łańcuchu  DNA,  jego  komple-  starter 
mentarną  kopię  RNA  zwaną  starterem.  Nie  wiado- 
mo, co  jest  sygnałem  do  zmiany  polimeraz,  w pewnym 
stadium  syntezy  startera  polimeraza  RNA  zostaje 
zastąpiona  przez  polimerazę  DNA,  która  kontynuuje 
polimeryzację  budując  już  potomny  łańcuch  DNA. 

Tak  przebiegająca  synteza  DNA  jest  nieciągła,  poli- 
meraza DNA  syntetyzuje  krótkie  fragmenty  łańcucha, 
zwane  od  nazwiska  odkrywcy  tego  zjawiska  fragmen- 
tami Okazaki;  w trakcie  jednej  rundy  replikacji  do- 
chodzi zatem  wielokrotnie  do  inicjacji  fragmentów 
Okazaki  przez  polimerazę  RNA  i elongacji  ich  przez 
polimerazę  DNA.  Startery  RNA  są  w późniejszym 
okresie  replikacji  usuwane  przez  inne  enzymy,  po- 
wstaiąca  na  ich  miejscu  luka  zapełniana  przez  poli- 
merazę DNA,  a fragmenty  Okazaki  łączone  w łańcuch 
ciągły  enzymem,  ligazą. 

Replikacja  DNA  rozpoczyna  się  zawsze  od  ściśle 
zdefiniowanego  odcinka  macierzystego  DNA  zwane- 
go punktem  początkowym  replikacji.  Przyczyna  wy- 
boru przez  kompleks  replikacyjny  punktu  początko- 
wego jest  nieznana,  w niektórych  wypadkach  został 
on  zlokalizowany  z dokładnością  do  kilkunastu  lub 
kilkudziesięciu  nukleotydów.  Wiadomo  również,  że 
inicjacja  replikacji  jest  kontrolowana  genetycznie  i że 
uczestniczą  w niej  specyficzne  białka  inicjatorowe. 

W niektórych  przypadkach  replikacja  biegnie 
w jednym  kierunku  od  punktu  początkowego, 
w niektórych  — jednocześnie  w obie  strony. 

Szybkość  replikacji  w bakteriach  (w  temperaturze 
37°)  ocenia  się  na  1 05 nukleotydów  polimeryzowanych 
w ciągu  minuty.  W przypadku,  gdy  do  łańcucha 
potomnego  włączony  zostanie  nukleotyd  niekomple- 
mentarny  istnieje  możliwość  bezpośredniego  popra- 
wienia tego  błędu  przez  polimerazę  DNA  i towa- 
rzyszące enzymy  drogą  wymiany  niewłaściwego  nu- 
kleotydu na  prawidłowy.  Wierność  replikacji  jest  bar- 
dzo wysoka,  błąd  popełniany  jest  nie  częściej  niż  raz 
na  1010  włączonych  nukleotydów.  Jednak  w pewnych 
warunkach  do  replikującego  się  DNA  może  zostać 
wbudowany  nieprawidłowy  nukleotyd,  lub  prawi- 
dłowy ulec  modyfikacji  chemicznej.  Może  to  stać  się 
przyczyną  mutacji  genetycznej,  tzn.  dziedziczonej  mutacja 
zmiany,  która  może  okazać  się  korzystna  lub  nie-  genetyczna 
korzystna  dla  organizmu.  Procesy  ewolucyjne  utrwa- 
lać będą  mutacje  korzystne  dla  gatunku,  eliminować  — 
mutacje  obniżające  żywotność  gatunku. 

Przyczynami  mutacji  mogą  być  również  zmiany 
chemiczne  w już  syntetyzowanej  cząsteczce  DNA, 
wywołane  przez  czynniki  zewnętrzne:  światło,  pro- 
mieniowanie ultrafioletowe,  jonizujące  i inne.  Nie 
zawsze  przyczyna  zmian  jest  nam  znana,  jeśli  nie  — 
mówimy  o mutacjach  spontanicznych.  Zdarzają  się 
zmiany  obejmujące  fragment  łańcucha  DNA,  np. 
podwojenie  pewnych  sekwencji  łańcucha,  dodanie 
(addycja)  lub  wypadnięcie  (delecja)  części  łańcucha 
DNA  czy  jednego  nukleotydu.  Jeśli  przyczyną  mu- 
tacji jest  modyfikacja  jednego  nukleotydu,  to  wtedy 


mutację  tę  nazywa  się  punktową.  Mutacje  punktowe, 
w odróżnieniu  od  delecyjnych  są  stosunkowo  łatwo 
odwracalne. 

Prawdopodobieństwo  mutacji  spontanicznej,  zmie- 
niającej funkcję  białka  u bakterii  jest  niewielkie 
(10“7-10“®  na  jedno  pokolenie  komórek),  ale  ze 
względu  na  dużą  liczebność  bakterii  w środowisku 
jest  ono  źródłem  pojawiania  się  mierzalnych  ilości 
zmienionych  osobników  (mutantów).  Przykładem  mu- 
cho roby  tacji  niekorzystnych  dla  gatunku  są  tzw.  choroby  ge- 
genetyczne  netyczne. 

Dobrze  poznanym  przykładem  takiej  choroby  jest 
złośliwa  anemia  sierpowata,  utrzymująca  się  wśród 
afrykańskich  plemion  murzyńskich.  Białko  hemoglo- 
biny (masa  cząsteczkowa  ok.  67  tys.  daltonów)  wy- 
dzielone z krwinek  ludzi  chorych  różni  się  od  białka 
normalnej  hemoglobiny  tylko  tym,  że  aminokwas  — 
kwas  glutaminowy  zastąpiony  został  przez  amino- 
kwas — walinę.  Różnica  ta,  wydawałoby  się  nie- 
znaczna, powoduje,  że  ludzie  dotknięci  anemią  sier- 
powatą  umierają  w wieku  młodzieńczym.  Opisano 
wiele  innych  nieprawidłowych  hemoglobin  i stwierdzo- 
no, że  w każdym  wypadku  zmiana  funkcji  wynika 
z niewielkiej  zmiany  w składzie  aminokwasowym  glo- 
biny  ludzi  chorych. 

Przekazywanie  informacji  genetycznej  z DNA  do 
komórki  jest  wynikiem  dwu  procesów:  transkrypcji 
i translacji. 


Transkrypcja  informacji 
genetycznej 


Określenie  transkrypcja  obejmuje  procesy  syntezy 
RNA  wg  wzorca  DNA,  a więc  polega  na  przeniesieniu 
informacji  genetycznej  z jednego  kwasu  nukleinowego 
(DNA)  na  drugi  (RNA).  W procesach  transkrypcji 
uczestniczą : DNA  jako  matryca,  enzym  polimeryzu- 
jący (polimeraza  RNA),  białka,  niskocząsteczkowe 
substraty  i substancje  regulatorowe,  tzw.  efektory 
(rys.  9,  10  i il.  119,  tabl.  29).  Polimeraza  RNA  rozpo- 


DNA 

Rys.  9.  Model  transkrypcji  RNA.  Syntetyzowany  na  matrycy 
lokalnie  zdenaturowanego  DNA  informacyjny  RNA  (mRNA) 
łączy  się  z rybosomami  i tworzy  kompleks  translacyjny 


rybosom  połączony 
z tRNA  rozpoczy- 
nający syntezę 


O°oc 

substraty 
o«oo  (nukleotydy) 


RNA 


A kierunek 
1 przesuwa- 
1 nia  się 
I polimerazy 
RNA 


mm 


am 

m ■-•-i'-  ■ & " Si  m „ z&mą  -- 


Rys.  10.  Dwa  odcinki  DNA  bakteryjnego  (zdjęcie  w mikroskopie 
elektronowym,  powiększenie  150  000  razy).  W dolnym  fragmencie 
DNA  ulega  transkrypcji,  syntetyzowany  jest  mRNA,  który  jesz- 
cze w trakcie  transkrypcji  łączy  się  z rybosomami,  tworząc  poli- 
som. Rozpoczyna  się  synteza  polipeptydu  (translacja).  W prawej 
górnej  części  zdjęcia  widać  globularne  cząsteczki  polimerazy 
RNA  rozpoczynającej  transkrypcję,  w lewej  dolnej  części  — naj- 
starszy mRNA  widoczny  na  zdjęciu,  będący  w trakcie  intensyw- 
nego procesu  translacji 


znaje,  nie  wiadomo  jeszcze  jak,  ten  fragment  łańcucha 
DNA,  od  którego  się  rozpoczyna  transkrypcja.  Roz- 
poczęcie transkrypcji  oraz  jej  kontynuacja  związane 
są  z koniecznością  lokalnego  rozplątania  heliksu  ma- 
trycy DNA,  gdyż  transkrypcji  ulega  tylko  jeden  łań- 
cuch DNA.  W ogromnej  większości  poznanych  przy- 


padków polimerazy  RNA  są  białkami  składającymi 
się  z podjednostek,  w polimerazie  bakteryjnej  jedna  z 
nich,  tzw.  białko  sigma,  ułatwia  jedynie  specyficzne 
rozpoczęcie  transkrypcji,  a następnie  ulega  odłączeniu 
od  kompleksu  transkrybującego.  Polimerazy  RNA, 
jak  już  wiemy,  w odróżnieniu  od  polimerazy  DNA, 
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mogą  rozpoczynać  transkrypcję  de  novoy  nie  wymaga- 
jąc do  tego  startera. 

Nie  wyjaśniono  również  mechanizmu  kończenia 
transkrypcji  z określonego  odcinka  DNA,  nie  wia- 
domo, jaki  sygnał  decyduje  o rozpadzie  transkrypcyj- 
nego  kompleksu  i oddzieleniu  się  polimerazy  i pro- 
duktu (RN A)  od  matrycowego  DNA.  Być  może  w 
procesie  tym  odgrywają  rolę  dodatkowe  białka.  Jed- 
nym z takich  białek  jest  np.  tzw.  czynnik  rho,  w obec- 
ności którego  transkrypcja  kończy  się  we  właściwym 
dla  danego  genu  rejonie  DNA. 

prekursor  Ważną  cechą  procesu  transkrypcji,  poznaną  stosun- 
RNA  kowo  niedawno,  jest  to,  że  jego  pierwotny  produkt, 
tzw.  prekursor  RNA,  jest  dłuższy  niż  odpowiadający 
mu  RNA  biologicznie  aktywny.  Prekursor  taki  podle- 
ga następnie  procesowi  dojrzewania,  w którym  uczest- 
niczą liczne,  często  wysokospecyficzne  enzymy.  Pro- 
ces dojrzewania  polega  na  skracaniu  łańcucha  pre- 
kursora oraz  na  dodatkowych  modyfikacjach,  np. 
metylacji  lub  dodawaniu  końcowych  fragmentów, 
nie  mających  swoich  komplementarnych  odpowied- 
ników w matrycowym  DNA.  Prekursory  mRNA  ko- 
mórek eukariontów  syntezowane  w jądrze  składają 
się  w ok.  10%  z właściwych  sekwencji  mRNA,  który 
pełni  swą  funkcję  następnie  poza  jądrem,  w cyto- 
plazmie;  pozostałe  90%  to  sekwencje  dodatkowe 
strukturotwórcze  lub  chroniące  mRNA  przed  nuklea- 
zami,  nigdy  nie  opuszczające  jądra.  Prawie  we  wszyst- 
kich mRNA  organizmów  eukariotycznych  jeden 
z końców  składa  się  tylko  z nukleotydów  adeniny  (A) 
dodanych  enzymatycznie  do  mRNA  już  po  transkryp- 
cji. Ta  właściwość  pozwoliła  na  łatwe  oddzielenie  pre- 
paratywne  mRNA  od  całej  puli  innych  kwasów  nuklei- 
nowych komórki,  umożliwiła  w następstwie  oczysz- 
czanie mRNA  pojedynczych  genów,  oznaczanie  se- 
kwencji ich  podjednostek  nukleotydowych,  a także 
zastosowanie  nowych  technik  inżynierii  genetycznej 
(zob.  niżej)  do  syntezy  genów  w probówce. 

Warto  tu  również  dodać,  że  zarówno  prekursor 
mRNA  w jądrze,  jak  i mRNA  w cytoplazmie,  nie  wy- 
stępują nigdy  w formie  wolnego  kwasu  nukleinowego, 
a jedynie  w kompleksach  ze  specyficznymi  białkami 
informosomy  tworząc  tzw.  informosomy.  W kompleksie  tym  rola 
białek  może  polegać  na  blokowaniu  pewnych  odcin- 
ków mRNA,  a więc  może  być  rolą  regulatora  aktyw- 
ności biologicznej  mRNA.  Jedną  z większych  sensacji 
genetyki  molekularnej  ostatnich  lat  stało  się  odkrycie, 
iż  w organizmach  eukariotycznych  niektóre  geny  są 
podzielone  na  fragmenty,  oddzielone  jeden  od  drugie- 
go odcinkami  DNA  o długości  porównywalnej  do 
długości  genu,  których  nie  odnajduje  się  następnie 
w dojrzałym  transkrybowanym  mRNA  tego  genu. 
Fakt  ten  sugeruje  istnienie  nowych,  nieznanych  dotąd 
sposobów  regulacji  wyrażania  aktywności  określo- 
nych genów  organizmów  eukariotycznych. 

Wszystkie  typy  RNA  syntetyzowane  w procesie 
transkrypcji  (mRNA,  tRNA,  rRNA)  grają  rolę  w pro- 
cesach translacji,  czyli  w procesie  przeniesienia  infor- 
macji genetycznej  z kwasu  nukleinowego  (mRNA) 
na  białko  (rys.  9). 


Translacja  informacji 
genetycznej 


Jak  wyjaśniono  uprzednio,  kwasy  nukleinowe  skła- 
dają się  z 4 rodzajów  podjednostek,  nukleotydów, 
białka  zaś  — z 20  podjednostek,  aminokwasów.  Dla- 
tego też  translacja  byłaby  niemożliwa  przy  założeniu, 
że  jednemu  ftukleotydowi  odpowiada  jeden  amino- 
kwas, jak  również  w wypadku  sekwencji  dwunukleo- 
tydowych,  tzn.  kombinacji,  w której  dwóm  nukleoty- 
dom  odpowiada  jeden  aminokwas,  bo  takim  sekwen- 
cjom przypisać  można  tylko  1 6 różnych  aminokwasów. 
Z prostych  reguł  kombinatoryki  wynika,  że  dopiero 
trójnukleotydowe  „litery”  (64  możliwych  kombina- 
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cji)  składają  się  na  „alfabet”  bogatszy  niż  dwudziesto-  kod 
literowy  „alfabet”  aminokwasowy.  Okazało  się,  że  genetyczny 
istotnie  w przyrodzie  ustalił  się  powszechny  kod  trój- 
kowy. Trójce  nukleotydów  w mRNA  w określonej 
kolejności  (kodonowi)  odpowiada  jeden  i tylko  jeden 
aminokwas.  Badania  te  pozwoliły  na  określenie  nastę- 
pujących cech  kodu  genetycznego:  a)  Kod  jest  uni- 
wersalny, tzn.  taki  sam  w całym  świecie  istot  żywych, 
od  wirusa  do  człowieka.  Fakt  ten  świadczy  o tym,  że 
ewolucja  kodu  została  bardzo  dawno  zakończona  i że 
stanowi  ona  optymalne  rozwiązanie  problemu  trans- 
lacji genetycznej,  b)  Kod  jest  trójkowy,  ciągły  i nie  za- 
chodzący, tzn.  odczytywane  są  kolejne  trójki  nukleo- 
tydowe  w łańcuchu  mRNA  i każdy  z nukleotydów 
wchodzi  w skład  tylko  jednego  kodonu.  Dzięki  tej 
właściwości  kodu  pojawienie  się  w łańcuchu  białka 
danego  aminokwasu  nie  zależy  od  rodzaju  poprze- 
dzającego i następującego  po  nim  aminokwasu,  c)  Kod 
jest  zwyrodniały,  tzn.  ten  sam  aminokwas  może  być 
zapisany  więcej  niż  jedną  trójką  nukleotydów.  Ta 
cecha  kodu  pozwala  na  syntezę  dowolnych  białek 
również  i w organizmach,  których  DNA  jest  szczegól- 
nie bogate  w niektóre  nukleotydy,  a ubogie  w inne, 
tym  niemniej  wystarcza  im  kodonów  do  wyrażenia 
wszystkich  aminokwasów  składających  się  na  białka 
konieczne  do  życia,  d)  Kod  jest  współliniowy,  tzn. 
kolejność  kodonów  odpowiada  kolejności  wbudowa- 
nych do  białka  aminokwasów,  odpowiadających  ko- 
donom.  e)  Kod  jest  odczytywany  od  określonego  pun- 
ktu startowego  w sposób  ciągły,  znane  są  kodony  po- 
czątkujące i kończące  odczytywanie  danej  informacji. 

Czasem  znajomość  kodu  genetycznego  pozwala  na 
poszukiwanie  i izolowanie  mRNA,  matrycy  w synte- 
zie określonych  białek.  Tak  np.  produkowane  przez 
poczwarki  jedwabnika  białko,  fibroina,  ma  bardzo 
szczególny  skład  aminokwasowy;  zawiera  45%  ami- 
nokwasu glicyny,  reszta  zaś  to  tylko  dwa  aminokwasy: 
alanina  i seryna.  W kodonach  odpowiadających  tym 
aminokwasom  przeważa  nukleotyd  guanylowy.  Z po- 
czwarek  jedwabnika  udało  się  wydzielić  RNA  bogaty 
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Rys.  1 1 . Schemat  struktury  rybosomu  bakteryjnego.  W skład 
aktywnego  biologicznie  rybosomu  (70S)  wchodzą  dwie  różnej 
wielkości  podjednostki  (30S  i 50S).  Każda  podjednostka  składa 
się  z rRNA  i rybosomalnych  białek.  Różne  geometryczne  figury 
w prawej  części  rysunku  symbolizują  różnice  w budowie  między 
poszczególnymi  białkami  rybosomalnymi ; skręcone  nici  — struk- 
tury przestrzenne  rybosomalnych  RNA 

Stała  sedymentacji  jest  proporcjonalna  do  masy  cząsteczkowej 
makrocząsteczki  podniesionej  do  potęgi  a (s  ~ A/*,  a — współ- 
czynnik zależny  m.in.  od  kształtu  makrocząsteczki) 
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w nukleotyd  guanylowy;  stanowił  on  aż  1,4%  ogólnej 
puli  RNA  poczwarki  i posiadał  rzeczywiście  cechy 
mRNA  fibroiny. 

Można  przypomnieć  tu  również  omawiany  już 
przykład  anemii  sierpowatej,  której  przyczyną  mole- 
kularną jest  zmiana  jednego  aminokwasu  w białku 
krwi,  globinie.  Dzięki  ustaleniu  zapisu  kodu  gene- 
tycznego wiemy,  że  kodonami  kwasu  glutaminowego 
są  dwie  trójki  nukleotydów,  GAA  i GAG,  natomiast 
waliny  — GUA  i GUG.  Tak  więc  anemia  sierpowata 
jest  wynikiem  zastąpienia  w mRNA  reszty  A przez 
resztę  U.  Oznacza  to  również,  że  w odpowiadającym 
temu  mRNA  odcinku  DNA  nastąpiła  zmiana  nu- 
kleotydu  A na  nukleotyd  T (mutacja). 

Tak  więc  wszystkie  informacje  genetyczne  zostały 
zapisane  językiem  trójek  nukleotydów  DNA,  następ- 
nie przepisane  w procesie  transkrypcji  do  RNA.  Od- 
czytanie kodu  odbywa  się  w procesie  translacji,  czyli 
syntezy  białka,  zgodnie  z kolejnością  ułożenia  ko- 
donów  w łańcuchu  mRNA. 

Odczytywanie  RNA  informacyjnego  wymaga  po- 
wstania kompleksu  mRNA  z rybosomami  (tzw.  poli- 
somu).  Budowa  i skład  rybosomów  bakteryjnych 
pokazana  jest  schematycznie  na  rys.  11.  Rybosomalne 
białka  i rRNA  zostały  wydzielone,  oczyszczone  i częś- 
ciowo zbadane.  Udało  się  również  uzyskać  funkcjo- 
nalnie aktywny  rybosom  po  zmieszaniu  w odpowied- 
nich warunkach  uprzednio  rozdzielonych  i oczyszczo- 
nych składników.  Udało  się  również  zbadać  niektóre 
oddziaływania  wzajemne  składników  rybosomu,  scha- 
rakteryzować część  sił  utrzymujących  strukturę  rybo- 
somu, prowadzone  są  intensywne  badania  roli  bio- 
logicznej rybosomalnego  RNA  i poszczególnych  bia- 
łek rybosomalnych  oraz  jakim  zmianom  ulega  struk- 
tura w czasie  funkcjonowania  rybosomu. 

Aminokwasy  nie  zbliżają  się  do  mRNA  jako  swo- 
bodne cząsteczki,  lecz  przyłączone  do  tRNA.  Przyłą- 
czenie to  katalizowane  jest  przez  zespół  enzymów, 
syntetaz  aminoacylo-tRNA.  Każdy  aminokwas  może 
być  przyłączony  do  cząsteczki  swojego  specyficznego 
tRNA  tylko  przez  taką  syntetazę.  Specyfika  tRNA 
polega  na  tym,  że  w jego  cząsteczce  znajduje  się  trójka 
nukleotydów  zwana  antykodonem  (rys.  4a).  Antyko- 
don  i kodon  mRNA  są  komplementarne,  dzięki  temu 
możliwe  jest  między  nimi  oddziaływanie  takie  jak 
w podwójnej  spirali  DNA.  Kod,  jak  już  wspomniano, 
jest  zwyrodniały,  a więc  ten  sam  aminokwas  może  być 
przyłączony  więcej  niż  do  jednego  tRNA,  a miano- 
wicie do  tych  tRNA,  których  antykodony  są  komple- 
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Rys.  12.  Schemat  przebiegu  syntezy  białka  w rybosomie.  Rybo- 
som przesuwa  się  wzdłuż  łańcucha  mRNA.  Kolejne  kodony 
mRNA  odczytywane  są  przez  komplementarne  trójki  nukleoty- 
dów (antykodony)  w tRNA.  W rybosomie  znajdują  się  dwa  miej- 
sca wiążące,  miejsce  A,  wiążące  tRNA  aminokwasu,  który  ma  być 
włączony  do  łańcucha  polipeptydowego,  i miejsce  By  do  którego 
przyłączony  jest  poprzedzający  tRNA  połączony  z syntetyzowa- 
nym łańcuchem  polipeptydowym.  Po  utworzeniu  wiązania  pep- 
tydowego  tRNA  przesuw-a  się  z miejsca  A na  miejsce  B , a drugi 
tRNA  zostaje  uwolniony  z miejsca  B i z rybosomu.  Aczkolwiek 
tRNA  mogą  się  różnić  między  sobą  sekwencją  nukleotydów,  to 
ich  struktura  przestrzenna  musi  być  w zasadzie  podobna,  tak  aby 
pasowała  do  struktury  nadcząsteczkowej  przedstawionego  tu 
schematycznie  kompleksu  translacyjnego 


mentarne  do  wszystkich  kodonów  danego  amino- 
kwasu. Dotychczas  w komórce  bakteryjnej  znaleziono 
ponad  50  różnych  tRNA. 

Proces  łączenia  aminokwasów  w łańcuchu  białko-  synteza 
wym  tak  zwanymi  wiązaniami  peptydowymi  przebiega  białka 
wewnątrz  rybosomu  (rys.  12).  Kompleks  rozpoczyna- 
jący syntezę  białka  składa  się  z kilku  białek  o aktyw- 
ności enzymatycznej,  z mRNA,  z rybosomów,  z ni- 
skocząsteczkowego  związku  — dawcy  energii,  z tRNA 
połączonego  z aminokwasem.  Wyróżniono  również 
białka,  których  obecność  konieczna  jest  do  zapocząt- 
kowania translacji,  inne  uczestniczą  w procesie  prze- 
dłużania łańcucha  polipeptydowego,  w przesuwaniu 
rybosomu  wzdłuż  mRNA  do  następnych,  jeszcze  nie 
odczytanych  kodonów,  w kończeniu  syntezy  danego 
polipeptydu,  w wiązaniu  tRNA  połączonego  z ami- 
nokwasem do  rybosomu.  Jednym  z białek  ryboso- 
malnych jest  również  enzym,  transferaza  peptydowa, 
syntetyzująca  wiązanie  peptydowe.  Po  zakończeniu 
syntezy  białko  zostaje  odłączone  od  rybosomu  i po- 
zostaje w cytoplazmie. 


Rys.  13.  DNA  przedstawiony  został  jako  okrąg,  w takim  kształcie 
występuje  w bakteriach  i bakteriofagach.  W wyniku  transkrypcji 
na  matrycy  DNA  powstają  wszystkie  typy  RNA,  o różnej  struk- 
turze przestrzennej,  co  schematycznie  zaznaczono  na  rysunku. 
Transkrybowanc  RNA  różnią  się  również  funkcjonalnie:  rRNA 
łączy  się  z białkami  rybosomalnymi  i tworzy  aktywny  biologicz- 
nie rybosom  (schemat  w ramce  w dole  rysunku),  tRNA  przyłącza 
aminokwas  (schemat  w ramce  w górnej  części  rysunku)  i w tej 
aktywnej  formie  dołącza  się  do  rybosomu  połączonego  z mRNA. 
W wyniku  translacji  informacji  zawartej  w mRNA  powstaje  po- 
lipeptyd  (białko),  który  uwalnia  się  od  rybosomu.  Po  sfałdowaniu 
w strukturę  natywną  oraz  po  transporcie  do  odpowiedniego  re- 
jonu komórki  białko  to  jest  gotowe  do  wypełniania  swej  funkcji 
biologicznej 


Ogólny  schemat  omówionych  pokrótce  procesów 
transkrypcji  i translacji  ze  szczególnym  uwzględnie- 
niem roli  RNA  podany  został  na  rys.  13. 


Inżynieria  genetyczna 


Poznanie  wzajemnych  zależności  między  strukturą 
i funkcją  kwasów  nukleinowych  w żywej  komórce 
uzależnione  jest  od  znajomości  sekwencji  nukleoty- 
dów w natywnej  cząsteczce  kwasu  nukleinowego, 
DNA  lub  RNA.  Nie  można  się  spodziewać  pełnego 
wytłumaczenia  mechanizmu  żadnego  z omówionych 
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tu  procesów:  replikacji,  mutagenezy,  transkrypcji, 
translacji,  jeżeli  nieznana  będzie  budowa  uczestni- 
czących w tych  procesach  biopolimerów,  a także 
zmiany  zachodzące  w strukturze  w zależności  od 
funkcjonalnego  stanu  badanego  biopolimeru.  Pod- 
czas gdy  w latach  1965-1975  rozwinęły  się  znacznie 
metody  badania  sekwencji  różnych  RNA  to  w dzie- 
dzinie oznaczania  sekwencji  DNA  postęp  był  nie- 
zwykle powolny.  Sytuacja  ta  uległa  radykalnej  zmia- 
nie z chwilą  odkrycia  i scharakteryzowania  (od  1972  r.) 
restryktazy  nowej  grupy  enzymów  działających  na  DNA,  naz- 
wanych restryktazami.  Enzymy  te,  izolowane  z bak- 
terii, nacinają  łańcuch  DNA  wtedy,  gdy  zawiera  on 
określoną  sekwencję  kilku  nukleotydów,  w taki 
sposób,  że  pozostawiają  po  obu  stronach  nacięcia 
krótki  pojedynczołańcuchowy  fragment  DNA.  I tak 
np.  jedna  z najlepiej  poznanych  restryktaz,  Eco  RI, 
nacina  DNA  w następujący  sposób: 


G 1 AATTC G A AT  TC ... . 

* Eco  RI  + 

GTTAA  | G CTTAA  G 


Powstałe  jednołaócuchowe  końce,  zwane  lepkimi, 
mogą  w odpowiednio  dobranych  warunkach  odna- 
leźć się  i dopasować,  zgodnie  z zasadą  komplementar- 
ności  nukleotydów.  Jeżeli  dodać  wówczas  enzym, 
który  może  zszywać  przerwy  w ciągłości  łańcucha 
ligaza  DNA,  ligazę,  to  nastąpi  połączenie  dwu  fragmentów 
DNA  uprzednio  przez  restryktazę  naciętych.  Według 
tej  strategii  można  połączyć  ze  sobą  dwa  łańcuchy 
DNA  wydzielone  z dowolnych  organizmów,  pod  wa- 
runkiem, że  były  nacinane  przez  ten  sam  enzym  re- 
strykcyjny. To  odkrycie  stało  się  podstawą  rozwoju 
nowego  działu  biologii  molekularnej  niekiedy  zwa- 
nego inżynierią  genetyczną. 

DNA — DNA,  który  chcemy  badać,  dołączamy  w wyżej 

wektor  opisany  sposób  do  innego  DNA,  zwanego  DNA- 
wektorem.  DNA-wektorem  mogą  być  plazmidy  lub 
DNA  wirusów,  które  mogą  wejść  do  żywej  komórki 
i tam  replikować  przez  dowolną  liczbę  pokoleń. 
W ten  sposób  można  uzyskać  dowolną  ilość  intere- 
sującego nas  DNA  połączonego  ligazą  z DNA-wek- 
torem.  Podstawowy  schemat  takich  zabiegów  przed- 
stawiał się  w 1977  r.  jak  następuje: 

— Oczyszczano  mRNA  transkrybowane  z określo- 
nego genu  o znanej  funkcji  i o znanym  produkcie 
białkowym. 

— Specyficzną  polimerazą  DNA  izolowaną  z wiru- 
sów onkogennych  syntetyzowano  na  matrycy  tego 
mRNA  dwułańcuchowy  DNA  komplementarny  do 
mRNA,  który  nazwać  można  syntetycznym  genem. 
— Syntetyczny  gen  dołączono  do  DNA-wektora 
i wprowadzono  do  komórki  bakteryjnej,  która  przez 
wiele  generacji  replikowała  wektor  razem  z synte- 
tycznym genem. 


— Izolowano  z powrotem  DNA-wektor,  wycinano 
z niego  restryktazą  syntetyczny  gen  i sprawdzano  czy 
nie  uległ  on  zmianie  w czasie  wielokrotnych  replikacji 
w komórce  gospodarza. 

Jednocześnie  i współzależnie  od  odkrycia  i stoso- 
wania restryktaz  opracowano  dwie  nowe  i szybkie 
metody  sekwencjonowania  DNA.  Jeżeli  w 1974  r. 
oznaczenie  sekwencji  20  nukleotydów  DNA  zajmo- 
wało dwa  lata,  to  w cztery  lata  później  wykonywano  je 
w jeden  dzień.  Osiągnięty  postęp  jest  tak  wielki,  że  sta- 
ło się  łatwiejszym  ustalenie  sekwencji  DNA  niż  sek- 
wencji RNA,  a nawet  z sekwencji  DNA  przepowiada 
się  już  sekwencje  aminokwasów  w trudniejszych  do 
oczyszczenia  białkach,  produktach  danego  genu 
(DNA). 

Metody  inżynierii  genetycznej,  aczkolwiek  w dużej 
mierze  oparte  na  procedurach  itt  vitro>  stanowią 

0 tak  wielkim  postępie  w rozumieniu  struktury  genu 

1 jego  transkryptu,  mRNA,  a także,  co  jeszcze  waż- 
niejsze, o sposobach  regulacji  ich  aktywności,  że  nie 
mogą  być  pominięte  przy  omawianiu  struktury  i funk- 
cji kwasów  nukleinowych. 

W krótkim  artykule  trudno  wyłożyć  wszystkie 
aspekty  problemu  wzajemnych  zależności  między 
strukturą  i funkcją  kwasów  nukleinowych.  Aby  przed- 
stawić w dostatecznie  zwartej  postaci  wszystkie  naj- 
ważniejsze zagadnienia  z punktu  widzenia  biologicz- 
nego, trzeba  było  zrezygnować  z opisu  wielu  metod 
fizycznych,  które  niezmiernie  wzbogaciły  naszą  wie- 
dzę o kwasach  nukleinowych  (-+•  Przedmiot  i proble- 
my biofizyki  molekularnej). 

W przedstawionym  schemacie  funkcjonowania  dlaczego 
kwasów  nukleinowych  w komórce  starano  się  głów-  istotne 
nie  podkreślić  pojawianie  się  w opisywanych  proce-  jest 
sach  przejściowych  oddziaływań  kwasów  nukleino-  badanie 
wych  między  sobą  i z białkami  oraz  to,  że  dopiero  kwasów 
zespół  biopolimerów  może  odgrywać  określoną  rolę  nukleino- 
biologiczną.  Co  więcej,  cechą  specyficzną  organiz-  wych 
mów  żywych  jest  fakt  tworzenia  przez  biopolimery 
funkcjonalnych  struktur  wyższych  rzędów,  takich  jak 
chromatyna,  kompleksy  polimeraz  z matrycami 
i substratami,  rybosomy,  informosomy  i polisomy. 

Struktury  te  mogą  powstawać  w określonych  warun- 
kach doświadczalnych  spontanicznie,  bez  udziału 
enzymów,  a więc  informacja  o nich  zawarta  jest 
a priori  w strukturze  przestrzennej  składników.  Dla- 
tego też  badania  struktur  podstawowych  i ich  wza- 
jemnych oddziaływań  mają  zasadnicze  znaczenie 
w pojmowaniu  procesu  życia.  W tej  dziedzinie  wiedzy 
należy  się  też  spodziewać  wciąż  nowych,  być  może 
zaskakujących  odkryć. 

J.  Ciernochowska  i in.  Molekularne  podstawy  życia , Warsza- 
wa 1976;  J.  N.  Davidson  Biochemia  kwasów  nukleinowych.  War- 
szawa 1977;  Fizyczne  metody  badań  białek  i kwasów  nukleino- 
wych, red.  Ju.  S.  Łazurkin,  Warszawa  1972;  J.  D.  Watson  Biolo- 
gia molekularna  genu , Warszawa  1975;  M.  W.  Wolkensztejn 
Na  skrzyżowaniu  dróg  wiedzy,  Warszawa  1975. 


Molekularne  podstawy  skurczu 
mięśnia 

Hanna  Strzelecka -Gołaszewska 


Współczesne  poglądy  na  temat  molekularnego  mecha- 
nizmu skurczu  mięśni  są  rezultatem  wieloletnich 
badań  fizjologów,  morfologów,  biochemików  i bio- 
fizyków. Najczęstszym  obiektem  dotychczasowych 
badań  były  mięśnie  szkieletowe  kręgowców.  Mięśnie 
te,  należące  do  grupy  mięśni  poprzecznie  prążkowa- 
nych, mają  strukturę  bardziej  regularną  niż  inne  typy 
mięśni,  toteż  stanowią  odpowiedniejszy  materiał  do 
badań  mikroskopowych  i rentgenograficznych,  a zwła- 
szcza do  śledzenia  z zastosowaniem  tych  właśnie  me- 
tod zmian  strukturalnych  zachodzących  podczas 

758 


skurczu.  W badaniach  biochemicznych,  wymagają- 
cych dużych  ilości  materiału,  najczęściej  używane  są 
mięśnie  królika,  natomiast  mięśnie  sartorius  i semi- 
tendinosus  żaby  okazały  się  — ze  względu  na  ich 
wielkość  i kształt  — najodpowiedniejsze  do  doświad- 
czeń nad  mechaniką  i energetyką  skurczu.  Niektóre 
zagadnienia  badane  są  również  porównawczo  na 
różnych  typach  mięśni  różnych  zwierząt.  Badania  te 
wykazały,  że  mimo  specyficznych  różnic  w sposobie 
działania,  budowie  makro-  i mikroskopowej  oraz 
w molekularnej  strukturze  i właściwościach  białek 


hydroliza 

ATP 


reakcje 

odtwarzające 

ATP 


kurczliwych  różnych  typów  mięśni  podstawowe  me- 
chanizmy skurczu  są  wspólne.  Co  więcej,  ostatnie 
badania  nad  organizmami  jednokomórkowymi  oraz 
wielokomórkowymi,  lecz  nie  posiadającymi  wyspe- 
cjalizowanej tkanki  mięśniowej,  wskazują  na  to,  że 
podstawą  wszelkiego  rodzaju  ruchliwości  są  te  same 
lub  bardzo  zbliżone  mechanizmy  molekularne. 


cie  nie  obserwuje  się  zmian  zawartości  ATP  aż  do 
momentu  wyczerpania  zapasu  fosfokreatyny. 

Inny  enzym  (miokinaza)  katalizuje  przeniesienie 
grupy  fosforanowej  z jednej  cząsteczki  ADP  na  drugą, 
z wytworzeniem  jednej  cząsteczki  ATP  i jednej  czą- 
steczki kwasu  adenozynomonofosforowego  (AMP): 

2 ADP  ATP+ AMP.  (3) 


Źródła  energii  skurczu 

Mięsień  jest  czymś  w rodzaju  biologicznego  silnika 
przekształcającego  energię  chemiczną,  zmagazyno- 
waną w prostych  substancjach  chemicznych,  w energię 
mechaniczną.  Wiadomości  o przemianach  energe- 
tycznych związanych  ze  skurczem  pochodzą  z badań 
na  mięśniach  wyizolowanych  z organizmu  i drażnio- 
nych sztucznie  impulsami  elektrycznymi,  imitującymi 
impulsy  nerwowe  w organizmie  zwierzęcym. 

Badając  zmiany  chemiczne  zachodzące  w kurczą- 
cym się  mięśniu,  ustalono  ponad  wszelką  wątpliwość, 
że  bezpośrednim  źródłem  energii  mechanicznej  i cie- 
pła wydzielanego  podczas  skurczu  jest  reakcja  hy- 
drolizy kwasu  adenozynotrój fosforowego,  w skrócie 
ATP,  w wyniku  której  powstają  kwas  adenozyno- 
dwufosforowy  (ADP)  i kwpas  ortofosforowy: 


(1) 


OH 


Ta  reakcja  przebiega  w kierunku  syntezy  ATP 
dopiero  wówczas,  gdy  stężenie  ADP  przewyższa 
stężenie  ATP,  toteż  w warunkach  normalnej  pracy 
mięśnia  ma  ona  mniejsze  znaczenie,  odgrywa  nato- 
miast ważną  rolę  przy  intensywnej  pracy,  prowadzącej 
do  wyczerpania  zapasu  fosfokreatyny. 

Łączny  zapas  energii  zawartej  w ATP  i fosfokreaty- 
nie  w mięśniach  żaby  wystarcza  na  wykonanie  80- 
100  skurczów.  Wykonywanie  przez  mięsień  jeszcze 
większej  pracy  — nawet  wówczas,  gdy  jest  on  wyizo- 
lowany z organizmu,  a więc  odcięty  od  dopływu  sub- 
stancji pokarmowych  — możliwe  jest  dzięki  procesom 
metabolicznym  odtwarzającym  ATP  z ADP  i nieor- 
ganicznego fosforanu.  Źródłem  energii,  która  w toku 
tych  procesów  magazynowana  jest  w wiązaniu  koń- 
cowej grupy  fosforanowej  w cząsteczce  ATP,  jest 
utlenianie  węglowodanów  i tłuszczów.  Wspólny  dla 
przemiany  węglowodanów  i tłuszczów  końcowy  łań- 
cuch reakcji  składających  się  na  proces  tzw.  oksyda- 
cyjnej fosforylacji  jest  najbardziej  wydajnym  pro- 
cesem fosforylacji  ADP.  Ponieważ  jednak  jest  on 
uzależniony  od  obecności  tlenu,  przeto  odgrywa  rolę 
przy  krótkotrwałej  oraz  długotrwałej,  lecz  powolnej 
pracy  mięśni,  a także  w okresie  „odnowy”,  po  za- 
kończeniu pracy.  Podczas  intensywnej  pracy  szyb- 
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kwas  adenozynotrójfosforowy  (ATP) 


} P O P 0H  + H20 


ADP2-  H"  HPOj_4-  energia 


Zawartość  ATP  w mięśniu  jest  stosunkowo  niska 
i wystarcza  najwyżej  na  10  kolejnych  skurczów,  gdy 
tymczasem  wyizolowany  z organizmu  mięsień  może 
w warunkach  tlenowych  wykonać  ponad  1000  skur- 
czów. W każdym  mięśniu  zachodzi  bowiem  wiele 
procesów  enzymatycznych,  które  odtwarzają  rozło- 
żony ATP.  Najważniejszą  z reakcji  utrzymujących 
stały  poziom  ATP  w pracującym  mięśniu  jest  prze- 
niesienie gupy  fosforanowej  z innego  wysokoenerge- 
tycznego związku  fosforowego,  a mianowicie  fosfo- 
kreatyny, na  ADP  (przeniesienie  jest  katalizowane 
przez  enzym  kreatynofosfotransferazę): 

O-  ch3 

O-— P— N— C— N— CH2— COO-  -f  ADP 

II  i tl 

O H NH 

fosfokreatyna 

H CH3 

H— Ń®— C— Ń— CH„— COO-  + ATP. 

I I! 

H NH 

kreatyna 

Reakcja  ta  jest  odwracalna  — nie  towarzyszą  jej 
zmiany  swobodnej  energii  układu,  lecz  kierunek  jej 
przebiegu  uzależniony  jest  od  stężeń  reagujących 
ze  sobą  związków  w taki  sposób,  że  ADP,  powstający 
w mięśniu  w wyniku  hydrolizy  ATP,  jest  natychmiast 
przekształcany  w ATP  (fosforylacja  ADP)  i w rezutta- 


kość  dostarczania  tlenu  przez  krew  jest  niewystarcza- 
jąca dla  zapewnienia  sprawnego  przebiegu  reakcji 
tlenowych. 

Odtwarzanie  ATP  z ADP  i nieorganicznego  fosfo- 
ranu w warunkach  beztlenowych  zapewnia  proces 
glikogenolizy,  obejmujący  wstępne  etapy  przemiany 
glikogenu.  W obecności  tlenu  produkt  glikogenolizy  - 
kwas  pirogronowy  — wchodzi  w cykl  reakcji  prowa- 
dzących do  jego  całkowitego  spalenia;  w warunkach 
niedotlenienia,  np.  przy  dużym  wysiłku  fizycznym, 
glikogen  ulega  przemianie  beztlenowej,  której  końco- 
wym produktem  jest  kwas  mlekowy,  gromadzony 
w mięśniu  podczas  pracy,  a następnie  usuwany  przez 
krwiobieg  i utleniany  w innych  narządach. 

Część  ATP  powstającego  w procesach  oksydacyjnej 
fosforylacji  i glikogenolizy  służy  z kolei  do  odtwo- 
rzenia zapasu  fosfokreatyny  (reakcja  2). 

(2)  Wszystkie  wymienione  procesy  i pojedyncze  reakcje 
chemiczne  umożliwiają  przenoszenie  energii  chemicz- 
nej zawartej  w różnorodnych  substancjach  pokarmo- 
wych na  ATP  — jedyną  substancję  zdolną  do  prze- 
kazywania energii  chemicznej  elementom  kurczli- 
wym, które  przekształcają  ją  na  pracę  mechaniczną. 

Badania  nad  mechanizmem  przekształcania  przez 
mięsień  energii  chemicznej  w mechaniczną  zostały  za- 
początkowane odkryciem  przez  W.  A.  Engelhardta 
i M.  N.  Lubimową  w 1939  r.,  że  jedno  z głównych 
strukturalnych  białek  mięśniowych  — miozyna  — jest 
enzymem  katalizującym  hydrolizę  ATP,  oraz  o dwa 
lata  późniejszą  obserwacją  A.  Szent-Gyorgyiego, 
że  miozyna  połączona  z drugim  białkiem  mięśnio- 
wym — aktyną  — po  wstrzyknięciu  przez  rurkę  ka- 
pilarną do  wody  wytrąca  się  w postaci  nici,  które  po 

759 


najprostszy 

model 

skurczu 

mięśnia 


dodaniu  ATP  ulegają  skurczeniu.  W ten  sposób  uzys- 
kano najprostszy  modelowy  układ  złożony  z miozyny, 
aktyny  i ATP,  umożliwiający  badanie  procesów,  które 
zachodzą  w żywym  mięśniu  podczas  skurczu.  Uzys- 
kane tą  drogą  informacje,  łącznie  z wynikami  jed- 
nocześnie prowadzonych  badań  nad  molekularną 
organizacją  miozyny  i aktyny  w mięśniu,  ukształto- 
wały współczesne  poglądy  na  molekularny  mecha- 
nizm skurczu. 


Budowa  komórek  mięśniowych 


Wszystkie  typy  mięśni  zbudowane  są  z jedno-  lub 
wielojądrowych  komórek  w kształcie  włókien  o śred- 
nicy ok.  100  pm.  Włókna  mięśni  szkieletowych  i mięś- 
nia sercowego  kręgowców  wypełnione  są  przebiega- 
jącymi przez  całą  długość  komórki,  ułożonymi  rów- 
mrofibryle  nolegle  włókienkami,  noszącymi  nazwę  miofibryli. 

Miofibryle  wykazują  regularne  poprzeczne  prążko- 
wanie, widoczne  na  podłużnych  przekrojach  mię- 
śnia w mikroskopie  optycznym.  Na  podstawie  ob- 
serwacji w mikroskopie  polaryzacyjnym  ustalono, 
że  prążkowanie  to  jest  skutkiem  występowania  wzdłuż 
miofibryli  na  przemian  stref  mających  właściwość 
podwójnego  załamywania  światła,  które  w związku 
z tym  otrzymały  nazwę  prążków  anizotropowych 
(w  skrócie  prążki  A)y  oraz  stref  nie  mających  tej  wła- 
ściwości, czyli  prążków  izotropowych  (prążki  I) 
(rys.  la).  Ponadto  wyróżniono  cienki,  ciemniejszy 
prążek  przechodzący  w poprzek  każdego  prążka  / 
i dzielący  go  na  połowę,  który  nazwano  linią  Z,  oraz 
jaśniejszą  strefę  pośrodku  prążka  Ay  zwaną  strefą  H. 
sarkomery  Powtarzające  się  wzdłuż  miofibryli  odcinki  struktural- 
ne ograniczone  dwiema  sąsiednimi  liniami  Z nazwa- 
no sarkomerami. 


a) 
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Rys.  !.  Przekrój  podłużny  mięśnia  poprzecznie  prążkowanego: 
a)  schemat  obrazu  miofibryli  otrzymywanego  w mikroskopie 
optycznym,  b)  schemat  budowy  pojedynczego  włókna.  U dołu 
ukazane  są  schematy  przekrojów  poprzecznych 
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Obserwacje  w mikroskopie  elektronowym  wyka- 
zały, że  poprzeczne  prążkowanie  miofibryli  spowo- 
dowane jest  obecnością  i charakterystycznym  ułożę-  filamenty 
niem  w każdym  sarkomerze  dwojakiego  rodzaju 
włókienkowatych  elementów  strukturalnych,  które 
ze  względu  na  ich  różną  średnicę  nazwano  filamenta- 
mi  grubymi  i cienkimi  (il.  120,  tabl.  30).  Filamenty 
grube,  o średnicy  10-12  nm,  przebiegają  wzdłuż  prąż- 
ka A , natomiast  filamenty  cienkie,  o średnicy  5-7  nm, 
biegną  od  linii  Z przez  całą  długość  prążka  I,  wnikają 
do  prążka  A i dochodzą  w nim  do  granicy  strefy  H. 

Tak  więc  centralna  strefa  H zbudowana  jest  wyłącznie 
z filamentów  grubych,  boczne  zaś  strefy  prążka  A — 
z obu  typów  filamentów.  Na  przekrojach  poprzecz- 
nych mięśnia  widać  regularne,  heksagonalne  uło- 
żenie filamentów  cienkich  wokół  każdego  filamentu 
grubego,  a filamentów  grubych  względem  siebie 
(rys.  Ib). 

W połowie  lat  50-ych  H.  E.  Huxley  i J.  Hanson  oraz 
A.F.  Huxley  i R.  Niedergerke  jednocześnie  ogłosili 
wyniki  swoich  obserwacji,  które  dały  jednoznaczną 
odpowiedź  na  pytanie,  jakie  zmiany  morfologiczne 
zachodzą  w mięśniu  podczas  skurczu,  powodując  jego 
skracanie  się.  Stwierdzili  oni,  że  następuje  wówczas 
skrócenie  prążków  I oraz  strefy  Hy  całkowita  zaś 
długość  prążków  A pozostaje  niezmieniona.  A zatem 
zmiany  długości  mięśnia  są  wynikiem  przesuwania 
się  grubych  i cienkich  filamentów  wzdłuż  osi  miofibryli 

I_ A / 


Z H Z 


Rys.  2.  Schemat  zmian  układu  filamentów  we  włóknie  mięśnio- 
wym podczas  skurczu 


w przeciwnych  kierunkach  w każdej  połówce  sarko- 
meru  oraz  zwiększenia  strefy  zachodzenia  filamentów 
pomiędzy  siebie  bez  zmiany  długości  samych  fila- 
mentów (rys.  2). 

Zrozumienie  mechanizmu  powodującego  przesu- 
wanie się  filamentów  grubych  i cienkich  względem 
siebie  wymaga  dokładniejszej  znajomości  nie  tylko 
budowy  tych  filamentów,  lecz  także  właściwości 
białek,  z których  są  one  utworzone. 

Po  mechanicznym  zniszczeniu  struktury  komórek 
mięśniowych  można  w stosunkowo  prosty  sposób 
wyizolować  z nich  miofibryle,  z których  działaniem 
odpowiednich  roztworów  soli  można  następnie  kolej- 
no wydzielić  dwa  główne  strukturalne  białka  mięś- 
niowe: miozynę  i aktynę.  Obserwacje  mikroskopowe 
zachodzących  przy  tym  zmian  w strukturze  miofibryli 
doprowadziły  do  wniosku,  że  filamenty  grube  zbu- 
dowane są  z miozyny,  filamenty  cienkie  — z aktyny. 
Materiałem,  z którego  utworzona  jest  linia  Z,  łą- 
cząca filamenty  cienkie  sąsiednich  sarkomerów  (rys. 
1),  jest  inne  białko  strukturalne,  zwane  a-aktyniną. 


Charakterystyka  strukturalnych 
białek  mięśniowych  i ich 
molekularnej  organizacji 
w mięśniu 


aktyna 


Rys.  3.  Schemat 
budowy  polimeru 
aktyny 


Aktyna  wyizolowana  z mięśnia  może  występować 
w dwóch  postaciach:  monomerycznej  i spolimeryzo- 
wanej,  odwracalnie  przechodzących  jedna  w drugą. 
Cząsteczka  aktyny  monomerycznej  ma  kształt  sfe- 
ryczny. Zbudowana  jest  z pojedynczego  łańcucha  poli- 
peptydowego  o masie  42  300  daltonów  (dalton  — 
stosowana  w biochemii  nazwa  jednostki  masy  ato- 
mowej u;  1 u jest  równa  Vit  masy  jądra  izotopu  węgla 
12C).  W tej  postaci  aktyna  występuje  w roztworach 
wodnych  nie  zawierających  soli  nieorganicznych. 
Dodanie  soli  w stężeniach  fizjologicznych  powoduje 
polimeryzację  aktyny.  Badając  w mikroskopie  elek- 
tronowym otrzymane  w ten  sposób  polimery,  stwier- 
dzono, że  mają  one  postać  filamentów,  takich  samych 
jak  cienkie  filamenty  bezpośrednio  wyizolowane 
z mięśni  po  mechanicznym  zniszczeniu  struktury 
komórkowej  i miofibrylarnej  (ii.  121,  tabl.  30).  Każdy 
filament  zbudowany  jest  z dwóch  śrubowo  wokół 
siebie  skręconych  łańcuchów  sferycznych  jednostek 
o średnicy  5,5  nm,  odpowiadającej  średnicy  monome- 
ru obliczonej  na  podstawie  fizykochemicznych  badań 
roztworów  aktyny  monomerycznej.  Punkty  przeci- 
nania się  obu  łańcuchów  monomerów  w rzucie  fila- 
mentu  na  płaszczyznę  (rys.  3),  powtarzają  się  w re- 
gularnych odstępach  36  nm.  Ponieważ  na  rentgeno- 
gramach  żywych  mięśni  znaleziono  refleksy  odpo- 
wiadające tej  okresowości,  można  sądzić,  że  struktura 
filamentów  aktynowych  „widziana”  w mikroskopie 
elektronowym  odpowiada  ich  strukturze  w żywym 
mięśniu. 

Podobnie  jak  aktyna,  wyizolowana  z mięśni  mio- 
zyna może  występować  bądź  w postaci  monomerycz- 
nej, bądź  w postaci  agregatów  odpowiadających 
kształtem  filamentom  grubym.  Cząsteczki  miozyny, 
o masie  ok.  480  000  daltonów,  mają  kształt  pałeczek 
zakończonych  dwiema  główkami  (widoczne  na  rys.  4). 
Zbudowane  są  z dwóch  łańcuchów  polipeptydowych 
o masie  200  000  daltonów,  zwanych  łańcuchami 
ciężkimi,  oraz  czterech  łańcuchów  tzw.  lekkich,  o ma- 
sach od  kilkunastu  do  dwudziestu  kilku  tysięcy  dal- 
tonów. Każdy  z dwóch  łańcuchów  ciężkich  ma 
w większej  swej  części  strukturę  heliksu  a;  na  tym  od- 
cinku oba  łańcuchy  skręcone  są  jeszcze  dodatkowo 
wokół  siebie  w superheliks,  który  tworzy  pałeczko- 
watą  część  cząsteczki.  W dalszej  swej  części  oba 


b)  Rys.  4.  Budowa  cząsteczki  miozyny:  a)  obraz  w mikroskopie 
elektronowym  (preparat  kontrastowany  metodą  cieniowania; 
powiększenie  175  000  razy  (wg  S.  Lowey  i in.),  b)  schemat. 
W nawiasach  podano  masy  cząsteczkowe  produktów  trawienia 
cząsteczki  trypsyną 


ciężkie  łańcuchy  tracą  wysoki  stopień  strukturalnego 
uporządkowania  i przechodzą  w jedną  z dwóch  głó- 
wek, w których  się  znajdują  również  łańcuchy  lekkie, 
luźno  połączone  z łańcuchami  ciężkimi.  Wiadomo 
obecnie,  że  dwa  z czterech  lekkich  łańcuchów  są  nie- 
zbędne dla  zachowania^  aktywności  enzymatycznej 
miozyny,  natomiast  funkcja  dwóch  pozostałych,  które 
można  usunąć  nie  powodując  utraty  aktywności, 
jest  dopiero  przedmiotem  badań.  Charakterystyczną 
cechą  miozyny  z różnych  typów  mięśni  oraz  z mięśni 
różnych  zwierząt  jest  znaczne  zróżnicowanie  masy, 
struktury  i własności  jej  lekkich  łańcuchów,  niewątpli- 
wie pozostające  w związku  z pewnymi  różnicami  włas- 
ności całej  cząsteczki. 

Ważnym  elementem  molekularnej  budowy  mio- 
zyny jest  obecność  w cząsteczce  dwóch  miejsc  szcze- 
gólnie wrażliwych  na  działanie  enzymów  trawiących 
białka.  Dzięki  temu  przez  trawienie  trypsyną  można 
podzielić  cząsteczkę  — jak  zaznaczono  na  rys.  4 — 
na  dwa  fragmenty,  z których  jeden  nazwano  mero- 
miozyną  lekką  (w  skrócie  LMM ),  drugi  — ciężką 
( HMM ).  Przy  dłuższym  trawieniu  następuje  roz- 
szczepienie HMM  na  dwa  subfragmenty : SI  i 52, 
z których  pierwszy  odpowiada  główce,  drugi  zaś 
stanowi  odcinek  pałeczkowatej  części  cząsteczki.  Po 
rozdzieleniu  produktów  trawienia  okazało  się,  że 
SI  zachowuje  zdolność  hydrolizy  ATP,  natomiast 
pozostałe  fragmenty  cząsteczki  nie  biorą  udziału 
w aktywności  enzymatycznej  miozyny.  Stwierdzono 
ponadto,  że  tylko  subfragment  SI  posiada  inną  ważną 
właściwość  miozyny  — zdolność  tworzenia  komplek- 
su z aktyną. 

W roztworach  soli  o niskim,  fizjologicznym  stę- 
żeniu cząsteczki  miozyny  agregują,  tworząc  filamenty 
podobne  do  filamentów  grubych  bezpośrednio  wy- 
izolowanych z mięśni  (rys.  5).  W mikroskopie  elek- 
tronowym na  powierzchni  filamentów  widoczne  są 
liczne  „wypustki”,  których  pozbawiony  jest  jedynie 
środkowy  odcinek  filamentu.  W podobnych  warun- 
kach meromiozyna  lekka  również  agreguje  tworząc 
filamenty,  lecz  o powierzchni  gładkiej,  natomiast  ani 
HMM , ani  SI  lub  52  nie  wykazują  tendencji  do  agre- 
gacji. Z tych  obserwacji  H.  A.  Huxley  wysnuł  wnio- 
sek, że  rdzeń  filamentu  grubego  utworzony  jest 
z ułożonych  równolegle  do  osi  filamentu  odcinków 
cząsteczek  miozyny  odpowiadających  meromiozynie 
lekkiej,  natomiast  części  odpowiadające  meromiozy- 
nie ciężkiej  wystają  na  zewnątrz  w formie  widocznych 
w mikroskopie  elektronowym  luźnych  wypustek 
(ii.  123,  tabl.  31).  W centralnej,  pozbawionej  wypustek 
części  filamentu  zmienia  się  kierunek  ułożenia  czą- 
steczek, co  nadaje  filamentowi  strukturalną  polar- 
ność,  której  znaczenie  zostanie  omówione  w dalszej 
części  artykułu. 
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Rys.  5.  Sche- 
mat budowy 
filamentu 
miozynowego 


Molekularny  mechanizm 
skurczu 


Hydroliza  ATP  katalizowana  przez  miozynę  w obec- 
ności jonów  potasu,  magnezu  i wapnia  w takich  stę- 
żeniach, w jakich  jony  te  występują  w mięśniu,  prze- 
biega z małą  szybkością,  nie  wystarczająca  na  pokry- 
cie potrzeb  energetycznych  skurczu.  W obecności 
aktyny  szybkość  ta  znacznie  wzrasta  i osiąga  wartość 
porównywalną  z szybkością  rozkładu  ATP  (mierzoną 
ubytkiem  fosfokreatyny  zużywanej  na  jego  resyntezę) 
w kurczącym  się  mięśniu.  Jak  wynika  z rozważań 
przedstawionych  w poprzednim  rozdziale,  zarówno 
miejsce  hydrolizy  ATP,  jak  i łączenia  się  miozyny 
z aktyną  znajduje  się  w tej  części  cząsteczki  miozy- 
nowej,  która  wystaje  z trzonu  filamentu  grubego 
w postaci  w-ypustki.  Według  ogólnie  dziś  akceptowa- 
nej teorii  H.  E.  Huxleya,  dochodzący  do  mięśnia  im- 
puls nerwowy  powoduje,  że  wypustki  filamentów  teoria 
miozynowych  (zwane  częściej  poprzecznymi  mostka-  Huxleya 
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mi)  łączą  się  z filamentami  aktynowymi.  Połączenie 
z aktyną  powoduje  aktywację  hydrolizy  ATP  przez 
miozynę  i wyzwolenie  energii  wiązania  końcowego 
fosforanu  z ATP.  Energia  ta  zostaje  zużyta  na  zmianę 
kąta,  pod  jakim  główka  cząsteczki  miozynowej  (sub- 
fragment  SI),  stanowiąca  część  mostka,  połączona 
jest  z filamentem  aktynowym.  Zmiana  kąta  powoduje 
przesunięcie  filamentu  aktynowego  wzdłuż  miozyno- 
wego  o pewien  odcinek  (rys.  6),  nie  większy  niż  5-10 
nm,  po  czym  następuje  rozerwanie  międzyfilamento- 
wego  połączenia  i ponowne  jego  utworzenie  w dalszej 
części  filamentu  aktynowego.  Opisany  cykl  zmian 
powtarza  się  wielokrotnie  podczas  skurczu,  a każdy 
związany  jest  z hydrolizą  jednej  cząsteczki  ATP. 


Rys.  6.  Schemat  ilustrujący  wahadłowy  ruch  mostków  miozyno- 
wych  oraz  mechanizm  przesuwania  filamentów  aktynowych  pod- 
czas skurczu 


Przedstawione  wyżej  zasadnicze  elementy  teorii 
Huxleya  zostały  sformułowane  w końcu  lat  50-ych. 
Wypada  obecnie  przedstawić  nieco  dokładniej  zało- 
żenia oraz  dowody,  na  których  teoria  została  oparta, 
i uzupełnić  je  wynikami  późniejszych  badań, 
wahadłowy  Dla  wytłumaczenia  wahadłowego  ruchu  mostków 
rt/chmost-  miozynowych  w kierunku  filamentów  cienkich  oraz 
kćw  miozy-  zmiany  kąta  przyłączenia  główek  miozynowych  do 
nowych  filamentu  cienkiego  Huxley  oparł  się  na  założeniu,  iż 
w tej  części  łańcucha  polipeptydowego,  która  tworzy 
mostek,  istnieją  dwa  miejsca  charakteryzujące  się 
pewną  giętkością  i spełniające  funkcję  „zawiasów”: 
jedno  tam,  gdzie  mostek  przechodzi  w trzon  filamen- 
tu, drugie  — pomiędzy  główką  (subfragmentem  SI) 
a liniową  częścią  mostka  (subfragmentem  S2)9  ma- 
jącą charakter  sztywnej  pałeczki. 

Cykliczne  zmiany  ustawienia  mostków  miozyno- 
wych podczas  skurczu  mięśnia  muszą  być  rezultatem 
zmian  w konformacji  łańcucha  polipeptydowego 
w obrębie  wspomnianych  wyżej  giętkich  obszarów 
mostka.  Z zastosowaniem  metod  biofizycznych  (np. 
badania  zmian  widma  miozyny  w ultrafiolecie,  ba- 
dania fluorescencji,  rezonansu  elektronowego  itp.) 
uzyskano  wiele  dowodów  na  to,  że  w trakcie  hydrolizy 
ATP  rzeczywiście  zachodzą  zmiany  konformacyjne 
w cząsteczce  miozyny  w pobliżu  jej  aktywnego  cen- 
trum enzymatycznego. 

Na  schemacie  ilustrującym  zmiany  ustawienia  mo- 
stków miozynowych  podczas  skurczu  (rys.  6)  przed- 
stawiono mostki  w sposób  uproszczony,  z pojedyn- 
czą główką  — subfragmentem  57,  jakkolwiek  wiado- 
mo, że  na  jedną  cząsteczkę  miozyny,  a co  za  tym  idzie 
— na  jeden  mostek  przypadają  dwa  SI.  Wiele  obser- 
wacji wskazuje  na  to,  że  oba  subfragmenty  SI  tego 
samego  mostka  nie  działają  jednocześnie. 

Ruch  filamentów  aktynowych  w każdym  sarkome- 
rze  kurczącego  się  mięśnia  odbywa  się  w sposób  sko- 
ordynowany — w kierunku  centralnej  części  sarko- 
meru,  a więc,  jak  już  o tym  mówiono  (rys.  2),  w każ- 
dej połówce  sarkomeru  w kierunku  przeciwnym.  Taką 
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koordynację  zapewnia  wspomniana  w poprzednim 
rozdziale  strukturalna  polarność  filamentów  miozyno-  polarność 
wych,  wynikająca  z odwrotnego  kierunku  ułożenia  fitamentów 
cząsteczek  miozyny  w obu  połówkach  filamentu.  miozynowych 
Ponadto  badania  H.  E.  Huxleya  i jego  współpracow-  i aktynowych 
ników  dostarczyły  również  dowodów  polamości 
struktury  filamentów  aktynowych.  Przemawia  za 
nią  struktura  kompleksów  utworzonych  przez  przy- 
łączenie cząsteczek  meromiozyny  ciężkiej  lub  sub- 
fragmentu  SI  do  filamentów  aktynowych  (ii.  122, 
tabl.  30).  Kompleksy  te  wyglądem  swoim  przypomina- 
ją długi  szereg  skierowanych  w tę  samą  stronę  grotów 
strzał  długości  36  nm.  Ponieważ  długość  ta  odpo- 
wiada skokowi  podwójnego  heliksu,  jaką  tworzą  łań- 
cuchy monomerów  w filamcncie  aktynowym,  uznano, 
że  każdy  monomer  aktyny  wiąże  jedną  cząsteczkę  sub- 
fragmentu  SI.  W ten  sposób  cały  kompleks  zachowuje 
okresowość  śrubowej  struktury  filamentu  aktynowego. 

Aby  powstała  charakterystyczna  struktura  grotów 
strzał,  przyłączone  cząsteczki  muszą  tworzyć  kąt  ostry 
z osią  filamentu  i muszą  być  zwrócone  w tym  samym 
kierunku;  w ukierunkowaniu  tym  ujawnia  się  właśnie 
strukturalna  polarność  filamentów  aktynowych. 

W odróżnieniu  od  sztucznie  wytworzonych  kom- 
pleksów — w mięśniu  nie  wszystkie  monomery  akty- 
ny łączą  się  jednocześnie  z mostkami  miozynowymi. 

Maksymalna  liczba  możliwych  połączeń  wynika 
przede  wszystkim  z rozmieszczenia  mostków  na  fila- 
mencie  miozynowym.  Do  uzyskania  informacji  na 
ten  temat  wykorzystano  obrazy  dyfrakcji  promieni 
rentgenowskich  na  żywym  mięśniu.  Kierując  wiązkę 
promieni  rentgenowskich  prostopadle  do  dłuższej 
osi  włókna  mięśniowego,  na  rentgenogramie  otrzy-  badanie 
muje  się  w kierunku  równoległym  do  osi  włókna  układ  struktury 
refleksów  południkowych  (il.  126,  tabl.  31),  będących  filamentów 
wynikiem  odbić  od  elementów  powtarzających  się  metodą  rent- 
wzdłuż  osi  włókna.  Ich  źródłem  może  więc  być  za-  genowską 
równo  śrubowa  struktura  filamentów  aktynowych, 
jak  i regularne,  periodyczne  rozmieszczenie  mostków 
wzdłuż  filamentów  miozynowych.  Odległość  reflek- 
sów południkowych  od  równika  jest  miarą  odległości 
między  powtarzalnymi  strukturami  w mięśniu.  Na- 
tomiast rozkład  refleksów  na  równiku  — w kierunku 
prostopadłym  do  dłuższej  osi  włókna  — odpowiada 
regularnościom  przestrzennego  rozmieszczenia  fila- 
mentów (rys.  7). 


Rys.  7.  Heksagonalna  siatka  grubych  i cienkich  filamentów  w mię- 
śniu poprzecznie  prążkowanym  kręgowców;  na  rysunku  zazna- 
czono płaszczyzny  będące  źródłem  refleksów  równikowych  (pro- 
stopadłych do  dłuższej  osi  włókna  mięśniowego)  na  obrazach 
dyfrakcji  promieniowania  rentgenowskiego  na  żywym  mięśniu 

Charakterystyczną  cechą  obrazów  dyfrakcji  pro- 
mieni X przez  mięsień  w stanie  spoczynkowym  (il. 

126,  tabl.  31)  jest  ułożenie  refleksów  południkowych  w 
linie  warstwowe  odpowiadające  okresowości  42,9  nm 
oraz  obecność  o wyjątkowo  dużym  natężeniu  refleksu 
południkowego  odpowiadającego  okresowości  14,3 
nm.  Po  skonfrontowaniu  tych  danych  z obrazami 
podłużnych  skrawków  mięśnia  w mikroskopie  elek- 
tronowym (na  których  przy  dużych  powiększeniach  model 
można  zauważyć  pary  mostków  odchodzące  od  Huxleya 
filamentu  miozynowego  w odstępach  ok.  40  nm)  o Browna 
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Rys.  8.  Model  rozmieszczenia  poprzecznych  mostków  na  fila- 
mencie  grubym  (wg  H.  E.  Huxleya).  Część  mostków  oznaczono 
szarym  kolorem  dla  uwidocznienia  ich  śrubowego  układu 

H.  E.  Huxley  i W.  Brown  zaproponowali  model  roz- 
mieszczenia mostków  na  filamencie  miozynowym 
(rys.  8).  Śrubowe  ułożenie  mostków  w taki  sposób, 
że  tworzą  one  jednocześnie  sześć  biegnących  wzdłuż 
filamentu  rzędów,  w których  odstępy  między  mostka- 
mi wynoszą  42,9  nm,  najlepiej  tłumaczy  wyniki  badań 
rentgenograficznych,  a zarazem  uzasadnione  jest 
faktem,  że  każdy  łilament  miozynowy  otoczony  jest 
sześcioma  filamentami  aktynowymi;  takie  rozmiesz- 
szczenie  mostków  byłoby  więc  najkorzystniejsze  jeśli 
chodzi  o łatwość  wytwarzania  międzyfilamentowych 
połączeń. 

Regularność  budowy  filamentów  miozynowych 
uwidacznia  się  tylko  na  rentgenogramach  mięśni 
w stanie  spoczynkowym,  kiedy  to  międzyfilamentowe 
połączenia  są  przerwane.  Po  wyczerpaniu  zapasu  ATP 
i fosfokreatyny  w wyniku  długotrwałej  serii  skurczów 
mięsień  wyizolowany  przechodzi  w stan  tężca,  staje 
się  sztywny  i nierozciągliwy.  Wskazuje  to  na  wytwo- 
rzenie trwałych  połączeń  między  filamentami  miozy- 
nowymi  i aktynowymi,  co  jest  zgodne  z wynikami  ba- 
dań nad  reagowaniem  miozyny  z aktyną  in  vitro 
(w  nieobecności  ATP  oba  białka  łączą  się  w kompleks). 
Rentgenogramy  mięśnia  w tym  stanie  znacznie  się 
różnią  od  obrazów  jego  w stanie-  spoczynkowym: 
południkowe  refleksy  odpowiadające  okresowi 
42,9  nm  niemal  całkowicie  zanikają,  a następuje 
wzmocnienie  refleksów  pochodzących  z filamentów 
aktynowych  (36  nm).  Zmienia  się  także  względne  na- 
tężenie refleksów  równikowych  (osłabienie  refleksu 

I. 0,  a wzmocnienie  1.1:  rys.  7).  Ponieważ  natężenie 
refleksów  kłw  jest  proporcjonalne  do  gęstości  sub- 
stancji rozpraszającej  promienie  X , zmiany  te  inter- 
pretuje się  jako  wynik  przesunięcia  większej  części 
masy  mostków  miozynowych  w kierunku  filamentów 
aktynowych  dla  wytworzenia  z nimi  połączeń.  Połą- 
czenie z filamentami  aktynowymi  nadaje  konfiguracji 
mostków  nową  regularność,  określoną  sposobem  uło- 
żenia monomerów  w filamencie  aktynowym. 

Z porównania  natężenia  poszczególnych  reflek- 
sów na  rentgenogramach  mięśni  w stanie  skurczu, 
tężca  i spoczynku  wynika,  że  podczas  skurczu  w każ- 
dym momencie  dochodzi  do  skutku  zaledwie  ok.  20% 
możliwych  połączeń  międzyfilamentowych.  Jest  to 
eksperymentalny  dowód  słuszności  jednego  z głów- 
nych założeń  teorii  skurczu  H.E.  Huxleya  — cyklicz- 
ności  wytwarzania  międzyfilamentowych  połączeń. 
Tak  niski  procent  jednocześnie  istniejących  połączeń 
oznacza,  że  każdy  mostek  w następujących  po  sobie 
cyklach  zmian  jego  stanu  pozostaje  w połączeniu 
z filamentem  aktynowym  przez  stosunkowo  krótki 
czas  — zaledwie  7*  część  czasu  trwania  całego  cyklu. 

Analiza  rentgenogramów  mięśnia  dostarczyła  rów- 
nież dowodów  na  to,  że  w mięśniu  rozkurczonym, 
w którym  międzyfilamentowe  połączenia  są  rozerwa- 
ne, globularnc  części  mostków  (główki  cząsteczek 
miozyny)  ustawione  są  pod  kątem  prostym  do  osi 
filamentów,  natomiast  gdy  mięsień  znajduje  się  w sta- 
nie tężca,  są  one  połączone  z filamentami  aktyno- 
wymi pod  kątem  45°.  Są  to  spostrzeżenia,  które  nie 
stanowią  wprawdzie  bezpośredniego  dowodu  na  wy- 
stępowanie tych  dwóch  konfiguracji  mostków  przej- 
ściowo w każdym  cyklu  tworzenia  i rozrywania  mię- 
dzyfilamentowych połączeń,  czynią  jednak  to  istotne 
założenie  teorii  Huxleya  wysoce  prawdopodobnym. 

W ostatnich  latach  wykazano,  że  hydroliza  ATP 
przez  miozynę  jest  procesem,  na  który  się  składa  co 
najmniej  7 kolejnych  reakcji: 


hydroliza 
ATP  przez 
miozynę 


M -f- ATP  M ATP  M*  - ATP  5± 

:M**-ADP-P^fc  M*  ADP  P«±  M*- ADP-fP 

M ADP+P^M  + ADP-fP,  (4) 


gdzie  przez  M,  M*  i M**  oznaczono  miozynę  w róż- 
nych stanach  konformacyjnych,  które  rozróżniono 
stosując  techniki  spektroskopowe.  Jakkolwiek  pod 
wpływem  aktyny  ogólna  szybkość  rozkładania  ATP 
przez  miozynę  ulega  znacznemu  zwiększeniu,  właści- 
wa reakcja  hydrolizy  (3)  przebiega  w tym  układzie  z 
taką  samą  szybkością  jak  w nieobecności  aktyny. 
Dzieje  się  tak  dlatego,  że  przyłączenie  ATP  w centrum 
aktywności  enzymatycznej  miozyny  powoduje  dyso- 
cjację  kompleksu  miozyny  z aktyną  i dopiero  po  hy- 
drolizie ATP,  która  zachodzi  na  cząsteczce  wolnej 
miozyny,  następuje  ponowne  połączenie  się  miozyny 
z aktyną,  co  przyspiesza  uwalnianie  produktów 
hydrolizy  z centrum  aktywności  enzymatycznej 
miozyny  i w ten  sposób  przyspiesza  cały  proces: 


AM -f  ATP  -+AM-  ATP 
AM*  ADPP  ->  AM*ADP+P 


M*  • ATP  -* 

t A 

I s 

[/ 

AM*- ATP 


M**  ADP  P 


\1 

AM**  ADP  P- 


(5) 


AM  ADP4-P  — AM  + ADP  + P. 


Taka  sekwencja  reakcji  implikuje  rozdzielenie  w cza- 
sie etapu  uwalniania  energii  chemicznej  z ATP  i etapu 
jej  przekształcania  w energię  mechaniczną,  ponieważ 
hydroliza  ATP  (uwalnianie  energii)  zachodzi  na  wol- 
nej miozynie,  natomiast  wykonanie  pracy  przesunię- 
cia filamentu  aktynowego  wymaga  istnienia  między- 
filamentowego  połączenia.  Badania  nad  procesem 
hydrolizy  ATP  przez  aktomiozynę  in  vitro  wykazały 
że  — zgodnie  z przyjętym  w teorii  Huxleya  założe- 
niem — energia  chemiczna  końcowego  wiązania  fo- 
sforanowego w ATP  zostaje  podczas  skurczu  mięśnia 
zużyta  na  zmianę  konformacji  cząsteczki  miozyny  i w 
tej  formie  jest  „przechowywana”  do  momentu  prze-  zmiana 
kształcenia  w energię  mechaniczną,  co  ma  miejsce  konformacja 
wówczas,  gdy  cząsteczka  miozyny  połączona  z aktyną  — f o^ma 
powraca  do  swojej  konformacji  wyjściowej.  Nie  jest  przechowy- 
jeszcze  pewne,  która  z poznanych  reakcji  procesu  hy-  wanta  energii 
drolizy  ATP  sprzężona  jest  z wykonaniem  pracy  me- 
chanicznej, nie  ulega  jednak  wątpliwości,  że  jest  to 
jedna  z reakcji  prowadzących  do  uwolnienia  pro- 
duktów hydrolizy  ATP  z cząsteczki  miozynowej. 


(wg  H.  G.  Mannherza  i in.). 


stan  4 


Rysunek  9 ilustruje  pierwszą  próbę  korelacji  zmian 
konfiguracji  mostków  miozynowych  z cyklem  reakcji 
procesu  hydrolizy  ATP.  W modelu  tym  najbardziej 
hipotetyczna  jest  konfiguracja  mostków  po  przy- 
łączeniu ATP  (stan  4) ; nie  udało  się  dotąd  sprawdzić  jej 
doświadczalnie,  ponieważ — jak  już  wspomniano  —- 
reakcja  hydrolizy  zachodzi  szybciej  niż  uwalnianie 
jej  produktów,  można  więc  przypuszczać,  że  w żywym 
mięśniu,  tak  jak  w roztworach  białek,  w obecności 
ATP  w każdym  momencie  większość  cząsteczek  mio- 
zynowych występuje  w połączeniu  z produktami  hy- 
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drolizy  (stan  7).  Stan  1 jest  analogiczny  do  tego,  w ja- 
kim się  znajdują  wszystkie  lub  większość  mostków 
podczas  rozkurczu  (spoczynku)  mięśnia,  konfiguracja 
zaś  mostków  w stanie  3 jest  typowa  dla  stanu  tężco- 
wego. 


Regulacja  cyklu  skurczowo- 
rozkurczowego 

Odpowiedź  na  pytanie,  w jaki  sposób  dochodzący  do 
mięśnia  bodziec  nerwowy  odbierany  jest  przez  białka 
kurczliwe  i jakie  wywołuje  w nich  zmiany,  które  pro- 
wadzą do  skurczu  mięśnia,  nasunęła  się  w wyniku  ba- 
dania procesu  odwrotnego,  czyli  rozkurczu.  Skoncen- 
trowanie uwagi  na  mechanizmie  rozkurczu  wynikło 
stąd,  że  wszystkie  układy  modelowe  stosowane  w ba- 
daniach nad  skurczem  wydawały  się  pozbawione  tej 
ważnej  właściwości  żywego  mięśnia,  jaką  jest  zdolność 
do  rozkurczu.  Tak  zw.  glicerynowane  włókna  mięś- 
niowe, tj.  włókna  pozbawione  substancji  niskoczą- 
steczkowych  i rozpuszczalnych  białek  przez  wypłuka- 
nie ich  wodnym  roztworem  glicerolu,  po  umieszczeniu 
w roztworze  ATP  i jonów  magnezu  ulegają  skur- 
czowi, który  się  utrzymuje  nadal  po  całkowitym  roz- 
łożeniu ATP.  Również  nieodwracalna  jest  superpre- 
cypitacja  — reakcja  preparatów  aktomiozyny  na  do- 
danie ATP  w fizjologicznych  warunkach  jonowych, 
polegająca  na  wytrąceniu  się  żelu  aktomiozynowego 
w postaci  odwodnionego  osadu;  jest  to  najprostszy 
model  skurczu  mięśnia  in  vitro.  Po  rozłożeniu  doda- 
nego ATP  nie  obserwuje  się  rozpuszczenia  wytrąco- 
nego białka. 

Po  bezskutecznych  poszukiwaniach  hipotetycznej 
substancji  rozkurczającej  udało  się  w latach  50-ych 
uzyskać  rozkurcz  glicerynowanych  włókien  mięśnio- 
wych przez  potraktowanie  ich  substancjami  silnie  wią- 
rola  żącymi  jony  wapnia.  Zwrócono  wówczas  uwagę  na 
jonów  wcześniejszą  obserwację  fizjologów,  że  wstrzyknięcie 
wapnia  soli  wapnia  do  włókien  mięśniowych  wywołuje  lokal- 
ny skurcz.  Okazało  się,  że  skurcz  i rozkurcz  inicjowane 
są  za  pośrednictwem  tej  samej  substancji  — jonów 
wapnia. 

Badając  zależność  napięcia  glicerynowanych  włó- 
kien mięśniowych,  stopnia  superprecypitacji  żelu 
aktomiozynowego,  a także  aktywacji  ATPazy  mio- 
zynowej  przez  aktynę  od  stężenia  jonów  wapnia, 
stwierdzono,  że  odpowiedź  skurczowa  wymaga  obec- 
ności jonów  wapnia  w stężeniach  powyżej  10~6  mol/l. 
Przy  stężeniu  10“ 5 mol/l  otrzymuje  się  maksymalną 
reakcję  wszystkich  badanych  modeli  mięśniowych. 
W tak  niskich  stężeniach  wapń  obecny  jest  zawsze 
jako  zanieczyszczenie  zarówno  w preparatach  białek, 
jak  i w glicerynowanych  włóknach  — tym  się  tłuma- 
czy stosunkowo  późne  zwrócenie  uwagi  na  jego  fizjo- 
logiczną rolę  w mięśniu. 

Całkowite  stężenie  wapnia  w mięśniu  jest  rzędu 
10“3  mol/l.  Zaczęto  więc  z kolei  poszukiwać  fizjolo- 
gicznej substancji  lub  struktury,  która  odwracalnie 
wiążąc  i uwalniając  jony  wapnia  mogłaby  regulować 
ich  stężenie  w plazmie  komórki  mięśniowej.  Okazało 
się,  że  funkcję  taką  spełnia  wewnątrzkomórkowy 
siateczka  układ  strukturalny  zwany  siateczką  sarkoplazma- 
sarkoplaz-  tyczną  (rys.  10  i il.  124  z tabl.  31).  Jest  to  zamknięty 
matyczna  układ  błon  tworzących  podłużne  kanaliki  wokół  mio- 
fibryli,  łączące  się  w pobliżu  granicy  między  prążkami 
A i / (w  mięśniach  szkieletowych  ssaków)  lub  w pobli- 
żu linii  Z (w  mięśniach  niższych  kręgowców)  w tzw. 
cysterny.  Między  sąsiadującymi  ze  sobą  cysternami 
przebiegają  kanaliki  poprzeczne,  tworzące  tzw.  układ 
T (skrót  od  angielskiej  nazwy  transverse  'poprzeczny’), 
który  w odróżnieniu  od  błon  siateczki  sarkoplazma- 
tycznej  posiada  łączność  z błoną  otaczającą  komór- 
kę mięśniową  — sarkołemmą;  kanaliki  T są  to 
wpuklenia  sarkolemmy  do  wnętrza  komórki  mięśnio- 
wej. 
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Stosując  różne  metody  pozwalające  uwidocznić 
rozmieszczenie  jonów  wapnia  na  preparatach  ogląda- 
nych w mikroskopie  elektronowym,  udało  się  ziden- 
tyfikować cysterny  siateczki  sarkoplazmatycznej  jako 
miejsca  magazynowania  wapnia  w stanie  spoczynku  badanie  prze- 
mięśnia.  Do  zbadania  przemieszczania  się  jonów  mieszczania 
wapnia  w komórce  mięśniowej  w cyklu  skurcz-roz-  się  jonów 
kurcz  posłużono  się  białkiem  zwanym  ekworyną,  wapnia 
którego  charakterystyczną  cechą  jest  luminescencja 
pod  wpływem  wiązania  wapnia.  Wstrzyknięta  do 
włókien  mięśniowych  ekworyną  łatwo  się  w miopla- 
zmie  rozprzestrzenia,  a jej  wysokie  powinowactwo  do 
wapnia  zapewnia  wiązanić  tego  jonu  przy  jego  niskich, 
fizjologicznych  stężeniach.  Rejestrując  luminescencję 
nasyconych  ekworyną  włókien  mięśniowych  stwier- 
dzono, że  skurcz  włókien  pod  wpływem  elektrycznego 
pobudzenia  poprzedzony  jest  wzrostem  stężenia  wa- 
pnia w mioplazmie.  Udowodniono  w ten  sposób,  że 
szybkość  uwalniania  wapnia  z siateczki  sarkoplazma- 
tycznej jest  wystarczająca  na  to,  aby  przekazywanie 
pobudzenia  wytłumaczyć  przemieszczeniem  jonów 
wapnia  do  mioplazmy. 


Rys.  10.  Schemat  budowy  siateczki  sarkoplazmatycznej:  wg  D.  W. 

Fewcctt,  M.  S.  McNutt,  J.  Celi  Biol.  42,  1 (1969) 

Błony  siateczki  sarkoplazmatycznej  nie  stykają  się 
bezpośrednio  z powierzchnią  komórki  mięśniowej  w 
mięśniach  szkieletowych  kręgowców,  wobec  tego 
rolę  ogniwa  pośredniczącego  w przekazywaniu  bodźca 
nerwowego  do  wnętrza  komórki  przypisano  kanalikom  ro|^ 

71,  o czym  zdecydowała  ich  łączność  z sarkołemmą  oraz  kanalików  T 
bliskie  sąsiedztwo  z cysternami  siateczki  sarkoplaz- 
matycznej. Z badań  elektrofizjologicznych  wiadomo, 
że  dochodzący  do  mięśnia  impuls  nerwowy  powoduje 
depolaryzację  sarkolemmy,  tj.  obniżenie  dodatniego 
potencjału  elektrycznego  występującego  na  jej  ze- 
wnętrznej powierzchni  w stanie  spoczynku.  Ten  spo- 
czynkowy potencjał  jest  wywołany  różnicą  stężeń 
niektórych  jonów  w komórce  i w płynie  pozakomór- 
kowym,  utrzymującą  się  wskutek  selektywnej  prze- 
puszczalności sarkolemmy.  Depolaryzacja  związana 
jest  ze  zmianą  przepuszczalności  i przenikaniem  jonów 
sodu  do  wnętrza  komórki.  Stopień  depolaryzacji 
wzrasta  ze  wzrostem  siły  bodźca,  przy  czym  do  pew- 
nej wartości  progowej  nie  powoduje  to  zmiany  stanu 
mięśnia;  po  przekroczeniu  tej  wartości  następuje  dal- 
sza, gwałtowna  zmiana  przepuszczalności  błony,  po- 
wodująca dalszą  dyfuzję  jonów  i wytworzenie  poten- 
cjału o znaku  przeciwnym,  potencjału  czynnościowe- 
go, któremu  towarzyszy  skurcz.  Przyjmując  założenie, 
że  właściwości  błon  układu  T są  takie  same  jak  sar- 
kolemmy, łatwo  sobie  wyobrazić,  że  potencjał  czyn- 
nościowy rozprzestrzenia  się  dostatecznie  szybko  na 


błonę  kanalików  T.  Sygnał  ten,  przekazywany  cyster- 
nom siateczki  sarkoplazma tycznej,  powoduje  uwol- 
nienie jonów  wapnia  do  mioplazmy  (schemat  tego  pro- 
cesu jest  przedstawiony  na  rys.  11). 


sarkoiemma 


stan  spoczynku 


Rys.  11.  Schemat  ilustrujący  sprzężenie  procesu  pobudzenia 
i skurczu  mięśnia 


Mechanizm  przekazywania  pobudzenia  z kanali- 
ków T do  siateczki  sarkoplazmatycznej  jest  jeszcze 
przedmiotem  dyskusji.  Według  jednej  z hipotez  de- 
polaryzacja błony  kanalików  T wywołuje  depolary- 
zację błony  cystern,  a ta  z kolei  zmienia  stopień  jej 
przepuszczalności  dla  wapnia.  Inna  hipoteza  zakłada 
uwalnianie  ze  ścian  kanalików  T jakiejś  nie  znanej 
jeszcze  substancji,  która  oddziałuje  na  błonę  cystern. 
Dokładna  obserwacja  w mikroskopie  elektronowym 
wykazała,  że  w miejscu  zetknięcia  z kanalikami  T 
błona  cystern  jest  pofałdowana,  a pomiędzy  nią  a bło- 
ną kanalika  T występują  regularnie  rozmieszczone 
zagęszczenia  bezpostaciowego  materiału  (rys.  12). 
Te  zagęszczenia  mogłyby  być  miejscami  przepływu 


Rys.  12.  Struktura  zetknięcia  się  kanalików  układu  T z cysternami 
siateczki  sarkoplazmatycznej:  a)  obraz  w mikroskopie  elektrono- 
wym, powiększenie  70  000  razy  (wg  C.  Franzini-Armstrong),  b) 
schemat,  strzałkami  zaznaczono  zagęszczenia  bezpostaciowego 
materiału  między  błonami  cysterny  i kanalika  T 

prądu  elektrycznego  albo  mogłyby  spełniać  funkcję 
utrzymywania  błon  obu  układów  w stałej  odległości, 
ewentualna  zaś  dyfuzja  hipotetycznej  substancji  po- 
budzającej zachodziłaby  w przestrzeniach  pomiędzy 
nimi. 

Dokładne  poznanie  molekularnego  mechanizmu 
uwalnianie  uwalniania  wapnia  z siateczki  sarkoplazmatycznej 
wapnia  również  wymaga  dalszych  badań.  Obecnie  już  wiado- 
mo, że  absorpcja  wapnia  po  ustaniu  działania  bodźca 
nerwowego  jest  procesem  aktywnego  transportu 
kosztem  energii  ATP,  przy  udziale  enzymu  hydroli- 
zującego  ATP,  będącego  głównym  składnikiem  biał- 
kowym błon  siateczki  sarkoplazmatycznej.  Transport 
ten  zachodzi  do  momentu  obniżenia  stężenia  wolnych 
jonów  wapnia  na  zewnątrz  układu  do  wartości  rzędu 
10-8  mol/l.  Na  wewnętrznej  powierzchni  błon  sia- 
teczki sarkoplazmatycznej  rozmieszczone  są  białka 
o wysokim  powinowactwie  do  wapnia,  przypuszczal- 
nie więc  wapń  — w stanie  spoczynku  mięśnia  — zma- 
gazynowany jest  w postaci  kompleksu  z tymi  białka- 
mi, a jego  dyfuzję  do  mioplazmy  pod  wpływem  im- 


pulsu nerwowego  poprzedza  zmiana  konformacji 
białka,  umożliwiająca  uwolnienie  wapnia  w formie 
zjonizowanej. 

Wkrótce  po  zwróceniu  uwagi  na  rolę  wapnia  w pro- 
cesie skurczu  zauważono,  że  hydroliza  ATP  i super- 
precypitacja  aktomiozyny  wymagają  obecności  jo- 
nów wapnia  tylko  wówczas,  gdy  białka  kurczliwe  nie 
były  poddawane  dokładnemu  oczyszczaniu.  W latach 
1963-66  S.  Ebashi  z uniwersytetu  w Tokio  wykazał, 
że  funkcję  „uczulania”  aktomiozyny  na  zmiany  stę- 
żenia jonów  wapnia  spełniają  dwa  inne  białka:  tro- 
pomiozyna,  której  obecność  w mięśniu  znana  była 
już  wcześniej,  oraz  białko  odkryte  przez  Ebashiego 
i nazwane  przez  niego  troponiną. 

Troponina  jest  jedynym  białkiem  miofibrylarnym, 
które  wiąże  i uwalnia  wapń  w zakresie  jego  fizjolo- 
gicznych stężeń  w mioplazmie.  Sama  troponina  nie 
wywiera  jednak  żadnego  wpływu  na  aktomiozynę, 
dopiero  w połączeniu  z tropomiozyną  wykazuje  zdol- 
ność uczulania  wysoce  oczyszczonych  preparatów 
aktomiozyny  na  zmiany  stężenia  wapnia,  tzn.  powo- 
duje hamowanie  ich  aktywności  ATP-azowej  i super- 
precypitacji  gdy  stężenie  wolnych  jonów  wapnia  nie 
przekracza  10-8  mol/l.  Już  te  wstępne  informacje 
wskazywały  na  to,  że  bodziec  nerwowy  jest  — za 
pośrednictwem  uwolnionego  z siateczki  sakroplazma- 
tycznej  wapnia  — odbierany  przez  troponinę  i prze- 
kazywany przez  nią  białkom  kurczliwym  przy  udzia- 
le tropomiozyny. 

Zdolność  wiązania  tropomiozyny  i troponiny,  któ- 
rą ma  aktyna,  a której  miozyna  nie  posiada,  była 
pierwszą  wskazówką,  że  oba  te  białka  są  zlokalizo- 
wane w cienkich  filamentach.  Potwierdziły  to  badania 
immunochemiczne,  w których  się  wykorzystuje  spe- 
cyficzną reakcję  przeciwciała  z jego  antygenem.  Oglą- 
dając w mikroskopie  elektronowym  podłużne  skraw- 
ki mięśni  potraktowane  przeciwciałem  na  tropomio- 
zynę,  stwierdzono  równomierną  reakcję  przeciwciała 
z filamentami  cienkimi  na  całej  ich  długości.  Nato- 
miast obserwacje  w mikroskopie  elektronowym  z za- 
stosowaniem normalnej  techniki  kontrastowania  pre- 
paratów białkowych  nie  wykazywały  różnic  w struk- 
turze filamentów  otrzymanych  przez  polimeryzację 
czystej  aktyny  i filamentów  aktynowych  zawierają- 
cych tropomiozynę.  Zaproponowany  przez  J.  Han- 
son  i J.  Lowy’ego  model  rozmieszczenia  tropomiozy- 
ny na  filamencie  aktynowym  godzi  te  pozornie 
sprzeczne  obserwacje.  Cząsteczka  tropomiozyny 
zbudowana  jest  z dwóch  łańcuchów  polipeptydowych 
o masie  ok.  34  000  daltonów,  posiadających  konfor- 
mację heliksu  a i zwiniętych  wokół  siebie  w superheliks 
(podobnie  jak  to  ma  miejsce  w wypadku  ciężkich  łań- 
cuchów miozyny  w pałeczkowatej  części  cząsteczki 
miozynowej);  długość  cząsteczki  wynosi  40  nm, 
a średnica  — zaledwie  2 nm.  W roztworach  o niskiej 
zawartości  soli  cząsteczki  tropomiozyny  polimeryzują 
łącząc  się  „koniec  z początkiem”.  Według  sugestii 
Hanson  i Lowy’ego  dwa  łańcuchy  tak  połączonych 
cząsteczek  tropomiozyny,  nawinięte  na  aktynowy 
trzon  filamentu,  mieszczą  się  w rowkach  podwójnego 
heliksu,  który  tworzą  łańcuchy  monomerów  akty- 
ny (rys.  13),  i dlatego  nie  są  widoczne  w mikrosko- 
pie. 

Pierwsze  informacje  o rozmieszczeniu  troponiny 
na  filamencie  cienkim  uzyskano  także  przy  użyciu 
przeciwciała  na  to  białko.  Przeciwciało  przyłącza  się 
do  cienkich  filamentów  w regularnych  odstępach,  rów- 
nych długości  cząsteczki  tropomiozyny,  a znacznie 
przekraczających  wymiary  globularnej  cząsteczki 
troponiny.  Uznano  więc,  że  regularne  rozmieszczenie 
troponiny  wzdłuż  filamentu  cienkiego  (rys.  13)  jest 
wynikiem  wiązania  się  jej  z tropomiozyną  w jednym 
tylko  miejscu,  które  według  najnowszych  badań  znaj- 
duje się  w odległości  ok.  14  nm  od  karboksylowego 
końca  cząsteczki  tropomiozyny. 

Bardziej  szczegółowych  informacji  o strukturze 
cienkich  filamentów  dostarczyły  badania  włóknistych 
agregatów,  powstających  w pewnych  warunkach 
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przez  połączenie  równolegle  do  siebie  ułożonych  fila- 
mentów.  Agregaty  filamentów  czystej  aktyny  (ii.  125a, 
tabl.  31)  wykazują  prążkowanie  o okresie  36  nm,  od- 


nia  z miozyną  siedmiu  monomerów  aktynowych  po- 
zostających w kontakcie  z tą  samą  cząsteczką  tropo- 
miozyny. 


Rys.  13.  Model  cienkiego  filamentu  (C.  Cohen).  Symbolami TNI,  TNC  i TNT oznaczono  trzy  składniki  białkowe  wchodzące  w skład 
cząsteczki  troponiny 


badanie  powiadające  skokowi  podwójnego  heliksu  łańcuchów 
agregatów  monomerów  w filamencie,  co  świadczy  o połączeniu 
filamentów  filamentów  na  odpowiednich  poziomach  ich  spiralnej 
aktyny  struktury.  Na  obrazach  agregatów  filamentów  zawie- 
rających tropomiozynę  i troponinę  (il.  125b,  tabl.  31) 
okres  śrubowej  struktury  aktyny  ulega  zatarciu  wsku- 
tek pojawienia  się  innego  rodzaju  prążkowania, 
o okresie  38,5  nm.  W świetle  wyników  uzyskanych 
przy  użyciu  przeciwciał  to  nowe  prążkowanie  należy 
przypisać  periodycznemu  rozmieszczeniu  troponiny. 
W ten  sposób  wyjaśniło  się  również  nie  znane  dotąd 
pochodzenie  południkowych  refleksów  o okresie 
38,5  nm,  występujących  na  rentgenogramach  żywego 
mięśnia. 

Dzięki  regularności  ułożenia  filamentów  w ich 
agregatach  można  badać  ich  strukturę  metodą  op- 
tycznej dyfrakcji  na  wykonanych  w mikroskopie 
elektronowym  zdjęciach  agregatów.  Analizując  roz- 
kład i natężenie  refleksów  na  otrzymanych  obrazach 
dyfrakcyjnych,  można  metodą  transformacji  Fouriera 
obliczyć  funkcję  rozkładu  gęstości  optycznej, 
a z niej  — określić  przestrzenny  rozkład  masy  cząste- 
czek białkowych  w filamencie  i wykonać  trójwymiaro- 
wą rekonstrukcję  filamentu.  W ten  sposób  udało  się 
nie  tylko  potwierdzić  (w  pewnych  szczegółach  nawet 
skorygować)  przedstawiony  wyżej  model  cienkiego 
filamentu,  lecz  również  zauważyć  zmiany  w strukturze 
filamentu  zachodzące  pod  wpływem  wiązania  wapnia 
przez  troponinę.  Okazało  się,  że  w nieobecności  jo- 
nów wapnia  łańcuchy  cząsteczek  tropomiozyny  prze- 
biegają nie  przez  środek,  lecz  wzdłuż  krawędzi  row- 
ków między  łańcuchami  monomerów  aktyny  (rys. 
14a).  Obecność  jonów  wapnia  powoduje  niewielkie 
przesunięcie  cząsteczek  tropomiozyny  ku  centrum 
rowka,  z jednoczesnym  odsunięciem  środka  ich  masy 
od  aktynowego  trzonu  filamentu. 

Z zaproponowanych  dotychczas  modeli  najlepiej  tę 
zmianę  ilustruje  schemat  przedstawiony  na  rys.  14b. 
Przy  konstruowaniu  tego  modelu  uwzględniono  dwu- 
łańcuchową  budowę  cząsteczki  tropomiozyny  i zało- 
żono, że  przesunięcie  jest  wynikiem  rotacji  cząsteczki 
wokół  jej  osi.  Z przeprowadzonych  analiz  wynika,  że 
sumaryczne  przesunięcie  tropomiozyny  wynosi  1,5 
nm.  Do  podobnego  wniosku  skłaniają  wyniki  analizy 
rentgenograficznej  mięśni  w stanach  spoczynku  i skur- 
czu. 

mechanizm  Na  podstawie  tych  obserwacji  przypuszcza  się,  że 
regulacji  mechanizm  regulacji  cyklu  skurczowo-rozkurczowego 
skurczu  jest  następujący:  tropomiozyna  w pozycji  rozkurczo- 
wej (na  krawędzi  rowka  między  łańcuchami  aktyny) 
blokuje  przestrzennie  miejsce  reagowania  aktyny 
z miozyną  (rys.  15).  Wapń  uwolniony  z siateczki  sar- 
koplazmatycznej  jest  wiązany  przez  troponinę,  co 
powoduje  zmianę  konformacji  troponiny  (obecnie 
jest  już  na  to  wiele  dowodów  eksperymentalnych). 
Wskutek  tej  zmiany  następuje  przemieszczenie  tro- 
pomiozyny i odsłonięcie  regionu  niezbędnego  dla  wy- 
tworzenia połączenia  aktyny  z mostkami  miozyno- 
wymi.  W ten  sposób  troponina  — mimo  jej  periodycz- 
nego rozmieszczenia  na  filamencie  — może  kontrolo- 
wać stan  wszystkich  monomerów  aktynowych:  jedna 
cząsteczka  troponiny  reguluje  zdolność  do  reagowa- 


Rys.  14.  Schemat  przekroju  poprzecznego  przez  cienki  filament 
ilustrujący  zmianę  pozycji  tropomiozyny  TM  w cyklu  skurczo- 
wo-rozkurczowym:  a)  w nieobecności  jonów  wapnia,  b)  po  zwią- 
zaniu wapnia  przez  troponinę  (wg  D.  A.  D.  Parry’ego) 


Rys.  15.  Schematyczne  przedstawienie  wpływu  pozycji  tropo- 
miozyny w filamencie  cienkim  na  oddziaływanie  aktyny  z mostka- 
mi miozynowymi.  Linią  przerywaną  zaznaczono  pozycję  „roz- 
kurczową”, blokującą  miejsce  interakcji  z mostkiem  miozyno- 
wym  (modyfikacja  schematu  T.  Wakabayashiego  i in.) 
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W tej  chwili  nie  wiadomo  jeszcze,  czy  postulowa- 
na uprzednio  konformacyjna  zmiana  w cząsteczkach 
tropomiozyny  jest  powodem  ich  przesunięcia  na  fila- 
mencie  aktynowym.  Istnieje  alternatywna  możliwość, 
że  skurczowa  pozycja  tropomiozyny  — bliżej  cen- 
trum rowka — jest  termodynamicznie  bardziej  ko- 
rzystna od  pozycji  spoczynkowej.  W tym  wypadku 
zmiana  konformacji  troponiny  w następstwie  zwią- 
zania przez  nia  waonia  DOwodowałabv  uwolnienie 
tropomiozyny  z termodynamicznie  mniej  korzystnej 
pozycji,  bez  zmiany  konformacji  cząsteczki  tropo- 
miozyny.  Druga  z wymienionych  możliwości  wydaje 
się  bardzo  prawdopodobna  w świetle  obecnych  wia- 
domości o mechanizmie  reagowania  troponiny  w cien- 
kim filamencie  na  zmiany  stężenia  jonów  wapnia. 

Dla  uproszczenia  pominięto  w dotychczasowych 
rozważaniach  fakt,  że  troponina  zbudowana  jest 
z trzech  podjednostek  o odrębnych  własnościach,  po- 
łączonych w stosunku  molowym  1:1:1.  Składnik 
zwany  TNI,  o masie  23  000  daltonów  (w  mięśniach 
szkieletowych  królika;  w różnych  typach  mięśni 
i u różnych  zwierząt  ciężary  cząsteczkowe  podjedno- 
połączenie  stek  troponiny  nieco  się  różnią),  w obecności  tropo- 
troponiny  miozyny  hamuje  reakcję  aktyny  z miozyną  niezależnie 
filamentem  od  stężenia  jonów  wapnia  w środowisku.  Składnik 
TNC,  o masie  19  000  daltonów,  jest  tym  składnikiem, 
w którym  są  zlokalizowane  miejsca  wiązania  wapnia 
z troponiną,  a w obecności  trzeciego  składnika,  TNT, 
o masie  39  000  daltonów,  powoduje  zniesienie  hamu- 
jącego działania  TNI,  jeżeli  stężenie  wolnych  jonów 
wapnia  przekracza  10-e  mol/l.  Wyniki  szczegółowych 
badań  nad  zdolnością  reagowania  poszczególnych 
podjednostek  troponiny  z tropomiozyną  i aktyną 
sugerują,  że  cząsteczka  troponiny  ma  dwa  miejsca 
przyłączenia  do  cienkiego  filamentu  (rys.  16):  połą- 
czenie przez  TNT  jest  trwałe  niezależnie  od  stężenia 
jonów  wapnia  w środowisku,  natomiast  drugie  połą- 
czenie, przez  TNI,  dochodzi  do  skutku  tylko  w nieo- 
becności jonów  wapnia.  Ponieważ  TNC  nie  wiąże  się 
bezpośrednio  ani  z aktyną,  ani  z tropomiozyną,  a jest 
jedynym  składnikiem  troponiny  wiążącym  wapń, 
zmiana  stężenia  jonów  wapnia  musi  wpływać  na  wią- 
zanie TNI  z aktyną  i (lub)  tropomiozyną  przez  zmianę 
konformacji  TNC.  Jednoczesne  istnienie  obu  połą- 
czeń (przez  TNT  i przez  TNI)  utrzymuje  tropomio- 
zynę  w pozycji  blokującej  miejsce  reagowania  aktyny 


z miozyną.  Rozerwanie  połączenia  przez  TNI  przy 
wzroście  stężenia  wapnia  powoduje  przemieszczenie 
tropomiozyny  (być  może  właśnie  wskutek  zwolnienia 
jej  z termodynamicznie  niekorzystnej  pozycji)  i umoż- 
liwia reagowanie  aktyny  z miozyną.  Taki  mechanizm 
najlepiej  tłumaczy  dotychczas  poznane  fakty  do- 
świadczalne, nie  można  jednak  wykluczyć  pewnych 


\ 

stan  rozkurczu  \ stan  skurczu 


Rys.  16.  Schemat  regulacji  cyklu  skurczowo-rozkurczowego  przez 
troponinę  i wapń 

Opisany  mechanizm  regulacji  cyklu  skurczowo- 
rozkurczowego  jest  charakterystyczny  dla  mięśni 
szkieletowych  kręgowców.  W mięśniach  wielu  zwie- 
rząt niższych  nie  znaleziono  troponiny,  najprawdo- 
podobniej też  białko  to  nie  występuje  w mięśniach 
gładkich  kręgowców.  Istnieją  dowody  przemawiające 
za  tym,  że  w mięśniach  gładkich  rolę  akceptora  jonów 
wapnia  podczas  skurczu  odgrywa  jeden  z lekkich 
łańcuchów  miozyny. 

Dokładniejsze  omówienie  różnic  w budowie  mi- 
kroskopowej wszelkich  typów  mięśni  oraz  moleku- 
larnej organizacji  i funkcjonowania  ich  białek  struk- 
turalnych i regulujących  przekracza  ramy  tego  arty- 
kułu. Mimo  różnic  w charakterystycznych  właści- 
wościach poszczegółnych  typów  mięśni,  podstawą  mechanizm 
mechanizmu  skurczu  wszystkich  mięśni  jest  reago-  skurczu 
wanie  ze  sobą  filamentów  miozynowych  i aktyno-  wszystkich 
wych  w trakcie  hydrolizy  ATP  — źródła  energii  dla  mięśni 
skurczu,  oraz  regulacja  tego  procesu  poprzez  zmiany 
stężenia  jonów  wapnia. 


Biomechanika  mięśni 

Kazimierz  Fideius,  Krzysztof  Kędzior  i Adam  Morecki 


Przedmiotem  biomechaniki  jest  badanie  ruchu  orga- 
nizmów żywych,  a w szczególności  człowieka,  przy 
korzystaniu  z praw  mechaniki.  Zakres  badań  biome- 
chanicznych  obejmuje  zarówno  mechaniczne  jak 
i biologiczne  aspekty  ruchu.  W organizmach  żywych 
poruszają  się  nie  tylko  poszczególne  części  ciała,  lecz 
również  organy  wewnętrzne,  ciecze  w naczyniach 
krwionośnych  i limfatycznych,  powietrze  w układzie 
oddechowym  itp.  Strona  mechaniczna  tych  ruchów 
jest  jeszcze  mało  zbadana.  Stosowanymi  metodami 
badawczymi  są  analiza  i synteza  ruchu  prowadzone 
na  podstawie  pomiarów  różnych  jego  parametrów 
i charakterystyk:  kinematycznych,  dynamicznych 
i regulacyjnych.  Bardzo  pomocne  przy  tych  badaniach 
jest  modelowanie  układów  ruchu  i układów  sterowa- 
nia ruchem. 

Rozwój  nauk  biologicznych,  medycznych  i cyber- 
netyki wpływał  i wpływa  na  rozwój  biomechaniki. 
Ponieważ  omawiana  dziedzina  ma  charakter  inter- 
dyscyplinarny, do  rozwiązywania  powstających  za- 
gadnień potrzebne  są  zespoły  grupujące  badaczy 
o różnym  przygotowaniu  zawodowym.  Teoria  bio- 
mechaniki formująca  się  od  niedawna  korzysta  z jed- 
nej strony  z ogromnego  materiału  doświadczalnego. 


zgromadzonego  w ciągu  ostatnich  stukilkudziesięciu 
lat,  a z drugiej  strony  — z wyników  w dziedzinie  mo- 
delowania matematycznego  i symulacji  systemów 
uzyskanych  ostatnimi  czasy. 

Analizę  ruchu  można  przeprowadzić  opierając  się  analiza  ruchu 
wyłącznie  na  podstawach  anatomicznych  i fizjologicz- 
nych oraz  obserwując  zewnętrzne  przejawy  ruchu. 

Metodami  służącymi  do  takiej  obserwacji  są:  technika 
filmowa  i elektromiografia  (rejestracja  elektrycznych 
potencjałów  mięśniowych).  Ten  kierunek  badawczy 
otrzymał  nazwę  kinezjologii.  Można  także,  korzysta- 
jąc z metod  i praw  mechaniki  ciał  sztywnych  i od- 
kształcanych, opisywać  ruch  (np.  ruch  ciała  ludzkie- 
go lub  jego  części,  czy  przepływ  cieczy  w naczyniach) 
w postaci  zależności  matematycznych.  Jest  to  podej- 
ście charakterystyczne  dla  współczesnych  badań  bio- 
mechanicznych.  W razie  potrzeby  opis  matematyczny 
obejmuje  także  towarzyszące  zjawiskom  mechanicz- 
nym zjawiska  elektryczne,  cieplne  i inne.  Na  podsta- 
wie takich  badań  proponuje  się  różne  modele  orga- 
nizmu, jego  części,  narządów  wewnętrznych  i zew- 
nętrznych, które  by  wyjaśniły  m.in.  zagadnienia  koor- 
dynacji ruchu. 

W ostatnich  latach  biomechanika  rozwija  się 
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główne 

układy 

ruchu 

człowieka 


w trzech  podstawowych  kierunkach : mechanika 
człowieka  traktowanego  jako  całość,  mechanika 
kończyn  człowieka  i mechanika  sterowania  ruchem 
człowieka  lub  jego  poszczególnych  części  ciała.  Roz- 
wijają się  także  zastosowania  w medycynie,  technice 
i sporcie.  Stąd  rozróżnia  się  biomechanikę  medyczną, 
inżynierską  i ćwiczeń  sportowych. 

Systemowe  ujęcie  głównych  układów  człowieka 
uczestniczących  w ruchu  pokazano  na  rys.  1.  Model 
przedstawiony  na  tym  rysunku  składa  się  z trzech 
podstawowych  układów,  a mianowicie:  ruchu,  stero- 
wania i zasilania.  Czwarty  układ  reprezentuje  środo- 
wisko, z którym  współdziała  cały  system.  Ogólne 
sprzężenia  oraz  wpływy  zewnętrzne  i wewnętrzne  w 
układach  zaznaczono  na  rysunku  odpowiednimi 


receptory  do  układu  sterowania.  Układ  zasilania  po- 
biera pokarm  i powietrze  z otoczenia,  przetwarzając 
pokarm  na  substancje  energetyczne  i powietrze,  oraz 
rozprowadza  substancje  energetyczne  i tlen.  Tak  ujęty 
model  działalności  ruchowej  człowieka  umożliwia 
przeprowadzenie  różnych  analiz  jego  działania  w roz- 
maitych sytuacjach  ruchowych.  Szczególnym  przy- 
padkiem działania  może  być  działanie  informacyjne 
lub  energetyczne  układu.  Należy  podkreślić,  że  układy 
ruchu  i sterowania  są  stosunkowo  nieźle  zbadane,  na- 
tomiast znacznie  mniej  jest  zbadany  układ  zasilania. 


Układ  ruchu 
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Rys.  1.  Schemat  blokowy  głównych  układów  współuczestniczą- 
cych w ruchu  organizmu,  gdzie  propriorecepcja  oznacza  infor- 
macje od  receptorów  czucia  własnego  mięśni,  ścięgien  i stawów, 
eksterorecepcja  — informacje  o stanie  środowiska  zewnętrznego 
(wzrokowa,  słuchowa,  powonienia,  dotyku  itp.),  wiscerorecep- 
cja  — informacje  płynące  od  trzew  (viscera),  ciśnienie  krwi,  stę- 
żenie C02  itp. 


strzałkami.  Układ  ruchu  składa  się  z aparatów:  kost- 
no-stawowego i mięśniowego.  Układ  sterowania  we 
współczesnym  ujęciu  jest  hierarchicznym,  kilkupozio- 
mowym  układem,  w którym,  przy  ogólnie  obowiązu- 
jącej centralizacji  sterowania,  poszczególne  poziomy 
mają  określony  stopień  autonomii.  Bodźce  ruchowe 
są  przesyłane  do  poszczególnych  tzw.  aktonów  mięś- 
niowych wywołujących  ruch  w stawach.  Wyjścia  tego 
układu  są  jednocześnie  wejściami  do  środowiska  zew- 
nętrznego. Informacje  o stanie  środowiska  są  prze- 
kazywane przez  telereceptory  i kontaktoreceptory, 
a informacje  o stanie  układu  ruchu  — przez  proprio- 


Aparat  kostno-stawowy 

Podamy  na  początek  kilka  szczegółowych  informacji 
o kościach  i stawach,  gdyż  wiąże  się  to  z głównym 
przedmiotem  opisu,  tj.  mięśniami.  Liczba  kości  u czło- 
wieka jest  zmienna  w zależności  od  wieku  i wynosi  od 
270  u noworodka,  przez  356  u ludzi  młodych,  do  206 
u ludzi  dorosłych  i w miarę  starzenia  się  organizmu 
nadal  maleje.  Każda  z czterech  kończyn  u ludzi  do- 
rosłych ma  22  kości.  Tak  więc  łączna  liczba  kości  w 
kończynach  wynosi  88,  co  stanowi  ponad  40%  ogól- 
nej liczby  kości  u dorosłego  człowieka.  Na  rys.  2 po- 
kazano schematycznie  kończyny  przednie  lub  górne 
5 ssaków  i ptaka.  Nietrudno  zauważyć,  że  poszczegól- 
ne kości  — narysowane  jako  odcinki  — tworzą  łań- 
cuchy kinematyczne.  Są  to  łańcuchy  otwarte,  a ich 
zamknięcie  następuje  np.  przy  unieruchomieniu  ręki 
względem  otoczenia  lub  przy  zetknięciu  stopy  z pod- 
łożem, tzn.  podczas  ruchów  lokomocyjnych  i stania. 

Tak  samo  jest  w kończynach  dolnych.  Liczba  wszyst-  j jczba  stopni 
kich  ruchów  (zwana  liczbą  stopni  swobody),  które  swobody 
możemy  wykonać  w poszczególnych  stawach  szkiele- 
tu, nie  interesując  się  zakresami  ruchów  i przyjmując, 
że  każdy  z nich  można  wykonać  niezależnie,  wynosi 
240-250.  W tym  kończyny  górne  i dolne  umożliwiają 
wykonanie  aż  120  ruchów,  czyli  ok.  50%  wszystkich 
ruchów.  W rzeczywistości  niektóre  ruchy  np.  palców 
u ręki  oraz  palców  u stopy  są  sprzężone  i trudno  jest 
wykonywać  niezależne  ruchy  poszczególnych  części 
palca.  . 

Stawy  są  tak  rozmieszczone,  że  położone  najbliżej  rozmieszczę- 
tułowia  stawy  ramienny  (rys.  2)  i biodrowy  umożli-  stawów 
wiają  wykonanie  trzech  niezależnych  ruchów.  Stop- 
niowo przez  stawy:  łokciowy  i promieniowo-nad- 
garstkowy  w kończynie  górnej  oraz  kolanowy  i sko- 
kowo-goleniowy  w kończynie  dolnej,  przechodzi  się 
do  stawów  palców,  które  umożliwiają  wykonanie  tyl- 
ko jednego  ruchu  w każdym  stawie.  Nasuwa  się  natu- 
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Rys.  2.  — Schematy  strukturalne  6 kończyn  przednich  lub  górnych  ssaków  i ptaka;  n liczba  stawów,  w liczba 
stopni  swobody.  HI, IV , V oznacza  stawy,  o trzech,  dwóch  i jednym  ruchu  obrotowym  (czyli  pary  biokinema- 
tyczne  klasy  ///,  IV , V) 


n = 22 
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ralne  pytanie,  dlaczego  spośród  różnych  możliwych  nich  latach  udało  się  otrzymać  ogólny  związek  opisu- 
rozwiązań  ukształtował  się  właśnie  taki  a nie  inny  jący  współzależność  pomiędzy  liczbą  stopni  swobody 
schemat  strukturalny  aparatu  kostno-stawowego,  kończyn  (suma  liczby  stopni  swobody  stawów  koń- 
Składa  się  na  to  wiele  czynników,  z których  podsta-  czyny)  a liczbą  funkcji  mięśni  napędzających  daną 
wowy  to  omówiony  niżej  sposób  napędu  aparatu  kończynę  (suma  funkcji  wszystkich  mięśni).  Na  rys.  3 
kostno-stawowego  przez  zespół  mięśni.  podano  kilka  charakterystycznych  liczb  dotyczących 

kończyn  wybranych  ssaków  i ptaka.  Przyjmując,  że 
kończyna  górna  człowieka  jest  najbardziej  zaawanso- 
Aparat  mięśniowy  wana  pod  względem  wszechstronności  rozwoju  usta- 

lono, że  związek  pomiędzy  liczbą  stopni  swobody  w 
O ile  układ  kostno-stawowy  wydaje  się,  przynajmniej  a liczbą  funkcji  aktonów  mięśniowych  / może  być 
na  pierwszy  rzut  oka,  dość  przejrzysty  i zbudowany  aproksymowany  podanym  na  rys.  4 równaniem,  któ- 
wg  określonych  zasad,  to  zespół  mięśni  wywołuje  wra- 


t . liczba  funkcji  aktonów  mięśniowych  w stawach 

Rys.  3.  Zależność  pomiędzy  liczbą  stawów  a liczbą  różnych  funkcji  aktonów  mięśniowych  w tych  stawach 


się  do  tego  bardzo  duża  liczba  mięśni,  człowiek  ma 
ich  ok.  640,  które  składają  się  łącznie  z ok.  6 mld  włó- 
kien mięśniowych  i ok.  6 bilionów  włókienek  mięśnio- 
wych. 

Mięśnie  dzielą  się  na  trzy  rodzaje:  mięśnie  szkiele- 
towe, czyli  poprzeczne  prążkowane,  mięśnie  gładkie 
i mięsień  sercowy.  Układ  ruchu  jest  napędzany  mię- 
śniami szkieletowymi,  których  człowiek  ma  ponad 
440.  Do  ich  sterowania  służy  ponad  420  tys.  komórek 
nerwow-ych  (tzw.  komórek  ruchowych)  znajdujących 
się  w rdzeniu  kręgowym.  Każda  z tych  komórek  ste- 
jednostka  ruje  działaniem  zespołu  włókien  mięśniowych.  Zespół 
motory czna  taki,  zwany  jednostką  motoryczną  (ruchową)  zawiera 
od  kilku  (4-6  w mięśniach  poruszających  gałką  oka) 
do  kilkuset  (640  w dużych  mięśniach  nóg)  włókien 
mięśniowych. 

Mięśnie  szkieletowe,  w zależności  od  przebiegu 
włókien  mięśniowych  względem  osi  podłużnej  mięśnia, 
dzielą  się  na  mięśnie  obłe,  pierzaste,  płaskie,  okrężne 
aktony  i inne.  Niektóre  mięśnie  mają  kilka  głów  lub  części 
i dzieli  się  je  wówczas  na  tzw.  aktony,  ponieważ  każda 
z części  mięśnia  wykonuje  inne  funkcje  w stawach, 
ponad  którymi  przebiega.  Tak  więc  przez  pojęcie  ak- 
tonu  rozumie  się  tę  część  mięśnia,  której  włókna  są  tak 
usytuowane,  że  rozwijają  (wytwarzają)  siłę  w jednym 
określonym  kierunku,  co  jest  równoważne  rozwijaniu 
momentu  siły  względem  jednej  z osi  obrotu  w stawie. 
Wiele  mięśni  składa  się  z jednego  tylko  aktonu.  W za- 
leżności od  sposobu  działania  aktonu  względem  osi 
stawu  wyróżnia  się  jego  następujące  funkcje:  prosto- 
wanie i zginanie  (ruch  w płaszczyźnie  strzałkowej),  su- 
pinację  i pronację  (ruch  w płaszczyźnie  poprzecznej) 
oraz  przywodzenie  i odwodzenie  (ruch  w płaszczyźnie 
czołowej).  W stawach  o trzech  stopniach  swobody 
(np.  staw  ramienny  człowieka)  występuje  wszystkie 
sześć  funkcji. 

Badanie  rozmieszczenia  mięśni  szkieletowych  na- 
suwa wniosek,  że  natura  zastosowała  tutaj  bardzo 
skomplikowany  system,  który  nie  poddaje  się  łatw-o 
analizie.  Jak  wynika  z zależności  przedstawionych  na 
rys.  3,  w organizmach  o strukturach  prostych  wystę- 
puje niewielkie  zróżnicowanie  funkcji.  W strukturach 
rozwiniętych  rozkład  możliwych  funkcji  jest  bardziej 
zróżnicowany.  Świadczy  to  o przystosowaniu  danej 
kończyny  do  wypełniania  różnych  funkcji.  W ostat- 
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Rys.  4.  Zależność  pomiędzy  liczbą  stopni  swobody  kończyn  w 
a liczbą  funkcji  / aktonów  różnych  zwierząt;  p kończyna  przed- 
nia, t kończyna  tylna.  Zależność  ta  ma  postać  tzw.  krzywej  lo- 
gistycznej 

rego  wykres  ma  postać  tzw.  krzyw-ej  logistycznej.  Ta 
prawidłowość  pozwala  na  wyciągnięcie  różnych  wnio- 
sków natury  biologicznej  i technicznej. 


Rodzaje  mięśni  i ich  możliwości 


Ewolucja  mięsni 

U zwierząt  jednokomórkowych  narządem  ruchu  są  witki, 
różnego  rodzaju  witki  i rzęski,  wewnątrz  których  znaj-  rzęska 
dują  się  nici  aktyny  i miozyny  ( -►  Molekularne  pod-  i mięśnie 
stawy  skurczu  mięśnia).  Zwierzęta  wielokomórkowe 
mają  bardziej  urozmaicony  aparat  ruchowy,  w'  którym 
nitki  aktyny  i miozyny  otoczone  sarkoplazmą  grupują 
się,  tw-orząc  włókna  mięśniowe  i mięśnie.  Mięsień, 
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zgodnie  z III  zasadą  dynamiki  Newtona,  może  rozwi- 
jać siłę  (akcja),  jeśli  na  końcach  jego  przyczepów  lub 
wewnątrz  jam  ciała,  które  otacza,  będzie  występować 
opór  (reakcja). 


przełyk 


podłużne 


mięśnie  okrężne 
(poprzeczne) 


mięsnie 


otworu 


gębowego 


chłonąco 
trawiaca 


podłużne 


Rys.  5.  Rozmieszczenie  mięśni  gładkich:  a)  ukwiaia  końskiego, 
b)  w żołądku  człowieka 


aparaty  Niżej  rozwinięte  zwierzęta,  np.  jamochłony  i pła- 
ruchowe  zińce  poruszają  się  całym  ciałem,  które  tworzy  wór 
różnych  skórno-mięśniowy.  Pasma  włókien  mięśniowych  bieg- 
zwierząt  ną  u nich  w różnych  kierunkach,  powodując  wydłu- 
żanie się  lub  grubienie  całego  ciała,  zwieranie  otworu 
gębowego  lub  wciąganie  do  wewnątrz  niektórych 
części  ciała  albo  pokarmu  (rys.  5).  U skorupiaków 
mięśnie  są  już  bardzo  dobrze  rozwinięte,  do  czego 
przyczynia  się  niewątpliwie  obecność  twardej  skorupy. 
Małże  np.  posiadają  silne  zwieracze  dwu  połówek 
muszli,  która  je  otacza;  ślimak  natomiast  posiada 
„nogę”  przytwierdzoną  pośrednio  do  skorupy,  dzię- 
ki której  może  się,  wprawdzie  bardzo  powoli,  poru- 
szać. 

U stawonogów  obserwuje  się  duże  różnice  w budo- 
wie aparatu  ruchowego  w porównaniu  ze  zwierzętami 
niższymi.  Po  pierwsze,  niższe  od  nich  formy  poruszają 
się  bez  udziału  specjalnych  części  ciała  zwanych  koń- 
czynami (nogami).  Występujące  u nich  witki,  rzęski 
a nawet  „noga”  ślimaka  są  tylko  pseudonogami,  po- 


Rys.  6.  Schemat  działania  mięśni  u owadów:  a)  mięśnie  porusza- 
jące skrzydłami  1.  W rzeczywistości  poruszają  one  tułowiem 
i znajdującą  się  na  nim  płytką  grzbietową.  Mięśnie  poprzeczne  2 
powodują  ruch  skrzydeł  ku  górze  a mięśnie  podłużne  3 — do 
dołu.  b)  Budowa  stawu  nogi  owada.  Człony  chitynowe  4 połą- 
czone tkanką  wiotką  tworzą  staw  J,  poruszany  znajdującymi 
się  wewnątrz  mięśniami  6 


nieważ  nie  mają  własnego  szkieletu.  Po  drugie,  poru- 
szają się  one  za  pomocą  mięśni  gładkich,  które  są  po- 
wolne, choć  bardzo  wytrzymałe  na  zmęczenie.  Mięśnie 
te  nie  potrzebują  twardego  szkieletu,  ale  równocześnie 
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nie  potrafią  rozwinąć  dużej  mocy  mechanicznej,  nie- 
zbędnej np.  do  latania  w powietrzu.  U stawonogów 
za  to  pojawiają  się:  twardy  zewnętrzny  szkielet  chity- 
nowy  oraz  najbardziej  sprawne  żywe  silniki  — mięśnie 
poprzecznie  prążkowane  (rys.  6). 


ft/Hęśniie  szkieletowe 

Mikroskopowa  budowa  mięśnia  szkieletowego  wska-  budowa 
żuje,  że  składa  się  on  z setek  lub  tysięcy  równoległych  ntikroskopo- 
komórek  — włókien  mięśniowych  otoczonych  współ-  wa 
ną  osłoną.  Na  obu  końcach  mięsień  przechodzi  w 
ścięgna,  które  łączą  się  z kośćmi  szkieletu  (rys.  7). 


Rys.  7.  Budowa  mięśnia  poprzecznie  prążkowanego:  a)  mięsień, 
b)  wycinek  mięśnia,  c)  włókno  mięśniowe,  na  którym  widać 
prążki  poprzeczne  oraz  włókienka,  d)  sarkomer  (który  ograni- 
czają linie  Z)  przed  skurczem,  e)  sarkomer  w stanie  skurczu 


Włókno  mięśniowe  z kolei  składa  się  z zesporow  włó-  włókno 
kienek  mięśniowych  (miofibryli)  osłoniętych  owłó-  mięśniowe 
knią  mięśniową,  która  jest  cienką  (ok.  2,5  pm)  przej- 
rzystą błoną  (rys.  7b).  Miofibryle  są  elementami  kurcz- 
liwymi włókien  mięśniowych,  które  występują  we 
włóknach  mięśni  gładkich,  mięśnia  sercowego  i mięśni 
szkieletowych.  W tych  ostatnich  i w mięśniu  serco- 
wym mają  one  budowę  prążkowaną  nadającą  charak- 
terystyczny wygląd  całemu  włóknu  obserwowanemu 
pod  mikroskopem.  Włókno  mięśniowe  ma  średnicę 
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Rys.  8.  Działanie  stawu  łokciowego  i schemat  połączeń  mięśnia 
dwugłowego  ramienia  z rdzeniem  kręgowym;  Fi  siła  rozwijana 
przez  mięsień,  r<  promień  siły  mięśniowej,  Fz  obciążenie  zewnętrz- 
ne stawu,  R promień  siły  Fz 


10-100  jim  i długość  3-5  a nawet  12  cm.  Miofibryle 
mają  grubość  ok.  0,5-2  jim  (rys.  7c)  i składają  się 
z setek  elementów  strukturalnych,  tzw.  filamentów, 
które  z kolei  składają  się  z łańcuchów  cząsteczek  biał- 
kowych rozmieszczonych  wg  ściśle  określonego  planu 


mięśnie 

wywołujące 

zmianę 

ciśnienia 


mięśnie 
usztywniają- 
ce szkielet 


(rys.  7d)  (— ► Molekularne  podstawy  skurczu  mięśnia). 
Badania  ultracienkich  preparatów  mięśniowych  me- 
todą mikroskopii  elektronowej  wykazały,  że  miofibry- 
le  są  zbudowane  z dwóch  rodzajów  filamentów,  a mia- 
nowicie grubszych  (miozynowych)  o średnicy  ok. 
1000  nm  i długości  1,5  jim  i cienkich  (aktynowych) 

0 średnicy  400-550  nm  i długości  2 pm.  Jak  wynika 
z rys.  7d,  filamenty  w mięśniach  poprzecznie  prążko- 
wanych częściowo  pokrywają  się  i w rezultacie  prążki 
A są  widoczne  w strefach  nakładania  się  cienkich 

1 grubych  filamentów,  prążki  / odpowiadają  nakła- 
daniu się  tylko  cienkich,  a strefy  H — nakłada- 
niu się  grubych  filamentów.  Wąskie  pasmo  rozdzie- 
lające na  połowę  cienkie  filamenty  odpowiada  tzw. 
linii  Z. 

Mięśnie  szkieletowe  kręgowców  mają  bardzo  różne 
kształty:  obłe,  czworoboczne,  trójkątne,  wachlarzo- 
wate,  okrężne  itp.  Poruszane  przez  nie  kości  wykonują 
ruchy  obrotowe  w stawach.  Na  rys.  8 pokazany  jest 
dla  przykładu  staw  łokciowy  człowieka  poddany  ob- 
ciążeniu siłą  Fz. 

Jest  jednak  pewna  odrębna  grupa  mięśni  poprzecz- 
nie prążkowanych,  która  podczas  skracania  się  wy- 
wołuje zmianę  ciśnienia  w obrębie  jam  naszego  ciała. 
Jama  ustna  jest  otoczona  mięśniami,  których  praca 
wywołuje  ciśnienie  ujemne  (zassanie)  lub  dodatnie 
(dmuchanie).  Podobnie  działają  mięśnie  otaczające 
klatkę  piersiową  oraz  jamę  brzuszną  (rys.  9).  Pierwsze 
zapewniają  wdychanie  i wydychanie  powietrza  z płuc, 
ale  oddychanie  może  się  również  odbywać  przy  ak- 
tywnym udziale  mięśni  brzucha.  Łatwo  to  wyczuć, 
np.  podczas  kaszlu.  Jednak  główne  zadanie  mięśni 
brzucha  polega  na  utrzymaniu  narządów  na  właści- 
wym miejscu  oraz  usztywnianiu  tułowia  podczas  prze- 
kazywania pędu  z kończyn  dolnych  lub  górnych  na 
resztę  ciała  człowieka.  Narządy  wewnętrzne,  takie  jak: 
serce,  wątroba,  żołądek  lub  jelita  wypełnione  płynami 
mają  masy  rzędu  1 kg  (np.  serce  ok.  0,5  kg,  wątroba 
ok.  2 kg).  Przyspieszenie  ciała  wynosi  np.  przy  skoku 
wzwyż  2-3  g (g  — przyspieszenie  ziemskie),  co  wy- 
wołuje pojawienie  się  dużych  sił  bezwładności  działa- 
jących na  te  narządy.  Siły  bezwładności  są  równowa- 
żone przez  zwiększone  ciśnienie  w jamach  ciała. 


Rys.  9.  Schemat  działania  mięśni  jamowych:  A klatki  piersiowej, 
fi  jamy  brzusznej;  / mięsień  prosty  brzucha,  2 przebieg  włókien 
mięśni  skośnych  zewnętrznych  i wewnętrznych  oraz  mięśnia  po- 
przecznego brzucha.  3 mięśnie  międzyżebrowe,  4 kręgosłup  wraz 
z żebrami,  5 miednica,  6 mostek,  7 przepona  moczopłciowa, 
^przepona  piersiowa 


Szkielet  tułowia  człowieka  ma  51  kości  i 49  stawów, 
które  mają  łącznie  104  stopnie  swobody.  Przy  wielu, 
ruchach  cały  ten  układ  musi  być  usztywniony  przez 
mięśnie  poprzecznie  prążkowane  w celu  przenoszenia 


sił  działających  na  kończyny.  Odbywa  się  to  zarówno 
podczas  odbicia  nogami  (skok,  bieg,  chód),  jak  i pod- 
czas rozwijania  dużych  sił  za  pomocą  kończyn  gór- 
nych (zwisy,  podnoszenie  ciężarów  itp.). 

Przebieg  włókien  nerwowych  między  rdzeniem  krę- 
gowym a mięśniami  szkieletowymi,  na  przykładzie 
mięśnia  dwugłowego  ramienia  pokazano  na  rys.  8. 
Włókna  mięśniowe  są  pobudzane  z komórek  rucho- 
wych rogów  rdzenia  czyli  komórek  i włókien  a.  Infor- 
macja o długości  i prędkości  skracania  mięśni  prze- 
biega do  rdzenia  od  środkowego  odcinka  wrzeciona 
mięśniowego  (włókna  ax  i a2).  Układ  nerwowy  uzysku- 
je informację  o sile  rozwijanej  przez  mięsień  od  orga- 
nów Golgiego,  które  znajdują  się  w ścięgnach  mięśni. 
Wrzeciona  mięśniowe  biegną  równolegle  do  włókien 
mięśniowych.  Na  biegunach  mają  one  części  kurczli- 
we, które  skracają  się  pod  wpływem  bodźców  wysy- 
łanych z komórek  y.  Skurcz  części  biegunowej  powo- 
duje rozciąganie  części  środkowej  wrzeciona  i 
wytwarzanie  impulsów  przekazywanych  do  rdzenia 
kręgowego. 

Jednostki  motoryczne  mięśnia  szkieletowego  dzia- 
łają zgodnie  z zasadą  „wszystko  albo  nic”  (prawo 
Bowditcha),  co  oznacza,  że  rozwijają  one  maksymal- 
ną siłę  na  jaką  je  aktualnie  stać,  lub  że  ich  naprężenie 
aktywne  jest  równe  zeru.  Takie  działanie  czyni  mię- 
sień szkieletowy  mało  przydatnym  do  utrzymania 
ciała  w położeniu  statycznym.  Szkielet  zewnętrzny 
stawonogów  utrzymuje  ciało  w bezruchu  bez  udziału 
mięśni,  natomiast  wewnętrzny  szkielet  kręgowców 
wymaga  stałego  napięcia  mięśni  dla  utrzymania  pos- 
tawy. Jeśli  uśpić  pająka  za  pomocą  chloroformu,  to 
będzie  on  stał  nadal.  Uśpienie  kręgowca  spowoduje 
natomiast  jego  przewrócenie  się.  Ze  względu  na  wa- 
runki statyki  ciała,  mięsień  szkieletowy  jest  zatem 
lepiej  dostosowany  do  funkcji  pełnionych  u stawono- 
gów, u których  pierwotnie  się  wykształtował,  niż 
u kręgowców.  Wspomniana  wyżej,  niejednoczesna 
praca  jednostek  motorycznych  u kręgowców  wystę- 
puje również  u stawonogów,  u których  jednak  cały 
mięsień  jest  unerwiony  przez  jedną  komórkę  ruchową 
i dlatego  proces  koordynacji  (sterowania)  ruchu  jest 
u nich  znacznie  ułatwiony. 

Prawie  połowa  masy  ciała  człowieka  składa  się 
z mięśni  i wszystkie  nasze  czynności  zewnętrzne  wy- 
konywane są  za  ich  pośrednictwem.  Mięsień  jest  ma- 
szyną biochemiczną  pracującą  w stałej  temperaturze. 
Nawet  izolowany,  utrzymywany  sztucznie  poza  orga- 
nizmem mięsień  może  podnieść  ciężar  o masie  2000 
razy  większej  od  jego  własnej.  Mięśnie  dwugłowy  ra- 
mienia ( biceps ) i ramienny  (brachialis)  u dobrze  zbu- 
dowanego mężczyzny  mają  masę  200-300  g.  Podczas 
pojedynczego  skurczu  wykonują  one  pracę  równą 
pracy  podniesienia  masy  1 kg  na  wysokość  90  m. 
Przy  pojedynczym  skurczu  temperatura  tych  mięśni 
podnosi  się  o ok.  0,003°C.  Przy  każdym  skurczu 
znaczna  część  energii  chemicznej  zostaje  zamieniana 
na  ciepło  i rozproszona.  Należy  podkreślić,  że  energia 
skurczu  przewyższa  ponad  1000  razy  energię  pobu- 
dzenia w mięśniu.  Na  ogół  mięśnie  pracują  w nieko- 
rzystnych warunkach  mechanicznych,  przy  przełoże- 
niach dźwigni  kostnych  w stosunku  ok.  10:1  (rys.  8). 
Tracąc  na  sile,  wywołują  one  w stawach  duże  pręd- 
kości kątowe.  Pomimo  to  można  przez  okres  kilku 
sekund  utrzymać  w dwóch  rękach,  przy  poziomej 
pozycji  przedramienia,  przedmiot  o ciężarze  900  N. 
Siła  rozwijana  przez  mięśnie  musi  być  w tym  położeniu 
10  razy  większa,  czyli  wynosić  9000  N.  Podnoszona 
masa  jest  prawie  2000  razy  większa  od  masy  pracują- 
cych mięśni.  Jako  ciekawostkę  można  podać,  że  naj- 
większy mięsień  człowieka  pośladkowy  wielki  ( glu - 
leous  maximus ) rozwija  siłę  12  000  N.  Sprawność  me- 
chaniczna tej  znakomitej  maszyny  wynosi  25%  lub 
więcej  podczas  pracy  w odpowiednich  warunkach. 
Mięsień  osiąga  więc  sprawność  silnika  spalinowego. 
Siła  rozwijana  przez  pojedyncze  włókno  mięśniowe 
przy  stosunku  jego  średnicy  do  długości  jak  1 :5000, 
wynosi  1-3  N,  a naprężenie  mięśnia  wynosi  70- 
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powiązanie 
mięśnia 
z układem 
nerwowym 


właściwości 
mięśni  szkie- 
letowych 


100  N/cm2  przekroju  poprzecznego.  Masa  1 kg  mięś- 
nia może  w ciągu  8 h rozwinąć  moc  ok.  15  W. 

Człowiek  może  zaangażować  jednocześnie  7?  swo- 
ich mięśni.  Gdyby  natomiast  te  wszystkie  mięśnie 
miały  ten  sam  punkt  przyczepu,  to  mogłyby  działać 
wady  z siłą  250  000  N.  Niezależnie  od  wymienionych  zalet 
mięśni  mięsień  szkieletowy  ma  również  swoje  wady.  Jego 
szkieleto-  skurcz  jest  bardzo  gwałtowny,  co  powoduje  koniecz- 
wych  ność  amortyzacji  całego  ruchu.  Dlatego  w mięśniu 
szkieletowym  występują  podatne  elementy,  takie  jak 
błona  Z,  a zwłaszcza  włókna  łącznotkankowe  two- 
rzące ścięgna  mięśni.  Rolę  amortyzatorów  u stawo- 
nogów pełni  również  szkielet  chitynowy,  a u kręgow- 
ców chrząstki  stawowe.  Mięsień  szkieletowy,  w od- 
różnieniu od  gładkiego,  musi  po  skurczu  odpocząć,  co 
uwzględnia  układ  nerwowy  kręgowców,  pobu- 
dzając włókna  mięśniowe  nie  równocześnie,  lecz  po 
kolei  — część  z nich  pracuje,  inne  odpoczywają 
Równoczesne  pobudzenie  prawie  wszystkich  włókien 
danego  mięśnia  w ruchach  pojedynczych  u kręgo- 
wców występuje  niezmiernie  rzadko,  np.  podczas 
gwałtownego  skoku. 


Mięśnie  gładkie 

Mięśnie  szkieletowe  są  przyczepione  do  szkieletu  ko- 
stnego i chrząstkowego.  Mięśnie  gładkie  natomiast 
nie  przyczepiają  się  do  elementów  sztywnych.  Znajdu- 
ją się  w ścianach  przewodu  pokarmowego,  naczyń 
krwionośnych,  układu  moczowego,  narządów  rod- 
nych i dróg  oddechowych.  W pewnym  sensie  „szkie- 
letem” dla  mięśni  gładkich  jest  ciśnienie  płynów  prze- 
miesźczanych  przez  te  mięśnie. 

budowa  Włókna  mięśni  gładkich  (miocyty)  mają  kształt 

włókien  wrzecionowaty.  Długość  ich  wynosi  30-500  pm, 
a średnica  5-10  pm.  Z zewnątrz  otoczone  są  błoną, 
a wnętrze  włókna  jest  wypełnione  sarkoplazmą,  którą 
wypełniają  prawie  całkowicie  miofibryle  o średnicy 
0,2-0, 3 pm.  W obrębie  miofibryli  włókien  mięśni 
gładkich  występują  mniejsze  elementy  strukturalne, 
tzw.  miofilamenty  o średnicy  ok.  5 nm.  Kilka  lub  kil- 
kanaście włókien  mięśniowych  tworzy  pęczek.  Nie- 
kiedy zakończenia  włókien  mięśni  gładkich  kończą  się 
sprężystymi,  splatającymi  się  ze  sobą  ścięgnami,  dzięki 
czemu  powstaje  elastyczno-kurczliwy  zespół,  który 
reguluje  wielkość  przekroju  przepływu  płynu  przez 
naczynie. 

właściwości  Brak  sztywnego  szkieletu,  do  którego  byłyby  przy- 
mięśni  łączone  mięśnie  gładkie  oraz  ich  funkcja  w organi- 
gładkich  zmie,  determinują  mniejszą  dynamikę  ich  działania. 

Nici  aktyny  i miozyny  w mięśniach  gładkich  nie  są 
uporządkowane  przestrzennie.  Dlatego  nie  występuje 
w nich  poprzeczne  prążkowanie.  Brak  uporządkowa- 
nia przestrzennego  miofilamentów  powoduje  również 
mniejszą  zmienność  siły  w zależności  od  długości 
mięśni  gładkich.  Ich  wydłużenie  względne  jest  większe 
niż  mięśni  szkieletowych.  Na  przykład  mięśnie  gładkie 
macicy  w okresie  ciąży  wydłużają  się  kilkunastokrot- 
nie w stosunku  do  długości  spoczynkowej.  Zmiana 
siły  mięśni  gładkich  w funkcji  ich  długości  zależy, 
bardzo  znacznie  od  prędkości  ich  rozciągania.  Powol- 
ne rozciąganie  ma  niewielki  wpływ  na  zmianę  ich  siły, 
natomiast  szybkie  ich  rozciąganie  powoduje  istotny 
wzrost  siły. 

Czynność  tych  mięśni  jest  bardziej  powolna  i cha- 
rakteryzują ją  automatyczne  skurcze  rytmiczne.  Skur- 
cze te  odbywają  się  niezależnie  od  świadomości.  Czas 
skurczu  wynosi  ok.  3 s,  a cały  cykl  z okresem  utajo- 
nym i zluźnieniem  trwa  do  20  s.  Pracują  więc  one  200 
razy  wolniej  niż  mięśnie  szkieletowe. 


Mięsień  sercowy 

Trzeci  typ  mięśnia  to  mięsień  sercowy.  Włókna  mięś- 
nia sercowego  wykazują  prążkowanie  podłużne  i po- 
przeczne, przy  czym  prążki  poprzeczne  przypominają 


analogiczne  prążki  występujące  we  włóknach  mięśni  skurcze 
szkieletowych.  Skurcz  pojedynczy  mięśnia  sercowego  serca 
reagującego  na  pojedynczy  bodziec  ma  przebieg  po- 
dobny do  skurczu  mięśni  szkieletowych.  Jednakże 
czas  trwania  skurczu  mięśnia  sercowego  jest  znacznie 
dłuższy.  Prądy  czynnościowe  mięśnia  sercowego  są 
zazwyczaj  rejestrowane  za  pomocą  elektrod  umoco- 
wanych w wybranych  miejscach  powierzchni  ciała. 

Ich  zapis  w funkcji  czasu  nosi  nazwę  elektrokardio- 
gramu  (EKG). 

W odróżnieniu  od  mięśni  szkieletowych  w mięśniu 
sercowym  nie  występuje  zależność  siły  skurczu  od 
wartości  pobudzenia.  Bodziec  progowy  wywołuje  od 
razu  maksymalny  skurcz  mięśnia  sercowego.  Skurcze 
serca  są  automatyczne.  Częstość  skurczów  (zwana 
również  częstością  tętna)  wynosi  u dorosłego  człowie- 
ka ok.  70/min.  U dzieci  jest  ona  znacznie  większa 
(noworodek  — 135/min,  dziecko  pięcioletnie  — 105/ 

/min)  i w miarę  dojrzewania  zmniejsza  się  stopniowo. 

W czasie  dużych  wysiłków  częstość  skurczów  może 
wzrosnąć  do  180/min,  a u zawodników  nawet  do 
220/min. 

Serce  pompuje  bez  przerwy  krew  — w spoczynku  wydolność 
ok.  4 l/min,  co  stanowi  ok.  2 T0G  l/rok  lub  ok.  130- 106  serca 
I w ciągu  65  lat.  Podczas  wysiłku  wydolność  serca  jest 
większa,  w czasie  intensywnej  pracy  może  wzrosnąć 
ośmiokrotnie  w stosunku  do  wydolności  spoczynko- 
wej serca.  Ciśnienie  w tętnicach  jest  wysokie,  równe 
w przybliżeniu  ciśnieniu  słupa  wody  o wysokości 
1,5-1, 8 m.  Tak  więc,  w ciągu  roku  serce  człowieka 
pozostającego  w spoczynku  wykonuje  pracę  równą 
podniesieniu  ok.  2-106 1 krwi  na  wysokość  1,5-1, 8 m 
lub  podniesieniu  340-410  1 krwi  na  wysokość  Mount 
Everestu.  U człowieka  wykonującego  przeciętną  pracę 
serce  podnosi  rocznie  ok.  1 t krwi  na  wysokość  Mount 
Everestu. 


Badanie  właściwości 
biomechanicznych 
mięśni  szkieletowych 

Badaniami  różnych  właściwości  mięśni  zajmują  się 
fizjologowie  od  przeszło  100  lat,  a w ostatnich  dwu- 
dziestu kilku  latach  do  badań  tych  włączyli  się  również 
biomechanicy  i inżynierowie.  Wynika  to  ze  znaczenia 
mięśni  dla  utrzymywania  przy  życiu  organizmów 
żywych.  Niemałe  znaczenie  ma  również  fakt,  że 
mięsień  jest  bardzo  wdzięcznym  obiektem  do  badań. 
Starannie  wypreparowany,  trzymany  w odpowiednim 
roztworze  i odżywiany,  może  całymi  tygodniami 
funkcjonować  po  oddzieleniu  go  od  właściciela. 

Badania  właściwości  mechanicznych  mięśni  pro- 
wadzone są  na  mięśniach  szkieletowych  całkowicie 
izolowanych,  częściowo  izolowanych  i w organizmie. 
Każde  z tych  badań  wymaga  stosowania  odpowied- 
niej metodyki  i odpowiednich  stanowisk  pomiaro- 
wych oraz  dostarcza  innych  informacji. 


Badanie  mięśni  izolowanych 

Większość  badań  podstawowych  jest  prowadzona  na 
mięśniach  (lub  nawet  pojedynczych  włóknach  mięś- 
niowych) całkowicie  izolowanych  (in  vitro).  Warunki 
te  umożliwiają  bowiem  wykonanie  selektywnego  po- 
miaru najważniejszych  parametrów  biomechanicznych 
mięśni  i otrzymanie  informacji  o związku  między 
nimi,  co  nie  jest  możliwe  w organizmie  żywym  ze 
względu  na  wpływ  czynników  anatomicznych  (np. 
mięśnie  wielostawowe),  a także  psychicznych  (moty- 
wacja), które  zakłócają  pomiar.  Badania  takie  mają  na 
celu  ustalenie  związku  między  siłą  rozwijaną  przez 
mięsień  a jego  długością,  prędkością  skracania  lub 
wydłużania  i wartością  pobudzenia  (bodźcem  stymu- 
lacyjnym)  przy  obciążeniu  statycznym  lub  dynamicz- 
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nym.  Ponadto  dąży  się  do  ustalenia  związków  między 
wymienionymi  parametrami  biomechanicznymi  a 
strukturą  tkanki  mięśnia,  zjawiskami  energetycznymi 
i biochemicznymi  w mięśniu  oraz  do  matematycznego 
opisu  tych  związków  w'  postaci  możliwie  ogólnego 
modelu. 

Badania  te  prowadzi  się  na  specjalnie  przystoso- 
wanych stanowiskach,  umożliwiających  stworzenie 
środowiska  i warunków  zbliżonych  do  naturalnych, 
które  mięsień  znajduje  w organizmie.  Jak  już  wspom- 
badanie  niano,  mięsień  wypreparowany  z organizmu,  a pocho- 
mięśnia  dzący  od  zwierząt  o zmiennej  ciepłocie  ciała  (np.  od 
żaby  żaby)  umieszczony  wr  roztworze  fizjologicznym,  przez 
który  przetłaczany  jest  tlen,  pobudzany  bodźcami 
elektrycznymi  o odpowiednio  dobranych  parametrach 
(amplituda,  kształt,  czas  trwania,  czas  przerw)  po 
pewnym  czasie  „przyzwyczaja  się”  do  nowego  środo- 
wiska i stabilizuje  swe  właściwości  biomechaniczne. 
Na  przykład  mięsień  krawiecki  żaby  ( sartorius ),  który 
jest  mały  (przeciętna  masa  kilkadziesiąt  mg)  i cienki, 
a przez  to  łatwo  pobierający  tlen  z roztworu,  ma  wy- 
starczające zasoby  energetyczne,  aby  nawet  po  kilku 
tygodniach  przebywania  w roztworze  (wolnym  od 
bakterii!)  i po  tysiącach  skurczów  nadal  zachować 
swoje  właściwości.  Rysunek  10  przedstawia  schemat 


bo  nic”.  Gdy  bodziec  jest  wystarczająco  silny,  aby  spo- 
wodować reakcję,  to  jest  ona  maksymalna.  W czasie 
kilku  milisekund  po  zadziałaniu  bodźca  nie  obserwuje 
się  odpowiedzi  w postaci  siłowej,  rejestruje  się  nato- 
miast zmiany  potencjału  błony  komórkowej  (rys.  1 1 b). 
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Rys.  10.  Stanowisko  pomiarowe  do  badania  charakterystyk  bio- 
mechanicznych  mięśnia  izolowanego  żaby  stosowane  przez  ba- 
daczy japońskich.  Badany  mięsień  M umieszczony  jest  w na- 
czyniu i V z roztworem  fizjologicznym.  Wymiennik  ciepła  T ste- 
rowany przez  termoregulator  R utrzymuje  stałą  temperaturę  roz- 
tworu. Do  stymulowania  mięśnia  służą  generator  impulsów  elek- 
trycznych G oraz  dwie  elektrody  platynowe  E zanurzone  po  obu 
stronach  mięśnia.  Jeden  koniec  mięśnia  przyłączony  jest  do  czuj- 
nika siły  F,  a drugi  koniec  do  ruchomej  dźwigni  D z obciążnikiem 
P,  której  ruch  jest  śledzony  przez  urządzenie  z fotokomórką  FO. 
Do  ustalania  długości  mięśnia  służą  zderzak  Z i urządzenie  mi- 
krometryczne  Mk.  Regulator  prędkości  V,  który  może  być  do- 
łączony do  dźwigni  utrzymuje  stałą,  zadaną  prędkość  skracania 
lub  wydłużania  mięśnia 


stanowiska  do  badania  właściwości  biomechanicz- 
nych  mięśni  żaby,  stosowanego  przez  badaczy  ja- 
pońskich. 

Pomiary  podstawowych  parametrów  biomechanicz- 
nych  mięśni  izolowanych  prowadzi  się  zarówno  pod- 
czas tzw.  skurczu  izometrycznego  (stała  długość 
mięśnia),  jak  i tzw.  skurczu  izotonicznego  (stała  siła 
rozwijana  przez  mięsień).  W żywym  organizmie  naj- 
częściej występuje  skurcz  auksotoniczny,  w którym 
zarówno  długość  mięśnia,  jak  i jego  siła  zmieniają 
się  równocześnie  w czasie  trwania  skurczu. 

W odpowiedzi  na  otrzymany  pojedynczy  bodziec 
(naturalny  — doprowadzony  drogą  nerwową,  lub 
sztuczny  — z generatora),  o czasie  trwania  kilku  mili- 
sekund i napięciu  wyższym  od  progowego,  pojedyncze 
włókno  mięśnia  szkieletowego  reaguje  skurczem  poje- 
dynczym, po  czym  wraca  do  spoczynku.  Rysunek  lla 
przedstawia  zależność  siły  od  czasu  po  zadziałaniu 
bodźca  stymulacyjnego  na  utrzymywane  w warun- 
kach izometrycznych  włókno  mięśniowe  kręgowca. 
Przebieg  pokazany  na  rys.  lla  nie  jest  stopniowany, 
ale  jak  już  wspomniano  zgodny  z zasadą  „wszystko  al- 
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Rys.  11.  Różne  charakterystyki  włókna  mięśniowego  kręgowca 
utr;  ymy wanego  w warunkach  izometrycznych:  a)  siła  rozwijana 
w rezultacie  zadziałania  w chwili  / — 0 bodźca  stymulacyjnego, 
siła  w jednostkach  względnych,  b)  zmiany  potencjału  na  błonie 
komórkowej  włókna,  c)  przykład  oscylogramu  przedstawiający 
sumowanie  się  bodźców  pojedynczych  i powstanie  skurczu  tęż- 
cowego 


Czas  trwania  skurczu  pojedynczego  zarówno  włók-  czas 
na  jak  i całego  mięśnia  zależy  od  temperatury  i od  trwania 
rodzaju  mięśnia.  Podobnie  jak  w wielu  procesach  bio-  skurczu 
logicznych  i chemicznych  wzrost  temperatury  o 10°C 
powoduje  dwu-,  trzykrotny  wzrost  prędkości  przebie- 
gu tego  zjawiska.  U ssaków  czas  trwania  skurczu  po- 
jedynczego jest  na  ogół  mniejszy  od  0,1  s,  u owadów 
wynosi  ok.  0,01  s,  a u zwierząt  o zmiennej  ciepłocie 
ciała  wydłuża  się  niekiedy  (w  niskich  temperaturach) 
aż  do  kilkudziesięciu  sekund.  Tak  np.  mięsień  uru- 
chamiający zęby  żołądkowe  raka  lub  mięśnie  nóg  żół- 
wia budzącego  się  ze  snu  zimowego,  potrzebują  ok. 

30  s na  wykonanie  pojedynczego  skurczu.  Mięśnie 
skrzydeł  pospolitej  muchy  ( Phormia ) skracają  się  120 
razy  na  sekundę,  a częstość  uderzeń  skrzydeł  dochodzi 
do  kilkuset  na  sekundę.  Rozpiętość  jest  więc  ogromna 
i mięśnie  owadów  poruszają  się  ok.  3000  razy  częściej 
niż  mięśnie  raka  i żółwia.  Na  tym  tle  człowiek  wypada 
korzystnie  w porównaniu  z żółwiem,  ale  niezbyt  ko- 
rzystnie w porównaniu  z komarem,  którego  skrzydła 
uderzają  ok.  900  razy  na  sekundę.  Nie  potrafimy 
bowiem  poruszać  palcami  szybciej  niż  8—10  razy  na 
sekundę. 

Wielkość  siły  rozwijanej  przez  cały  mięsień,  w prze-  siła 
ciwieństwie  do  pojedynczego  włókna  mięśniowego,  rozwijana 
zależy  od  ampljtudy  bodźca  stymulacyjnego.  Gdy  przez 
przekracza  ona  wartość  progową,  notuje  się  słabą  mięsień 
odpowiedź  mięśnia,  która  powiększa  się  aż  do  mo- 
mentu osiągnięcia  przez  bodziec  największej  wartości. 

Słabe  bodźce  pobudzają  kilka  włókien  mięśniowych, 
natomiast  bodziec  maksymalny  pobudza  wszystkie 
włókna  mięśniowe.  Podobnie  przy  pobudzaniu  natu- 
ralnym siła  rozwijana  przez  mięsień  zależy  od  liczby 
jego  włókien  zaangażowanych  w wysiłek. 

Jeżeli  kolejny  bodziec  jest  doprowadzany  do  włókna 
mięśniowego  w trakcie  trwania  poprzedniego  skurczu, 
to  występuje  zjawisko  sumowania  odpowiedzi  siło- 
wych mięśnia.  Przy  określonej  częstości  bodźców  zja- 
wisko sumowania  doprowadza  do  wystąpienia  pełne- 
go (tzw.  gładkiego)  skurczu  tężcowego.  Rysunek  lic 
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przedstawia  przebieg  siły  rozwijanej  przez  włókno 
mięśniowe  kręgowca  w warunkach  izometrycznych 
w trakcie  stymulacji  o częstości  najpierw  rosnącej, 
a następnie  — malejącej.  Częstość  pobudzania  wy- 
wołująca skurcz  tężcowy  zależy  od  rodzaju  mięśnia 
i od  temperatury.  Dla  mięśni  szkieletowych  żaby  w 
temperaturze  0°C  częstość  ta  wynosi  ok.  18  Hz, 
w temperaturze  20°C  ok.  30  Hz,  a dla  mięśni  człowieka 
ok.  50  Hz.  Skurcz  tężcowy  trwa  tak  długo,  jak  długo 
są  dostarczane  bodźce  lub  dopóki  nie  nastąpi  zmę- 
czenie mięśnia.  Aby  siła  maksymalna  nie  malała, 
mięsień  izolowany  wymaga  przeciętnie  1 min  odpo- 
czynku na  1 s skurczu  tężcowego. 

Podstawową  właściwością  mięśnia  jest  rozwijanie 
(wytwarzanie)  siły.  Na  rys.  12  przedstawiono  podsta- 
wową charakterystykę  biomechaniczną  mięśni  na  przy- 
kładzie charakterystyki  uzyskanej  dla  izolowanego 
mięśnia  krawieckiego  żaby  ( sartorius ).  Charakterys- 


dlugość  / = l0  +&1,  gdzie  długość  spoczynkowa  J0=  31  mm 

Rys.  12.  Charakterystyka  statyczna  mięśnia  izolowanego 


zależność  tyka  ta  zwana  charakterystyką  statyczną  przedstawia 
rozwijanej  zależność  siły  całkowitej  F rozwijanej  przez  mięsień 
si*V  (podczas  izometrycznego  skurczu  tężcowego  i przy 
od  długość  stałym  pobudzaniu)  od  długości  /.  Jest  ona  sumą 
składowej  biernej  FB  i składowej  czynnej  Fc,  czyli 
F—Fb-tFc.  Mięsień  nie  pobudzony,  rozciągany 
powyżej  długości  spoczynkowej  /0  przeciwstawia  się 
biernie  sile  rozciągającej  z siłą  FB.  Natomiast  składo- 
wa czynna  Fc  pochodzi  od  aktywnie  kurczących  się, 
pod  wpływem  pobudzenia,  elementów  struktury 
mięśnia  i jej  wartość  zależy  od  wartości  bodźców 
pobudzających. 

Doświadczalnie  można  mierzyć  składową  bierną 
(rozciągając  mięsień  nie  pobudzony)  i siłę  całkowitą 
(mierząc  siłę  rozwijaną  przez  mięsień  pobudzony). 
Przebieg  składowej  czynnej  Fc  dla  />/„  wyznacza  się 
odejmując  od  siły  całkowitej  składową  bierną.  Dłu- 
gość spoczynkowa  /0  w pewnym  przybliżeniu  odpo- 
wiada długości  mięśnia  w pośrednim  położeniu  kąta 
zakresu  (amplitudy)  ruchu  w stawie.  Krzywe  typu 
F = F(/),  dla  których  siła  osiąga  maksimum  w okolicy 
/0,  a długość  mięśnia  może  zmieniać  się  o kilkadziesiąt 
procent  l0  w obie  strony,  są  typowe  dla  prawie  wszyst- 
kich rodzajów  mięśni:  szkieletowych,  sercowego 
i gładkich.  Wyjątkiem  są  mięśnie  owadów,  które  roz- 
ciągnięte o więcej  niż  kilka  procent  ulegają  uszkodze- 
niu. Siła  rozwijana  przez  te  mięśnie  maleje  w miarę 
ich  rozciągania,  dzięki  czemu  mogą  one  wytwarzać 
ciągłe  drgania,  jeżeli  są  połączone  z tułowiem  owada 
i jego  skrzydłami,  których  bezwładność  i sztywność  są 
odpowiednio  dostrojone  do  sztywności  i częstości 
drgań  mięśni. 

ślizgowa  Przebieg  zależności  składowej  czynnej  Fc  od  dłu- 
teoria  gości  mięśnia  można  wyjaśnić  na  podstawie  ślizgowej 
skurczu  teorii  skurczu  zaproponowanej  przez  H.  E.  Huxleya 
i współpracowników.  Na  rys.  13  przedstawiono  wyniki 
bardzo  precyzyjnych  pomiarów  przeprowadzonych 
przez  H.  E.  Huxleya  i innych  na  preparatach  pobra- 
nych z pojedynczych  włókien  mięśniowych  żaby.  Na 
rys.  13a  i c przedstawiono  schemat  mikrostruktury 
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Rys.  13.  Sarkomer:  a)  schemat  mikrostruktury  z podstawowymi 
wymiarami : a = 1,60  nm,  b = 2,05  pm,  c = 0,15-0,20  pm,  z = 
= 0,05  pm),  b)  krzywa  siły  w funkcji  długości  (schematyczne 
przedstawienie  wyników,  strzałki  nad  wykresem  wskazują  różne 
etapy  zachodzenia  na  siebie  nitek,  przedstawione  na  rys.  c; 
c)  kolejne  etapy  zachodzenia  na  siebie  grubych  i cienkich  nitek 
podczas  skracania  się 


(por.  z rys.  7d)  i podano  podstawowe  wymiary  sar- 
komeru  (odległość  między  dwiema  kolejnymi  liniami 
Z).  Na  rys.  13b  podano  zależność  siły  czynnej  Fc 
rozwijanej  przez  pojedyncze  włókno  mięśniowe  w 
funkcji  długości  sarkomeru.  Dla  pojedynczego  włókna 
mięśniowego  zależność  rozwijanej  przezeń  siły  czynnej 
Fc  = Fc(f)  jest  liniowa  odcinkami.  Nieciągłości 
w punktach  7,  2,3,4,  5i6  wynikają  z przejść  między 
kolejnymi  fazami  współpracy  nitek  aktyny  i miozyny. 
Dzięki  wypustkom,  jakie  mają  nitki  miozyny  (tzw. 
mostkom)  następuje  połączenie  miozyny  z aktyną 
z równoczesnym  wzajemnym  przesuwaniem  się  — 
ślizganiem  — obu  filamentów,  co  prowadzi  do  skra- 
cania się  włókna  mięśniowego.  Dla  mięśnia  badanego 
w całości  nie  obserwuje  się  nieciągłości,  charakterysty- 


siła  czynna  Fę 

Rys.  14.  Zależność  między  silą  rozwijaną  przez  mięsień  a pręd- 
kością skracania  Fe(v)  oraz  między  mocą  i siłą  N(Fe) 


ki  są  zaokrąglone,  ponieważ  nawet  w obrębie  jednego 
włókna  mięśniowego  sarkomery  nie  kurczą  się 
równomiernie.  Rysunek  13c  przedstawia  schemat 
procesu  ślizgania. 

charaktery-  Na  rys.  14  pokazano  przykładowy  przebieg  podsta- 
styka  wowej  charakterystyki  dynamicznej  mięśni,  czyli  za- 
dy nam iczna  leżności  między  siłą  czynną  Fc  rozwijaną  przez 
mięśni  mięsień  a prędkością  skracania  mięśnia  v przy  okreś- 
lonej długości  i przy  stałym  pobudzeniu.  Dla  innych 
wartości  / = const  i ustalonego  pobudzenia  przebieg 
charakterystyk  ma  podobny  kształt.  Krzywe  tego 
typu  otrzymuje  się  dla  wszystkich  rodzajów  mięśni, 
nie  tylko  szkieletowych,  lecz  także  sercowych  i gład- 
kich, a nawet  dla  preparatów  z nitek  aktomiozyny. 
Jedynym  wyjątkiem  są  znowu  mięśnie  skrzydeł  owa- 
dów pracujące  na  zasadzie  niewielkich  drgań,  a nie 
dużych  zmian  długości. 

Hiperboliczny  przebieg  zależności  Fc  = Fc(v ) tłu- 
maczono początkowo,  zakładając  że  siła  rozwijana 
przez  mięsień  jest  w rzeczywistości  stała  przy  wszel- 
kich prędkościach,  lecz  że  część  tej  siły  jest  zużywana 
na  pokonanie  wewnętrznych  sił  tarcia  i lepkości  w 
mięśniu,  dlatego  nie  ujawnia  się  ona  na  zewnątrz. 
Obecnie  wydaje  się  raczej,  że  na  charakter  tej  krzywej 
decydujący  wpływ  ma  prędkość  zachodzenia  reakcji 
biochemicznych  w skracającym  się  mięśniu.  Prak- 
tyczny wniosek  wypływający  z przebiegu  zależności 
Fc  = Fc(v)  jest  taki,  że  moc  mechaniczna  rozwijana 
przez  mięsień  N = Fv  osiąga  maksimum  w punkcie 
odpowiadającym  mniej  więcej  jednej  trzeciej  wartości 
maksymalnej  siły  i maksymalnej  prędkości.  Moc  ma- 
ksymalna rozwijana  przez  mięsień  wynosi  ok. 
0, 1 Fmax  vmax.  Aby  wykonać  mechaniczną  pracę  przy 
użyciu  mięśni  w sposób  najefektywniejszy,  należy 
dobrać  obciążenie  zgodne  z tą  zasadą.  Przerzutka  ro- 
werowa jest  przykładem  urządzenia  pozwalającego 
dopasować  obciążenie  i prędkość  do  właściwości 
mięśni,  bez  względu  na  pochylenie  drogi. 

Mierząc  energię  doprowadzaną  i odbieraną  można 
określić  sprawność  mechaniczną  mięśnia,  która  wy- 
nosi ok.  25%.  Należy  podkreślić,  że  nawet  w warun- 
kach izometrycznych,  gdy  mięsień  nie  skraca  się, 
można  mówić  o wykonywaniu  pracy  (rozwijaniu  mo- 
cy) przez  mięsień,  w odróżnieniu  od  urządzeń  tech- 
nicznych. 


Badanie  mięśni  częściowo  izolowanych 
i mięśni  bezpośrednio  w organizmie 

Pomiary  właściwości  biomechanicznych  mięśni  częś- 
ciowo izolowanych  są  pośrednim  rodzajem  badań. 
Dostarczają  one  informacji  o mięśniach  naturalnie 
odżywianych  i przez  to  znajdujących  się  w warunkach 
bardziej  zbliżonych  do  naturalnych  niż  mięśnie  izolo- 
wane. Z drugiej  strony  konieczność  wykonywania 
pomiarów  w ograniczonym  czasie,  wpływ  narkozy 
i obrzęku  mięśni  na  skutek  częściowego  ich  obna- 
żenia, bardzo  utrudnia  pomiary  i prowadzi  zazwy- 
czaj do  rozrzutu  wyników. 

Na  rys.  15  przedstawiono  dla  przykładu  zestaw 
pomiarowy  stosowany  do  badań  zależności  w rodzaju 
F = F(J)  dla  mięśni  obłych  i pierzastych  królika  pod 
narkozą  (in  vivo ).  Badania  na  mięśniach  pozostają- 
cych w organizmie  (in  situ)  prowadzi  się  między  in- 
nymi w celu  poznania  zjawisk  bioelektrycznych  to- 
warzyszących skurczowi  mięśni.  Duża  liczba  włókien 
mięśniowych  i ich  mikroskopijne  wymiary  skłaniają 
badaczy  do  rozpatrywania  i mierzenia  sumarycznego 
efektu  elektrycznego  zespołu  włókien,  który  można 
traktować  jako  miarę  działania  całego  mięśnia.  Po- 
miar miopotencjałów  mięśni  powierzchniowych  (znaj- 
dujących się  tuż  pod  skórą)  nie  wymaga  bezpośred- 
niego dotarcia  do  mięśnia.  Wystarczy  umieszczenie 
odpowiednich  elektrod  na  skórze  w miejscu  położo- 
nym nad  mięśniem.  Uzyskany  w ten  sposób  zapis, 
elektromio-  zwany  elektromiogramem  (EMG),  jest  sumą  poten- 
gram  cjałów  pewnej  liczby  włókien  badanego  mięśnia  znaj- 


dujących się  w pobliżu  elektrod.  Napięcie  miopoten- 
cjałów zawiera  się  w przedziale  od  kilku  jiV  do  kilku 
mV.  Za  pomocą  bipolarnych  elektrod  igłowych 


Rys.  15.  Zestaw  pomiarowy  stosowany  do  badań  częściowo  izo- 
lowanych mięśni  królika.  Łapa  badanego  królika  jest  umocowana 
linkami  1 i zaciskiem  2.  Badany  mięsień  3 częściowo  wypreparo- 
wany, jednym  końcem  odcięty  od  kości  i przyłączony  do  czuj- 
nika siły  6 pobudzany  jest  bodźcami  ze  stymulatora  5 doprowa- 
dzonymi do  mięśnia  parą  elektrod  powierzchniowych.  Długość 
mięśnia  u-  talona  jest  przy  pomocy  płytki  z otworami  4.  Wartość 
siły  odczytywana  jest  na  wskaźniku  wzmacniacza  7 

0 niewielkich  wymiarach,  które  nie  powodują  odczu- 
walnych uszkodzeń  mięśnia,  można  otrzymać  EMG 
nawet  pojedynczych  włókien  mięśniowych.  Okazuje 
się,  że  zamiany  potencjałów  mięśniowych  są  w pew- 
nych zakresach  proporcjonalne  do  zmian  naprężeń 
włókien  mięśniowych,  a tym  samym  do  siły  rozwijanej 
przez  mięsień. 

Na  il.  127a  (tabl.  32)  pokazano  widok  ogólny  sta- 
nowiska pomiarowego  stosowanego  do  badań. 
Przedmiotem  badania  jest  współdziałanie  aktonów 
mięśniowych  obsługujących  staw  ramienny  w warun- 
kach statycznych.  Aktonów  tych  jest  siedemnaście 

1 w różny  sposób  współdziałają  one  podczas  ruchów 
w stawie.  Badany  człowiek  wykonuje  ruchy  z różnym 
wysiłkiem,  np.  25%,  50%  i 100%  wysiłku  maksymal- 
nego, a w tym  czasie  aparatura  wzmacniająca  i piszą- 
ca rejestruje  zarówno  rozwijaną  siłę  (uzyskuje  się  tzw.  mechano« 
mechanogramy),  jak  i przebieg  potencjałów  mięśnie-  gram 
wych  (elektromiogramy).  Przykład  jednoczesnego 

zapisu  mechanogramu  i elektromiogramu  jednego 
z aktonów  pokazano  na  il.  127b  (tabl.  32).  W celu 
określenia  udziału  każdego  z badanych  aktonów 
mięśniowych  należy  prowadzić  jednoczesny  zapis 
mechanogramów  i elektromiogramów  dla  każdego 
z nich. 


Modelowanie  mięśni  izolowanych 

Badania  biomechaniczne  mięśni  izolowanych  do- 
starczyły bogatego  materiału  doświadczalnego;  nie 
udało  się  jednak  sformułować  na  jego  podstawie  uni- 
wersalnego modelu  matematycznego  mięśnia.  Zna- 
ne obecnie  modele  są  typu  fenomenologicznego  i obo- 
wiązują tylko  w określonych  zakresach  parametrów 
i stanów  mięśnia. 

Do  najbardziej  rozpowszechnionych  należą  modele  modele 
typu  Teologicznego,  co  wynika  z faktu,  że  właściwości  reoSogiczne 
mechaniczne  tkanki  mięśniowej  są  zbliżone  do  właści- 
wości kauczuku  i innych  elastomerów.  Podobieństwo 
to  jest  wynikiem  podobieństwa  budowy  chemicznej  — 
długich  łańcuchów  cząsteczek.  W modelu  Teologicz- 
nym materiał  rzeczywisty  zastępuje  się  układem 
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sprężyn,  tłumików  i innych  elementów  nie  mających 
odpowiedników  w naturze.  Jednakże,  w przeciwień- 
stwie do  innych  tworzyw,  właściwości  żywego  mięśnia 
zmieniają  się  w zależności  od  stopnia  pobudzenia. 
Poza  tym  mięsień  może  się  samodzielnie  kurczyć  i roz- 
wijać siłę.  Fakty  te  muszą  być  uwzględnione  przy  bu- 
dowie modelu. 


Sformułowanie  uogólnionego  modelu 

Sformułowanie  uogólnionego  modelu  jest  oparte  na 
przyjmowanym  powszechnie  założeniu,  że  siła  F 
rozwijana  przez  mięsień  w funkcji  długości  mięśnia  /, 
podczas  skurczu  tężcowego  i przy  stałym  pobudzeniu 
jest  sumą  niezależnej  od  pobudzenia  składowej  bier- 
nej Fb  i zależnej  od  wartości  pobudzenia  składowej 
uogólniony  czynnej  Fc  (rys.  12).  Schemat  uogólnionego  modelu 
modeS  Teologicznego  mięśnia  opracowany  w Polsce  przed- 
reologiezny  stawiony  jest  na  rys.  16,  gdzie  i,  2, 3 oznacza  zespoły 
składowe  modelu,  E0,  Ely  EZy  £, — wartości  modułów 
Younga  elementów  sprężystych  modelu,  Es  — moduł 
Younga  charakteryzujący  element  siłowy  modelu 
(jest  on  funkcją  czasu  t napięcia  stymulacji  U i czę- 
stości /),  ijl9  r]Zt  7] 3 — współczynniki  lepkości  elemen- 
tów tłumiących  modelu,  er2,  rr3,  a — naprężenia  od- 
powiednio dla  zespołów  1,  2,  3 i całego  modelu. 

Zakłada  się,  że  parametry  E0-E3y  ESy  7]x-7}3  modelu 
mają  następujące  cechy:  są  nieliniowymi  funkcjami 
długości  mięśnia  /,  nie  są  zależne  od  czasu  (nie  uwzglę- 
dnia się  wpływu  takich  parametrów,  jak  np.  zmęcze- 
nie), nie  zależą  od  pobudzenia  mięśnia  (rozpatruje  się 
przypadek  stałego  pobudzenia). 

Taki  układ  połączeń  modeli  składowych  został 
przyjęty  z następujących  przyczyn : Mięsień  nie  pobu- 
dzony i rozciągany  biernie  w warunkach  statycznych 
zachowuje  się  (rys.  12),  jak  nieliniowa  sprężyna  o cha- 
rakterystyce Fb  (/),  stan  ten  charakteryzuje  zespół  1 
(o  parametrze  E0 ; rys.  17).  Stan  mięśnia  niepobudzo- 
nego  w warunkach  dynamicznych  opisać  można  ze- 
społem 2 , w którym  pierwszy  element  Maxwełla  o pa- 
rametrach £i,  opisuje  tzw.  składową  szybką,  a ele- 
ment o parametrach  Ei9  r}2  — składową  wolną, 
model  Zespół  3 modeluje  składową  czynną  siły  rozwijanej 
składowej  Przez  mięsień  (rys.  14).  Wyniki  badań  wielu  autorów 
czynnej  wskazują  na  fakt,  że  model  składowej  czynnej  powi- 
nien zawierać  tzw.  element  siłowy  (kurczliwy),  który 
w tej  pracy  jest  modelowany  elementem  o module 
sprężystości  Es.  Element  ten  charakteryzuje  wyłącznie 
zdolność  mięśnia  do  rozwijania  siły.  Stwierdzono 
także,  iż  mięsień  pobudzony  zmienia  swą  lepkość 
OFaz  zawiera  tzw.  szeregowy  element  sprężysty,  co 
w tym  modelu  jest  uwzględnione  przez  wprowadzenie 
elementów  o parametrach  rj3,  Ez. 


Składowe  uogólnionego  modelu  mięśnia 
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Zależnie  od  długości  mięśnia  l oraz  jego  stanu  do 
opisu  zachowania  się  mięśnia  można  wykorzystać 
określone  kombinacje  modeli  składowych  podane 
w tabeli  (e  oznacza  wydłużenie  mięśnia,  e — Al/ł, 
U oznacza  bezwymiarowe  pobudzenie,  Um ax  = 1). 

Inny  rodzaj  modelu  mięśni  izolowanych  (model 
matematyczny)  wynika  z tzw.  równania  charaktery- 
stycznego Hilla  podawanego  zwykle  w postaci 

(F  + a)(v  + b)  - (F0-ra)b, 

gdzie:  Fjest  siłą  rozwijaną  izotonicznie  przez  mię- 
sień, F0  — siłą  rozwijaną  izometrycznie  przez  mięsień 
przy  długości  /0,  v — prędkością  skracania  mięśnia, 
a,  b — współczynnikami.  Zależność  tę  A.  V.  Hill 
uzyskał  w 1938  r.  na  podstawie  analizy  wyników  po- 
miarów mechaniczno-energetycznych  (pomiary  ciepła 
wydzielanego  przez  mięsień  w różnych  fazach  skurczu) 
i początkowo  przypuszczał,  że  współczynniki  a i b 
mają  dla  danego  mięśnia  wartości  stałe.  Od  tamtego 
czasu  teoria  Hilla  została  znacznie  rozszerzona  i udos- 
konalona. Obecnie  bardzo  intensywnie  rozwijanym 
kierunkiem  są  próby  opisania  charakterystyk  mecha- 
nicznych mięśnia  F = F{J)  i F = F(v)  w powiązaniu 
z przemianami  biochemicznymi  zachodzącymi  pod- 
czas jego  pracy  i z występującymi  wówczas  zmianami 
w jego  mikrostrukturze. 

W ostatnich  latach,  w związku  z rozpowszechnia- 
niem się  metod  cybernetycznych,  są  podejmowane 
próby  modelowania  mięśni  izolowanych,  w których  — 
zgodnie  z teorią  automatycznego  sterowania  — 
mięsień  traktuje  się  jako  obiekt  wieloparametrowy, 
mający  różne  wejścia  i wyjścia.  Wprowadzając  na 
wejścia  takiego  obiektu  określone  sygnały  wymusza- 
jące pochodzenia  mechanicznego  i elektrycznego  bada 
się  odpowiedź  obiektu  i na  tej  podstawie  dobiera  się 
równania  matematyczne  opisujące  model.  Opisana 
metoda  była  zastosowana  w badaniach  przeprowa- 
dzonych w Polsce.  Przyjęto,  że  mięsień  izolowany 
jest  wieloparametrowym,  nieliniowym  obiektem  re- 
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Rys.  17.  Model  cybernetyczny  mięśnia  izolowanego 


gulacji  o dwóch  wejściach  (długość  / i napięcie  sty- 
mulacji U)  i jednym  wyjściu  (siła  F — Fc  t Fb). 
Przyjęto  także,  iż  obiekt  ten  można  podzielić  na  dwa 
człony,  odpowiadające  składowym  Fb  i Fc  siły 
rozwijanej  przez  mięsień  (rys.  17).  Na  podstawie  wy- 
ników badań  doświadczalnych  przeprowadzonych  na 
mięśniu  izolowanym  brzuchatym  łydki  ( gastrocne - 
mius)  żaby  wyznaczono  układ  równań  różniczkowych 
opisujących  ten  model  mięśnia. 

Wyniki  uzyskane  przy  modelowaniu  mięśni  opi- 
sanymi metodami  mają  dwa  główne  kierunki  zasto- 
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sowań:  ułatwiają  teoretyczne  rozpatrywanie  skompli- 
kowanych zagadnień  dynamicznych  biomechaniki 
ruchu  (np.  zagadnienia  współudziałów  mięśni)  oraz 
są  pomocne  przy  syntezie  mięśni  sztucznych  o właści- 
wościach zbliżonych  do  mięśni  naturalnych.  Oba 
wymienione  kierunki  badań  są  obecnie  intensywnie 
rozwijane  ze  względu  na  podejmowane  próby  skon- 
struowania antropomorficznych  (człowiekopodob- 
nych)  robotów  i manipulatorów. 


IV!oż!iwości  rozwoju  siły 
mięśniowej  przez  trening 


Siłę  Fm  rozwijaną  przy  stałej  długości  mięśnia  przez 
jednostkę  motoryczną  należącą  do  danego  mięśnia 
można  wyrazić  zależnością 

F = S<ry 

m r 

gdzie  S jest  przekrojem  poprzecznym  (tzw.  przekro- 
jem fizjologicznym)  włókien  mięśniowych,  a — na- 
prężeniem rozwijanym  przez  te  włókna.  Siła  rozwija- 
na w danym  momencie  przez  mięsień  zależy  zarówno 
od  liczby  synchronicznie  (równocześnie)  pobudzanych 
jednostek  motorycznych  (ich  siły  sumują  się  z od- 
powiednimi wagami)  jak  i od  częstości  ich  pobudzania 
(sumują  się  skurcze  pojedyncze  poszczególnych  jed- 
nostek). Ponieważ  działalności  mechanicznej  włókien 
mięśniowych  towarzyszy  aktywność  elektryczna,  to 
stan  pobudzenia  całego  mięśnia  jest  zakodowany 
zarówno  w amplitudzie  jak  i w częstości  elektromio- 
gramu.  W celu  łącznego  ujęcia  obu  tych  parametrów 
przyjmuje  się,  że  miarą  pobudzenia  mięśnia  jest 
amplituda  U tzw.  scałkowanego  elektromiogramu, 
otrzymanego  przez  uśrednienie  (średnia  ważona) 
elektromiogramu  wyjściowego  w kolejnych  krótkich 
przedziałach  czasu. 

Przyjmując,  że  wartość  maksymalna  scałkowanego 
elektromiogramu  £/maXjest  rejestrowana  wówczas, 
gdy  mięsień  rozwija  siłę  maksymalną,  tzn.  gdy  wszy- 
stkie jednostki  motoryczne  są  pobudzone,  to  bezwy- 
miarowy stosunek  w = Uj Ł/max  jest  proporcjonalny  do 
liczby  jednostek  motorycznych  (czyli  do  części  prze- 
kroju fizjologicznego)  mięśnia  w danej  chwili  zaanga- 
żowanych w rozwijaniu  siły. 

Siła  Fi  rozwijana  przez  i-i y mięsień  w warunkach 
statycznych  jest  więc  funkcją  jego  przekroju  fizjolo- 
gicznego Si , średniego  naprężenia  rozwijanego  przez 
włókna  <ny  długości  mięśnia  h i wielkości  ut.  Długość 
h mięśni  w organizmie  zależy  jednoznacznie  od  kąta 
obrotu  w stawie  a.  Dla  zespołu  mięśni  obsługujących 
staw  o jednym  stopniu  swobody  można  napisać  tzw. 
równanie  udziałów  w postaci: 

n 

Mz  = J]  Fi  (Su  a,  ud-nfa), 

1=1 

gdzie:  Mz  jest  momentem  wypadkowej  sił  zewnętrz- 
nych względem  osi  stawu,  n — ramieniem  siły  Fi 
względem  osi  stawu,  n — liczbą  mięśni  (rys.  8).  Je- 
żeli staw  ma  większą  liczbę  stopni  swobody  (np.  staw 
ramienny  o trzech  stopniach  swobody  — il.  127a  (tabl. 
32} należy  rozpatrzyć  równanie  udziałów  dla  każdego 
ze  stopni  swobody  oddzielnie. 

Równanie  udziałów  w kilku  odmianach  opraco- 
wano i zbadano  w Polsce.  Obszerne  badania  mięśni 
obsługujących  różne  stawy  kończyny  górnej  człowie- 
ka: łokciowy,  promieniowo-nadgarstkowy,  łokciowo- 
promieniowy  i ramienny  przeprowadzone  w latach 
1963-1979  pozwoliły  na  opracowanie  metodyki  usta- 
lania udziału  poszczególnych  mięśni  w realizacji  okre- 
ślonego aktu  ruchow-ego  w warunkach  statycznych 
i dynamicznych. 

W sporcie  i medycynie  jest  możliwe  wywieranie 
wpływu  na  wartość  siły  mięśni  przez  odpowiedni  tre- 
ning. Trening  mięśni  następuje  podczas  każdej  pracy 


fizycznej,  ale  jego  skuteczność  zależy  głównie  od 
intensywności  wykonywanej  pracy.  Praca  o dużej 
intensywności  oznacza,  że  organizm  rozwija  podczas 
tej  pracy  dużą  moc  użyteczną.  Pracę  intensywną 
wykonują  robotnicy  fizyczni,  ale  nie  jest  to  praca 
o maksymalnej  mocy,  ponieważ  taka  praca  nie  może 
być  wykonywana  przez  kilka  godzin.  Zatem  trening 
mięśni  u robotników  fizycznych  występuje  tylko 
w niewielkim  stopniu.  Intensywny  trening  uprawiają 
tylko  sportowcy,  dlatego  wpływ  treningu  na  zmianę 
siły  mięśni  zostanie  zilustrowany  przykładami  za- 
czerpniętymi ze  sportu. 

Przekrój  fizjologiczny  włókien  mięśniowych  i osią- 
gane przez  nie  naprężenie  zmieniają  swoje  wartości 
zarówno  pod  wpływem  pracy  (treningu)  jak  i bez- 
czynności. Zmiany  te  zależą  od  rodzaju  treningu. 

Trening  szybkościowy,  polegający  na  krótkotrwa- 
łych ćwiczeniach  od  kilku  do  kilkunastu  sekund,  wy- 
konywanych z maksymalną  prędkością,  powoduje 
głównie  wzrost  naprężenia  mięśni. 

Trening  siłowy  i siłowo- wytrzymałościowy  powo- 
duje głównie  wzrost  przekroju  fizjologicznego  włókien 
mięśniowych.  Trening  siłowy  polega  na  kilkusekun- 
wym  maksymalnym  pobudzeniu  mięśni,  a siłowo- 
dowytrzymałościowy  na  długotrwałej  (od  kilku  do- 
kilkunastu  minut)  pracy  przy  średnim  obciążeniu 
mięśni. 

Zagadnienie  wpływu  treningu  na  wzrost  siły  mięś- 
niowej można  prześledzić  posługując  się  równaniem 
udziałów  W tym  równaniu  parametry  a i n nie  pod- 
legają treningowi.  Natomiast  takie  parametry  jak 
przekrój  fizjologiczny  Su  naprężenie  <h  i pobudzenie 
ui  istotnie  zależą  od  wytrenowania  mięśnia.  Ponadto, 
w warunkach  dynamicznych  siła  mięśniowa  zależy 
także  od  prędkości  skracania  mięśnia  zgodnie  z cha- 
rakterystycznym równaniem  Hilla.  Zarówno  pręd- 
kość skracania  mięśnia,  jak  i wartość  siły  przy  danej 
prędkości  podlegają  również  wytrenowaniu. 

Wartość  parametrów  siłowych  mięśni  zależy  głów- 
nie od  stanu  układu  nerwowego  oraz  rodzaju  źródeł 
energetycznych,  które  decydują  zarówno  o czasie 
trwania  pracy,  jak  i rozwijanej  przez  mięśnie  mocy 
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maksymalnej.  Przy  założeniu,  że  praca  jest  wykony- 
wana z maksymalną  intensywnością,  charakterystyki 
czasowe  wykorzystania  źródeł  energetycznych  (->  Mo- 
lekularne podstawy  skurczu  mięśnia)  mają  postać 
jak  na  rys.  18,  a ich  zasób  i moc  przedstawia  tabela. 


czas 

Rys.  18.  Udział  różnych  źródeł  energii  w zależności  od  czasu 
pracy  mięśnia 


777 


Zdolność  do  wykonywania  pracy  i rozwijania  mocy  przez 
człowieka  o masie  75  kg 
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W tabeli  u góry  podano  z kolei  jak  są  wykorzystywane 
poszczególne  źródła  energii  przez  człowieka  na  przy- 
kładzie człowieka  o masie  75  kg. 

Charakterystyki  te  decydują  o doborze  intensywno- 
ści i czasu  trwania  wysiłku  w treningu  parametrów 
podlegających  wytrenowaniu.  Wzrost  naprężenia 
mięśni  <h  jest  trenowany  głównie  przez  przedstawi- 
cieli szybkościowych  i szybkościowo-siłowych  dyscy- 
plin sportu.  Wzrost  oi  powoduje  zwiększenie  siły 
i prędkości  ruchu  rozwijanych  przez  mięśnie  bez  wy- 
raźnego zwiększenia  masy  mięśniowej,  czyli  bez  istot- 
nego zwiększania  przekroju  fizjologicznego  mięśni. 
Wzrost  naprężenia  mięśni  er<  uzyskuje  się  w wyniku 
ćwiczeń  polegających  na  maksymalnym  obciążeniu 
mięśni  przez  kilka  lub  kilkanaście  sekund,  co  zwiększa 
zasób  źródeł  wysokoenergetycznych  w mięśniu  — 
głównie  fosfokreatyny  i częściowo  glikogenu  (rys.  18). 
Są  to  ćwiczenia  w rodzaju  krótkich  biegów,  skoków, 
serii  uderzeń. 

zwiększenie  Przekrój  fizjologiczny  Si  mięśni  zwiększa  się  przede 
przekroju  wszystkim  przez  wzrost  plazmy  w komórkach  mięś- 
mięśni  niowych  (tzw.  mioplazmy),  przy  nie  zmienionej  liczbie 
włókien  mięśniowych.  Zwiększa  się  ona  wówczas, 
gdy  rośnie  w niej  niezbędny  zapas  substancji  energe- 
tycznych — głównie  glikogenu.  Takie  warunki  wy- 
stępują wtedy,  gdy  praca  jest  wykonywana  prawie 
z maksymalną  intensywnością  przez  kilkanaście  do 
kilkudziesięciu  sekund  (tabela  z poprzedniej  strony: 
Zasób  i moc  źródeł  energii,  rys.  18).  Wzrost  przekroju 
fizjologicznego  jest  czynnikiem  pożądanym  u kultu- 
rystów, zapaśników,  miotaczy,  a także  ciężarowców, 
u których  duża  masa  ciała  nie  przeszkadza,  a na  od- 
wrót — pomaga  w osiąganiu  dobrych  wyników  spor- 
towych. 

zwiększenie  Umiejętność  synchronicznego  pobudzania  maksy- 
liczby  pobu-  malnej  liczby  włókien  mięśniowych  (wzrost  tZ*)  jest 
dzanych  głównie  związana  z działalnością  układu  nerwowego, 
włókien  Gwałtowne  napinanie  mięśni  jest  możliwe  tylko  przy 
wykorzystaniu  bezpośrednio  ATP  (kwas  adenozyno- 
trój fosforowy).  Jednakże  zapas  ATP  starcza  zaledwie 
na  2-3  maksymalne  napięcia  mięśni  (rys.  18)  i więk- 
sza liczba  powtórzeń  (np.  3-7)  musi  odbyć  się  na 
koszt  fosfokreatyny  wchodzącej  w reakcję  odtwarza- 
nia ATP  z ADP  (kwas  adenozynodwufosforowy) 
(CP  na  rys.  18).  Metody  treningu  tej  właściwości 
układu  mięśniowego  i nerwowego  polegają  na  dyna- 
micznym wymuszaniu  pobudzenia  dużej  liczby  włó- 
kien mięśniowych.  Dzieje  się  to  np.  podczas  zeskoków, 
gdy  mięśnie  muszą  gwałtownie  hamować  rozpędzone 
ciało.  Duża  prędkość  skracania  mięśni  zachodzi 
również  wówczas,  gdy  przemieszcza  się  niewielkie 
masy  — np.  piłkę,  oszczep,  rakietę  tenisową  lub  wy- 
konuje ćwiczenia  cykliczne  bez  dodatkowego  obciąże- 


nia, np.  bieg.  W tym  drugim  wypadku  prędkość  skra- 
cania mięśni  decyduje  o dużej  amplitudzie  częstości 
ruchów  wykonywanych  przy  dużej  amplitudzie  ru- 
chów w stawach.  Maksymalną  częstość  ruchów  cy- 
klicznych uzyskuje  się  po  ok.  4-6  s,  co  jest  głównie 
związane  z wykorzystaniem  fosfokreatyny  jako  źródła 
energii. 

Ponadto  trening  mięśni  jest  stosowany  w procesie 
rehabilitacji  inwalidów.  Zasady  tego  treningu  są 
zbliżone  do  zasad  treningu  sportowego. 


Problemy  wymagające  dalszych 
badań 


Wiele  zagadnień  dotyczących  mięśni  zostało  jeszcze 
nie  zbadanych,  dlatego  na  pewno  pozostaną  one 
nadal  w centrum  zainteresowania  fizjologów,  biome- 
chaników,  inżynierów-bioników,  biochemików  i bio- 
fizyków. Dalszych  badań  wymaga  m.in.  ustalenie 
zależności  właściwości  mięśni  od  ich  budowy  (szcze- 
gólnie mięśni  gładkich).  Nie  jest  także  całkowicie  wy- 
jaśniony związek  między  zjawiskami  chemicznymi, 
mechanicznymi  i elektrycznymi  zachodzącymi  pod- 
czas pracy  mięśnia.  Jak  dotąd  w modelowaniu  ma- 
tematycznym i przy  symulacji  własności  mięśni  w róż- 
nych odpowiednikach  technicznych  nie  udało  się 
uwzględnić  ich  właściwości  biochemicznych.  Dokład- 
niejsze zbadanie  miopotencjałów  rejestrowanych  na 
powierzchni  ciała  lub  za  pomocą  elektrod  wkłuwa- 
nych  i implantowanych  powinno  wyjaśnić  udział 
włókien  i jednostek  motorycznych  w przebiegu  glo- 
balnego elektromiogramu.  Bliższe  poznanie  mecha- 
nizmu zmian  miopotencjału  pozwoli  na  lepsze  wy- 
korzystanie elektromiogramów  do  celów  diagnos- 
tyki i do  sterowania  urządzeń  technicznych,  np.  bio- 
protez. 

Interesująca  i mało  zbadana  jest  kwestia  męczenia 
się  mięśnia  podczas  kolejnych  skurczów.  Wiadomo 
w tej  chwili,  że  przy  odpowiednim  stosunku  czasów 
skurczów  do  czasów  odpoczynku  można  znacznie 
dłużej  utrzymywać  mięsień  w stanie  zdolności  do 
pracy. 

Kolejnym  zagadnieniem,  które  wymaga  dalszych 
badań  jest  współdziałanie  mięśni  podczas  wykony- 
wania ruchów  w stawach.  W każdym  ruchu  bierze 
udział  wiele  mięśni,  które  z różnym  wkładem  sił 
uczestniczą  w pokonywaniu  zewnętrznego  obciążenia 
kończyny.  Dotąd  podano  kilka  hipotez  mechanizmu 
współdziałania  mięśni  obsługujących  np.  staw  łok- 
ciowy lub  promieniowo- nadgarstkowy  w warunkach 
statycznych.  Zbyt  mało  jest  natomiast  zbadane  współ- 
działanie mięśni  w warunkach  dynamicznych,  szcze- 
gólnie w stawach  o większej  liczbie  ruchów,  jak  np. 
ramiennym  lub  biodrowym.  Poznanie  mechanizmu 
współdziałania  mięśni  pozwoli  na  budowanie  zaa- 
wansowanych manipulatorów  antropomorficznych 
o lepszej  sprawności  energetycznej,  dokładniejszym 
pozycjonowaniu  i krótszym  czasie  działania  przy 
wykonywaniu  określonych  zadań. 

J.  R.  Bendall  Muscles , Molecules  and  Movement , An  essay  in 
the  contr  ibution  of  Muscles,  London  1970;  E.V.  Hill  First  and 
Last  Experiments  in  Muscle  Mechanics , London  1970;  A.  Mo- 
RECKi  Manipulatory  bionicznc , Warszawa  1976;  A.  Morecki  i in. 
Bionika  ruchu.  Warszawa  1971 ; A.  Morecki  i in.  Badanie  własnoś- 
ci mechanicznych  mięśni.  Wykłady  z biofizyki , Łódź  1975;  A.  Mo- 
recki i in.  Cybernetyczne  systemy  ruchu  kończyn  zwierząt  i robo- 
tów, Warszawa  1979;  D.  R.  Wilkie  Mięsień,  Warszawa  1974. 
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Biocybernetyka 

Ryszard  Gawroński 

Biocybernetyka  jako  metoda 
badań  procesów  w złożonych 
układach  biologicznych 


Dzięki  powstałym  około  dwudziestu  lat  temu  nowym 
metodom  badań  złożonych  układów  biologicznych, 
stosunkowa  szybko  zmieniły  się  poglądy  na  podsta- 
wowa zjawiska  zachodzące  w organizmach  żywych 
i obecnie  trudno  sobie  wyobrazić  nowoczesne  bada- 
nia biologiczne  bez  udziału  specjalistów  w zakresie 
teorii  sterowania  i przetwarzania  informacji  oraz  ich 
metod.  Już  z definicji,  jaką  podał  w 1948  r.  Norbert 
Wiener  w swojej  klasycznej  pracy  Cybernetics , or 
Control  and  Communication  in  the  Animal  and  the 
Machinę  ('Cybernetyka,  komunikacja  i sterowanie 
w zwierzętach  i maszynach’),  wynika,  że  cybernetyka 
w równym  stopniu  może  być  stosowana  w badaniach 
biologicznych,  jak  i w technicznych.  Biologowie 
z dość  dużą  rezerwą  przyjmowali  tak  rewolucyjne 
zmiany  w metodach  badań  przyrodniczych.  Większość 
znanych  naukowców  pracujących  w dziedzinie  bio- 
cybernetyki — to  technicy,  oprócz  nich  raczej  lekarze 
(np.  psychiatrzy  W.  Mc  Culloch  lub  W.  Ross  Ashby) 
niż  biologowie.  Obecnie  na  świecie  biocybernetyką 
zajmują  się  setki  instytutów  naukowych  lub  labora- 
toriów w'  szkołach  wyższych,  a jej  wpływ,  mniej  lub 
więcej  uświadomiony,  obserwuje  się  w większości 
prac  biologicznych.  Nie  ogranicza  się  on,  jak  nie- 
którzy sądzą,  do  wykrycia  pętli  sprzężeń  zwro- 
tnych lub  wyrysowania  tzw.  schematów  blokowych, 
tzn.  rysunków',  w których  poszczególne  elementy 
(prostokąty,  koła)  oznaczają  etapy  procesu  lub  pod- 
zespoły układu,  a linie  łączące  te  elementy  obrazują 
wzajemne  wpływy  podzespołów.  Do  tego  celu  nie 
trzeba  by  powoływać  nowej  gałęzi  nauki  ani  tworzyć 
nowych  zespołów  badawczych,  wystarczyłyby  zwy- 
czaje lub  wyniki  uzyskane  w naukach  technicznych. 
Warto  tu  podkreślić,  że  potrzeba  nowego  podejścia 
wynika  przede  wszystkim  z trudności  analizy  zło- 
żonych procesów  biologicznych  metodami  klasycz- 
nymi, które  mają  w zasadzie  charakter  opisowy  i nie 
wykorzystują  w dostatecznym  stopniu  nowych  osiąg- 
nięć innych  działów  wiedzy  (oprócz  techniki  pomia- 
rowej). 

Cybernetyczne  metody  w biologii  polegają  na: 

możliwie  precyzyjnym  opisie  jakościowym  i ilo- 
ściowym wszystkich  mierzalnych  wielkości,  które  wy- 
stępują w procesie; 

ustaleniu  bądź  założeniu  (w  postaci  odpowiednich 
hipotez)  związków  między  interesującymi  nas  wiel- 
kościami; 

wykorzystaniu  metod  matematycznych  do  opisu 
badanych  zjawisk  i formowaniu  tzw.  modelu  mate- 
matycznego procesu ; 

badaniu  procesu  nie  tylko  w stanie  ustalonym,  ale 
również  badaniu  jego  dynamiki,  tzn.  zmian  zachodzą- 
cych w czasie; 

wykorzystaniu  teorii  sterowania  i powstałej  nie- 
dawno teorii  systemów  do  analizy  procesów  w zło- 
żonych układach,  a zwłaszcza  w układach  z pętlami 
sprzężeń  zwrotnych,  w układach  adaptacyjnych  i opty- 
malnych lub  układach  hierarchicznych; 

wykorzystaniu  teorii  informacji  i metod  przetwa- 
rzania informacji  do  oceny  różnych  procesów,  w któ- 
rych dawniej  uwzględniano  głównie  aspekty  energe- 
tyczne; 

wykorzystaniu  metod  technicznego  modelowania 
do  weryfikacji  hipotez  i analizy  przebiegów  procesów 
biologicznych,  zwłaszcza  wówczas,  gdy  analiza  mate- 
matyczna jest  zbyt  trudna,  a wyniki  skomplikowane 
i nieczytelne. 


Pierwsze  trzy  cechy  stosowania  metod  cybernetycz- 
nych w biologii  wynikają  ze  związków  biocybernetyki 
z matematyką,  która  w coraz  większym  stopniu  staje 
się  podstawowym  narzędziem  badań  (jak  to  wcześniej 
nastąpiło  w fizyce  i w różnych  dziedzinach  techniki). 

Pierwszy  etap  analizy  układu  lub  procesu  biolo- 
gicznego polega  zwykle  na  zastosowaniu  tzw.  metody 
czarnej  skrzynki  (rys.  1).  Przypuśćmy,  że  o wewnętrz-  metoda 
nej  strukturze  badanego  obiektu  nie  wiemy  nic  lub  czarnej 
tak  mało,  że  symbolicznie  możemy  go  przedstawić  skrzynki 
np.  w postaci  prostokąta  o nieznanej  stukturze  wew- 
nętrznej. W tym  wypadku  wygodnie  będzie  posłużyć 
wejścia  dodatkowe  Xd  zakłócenia  Z 

Ił  1 tli 

wejścia ^ badany  obiekt 

główne  ; lub  proces 

* W ^ 


Rys.  1.  Metoda  „czarnej  skrzynki” 


się  pojęciem  układu  względnie  odosobnionego,  wpro- 
wadzonym przez  niedawno  zmarłego  prof.  Henryka 
Greniewskiego. 

W odróżnieniu  od  stosowanego  w fizyce,  a także 
w cybernetyce,  pojęcia  układu  całkowicie  odosob- 
nionego, w układzie  względnie  odosobnionym  ist- 
nieją wyróżnione  punkty  powierzchni  brzegowej, 
przez  które  możliwy  jest  wpływ  otoczenia  na  procesy 
wewnętrzne  układu.  Ponadto  wyróżnia  się  inne  pun- 
kty, przez  które  następuje  oddziaływanie  układu  na 
otoczenie.  Pierwszego  rodzaju  punkty  nazywamy  wej- 
ściami układu,  drugiego  zaś  — jego  wyjściami. 
W układach  biologicznych  ustalenie  wejść  i wyjść  na- 
potyka zwykle  duże  trudności  i wymaga  wstępnej  zna- 
omości  badanego  procesu. 

Przypuśćmy  np.,że  pragniemy  opisać  zachowanie 
się  pszczoły  w czasie  jej  pierwszego  lotu  od  ula  do 
miejsca  zbierania  pokarmu.  Pszczoła  korzysta  z in- 
formacji zewnętrznych  i z pewnych  danych  wewnętrz- 
nych (pamięci),  wynikających  z dotychczasowych  do- 
świadczeń. Jako  informacje  zewnętrzne  należy  trakto- 
wać dane  o zachowaniu  się  (parametry  ruchu)  innych 
zbieraczek  przylatujących  do  ula,  a zwłaszcza  tzw. 
taniec  pszczół  po  przylocie  w obszar  ula.  Liczba  i za- 
kres zmian  tych  parametrów  mogą  być  dość  duże 
i w naszym  przykładzie  nie  wiemy  dokładnie,  które 
parametry  są  istotne,  a które  można  pominąć;  do- 
piero seria  badań  prowadzi  do  wybrania  istotnych 
sygnałów  wejściowych.  Ponadto  pszczoła  przypusz- 
czalnie do  ustalenia  kierunku  lotu  uwzględnia  dane 
o zapachu  pokarmu  zebranego  przez  inne  zbieraczki, 

0 położeniu  Słońca,  kierunku  wiatru  itp.  Na  pszczołę 
oddziałują  również  pewne  czynniki  zakłócające,  np. 
zjawienie  się  owadów  będących  jej  naturalnymi  wro- 
gami, ruchomych  obiektów,  które  trzeba  ominąć  itp. 
Za  wyjścia  można  przyjąć  zmieniony  kierunek  lotu 

1 ewentualnie  jego  średnią  szybkość.  Jak  w idać,  można 
rozróżnić  trzy  rodzaje  wejść  (będziemy  je  oznaczać 
czcionką  półgrubą  — jak  wektory  wielowymiarowe  — 
rozumiejąc  np.  przez  X«?  zbiór  wszystkich  wejść  głów- 
nych) : 

— wejścia  główne  X«>,  mające  zasadniczy  wpływ  na 
przebieg  zjawiska  (w  eksperymencie  biologicznym  są 
to  często  wejścia  sterowane  przez  eksperymentatora); 

— wejścia  pomocnicze  X<*,  które  woźna  zmierzyć  i na- 
leży uwzględnić  przy  ustalaniu  warunków  pomiaru; 

— wejścia  zakłócające  Z,  których  na  ogół  nie  można 
zmierzyć,  ale  można  niekiedy  ustalić  pewne  jego  para- 
metry statystyczne,  np.  średnią  częstość  zjawiania  się 
danego  zjawiska. 
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Nietrudno  zauważyć,  że  podane  tu  rozumowanie 
zawsze  charakteryzowało  badania  fizyczne  oraz  bio- 
pytania  logiczne  i nie  widać  tu  jeszcze  potrzeby  odwoływania 
eksperymen-  się  do  cybernetyki.  Ale  współczesny  eksperymentator 
tatora  zaczyna  stawiać  pytania  ilościowe: 

Jakie  są  związki  między  sygnałami  wejściowymi 
Xw  i wyjściowymi  Y? 

Jaki  jest  wpływ  na  te  związki  wejść  dodatkowych 
X*? 

Jaki  jest  wpływ  stanu  obiektu  (dotychczasowy 
rozwój  i dojrzałość  osobnicza,  przeprowadzone 
doświadczenia  i in.)  na  związki  między  Xw  a Y? 

Jaki  jest  wpływ  zakłóceń  Z na  wyjścia  obiektu? 
Wymienione  wyżej  zależności  można  w ogólnej  po- 
staci przedstawić  za  pomocą  pewnej,  na  razie  niezna- 
nej funkcji  F: 

Y = F(XW,  Xrf,  Z,  s), 

gdzie  przez  wektor  s oznaczono  zespół  parametrów 
charakteryzujących  stan  obiektu. 

Celem  badań  jest  oczywiście  ustalenie  postaci  fun- 
kcji F,  a ściślej  — zespołu  funkcji,  ponieważ  F jest 
również  wektorem  o liczbie  k składowych  równej 
liczbie  wyjść  Fi,  i = 1,2,...,  k.  Powstają  natychmiast 
zasadnicze  pytania: 

1.  Czy  możliwe  jest  ustalenie  postaci  funkcji  F, 
czyli  ilościowego  opisu  obiektu  przedstawionego 
w postaci  czarnej  skrzynki,  a więc  czy  istnieje  ciąg 
pomiarów  wielkości  Xw,  Xd>  i Y,  który  umożliwi  taki 
opis  z żądaną  dokładnością? 

2.  Czy  istnieje  tylko  jedna  postać  funkcji  F,  tzn. 
czy  istnieje  tylko  jeden  sposób  opisu  obiektu? 

3.  Jak  należy  zaplanować  eksperyment,  by  ewen- 
tualne ustalenie  opisu  obiektu  (postaci  funkcji  F)  na- 
stąpiło w możliwie  najkrótszym  czasie  i możliwie 
najmniejszym  kosztem? 

identyfikacja  Sformułowane  w tych  trzech  punktach  zadanie  na- 
obiektu  żywa  się  w cybernetyce  identyfikacją  obiektu  i przy 
jego  rozwiązaniu  korzystamy  często  — ze  względu 
na  występowanie  zakłóceń  Z — z bardzo  subtelnych 
metod  matematycznych,  najczęściej  statystycznych. 

W każdym  razie  wiadomo,  że  na  drugie  pytanie 
odpowiedź  jest  negatywna  i bez  dodatkowych  ogra- 
niczeń nie  można  jednoznacznie  opisać  obiektu.  Moż- 
na np.  żądać,  aby  funkcja  F miała  postać  szeregu  po- 
tęgowego o minimalnej  liczbie  składników.  Identy- 
fikacja polega  wtedy  na  określeniu  liczby  i wartości 
współczynników  przy  kolejnych  potęgach  zmiennych 
wejściowych.  Procedura  obliczenia  tego  typu  współ- 
czynników w bardziej  złożonych  wypadkach  wymaga 
stosowania  k omputera. 

W odróżnieniu  od  wyżej  podanego  przykładu  coraz 
częściej  spotykamy  się  z taką  sytuacją,  że  posiadamy 
pewne  wstępne  jakościowe  i ilościowe  dane  o struk- 
turze wewnętrznej  badanego  obiektu  i możemy  je 
model  wykorzystać  przy  ustalaniu  jego  opisu.  Konstruując 
układu  np-  m°del  układu  oddechowego,  należy  uwzględnić 
oddecho-  tylko  wiedzę  dotyczącą  budowy  i własności  płuc 
wego  * układu  mięśni  klatki  piersiowej,  ale  i dane  o ośrodku 
nerwowym  sterującym  procesem  oddychania.  Wia- 
domo, że  w rdzeniu  przedłużonym,  tworzącym  naj- 
niższą funkcjonalnie  część  mózgowia,  znajdują  się 
ośrodki  wdechu  i wydechu,  których  praca  zależy  od 
zawartości  C02  we  krwi.  Uwzględniając  tego  typu 
dane,  można  narysować  schemat  blokowy  obrazujący 
wewnętrzną  strukturę  obiektu  oraz  niektóre  własności 
szara  jego  elementów  (zob.  rys.  10).  W takiej  Sytuacji  mó- 
skrzynka  wimy  w przenośni,  że  mamy  do  czynienia  nie  z czar- 
ną, lecz  z szarą  skrzynką,  ponieważ  posiadamy  pewne 
informacje  o jej  wnętrzu. 


Rola  sprzężenia  zwrotnego 

W pierwszym  ćtapie  rozwoju  biocybernetyki  podkre- 
ślano, że  istótną  cechą  metod  biocybernetycznych 
jest  wyodrębnienie  pętli  sprzężeń  zwrotnych.  Sprzę- 
żenie zwrotne  jest  jednym  z najważniejszych  pojęć 
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cybernetyki,  umożliwia  wyjaśnienie  szeregu  zjawisk 
występujących  w przyrodzie.  Sprzężenie  zwrotne  jest 
obecnie  wykorzystywane  powszechnie  w urządzeniach 
technicznych,  zwłaszcza  w złożonych  systemach  ste- 
rowania. Najbardziej  ogólnie  można  stwierdzić,  że  ze 
sprzężeniem  zwrotnym  mamy  do  czynienia,  gdy  jedna 
lub  kilka  wielkości  wyjściowych  z rozpatrywanego 
układu  zostaje  przekazana  z powrotem  na  wybrane 
wejścia  tego  układu.  Żartobliwie  powołujemy  się  tu 
niekiedy  na  analogię  do  węża,  który  zaczyna  zjadać 
własny  ogon  — ale  jest  to  analogia  jedynie  struktu- 
ralna, bo  oczywiście  zjawiska  fizyczne,  jakie  wystę- 
pują w przypadku  sprzężenia  zwrotnego,  są  innego 
rodzaju. 

Sprzężenie  zwrotne  dzielimy  na  ujemne  (rys.  2b) 
i dodatnie  (rys.  3).  W wypadku  ujemnego  sprzężenia 
zwrotnego  sygnał  wyjściowy  y jest  przykładany  na 
wejście  z przeciwnym  znakiem,  przeciwdziała  jakby 
zmianom  zachodzącym  w układzie.  Jeżeli  natomiast 
mamy  do  czynienia  z dodatnim  sprzężeniem  zwrot- 
nym, sygnał  wyjściowy  dodawany  jest  do  odpowied- 
nich sygnałów  wejściowych,  co  powoduje  często  pod- 
trzymanie bądź  narastanie  procesów. 

Ujemne  sprzężenie  zwrotne  wyjaśnia  dobrze  sta- 
bilizację różnych  wielkości  fizycznych  i biochemicz- 
nych występujących  w układzie  biologicznym.  Tak 
np.  wzrost  temperatury  otoczenia  hamuje  odpływ 
ciepła  wytwarzanego  stale  przez  organizm  człowieka. 
Jeden  ze  sposobów  kompensacji  tego  wpływu  po- 
lega na  poceniu  się  (a  np.  u psów  — na  szybszym  od- 
dechu), które  ułatwia  odpływ  ciepła  i stabilizuje  tem- 
peraturę ciała. 

Na  rys.  2a  przedstawiono  dowolny  obiekt,  którego 
jedna  z wielkości  wyjściowych  y powinna  być  stabi- 
lizowana bądź  zmieniana  zgodnie  z pewną  regułą. 
Na  obiekt  można  wpływać  za  pomocą  pewnego  sygna- 
łu sterującego  u.  Ponadto  na  obiekt  oddziałują  za- 
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Rys.  2.  Działanie  pętli  ujemnego  sprzężenia  zwrotnego:  a)  obiekt 
sterowany  sygnałem  u,  b)  tenże  obiekt  objęty  pętlą 


kłócenia  z zwykle  o charakterze  przypadkowym  i trud- 
nym do  bezpośredniego  pomiaru.  Schemat  na  rys.  2b 
ilustruje  rolę  ujemnego  sprzężenia  zwrotnego,  zazna- 
czono na  nim:  xw  — wartość  zadaną  wielkości  sta- 
bilizowanej (wartość  sterującą);  y — stabilizowaną 
wielkość  wyjściową,  której  wartość  powinna  być 
możliwie  zbliżona  do  wartości  xw\  z — zakłócenia; 
e = Xw-  y,  tzw.  sygnał  błędu,  charakteryzujący  od- 
chylenie wielkości  wartości  sterującej  (zadanej)  od 
wyjściowej.  Przypuśćmy,  że  zachowanie  się  obiektu 
(rys.  2a)  można  opisać  prostym  równaniem: 

y — ku  u f kz  z,  (2) 

gdzie  u — sygnał  sterujący  obiektem,  ku  — Ay/Au  — 
wzmocnienie  w torze  sygnału  sterującego,  kz  = AyjAz 
— wzmocnienie  w torze  zakłóceń,  Au  i Az  przyrosty 
wielkości  u i z wywołane  w obiekcie  dla  wyznaczenia 
współczynników  ku  i kz.  Rozpatrzmy  zachowanie  się 
takiego  obiektu  po  objęciu  go  pętlą  sprzężenia  zwrot- 
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nego.  Ponadto  przypuśćmy,  że  ustawiono  dodatkowy 
wzmacniacz  umożliwiający  dość  duże  wzmocnienie 
sygnału  błędu : 

u = k0e  — k0(xw—y).  (3) 

Oprócz  obiektu  i wzmacniacza  w skład  pętli  sprzęże- 
nia zwrotnego  wchodzi  komparator,  sprawdzający 
zgodność  sygnału  wyjściowego  z sygnałem  wejścio- 
wym i przekazujący  do  obiektu  sygnał  sterujący  //, 
oraz  element  zmieniający  znak  sygnału  wyjściowego  y. 
Oczywiście  do  przekazania  informacji  potrzebna  jest 
zawsze  jakaś  (na  ogół  niewielka)  ilość  energii,  będą- 
cej nośnikiem  informacji.  Ilość  tej  energii  określają 
pewne  prawa  badane  w teorii  informacji. 

Na  podstaw-ie  rysunku  2 można  napisać  następu- 
jącą prustą  zależność: 

y = k0  ku  (xw  —y)  •+  kz  z. 

Rozwiązując  względem  y otrzymamy: 

k0ku  Xw~{  kzZ 
y *„*„  + ! • 


(4) 

(5) 


Analizując  wzór  (5)  nietrudno  zauważyć,  że  w mia- 
rę wzrostu  iloczynu  k0ku  (czyli  w miarę  wzrostu 
wzmocnienia  w torze  sygnału  błędu  i torze  sygnału 
sterującego)  maleje  rola  członu  kzz , a więc  maleje 
wpływ  zakłóceń  na  działanie  układu.  Jeśli  k0ku  > 1, 
wzór  (5)  można  uprościć: 


y 


Xw  -f- 


kz 

TJ^Z' 


(6) 


Widać  tu  jeszcze  wyraźniej,  że  dzięki  pętli  sprzężenia 
zwrotnego  wpływ  zakłóceń  został  zmniejszony  pro- 
porcjonalnie do  kQ  ku- 
limy przykład  umożliwi  nam  wyjaśnienie  jeszcze 
jednego  pojęcia  używanego  w teorii  sterowania  (a 
wcześniej  — w podstawach  automatyki),  a mianowi- 
cie pojęcia  układu  śledzącego.  Wartość  wejściowa  xw 
nie  zawsze  musi  być  stała ; może  być  zmieniana,  gdy 
tego  wymaga  zadanie  układu.  Przypuśćmy  dla  uprosz- 
czenia, że  jednokierunkowy  ruch  kończyny  jest  ste- 
rowany jednym  mięśniem.  Zatem  wielkość  skurczu 
musi  być  tak  sterowana,  aby  przebieg  wyjściowy  „śle- 
dził’" zmiany  sygnału  sterującego,  a wynik  sterowania 
powinien  możliwie  mało  zależeć  od  zakłóceń.  Jeżeli 
sterowanie  skurczem  odbywa  się  przez  zmianę  xw(t) 
w pętli  sprzężenia  zwTOtnego,  to  zgodnie  z wzorem 
(6)  otrzymamy: 


y(t)=Xu,(»  + J?l  z(0.  (7) 

KqKu 


gdzie  y(t ) może  obecnie  oznaczać  np.  położenie  końca 
kończyny  względem  tułowia. 

Znacznie  bardziej  skomplikowane  zjawiska  wy- 
stępują wówczas,  gdy  zachowanie  się  obiektu  wymaga 
uwzględnienia  procesów  dynamicznych,  tzn.  proce- 
sów związanych  ze  zmianami  energetycznymi  w ukła- 
dzie, lub  gdy  obiekt  może  magazynować  energię,  np. 
w postaci  energii  kinetycznej  czy  potencjalnej.  (W  me- 
chanice proces  dynamiczny  oznacza  ruch  cząstek 
pod  wpływam  sił,  w teorii  sterowania  o dynamice 
mówimy  wówczas,  gdy  w układzie  zachodzą  zmiany 
wielkości  charakteryzujących  różne  rodzaje  energii). 
Obiekt  zawierający  kilka  wejść  i kilka  wyjść  oraz  ele- 
menty magazynujące  energię  może  być  opisany  za  po- 
mocą układu  równań  różniczkowych,  a badanie  zja- 
wisk występujących  przy  sterowaniu  układami  biolo- 
gicznymi wymaga  dobrej  znajomości  współczesnej 
teorii  sterowania. 


Stabilność  układu 

Jedno  z zagadnień,  które  się  rozwiązuje  metodami 
teorii  sterowań ia*  polega  na  ustaleniu,  czy  opracowa- 
ny przez  biocybernetyka  model  matematyczny  pro- 


cesu jest  modelem  stabilnym.  Stan  układu  lub  mo- 
delu nazywamy  niestabilnym,  jeżeli  — mówiąc  w’ 
uproszczeniu  — bardzo  małe  zaburzenia  powodują  stan 
powstanie  w układzie  procesów  (np.  wychyleń  lub  niestabilny 
drgań),  które  wyprowadzają  układ  poza  stany  do- 
puszczalne w normalnej  pracy  układu.  Ołówek  po- 
stawiony pionowo  na  ostrzu  nie  znajduje  się  w stanie 
stabilnym,  ponieważ  najmniejsze  nawet  zaburzenie 
powoduje  szybką  zmianę  jego  położenia  na  poziome. 

Można  wykazać,  że  występowanie  w układzie  bio- 
logicznym lub  technicznym  dodatniego  sprzężenia 
zwrotnego  prowadzi  do  niestabilności.  Ilustruje  to 
rysunek  3,  na  którym  przyjęto  w celu  uproszczenia,  że 


po  czasie  r: 


Rys.  3.  Działanie  pętli  dodatniego  sprzężenia  zwrotnego 


zamiast  obiektu  znajduje  się  prosty  element  opóźnia- 
jący każdy  przebieg  o stałą  wartość  t.  Jeżeli  w pętli 
sprzężenia  zwrotnego  wzmocnienie  jest  większe  od 
jedności,  to  drobne  zaburzenie  np.  na  wejściu  układu 
powoduje  po  czasie  r zjawienie  się  na  wyjściu  sygnału 
k0e>  a to  po  kolejnych  przejściach  przez  pętlę  wywoła 
sygnały  o wartości  kl  e,  kl  e itd. ; jeżeli  przy  tym  k > 1 , 
to  sygnał  będzie  narastał  aż  do  zjawienia  się  dodatko- 
wych ograniczeń  amplitudy  procesu.  Występujące 
w niektórych  schorzeniach  układu  nerwowego  silne 
drżenie  kończyn  czy  napady  padaczkowe  można  wyjaś- 
nić zjawianiem  się  pętli  dodatniego  sprzężenia  zwrot- 
nego. Na  ogół  jednak  organizm  uruchamia  w takich 
wypadkach  dodatkowe  pętle,  tzw.  hamujące,  które 
wygaszają  nadmierne  oscylacje  (np.  przez  zmniej-  pętla  _ 
szenie  wzmocnienia).  Mamy  tu  do  czynienia  z nowym  hamująca 
zjawiskiem,  które  należy  do  tzw.  zjawisk  adaptacyj- 
nych. Powstanie  nowej  sytuacji  lub  zmiany  warunków 
pracy  układu  mogłyby  spowodować  niekorzystne  dla 
organizmu  procesy.  Aby  temu  zapobiec,  organizm 
uruchamia  nowe  procesy,  np.  zmiany  wzmocnienia 
w poszczególnych  pętlach,  które  kompensują  zabu- 
rzenia i sprowadzają  warunki  pracy  układu  do  wa- 
runków dopuszczalnych. 

Układy  adaptacyjne  mają  co  najmniej  dwie  pętle  układy 
sprzężenia  zwrotnego.  Jedna  z nich  np.  stabilizuje  adaptacyjne 
proces  w normalnych  warunkach,  druga  — steruje 
akością  procesu  ub  włącza  się  z chwilą  przekroczenia 
typowrych  warunków  pracy.  Organizmy  żywe  zawie- 
rają tysiące  pętli  sprzężenia  zwrotnego,  a ich  rolę 
można  będzie  stopniowo  wyjaśniać  prow-adząc  ba- 
dania biocybernetyczne. 


Zastosowanie  teorii  informacji 

Chociaż  nasza  wiedza  o procesach  występujących 
w organizmach  żywych,  zwłaszcza  w układzie  nerwo- 
wym, znajduje  się  w początkowym  stadium,  rozwój 
teorii  informacji  przyniósł  rewelacyjne  zmiany  w po- 
glądach na  te  procesy  i w metodach  ich  badania. 
W 1948  r.  C.  E.  Shannon,  badając  systemy  komuni- 
kacyjne, wprowadził  miarę  ilości  informacji  dla  oceny 
zjawisk  zachodzących  między  nadawcą  a odbiorcą. 
Najprostszy  system  przekazywania  wiadomości  przed- 
stawiono na  rys.  4.  Celem  systemu  jest  przekazanie 
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sygnafi  — wiadomości  od  nadawcy  do  odbiorcy,  czyli  — inaczej 
nośnik  mówiąc  — u odbiorcy  musi  nastąpić  jakiś  proces, 
informacji  który  będzie  pewnym  (na  ogół  niejednoznacznym) 
odwzorowaniem  jakiegoś  zjawiska  zachodzącego 
u nadawcy.  Aby  to  było  możliwe,  nadawca  musi  mieć 
do  swej  dyspozycji  nadajnik  (np.  aparat  telegraficzny, 
sygnalizator  świetlny  lub  narząd  mowy),  który  wysyła 
sygnał  (akustyczny,  elektryczny,  świetlny  itp.).  Sygnał 
jest  nośnikiem  informacji.  Oznacza  to,  że  pewne  pa- 
rametry sygnału  charakteryzują  stan  nadawcy.  Pa- 
rametry te  muszą  być  przesłane  kanałem  komunika- 
cyjnym i przyjęte  w odbiorniku,  a następnie  przeka- 
zane odbiorcy  jako  dane  o pewnym  stanie  nadawcy. 


Rys.  4.  Najprostszy  system  informacyjny 


Przy  konstruowaniu  technicznych  urządzeń  komu- 
nikacyjnych, jak  i przy  badaniu  wzajemnego  przeka- 
zywania informacji  przez  środowisko  i organizm  żywy 
(a  także  wewnątrz  organizmu)  dążymy  do  wyodręb- 
nienia źródła  sygnałów  i ich  znaczenia  dla  badanego 
układu,  charakteru  i własności  procesu  fizycznego 
będącego  nośnikiem  informacji  (np.  rozchodzenia  się 
fal  akustycznych  czy  elektromagnetycznych,  przepły- 
wu prądów  elektrycznych  lub  procesów  elektroche- 
micznych), ewentualnego  wpływu  zakłóceń  oraz  spo- 
sobu reagowania  odbiorcy  na  ten  proces. 

Najprostsza  sytuacja  występuje  wówczas,  gdy  u 
nadawcy  możliwe  są  dwa  stany,  np.  głodny  lub  nasy- 
cony. Pisklę  ptaka  w gnieździe  sygnalizuje  milczeniem 
stan  nasycenia,  a krzykiem  lub  piskiem  stan  głodu, 
ilość  Pierwszy  stan  oznaczamy  np.  0,  drugi  1.  Ilość  infor- 
informacji  macji  zawartej  w wiadomości  o wyborze  jednego 
z dwu  możliwych  i jednakowo  prawdopodobnych 
*>■*  stanów  została  nazwana  1 bitem. 

Jeżeli  u nadawcy  możliwe  są  4 stany,  to  wbrew 
pierwszemu  wrażeniu  liczba  informacji  zawartej  w 
wiadomości  o tym  stanie  jest  równa  2 bity.  Najpierw 
dzielimy  4 stany  na  dwie  pary  i ustalamy,  o którą 
z tych  dwóch  par  chodzi  (1  bit),  a następnie  ustalamy 
stan  w danej  parze  (1  bit).  Podobnie,  jeżeli  mamy 
s — 2n  stanów  u nadawcy,  to  wiadomość  o wybranym 
stanie  (spośród  s jednakowo  prawdopodobnych)  za- 
wiera 

log2  s — log2  2n  = n 


bitów  informacji.  Wzór  ten  jest  słuszny,  gdy  chodzi 

0 stany  jednakowo  prawdopodobne.  Najprostszym 

1 naturalnym  uogólnieniem  uwzględniającym  możli- 
wość różnych  prawdopodobieństw  występowania  po- 
szczególnych stanów  nadawcy  jest  następujący  wzór 
wyprowadzony  przez  Shannona: 

K 

1=  —]£  /»(')!og*p(i)  bitów,  (8) 

<=l 

gdzie  />(/)  — prawdopodobieństwo  zjawienia  się  stanu 
oznaczonego  numerem  i u nadawcy. 

Nie  wnikając  głębiej  w problemy  teorii  informacji, 
trzeba  podkreślić,  że  do  istotnych  zagadnień  należy 
kodowanie  wybór  sposobu  kodowania  informacji,  tzn.  wybór 
informacji  tych  parametrów  w sygnale,  których  zmiana  przenosi 
informację.  Od  sposobu  kodowania  może  zależeć, 
czy  mimo  zakłóceń  informacja  zostanie  przekazana 
prawidłowo  odbiorcy.  Drugie  ważne  zagadnienie 
polega  na  odpowiedniej  selekcji  tych  informacji,  tak 
aby  najważniejsze  dotarły  do  odbiorcy,  a nieistotne 
zostały  pominięte.  Wiąże  się  to  z tzw.  zagadnieniem 
selekcja  selekcji  danych  o otoczeniu,  której  dokonuje  stale 
informacji  każdy  organizm  żywy  za  pomocą  układu  nerwowego. 

Przede  wszystkim  selekcjonowane  zostają  sygnały 
o niebezpieczeństwie,  potem  o pokarmie,  w pewnych 
sytuacjach  o partnerze  seksualnym,  a następnie  np. 
o możliwości  komfortowego  spędzenia  czasu  itp. 
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Modelowanie 

Wobec  ogromnej  złożoności  zjawisk  w organizmach 
żywych  opisy  matematyczne  nawet  bardzo  uprosz- 
czonych układów  lub  funkcji  organizmu  żywego  są 
również  wyjątkowo  skomplikowane.  Opisy  te  mają 
często  postać  układów  równań  różniczkowych  lub 
różniczkowo-różnicowych  (tzn.  niektóre  składniki 
tych  równań  odpowiadają  różnym  czasom),  a ich 
rozwiązanie  analityczne  jest  z reguły  niemożliwe. 
Niekiedy  korzysta  się  w takiej  sytuacji  z maszyn  cy- 
frowych (komputerów),  znacznie  przyspieszających 
obliczenia,  ale  otrzymane  wyniki  dotyczą  tylko  kon- 
kretnych wypadków  o ustalonych  parametrach,  przy 
tym  często  nie  wystarczają  do  poznania  całego  bo- 
gactwa zjawisk,  jakie  mogą  wystąpić  w badanym 
obiekcie.  Dlatego  właśnie  w biocybernetyce  dużego 
znaczenia  nabierają  metody  modelowania  fizycznego 
zjawisk  biologicznych  (->  modelowanie  procesów 
biologicznych). 

Modelowanie  różnorodnych  zjawisk  fizycznych, 
technicznych,  a ostatnio  nawet  ekonomiczno-spo- 
łecznych, jest  często  jedyną  możliwością  choćby  czę- 
ściowego poznania  procesów  w złożonym  układzie 
(systemie).  W tym  celu  wykorzystuje  się  (bądź  spe- 
cjalnie konstruuje)  urządzenia  techniczne  opisywane 
w przybliżeniu  tymi  samymi  równaniami  co  badany 
układ.  Urządzenia  te  umożliwiają  łatwą  zmianę  syg- 
nałów wejściowych,  struktury  i wielkości  parametrów 
poszczególnych  elementów  modelu  oraz  pomiar  do- 
wolnych procesów  zarówno  na  wyjściu,  jak  i wew- 
nątrz modelu. 

Należy  wyraźnie  podkreślić,  że  model  w postaci 
urządzenia  mechanicznego,  elektrycznego,  a ostatnio 
najczęściej  elektronicznego,  jest  z reguły  bardzo 
uproszczonym  odwzorowaniem  rzeczywistych  pro- 
cesów biologicznych  i dlatego  ogromnego  znaczenia 
nabiera  wybór  tych  własności  i parametrów  badanego 
zjawiska  biologicznego,  które  mają  być  odwzorowane 
w modelu.  W rozdziale  dotyczącym  układu  nerwo- 
wego podane  zostaną  przykłady  modelowania  fizycz- 
nego z wykorzystaniem  zarówno  typowych  maszyn 
matematycznych,  jak  i wyspecjalizowanych  urządzeń 
technicznych. 


Biocybernetyka  a układy  regulacji 


W układach  biologicznych  zwykle  wydziela  się  kilka 
powiązanych  hierarchicznie  poziomów  regulacji:  po- 
ziom regulacji  procesów  wewnątrzkomórkowych, 
regulacja  ustrojowa  przemian  metabolicznych  w tkan- 
kach i podstawowych  procesów  wegetatywnych,  re- 
gulacja zachowania  się  organizmu  przez  wyższe  po- 
ziomy układu  nerwowego. 

Dotychczas  udział  biocybernetyki  w analizie  pro- 
cesów pierwszego  i drugiego  poziomu  regulacji  był 
stosunkowo  niewielki,  jednakże  próby  tworzenia  mo- 
deli matematycznych  i programów  komputerowych 
do  badania  poszczególnych  układów  regulacji  są  co- 
raz częstsze.  Na  przykład  przy  modelowaniu  procesu 
syntezy  białka  z uwzględnieniem  roli  kwasów  nuklei- 
nowych i enzymów  w reprodukcji  określonych  białek 
korzysta  się  ze  schematów  blokowych,  chociaż  jest 
to  dopiero  wstęp  do  badań  cybernetycznych.  Więcej 
jest  prac  polegających  na  modelowaniu  takich  pro- 
cesów w organizmie  jak  sterowanie  oddechem,  regu- 
lacja obiegu  krwi,  stabilizacja  poziomu  temperatury, 
ilości  wody  i innych  płynów  w organizmie,  regulacja 
hormonalna  różnych  przemian  metabolicznych  i wiele 
innych. 

Wszystkie  te  przykładowo  wymienione  procesy  są 
ze  sobą  w różnym  stopniu  powiązane  i układy  regu- 
lacji muszą  w odpowiednim  stopniu  uwzględniać  te 
powiązania.  Odpowiedzialna  za  pracę  i koordynację 
układów  regulacji  w organizmach  żywych  jest  część 
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układu  nerwowego  zwana  układem  wegetatywnym. 
Analizując  liczne  dane  o układzie  wegetatywnym  pod 
kątem  widzenia  ogólnej  struktury  i charakteru  pro- 
cesów, można  stwierdzić  następujące  jego  własności: 

1.  Hierarchiczno-równoległa  organizacja  współza- 
leżności poszczególnych  ośrodków  i obwodów  (rys.  5). 
Warto  podkreślić,  że  wzajemne  powiązania  różnych 
obwodów  i wpływy  nadrzędne  między  nimi  mogą  być 
różne,  a nawet  mogą  się  zmieniać  w zależności  od 
warunków  otoczenia.  Tak  np.  człowiek  nie  ma  (i  nie 
ma  potrzeby)  bezpośredniego  dowolnego  wpływu 
ani  na  bicie  serca  lub  skurcz  naczyń  krwionośnych, 
ani  na  pracę  wielu  ośrodków  hormonalnych.  Wpływ 
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Rys.  5.  Struktura  hierarchiczno-równoległa.  Strzałkami  czarnymi 
oznaczono  połączenia  między  sąsiednimi  szczeblami  hierarchii, 
niebieskimi  — połączenia  bezpośrednie  łączące  szczeble  bardziej 
odległe,  umożliwiające  szybkie  przekazywanie  bodźców  do  tych 
szczebli 


ten  pojawia  się  w sposób  pośredni,  np.  przez  stany 
emocjonalne,  lub  występuje  u niektórych  specjalnie 
wytrcnowanych  osób.  Z drugiej  strony  wiele  proce- 
sów jest  ściślej  ze  sobą  powiązanych  w porównaniu 
z innymi.  Dotyczy  to  np.  regulacji  bicia  serca,  ciśnie- 
nia krwi,  skurczu  naczyń  krwionośnych  i w ogóle 
procesów  w układzie  krążenia.  Układ  sterowania  bi- 
ciem serca  jest  związany  z regulacją  ukrwienia  róż- 
nych narządów,  np.  układu  trawiennego  lub  mięśni. 
Ustalenie  ogólnej  struktury  powiązań  stanowi  pierw- 
szy etap  badań  modelowych. 

2.  Występowanie  licznych  obejmujących  się  wzaje- 
mnie pętli  sprzężenia  zwrotnego.  Badanie  dynamiki 
takich  pętli,  zwłaszcza  przy  uwzględnieniu  własności 
nieliniowych  i inercyjnych  (a  w tym  i opóźnienia), 
ogranicza  się  na  razie  do  konkretnych  wypadków,  ale 
można  wysunąć  ogólne  przypuszczenie,  że  dodatkowe 
pętle  zmniejszają  wpływ  wahań  parametrów  i za- 
kłóceń o różnych  szybkościach  zmian.  Przykład  ta- 
kiego układu  z kilkoma  pętlami  podany  jest  na  rys.  10 
i zostanie  opisany  nieco  dalej. 

Układ  nazywamy  nieliniowym,  jeżeli  nie  można  do 
niego  zastosować  zasady  superpozycji  (reakcja  na 
sumę  dwóch  bodźców  nie  jest  równa  sumie  reakcji 
na  bodźce  składowe);  układ  nazywamy  inercyjnym, 
jeżeli  zawiera  elementy  gromadzące  energię  pod  jąką- 
kolwiek  postacią  (kinetyczną,  potencjalną,  chemicz- 
ną itp.). 

3.  Występowanie  dwóch  rodzajów  wejść  do  po- 
szczególnych pętli  regulacji.  Oprócz  opisanych  w po- 
przednim rozdziale  wejść  typu  sumacyjnego  w ukła- 
dach biologicznych  występują  bardzo  często  wejścia 
mnożące  (rys.  6).  Zmieniają  one  wzmocnienie  w po- 
szczególnych elementach  pętli  sprzężenia  zwrotnego, 
co  w zasadniczy  sposób  zmienia  własności,  a zwłasz- 
cza dynamikę  procesu  regulacji.  Przy  omawianiu 
układu  sterowania  mięśniami  (rys.  23)  zostanie  po- 
dany przykład  wpływu  zmiany  wzmocnienia  na  szyb- 
kość skurczu  mięśni.  W pierwszej  bowiem  fazie  skur- 
czu zwiększa  się  czułość  układu  na  przychodzące  syg- 


nały sterujące,  wskutek  czego  proces  rozpoczyna  się 
prędzej  niżby  to  nastąpiło  przy  stałym  wzmocnieiu. 

4.  Występowanie  kilku  sygnałów  wejściowych  (rys.  kilka  sygraa- 
7).  Element  wyjściowy,  zwany  często  efektorem  (mię-  fów  wejścio- 
sień  lub  gruczoł),  otrzymuje  sygnały  sterujące,  do-  wych 


Rys.  7.  Hipotetyczny  schemat  typowej  pętli  sterowania  w orga- 
nizmie żywym  z kilkoma  wejściami  (sumującymi  i mnożącymi) 


cierające  do  niego  różnymi  drogami.  Wyższe  szczeble 
hierarchicznego  układu  regulacji  otrzymują  infor- 
mację nie  tylko  o wartości  regulowanej  wielkości, 
ale  i o wartościach  sygnałów  w poszczególnych  punk- 
tach układów  sterowania,  w tym  również  o wartości 
sygnałów  błędu,  stanu  czujników  itp. 

5.  Hierarchia  czasowa  zjawisk.  W układzie  nerwo- 
wym, a zatem  i w układach  sterowania,  występują 
procesy  o różnych  stałych  czasowych.  Na  ogół  można 
wydzielić  dwa  typy  pętli:  pętle  szybkie  i pętle  wolno 
działające.  Pętle  szybkie  są  związane  z receptorami 
o małej  stałej  czasowej  i umożliwiają  szybką  reakcję 
na  określony  bodziec,  natomiast  pętle  powolne,  naj- 
częściej o charakterze  adaptacyjnym,  umożliwiają 
dopasowanie  procesu  do  nowych  warunków  otocze- 
nia. 

6.  Występowanie  ośrodków  antagonistycznych. 
Sygnały  w ośrodkach  biologicznych  mają  z reguły 
stały  znak  i dlatego  w typowych  układach  regulacji 
procesów  biologicznych  występują  dwie  pętle  (rys.  8). 
Jedna  z nich  służy  do  kompensacji  niedomiaru  lub 
zbyt  małej  wartości  jakiejś  wielkości,  druga  zaś 
umożliwia  zmniejszenie  nadmiaru  lub  zbyt  dużej  war- 
tości regulowanej  wielkości.  Zresztą  w całym  układzie 
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Rys.  8.  Hipotetyczny  układ  regulacji  z pętlami  antagonistycznymi 

regulacji  wegetatywnej  wydziela  się  dwa  podukłady: 
tzw.  współczulny  (sympatyczny)  i przywspółczulny 
(parasympatyczny).  Na  ogół  ośrodki  układu  współ- 
czulnego  działają  pobudzająco  na  różne  funkcje  or- 
ganizmu, ośrodki  układu  przywspółczulnego  działają 
na  nie  hamująco.  Wprawdzie  od  tej  zasady  są  wyjątki, 
ale  zawsze  są  to  działania  antagonistyczne. 


783 


Należy  podkreślić,  że  przytaczane  tu  schematy  są 
bardzo  uproszczone,  a modele,  z których  korzystamy 
przy  analizie  zjawisk,  zawierają  wiele  wejść  i wyjść 
i pętli  sprzężeń  zwrotnych,  co  zostało  jedynie  zasyg- 
nalizowane dodatkowymi  strzałkami  na  rys.  7,  8 itd. 

Podsumowując  powyższe  uwagi  na  temat  struktur 
układów  sterowania  organizmów  żywych,  można 
przedstawić  ogólny  schemat  układu  sterowania  ma- 
jącego zapewnić  organizmowi  takie  warunki,  w któ- 
rych by  wszystkie  procesy  życiowe  przebiegały  w op- 
tymalny sposób.  Na  rys.  9 przedstawiono  wycinek 
najniższych  szczebli  hierarchii  takiego  układu;  na- 
zwiemy go  układem  homeostazy.  Poszczególne  obiekty 
regulacji  Ou  0ly  ...  Ok  itd.  są  oczywiście  powiązane 
układ  zależnościami  fizyczno-chemicznymi.  Zgodnie  z po- 
homeostazy  przednio  podanymi  zasadami  czujniki  nadmiaru 
(oznaczone  indeksem  a)  i niedomiaru  (oznaczone 
indeksem  b ) Cwaiy  c*ai,  cWbiy  cSbi , cWa2y  cSa2  itd.  są  źród- 
łami sygnałów  korekcyjnych  dla  odpowiednich  ośrod- 
ków regulacji.  Zarówno  wzmocnienia  czujników,  jak 
i pobudliwości  ośrodków  mogą  być  zmieniane  przez 
ośrodki  nadrzędne.  Ponadto  przewidziano  w układzie 
występowanie  pętli  regulacji  o małej  i dużej  stałej 
czasowej,  czyli  pętle  działające  szybko  (oznaczone 
indeksem  s ) i pętle  działające  wolno  (oznaczone  in- 
deksem w).  Ośrodki  nadrzędne  Nly  N2y ... y Njć  również 
tworzą  pary  antagonistyczne  i sterują  zarówno  pobu- 
dzeniem poszczególnych  obwodów,  jak  i ich  wzmoc- 
nieniem. 
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Rys.  9.  Schemat  przedstawiający  typową  strukturę  układów  ste- 
rowania homeostazą 

układ  Jako  przykład  rozpatrzmy  schemat  układu  stero- 
sterowania  wania  oddechem.  Chociaż  badaniom  tego  układu 
oddechem  poświęcono  wiele  prac  zarówno  fizjologicznych,  jak 
i cybernetycznych,  istnienie  i rola  wielu  połączeń 
i własności  tego  układu  nie  są  jeszcze  wyjaśnione. 
Ogólna  jego  struktura  została  przedstawiona  na  rys.  10. 
Intensywność  oddychania  zależy  od  składu  gazowego 
wzór  krwi,  co  można  przedstawić  wzorem  Graya: 

Qraya  IV  = Ko  + KiPcoi+KzpH-KzPoz,  (9) 
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Rys.  10.  Schemat  blokowy  układu  sterowania  oddechem  (wg 
A.  Nechaya) 


w którym  vr — intensywność  oddychania,  K0y  Kly  K2y 
K3  — współczynniki,  Pco2  — cząsteczkowe  ciśnienie 
dwutlenku  węgla  we  krwi,  Po2  — cząsteczkowe  ciś- 
nienie tlenu,  pH  — stężenie  jonów  wodorowych. 

Odpowiednie  chemoreceptory,  znajdujące  się  za- 
równo w centralnym  układzie  nerwowym,  jak  i. na 
jego  części  peryferyjnej,  umożliwiają  pomiar  stężeń 
C02  i Oz.  Maksimum  czułości  czujnika  C02  przypada 
nieco  powyżej  cząstkowego  ciśnienia  normalnego  dla 
C02  (tj.  Pc o2  = 40  mm  Hg),  natomiast  maksimum 
czułości  na  zmiany  ciśnienia  tlenu  występuje  przy 
ciśnieniu  cząstkowym  znacznie  niższym  niż  norma- 
lne dla  tlenu,  a więc  gdy  Po2  = 55  mm  Hg.  W ukła- 
dzie sterowania  występują  zatem  dwie  nadrzędne 
pętle  sterujące  intensywnością  oddechu,  z których 
jedna  reaguje  na  wzrost  C02,  a druga  na  spadek  02 
we  krwi. 

Najniższy  szczebel  sterowania  jest  układem  typo- 
wo samowzbudnym  i o regulowanym  wzmocnieniu. 
W płucach  znajdują  się  dwa  typy  mechanorecepto- 
rów:  wdechu  i wydechu.  Pobudzenie  ich  pobudza 
odpowiednio  ośrodki  wydechu  i wydechu  w rdzeniu 
przedłużonym  i łącznie  z mięśniami  wdechu  i wydechu 
tworzy  zasadniczą  część  układu  wydechowego.  Na- 
tomiast ośrodki  znajdujące  się  nieco  wyżej,  tzw. 
pneumotaksyczny  i apneustyczny,  wpływają  zarówno 
na  częstotliwość,  jak  i na  amplitudę  procesów  przez 
dwie  pętle  ujemnego  sprzężenia  zwrotnego.  Pierw-szą 
pętlę  stanowi  połączenie  ośrodka  pneumotaksycznego 
z ośrodkiem  wdechu.  Ośrodek  pneumotaksyczny  ha- 
muje ośrodek  wdechu  z siłą  zależną  od  pobudzenia, 
jakie  od  niego  otrzymuje.  Druga  pętla  jest  dłuższa 
i obejmuje  ośrodek  wdechu,  mięśnie  wdechowe, 
mechanoreceptory  i ośrodek  apneustyczny.  Ośrodek 
apneustyczny  pobudza  ośrodek  wdechu,  a receptory 
sygnalizujące  wrdech  hamują  ośrodek  apneustyczny. 
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badanie  W badaniach  układu  oddechowego  przeprowadzo- 
układu  od-  nych  na  zwierzętach  stwierdzono  oscylacyjne  procesy 
dechowego  w ośrodkach  wdechu  i wydechu  nawet  po  ich  izolo- 
waniu od  mechanoreceptorów  i od  ośrodków  nad- 
rzędnych. Przypuszcza  się,  że  w ośrodkach  wdechu 
i wydechu  istnieją  sieci  komórek  złożone  z wielu 
zamkniętych  pętli.  Komórki  w tych  pętlach  pobudza- 
ją się  kolejno,  a potencjały  ich  pobudzenia  rozprze- 
strzeniają się  dość  wolno  w pewnym  obszarze,  tak  jak 
się  to  dzieje  w mięśniu  sercowym.  Potencjał  progowy 
tych  komórek  narasta  w'  funkcji  czasu,  a pobudzenie 
dochodzi  do  nasycenia.  Wskutek  ujemnego  sprzęże- 
nia zwrotnego  między  ośrodkami  pobudzenie  jed- 
nego ośrodka  hamuje  pracę  drugiego  i odwrotnie, 
co  prowadzi  do  rytmicznej  pracy  układu. 

Występowanie  w organizmach  żywych  wielu 
sprzężeń  zwTotnych  nasuwa  pewne  zasadnicze  pyta- 
nie. W jaki  sposób  zapewniona  jest  stabilność  tak 
złożonego  układu,  w którym  istnieje  bardzo  duże 
prawdopodobieństwo  zjawienia  się  dodatniego  sprzę- 
żenia zwrotnego  pod  wpływem  zmieniających  się 
warunków  zewnętrznych  i wewnętrznych?  W.  R. 
Ashby  wykazał  doświadczalnie  możliwość  istnienia 
takiej  elastycznej  struktury  sterowania,  która  za- 
pewnia stabilność  złożonego  układu  niezależnie  od 
homeostat  zakłóceń.  Skonstruował  on  urządzenie  nazwane 
homeostatem.  W sposób  najbardziej  ogólny  można 
go  nazwać  układem  znajdującym  stan  równowagi  we 
wszelkich  stwarzanych  mu  warunkach.  Ogólna 
struktura  homeostatu  przedstawiona  została  na  rys. 
lla.  Homeostat  składa  się  z dwóch  zasadniczych 
części.  Część  pierwsza  (I)  zawiera  cztery  układy 
połączone  ze  sobą  w sposób  pokazany  na  rys.  1 1 b. 
Jak  widać,  połączenia  te  tworzą  sieć  licznych  pętli 
sprzężeń  zwrotnych.  Między  innymi  uwzględniono  tu 
również  sprzężenia  zwrotne  działające  na  własny 
element.  Druga  część  (II)  homeostatu  składa  się 
z szeregu  przełączników  krokowych  (działających 
wtedy,  gdy  któryś  z parametrów  osiągnie  graniczną 
wartość  dopuszczalną)  powodujących  zmianę  pa- 
rametrów części  pierwszej. 

Istota  pracy  układu  polega  na  tym,  że  zmienne 
opisujące  przebiegi  w części  I mogą  przybierać  war- 
tości tylko  w pewnym  dopuszczalnym  przedziale. 
Osiągnięcie  granic  przedziału  przez  którąkolwiek  ze 
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Rys.  11.  Homeostat:  a)  struktura  ogólna,  b)  pętle  sprzężenia 
zwrotnego  między  układami  homeostatu 

zmiennych  (np.  prądu  w elemencie  części  I)  powoduje 
wysłanie  odpowiedniego  sygnału  do  części  II  i zadzia- 
łanie przełączników  krokowych,  zmieniających  para- 
metry części  I.  Jeśli  część  I osiągnie  stan  równowagi 
wewnątrz  obszaru  dopuszczalnych  wartości,  to  prze- 
łączniki części  II. będą  nieruchome  — i całość  znajdzie 
się  w stanie  równowagi.  Bardziej  prawdopodobna  jest 
jednak  taka  sytuacja,  że  któraś  ze  zmiennych  w części 
I osiągnie  wartość  graniczną  — wtedy  zadziała  część 
II,  zmieniająca  parametry  części  I,  i rozpocznie  się 
nowy  cykl  pracy  zmian  przebiegów  w części  I,  który 
zakończy  się  bądź  osiągnięciem  stanu  równowagi, 
bądź  osiągnięciem  przez  którąś  ze  zmiennych  war- 
tości granicznej,  co  poprowadzi  do  następnego  cyklu 
pracy.  Cykle  będą  się  powtarzać  dopóty,  dopóki 
układ  nie  znajdzie  się  w stanie  równowagi. 


Przypuśćmy  na  chwilę,  że  w układzie  zmieniają  się 
tylko  dwie  zmienne,  czyli  prądy  i\  i /2.  Na  rys.  12 
podano  kilka  przykładów  tzw.  płaszczyzn  fazowych 
(w  technice  i matematyce  stosuje  się  termin  obrazy 
fazowe),  tzn.  zestawu  krzywych  obrazujących  wza-  płaszczyzny 
jemne  powiązania  wielkości  i i2.  Strzałki  oznaczają  fazowe 
kierunek  zmian  zachodzących  w miarę  upływu  czasu. 

Chwilową  wartość  prądu  charakteryzuje  pewien 
punkt  x poruszający  się  po  krzywych.  Ponadto  na 
rysunkach  podano  linie  ograniczające  brzegi  dopusz- 


Rys.  12.  Przykłady  płaszczyzn  fazowych 

czalnych  zmian  wartości  zmiennych.  Gdy  punkt  x , 
poruszając  się  w miarę  upływu  czasu,  osiągnie  brzeg 
obszaru,  nastąpi  opisane  wyżej  zadziałanie  układu 
krokowego  i zmiana  płaszczyzny  fazow-ej  na  inną. 

Uwidacznia  to  rys.  13.  Wprowadzono  tu  trzecią 
zmienną  s,  ilustrującą  stan  przełączników.  Zmienna 
ta  może  przybierać  dyskretne  wartości,  tzn.  że  zmie- 
nia się  skokowo  od  wartości  sx  do  s2,  dalej  do  s3  itd.  Na 
rys.  13  podano  przykładowy  ruch  punktu  x obrazują- 
cy zmiany  prądów  ix  i i2  w miarę  upływu  czasu  i po- 
szukiwania stabilnej  płaszczyzny  fazowej,  czyli 
takiej,  przy  której  punkt  równowagi  (węzeł  trwały) 
znajduje  się  wewnątrz  obszaru.  Jak  widać  z rysunku, 
płaszczyzną  tą  okazała  się  płaszczyzna  przy  wartości  punkt 
s3.  W praktyce  jednak  poszukiwanie  punktu  stabilne-  równowagi 
go  może  trwać  bardzo  długo.  Interesujące  własności 


I 


Rys.  13.  Ruch  punktu  po  płaszczyznach  fazowych  przy  uwzględ- 
nieniu zmian  parametru  s 
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opisanego  tu  urządzenia  ujawniają  się,  gdy  ekspery- 
mentator wprowadza  do  układu  nowe  zmiany,  np. 
zmienia  kierunki  lub  wartości  prądów  w elementach 
części  I.  Okazuje  się,  że  nawet  bardzo  duże  i złośliwe 
zmiany  parametrów  homeostatu  (tzn.  takie,  które 
powodują  powstanie  pętli  dodatniego  sprzężenia 
zwrotnego)  nie  mogą  uniemożliwić  znalezienia  sta- 
nu stabilnego,  wydłużają  tylko  czas  jego  poszuki- 
wania. 

Warto  zwrócić  uwagę  na  to,  że  homeostat  posiada 
dwa  typy  sprzężeń  zwrotnych.  Jedne  z nich  (przed- 
stawione na  rys.  11)  są  pętlami  lokalnymi  realizują- 
cymi oddziaływania  między  poszczególnymi  zmien- 
nymi, a sprzężenia  zwrotne  drugiego  typu  działają  nad- 
rzędnie i włączając  się  okresowo  zmieniają  związki 
między  elementami  powiązanymi  przez  pętle  lokalne. 
Pętla  nadrzędna  działa  dopóty,  dopóki  układ  nie 
osiągnie  zamierzonego  celu,  jakim  jest  w tym  wypad- 
ku osiągnięcie  stanu  równowagi  stabilnej. 

Takie  właśnie  hierarchiczne  struktury  występują 
w organizmach  żywych,  a homeostat  jest  jednym 
z przykładów  ich  ogromnych  możliwości.  Przykłady 
innych  złożonych  struktur  będą  podane  w następnym 
rozdziale. 


Neurocybernetyka 


Najbardziej  rozwinięty  dział  biocybernetyki,  neurocy- 
bernetyka, zajmuje  się  modelowaniem  i analizą 
procesów  w układzie  nerwowym.  Jej  rozwój  wiąże 
się  oczywiście  z rozwojem  badań  neurofizjologicz- 
nych, a zwłaszcza  z rozwojem  teorii  działania  pod- 


drzewko  dendrytowe 


stawowego  elementu  systemu  nerwowego,  jakim  jest 
komórka  nerwowa,  czyli  neuron.  Z rys.  14,  na  którym 
przedstawiono  różne  typy  neuronów,  widać,  że  nawet 
anatomicznie  jest  to  zwykle  bardzo  skomplikowany 
element. 

W latach  trzydziestych  panowała  opinia,  że  do- 
kładniejszy, a zwłaszcza  matematyczny  opis  zarówno 
neuronu,  jak  i układów  złożonych  z większej  liczby 
tego  typu  elementów  jest  praktycznie  niemożliwy. 
Punktem  zwrotnym  prac  w tym  zakresie  był  opubli- 
kowany w 1943  r.  artykuł  W.S.  Mc  Cullocha  i W.  Pit- 
tsa,  w którym  na  podstawie  ówczesnych  danych 
o własnościach  neuronu  stworzono  teoretyczne  pod- 
stawy analizy  sieci  złożonych  z bardzo  uproszczo- 
nych modeli  neuronów.  Dzięki  odpowiedniemu 
sformułowaniu  własności  elementów  i charakteru 
sygnałów  wejściowych  można  było  wykorzystać 
aparat  logiki  matematycznej  do  analizy  ogólnych 
własności  tego  typu  sieci. 
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Wprowadzony  przez  Mc  Cullocha  model  elementu, 
nazywany  zwykle  neuronem  formalnym,  może  się 
znajdować  w jednym  z stanów,  dwu  a mianowicie 
w stanie  pobudzenia  (aktywności)  — oznacza  się  go 
zwykle  umownie  1 — lub  w stanie  niepobudzenia 
(pasywności),  który  oznaczamy  umownie  0.  Zmiana 
stanu  jest  możliwa  jedynie  w ustalonych  momentach 
czasu  t9  /+1,  t+2y  ...»  tĄ-ky  które  można  określić  za 
pomocą  liczb  całkowitych.  Każdy  neuron  formalny 
posiada  wejścia  pobudzające  i hamujące  (rys.  15). 
Zostaje  on  pobudzony  wówczas,  gdy  liczba  wejść, 
do  których  przyłożono  sygnały  pobudzające,  jest 
większa  od  zadanej  wartości,  zwanej  wartością  pro- 
gową, i gdy  jednocześnie  nie  działa  żadne  wejście 
hamujące.  Tak  np.  w układzie  podanym  na  rys.  15, 
jeżeli  próg  ma  wartość  2,  muszą  zostać  pobudzone 
dowolne  trzy  wejścia  pobudzające  spośród  czterech 
narysowanych  xu  xZt  x3t  jc4,  a jednocześnie  na  wej- 
ściach hamujących  xh  i x6  pobudzenia  muszą  być 
równe  zeru. 

Późniejsze  badania  neurofizjologiczne  wykazały, 
że  warunkiem  pobudzenia  jest,  aby  różnica  między 
liczbą  wejść  pobudzających  a liczbą  wejść  hamują- 
cych była  równa  wartości  progowej  lub  większa  od 
niej.  Rozszerza  to  możliwości  sieci.  Ponadto  uważa 
się,  że  każdy  element  wprowadza  jednostkowe  opóź- 
nienie (np.  1 milisekundę),  równe  czasowi  trwania 
jednego  taktu  pracy  sieci. 

Z tak  zdefiniowanych  elementów  można  zestawić 
proste  sieci  realizujące  podstawowe  działania  lo- 
giczne. Łącząc  np.  elementy  w sposób  podany  na 
rys.  16,  na  wyjściu  neuronu  formalnego  o progu  1 
otrzymamy  pobudzenie  wtedy,  i tylko  wtedy,  kiedy 
zostanie  pobudzony  co  najmniej  jeden  neuron  wej- 
ściowy. Zapisując  to  w sposób  formalny,  otrzymamy  : 


wejście 


Rys.  15.  Schemat 
połączeń  neuronu 


W+i)  = ^(0  V wz{t)\j ...  V Wn{t)y 

gdzie  N(t- f 1)  — stan  pobudzenia  neuronu  wejściowe- 
go w chwili  r+1 ; W(t)i  — stan  pobudzenia  neuronu  i 
w chwili  t;  a zatem  sieć  realizuje  sumę  logiczną  zda- 
rzeń, którymi  są  sygnały  wejściowe. 

Jeżeli  w tej  samej  sieci  dokonamy  pewnej  zmiany, 
a mianowicie  próg  będzie  równy  liczbie  neuronów 
wejściowych  ny  to  wyjście  będzie  pobudzane  jedynie 
wówczas,  gdy  pobudzone  zostaną  wszystkie  wejścia. 
Oznacza  to,  że  sieć  realizuje  iloczyn  logiczny 


N(t+1)  = fVx(t)  A Wz(t)  A ...  A Wn{t). 


w,  wh  wK+,  wn 


Rys.  16.  Sieć  neuronowa  realizująca  sumę 
logiczną  (cyfra  1 oznacza  wartość  pro- 
gową) 


Rys.  17.  Sieć  realizująca  uczenie  się  odru- 
chu warunkowego 


BW  BB 


Liczne  prace  dotyczące  tego  typu  sieci  wykazały, 
że  mają  one  ogromne  możliwości  i mogą  realizować 
bardzo  szeroką  klasę  procesów,  o których  dawniej 
modeł  myślano,  że  są  możliwe  jedynie  w organizmach  ży- 
uczenia  wych.  W szczególności  sieci  te  mogą  modelować  od- 
sję  odruchu  ruchy  warunkowe,  to  znaczy  mogą  się  uczyć  reagowa- 
warun-  nia  na  bodziec  warunkowy,  który  przez  pewien  czas 
kowego  towarzyszył  bodźcowi  bezwarunkowemu.  Na  rys.  17 
przedstawiono  sieć,  która  w uproszczony  sposób  rea- 
lizuje powstanie  odruchu  warunkowego.  W układzie 
są  dwa  wejścia:  wejście  bezwarunkowe  BB  i w-ejście 
warunkowa  BW.  Bodziec  bezwarunkowy  pobudza 
neuron  I,  a ten  sygnałem  podwójnej  intensywności 
(dwa  wejścia)  pobudza  z kolei  neuron  wyjściowy  VI. 
Pobudzenie  jedynie  wejścia  warunkowego  BW  nie 
wystarcza  do  pobudzenia  komórki  VI,  która  ma  próg 
2.  Łączne  pobudzenie  obu  wejść  uruchamia  komórkę 
iloczynową  III,  ta  zaś  z kolei  komórkę  V.  Wskutek 
zastosowania  sprzężenia  zwrotnego  impuls  zjawiający 
się  na  wyjściu  neuronu  V jest  z powrotem  przykładany 
na  jego  w-ejście.  Otrzymujemy  układ  samowzbudny, 
w którym  stale  krążą  impulsy  0eśli  nie  zostaną  przer- 
wane przez  przyłożenie  sygnału  hamującego  z neuro- 
nu IV).  Po  takim  łącznym  zjawieniu  się  sygnałów  na 
obu  wejściach  stan  modelu  jest  więc  inny  i przy  na- 
stępnym pobudzeniu  wystarczy  już  przyłożenie  bodź- 
ca jedynie  do  wejścia  BW,  aby  (łącznie  ze  stale  do- 
cierającymi sygnałami  z komórki  V)  pobudzić  ko- 
mórkę wyjściową  VI. 

Jak  w'idać,  komórka  V została  tu  wykorzystana  jako 
element  pamięciowy.  Ponadto  przewidziano  tu 
wygaszanie  odruchu  za  pomocą  komórki  IV.  Jak 
wspomniano,  samo  przyłożenie  bodźca  warunkowego 
pobudza  komórkę  IV  i wygasza  komórkę  V. 

Układy  tego  typu  mogą  być  bardzo  rozbudowane, 
tak  aby  tworzenie  się  odruchu  nastąpiło  dopiero  po 
wielokrotnym  przyłożeniu  pary  bodźców:  warunko- 
wego i bezwarunkowego. 

Nowe  informacje  o własnościach  komórek  nerwo- 
wych wykazały,  że  są  to  elementy  znacznie  bardziej 
skomplikowane.  Wiele  prac  neurocybernetycznych 
w latach  sześćdziesiątych  poświęcono  modelowaniu 


własności  zarówno  pojedynczych  neuronów,  jak  i pro-  modele 
stych  sieci  złożonych  z takich  modeli.  Na  rys.  18  neuronu 
przedstawiono  przykładowy  schemat  elektronicznego 
modelu  neuronu,  a na  rys.  19  — zdjęcie  tego  typu 
modeli  wykonanych  w Zakładzie  Bioniki  byłego 
Instytutu  Cybernetyki  Stosowanej  PAN.  Nadal  nie 
ma  jednak  jednolitych  poglądów  na  temat  tych 
własności  neuronu,  które  są  najbardziej  istotne 
z punktu  widzenia  przekazywania  i przetwarzania 
informacji  w systemie  nerwowym. 

Rys.  20  przedstawia  schemat  funkcjonalny  mo- 
delu, neuronu,  w którym  wykorzystano  obecne  po- 
glądy na  przebiegi  zjawiska  w neuronie.  Układ  ma 
szereg  wejść,  z których  jedne  przenoszą  pobudzenia, 
inne  — hamowania.  Sygnały  wejściowe  mnożymy 
przez  pewien  współczynnik  Wi,  zwany  wagą  wejścia, 
następnie  sygnały  z wszystkich  wejść  sumujemy  i otrzy- 
mujemy wypadkowy  sygnał  pobudzający: 

k 

ei  = 5}  Xi  Wi(Ui), 

»=i 

przy  czym  k — liczba  wejść,  Wi(m)  — waga  /-tego 
wejścia,  m — sygnał  sterujący  wielkością  wagi. 

W omawianym  modelu  wprowadzono  drugi  rodzaj 
w>ejść  w postaci  sygnałów  u , zmieniających  wartość 
wagi  w-ejścia.  Przypuszcza  się,  że  z istnieniem  tego 
rodzaju  sygnałów  związane  są  tzw.  plastyczne  włas- 
ności neuronu,  czyli  możliwość  uczenia  się.  Jeżeli 
występują  sygały  u , można  modelować  wytwarzanie 
odruchów  warunkowych  oraz  inne  zjawiska  związane 
z procesami  uczenia  się  w organizmach  żywych. 

Neuron  odznacza  się  pewną  bezwładnością,  co  ozna- 
cza, że  jego  zachowanie  się  zależy  od  częstości  impul- 
sów przykładanych  do  wejść.  Dlatego  też  model 
neuronu  zawiera  element  inercyjny  o charakterze 
układu  całkującego  RC , uśredniającego  w pewmym 
zakresie  przebieg  ei.  Następnym  blokiem  jest  tzw. 
generator  progowy  impulsów.  W bloku  tym  wytwa- 
rza się  krótki  impuls  o stałej  amplitudzie  za  każdym 
razem,  gdy  wypadkowe  pobudzenie  ei  przekracza 


wartość  progową.  Im  większa  jest  różnica  pomiędzy 
wartością  progową  a ei , tym  większa  jest  częstotli- 
wość generowanych  impulsów.  Ponadto  w modelu 
neuronu  uwzględnia  się  stałe  opóźnienie,  występujące 
z reguły  w komórce  nerwowej.  Sygnał  wyjściowy  z mo- 
delu może  być  podany  na  wejścia  większej  liczby  in- 
nych neuronów  sieci  modelujących  pewne  fragmenty 
tkanki  nerwowej. 


procesów  elektrycznych  w tkance)  tylko  w nielicz- 
nych wypadkach  można  ustalić  ogólne  zasady  łą- 
czenia neuronów  w sieci.  Takim  przykładem  mogą 
być  sieci  warstwowe  z połączeniami  lokalnymi 
(rys.  21).  Sieci  podobnego  typu  odgrywają  prawdo- 
podobnie istotną  rolę  w procesie  przetwarzania 
informacji  wzrokowej  docierającej  do  siatkówki  oka. 
Wykazano  m.in.,  że  sieci  te  mogą  służyć  do  wykry- 


Rys.  19.  Modele  neuronu  (a)  i utworzona  z nich  sieć  (b) 


Rys.  20.  Schemat  funkcjonalny  modelu  neuronu 

Podstawowe  zagadnienie,  które  się  pojawia  na  tym 
etapie  badania  procesów  w układzie  nerwowym, 
polega  na  ustaleniu  sposobu  połączeń  między  neuro- 
nami, czyli  struktury  sieci.  Na  podstawie  niektórych 
danych  anatomicznych  oraz  przesłanek  wynikają- 
cych z badań  elektrofizjologicznych  (czyli  badań 
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sieci 

neuronów 


wania  pewnych  cech  lokalnych  obrazu,  takich  jak 
zakończenia,  załamania  i zagięcia  linii,  jak  również 
skrzyżowania  i rozgałęzienia. 

W wyniku  badań  nad  procesami  rozpoznawania  modele 
obrazów  zachodzącymi  w tzw.  analizatorze  wzroko-  percepcji 
wym,  czyli  w części  układu  nerwowego  zajmującego  wzrokowej 
się  analizą  sygnałów  docierających  do  siatkówki  oka. 


Rys.  21.  Sieć  warstwowa  z połączeniami  lokalnymi 


zbudowano  szereg  modeli  percepcji  wzrokowej.  Ba- 
daniom tym  zawdzięczamy  udoskonalenie  urządzeń 
do  automatycznego  rozpoznawania  obrazów,  a zwła- 
szcza do  skonstruowania  automatycznych  czytników 
tekstów  drukowanych  lub  maszynopisowych  (czyt- 
niki takie  są  już  stosowane  w polskich  drukarniach 
przy  automatycznym  składaniu  tekstów). 

Oprócz  prac  nad  modelowaniem  procesów  per- 
cepcji wzrokowej  i słuchowej  modelowano  również 
sterowanie  mięśniami.  Z teoretycznego  i praktycz- 
nego punktu  widzenia  jest  rzeczą  bardzo  interesującą, 
w jaki  sposób  układ  nerwowy  steruje  zespołem  kilku- 
dziesięciu czy  kilkuset  mięśni,  uwzględniając  przy 
tym  liczne  własności  mechaniczne  układu  ruchowego 
człowieka  i zwierzęcia  oraz  sytuację  otoczenia.  Okaza- 
ło się,  że  część  układu  nerwowego  sterującego  ruchem 
ma  również  bardzo  złożoną  budowę  hierarchiczną 
(rys.  22).  Pomimo  licznych  badań  nie  mamy  o niej  wy- 
starczających informacji,  by  zbudować  jej  zadowala- 
jący model.  Można  jednak  w przybliżeniu  zmodelować 
najniższy  stopień  w hierarchii  układu  ruchowego, 
zawierający  elementy  sterujące  skurczem  mięśni. 


Przykład  takiego  układu  sterowania  mięśniami 
przedstawiono  na  rys.  23.  Ma  on  jedynie  zilustrować 
ogólny  charakter  tego  typu  schematów.  Znajdujące 
się  w rdzeniu  kręgowym  komórki  motoryczne  (zwane 
niekiedy  komórkami  alfa)  powodują  skurcz  włókien 
mięśniowych  przez  wysłanie  odpowiedniego  pobu- 
dzenia włóknami  nerwowymi.  Skurcz  mięśnia  prze- 
nosi się  oczywiście  na  obiekt,  którym  może  być  np. 
podnoszony  przedmiot,  a ciężar  tego  przedmiotu 
układ  wpływa  na  wielkość  skurczu  mięśnia  i rozwijaną  przez 
sterowania  niego  siłę.  W mięśniu  oraz  w ścięgnach  istnieją  spe- 
mięśniami  cjalne  elementy  pomiarowe,  tzw.  wrzeciona  i organy 
Golgiego,  służące  do  pomiaru  skurczu  mięśnia. 
Zmianę  długości  mięśnia  lx  sygnalizuje  wrzeciono 
komórkom  motorycznym  znajdującym  się  w rdzeniu 
kręgowym.  Dzięki  organom  Golgiego  komórki  te 
otrzymują  też  informację  o sile  rozwijanej  przez 
mięsień.  Również  receptory  czucia  powierzchniowego 
mogą  przekazywać  bodźce  do  komórek  motorycz- 
nych  alfa.  Z powyższego  widać,  że  komórka  motorycz- 
na  jest  pewnego  rodzaju  centrum  skupiającym  infor- 


macje o efekcie,  jaki  wywołała  ona  sama,  powodując 
skurcz  mięśnia. 

Obwodowo-rdzeniowy  układ  sterowania  mięśniami 
zawiera  zatem  kilka  pętli  (rys.  23),  a własności  ele- 
mentów są  do  tego  stopnia  skomplikowane,  że  układ 
wymaga  specjalnych  badań  modelowych.  W odróż- 


Rys.  23.  Funkcjonalny  schemat  układu  sterowania  mięśniem: 

Im  długość  mięśnia,  Fobc  siła  obciążenia,  Fm  siła  rozwijana  przez 
mięsień.  Iw  sygnał  ustalający  długość  wrzeciona,  Wlt  fVs  i 
wejścia  sygnałów  z innych  ośrodków  nerwowych 

nieniu  od  klasycznych  układów  technicznych  odzna- 
cza się  on  szerokim  zakresem  adaptacji  do  zmiennych 
warunków  obciążenia,  stosunkowo  dużą  precyzją 
i szybkością  działania,  budzi  więc  zainteresowanie 
nie  tylko  biologów,  ale  i techników.  Przedstawiając 
w bardzo  uproszczony  sposób  niektóre  wyniki 
badań  modelowych,  można  powiedzieć,  że  proces 
sterowania  skurczem  mięśnia  dzięki  jednoczesnemu 
wykorzystaniu  kilku  rodzajów  sygnałów  wejściowych 
i kilku  obwodów  sterowania  umożliwia  znacznie 
szybszą  i precyzyjniejszą  regulację  położenia  kończyny 
niżby  to  było  możliwe  w wypadku  klasycznego  układu 
ze  sprzężeniem  zwrotnym.  Ponadto  analiza  tego 
układu  umożliwia  wyjaśnienie  pewnych  sytuacji  pato- 
logicznych, jak  np.  sztywność  mięśniową  oraz  spa- 
styczność. 

Modelowanie  wyższych  szczebli  układu  ruchowego 
napotyka  znacznie  większe  trudności,  chociaż  np. 
ostatnie  wyniki  badań  dotyczące  roli  móżdżku  w pro- 
cesie korekcji  sterowania  ruchem  są  bardzo  interesu- 
ące  z biocybemetycznego  punktu  widzenia. 

Postęp  badań  w neurocybernetyce  jest  ściśle  zwią- 
zany z rozwojem  badań  w dziedzinie  neurofizjologii, 
a zwłaszcza  elektrofizjologii,  i z wykorzystaniem 
nowoczesnych  metod  techniki,  zwłaszcza  elektroniki. 

Na  podstawie  współczesnych  poglądów  neurofizjo-  układ 
logicznych  można  przedstawić,  bardzo  zresztą  nerwowy- 
ogólnikowo,  schematy  funkcjonalnych  powiązań  powiązania 
(które  nie  budzą  większych  wątpliwości)  pomiędzy  między 
głównymi  ośrodkami  układu  nerwowego.  Przykład  ośrodkami 
takiego  schematu  przedstawiono  na  rys.  24. 

Schemat  ten  składa  się  z 3 części : 

1.  Układ  dośrodkowy,  w którym  następuje  prze- 
kazywanie i analiza  sygnałów  docierających  z oto- 
czenia. Sposób  analizy  jest  regulowany  przez  nad- 
rzędne ośrodki  koordynująco-decyzyjne. 

2.  Centralny  układ  asocjacyjno-decyzyjny,  w któ- 
rym na  podstawie  stanu  otoczenia,  stanu  organizmu, 
dotychczasowego  doświadczenia  i prognozy  skutków 
zostaje  wypracowana  decyzja  o reakcji  organizmu. 

3.  Układ  odśrodkowy,  w którym  na  podstawie  pod- 
jętej decyzji  wypracowany  jest  plan  ruchu  (ogólnej 
reakcji  organizmu),  uwzględniający  sytuację  staty- 
czną i dynamiczną  oraz  doświadczenie  organizmu 
w zakresie  optymalizacji  ruchu. 

Ponadto  wydzielić  można  układ  koordynacji  i re- 
gulacji różnych  ośrodków,  umieszczony  w środkowej 
części  rysunku. 

Szczególnie  obiecujące  są  prace  związane  z modę- 
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Rys.  24.  Funkcjonalny  schemat  powiązań  między  głównymi 
ośrodkami  układu  nerwowego 


Iowaniem  procesów  uczenia  się  i badania  sieci  neuro- 
nowych o zmiennej  strukturze.  Umożliwią  one 
wyjaśnienie  niektórych  podstawowych  procesów 
psychicznych  związanych  z podejmowaniem  decyzji 
i zachowaniem  się  zwierząt  oraz  staną  się  źródłem 
koncepcji  przy  konstruowaniu  złożonych  urządzeń 
technicznych  do  selekcji  informacji  i sterowania 
złożonymi  systemami. 

Jako  przykład  przedstawiono  na  rys.  25  uproszczo- 
ny funkcjonalny  schemat  układu  uczącego  się  rozpo- 
znawania obrazów.  Zgodnie  z obecnymi  poglądami 
rozpoznawanie  obrazu,  np.  litery,  cyfry,  figury  geo- 
metrycznej, fotografii  osoby  czy  znajomych  przed- 
miotów, odbywa  się  w kilku  etapach.  Poszczególne 
wkład  etapy  zostały  przedstawione  na  rysunku.  Ostatecz- 
uczący  się  nym  rezultatem  rozpoznania  jest  ustalenie  nazwy 
rozpoznający  oglądanego  przedmiotu;  kod  nazwy  jest  przekazany 
obrazy  w organizmach  żywych  dalszym  częściom  układu 
nerwowego,  a w urządzeniach  technicznych  — urzą- 
dzeniom informatyki  wykorzystującym  rozpoznanie. 

Ostatnie  dwa  (a  być  może  trzy)  etapy  rozpoznania 
zawierają  sterowane  elementy,  np.  w postaci  wyżej 
opisanych  modeli  neuronów  o sterowanej  wadze. 
Zadaniem  układu  uczącego  się  jest  wywołanie  takich 
zmian  w układzie  selekcji  cech  obrazu  oraz  w klasy- 
fikatorze, aby  urządzenie  rozpoznające  popełniało 
jak  najmniej  błędów.  Tak  np.  jedna  z reguł  uczenia 
się  polega  na  tym,  że  przy  błędnym  rozpoznaniu 
zmniejszają  się  wagi  cech,  które  uczestniczyły  w roz- 
poznaniu, natomiast  przy  prawidłowym  rozpoznaniu 
rosną  wagi  cech  (wzmocnienia  w odpowiednich 
kanałach),  które  się  przyczyniły  do  prawidłowego 
rozpoznania,  pozostałe  ewentualnie  maleją.  Niekiedy 
można  teoretycznie  wykazać  (niekiedy  zaś  praktycznie 
sprawdzić),  że  proces  uczenia  się  doprowadza  do 


rozpoznawania  przez  tego  typu  układ  uczący  się 
różnego  typu  obrazów,  np.  liter,  cyfr  lub  prostych 
obrazów  konturowych.  Ostatnio  pojawiły  się  rów- 
nież urządzenia  do  rozpoznawania  bardziej  złożo- 
nych obrazów,  np.  fotografii  osób,  lub  dźwięków 
mowy. 


nazwa  obrazu 


Rys.  25.  Funkcjonalny  schemat  układu  uczącego  się  rozpozna- 
wania obrazów 

Inne  równie  przydatne  w przyszłości  zastosowanie  sterowanie 
sieci  uczących  się  polegać  będzie  najprawdopodobniej  robotami 
na  sterowaniu  ruchem  różnego  rodzaju  robotów 
uczących  się  zastępowania  człowieka  w warunkach 
niebezpiecznych  lub  nużących  i nieopłacalnych  dla 
człowieka. 

M.  A.  Arbib  Mózg , maszyna , matematyka.  Warszawa  1968; 

W.  R.  Ashby  Wstęp  do  cybernetyki , Warszawa  1961 ; A.  J.  Berg 
Informacja  i cybernetyka.  Warszawa  1970;  A.  A.  Bratko  i in.  Mo- 
delowanie czynności  psychicznych.  Warszawa  1973;  E.  A.  Feigen- 
baum,  J.  Feldman  Maszyny  matematyczne  i myślenie , Warszawa 
1972;  R.  Gawroński  Rozpoznanie  i decyzja , Warszawa  1970; 

Bionika  — system  nerwowy  jako  układ  sterowania , red.  R.  Gaw- 
roński, Warszawa  1970;  W.  Głuszkow  Wstęp  do  cybernetyki , 

Warszawa  1967;  W.  Karczewski  Zjawiska  elektryczne  w orga- 
nizmie, Warszawa  1963;  P.  de  Latil  Sztuczne  myślenie  — wstęp 
do  cybernetyki , Warszawa  1958;  W.  Sluckin  Mózg  i maszyny , 

Warszawa  1957;  J.  Z.  Young  Model  mózgu , Warszawa  1968. 


Fizyka  medyczna 

Oskar  Chomicki 

Fizykę  medyczną  można  określić  jako  dział  fizyki  Z historycznego  punktu  widzenia  związek  pomię-  związek 
stosowanej,  który  traktuje  o zastosowaniu  zasad  dzy  fizyką  a medycyną  można  podzielić  na  dwa  między 
i metod  fizycznych  we  wszystkich  dziedzinach  za-  okresy:  przed  odkryciem  promieniowania  jonizują-  a medycyną 
pobiegania,  rozpoznawania  i leczenia  chorób  ludz-  cego  (promieni  X i radu)  i po  jego  odkryciu.  Pierwszy  fizyką 
kich,  jak  również  w badaniach  naukowych  mających  okres  rozpoczął  się  w czasach  Odrodzenia  — do  końca 
na  celu  zdrowie  człowieka.  XIX  w.  (związek  między  fizyką  a medycyną  opierał 

Jest  to  definicja  niejednoznaczna,  co  wynika  stąd,  się  głównie  na  osiągnięciach  w fizyce  dokonywanych 
że  fizyka  medyczna  należy  do  nauk  z pogranicza  przez  lekarzy  i na  zdobyczach  medycyny  będących 
fizyki,  biologii,  medycyny  i techniki.  dziełem  fizyków ; tabela).  Już  Galileusz,  który  prawdo- 
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powstanie 
fizyki  me- 
dycznej 


praca  fizyka 
medycznego 


Niektórzy  słynni  lekarze  zajmujący  się  badaniami  fizycz- 
nymi oraz  słynni  fizycy  interesujący  się  medycyną 


Wiek 

Nazwisko 

Zawód 

wyuczony 

Osiągnięcia 
w dziedzinie 

XVI 

Glibert  (Anglia) 

lekarz 

magnetyzm 

William  Harvcy 
(Anglia) 

lekarz 

dynamika  krwiobie- 
gu,  zastosowanie 

metod  naukowych 
w medycynie 

XVII 

Giovanni  Alfon- 

przyrodnik 

praca  mięśni,  me- 

so Borclli  (Wło- 

chanika  ruchu  ssa- 

chy) 

ków 

Robert  Hooke 

lekarz 

sprężystość  ciał,  mi- 

(Anglia) 

kroskopia 

XVIH 

Luigi  Galvani 

anatom 

elektryczność  w me- 

(Włochy) 

dycynie 

Alessandro  Vołta 

fizyk  i fi- 

elektryczność 

(Włochy) 

zjolog 

ciepło 

Joseph  Black 
(Szkocja) 

lekarz 

teoria  falowa  świa- 

Thomas Young 

lekarz 

(Anglia) 

tła,  optyka  fizjolo- 
giczna, widzenie 

barwne 

XIX 

Hermann  Ludwig 

fizyk,  ana- 

oftalmoskop, teoria 

Helmholtz 

tom  i fizjo- 

widzenia barwnego , 

(Niemcy) 

log 

akustyka  i teoria 
słyszenia 

D*Arsonval 

fizyk 

terapia  elektrycz- 

(Francja) 

nością,  diagnostyka 

podobnie  początkowo  studiował  medycynę,  do  badań 
nad  wahadłem  używał  podobno  własnego  pulsu. 
Dopiero  jednak  jego  rodak  Santorio  stał  się  poniekąd 
pierwszym  fizykiem  medycznym;  on  to  zastosował 
termometr  do  mierzenia  temperatury  ciała  ludzkiego. 

Drugi  okres  rozwoju  fizyki  medycznej,  zapoczątko- 
wany w 1895  r.  odkryciem  promieni  X przez  Roentge- 
na oraz  radu  przez  małżonków  Curie,  trwa  do  dziś. 
Sami  fizycy  nie  mogą  już  przeszczepiać  swoich 
odkryć  do  medycyny;  oba  te  działy  stały  się  zbyt 
rozległe  i wyspecjalizowane.  Powstała  więc  nowa 
specjalizacja,  fizyka  medyczna,  która  się  włączyła  do 
ścisłej  współpracy  z medycyną,  szczególnie  radiolo- 
giczną (tabela). 

W różnych  krajach  stan  fizyki  medycznej  jest 
różny.  Zależy  on  od  wielu  czynników  (organizacja 
służby  zdrowia,  poziom  ekonomiczny  itp.).  Liczba  fi- 
zyków medycznych  na  milion  ludności  w 1975  r.:  od 
0,02  (Nigeria)  do  17  (Wielka  Brytania).  Znaczne  róż- 
nice występują  w tym  zakresie  nawet  w krajach  uprze- 
mysłowionych (np.  Francja  ma  wskaźnik  0,9,  Szwecja 
— 5,0,  Polska  zaś  — 3,0). 

Większość  fizyków  medycznych  pracuje  w dziedzi- 
nie zastosowań  promieniowania  jonizującego,  część  — 


Zakres  działalności  fizyka  medycznego 


Dziedzina 


Współpraca  z leka- 
rzami w zakresie 
pracy  klinicznej 


Współpraca  z leka- 
rzami w zakresie 
prac  badawczych 


Ochrona  przed 
promieniowaniem 

Nauczanie  fizyki 


Działalność  fizyka 


pomiary  ciśnienia  i szybkości  krążenia 
krwi  oraz  płynów  tkankowych 
bioelektryczna  czynność  ciała 
elektroniczne  metody  diagnostyczne 
urządzenia  techniki  medycznej  (serce-płu- 
co,  sztuczna  nerka  itp.  — przy  współpracy 
z inżynierami) 
aparatura  optyczna 

ocena  i planowanie  dawek  w radiodiagno- 
styce i radioterapii 
! metody  medycyny  nuklearnej 
metody  diagnostyki  ultradźwiękowej 

I radiobiologia  i biofizyka 
nowe  metody  pomiaru  promieniowania 
nowe  urządzenia  do  napromieniowania 
zastosowanie  maszyn  liczących 
zastosowanie  teorii  informacji  do  diagno- 
styki 

analiza  aktywacyjna 

modelowanie  matematyczne 

kontrola  narażania  na  promieniowanie 

w szpitalach  i laboratoriach 

pomiary  radioaktywności  całego  ciała 

studenci  medycyny 
radiologowie  i radiotcrapeuci 
przyrodnicy 
studenci  radiobiologii 


w dziedzinach,  które  nabierają  coraz  większego 
znaczenia,  jak  np.  zastosowanie  podczerwieni,  dzie- 
dzina laserów,  bioprądów  czy  mikrofal.  Oblicza  się,  że 
np.  w Wielkiej  Brytanii  działy  te  obejmują  obecnie 
ok.  25%  wszelkiego  typu  zastosowania  fizyki  do 
medycyny  (tabela). 


Typowe  zastosowania  fizyki  w medycynie 


Specjalność 


Zastosowanie  fizyki 


Anestezjologia 

Anatomopatologia 

Chirurgia 

Dermatologia 

Fizykoterapia 

Ginekologia  i 
położnictwo 
Kardiologia 


Laryngologia 
Medycyna  ogólna 

Neurologia  i 
neurochirurgia 
Ochrona  przed 
promieniowaniem 
Okulistyka 
Radiologia  i 
radioterapia 
(onkologia) 


zastosowanie  fizyki  gazów,  analiza  gazów 
optyka  mikroskopowa,  technika  radio- 
izotopowa 

urządzenia  biomechaniczne,  technika  ra- 
dioizotopowa 

leczenie  chorób  skóry  przez  naświetlanie, 
pomiary  kolorymetryczne,  technika  radio- 
izotopowa 

leczenie  krótkofalowe  i mikrofalowe,  sty- 
mulatory elektryczne,  telemetria 
technika  radioizotopowa,  ultradźwięko- 
wa, promieniolecznictwo 
elektrokardiografia,  fonokardiografia,  ba- 
listokardiografia,  pobudzenie  mięśni,  apa- 
ratura do  badania  ciśnienia  i przepływu 
krwi,  stymulatory  serca 
aparatura  audiometryczna 
technika  radioizotopowa,  zastosowanie 
ultradźwięków,  technika  podczerwieni 
zastosowanie  ultradźwięków,  elektroen- 
cefalografia 

ustalenie  przepisów  bezpieczeństwa  pracy, 
pomiar  skażeń  promieniotwórczych 
zastosowanie  laserów  i ultradźwięków 
scyntygrafia,  wzmacniacze  obrazu,  pomia- 
ry zawartości  minerałów  w kościach,  do- 
zymetria, planowanie  leczenia 


zastosowanie 
fizyki  w 
medycynie 


Najważniejsze  rodzaje  zastosowania  termografii  medycznej 


Specjalność 

Zastosowanie 

Onkologia 

wykrywanie  raka  sutka  i przerzutów  no- 
wotworowych 

Interna 

choroby  układu  krążenia 

Ortopedia 

lokalizacja  uszkodzeń  mięśni,  stawów 

i kręgów 

Ginekologia  i 
położnictwo 

lokalizacja  łożyska 

Dermatologia 

badania  stopnia  oparzenia,  odmrożeń; 
chirurgia  plastyczna 

Farmakologia 

badanie  skuteczności  leków  i niektórych 
metod  leczenia 

Główne  zadania  stojące  przed  fizykiem  medycznym  zadania  fizyka 
wiążą  się  z jednej  strony  z pracą  w zakładach  fizyki  medycznego 
akademii  medycznych,  które  są  terenem  intensywnej 
działalności  dydaktycznej  i badawczej  związanej 
z ogólnymi  zagadnieniami  medycznymi,  z drugiej  zaś 
strony  pozostają  w związku  z jego  pracą  w służbie 
zdrowia,  przede  wszystkim  w szpitalu,  tylko  bowiem 
szpital  — z uwagi  na  swoje  możliwości  materialne 
i organizacyjne  — może  stanowić  bazę  działalności 
fizyka,  wymagającego  skomplikowanej  i kosztownej 
aparatury  i odpowiedniego  zrozumienia  ze  strony 
personelu  lekarskiego.  Odpowiedzialność  lekarza 
i fizyka  dzieli  się  w ten  sposób,  że  lekarz  zleca  okre- 
ślone badanie  lub  metodę  leczenia,  do  którego  wy- 
magane jest  zastosowanie  aparatury  lub  metody 
fizycznej,  natomiast  fizyk  dba  o to,  aby  postępowanie 
było  poprawne  metodycznie  i pozwoliło  na  uzyskanie 
zamierzonego  skutku. 

Zadania  fizyka  medycznego  w służbie  zdrowia 
dzielą  się  na  rutynowe  i badawcze.  Do  zajęć  ruty-  zajęcia 
nowych  należy  troska  o niezawodność  aparatury  rutynowe 
i rzetelność  otrzymywanych  wyników,  co  zwykle 
sprowadza  się  do  nadzoru  nad  konserwacją  aparatury 
i nad  personelem  technicznym  obsługującym  urzą- 
dzenia do  standardowych  badań  (przeliczniki,  ka- 
mery, elektrokardiografy,  encefalografy  itp.). 

O wiele  ważniejsza  i wymagająca  wyższych  kwali 
fikacji  jest  działalność  fizyka  medycznego  w prowa- 
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badania  dzeniu  badań  naukowych  i opracowywaniu  nowych 
naukowa  rozwiązań  technicznych  problemów  medycznych 
stawianych  przez  lekarza.  Fizyk  może  się  w tym  za- 
kresie wykazać  całą  swoją  wiedzą  fizyczną,  gdyż  dzie- 
dziny badań  medycznych  mogą  być  bardzo  rozległe, 
od  chirurgii  kości,  rehabilitacji  (zastosowania  mecha- 
niki) począwszy,  przez  okulistykę  (zastosowania  opty- 
ki), fizykoterapię  (zastosowanie  prądu  elektrycznego 
i elektrostatyki),  aż  do  radiodiagnostyki,  radioterapii 
i medycyny  nuklearnej  (zastosowanie  fizyki  atomo- 
wej). Wszechstronność  wykształcenia  fizyka  pozwala 
na  efektywną  współpracę  z lekarzami  różnych  specjal- 
ności, a równocześnie  zapewnia  ścisły,  ujęty  matema- 
tycznie (w  miarę  możliwości)  pogląd  na  zagadnienia 
medyczne. 

zadania  w Fizyk  medyczny  znajduje  rozlegle  pole  działania 
ochronią  ra-  w zakresie  ochrony  przed  promieniowaniem.  Pro- 
diologicznej  wadzi  badania  radioaktywności  naturalnej  środowi- 
ska, sprawuje  stały  nadzór  nad  poziomem  skażeń 
promieniotwórczych,  które  mogą  wystąpić  wskutek 
pracy  takich  urządzeń  jak  reaktory  czy  elektrownie 
atomowe,  oraz  współuczestniczy  w pracach  bardziej 
podstawowych,  mających  na  celu  badanie  efektów 
promieniowania  na  tkankę  czy  komórkę.  W Polsce 
wielu  fizyków  medycznych  uzyskało  tytuł  inspektora 
ochrony  radiologicznej,  co  podkreśla  wagę  pełnio- 
nych przez  nich  funkcji. 

zadania  w Rola  fizyka  medycznego  w zakresie  radiodiagno- 
radiodiagno-  styki  polega  na  nadzorze  nad  bezpieczeństwem  i higie- 
styce  ną  pracy,  na  czuwaniu  nad  typową  aparaturą  i przede 
wszystkim  na  ścisłej  współpracy  z lekarzem  w opra- 
cowywaniu lub  adaptowaniu  nowych  metod  diagno- 
styki (nowe  badania  kontrastowe,  tomografia,  angio- 
grafia, kseroradiografia,  zastosowanie  wzmacniacza 
obrazu  itp.).  Należy  podkreślić,  że  działalność  fizyka 
podnosi  w sposób  zasadniczy  jakość  wykonywanych 
badań;  przez  ścisłą  kontrolę  aparatury  osiąga  się 
ponadto  optymalizację  dawki  promieniowania  użytej 
przy  badaniu. 

zadania  w W radioterapii  fizyk  medyczny  odgrywa  jeszcze 
radioterapii  ważniejszą  rolę:  zajmuje  się  przede  wszystkim 
planowaniem  leczenia, a poza  tym  — opracowywaniem 
dodatkowych  urządzeń  do  kierowania  wiązką,  kali- 
bracją aparatury  i rozwojem  nowych  metod  radio- 
terapeutycznych. 


Promieniowanie  Jonizujące 
w medycynie 

Promieniowanie  jonizujące  Jest  terminem,  przez 
który  będziemy  przede  wszystkim  rozumieć  promie- 
niowanie składające  się  z cząstek  naładowanych, 
takich  jak  elektrony,  pozytony,  protony,  deuterony, 
cząstki  alfa,  piony,  oraz  cząstek  nienaładowanych,  jak 
fotony  czy  neutrony.  Wszystkie  te  cząstki  niosą 
ze  sobą  pewną  energię  i dopiero  częściowe  przekaza- 
nie tej  energii  materii,  przez  którą  przechodzą,  pozwa- 
la na  ich  wykrycie.  Nas  będą  oczywiście  interesować  te 
rodzaje  wzajemnego  oddziaływania  promieniowania 
i materii,  które  albo  umożliwiają  stosowanie  urządzeń 
wykrywających  promieniowanie  (detektorów),  albo 
powodują  uszkodzenie  lub  zniszczenie  tkanki, 
cząstki  Przechodząc  przez  materię,  naładowana  cząstka 
naładowane  może  wywoływać  jonizację,  tj.  wybijać  elektrony  z ato- 
— jonizacja  mów,  wzbudzać  atomy,  rozrywać  wiązania  czą- 
steczkowe, a także,  jeżeli  zostanie  nagle  zahamo- 
wana lub  przyśpieszona,  wysyłać  promieniowanie 
elektromagnetyczne,  zwane  promieniowaniem  hamo- 
wania. Z biologicznego  punktu  widzenia  najważniejszą 
sprawą  jest  jonizacja  wywołana  przez  cząstkę  w tkan- 
ce. Im  cząstka  jest  cięższa,  tym  szybciej  traci  energię 
i tym  wcześniej  jest  zatrzymana,  a więc  jej  zasięg 
jest  mniejszy.  Na  przykład  zasięg  cząstki  alfa  w tkance 
wynosi  ok.  0,07  mm,  cząstki  beta  (elektrony)  — 
4,2  mm  (przy  energii  1 MeV).  Jeśli  energia  elektro- 
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nów  wynosi  kilkanaście  McV,  zasięg  ten  wzrasta 
do  kilku  cm.  Krzywa  zależności  zasięgu  od  energii 
elektronów  przekazanej  tkance  (rys.  1)  ma  kształt 
przypominający  prostokąt  o stosunkowo  stromych 
zboczach. 


Rys.  1.  Zależność  zasięgu  promieniowania  jonizującego  od  energii 
(energia  promieniowania  jest  wyrażona  w jednostkach  względ- 
nych) 


Promieniowanie  nienaładowane,  a więc  przede  cząstki 
wszystkim  promieniowanie  rentgenowskie  lub  gamma,  niensłado- 
zachowuje  się  zupełnie  inaczej  przy  przejściu  przez  wane  — 
materię.  We  wzajemnym  oddziaływaniu  indywidual-  różnorodno 
nego  fotonu  X lub  gamma  i elektronu  przekazanie  procesy 
energii  odbywa  się  wieloma  sposobami.  Cechą 
charakterystyczną  wzajemnego  oddziaływania  wiązki 
fotonów  X lub  gamma  i materii  jest  wykładnicza 
zależność  energii  przekazanej  przez  wiązkę  promie- 
niowania od  grubości  ciała  pochłaniającego  (krzywa 
na  rys.  1 ; gdy  cząstki  są  ciężkie,  jak  deuterony,  krzywa 
ma  charakterystyczne,  ostre  maksimum). 


promieniowanie  X lub  y 


Rys.  2.  Schemat  oddziaływania  promieniowania  X lub  y z ukła- 
dem biologicznym.  Całkowite  pochłonięcie  energii  padającego 
fotonu  X lub  y następuje  po  ok.  30  kolejnych  aktach  takiego  od- 
działywania 


,, historia  By  wyjaśnić  złożoność  procesów  pochłaniania 
życia"  i rozpraszania  promieniowania  X paciającego  na 
fotonu  układ  biologiczny  rozpatrzmy  „historię  życia”  fotonu 
(rys.  2).  Można  przypuścić,  że  pierwotne  wzajemne 
oddziaływanie  fotonu  i elektronu  następuje  w odle- 
głości średniej  drogi  przebytej  w tkance.  Z obliczeń 
wynika,  że  odległość  ta  wynosi  56  cm.  Stosując 
teraz  odpowiednie  wzory  opisujące  rozproszenie 
i pochłanianie,  otrzymamy,  że  ze  100  fotonów  pada- 
jących o energii  20  MeV  powstaną  w pierwotnym  od- 
działywaniu 44  pary  elektron-pozyton,  56  szybkich 
elektronów  comptonowskich  oraz  56  rozproszonych 
fotonów  o średniej  energii  5,4  MeV.  Pary  elektron- 
pozyton  ulegną  anihiłacji,  dając  początek  88  fotonom 

0 energii  511  keV.  Dalej  śledzić  będziemy  los  fotonów 
powstałych  z anihiłacji,  choć  podobne  rozważania 
można  by  również  zastosować  do  fotonów  rozproszo- 
nych o energii  5,4  MeV. 

Otóż  po  przebyciu  w tkance  drogi  10,3  cm  owych 
88  fotonów  ulegnie  rozproszeniu  comptonowskiemu, 
tzn.  powstanie  88  elektronów  comptonowskich  o ener- 
gii 175  keV  i 88  rozproszonych  fotonów  o energii 
336  keV.  Fotony  te  przebędą  średnią  drogę  9,1  cm 
do  następnego  miejsca  oddziaływania.  Proces  ten 
będzie  się  powtarzał  aż  do  chwili,  gdy  energia  foto- 
nów spadnie  do  kilkunastu  keV,  a wówczas  zacznie 
przeważać  proces  fotoelektryczny,  będzie  wzrastała 
liczba  fotoelektronów  i będzie  się  zmniejszała  liczba 
fotonów  comptonowskich,  aż  pozostanie  tylko  jeden 
foton;  a zatem  proces  rozproszenia  i pochłaniania 
pierwotnych  100  fotonów  o energii  20  MeV  zostanie 
zakończony.  Tak  przedstawiona  „historia  życia” 
fotonu  jest,  oczywiście,  bardzo  uproszczona,  ale 
przy  zastosowaniu  statystycznej  metody  Monte 
dawka  Carlo  i obliczeń  komputerowych,  do  np.  500  000 
pochłonięta;  „historii”,  uzyskuje  się  poprawny  ilościowy  opis 
grej  zjawisk  pochłaniania  i rozpraszania  w tkance,  co  ma 
wielkie  znaczenie  przy  określaniu  dawki  pochłoniętej. 
Jednostką  dawki  pochłoniętej  jest  grej  — Gy;  jest  to 
dawka,  przy  której  substancja  o masie  1 kg  pochłania 
energię  1 J (poprzednio  stosowaną  jednostką  był  rad ; 

1 rad  = 10~2  Gy).  Średnia  dawka  śmiertelna  dla  czło- 
wieka, którego  całe  ciało  zostało  napromieniowa- 
ne promieniami  X lub  gamma,  wynosi  ok.  4 grejów, 
dopuszczalna  zaś  dawka  roczna  < 5*  10  2 Gy.  Ponie- 
waż różne  rodzaje  promieniowania  wywołują  różny 
skutek  biologiczny,  wprowadza  się  tzw.  współczynnik 
jakości  promieniowania  QF,  który  przy  promienio- 
waniu X , gamma  i elektronów  równy  jest  1,  a np.  przy 
szybkich  neutronach  sięga  10.  Tak  zwany  równo- 
ważnik dawki  jest  określony  jako  iloczyn  dawki  po- 
chłoniętej i współczynnika  QF:  stosowaną  powszech- 
nie jednostką  równoważnika  dawki  jest  rem  (1  rem  jest 
to  równoważnik  dawki  1 rad  promieniowania  o współ- 
czynniku QF  =1). 

Skutki  działania  promieniowania  na  ustrój  zależą 
od  wielu  czynników:  od  wielkości  dawki  w okre- 
ślonej jednostce  czasu,  od  masy  ciała  czy  tkanki, 
wreszcie  od  biologicznych  cech  ustroju  i wrażliwości 
jego  poszczególnych  tkanek.  Pochłonięcie  energii  jo- 
nizacji przez  komórkę  powoduje  zasadnicze  zmiany 
skutki  w procesach  wewnątrzkomórkowych,  szczególnie 
działania  w jądrze  komórki:  może  nastąpić  śmierć  komórki, 
promienio-  zahamowanie  podziałów  komórkowych,  uszkodzenie 
wania  chromosomów  lub  zmiany  czynnościowe.  Okazuje  się, 
że  wiele  komórek  może  przeżyć  dawki  kilkuset  rem, 
toteż,  by  całkowicie  zniszczyć  np.  tkankę  nowotwo- 
rową, stosuje  się  dawki  sięgające  kilkunastu  lub  kilku- 
set tysięcy  rem  na  określonym  obszarze.  Od 
dawna  wiadomo,  że  promieniowanie  jonizujące  może 
pociągać  za  sobą  szkodliwe  skutki  genetyczne;  na 
ogół  są  one  proporcjonalne  do  wielkości  dawki, 
prawdopodobnie  jednak  nawet  najmniejsze  dawki, 
nawet  pojedyncze  akty  jonizacji  mogą  prowadzić 
do  mutacji  genetycznych  Szczególnie  wrażliwy  na 
promieniowanie  jest  organizm  ludzki  w czasie  życia 
płodowego  i to  przede  wszystkim  w najwcześniejszym 
okresie  5-6  tygodni.  Ponadto  niektóre  tkanki  i na- 


rządy ciała  ludzkiego,  np.  skóra,  układ  krwiotwórczy 
i limfatyczny,  narządy  rozrodcze,  soczewka  oka, 
błopa  śluzowa  jelit,  wykazują  wysoką  promienio- 
czułbść. 

Wszystkie  te  względy  narzucają  konieczność 
określenia  maksymalnej  dopuszczalnej  dawki  pro- 
mieniowania jonizującego  — i to  różnej  dla  róż- 
nych grup  ludności.  Dla  pracowników  bezpośrednio 
narażonych  na  promieniowanie  dawka  nie  powinna 
przekraczać  1,3  rema  na  kwartał,  a w żadnym  razie 
5 (W— 18)  remów  w całym  życiu  (gdzie  iVjest  wiekiem 
pracownika).  Dla  każdego  człowieka  dopuszczal- 
na jest  dawka  5 remów  w ciągu  pierwszych  30  lat 
życia. 

Ludność  narażona  jest  na  promieniowanie  jonizu- 
jące pochodzące  z promieniowania  kosmicznego, 
z promieniowania  naturalnych  pierwiastków  promie- 
niotwórczych oraz  z promieniowania  stosowanego  w 
radiodiagnostyce  i radioterapii,  ponadto  — w krajach 
uprzemysłowionych  — na  promieniowanie  pochodzą- 
ce z zakładów  przemysłowych  i instytutów  badaw- 
czych stosujących  radioizotopy,  a także  z pracują- 
cych elektrowni  atomowych.  Dokładna  analiza  wszy- 
stkich źródeł  promieniowania  jonizującego  w Polsce 
prowadzi  do  wniosku,  że  przyjęta  największa  dopusz- 
czalna dawka  5 rem  na  30  lat  uwzględnia  z nadmia- 
rem bezpieczeństwo  całej  ludności,  nawet  przy  in- 
tensywnej rozbudowie  do  2000  r.  elektrowni  atomo- 
wych. 

Z drugiej  strony  — oddziaływanie  promieniowa- 
nia jonizującego  na  materię,  o którym  mówiliśmy 
wyżej  z punktu  widzenia  jego  szkodliwości  dla  orga- 
nizmu, pozwala  na  jego  wykrywanie  przy  zastoso- 
waniu tzw.  mierników  promieniowania.  Podstawowa 
zasada  działania  takich  mierników  ukazana  jest  na 
rys.  3.  Zasadniczym  elementem  miernika  jest  detek- 
tor, tj.  urządzenie  służące  do  przetwarzania  energii 
promieniowania  na  energię  (sygnał)  dogodną  do  po- 
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Rys.  3.  Schemat  typowych  układów  pomiarowych  do  mierzenia 
promieniowania  jonizującego 


miaru  (najczęściej  prąd  elektryczny).  W komorze 
jonizacyjnej  jest  to  prąd  ciągły  a w licznikach  Geige- 
ra-Miillera,  w licznikach  proporcjonalnych  oraz 
scyntylacyjnych  — prąd  impulsowy,  który  następnie, 
po  wzmocnieniu,  zostaje  zmierzony  w układzie  po- 
miarowym. 

Konstruuje  się  mierniki  różnego  rodzaju,  zależnie 
od  rodzaju  promieniowania  i od  celu,  któremu  mają 
służyć.  Dzisiaj  jednak  są  to  przeważnie  tzw.  liczniki 
scyntylacyjne,  o których  będzie  mowa  dalej  w związ- 
ku z omówieniem  medycyny  nuklearnej. 


Radiodiagnostyka  i radioterapia 

Radiodiagnostyka  i radioterapia,  w medycynie  zwane 
łącznie  radiologią,  obejmują  zastosowanie  zarówno 
źródeł  promieniowania  rentgenowskiego  (aparaty  radiologia 
rentgenowskie)  i promieni  gamma  czy  strumieni  czą- 
stek, jak  i zamkniętych  lub  otwartych  źródeł  pro- 
mieniotwórczych (np.  stosowane  w radioterapii 


793 


źródła 
otwarte 
£ zamknięte 


rentgeno- 

diagnostyka 


otrzymywa- 
nie obrazów 


igły  radowe  lub  kobaltowe,  które  się  umieszcza  we- 
wnątrz ciała  chorego,  są  źródłami  zamkniętymi,  na- 
tomiast radioizotop  jodu  131 J,  stosowany  w leczeniu 
m.in.  przerzutów  nowotworowych,  uczestniczący 
w przemianie  metabolicznej  w organizmie,  jest 
źródłem  otwartym). 

Radiodiagnostyka,  zwana  również  rentgenodiagno- 
styką,  jest  najpowszechniej  stosowaną  metodą  badań 
przy  użyciu  aparatów  rentgenowskich.  Ponieważ 
różne  tkanki  organizmu  pochłaniają  promieniowanie 
rentgenowskie  w różnym  stopniu,  zależnie  od  ich 
składu  chemicznego,  na  ekranie  pokrytym  substancją 
fluoryzującą  pod  wpływem  promieni  X powstaje 
obraz  o różnym  kontraście  (rys.  4).  Zamiast  ekranu 
umieszcza  się  kliszę  światłoczułą  pomiędzy  dwiema 
wzmacniającymi  foliami,  które  świecą  pod  wpływem 
promieniowania  X i dodatkowo  naświetlają  emulsję 


przez  tkankę 

Rys.  4.  Schemat  otrzymywania  obrazu  rentgenowskiego  na  przy- 
kładzie prześwietlenia  podudzia.  Zmiana  natężenia  wiązki  po 
przejściu  przez  tkanki  zależy  od  ich  rodzaju 


kliszy  fotograficznej.  Zdjęcia  rentgenowskie  są  nega- 
tywami i są  zawsze  w tej  postaci  interpretowane  przez 
lekarzy. 

Różne  typy  aparatów  rentgenowskich  przeznaczone 
są  do  różnych  celów.  I tak  seriografy  stosuje  się 
do  wykonywania  wielu  zdjęć  w krótkim  czasie,  tomo- 
grafy służą  do  wykonywania  zdjęć  warstwowych, 
wreszcie  kamery  do  zdjęć  małoobrazkowych  pozwa- 
lają na  szybkie  przeprowadzenie  masowych  badań 
ludności.  Obecnie  coraz  częściej  stosuje  się  układy 
rentgenotelewizji  złożone  z aparatu  rentgenowskiego, 
elektronowego  wzmacniacza  obrazu,  kamery  TV 
i monitora  TV  (rys.  5 i il.  25,  tabl.  8).  Dzięki  ogromnej 
czułości  wzmacniacza  obrazu  (kilka  tys.  razy  większej 
niż  czułość  zwykłego  ekranu  rentgenowskiego)  można 
znacznie  obniżyć  dawkę  promieniowania  pochłanianą 
przez  pacjenta.  Przez  zastosowanie  kserografii  zwięk- 
sza się  kontrast  i rozdzielczość  obrazów  rentgeno- 
wskich, a ponadto  unika  się  kłopotliwej  obróbki  klisz 
w ciemni  fotograficznej. 

Najnowszym  osiągnięciem  w dziedzinie  diagnostyki 
rentgenowskiej  są  tomografy  komputerowe.  Metoda 
konwencjonalnej  tomografii  rentgenowskiej  (do  zdjęć 
warstwowych)  polega  na  tym,  że  lampa  rentgenowska 
przesuwa  się  w trakcie  naświetlania  w jednym  kie- 
runku, a sprzężona  z nią  kaseta  z kliszą  fotograficzną 
przesuwa  się  w kierunku  przeciwnym  (rys.  8). 

Jeżeli  weźmiemy  pod  uwagę  punkty  A i B leżące 
w ciele  pacjenta  w płaszczyźnie  obrotu  układu  lampa- 
kaseta  PPl9  to  rzutami  tych  punktów  na  kliszy  w jej 
pierwszym  położeniu  będą  punkty  Ax  i Bu  w drugim 
zaś  — Az  i B2.  Wypadną  one  w tym  samym  miejscu 
kliszy  i dlatego  po  jej  wywołaniu  będą  widoczne 
jako  ostre,  natomiast  rzuty  każdego  punktu  leżą- 
cego poza  płaszczyzną  obrotu  PPX  (rys.  8)  wypadną 
w różnych  miejscach  kliszy  (punkty  Cx  i C2),  nawet 
znajdą  się  poza  kliszą  (punkt  C,).  Tak  więc  obraz 
tkanek  leżących  w płaszczyźnie  obrotu  układu  lam- 
pa-kaseta  jest  ostry  na  zamazanym  tle  pochodzącym 
z nałożonych  na  siebie  rzutów  obrazów  z innych 
płaszczyzn.  Przez  zmianę  odległości  lampa-kaseta 
zmienia  się  płaszczyznę  ostrego  obrazu,  a zatem  uzy- 
skuje się  możliwość  oglądania  kolejnych  warstw 
tkanek.  Jedna  klisza  rentgenowska  odpowiada  tylko 
jednej  płaszczyźnie,  a zatem  uzyskanie  pełnego, 
trójwymiarowego  obrazu  tkanek  byłoby  możliwe 
jedynie  po  złożeniu  jedna  na  drugiej  wszystkich 
klisz,  na  których  leżą  rzuty  wszystkich  płaszczyzn, 
co  jest  technicznie  niewykonalne. 

Wykorzystując  minikomputer,  udało  się  jednak  za- 
stosować samą  ideę  superpozycji  rzutów  tomogra- 
ficznych  do  zbudowania  nowego  urządzenia,  zwanego 
tomografem  komputerowym.  Nastąpił  przewrót  w me- 
todach diagnostycznych  medycyny,  jak  sądzą  nie- 
którzy — na  miarę  odkrycia  samych  promieni 
rentgenowskich.  Twórcą  pierwszego  tomografu  kom- 
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urządzenia  telewizyjne 


wzmacniacz  obrazu 
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Rys.  5.  Zasada  zastosowania 
wzmacniacza  obrazu 
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budowa  to- 
mografu 

komputero- 

wego 


puterowego  (EMI  Brain  Scanner)  był  Anglik,  God- 
frey  N.  Hounsfield,  z firmy  EMI  (nagroda  Nobla 
1979  r.).  Zastosowany  w praktyce  lekarskiej  w 1973  r. 
tomograf  służył  przede  wszystkim  do  badania  mózgu. 


zaś  z kolei  daje  możliwość  odróżnienia  tkanek  nie- 
wiele różniących  się  gęstością. 

Pacjenta  umieszcza  się  na  kozetce  przechodzącej 
przez  otwór  tzw.  bramki  skaningowej  urządzenia. 


Rys.  6.  Przesunięcie  liniowe  aparatu  tomograficznego 


Tomograf  komputerowy  składa  się  z urządzenia 
przesuwającego  (z  lampą  rentgenowską  i układem 
detektorów;  rys.  6 i 7),  z konsoli  rentgenowskiej 


lampa  rentgenowska 


ciało  pacjenta 


układ  detektorów  I 


f—l 


Rys.  7.  Po  fazie  przesunięć  liniowych  aparat  tomograficzny  obraca 
się  o 10° 


układu  monitorowania  i regulacji  oraz  z zespołu 
pamięci  (dyskowej  lub  taśm  magnetycznych)  i ekranu 
TV,  służących  do  rejestracji  i oglądania  otrzymanych 
obrazów.  Lecz  najważniejszą  rolę  w tomografie  od- 
grywa szybki  minikomputer,  który  stanowi  serce  ca- 
łego urządzenia. 

W takim  tomografie  bada  się  tkanki  ciała  w plas- 
trach grubości  13  mm,  wyciętych  bezkrwawo,  prosto- 
padle do  pionowej  osi  ciała  (rys.  9).  Dzięki  zastoso- 
waniu minikomputera  można  przeprowadzić  analizę 
niewielkich  nawet  różnic  w natężeniu  promie- 
niowania po  przejściu  przez  tkanki,  a więc  i współ- 
czynników pochłaniania  promieni  rentgenowskich;  to 


kierunek  przesuwu  kasety  z kliszą 
Rys.  8.  Schemat  otrzymywania  rzutów  tomograficznych 


kierunek  przesuwu  lampy 


V- 

płaszczyzna  obrotu 


ciało  pacjenta 


Kozetka  może  się  przemieszczać  wzdłuż  osi  poziomej 
przechodzącej  przez  bramkę.  W bramce  skaningowej 
znajduje  się  źródło  promieni  rentgenowskich  i układ 
detektorów  scyntylacyjnych.  Źródło  i detektory  usta- 
wione są  naprzeciw  siebie,  a pomiędzy  nimi  znajduje 
się  badana  część  ciała  pacjenta.  Dodatkowy  detektor 
mierzy  natężenie  pierwotnej  wiązki  promieni  rentge- 
nowskich (il.  182,  tabl.  47). 


obszar  badany  w ciągu 
jednego  cyklu 


Rys.  9.  Metodą  tomograficzną  bada  się  kolejne  plastry  ciała 
pacjenta 


Badanie  rozpoczyna  się  od  fazy,  w której  bramka 
przesuwa  się  względem  ciała  pacjenta,  przy  czym  badanie  za 
wąska  wiązka  skolimowanych  promieni  rentgenów-  pomocą 
skich  przechodzi  przez  ciało  i pada  na  układ  detek-  tomografu 
torów.  W czasie  jednego  przesunięcia  otrzymuje  się  komputero- 
jeden  rzut  tomograficzny  z zarejestrowanych  18  000  wego 
pomiarów  natężenia  promieniowania.  Po  zakończe- 
niu przesuwu  bramka  skaningowa  obraca  się  wzglę- 
dem ciała  pacjenta  o 10°,  następnie  powtarza  się 
przesuw  z jednoczesnym  pomiarem  i obrót  bramki 
o 10°.  I tak  18  razy,  aż  bramka  zatoczy  pół  okręgu, 
tzn.  wykona  obrót  o 180°.  Wartości  liczbowe  dla 
każdego  rzutu  tomograficznego  są  w sposób  ciągły 
wprowadzane  do  minikomputera,  który  oblicza 
łącznie  80  000  wartości  współczynników  pochłaniania 
dla  badanego  obszaru  ciała  i przekazuje  do  pamięci 
dyskowej,  która  może  przechowywać  wyniki  ośmiu 
obrazów  — ośmiu  plastrów  ciała. 

Istota  tomografii  komputerowej  polega  na  wyko- 
nywaniu dokładnych  obliczeń  — za  pomocą  mini- 
komputera — współczynników  pochłaniania  promie- 
ni rentgenowskich  dla  każdego  rzutu  tomograficznego 
(co  odpowiada  na  zdjęciu  obszarom  o różnym  za- 
czernieniu), a następnie  rekonstrukcji  matematycznej 
całkowitego  obrazu  plastra  z tych  rzutów.  Współ- 
czynniki pochłaniania  obliczane  są  z dużą  dokład- 
nością. Pozwala  to  na  uwidocznienie  tkanek  o małych 
różnicach  gęstości,  co  tradycyjnymi  metodami  radio- 
diagnostyki było  nieosiągalne.  Układ  wyjściowy  z kolo- 
rowym monitorem  telewizyjnym  pozwala  na  ogląda- 
nie obrazów  badanych  plastrów  ciała  i rejestrację 
ich  na  kliszy  (il.  22,  tabl.  8 i il.  183,  tabl.  47). 
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Czas  badania  jednego  plastra  wynosi  20  s (bada 
się  8 plastrów).  Średni  całkowity  czas  badania  pacjenta 
wynosi  ok.  30  min,  w co  wlicza  się  czas  potrzebny 
na  pracę  minikomputera. 

Ten  nowy  system  przedstawiania  obrazów  rentge- 
nowskich wymaga  od  lekarza  radiologa  innego  spo- 
sobu interpretacji,  gdyż  większość  zdjęć  wykonywano 
dotychczas  w płaszczyznach  równoległych  do  piono- 
wej osi  ciała.  Chociaż  w tradycyjnej  rentgen odiagnc- 
styce  (szczególnie  w kseroradiografii)  można  odróż- 
nić szczegóły  budowy  tkanki  kostnej  z dokładno- 
ścią rzędu  mikronów,  to  jednak  dopiero  w tomo- 
grafii komputerowej  uzyskuje  się  obrazy  miękkich 
tkanek  ciała,  a więc  większości  wewnętrznych 
organów  człowieka. 

możliwości  Zakres  medycznych  zastosowań  tomografii  kom- 
zastosowa-  puterowej  jest  ogromny  i rozszerza  się  z każdym 
nia  tomogra-  rokiem:  począwszy  od  diagnostyki  nowotworów  czy 
fii  kom pute-  zatorów  w mózgu  bez  konieczności  wprowadza- 
rowej  nia  środka  cieniującego  lub  powietrza  (co  się  zawsze 
wiąże  z niewygodą  lub  nawet  niebezpieczeństwem 
dla  pacjenta),  poprzez  badania  profilaktyczne, 
sprawdzanie  wyników  leczenia  — aż  po  badanie 
dynamiki  organów  (np.  serca)  — wszędzie  ta  metoda 
znajduje  zastosowanie. 

Obecnie  prowadzi  się  również  prace  nad  za- 
stosowaniem tomografii  komputerowej  w dziedzinie 
krótkożyciowych  radioizotopów  pozytonowych,  ta- 
kich jak  llC,  13N  czy  lsO,  albo  ciężkich  jonów.  Można 
sobie  również  wyobrazić  zastosowanie  komputero- 
wej metody  tomograficznej  w technice  sonografii 
ultradźwiękowej  lub  w technice  pól  magnetycznych, 
terapia  pro-  Naczelną  troską  konstruktorów  diagnostycznych 
mieniami  X aparatów  rentgenowskich  jest  stałe  dążenie  do  zmniej- 
szania dawki  promieniowania  związanej  z badaniem. 
Natomiast  w aparatach  rentgenowskich  stosowanych 
w terapii,  przede  wszystkim  nowotworowej,  istotne 
jest  otrzymywanie  możliwie  silnych,  jednorodnych 
i stabilnych  wiązek  promieni  X , terapia  bowiem 
polega  na  niszczeniu  tkanki  nowotworowej  przy 


Z fizycznego  punktu  widzenia  terapię  rentgenow- 
ską podzielić  można  na  4 działy:  do  ok.  100  kV 
(terapia  powierzchniowa),  do  ok.  150  kV  (terapia 
półgłęboka),  do  500  kV  (terapia  głęboka)  oraz  od  ok. 

1 MV  (terapia  megawoltowa).  Inne  warunki  muszą 
być  spełnione,  gdy  chodzi  o napromienianie  skóry, 
a inne,  gdy  chodzi  o tkanki  nowotworowe  znajdujące 
się  głęboko  w ciele  chorego.  Program  napromieniania 
opracowuje  lekarz  radioterapeuta  przy  współpracy 
z fizykiem  medycznym,  o czym  poniżej. 

W rentgenoterapii  stosuje  się  lampy  rentgenowskie 
nieruchome  (terapia  stacjonarna)  lub  lampy,  które 
wykonują  ruch  obrotowy  (terapia  obrotowa). 

Oprócz  terapii  rentgenowskiej  w leczeniu  nowotwo- 
rów stosuje  się  zewnętrzną  i wewnętrzną  terapię 
promieniami  gamma.  Dawka  promieniowania  gamma  terapia  pro- 
pochłonięta  przez  tkanki  kostne  jest  mniejsza  niż  mieniami  y 
dawka  promieniowania  rentgenowskiego.  Ponadto 
stosowanie  promieni  gamma  pozwala  na  korzystniej- 
sze napromieniowanie  tkanek  nowotworowych  poło- 
żonych głębiej  w ciele  przy  jednoczesnym  oszczędza  - 
niu  skóry.  Wewnętrzna  terapia  gamma  polega  na  sto- 
sowaniu tzw.  aplikatorów  w postaci  igieł,  walców 
itp.  zawierających  rad,  kobalt-60,  iryd-192  i cez-137, 
wprowadzanych  śródtkankowo  lub  śródjamowo  do 
organizmu.  Zewnętrzna  zaś  terapia  polega  na  sto- 
sowania aparatu  do  teleterapii  Co-60,  tzw.  bomby  ko- 
baltowej. Jest  to  urządzenie  zawierające  ładunek  ak- 
tywności rzędu  1014  Bq,  umożliwające  krótkie  i inten- 
sywne naświetlanie  tkanki  nowotworowej.  Problemy 
planowania  teieterapii  są  w tym  wypadku  podobne  do 
planowania  terapii  rentgenowskiej.  Bomby  kobaltowe 
produkowane  przez  firmę  Siemens  nazywają  się  gam- 
matronami  (ii.  52,  tabl.  14). 

Rozważmy  tu  przykładowo  zagadnienie  planowania  zastosowa- 
kuracji  — za  pomocą  bomby  kobaltowej  (Co-60) — nie  bomby 
pacjenta,  u którego  w pęcherzu  wykryto  zmiany  kobaltowej 
nowotworowe.  Po  wykryciu  tych  zmian  na  zdjęciu 
rentgenowskim  lekarz  wskazuje  fizykowi  obszar 
odpowiadający  anatomicznie  pęcherzowi  i całkowitą 


Rys.  10.  Sumaryczny  rozkład  dawki  na  pęcherz  ze  zmianami  nowotworowymi  pochodzący  od  trzech  wiązek  promieniowania  y izoto- 
pu *°Co 


jak  najmniejszym  uszkodzeniu  tkanki  zdrowej.  Tak 
rozumiane  leczenie  promieniami  X wymaga  opraco- 
wania szczegółowego  programu  napromieniowania. 
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dawkę  promieniowania,  którą  obszar  ten  ma  zostać 
naświetlony.  Na  rys.  10,  przedstawiającym  przekrój 
w płaszczyźnie  pęcherza  prostopadły  do  pionowej  osi 


ciała  pacjenta,  obszar  ten  obwiedzony  jest  czarną  linią. 
Rola  fizyka  medycznego  polega  na  takim  dobraniu 
warunków  napromieniowania,  aby  maksimum  dawki 
przypadło  w tym  właśnie  obszarze,  pozostałe  zaś  czę- 
ści ciała  zostały  jak  najmniej  napromieniowane.  W wy- 
padku przedstawionym  na  rysunku  fizyk  medyczny 
dobrał  napromieniowanie  nowotworu  trzema  wiązka- 
mi promieni  gamma  z trzech  kierunków.  L inie  koloru 
izodozy  niebieskiego  są  to  tzw.  izodozy,  tj.  krzywe  łączące 
punkty  o tej  samej  wartości  dawki  (podanej  w pro- 
centach; dawkę  odpowiadającą  wiązce  padającej  od 
przodu  przyjęto  jako  100%).  Izodozy  te  powstały  z su- 
mowania trzech  rozkładów  pierw-otnych  izodoz,  które 
dotyczyły  trzech  kierunków  oddzielnie,  a które  otrzy- 
fantom  mano  z badań  na  fantomach  — sztucznych  układach 
własnościami  imitujących  ciało  człowieka.  Wiązki  pro- 
mieni gamma  mają  w tym  przykładzie  „średnicę” 
8 cm  i tego  rzędu  zasięg  najefektywniejszego  działa- 
nia. 

Przygotowanie  rozkładu  izodoz,  tzn.  dobranie 
wszystkich  warunków,  takich  jak  odległości,  w ielkości 
dawek,  liczba  kierunków  napromieniowania,  zasto- 
sowanie specjalnych  filtrów  formujących  wiązki  itp., 
jest  procedurą  żmudną  i pracochłonną,  i dlatego  po- 
wierza się  je  obecnie  coraz  częściej  odpowiednio 
zaprogramowanym  komputerom.  Programy  na  kom- 
puter są  oczyw-iście  pisane  również  przez  fizyków 
medycznych. 

zastosowanie  W niewiele  lat  po  skonstruowaniu  pierwszych 
akcelerato-  akceleratorów  typu  Van  de  Graaffa,  betatronów 
rów  i akceleratorów  liniowych  do  celów  badań  fizycznych 
okazało  się,  że  mogą  one  być  z pożytkiem  wykorzysta- 
ne w radioterapii.  Obecnie  jest  na  świecie  przeszło 
400  betatronów  i akceleratorów  liniowych  stosowa- 
nych w medycynie.  Liczba  pacjentów  leczonych 
sięga  miliona  rocznie,  a koszt  leczenia  — wieluset 
milionów  dolarów. 

Akceleratory  służą  do  otrzymywania  wiązek 
cząstek  naładowanych,  np.  elektronów,  protonów, 
lub  pośrednio  do  otrzymywania  wiązek  cząstek  nie 
naładowanych,  jak  neutrony  i fotony.  W radioterapii 
stawia  się  specjalne  wymagania:  energia  cząstek 
musi  być  na  tyle  duża,  aby  dotarły  one  do  obszaru 
nowotworu,  natężenie  wiązki  musi  być  tak  duże, 
żeby  okres  napromieniowania  pacjenta  był  jak  naj- 
krótszy, sama  zaś  w'iązka  musi  być  jednorodna  i łatwa 
do  regulowania  i kontroli.  Wreszcie  zależność  wiel- 
kości dawki  od  grubości  tkanki  musi  się  charakteryzo- 
wać szybkim  narastaniem,  możliwie  płaskim  maksi- 
mum i szybkim  spadkiem  (rys  1). 

W radioterapii  wykorzystuje  się  najczęściej  elektro- 
ny o energiach  do  40  MeV  oraz  promienie  A"  od  8 do 
20  MeV.  Stosuje  się  również  neutrony  prędkie, 
produkowane  najczęściej  w cyklotronach  izochro- 
nicznych.  Wreszcie  w celach  leczniczych  mogą  być 
stosowane  protony,  deuterony,  a nawet  piony.  Stosu- 
jąc protony  o energii  przekraczającej  100  MeV  i tech- 
nikę obrotową,  otrzymuje  się  wyjątkowo  korzystne 
warunki  napromieniowania  głęboko  położonej  tkanki 
nowotworowej  przy  małej  dawce  powierzchniowej. 
W radioterapii  można  również  stosować  wysokoener- 
getyczne ciężkie  jony,  dające  dobry  rozkład  dawki, 
np.  w wypadku  nowotworów  położonych  głęboko. 


Medycyna  nuklearna 

Uważa  się  powszechnie,  że  medycynę  nuklearną 
można  określić  jako  dziedzinę,  która  obejmuje  wszy- 
stkie rodzaje  zastosowania  źródeł  promieniowania 
jonizującego  w postaci  substancji  radioaktywnych 
(promieniotwórczych)  wr  diagnozie  i leczeniu  oraz 
w pracy  badawczej  z wyjątkiem  zastosowania  zamk- 
niętych źródeł  promieniowania,  o których  była  mowa 
w części  poświęconej  radioterapii.  Medycyna  nuklear- 
na szybko  się  rozwija.  Wprowadza  się  bezustannie 
nowe  radiofarmaceutyki,  nowe  techniki  pomiaru 
i now'e  testy  diagnostyczne. 


Metody  diagnostyczne  medycyny  jądrow-ej  — meto- 
dy radioizotopowe,  — opierają  się  na  zastosowaniu 
tzw.  znaczników.  Atomy  radioaktywnego  izotopu  da-  znaczniki 
nego  pierw-iastka  wprowadzone  do  organizmu  zacho- 
wują się  jak  atomy  pierwiastka  trwałego  i uczestniczą 
w'e  wszystkich  procesach  metabolicznych  na  podo- 
bieństwo agentów  policji  zmieszanych  z tłumem 
demonstrantów  i wysyłających  radiowa  raporty 

0 sytuacji.  Tak  samo  atomy  radioaktywne,  wysyłając 
promieniowanie  gamma  (lub  elektrony),  które  mogą 
być  wykryte  za  pomocą  detektorów  promieniowania, 
dają  nam  znać  o przebiegu  procesów  w organizmie, 
tkance  czy  komórce.  Ponieważ  liczba  znaczników 
radioaktywnych  jest  znikomo  mała  w porównaniu 
z odpowiednimi  atomami  trwałymi,  efekt  zakłócający 
procesy  biologiczne,  jaki  mogłoby  wywrzeć  promie- 
niowanie wysyłane  przez  znaczniki,  jest  w większości 
wypadków  również  znikomy.  Nie  można  jednak 
pominąć  efektu  niszczącego  tkankę  i dlatego  poda- 
wanie jakichkolwiek  substancji  radioaktywnych  do 
organizmu  musi  być  obwarowane  odpowiednimi 
przepisami  i zastrzeżeniami.  Wszelkie  substancje  radio- 
promieniotwórcze,  tzw.  radiofarmaceutyki,  wpro-  farmaceutyki 
wsadzane  są  do  żywego  organizmu  pod  kontrolą 

lekarską.  Celowo  nie  używamy  terminu  „radiolek”, 
gdyż  substancje  promieniotwórcze  stosowane  są 
w ogromnej  większości  do  celów  diagnostycznych, 
a nie  leczniczych.  Stosuje  się  je,  aby  zbadać  funkcję 
określonego  narządu  w organizmie  lub,  aby  uzyskać 
obraz  struktury  narządu.  Muszą  je  charakteryzować 
cztery  zasadnicze  cechy:  odpowiednie  właściwości 
biologiczne,  rodzaj  i szybkość  rozpadu  radioizotopu, 
właściwości  umożliwiające  detekcję  i łatw-ość  pro- 
dukcji. 

Ilość  radioizotopu  albo  raczej  proporcjonalną 
do  niej  aktywmość  promieniotwórczą  mierzy  się 
liczbą  rozpadów  na  jednostkę  czasu.  Jednostką 
aktywności  jest  bekerel  — Bq ; 3 Bq  jest  to  aktywność, 
przy  której  następuje  1 rozpad  w czasie  1 sekundy  aktywność 
(poprzednio  stosowaną  jednostką  był  kiur  — Cj;  promienio- 

1 Ci  = 3,7-1010Bq).  Można  w zasadzie  przyjąć,  że  twórcza; 
ilości  radioizotopu  w radiofarmaceutykach  stosowa-  bekerel 
nych  diagnostycznie  są  rzędu  104  Bq,  stosowanych  zaś 

wr  radioterapii  — rzędu  (0,1-1)- 1 09  Bq. 

Charakterystyczną  cechą  każdego  radioizotopu 
jest  jego  fizyczny  czas  połowicznego  zaniku  ^1/2* 

Ze  względu  na  szkodliwość  radioizotopów  dla  orga- 
nizmu oraz  wymagania  związane  z detekcją  radioizo- 
topy medyczne  podawane  w postaci  radiofarmaceuty- 
ków  powinny  mieć  czas  połow-icznego  zaniku  T1JZ  nie 
krótszy  niż  1 min  i nie  dłuższy  niż  100  dni;  energie 
emitowanych  przez  nie  promieni  beta  powinny  być 
jak  najniższe,  a energie  promieni  gamma  nie  większe 
niż  1 MeV. 

Każdą  substancję  podawaną  żywemu  organizmowi  biologiczny 
charakteryzuje  czas,  po  którym  organizm  w'ydala  czas 
połowę  podanej  ilości.  Jest  to  tzw.  biologiczny  czas  połowiczne- 
połowicznego  zaniku  T\jZ.  W rezultacie  obserwowany  9®  zaniku 
czas  połowicznego  zaniku,  tzw.  efektywmy  czas  po- 
łowicznego zaniku  podawanego  radiofarmaceutyka 
jest  mniejszy  od  r,/2  w stopniu  zależnym  od 
Znajomość  — z obserwacji  — czasu  efektywnego 
pozwala  łącznie  z danymi  o zdolności  jonizacyjnej 
radioizotopu  na  obliczenie  dawki  pochłoniętej  przez 
określony  narząd  czy  tkankę.  Obliczenia  takie  są 
skomplikowane,  wymagają  użycia  komputerów,  ale 
są  niezwykle  ważne  w medycynie  nuklearnej,  gdyż 
dzięki  nim  można  wyznaczyć  efekt  szkodliwości 
podawania  określonego  radioizotopu.  Ponadto  ra- 
dioizotopy znajdują  zastosowanie  w badaniach  me- 
tabolicznych (tabela). 

Większość  radioizotopów'  stosow-anych  w medycy-  otrzymywa- 
nie otrzymuje  się  w reaktorze,  niektóre  w cyklotronie  nie  radio- 
(I23J,  52Fe,  18F,  UC,  13N  i lsO).  Obecnie  coraz  szerzej  izotopów 
stosowane  są  radioizotopy  krótkożyjące  (T^z=  6 h, 
takie  jak  "^Tc  czy  113In).  Otrzymuje  się  je  bezpośred- 
nio w pracowni  medycznej  z rozpadu  dłużej  żyjących 
radioizotopów  macierzystych  umieszczonych  w’  tzw. 
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zastosowanie 

radioizoto- 

pów 


radioizotopy 
w medycynie 


generatory 


licznika 

scyntylacyjne 


Metody  diagnostyczne  i terapeutyczne  w medycynie 
jądrowej 


Diagnostyka 


Terapia 


Badanie  czynności  tarczycy 
Scyntygrafia  tarczycy 
Badanie  czynności  wątroby 
Scyntygrafia  wątroby 
Scyntygrafia  mózgu 
Badanie  czynności  nerek 
Scyntygrafia  nerek 
Scyntygrafia  ognisk  nowotworo- 
wych 

Scyntygrafia  układu  kostnego 
Scyntygrafia  mięśnia  sercowego 
Diagnostyka  chorób  układu  krą- 
żenia 

Oznaczanie  objętości  krwi  krą- 
żącej 

Diagnostyka  zaburzeń  ukrwienia 
Badanie  metabolizmu,  np.  żelaza 
Badanie  gospodarki  wodnej 


Zastosowanie  źródeł  otwar- 
tych 

Leczenie  chorób  tarczycy 
Leczenie  chorób  krwi 
Leczenie  przerzutów  nowo- 
tworowych 

Zastosowanie  źródeł  zam- 
kniętych 

Leczenie  kontaktowe  i śród- 
miąższowe 

Wprowadzenie  do  przysadki 
mózgowej 

Leczenie  nowotworów  skóry 
za  pomocą  izotopów 
^■-promieniotwórczych 


Radioizotopy  najczęściej  stosowane  w medycynie  nuklear- 
nej i ich  właściwości 


Izotop 

T,„ 

— 

Energia 

B 

Energia 

y 

iRadiofarma- 
!;  ceutyka 

Zastosowa- 

nie 

l4C 

5700  lat 

bardzo 

niska 

- 

liczne  związ- 
ki orga- 
riczne 

badania 

biomedycz- 

ne 

"Co 

! 5,2  lat 

średnia 

wysoka 

źródło 

zamknięte 

leczenie 

nowotwo- 

rów 

"Kr 

10,4  lat 
(bar- 
; dzo 
, krótki 

7*1/ Ib) 

średnia 

gaz 

przepływ 
krwi,  zabu- 
rzenia od- 
dychania 

•*To 

j 6 h 

średnia 

nadtechne- 
cjan,  związ- 
ki znako- 
wane 

scyntygrafia 

tarczycy, 

nowotwo- 

rów 

u»I 

1,7  h 

wysoka 

związki  che- 
latowe 

scyntygra- 
fia nowo- 
tworów 

X»J 

60  d 

niska 

niska 

jodek  sodu, 
liczne  zwią- 
zki orga- 
niczne 

(hormony)  ! 

badania 
gruczołów 
wydzielania 
dokrewne- 
go  (prze- 
ważnie in 
vitro ) 

mj 

8,1  d 

średnia 

średnia 

jodek  sodu, 

albumina, 

hipuran, 

hormony 

tarczycy 

diagnostyka 
tarczycy, 
nerek,  prze- 
pływ krwi 
(przeważ- 
nie in  vivo ) 

1#,Au 

2,7  d 

wysoka 

średnia 

zawiesina 

koloidalna 

terapia  no- 
wotworowa 

X*7Hg 

67  h 

niska 

niska 

neohydryna 

scyntygra- 
fia nerek 

*03Hg 

47  d 

średnia 

średnia 

neohydryna 

scyntygra- 
fia nerek 

energia  mała:  < 100  keV 
energia  średnia:  100  keV  —500  keV 
energia  duża:  > 500  keV 


generatorach  (rys.  11).  Na  przykład  "mTc  otrzymuje 
się  z generatora  "Mo  o czasie  połowicznego  zaniku 
67  h.  Radioizotopy  te  znajdują  szczególnie  szerokie 
zastosowanie  w scyntygrafii. 

Diagnostyczne  metody  radioizotopowe  pozwalają 
na  postawienie  lepszej  diagnozy  niż  metody  nieradio- 
izotopowe,  gdyż  umożliwiają  otrzymywanie  danych 
pewniejszych,  bardziej  szczegółowych,  bardziej  obiek- 
tywnych, bo  ilościowych;  ponadto  umożliwiają 
wprowadzenie  badań  masowych  (np.  w diagnostyce 
nowotworowej)  i zmniejszają  koszt  badań. 

Podstawowym  przyrządem  mierzącym  ilość  pro- 
mieniowania (przeważnie  gamma)  ze  znacznika  krą- 
żącego w ustroju  lub  zawartego  w próbce  krwi  pobra- 
nej od  pacjenta  jest  licznik  scyntylacyjny.  Składa  się 
on  ze  scyntylatora  krystalicznego  (NaJ  aktywowany 
talem)  i foto  powielacza  połączonych  ze  sobą  (rys.  12). 


Wiązka  promieni  gamma,  ograniczona  przez  oło- 
wiany kolimator,  pada  na  scyntylator  i powoduje 
powstanie  w nim  krótkotrwałych  błysków  świetlnych, 
tzw.  scyntylacji.  Światło  tych  scyntylacji,  padając  na 
światłoczułą  katodę  fotopowielacza,  uwalnia  z niej 


"Mo 

osadzony  na 
tlenku  glinu 


z ołowiu 


Rys.  11.  Kolumna  do  otrzymywania  radioizotopów  krótkożyją- 
cych.  Izotop  technetu  MmTc  otrzymuje  się  np.  wymywając  roz- 
tworem chlorku  sodu  izotop  molibdenu  MMo  osadzony  na  ko- 
lumnie szklanej  z tlenkiem  glinu.  Proces  ten  można  powtarzać 
co  ok.  24  h aż  do  spadku  aktywności  "Mo 


strumień  elektronów.  Strumień  ten,  zwielokrotniony 
w fotopowielaczu,  tworzy  na  wyjściu  prąd  elektryczny 
w postaci  impulsów  przekazywanych  dalej  do  ukła- 
dów wzmacniających,  kształtujących  i liczących. 


układ  pomiarowy 

. 


dynody 


foton  scyntylacyjny 
[kryształ  scyntylacyjny  NaJ  (Tl) 

kolimator  z ołowiu 


promieniowanie  Y 
źródło  radioaktywne 


Rys.  12.  Schemat  sondy  scyntylacyjnej 
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Liczniki  scyntylacyjne  mają  największą  ze  wszy- 
stkich typów  detektorów  wydajność  liczenia  promieni 
gamma;  ich  kształty  i rozmiary  mogą  być  różne  — 
od  wąskich  sond,  średnicy  ułamka  centymetra,  do 
wielkich  detektorów  średnicy  kilkudziesięciu  centy- 
metrów. 

metody  in  vivo  Metody  pomiarowe  stosowane  w medycynie  dzielą 
i in  vitro  Sl$  na  metody  in  vivo  (w  żywym  organizmie)  i in  vitro 
(poza  organizmem,  w probówce).  Pomiary  in  vivo 
obejmują  pomiary  czynnościowe  i lokalizacyjne 
(scyntygrafia).  Obecną  tendencją  jest  niewątpliwie 
przechodzenie  od  metod  in  vivo  do  metod  in  vitro 
(np.  testy  radioimmunologiczne,  polegające  na  po- 
miarach pewnych  parametrów  biochemicznych  we 
krwi  z zastosowaniem  znaczników  „wbudowanych” 
w radiofarmaceutyk).  Pomiary  prowadzone  in  v/vo, 
z uwagi  na  zmienną  geometrię,  zależną  od  pacjenta, 
jak  i na  wiele  innych  trudności  związanych  z charakte- 
rem promieniowania  przechodzącego  przez  tkanki, 
są  bardziej  kłopotliwe  i mniej  dokładne.  W pomiarach 
in  vitro  próbki  krwi  czy  innych  płynów  ustrojowych, 
które  zostały  pobrane  od  pacjenta  otrzymującego 
uprzednio  radiofarmaceutyk  lub  do  których  radio- 
farmaceutyk został  podany  pozaustrojowo,  mierzy 
się  w scyntylatorze  zwanym  studniowym,  w stałych 
warunkach  geometrycznych. 

Typowym  przykładem  pomiarów  czynnościowych 
in  vivo  może  być  test  polegający  na  pomiarze  jodo- 
badanie  chwytności  tarczycy.  Tarczyca  jest  gruczołem,  który 
tarczycy  i°d  z pożywienia  „wbudowuje”  w hormon  wydzie- 
lany do  krwi  (jod  odgrywa  bardzo  ważną  rolę  w wielu 
procesach  organizmu).  Miarą  czynności  tarczycy  jest 
m.in.  ilość  jodu,  która  zostaje  wbudowana  na  jed- 
nostkę czasu.  Otóż  czynność  tę  można  określić  mie- 
rząc jaki  procent  podanego  radiofarmaceutyka  (np. 
jodek  sodu  Na131J  w ilości  ok.  4 TO5  Bq)  znajduje  się 
w tarczycy  po  upływie  np.  24  godzin  od  podania 
(rys.  13).  Stosując  inne  radiofarmaceutyki  można 
określić  działanie  nerek,  zmierzyć  szybkość  przepły- 
wu krwi  krążącej,  szybkość  produkcji  witaminy  B,* 
w szpiku  itp.  (ii.  184,  185,  187,  188  i tabl.  48). 


jod  radioaktywny 
(tabletka) 


fantom 


tarczyca 


Rys.  13.  Zasada  pomiaru  jodochwytności  tarczy.  Po  podaniu 
pacjentowi  diagnostycznej  dawki  NamJ  (w  postaci  tabletki) 
mierzy  się  liczbę  impulsów  nad  tarczycą  pacjenta  (7P)  oraz  — 
w takich  samych  warunkach  geometrycznych  — nad  próbką 
Na13lJ  o aktywności  równej  podanej,  umieszczoną  w sztucznej 
tarczycy,  tzw.  fantomie  (//).  Procent  jodochwytności  oblicza  się 
z ilorazu  7p/7/ 


scyntygrafia  Bardzo  rozległą  dziedziną  metod  określania  ra- 
radioizofo-  dioaktywności  in  vivo  jest  scyntygrafia  radioizotopo- 
powa  wa.  Umożliwia  ona  przedstawienie  rozmieszczenia 
radioizotopów  w tkankach  ustroju  w postaci  dogod- 
nej do  interpretacji  za  pomocą  wzroku  lub  kompu- 
terów. 

W diagnostyce  zadaniem  scyntygrafii  jest  wizualne 
przedstawienie  badanego  obszaru,  tj.  narządu  lub 
tkanki  patalogicznej  u pacjenta,  w celu  stwierdzenia 
zmian  patologicznych  lub  określenia  położenia,  wiel- 
kości i kształtu  tego  obszaru  oraz  względnej  ilości  wy- 
chwytanego  przez  niego  radiofarmaceutyka.  Te  ra- 
czej skomplikowane  zadania  spełniają  aparaty  scyn- 
tygraficzne; są  to  urządzenia  detekcyjno-zapisujące, 
które  przyjmują  sygnały  (w  tym  wypadku  promienio- 
wanie gamma),  przetwarzają  je,  a następnie  przedsta- 
wiają je  jako  obrazy  płaskie,  złożone  z kresek,  plamek 
lub  liczb.  Wszystkie  aparaty  scyntygraficzne  można 


podzielić  na  dwa  typy:  scyntygrafy,  zwane  inaczej 
skenerami,  oraz  scyntykamery. 

W scyntygrafie  (rys.  14)  głowica  detektora  przesuwa  scyntygrafy 
się  ruchem  meandrowym  nad  obszarem  badanym. 

Głowica  wyposażona  jest  w kolimator,  będący  so- 
czewką zbierającą  promienie  gamma  w danej  chwili 
z niewielkiego  obszaru.  Na  wyjściu  otrzymuje  się  obraz 
o różnym  zaczernieniu,  który  stanowi  rzut  płaski 
obszaru  zawierającego  radioizotop  o różnej  koncen- 
tracji (il.  187,  tabl.  48). 


kryształ  NaJ(Tl) 


Rys.  14.  Scyntygraf — ruchomy  aparat  scyntygraficzny.  Scynty- 
gram  kreskowy  otrzymuje  się  za  pomocą  pisaka  na  papierze 
umieszczonym  na  stoliku  scyntygrafu 


Rys.  15.  Scynty kamera  — nieruchomy  aparat  scyntygraficzny. 
Scyntygramy  otrzymuje  się  na  ekranie  oscyloskopu  po  opraco- 
waniu przez  komputer 
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scynty- 

kamery 


liczniki 
całego  ciała 


źródła 
otwarte 
w terapii 


zadania 

fizyka 

medycznego 


Scynty kamera  (rys.  15)  wyposażona  jest  w nieru- 
chomy detektor  (w  postaci  dużego  i płaskiego  scyn- 
tylatora), w którym  powstaje  scyntylacyjny  obraz 
rozmieszczenia  radioizotopu  w tkance.  Obraz  ten 
zostaje  elektronicznie  zanalizowany  i przedstawiony 
na  ekranie  oscyloskopu  (il.  188,  tabl.  48). 

Przykładowo  na  il.  184  (tabl.  48)  podane  są  dwa 
scyntygramy:  jeden  — fantomu  tarczycy  po  podaniu 
Na  i3ij  — wykonany  scyntygrafem,  drugi  — po  po- 
daniu ®9mTc  — wykonany  scyntykamerą. 

Ze  stosowaniem  komputerów  do  ilościowej  oceny 
scyntygramów  i z dążeniem  do  rejestracji  przebiega- 
jącego w czasie  procesu  rozchodzenia  się  znaczników 
w ciele  wiąże  się  w pewnym  stopniu  inna  ważna  meto- 
da badań  radioizotopowych  in  vivo,  która  polega  na 
stosowaniu  liczników  całego  ciała.  Są  to  niezwykle 
czułe  mierniki  wykrywające  znikome  ilości  radio- 
izotopów w ciele.  Znajdują  one  zastosowanie  w ochro- 
nie przed  promieniowaniem  (określanie  wewnętrznych 
skażeń  promieniotwórczych)  oraz  w badaniu  niektó- 
rych długotrwałych  przemian  w organizmie. 

Zastosowanie  terapeutyczne  radioizotopów  jako 
źródeł  otwartych  nie  jest  tak  częste  jak  zastosowanie 
diagnostyczne;  niektóre  metody  podane  są  w tabeli. 
Warto  tu  wspomnieć  przykładowo  o metodzie  bez- 
krwawej operacji  tarczycy  za  pomocą  podawania 
doustnie  jodku  sodu  Na  131 J w ilości  (40-80)  • 106  Bq. 
Radiofarmaceutyk  ten  zostaje  wychwycony  przez  tar- 
czycę i w tak  dużej  ilości  (1000  razy  większej  od 
ilości  podawanej  diagnostycznie)  powoduje  znisz- 
czenie nadmiernie  rozrośniętej  tkanki  tarczycy  w cho- 
robie Gravesa-Basedowa. 

Zakres  pracy  fizyka  medycznego  w medycynie 
nuklearnej  jest  szeroki.  Zajmuje  się  on  kontrolą  bez- 
pieczeństwa i higieny  pracy,  co  ma  szczególne  zna- 
czenie z uwagi  na  pracę  z otwartymi  źródłami  pro- 
mieniowania oraz  stosowanie  krótkożyjących  ra- 
dioizotopów. Otrzymywanie  tych  izotopów  z gene- 
ratorów wymaga  pomiaru  ich  aktywności,  dozowania 
i podawania  ich  w warunkach  sterylnych  i nie  powo- 
dujących reakcji  ubocznych.  Poza  tym  konieczna  jes 
współpraca  fizyka  medycznego  z lekarzem  przy  opra- 
cowywaniu i prowadzeniu  pomiarów  in  vivo  i in  vitro. 
Szczególnie  pomiary  in  vivo  wymagają  starannego 
wzorcowania.  Rozwój  metod  nowoczesnej  scynty- 
grafii (kilka  tysięcy  prac  publikowanych  rocznie  na 
całym  świecie)  zależy  również  w dużej  mierze  od 
współpracy  lekarzy  i fizyków  medycznych. 

Na  zakończenie  podkreślimy  raz  jeszcze,  że  obecna 
tendencja  rozwojowa  w dziedzinie  zastosowania 
promieniowania  jonizującego  w medycynie  polega  na 
zmniejszaniu  aktywności  substancji  podawanych  pac- 
jentowi w celach  diagnostycznych,  a nawet  na  prze- 
chodzeniu do  badań  stosujących  radioizotopy  poza- 
ustrojowo,  z drugiej  zaś  strony  — na  dalszym  roz- 
woju potężnych  urządzeń  terapeutycznych  wykorzy- 
stujących promieniowanie  jonizujące,  a także  zasto- 
sowaniu innych  niż  wymienione  w artykule  źródeł 
promieniowania. 


Promieniowanie  niejonizujące 
w medycynie 


Jak  wspomniano  na  wstępie,  dział  fizyki  medycznej 
obejmujący  dziedziny  zastosowania  promieniowania 
niejonizującego  staje  się  mniej  więcej  od  10  lat  kon- 
kurentem działu  promieniowania  jonizującego.  Z jed- 
nej strony  jest  to  wynikiem  nowych  odkryć  fizyki 
i nowych  rozwiązań  techniki,  z drugiej  zaś  — tenden- 
cji (w  diagnostyce  medycznej)  do  stosowania  metod 
jak  najmniej  szkodliwych  dla  pacjenta.  Tak  więc 
znaczenia  nabierają  metody  stosujące  promieniowanie 
laserowe,  promieniowanie  podczerwone  (termografia) 
oraz  fale  ultradźwiękowe  (->  Badanie  ośrodków  za 
pomocą  ultradźwięków). 
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Promieniowanie  laserowe 

Promieniowanie  laserowe  charakteryzuje  wysoki  sto- 
pień spójności  i monochromatyczności ; można 
je  wytwarzać  w postaci  silnie  skolimowanych  wiązek 
o średnicy  naw'et  rzędu  długości  fali  tego  promienio- 
wania. Ta  druga  cecha  pozwala  na  ogromne  zwięk- 
szenie gęstości  mocy  wiązki,  co  z kolei  daje  możli- 
wość skupienia  dużych  ilości  energii  na  minimalnym 
obszarze.  Szczególne  znaczenie  mają  w biomedycynie 
lasery  molekularne  ze  względu  na  dużą  wydajność, 
niski  koszt  wytwarzania  i niewielkie  rozmiary.  Po- 
nadto promieniowanie  lasera  molekularnego  przypa- 
da na  część  podczerwoną  widma,  która  jest  silnie 
pochłaniana  przez  tkankę. 

Lasery  wykorzystuje  się  obecnie  w medycynie  do 
trzech  zasadniczych  celów:  w terapii  — do  niszczenia 
tkanki  metodą  „cięcia”  lub  „odparowyvyania”  (bez- 
krwawa chirurgia),  w diagnostyce  — jako  źródło 
oświetlające  oraz  do  celów  badawczych  w biomedy- 
cynie. 


Terapeutyczne  i diagnostyczne  zastosowania  laserów 
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Ogólnie  biorąc,  wiązka  promieniowania  laserowego 
oddziałuje  na  tkankę  Jak  to  przedstawiono  na  rys.  16. 
Wiele  efektów  występujących  przy  odbiciu  i rozpro- 
szeniu nie  ma  dla  nas  większego  znaczenia,  najważ- 
niejsze jest  termiczne  oddziaływanie  promieniowania 
na  tkankę,  zasadniczo  związane  z pochłanianiem  (nie 


wiązka  padająca  z lasera 


Rys.  16.  Schemat  oddziaływania  wiązki  laserowej  z tkanką 

należy  jednak  zapominać,  że  promieniowanie  odbite 
lub  rozproszone  może  powodować  uszkodzenie  tkan- 
ki). Oddziaływanie  termiczne  zależy  przede  wszystkim 


zalety  pro- 
mieniowania 
fiaserewego 


lasery  w 
medycynie 


od  gęstości  mocy  promieniowania.  Po  przekroczeniu 
pewnej  wartości  gęstości  występuje  zjawisko  odparo- 
wywania tkanki  na  obszarze,  na  który  pada  wiązka 
promieniowania.  Warto  podać,  że  do  odparowania 
1 g tkanki,  której  gęstość  jest  w przybliżeniu  równa 
gęstości  wody,  potrzeba  energii  ok.  2000  J.  Najtrud- 
niejszą sprawą  z praktycznego  punktu  widzenia  jest 
dobranie  odpowiednich  ilości  energii.  Przy  zbyt  dużej 
gęstości  mocy  mogą  powstawać  małe  eksplozje, 
utrudniające  stosowanie  lasera  do  cięcia  tkanek,  przy 
zbyt  małej  — mogą  wystąpić  dodatkowe  komplikacje, 
laser  jako  Ostra  wiązka  laserowa  stosowana  jako  skalpel 
skalpel  chirurgiczny  umożliwia  przeprowadzanie  czystych 
cięć  w'  tkankach,  a przez  przypalanie  rany  — zmniej- 
sza krwawienie.  Takich  bezkrwawych  zabiegów  moż- 
na dokonywać  na  narządach  silnie  ukrwionych,  jak 
wątroba,  płuca  czy  mózg.  Czyni  się  również  próby 
użycia  promieni  laserowych  do  usuwania  próchnicy 
zębów,  a nawet  do  plombowania  zębów.  Najbardziej 
jednak  rozpowszechnione  jest  zastosowanie  wiązki 
laserowej  w okulistyce,  a mianowicie  w mikrochirur- 
gii  ocznej  do  łączenia  (koagulacji)  odklejonej  siat- 
kówki z naczyniówką  w oku  ludzkim.  Urządzenie 

oko  lekarza 


Rys.  17.  Schemat  działania  głowicy  koagulatora  laserowego 


koagulator  służące  do  tego  zabiegu  zwie  się  koagulatorem  lasero- 
laserowy  wym,  zabieg  zaś  polega  na  tym,  że  wiązkę  laserową 
kieruje  się  przez  źrenicę  tak,  aby  soczewka  skupiła  ją 
w miejscu,  w którym  ma  powstać  koagulacja;  silny 
impuls  świetlny  wywołuje  odczyn  zapalny,  w następ- 
stwie czego  powstaje  zrost,  który  „przykleja”  siat- 
kówkę do  naczyniówki.  Koagulator  laserowy  (rys.  17 
i ii.  16,  tabl.  5)  góruje  nad  uprzednio  stosowanymi  fo- 
tokoagulatorami  krótkim  czasem  naświetlania  i małą 
średnicą  wiązki  (o  energii  10“3-10-2  J). 
technika  Technika  odparowywania  rozleglejszych  tkanek, 
„odparowy-  wymagająca  znacznie  większych  gęstości  mocy  niż 
wania"  cięcie  czy  koagulacja,  znajduje  zastosowanie  przy 
niszczeniu  tkanki  nowotworowej  przede  wszystkim 
w miejscach  na  ciele  pacjenta  dostępnych  do  bezpo- 
średniego naśw-ietlania.  Nie  można  jednakże  ustalić 
jednej  wartości  dopuszczalnej  dawki  promieniowania 
laserowego.  Istnieją  zalecenia  podające  różne  war- 
tości, zależne  od  parametrów  samych  urządzeń  la- 
serowych, ale  uważa  się  zawsze,  iż  najdelikatniejszym 
narządem  jest  oko  ludzkie.  Uznano,  że  dozwolone 
dawki  promieniowania  bezpośrednio  padającego  na 
źrenicę  oka  wahają  się  od  5-10“8  do  10~8  J/cm2, 
natomiast  dawki  promieniowania  „odbitego”  w 100% 
od  powierzchni  rozpraszającej  wahają  się  od  0,07  do 


0,9  J/cm2.  Jeśli  chodzi  o inne  organy  (skóra  itp.), 
wartości  dawek  mogą  być  znacznie  większe.  Do  na- 
promieniowania narośli  o średnicy  kilku  milimetrów 
wymagana  jest  energia  kilku  dżuli  w impulsie;  znisz- 
czenie większych  obszarów  tkanki  zdegenerowanej 
wymaga  stosowania  laserów  dających  wiązki  o energii 
do  10  000  J.  Zastosowanie  światłowodów  umożliwia 
niszczenie  tkanki  wewnątrz  organizmu. 

W niedalekiej  przyszłości  wiązka  promieniowania 
laserowego  może  znaleźć  zastosowanie  w diagno- 
styce medycznej,  a mianowicie  do  oświetlania  narzą- 
dów wewnętrznych.  Wiąże  się  to  również  z zastoso- 
waniem techniki  przesyłania  światła  za  pomocą 
światłowodów.  Nawet  holografia  powinna  znaleźć 
zastosowanie  w medycynie,  szczególnie  z chwilą  uzy- 
skania spójnych  wiązek  promieni  X.  Już  obecnie 
filtracja  holograficzna  w rentgen  od  iagn  osty  ce  po- 
prawia czytelność  zdjęć  rentgenowskich.  Czyni  się 
próby  wykorzystania  w diagnostyce  holografii  ultra- 
dźwiękowej. 

Jeszcze  inną  dziedziną  zastosowania  promienio- 
wania laserowego  jest  biomedycyna.  Promieniowanie 
to  pozwala  na  przeprowadzanie  mikrooperacji  wew- 
nątrz ...  pojedynczej  komórki. 

Nie  należy  jednakże  zapominać  o niebezpieczeń- 
stwach związanych  z użyciem  promieniowania  lase- 
rowego. Nowe  rodzaje  jego  zastosowania  będą  zatem 
wynikiem  nowych  rozwiązań  w dziedzinie  techniki 
laserowej  i prac  nad  ustaleniem  wpływu  tego  pro- 
mieniowania na  obiekty  biologiczne. 

Rola  fizyka  medycznego  polega  w tej  dziedzinie 
przede  wszystkim  na  udziale  w projektowaniu  urzą- 
dzeń, które  w diagnostyce  lub  terapeutyce  mają 
częstokroć  charakter  prototypowy,  a ponadto  na 
obsłudze  aparatury,  określaniu  warunków  bezpie- 
czeństwa pracy  itp. 


Promieniowanie  podczerwone 


Źródłem  promieniowania  podczerwonego  są  wszyst- 
kie ciała,  a m.in.  człowiek;  wykorzystano  to  w diag- 
nostyce. Zasada  działania  klasycznych  detektorów 
promieniowania  podczerwonego  polega  na  wzroście 
temperatury  odbiornika  absorbującego  promienio- 
wanie, które  nań  pada.  W nowoczesnych  detektorach 
fotoprzewodzących  lub  fotoemisyjnych  promienio- 
wanie podczerwone  przetwarzane  jest  bezpośrednio 
na  prąd  elektryczny. 

Do  otrzymywania  obrazów  przedmiotów  wysyłają- 
cych fale  podczerwone  stosuje  się  złożone  układy 
optyczne:  przetworniki  obrazu,  które  przetwarzają 
obraz  widzialny  na  ekranie  fluorescencyjnym,  oraz 
termografy,  stanowiące  detektory  przeszukujące. 

Zasada  działania  klasycznego  termografu  podana 
jest  na  rys.  18.  Promieniowanie  podczerwone  (ciepl- 
ne) badanego  obiektu,  którym  jest  np.  ciało  ludzkie. 
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Rys.  18.  Schemat  działania  termografu 
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pada  na  detektor  po  odbiciu  od  zwierciadła  nachylo- 
nego pod  kątem  45°  do  kierunku  wiązki  promienio- 
wania. Zwierciadło,  wprawione  w ruch,  „przeszukuje” 
pole  widzenia.  Sygnały  z detektora  modulują  natę- 
żenie światła  lampki,  która  oświetla  kliszę  fotogra- 
ficzną. W ten  sposób  otrzymuje  się  obraz  rozkładu 
temperatury  na  obszarze  ciała  w postaci  rozkładu 
zaczernienia  kliszy. 

AGA  Jednym  z najnowszych  termografów  jest  kamera 
kamera  AGA  Thermovision  (rys.  19).  Charakteryzuje  ją  duża 
czułość  (0,2°C),  gdyż  jako  detektora  użyto  tu  anty- 
monku  indu  chłodzonego  ciekłym  azotem;  „prze- 
szukiwania” dokonuje  się  za  pomocą  drgającego 
lustra  oraz  obracającego  się  kwarcowego  pryzmatu; 
otrzymuje  się  16  obrazów  termograficznych  na  sekun- 

naczynie  Dewara 


pryzmat  wielokątny  wirujący 


Rys.  19.  Kamera  termowizyjna  firmy  AGA 

dę,  obserwowanych  na  ekranie  monitora  (lampa 
oscyloskopowa),  fotografowanych  lub  filmowanych. 

Za  pomocą  termowizyjnej  kamery  można  rów- 
nież uzyskać  obraz  złożony  z izoterm,  tj.  krzywych 
łączących  punkty  o tej  samej  temperaturze;  ułatwia 
to  diagnozę  kliniczną. 

zastosowanie  Termograf  znajduje  szerokie  zastosowanie  w prak- 
termografii  tyce  medycznej.  Interpretacja  obrazu  otrzymanego 
w termografie  wymaga  ustalenia  związku  między 
temperaturą  normalną,  podwyższoną  lub  obniżoną 
, danej  części  ciała  a stanem  klinicznym.  Ogólnie 
biorąc,  podwyższenie  temperatury  łączy  się  ze  zwięk- 
szoną przemianą  metaboliczną,  zwiększonym  ukrwie- 
niem,  natomiast  obniżenie  temperatury  wiąże  się 
z ogólnym  oziębieniem  ciała,  napięciem  psychicznym 
lub  ...  paleniem  papierosów  (ii.  186  i 189,  tabl.  48). 

Termografia  jest  metodą  całkowicie  bezpieczną 
dla  pacjentów  i choć  dostarcza  informacji  o tempe- 
raturze tylko  powierzchni  ciała,  znajduje  coraz  szersze 
zastosowanie  w medycynie. 


Fizyka  medyczna  nieradiacyjna 

Ten  dział  fizyki,  najskromniejszy  w niniejszym  arty- 
kule, dotyczy  z jednej  strony  badań  napięć  bioelek- 
trycznych i prądów  czynnościowych  w organizmie 
żywym,  z drugiej  zaś  — zastosowań  bodźców  elek- 
trycznych w celach  terapeutycznych.  Ta  ostatnia 
dziedzina  wchodzi  jednak  tradycyjnie  w zakres  tzw. 
fizykoterapii,  która  choć  z nazwy  przypomina  fizykę 
medyczną,  niewiele  ma  z nią  wspólnego.  Fizykote- 
rapia polega  bowiem  na  zastosowaniu  w celach  leczni- 
czych lub  zapobiegawczych  naturalnych  czynników 
fizycznych  (np.  działanie  energii  mechanicznej  lub 
cieplnej,  pewnych  cech  powietrza  i wody)  oraz  czyn- 


ników fizycznych  sztucznie  wytwarzanych  przez  róż-  fizykoterapia 
nego  rodzaju  przyrządy  elektryczne.  Natomiast  ba- 
danie napięć  bioelektrycznych  stanowi  — również 
tradycyjnie  — domenę  tzw.  bioelektroniki.  Dlatego 
też  ograniczymy  się  tu  do  zasygnalizowania  niektó- 
rych problemów,  nie  wdając  się  w szersze  rozważania. 

Z fizycznego  punktu  widzenia  badanie  napięć 
bioelektrycznych  w organizmie  jest  fascynujące  za- 
równo w skali  makro  (elektrokardiografia,  elektro- 
encefalografia), jak  i mikro  (zjawiska  elektryczne 
w komórce). 

Zdolność  wytwarzania  napięć  elektrycznych  jest  napięcia  bio- 
cechą  wszystkich  żywych  komórek  i tkanek.  Związana  elektryczne 
jest  z faktem  występowania  różnicy  stężenia  jonów 
potasu  i sodu  między  wnętrzem  komórki  a obszarem 
pozakomórkowym.  Ta  różnica  stężenia  jonów  pro- 
wadzi do  utworzenia  się  potencjału  zwanego  spoczyn- 
kowym. Po  przyłożeniu  bodźca  zewnętrznego  poten- 
cjał spoczynkowy  przechodzi  w potencjał  czynnościo- 
wy, przenoszony  wzdłuż  włókien  nerwowych  w myśl 
zasady  „wszystko  albo  nic”.  Takim  złożonym  obra- 
zem potencjałów  czynnościowych  jest  zapis  dobrze 
znanych  krzywych,  zwanych  elektrokardiogramami 
lub  encefalogramami.  Krzywe  te  pozwalają  lekarzowi 
na  przeprowadzenie  diagnozy  chorób  serca  (EKG) 
czy  anomalnej  czynności  mózgu  (EEG).  Ponadto 
znaczenie  kliniczne  posiada  badanie  potencjałów 
elektrycznych  mięśni  (elektromiografia)  lub  siatkówki 
oka  (elektroretinografia). 

Ogólnie  biorąc,  odbierane  napięcia  bioelektryczne 
są  bardzo  małe,  często  na  poziomie  szumów  aparatury 
i zakłóceń  sieci.  Tak  np.  napięcia  występujące  przy 
rejestracji  prądów  mózgu  wahają  się  od  0,005  do 
0,1  mV.  Dlatego  też  wymagania,  jakie  się  stawia 
bioelektrykom  konstruującym  wzmacniacze  wielo- 
kanałowe, są  bardzo  wysokie. 

Obecnie  urządzenia  elektrokardiograficzne  pracują 
w połączeniu  z aparatami  do  ciągłego  lub  okresowego 
rejestrowania  danych,  szczególnie  na  tzw.  oddziałach 
intensywnego  nadzoru.  Z kolei  do  analizy  danych 
elektroencefalograficznych,  których  interpretacja  jest 
zazwyczaj  trudna,  wprowadza  się  coraz  szerzej  kom- 
putery. 

Ciekawą  dziedziną,  w której  uczestniczą  fizycy  me-  działanie 
dyczni,  jest  coraz  bardziej  rozwijająca  się  dziedzina  pól  elektro- 
badań  skutków  biologicznego  oddziaływania  pól  magnetycz- 
elektromagnetycznych,  ze  szczególnym  uwzględnię-  nych 
niem  mikrofal.  Efekt  oddziaływania  pół  elektromag- 
netycznych ma,  jak  się  wydaje,  charakter  kumulujący. 

Szkodliwymi  źródłami  pól  mogą  być  reklamy  świetlne, 
telewizja  itp.  Źródeł  tych  nie  można  usunąć,  ale  efekt 
ich  można  ograniczyć  przez  odpowiednie  warunki 
narzucone  budownictwu  mieszkaniowemu. 

Jeżeli  chodzi  o bardziej  wymierne  i lepiej  zbadane 
oddziaływanie  mikrofal  na  tkankę,  okazuje  się,  że 
głównym  efektem  jest  działanie  cieplne,  choć  wystę- 
pują również  zjawiska,  jak  np.  aberracje  chromozo- 
malne  in  vitro  i in  vivo , które  wymagają  innego  wy- 
jaśnienia. W związku  z rozpowszechnianiem  się  sto- 
sowania mikrofal  sprawy  te  nabierają  coraz  więk- 
szego znaczenia. 

Z przedstawionego  wyżej  krótkiego  przeglądu  fizy- 
ki medycznej  widzimy,  że  ta  nowa  dziedzina  zastoso- 
wań fizyki  wyodrębnia  się  w pewnych  działach  w sa- 
modzielną specjalność  (np.  promieniowanie  jonizu- 
jące), w innych  zaś  współpracuje  z bioelektroniką, 
bioinżynierią  czy  biofizyką.  Trudno  jest  przeprowa- 
dzić jakiś  zdecydowany  podział,  a może  nawet  nie 
trzeba,  gdyż  nauka  współczesna  przestaje  być  zbio- 
rem nie  powiązanych  ze  sobą  dziedzin,  zaczyna  coraz 
bardziej  przypominać  jedną  wspólną  budowlę  opartą 
na  tych  samych  fundamentach. 
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Modelowanie  matematyczne 
procesów  biologicznych 


Dymitr  C żerna  wski  i Ewa  Skrzypczak 

Modelowanie  procesów  biologicznych  należy  do 
ważnych  i szeroko  stosowanych  metod  w naukach 
biologicznych.  Modelowanie  matematyczne  odgrywa 
tu  szczególną  rolę,  zwłaszcza  w stosunkowo  młodych 
dziedzinach:  biofizyce  i biologii  teoretycznej.  Jego 
znaczenie  oraz  związane  z nim  problemy  opiszemy 
powołując  się  na  przykład  starszej  dyscypliny  nauko- 
wej, a mianowicie  fizyki.  Zadaniem  fizyki  teoretycz- 
nej jest  formułowanie  postulatów  i praw  niesprzecz- 
nych  ze  znanymi  faktami  eksperymentalnymi  oraz 
wyciąganie  na  ich  podstawie  wniosków,  które  powinny 
być  konfrontowane  z wynikami  doświadczeń  nie  zna- 
nymi dotychczas  bądź  nie  należącymi  do  zespołu 
faktów  leżących  u podstaw  teorii.  Sformułowanie 
teorii,  a zwłaszcza  jej  skuteczne  wykorzystanie  dla 
otrzymania  wniosków,  wymaga  często  wprowadzenia 
upraszczających  założeń,  idealizujących  rzeczywistość 
fizyczną.  Takie  założenia  stanowią  punkt  wyjścia  dla 
konstrukcji  modeli  w fizyce.  Typowym,  prostym  tego 
model:  przykładem  jest  w fizyce  zagadnienie  ruchu  wahadła 
wahadło  matematycznego,  które  stanowi  model  rzeczywistego 
matema-  fizycznego  wahadła.  W modelu  pomija  się  siłę  tarcia 
tyczne  i oporu  ośrodka,  rozciągliwość  nici,  rozmiary  i kształt 
ciężarka,  zastępowanego  w modelu  przez  tzw.  punkt 
materialny.  Uproszczenia  wprowadzone  w założe- 
niach modelu  ograniczają  oczywiście  wnioski  do 
określonego  zespołu  procesów  dotyczących  badanego 
obiektu  czy  zjawiska. 

Mimo  oczywistej  niedoskonałości  modelu  w porów- 
naniu ze  ścisłą,  kompletną  teorią  jego  skonstruowa- 
nie i analiza  wzbogacają  z reguły  wiedzę  o pewnym 
zespole  zjawisk  i na  ogół  poprzedzają  następny  etap, 
którym  jest  sformułowanie  teorii  fizycznej. 

W odróżnieniu  od  fizyki  biologię  uważano  do  nie- 
dawna za  dyscyplinę  eksperymentalną,  jeżeli  nie 
opisową.  Biofizyka  natomiast  bywa  często  potocznie 
uznawana  za  tę  dziedzinę  biologii,  w której  podsta- 
wową rolę  odgrywa  zastosowanie  aparatury  i ekspery- 
mentalnych metod  fizyki  w badaniu  obiektów  biolo- 
biologia  gicznych.  W ostatnich  latach  zrodziły  się  nowe  dyscy- 
teoretyczna  pliny : biologia  teoretyczna  i biofizyka  teoretyczna. 

i biofizyka  Podstawową  funkcję  w tych  dziedzinach  pełni  mo- 
teoretyczna  delowanie  matematyczne  procesów  zachodzących 
w żywych  obiektach  lub  w ich  zespołach.  Podobnie 
jak  w fizyce,  podejście  modelowe  w biologii  wymaga 
starannego  sformułowania  założeń,  ograniczenia  roz- 
ważań do  określonego  zespołu  faktów  i zjawisk  naj- 
bardziej istotnych  dla  badanego  procesu,  wprowa- 
dzenia uproszczeń.  Następnym  krokiem  jest  analiza 
modelu  i wyciągnięcie  wniosków,  ułatwiających  zro- 
zumienie mechanizmu  procesu,  oraz  opis,  choćby 
w ogólnym  zarysie,  zachowania  się  badanego  układu 
i przebiegu  zjawiska  w czasie. 

Jednym  z podstawowych  założeń  w modelach 
i teoriach  fizycznych  jest  izolacja  rozważanego  układu 
od  wpływu  czynników  zewnętrznych.  Mówimy  wów- 
czas o układzie  zamkniętym  i odosobnionym.  W mo- 
delowym podejściu  do  badania  układów  biologicz- 
nych istotną  trudność  stanowi  fakt,  że  dopóki  roz- 
ważane obiekty  są  żywe,  dopóty  nie  mogą  stanowić 
układu  izolowanego  i zamkniętego. 

Odrębnym  zagadnieniem  utrudniającym  konstruo- 
wanie i analizę  modeli  biologicznych  jest  ogromna 
liczba  i różnorodność  procesów  zachodzących  w obiek- 
tach biologicznych.  Wybór  procesów  czy  zjawisk  naj- 
bardziej istotnych  stanowi  podstawowy  krok  przy 
konstrukcji  modelu.  Jest  to  trudne  i odpowiedzialne 
zadanie,  wymagające  znajomości  ogólnych  charakte- 
rystyk rozważanych  zjawisk  oraz  wykorzystania  od- 
powiedniego aparatu  i metod  matematycznych. 


Wspomniane  trudności  sprawiają,  że  młode  dyscy- 
pliny — biologia  i biofizyka  teoretyczna  — rozwijają 
się  wolniej  niż  fizyka  teoretyczna,  a osiągnięcia  ich 
nie  mogą  na  ogół  być  teoriami  o takim  stopniu  dosko- 
nałości i precyzji,  jakie  charakteryzują  teorie  fizyczne. 
Istotny  rozwój  biologii  i biofizyki  teoretycznej  w ostat- 
nich latach  wiąże  się  w znacznym  stopniu  z rozwojem 
eksperymentalnej  biologii  i biofizyki  oraz  z zaintere- 
sowaniem tymi  dziedzinami  matematyków  i fizyków 
teoretyków,  którzy  wnoszą  w tę  dziedzinę  znajomość 
aparatu  matematycznego  oraz  ogólnego  procesu 
przechodzenia  od  hipotez  do  modeli  i od  modeli  do 
teorii. 

Niniejszy  artykuł  przedstawia  niektóre  aspekty 
współczesnej  biologii  i biofizyki  teoretycznej  związa- 
ne z modelowaniem  matematycznym  procesów  biolo- 
gicznych jako  szczególną  metodą  modelowania. 


Klasyfikacja  modeli 

Jak  już  wspomniano  wyżej,  modelowe  podejście  do 
opisu  i analizy  jakiegoś  procesu  lub  zespołu  procesów 
wymaga  znajomości  pewnych  podstawowych  faktów, 
v ynikających  z obserwacji  i doświadczeń,  oraz  przy- 
jęcia pewnych  założeń,  które  stanowią  z reguły  jakąś 
idealizację,  a zarazem  uproszczenie  problemu.  Na- 
stępnym krokiem  jest  skonstruowanie  modelu  w po-  konstru- 
staci  rzeczywistego  układu  fizycznego,  poddającego  owanie 
się  bezpośredniej  lub  pośredniej  obserwacji,  bądź  modelu 
w postaci  układu  równań  matematycznych.  Analiza 
działania  układu  fizycznego  lub  właściwości  układu 
równań  prowadzi  następnie  do  wniosków. 

Modele  stosowane  obecnie  w biologii  i biofizyce 
możemy  podzielić  (pamiętając  jednak,  że  żadna  klasy- 
fikacja nie  jest  ścisła  i doskonała)  na  modele  fizyczne 
(w  szczególności  analogowe),  matematyczne  (dyna- 
miczne) i statystyczne. 


Modele  fizyczne 

Modele  fizyczne  są  to  układy  fizyczne  zawierające 
elementy  mechaniczne,  hydrauliczne,  elektryczne  lub 
elektroniczne,  akustyczne  czy  optyczne,  umożliwia- 
jące imitowanie  określonych  procesów  biologicznych 
przez  procesy  fizyczne,  które  jest  łatwiej  obserwować 
i analizować.  Pozwala  to  na  wyciąganie  wniosków 
o właściwościach  procesów  i ich  przebiegu. 

Ilustrację  modelu  fizycznego  mogą  stanowić  mode- 
le, w których  przepływ  cieczy  w odpowiednio  dobra- 
nym układzie  naczyń  i rurek  imituje  obieg  krwi, 
powietrza  czy  innych  substancji  w żywym  organizmie 
lub  w jego  części.  Wprowadzenie  do  układu  dodat- 
kowych elementów,  takich  jak  błony  półprzewodzące, 
wymiana,  dopływ,  czy  odpływ  płynu  z układu  itp., 
umożliwia  uwzględnienie  szeregu  szczegółów  właści- 
wych modelowanemu  zjawisku. 

Innym  przykładem  modelu  fizycznego  jest  klasycz-  model 
ny  model  Lilliego,  imitujący  rozchodzenie  się  impulsu  Lilliego 
wzdłuż  włókna  nerwowego  (aksonu).  Podstawowym 
elementem  modelu  jest  żelazny  drut  umieszczony 
w roztworze  kwasu  azotowego.  W tych  warunkach 
powierzchnia  drutu  pokrywa  się  szybko  warstwą 
tlenku  żelaza.  Do  układu  doprowadzamy  z zewnętrz- 
nego źródła  impuls  elektryczny.  Wzdłuż  drutu  zaczy- 
na się  rozchodzić  sygnał  elektryczny,  któremu  towa- 
rzyszy chwilowa  pozbawienie  kolejnych  odcinków 
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drutu  warstwy  tlenku  żelaza.  Na  podstawie  obserwacji 
obszaru  znikania  tej  warstwy  i pomiarów  przeprowa- 
dzonych przy  pomocy  odpowiednich  układów  elek- 
trycznych można  ocenić  prędkość  rozchodzenia  się 
sygnałów  wzdłuż  drutu  oraz  kształt  impulsu.  Stwier- 
dzono, że  sygnał  taki  powstaje  i rozchodzi  się,  jeżeli 
wielkość  pierwotna  impulsu  przekracza  pewną  war- 
tość progową,  oraz  że  kształt  powstałego  sygnału  nie 
zależy  od  wielkości  pierwotnego  impulsu.  Model  ten 
umożliwia  jakościową  imitację  rzeczywistego  prze- 
biegu zjawiska  rozchodzenia  się  sygnałów  wzdłuż 
włókien  nerwowych. 

modele  Często  do  badania  procesów  biologicznych, 
analogowe  a zwłaszcza  ich  dynamiki,  stosuje  się  modele  analo- 
gowe. Zasadą  konstruowania  modelu  analogowego 
jest  zastąpienie  układu  rzeczywistego  przez  układ 
innego  rodzaju,  opisywany  takimi  samymi  zależnoś- 
ciami matematycznymi  jak  układ  modelowany  i mają- 
cy parametry  wzajemnie  proporcjonalne  — niezależ- 
nie od  ich  fizycznej  natury.  Modelami  analogowymi 
mogą  być  układy  elektroniczne,  hydrauliczne, 
modei  Dla  stosowania  modeli  tego  rodzaju  wystarcza  nie- 
pracy  kiedy  tylko  jakościowa  znajomość  analizowanego 
serca  procesu;  ścisłe  formułowanie  związków  matematycz- 
nych nie  jest  wówczas  niezbędne. 

Przykładem  takiego  modelu  analogowego  jest  kla- 
syczny już  model  pracy  serca  zaproponowany  przez 
Van  der  Pola  (rys.  1).  Składał  się  on  z lampki  neono- 
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Rys.  1.  Modę!  pracy  serca  van  der  Pola:  a)  analogie  między  pod- 
układami  aparatury  i modelowanego  serca  (IV  węzeł  zatokowy, 
P przedsionek,  K komora  serca,  R układ  opóźniający),  b)  kom- 
pletny układ  elektryczny,  c)  sztuczny  elektrokardiogram  otrzy- 
many za  pomocą  układu  elektrycznego  dla  przypadku  fizjolo- 
gicznego (/)  i patologicznego  (2) 


wej,  zapewniającej  oscylacyjny  przebieg  zjawiska, 
oraz  kondensatora  i oporu  elektrycznego,  imitującego 
działanie  węzła  zatokowego.  Prosty  ten  model  poz- 
walał imitować  procesy  związane  z biciem  serca 
zarówno  w przypadkach  fizjologicznych,  jak  i patolo- 
gicznych (arytmia)  — w zależności  od  warunków 
pracy  (w  szczególności  oporu  elektrycznego  w ukła- 
dzie analogowym).  Opisanemu  tu  modelowi,  opraco- 
wanemu ponad  40  lat  temu,  poświęcamy  więcej 
miejsca,  aby  podkreślić,  że  bardzo  proste  założenia 
matematyczne  oraz  dość  prymitywna  aparatura  mogą 
niekiedy  odtwarzać  złożone  procesy  biologiczne. 

Odpowiednio  skonstruowane  maszyny  analogowe  maszyny 
umożliwiają  bezpośrednią  obserwację  (na  ekranie  analogowe 
oscyloskopu)  przebiegów  czasowych  interesujących 
nas  zmiennych  oraz  zależności  tych  przebiegów  od 
parametrów  układu  i od  założeń  stanowiących  punkt 
wyjścia  dla  modelowania  badanego  procesu.  Otwiera 
to  szerokie  możliwości  zarówno  w zakresie  sprawdza- 
nia przyjętych  założeń  początkowych,  jak  i szczegóło- 
wego opisu  przebiegu  badanych  zjawisk,  a nawet 
umożliwia  przewidywanie  faktów  trudnych  lub  wręcz 
niedostępnych  bezpośredniej  obserwacji  w realnych 
procesach  biologicznych. 


Modele  matematyczne 

Modelem  matematycznym  badanego  procesu  bądź 
zespołu  obserwacji  dotyczących  przejawów  jakiegoś 
zjawiska  nazywamy  układ  związków  matematycznych, 
wiążących  ta  sobą  te  zmienne  (wielkości  mierzone  czy 
— ogólniej  — stanowiące  przedmiot  zainteresowania), 
wartości  parametrów  oraz  czas  — jeżeli  rozważany 
model  dotyczy  dynamiki  procesu,  tzn.  przebiegu 
analizowanych  procesów  w czasie.  Zmiennymi,  wy- 
stępującymi w modelu,  mogą  być  np.  stężenia  sub- 
stancji biorących  udział  w reakcjach  biochemicznych, 
liczebności  populacji,  wielkości  charakteryzujące  ba- 
dane obiekty,  takie  jak  ich  rozmiary,  prędkości  itp. 

Modele  statyczne  mają  najczęściej  postać  jednego  modele 
(lub  więcej)  związku  algebraicznego.  Kształt  matema-  statyczne 
tyczny  takiego  związku  może  wynikać  z przesłanek 
a priori,  wynikających  z ogólnej  znajomości  badanych 
zjawisk,  bądź  z danych  doświadczalnych,  do  których 
dopasowuje  się  postać  związków  matematycznych. 

Jeżeli  — dla  ilustracji  — ograniczymy  się  do  najprost- 
szego przypadku  jednego  związku  między  dwiema 
zmiennymi,  przy  czym  przypuszczamy,  że  związek  ten 
jest  liniowy,  to  modelem  matematycznym  procesu 
nazwiemy  równanie  o postaci  y = ax+b , gdzie  x i y 
są  zmiennymi,  zaś  a i b — parametrami  modelu.  Za- 
daniem, jakie  sobie  wówczas  stawiamy,  jest:  a)  zna- 
lezienie odpowiedzi  na  pytanie,  czy  dane  doświad- 
czalne (zbiór  par  wartości  x i y wyznaczonych  ze  zna- 
ną dokładnością)  spełniają  powyższy  związek  linio- 
wy, oraz  b)  wyznaczenie  wartości  parametrów  a i b 
i ich  błędów.  Rozwinięte  są  metody  statystyczne 
umożliwiające  wykonanie  tych  zadań  oraz  określenie 
tzw.  poziomu  ufności  uzyskanych  wyników.  Jeżeli 
zgodność  modelu  z danymi  doświadczalnymi  okaże 
się  niezadowalająca,  należy  testowany  model  (linio- 
we równanie  w naszym  przykładzie)  odrzucić  lub 
zmodyfikować.  Taka  modyfikacja  polega  zazwyczaj 
na  wzbogaceniu  postaci  modelu  o człony  zawierające 
wyższe  potęgi  x lub  y,  bądź  o człon  zawierający  inną, 
pierwotnie  pominiętą,  zmienną  (z).  Zastosowanie  od- 
powiednich metod  statystycznych  pozwala  następnie 
na  znalezienie  najlepiej  pasującego  do  danego  zespołu 
parametrów  (a,  b , ...)  testowanej  postaci  modelu. 
Interpretacja  tak  otrzymanego  i akceptowanego  mo- 
delu prowadzi  do  lepszego  opisu  i zrozumienia  bada- 
nych zjawisk.  Ponadto  znajomość  związku  (czy 
związków)  między  zmiennymi  występującymi  w mo- 
delu umożliwia  następnie  wykorzystywanie  modelu 
do  znajdowania  wartości  jednej  zmiennej,  gdy  znamy 
pozostałe  — bez  przeprowadzania  za  każdym  razem 
badań  eksperymentalnych. 
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Modele  dynamiczne,  których  przedmiotem  jest 
analiza  przebiegu  badanego  procesu  w czasie,  mają 
zazwyczaj  postać  układu  złożonego  z jednego  łub  wię- 
cej równań  różniczkowych  zawierających  pochodne 
zmiennych  względem  czasu. 

Analizy  takiego  modelu  matematycznego  można 
dokonać  bądź  stosując  teorię  równań  różniczkowych 
(opis  tego  podejścia  i przykłady  jego  zastosowania 
przedstawimy  w rozdziałach:  ,, Modele  matematycz- 
ne” i „Wybrane  przykłady  modeli  matematycznych 
w zagadnieniach  biologicznych”),  bądź  za  pomocą 
rola  analogowych  maszyn  matematycznych.  Rolą  maszy- 
maszyny  ny  analogowej  jest  rozwiązanie  układu  równań  sta- 
analogowej  nowiących  model  i znalezienie  związków  między  wiel- 
kościami dynamicznymi.  Szczególnie  ważna  jest  w tym 
wypadku  możliwość  badania  reakcji  modelowanego 
układu  na  zmiany  parametrów  układu,  charaktery- 
zujących warunki,  w jakich  działa  rzeczywisty  układ. 

Na  rys.  2 widać  zdjęcie  ekranu  oscyloskopowego 
maszyny  analogowej,  przy  użyciu  której  analizowano 
model  złożonego  zjawiska  — procesu  fotosyntezy 
u roślin.  Obraz  otrzymany  na  ekranie  przedstawia 
związek  między  zmiennymi  dynamicznymi  — w tym 
wypadku  są  to  stężenia  tzw.  lekkich  i ciężkich  cuk- 
rów biorących  udział  w reakcjach  chemicznych,  które 
leżą  u podstaw  zjawiska  fotosyntezy.  Na  osiach  po- 
ziomej i pionowej  odłożone  są  stężenia  odpowied- 
nich cukrów.  Nawet  pobieżne  spojrzenie  na  zdjęcie 
prowadzi  do  ważnego  wniosku  o oscylacyjnym  cha- 
rakterze zmian  w czasie  stężeń  lekkich  i ciężkich  cuk- 
rów, przy  czym  oscylacje  stężeń  tych  cukrów  są  wzglę- 
dem siebie  przesunięte  w fazie.  Zdjęcie  to  przedstawia 
tzw.  obraz  fazowy  badanego  układu.  Zastosowanie 
maszyny  analogowej  zastąpiło  niełatwą  w tym  wy- 
padku bezpośrednią  analizę  układu  równań  stano- 
wiących model  matematyczny  zjawiska. 

Ostatnio  w biologii  teoretycznej  badane  są  modele 
matematyczne  nie  wymagające  nawet  formułowania 
konkretnych  równań  matematycznych;  modele  tego 
teoria  rodzaju  prowadzą  z reguły  do  wniosków  jakościo- 
katastrof  wych.  Punktem  ich  wyjścia  jest  teoria  katastrof 
Thoma  R.  Thoma.  Przy  takim  podejściu  do  zagadnienia  usta- 
la się  zespół  zmiennych  i parametrów  istotnych  dla 
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badanego  zjawiska.  Zarówno  zmienne,  jak  i para- 
metry traktowane  są  na  równych  prawach  — z tym, 
że  parametrom  przypisuje  się  powolniejszą  zmienność 
w czasie  niż  zmiennym.  Zbiór  tych  wszystkich  wiel- 
kości, charakteryzujący  chwilowy  stan  układu,  sta- 
nowi zbiór  współrzędnych  punktu  w przestrzeni  wielo- 
wymiarowej. Zbiór  stanów  rozważanego  układu 
przedstawiony  jest  przez  pewną  hiperpowierzchnię 
(wielowymiarową)  w tej  przestrzeni.  Rozważania 
oparte  na  znajomości  topologii  pozwalają  na  wpro- 
wadzenie pewnej  klasyfikacji  takich  powierzchni.  Ja- 
kościowe przypisanie  badanemu  zjawisku  określo- 
nego charakteru  takiej  powierzchni  i jej  osobliwości 
geometrycznych  umożliwia  dokonanie  jakościowego 
opisu  procesów  odbywających  się  w układach  biolo- 
gicznych i wyciągnięcie  pewnych  wniosków  o właści- 
wościach tych  procesów,  jak  np.  gwałtowne  skokowe 
zmiany  jednych  zmiennych  przy  jednoczesnej  gład- 
kiej zmienności  innych.  Tego  rodzaju  modele  teore- 
tyczne bywają  stosowane  np.  do  analizy  takich  za- 
gadnień, jak  praca  serca,  działanie  neuronu,  różni- 
cowanie tkanek,  oraz  pewnych  problemów  z dziedziny 
embriologii  i ekologii. 

Bardziej  szczegółowa  dyskusja  teorii  katastrof 
w zastosowaniu  do  modelowania  procesów  biolo- 
gicznych wykracza  poza  ramy  niniejszego  artykułu. 


Modele  statystyczne 

W modelach  matematycznych  zmienne  oraz  para-  wartości 
metry  badanego  układu  są  pewnymi  wielkościami  średnie 
mającymi  charakter  wielkości  średnich  (np.  stężenie 
substancji,  liczebność  komórek  czy  populacji,  pręd- 
kość reakcji).  Operowanie  nimi  jest  uzasadnione 
wówczas,  gdy  przypadkowe  fluktuacje  w wartościach 
tych  wielkości  są  małe  w porównaniu  z samymi 
wielkościami.  Zdarza  się  jednak,  że  informacje  doty- 
czące średnich  wielkości  charakteryzujących  badane 
obiekty  i procesy  są  niedostatecznie  ścisłe,  a przy- 
padkowe fluktuacje  są  porównywalne  z samymi  wiel- 
kościami. Odpowiada  to  sytuacjom,  gdy  liczba  inte- 
resujących nas  obiektów  jest  niewielka  i pojęcie  stę- 
żenia traci  swój  ścisły  sens.  Tak  bywa  w niektórych 
zagadnieniach  ekologicznych,  kiedy  np.  liczba  osobni- 
ków na  danym  terytorium  wyraża  się  w dziesiątkach, 
a nawet  w jednostkach,  lub  przy  rozważaniu  reakcji 
biochemicznych,  gdy  liczba  cząstek  biorących  udział 
w reakcji  jest  w obrębie  jednej  komórki  niewielka. 

W tego  rodzaju  zagadnieniach  stosuje  się  modele 
statystyczne,  w których  rolę  zmiennych  odgrywają 
prawdopodobieństwa  analizowanych  zdarzeń.  Związ- 
ki między  zmiennymi  zapisuje  się  w postaci  równań 
różniczkowych  lub  równań  algebraicznych,  albo  też 
podaje  się  algorytmy,  umożliwiające  przeprowadzenie 
rachunków  modelowych  na  komputerach  metodą  modele  wy- 
Monte  Carlo.  Modele  wykorzystujące  metodę  Monte  korzystające 
Carlo  stosowane  są  np.  przy  badaniu  i analizie  zagad-  metodę 
nienia  rozwoju  i podziału  komórek  wówczas,  gdy  pro-  Monte  Carlo 
cesy  te  w znacznym  stopniu  zależą  od  przypadkowych 
czynników  otoczenia,  w wyniku  czego  okres  podziału 
i czas  trwania  kolejnych  faz  w cyklu  komórkowym 
podlegają  znacznym  fluktuacjom. 

Modele  statystyczne,  w których  się  stosuje  równa- 
nia różniczkowe,  są  w istocie  — mimo  różnic  w okreś- 
leniu zmiennych  charakteryzujących  badany  układ  — - 
podobne  do  modeli  dynamicznych,  którymi  się  zaj- 
miemy bardziej  szczegółowo  w następnym  rozdziale. 

Analiza  modelu  statystycznego  umożliwia  nie  tylko 
znalezienie  związków  między  zmiennymi  dynamicz- 
nymi modelowanego  układu,  lecz  także  ocenę  roli 
fluktuacji  i ich  wpływu  na  przebieg  zjawiska.  Szczegól- 
ne znaczenie  takiej  analizy  przejawia  się  np.  przy 
badaniu  układów  przełączeniowych  (tryggerowych), 
w których  niewielka  przypadkowa  fluktuacja  wartości 
zmiennych  czy  parametrów  może  decydować  o dal- 
szym przebiegu  dynamiki  modelowanego  procesu 
(dokładniej  w rozdziale  Modele  przełączania). 
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Modele  matematyczne 
(dynamiczne) 

Jak  już  wspomniano  wyżej,  modelem  matematycz- 
nym nazywamy  układ  związków  matematycznych 
między  zmiennymi  dynamicznymi,  współrzędnymi 
przestrzennymi,  czasem  i parametrami  układu. 

Zmienne  dynamiczne,  ich  liczba  i charakter  zależą 
od  rodzaju  analizowanego  układu.  W zagadnieniach 
biochemicznych  są  to  najczęściej  stężenia  substancji 
wchodzących  w reakcje,  w zagadnieniach  ewolucyj- 
nych i ekologicznych  — liczebności  badanych  obiek- 
tów lub  populacji.  Zależność  zmiennych  (*)  od  czasu 
(0  wyrażana  jest  w modelu  przez  pochodne  tych 
zmiennych  względem  czasu  (dx/dt).  Na  ogół  zmienne 
dynamiczne  mogą  zależeć  nie  tylko  od  czasu,  lecz 
i od  miejsca  w przestrzeni. 

Parametrami  układu  mogą  być  np.  prędkości  reak- 
cji chemicznych,'  śmiertelność  lub  przyrost  naturalny 
badanej  populacji,  wielkości  charakteryzujące  od- 
działywanie między  komórkami,  cząsteczkami  che- 
micznymi, członkami  badanych  populacji  itp.  Kon- 
kretne wartości  parametrów  często  nie  są  znane  lub 
też  zmieniają  się  w szerokim  zakresie  — w zależności 
od  warunków,  w jakich  się  znajduje  badany  układ. 

Nie  wchodząc  na  razie  w szczegóły  procedur  sto- 
sowanych przy  analizie  modelu  (poniżej),  wymienimy 
tylko  kolejne  etapy  modelowania  matematycznego. 

1.  Zebranie  dostępnych  (zaczerpniętych  z badań 
eksperymentalnych  oraz  ze  znanych  ogólnych  prawid- 
łowości) informacji  o badanym  procesie. 

2.  Podjęcie  decyzji,  jakie  zmienne  dynamiczne  oraz 
jakie  parametry  będą  rozważane  w modelu. 

3.  Sformułowanie  modelu,  tj.  związków  między 
zmiennymi  dynamicznymi,  parametrami  i czasem  oraz 
położeniem  w przestrzeni.  Zależności  od  czasu  i miej- 
sca wyraża  się  przez  pochodne  względem  czasu 
i współrzędnych  geometrycznych. 

4.  Analiza  modelu  matematycznego,  polegająca 
bądź  na 

a)  rozwiązaniu  układu  równań  różniczkowych 
i otrzymaniu  jawnej  postaci  zależności  każdej  ze 
zmiennych  od  pozostałych  zmiennych,  czasu  i miej- 
sca w przestrzeni,  bądź  na 

b)  jakościowej  analizie  właściwości  układu  dyna- 
micznego, prowadzącej  do  wniosków  o ogólnym  cha- 
rakterze wzajemnych  związków  między  zmiennymi 
i o ich  zależności  od  parametrów,  czasu  i miejsca. 

5.  Sformułowanie  wniosków  dotyczących  dyna- 
micznych charakterystyk  analizowanego  zjawiska  czy 
zespołu  zjawisk.  Wnioski  takie  mogą  np.  zawierać 
stwierdzenie  charakteru  zmienności  w czasie  po- 
szczególnych zmiennych  (np.  występowanie  oscylacji) 
lub  stwierdzenie  asymptotycznego  (po  długim  czasie) 
zachowania  się  zmiennych  (np.  dążenie  do  warto- 
ści stacjonarnych  odpowiadających  trwałym,  stabil- 
nym stanom  układu  albo  oddalenie  się  od  wartości 
stacjonarnych  odpowiadających  stanom  nietrwa- 
łym. 

Ważne  jest,  że  badając  model,  można  przeanalizo- 
wać wpływ  poszczególnych  parametrów  na  przebieg 
badanego  zjawiska,  a w szczególności  — przewidzieć 
możliwość  występowania  nagłych  zmian  jakościo- 
wych przebiegu  procesu  (przełączanie). 

6.  Porównanie  wniosków  wynikających  z analizy 
modelu  ze  znanymi  faktami  doświadczalnymi  doty- 
czącymi badanego  procesu  lub  wskazanie  możliwych 
obserwacji  i eksperymentów  umożliwiających  porów- 
nanie rzeczywistych  charakterystyk  procesu  z przewi- 
dywaniem modelu.  Po  dokonaniu  takiej  konfron- 
tacji model  i założenia  stanowiące  jego  podstawę 
mogą  być  uznane  za  prawidłowe,  oczywiście  w grani- 
cach przewidzianych  przy  wprowadzeniu  uproszczeń 
i przy  idealizacji  rzeczywistej  sytuacji. 

W następnych  paragrafach  tego  rozdziału  omówi- 
my metody  modelowania  matematycznego  układów 
dynamicznych  i wprowadzimy  podział  modeli  na 
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modele  punktowe,  modele  uwzględniające  wiek 
obiektów  oraz  modele  uwzględniające  układy  prze- 
strzennie niejednorodne. 


Modele  punktowe 

Do  najprostszych  modeli  matematycznych  należą  ta- 
kie, w których  zmienne  dynamiczne  nie  zależą  od 
współrzędnych  przestrzennych.  Takie  modele  mate- 
matyczne nazywamy  punktowymi.  Przed  sformuło- 
waniem układu  równań  stanowiących  model  mate- 
matyczny układu  niezbędne  jest  podjęcie  decyzji 
o wyborze  i liczbie  zmiennych  dynamicznych.  Jeżeli 
liczba  zmiennych  (*<)  wynosi  ny  wówczas  model 
matematyczny  badanego  zjawiska  można  zapisać 
w postaci  układu  równań  różniczkowych: 

dxi 

^ * (*i>  xt*  ■ • • » ■*«)»  (1) 

gdzie  w funkcjach  Pi  zawarte  są  parametry  charak- 
teryzujące warunki,  w jakich  zachodzą  badane  pro- 
cesy. Jeżeli  pochodne  zmiennych  dynamicznych 
względem  czasu  (dxifdt)  są  miarą  tempa  zmian  wiel- 
kości Xi  w czasie,  to  charakteryzują  one  dynamikę 
zachowania  się  tych  wielkości. 

Rozwiązanie  tego  układu  równań  w postaci  jaw- 
nych zależności  każdej  ze  zmiennych  xi  od  pozostałych 
zmiennych  i czasu  daje  obraz  zachowania  się  mode- 
lowanego układu  w czasie.  Wykażemy  niżej,  że  nie 
zawsze  taka  postać  rozwiązania  jest  niezbędna.  Często 
wystarczające  dla  opisu  modelowanego  procesu  jest 
podanie  i analiza  jego  tzw.  obrazu  fazowego  (o  czym 
niżej). 

Jeżeli  funkcje  Pi  nie  zależą  w sposób  jawny  od 
czasu,  to  układ  taki  nazywamy  autonomicznym;  w fi- 
zyce jest  to  równoważne  badaniu  układu  odosobnio- 
nego. Jeżeli  mamy  do  czynienia  z układem  znajdu- 
jącym się  w zmiennych  warunkach  zewnętrznych, 
wówczas  mówimy  o układzie  nieautonomicznym ; 
w układzie  równań  odpowiada  to  wprowadzeniu  jaw- 
nej zależności  od  czasu.  Dążenie  do  uwzględnienia 
w modelu  wszystkich  procesów  zachodzących  w ba- 
danym układzie  biologicznym  wiąże  się  nieuchronnie 
z wprowadzeniem  dużej  liczby  zmiennych  i — od- 
powiednio — dużej  liczby  równań  stanowiących 
układ.  Analiza  takiego  układu  i efektywne  wypro- 
wadzenie wniosków,  choćby  tylko  jakościowych, 
stanowi  często  zadanie  trudne,  niekiedy  wręcz  nie- 
wykonalne. Wynika  to  z trudności  matematycznych, 
a przede  wszystkim  — z niedoskonałej  znajomości 
charakterystyk  poszczególnych  procesów.  Zdarza 
się  co  prawda,  że  nie  znając  szczegółowo  jakiegoś 
procesu,  wiemy  jednak  że  jest  to  proces  bardzo  po- 
wolny w porównaniu  z innymi,  opisywanymi  przez 
pozostałe  równania  układu,  albo  odwrotnie:  wiemy, 
że  jedna  ze  zmiennych  dynamicznych  zmienia  się  bar- 
dzo szybko,  np.  oscylując  z okresem  małym  w po- 
równaniu z interwałem  czasowym  charakterystycz- 
nym dla  innych  zmiennych.  W takich  wypadkach  wol- 
nozmienne  wielkości  można  uznać  za  stałe  i trakto- 
wać jako  parametry  układu  dynamicznego.  Z drugiej 
strony  — można  przyjąć,  że  szybko  zmieniające  się 
wielkości  osiągnęły  już  swoje  wartości  stacjonarne, 
odpowiadające  chwilowym  wartościom  innych  zmien- 
nych. Umożliwia  to  związanie  tych  szybkozmiennych 
wielkości  z pozostałymi  za  pomocą  równań  algebra- 
icznych (przez  przedstawienie  tych  zmiennych  jako 
funkcji  pozostałych  zmiennych). 

W wyniku  takich  rozważań  i zastosowania  odpo- 
wiednich procedur  matematycznych  otrzymujemy 
ostateczny  układ  dynamiczny,  zawierający  tylko  te 
zmienne,  których  prędkości  zmian  w czasie  są  w przy- 
bliżeniu  tego  samego  rzędu.  Oznacza  to,  że  jeżeli 
analizujemy  zjawisko  o pewnych  określonych  cha- 
rakterystykach czasowych,  nieistotne  są  procesy 
przebiegające  znacznie  wolniej  lub  znacznie  szybciej. 


najprostsze 

modele 

dynamiczne 


układ 

autono- 

miczny 


Model  matematyczny  składa  się  zatem  w rezultacie 
najczęściej  z niewielu  równań  różniczkowych,  często 
tylko  z dwóch  lub  trzech. 

najprostszy  Zajmiemy  się  najprostszym  rodzajem  układu  dy- 
ukiad  namicznego,  złożonym  tylko  z dwóch  równań  róż- 
dynamiczny  niczkowych,  które  zapiszemy  w postaci: 

dxjdt  = P(x,y)y 

dyjdt  = Q(x,y).  ® 

Funkcje  P(x,  y ) i Q(xy  y)  stanowią  więc  miarę  tempa 
zmian  zmiennych  dynamicznych  x i y.  Odpowiednio 
równania  te  dzielimy  stronami  przez  siebie,  elimi- 
nujemy czas  z układu  równań  (2)  i otrzymujemy: 

dyjdx  = Q(x,  y)lP (x ,y)  (3) 

pod  warunkiem,  że  procedura  ta  nie  dotyczy  punk- 
tów, w których  funkcja  P(xy  y)  osiąga  wartość  zero. 
Otrzymane  w ten  sposób  równanie  różniczkowe,  wią- 
żące zmienne  dynamiczne  x i y,  można  niekiedy  roz- 
wiązać analitycznie,  tj.  można  znaleźć  jawną  postać 
związku  y = /(*),  który  spełnia  równanie  (3).  Ele- 
mentarna znajomość  rachunku  różniczkowego  i cał- 
kowego prow-adzi  do  wniosku,  że  rozwiązanie  zapisa- 
ne w postaci  y = f(x)  nie  jest  jedyne;  ogólne  rozwią- 
zanie równania  (3)  ma  postać: 

y — /(*  ♦ C) , (4) 

gdzie  C jest  tzw.  stałą  całkowania.  Wartość  stałej 
całkowania  C zależy  od  wartości  początkowych, 
tj.  wartości  zmiennych  x i y w określonej  chwili, 
którą  możemy  nazwać  chwilą  początkową,  / = 0. 
W ten  sposób  rozwiązaniem  równania  (3)  jest  cała 
rodzina  związków  między  zmiennymi  x i y;  poszcze- 
gólne funkcje,  wchodzące  w skład  tej  rodziny  różnią 
się  między  sobą  wartościami  stałej  C.  Związek  między 
zmiennymi  x i y można  przedstawić  jako  wykresy 
w układzie  współrzędnych  x i y.  Rysunek  3 przedsta- 
wia przykład  takiej  rodziny  krzywych,  przy  czym 
każdej  krzywej  odpowiada  inna  określona  wartość 
stałej  C.  Taką  płaszczyznę  (przestrzeń  trój-  lub  więcej 
wymiarową,  jeżeli  mamy  do  czynienia  z więcej  niż 
płaszczyzna  dwiema  zmiennymi)  nazywamy  płaszczyzną  fazową, 
fazowa  a wykresy  funkcji  (4)  nazywamy  trajektoriami  układu 
w przestrzeni  fazowej.  Trajektorie  są  krzywymi 
zorientowanymi,  tzn.  zaopatrzonymi  w strzałki  okre- 
ślające zwrot  ruchu  po  trajektorii.  Przechodzenie  od 
punktu  do  punktu  wzdłuż  określonej  trajektorii  od- 


powiada zmianom  stanu  modelowanego  układu 
w czasie,  jeżeli  układ  wystartował  w chwili  początko- 
wej ze  stanu,  który  odpowiada  punktowi  znajdują- 
cemu się  na  tej  trajektorii,  a warunki  (parametry 
układu  bądź  wpływy  czynników  zewnętrznych)  nie 
uległy  w'  tym  czasie  zmianie.  Zbiór  trajektorii  nosi  obraz  fazowy 
nazwę  obrazu  fazowego  modelu  (2).  Każdemu  punk-  modelu 
towi  przestrzeni  fazowej  odpowiada  określona  para 
wartości  zmiennych  dynamicznych  x i yy  a zatem  — 
określony  stan  badanego  układu.  Należy  przy  tym 
pamiętać,  że  współrzędne  y i x nie  mają  nic  wspól- 
nego ze  współrzędnymi  przestrzennymi.  Można  wy- 
kazać, że  przez  każdy  punkt  płaszczyzny  fazowej, 
z wyjątkiem  punktów,  w których  P(xyy)  = 0 
i Q , y)  — 0 (takie  punkty  nazywamy  punktami 
osobliwymi)  przechodzi  tylko  jedna  trajektorią. 

Znalezienie  punktów  osobliwych  i zbadanie  ich  cha- 
rakteru (o  czym  niżej)  stanowi  istotny  element  bada- 
nia układu  dynamicznego. 

Jeżeli  analityczne  rozwiązanie  równania  (3)  wiąże 
się  ze  znacznymi  trudnościami  matematycznymi,  to 
zawsze  jest  możliwe  skonstruowanie  obrazu  fazo- 
wego badanego  układu  przy  pomocy  rachunków 
numerycznych.  Wykorzystuje  się  wówczas  fakt,  że 
wartość  dyjdx  — Q(xy  y)}P(xy  y)  odpowiadająca  każdej 
parze  wartości  x i y daje  kierunek  stycznej  do  trajek- 
torii przechodzącej  przez  punkt  (xy  y).  Jednak  nawet 
bez  szczegółowych  rachunków  numerycznych  można 
wykorzystać  znajomość  funkcji  P(x,y)  i Q(xy  y)  dla 
znalezienia  ogólnych  właściwości  obrazu  fazowego 
badanego  układu.  Równanie  jP(x,y)  — 0 określa  izokliny 
pewną  krzywą  zwaną  izokliną  stycznych  pionowych; 
krzywa  ta  jest  miejscem  geometrycznym  wszystkich 
punktów,  w których  styczne  do  trajektorii  układu 
dynamicznego  mają  kierunek  pionowy.  Analogicznie 
równanie  Q(xyy)  — 0 określa  izokligę  stycznych 
poziomych.  Krzywe  te  nazywamy  głównymi  izokli- 
nami  obrazu  fazowego  badanego  układu  dynamicz- 
nego (zob.  np.  rys.  14).  Punkt  przecięcia  głównych  izo- 
klin  nazywamy  punktem  osobliwym  (stacjonarnym). 

W stanie  odpowiadającym  temu  punktowi  pochod- 
ne dxjdt  i dyjdt  równają  się  zeru,  a zatem  zmienne 
x i y są  stałe,  nie  ulegają  zmianom.  Stan  taki  można 
więc  nazwać  stanem  równowagi,  przy  czym  — po- 
dobnie jak  w zagadnieniach  statyki  w mechanice  — 
stan  równowagi  może  być  trwały  (stabilny)  lub  nie- 
trwały (niestabilny).  Układ  wyprowadzony  z tego 
stanu  (np.  przez  działanie  czynników  zewnętrznych) 
lub  znajdujący  się  w chwili  początkowej  w pobliżu 
tego  stanu  dąży  odpowiednio  po  odpowiedniej  trajek- 
torii do  stanu  równowagi  trwałej  lub  oddala  się  coraz 
bardziej  od  stanu  równowagi  nietrwałej.  Analiza  cha-  przykłady 
rakteru  punktów  osobliwych  na  obrazie  fazowym  mo-  obrazów 
delowanego  układu  stanowi  zatem  ważną  informację  fazowych 
o dynamice  układu.  Nie  wchodząc  w szczegóły  mate- 
matycznych rozważań  prowadzących  do  otrzymania 
obrazu  fazowego,  podamy  poniżej  kilka  przykładów 
różniących  się  między  sobą  charakterem  punktów 
osobliwych : 

a)  Rysunek  4 przedstawia  przykład  obrazu  fazo- 
wego, którego  punkt  osobliwy  jest  węzłem  trwałym 
(na  rysunku  naszkicowano  kilka  spośród  nieskończe- 
nie wielu  trajektorii  fazowych);  wszystkie  trajektorie 
zbiegają  się  w miarę  upływu  czasu  do  węzła  trwałego, 
niezależnie  od  stanu  początkowego  układu.  Stanowi 
to  ważną  informację  w wypadku  modelowania  kon- 
kretnego układu.  Stan  odpowiadający  węzłowi  sta- 
bilnemu jest  stanem  równowagi  trwałej  odpowiada- 
jącym określonym  wartościom  zmiennych  dyna- 
micznych x i y. 

b)  Rysunek  5 przedstawia  przykład  obrazu  fazo- 
wego, którego  punktem  osobliwym  jest  węzeł  nie- 
trwały. Z biegiem  czasu  obydwie  zmienne  dynamiczne 
oddalają  się  od  tego  punktu,  odpowiadającego  stano- 
wi równowagi  nietrwałej.  Stan  układu  odpowiadający 
punktowi  osobliwemu  jest  nietrwały,  co  oznacza,  że 
dowolnie  mała,  przypadkowa  fluktuacja  wyprowadza- 
jąca układ  z tego  stanu  prowadzi  do  zmian  nieod- 
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wracalnych  — punkt  stanowiący  obraz  stanu  modelo- 
wanego układu  oddala  się  po  odpowiedniej  trajektorii 
do  nieskończoności  lub  do  innego,  trwałego  punktu 
osobliwego,  jeżeli  taki  istnieje  na  płaszczyźnie  fazo- 
wej. 

c)  Rysunek  6 przedstawia  przykład  obrazu  fazowe- 
go, którego  punktem  osobliwym  jest  siodło.  Liniami 


pogrubionymi  zaznaczono  separatrysy  układu.  Łatwo 
zauważyć,  że  siodło  jest  nietrwałym  punktem  osobli- 
wym. Przez  analogię  do  poprzednich  przykładów 
(a  i b)  można  prześledzić  losy  punktu  — obrazu  na 
płaszczyźnie  fazowej  — w zależności  od  stanu  po- 
czątkowego układu. 

d)  Na  rys.  7a  podano  przykład  obrazu  fazowego, 
którego  punktem  osobliwym  jest  tzw.  środek.  Przy 
omawianiu  zastosowania  maszyn  analogowych  w pa- 
ragrafie poświęconym  modelom  matematycznym 
pokazano  obraz  fazowy  tego  typu  otrzymany  na 
ekranie  oscyloskopu  maszyny  analogowej.  Warto 
zauważyć,  że  zmienne  dynamiczne  takiego  układu 
oscylują  w czasie,  periodycznie  powracając  do  punktu 
początkowego,  gdy  odbędą  pełny  obieg  po  cyklu 
zamkniętym.  Jeżeli  układ  modelowany  zostanie  wy- 
prowadzony z tego  cyklu  (np.  przez  zwiększenie  war- 
tości zmiennej  x — czy  to  przez  doprowadzenie  z zew- 
nątrz pewnej  ilości  substancji,  jeżeli  x jest  jej  stęże- 
niem, czy  też  przez  doprowadzenie  osobników  okre- 
ślonego gatunku,  jeżeli  x jest  liczebnością  jego  popu- 
lacji), to  punkt  na  płaszczyźnie  fazowej  rozpocznie 
ruch  po  nowej  zamkniętej  trajektorii.  O takich  tra- 
jektoriach mówimy,  że  są  nietrwale  (o  czym  w roz- 
dziale Modele  oscylacyjne).  Przy  modelowaniu  pro- 
cesów spotykamy  się  niekiedy  z tzw.  cyklami  gra- 
nicznymi. Odpowiada  to  sytuacji,  gdy  trajektorie 
układu  wychodzące  z jakiegoś  punktu  osobliwego, 
np.  niestabilnego  węzła,  dążą  asymptotycznie,  po 
dostatecznie  długim  czasie,  do  cyklu  zamkniętego, 
a po  osiągnięciu  go  obiegają  taki  cykl,  co  odpowiada 
trwałym  oscylacjom  zmiennych  x i y.  Sytuację  taką 
przedstawia  schematycznie  rys.  7b. 
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c)  Na  rys.  8a,  b podano  przykłady  obrazów  fazo- 
wych układów,  których  punktami  osobliwymi  są  od- 
powiednio ognisko  trwałe  i ognisko  nietrwałe.  Mamy 
tu  do  czynienia  z oscylacjami  obydwu  zmiennych. 
Oscylacje  te  nie  są  jednak  periodyczne,  układ  nie 
powraca  do  stanu  początkowego,  lecz  dąży  z biegiem 
czasu  do  punktu  trwałego  (a)  lub  do  nieskończoności 
(b)  czy  innych  punktów  osobliwych.  Podane  przykłady 
stanowią  ilustrację  niektórych  typów  obrazów  fazo- 
wych. Znajomość  funkcji  P(x,y)  i Q(x,  y)  oraz  od- 
powiedniego aparatu  matematycznego  umożliwia 
przeprowadzenie  tzw.  jakościowej  analizy  układu  dy- 
namicznego, stwierdzenie,  czy  istnieje  i jaki  ma  cha- 
rakter punkt  osobliwy,  oraz  naszkicowanie  przebiegu 
trajektorii  fazowych,  izoklin  układu.  Nawet  gdy 
mamy  do  czynienia  ze  złożonym  układem  dynamicz- 
nym, można  — nie  poszukując  jego  pełnego,  ścisłego 
rozwiązania  — uzyskać  bogate  informacje  o bada- 
nym układzie  przeprowadzając  jakościową  analizę 
obrazu  fazowego  modelowanego  układu. 

Kilka  przykładów  zastosowania  matematycznych 
modeli  punktowych  i ich  analizy  w zagadnieniach 
biologicznych  podamy  w rozdziale  Wybrane  przy- 
kłady modeli  matematycznych  w zagadnieniach  bio- 
logicznych. 


Modelowanie  uwzględniające  wiek 
obiektów 


wania  struktur  przestrzennych,  takich  jak  periodyczna 
struktura  kręgosłupa  czy  warstwowa  struktura  ga- 
struli  w embriologii.  Ważną  właściwość  modeli  nie- 
punktowych  stanowi  możliwość  opisu  przy  ich  pomocy 
procesu  spontanicznego  rozbicia  pierwotnie  jednorod- 
nego obszaru  na  szereg  jednorodnych  podobszarów. 
Ma  to  miejsce  wówczas,  gdy  w odpowiednim  modelu 
punktowym  (bez  dodatkowych  członów  po  prawej 
stronie  równań)  występują  nietrwałe  punkty  osobli- 
we. W § Modele  przełączania  będzie  mowa  o przy- 
kładach takich  modeli. 

Znaczenie  poszczególnych  typów  wyżej  opisanych 
modeli  zależy  oczywiście  od  konkretnego  zagadnienia, 
w jakim  model  jest  stosowany,  oraz  od  zadań  stawia- 
nych przed  modelem.  Wydaje  się  jednak,  że  w obec- 
nym stanie  rozwoju  biologii  i biofizyki  teoretycznej 
szczególnie  ważną  rolę  odgrywają  modele  dynamicz- 
ne. Kilka  takich  przykładów  podamy  w rozdziale 
Wybrane  przykłady  modeli  matematycznych  w za- 
gadnieniach biologicznych. 


Wybrane  przykłady  modeli 
matematycznych 
w zagadnieniach  biologicznych 


Model  hodowli  ciągłej 


warunek 

graniczny 


uwzględnie- 

nie 

niejednoro- 

dności 

przestrzennej 


Modele  takie  stosuje  się  wówczas,  gdy  badane  obiekty 
z biegiem  czasu  zmieniają  swe  własności.  Uwzględ- 
nienie tego  konieczne  jest  w zagadnieniach  takich 
jak  ekologia  gatunków,  wzrost  i rozmnażanie  komó- 
rek. Odpowiednio  równania  dynamiczne  mają  po- 
stać: 

. a?('r  TL  + Sx^lP-  --  - Wx,  (5) 
St  ST 

gdzie  x oznacza  liczbę  osobników  w wieku  T w chwili 
t,  a W — współczynnik  śmiertelności,  który  może 
zależeć  od  wieku  T.  (Symbol  djdt  oznacza  tzw.  po- 
chodną cząstkową  względem  czasu).  Lewa  strona 
równania  opisuje  starzenie  się  osobników,  prawa 
strona  — ich  śmierć.  Uzupełnianie  populacji  jest 
uwzględnione  w tzw.  warunku  granicznym: 

00 

x(t,0)  = f MT)x(t,T)dT,  (6) 

0 

gdzie  n(T)  jest  współczynnikiem  rozmnażania.  W pro- 
stszych modelach  stosuje  się  często  rozkładanie  po- 
pulacji na  grupy  wiekowe.  Równanie  (6)  przechodzi 
wówczas  w układ  równań,  w których  zmiennymi  dy- 
namicznymi są  liczebności  odpowiednich  grup. 


Modele  niepunktowe,  opisujące  układy 
przestrzennie  niejednorodne 


Badanie  zjawisk  zachodzących  w układach,  w których 
zmienne  i parametry  charakteryzujące  układ  zależą 
nie  tylko  od  czasu,  ale  i od  współrzędnych  przestrzen- 
nych, wymaga  stosowania  modeli  niepunktowych. 
Aby  uwzględnić  niejednorodność  przestrzenną  i — 
w szczególności  — zjawiska  dyfuzji,  wystarcza  w ukła- 
dzie równań  dynamicznych  (1)  dodać  człony  opisu- 
jące przepływ  substancji  w przestrzeni.  Układ  równań 
przybiera  wówczas  postać : 


dxi(ttriltr)2>Tte) 

dt 


Pi(x  1,*2, 


Xn)  + 


(7) 


gdzie  rjlt  7)2,  rj3  oznaczają  współrzędne  przestrzenne. 
Modele  tego  typu  wykorzystuje  się  do  opisu  powsta- 


Jednym  z najprostszych,  a zarazem  najszerzej  stoso- 
wanych w praktyce  modeli  matematycznych  jest 
model  hodowli  ciągłej  mikroorganizmów.  Model  ten 
jest  szczególnie  przydatny  przy  planowaniu  optymal- 
nych warunków  hodowli  drobnoustrojów,  których 
funkcją  jest  przemiana  małowartościowego  substratu 
na  produkt  bardziej  dla  nas  wartościowy  (np.  para- 
finy na  jadalne  białka).  Procesy  takie  na  wielką  skalę 
przeprowadza  tzw.  mikrobiologia  przemysłowa.  Po- 
dobne problemy  występują  w przemyśle  farmaceuty- 
cznym oraz  przy  projektowanu  układów  umożliwia- 
jących długotrwałe  przebywanie  człowieka  w prze- 
strzeni kosmicznej. 

W najprostszym  wariancie  modelu  hodowli  ciągłej 
uwzględnia  się  tylko  zmiany  w czasie  stężenia  sub- 
stratu (5)  oraz  stężenia  produkowanej  biomasy  ( x ). 
R.ozważany  proces  ma  następujący  przebieg:  do  na- 
czynia zwanego  kultywatorem  (rys.  9),  w którym  się 
odbywa  proces,  wprowadza  się  substrat  o stężeniu 
S0t  z objętościową  prędkością  D.  W kultywatorze 
znajdują  się  i rozmnażają  interesujące  nas  w danym 
zagadnieniu  drobnoustroje,  a wypływa  z naczynia 
(z  taką  samą  prędkością  objętościową  D)  mieszanina 
zawierająca  nie  zużyty  substrat  oraz  drobnoustroje. 


Rys.  9.  Schemat  kultywatora 
przepływowego 


Model  matematyczny  hodowli  ciągłej  można  zapi- 
sać w postaci  układu  dwóch  równań  różniczkowych 


gdzie 


dx 

~~dt 


— jx(S)x  — Dx , 


dy 

dt 


= m(S)x-DS+DS0, 


U(S)  = 


<xS 

KŹ+S' 


(8) 


(9) 


model 

hodowli 

ciągłej 

mikroorga- 

nizmów 


model 
matematy- 
czny hodowli 
w warunkach 
przepływu 
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Kształt  zależności  współczynnika  n od  S jest  znany 
z eksperymentalnych  prac  Monoda.  Sens  fizyczny 
tej  zależności  jest  prosty:  przy  małych  stężeniach 
substratu  S współczynnik  //  szybko  się  zmienia  wraz 
z S , natomiast  przy  dużych  stężeniach  S,  gdy  sub- 
strat  znajduje  się  w nadmiarze  ( S > Ks)  — współ- 
czynnik n(S)  staje  się  praktycznie  stały.  Omawiana 
zależność  jest  podobna  do  znanego  w kinetyce  reak- 
cji chemicznych  prawa  Michaelisa,  opisującego  za- 
leżność prędkości  reakcji  enzymatycznych  od  stężenia 
substratu.  Możliwe  są  także  inne  postacie  zależności 
M od  S.  Obraz  fazowy  układu,  którego  model  mate- 
matyczny stanowią  równania  (8)  przedstawia  rys.  10. 
Na  rysunku  zaznaczono  główne  izokliny  I i II,  punkt 
osobliwy  układu  jest  węzłem  trwałym.  Analiza  mo- 


delu prowadzi  ponadto  do  wniosku,  że  istnieje  pewna 
krytyczna  wartość  stężenia  50,  poniżej  której  hodowla 
ciągła  staje  się  niemożliwa  (mikroorganizmy  wypłu- 
kują się  z kultywatora).  Analiza  modelu  pozwala  po- 
nadto wyznaczyć  prędkość  przepływu  D oraz  po- 
czątkowe stężenie  SQ , odpowiadające  z góry  danej 
efektywności  produkcji,  której  miarą  jest  wielkość 
Dxs  — (50— S)/S  (w  warunkach  stacjonarnych).  Ana- 
lizując dalej  model  można  wreszcie  uzyskać  optymal- 
ny wariant  pracy  układu  w początkowym  stadium 
rozruchu. 

Omówiony  powyżej  model  jest  modelem  uproszczo- 
nym. W mikrobiologii  przemysłowej  stosowane  są 
bardziej  złożone  modele,  uwzględniające  szereg  in- 
nych czynników,  takich  jak  efekt  ciasnoty  (wpływ 
oddziaływania  między  drobnoustrojami),  rozkład 
hodowanych  obiektów  według  wieku,  przesunięcie 
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w czasie  (opóźnienie)  zmian  tempa  rozmnażania 
w stosunku  do  wywołujących  je  zmian  stężeń 
substratu.  Jednakże  u podstaw  każdego  z tych 
realnie  stosowanych  złożonych  modeli  leży  przed- 
stawiony powyżej  uproszczony  wariant  modelu  ho- 
dowli ciągłej. 


Modele  oscylacyjne 


Typowymi  przykładami  modeli  oscylacyjnych  są 
modele  dotyczące  współistnienia  gatunków,  znane 
w literaturze  pod  nazwą  modeli  Lotki  i Volterry. 
Przedstawiamy  poniżej  prosty  model  VoIterry  opi- 
sujący współistnienie  populacji  drapieżników  i popu- 
lacji ofiar  przy  założeniu,  że  ofiary  (populacja  (1)) 
mają  pod  dostatkiem  pożywienia,  pokarm  zaś  dra- 
pieżników (populacji  (2))  stanowią  przedstawiciele 
populacji  (1). 

Równania  różniczkowe  stanowiące  model  mają  na- 
stępującą postać: 


dNx 

dt 


aA^  — yN,  A^, 


-y-  = -fiNt+3NxN%. 


(10) 


Nx  oznacza  liczebność  populacji  (1)  (ofiar),  N2  — 
populacji  (2)  (drapieżników).  W modelu  przyjęto 
założenie,  że  populacja  (1)  rozmnaża  się  ze  stałą 
prędkością,  ginie  zaś  w wyniku  spotkań  z drapież- 
nikami ; ponadto  — że  populacja  (2)  może  się  rozmna- 
żać tylko  w warunkach,  gdy  nie  brak  jej  pożywienia, 
którym  są  ofiary,  ginie  zaś  tylko  śmiercią  naturalną. 
Założenia  te  łatwo  można  rozpoznać  w poszczególnych 
członach  układu  równań. 

Analiza  zaproponowanego  modelu  nie  jest  trudna, 
wynik  jej,  w postaci  obrazu  fazowego  układu,  przed- 
stawia rys.  1 1 . Rozważany  układ  jest  układem  zacho- 
wawczym, ponieważ  trajektorie  układu  są  krzywymi 
zamkniętymi.  Liczebność  każdej  populacji  oscyluje 
w czasie;  wynika  to  stąd,  że  procesy  rozmnażania 
(zwiększania  liczebności)  populacji  (2)  są  przesunięte 
w fazie,  są  opóźnione  w stosunku  do  zmian  ilości  ich 
pożywienia,  czyli  populacji  (1). 

W przedstawionym  tu,  bardzo  uproszczonym  mo- 
delu pominięto  działanie  wszelkich  czynników  zew- 
nętrznych, które  w realnych  warunkach  mogą  wy- 
wierać istotny  wpływ  na  liczebność  obydwu  rozważa- 
nych populacji. 

Warto  zwrócić  uwagę,  że  jednorazowe  działanie 
czynników  zewnętrznych,  zmieniające  liczebność  jed- 
nego z gatunków,  przenosi  punkt  na  obrazie  fazowym 
na  inną  trajektorię,  przy  czym  efekt  takiego  działania 
zależy  od  fazy.  I tak  np.  zwiększenie  liczebności  ga- 
tunku (1)  w fazie  Ax  (trajektoria  A ) przenosi  układ  na 
trajektorię  wewnętrzną  (R),  o mniejszych  oscylacjach, 
dla  której  maksymalna  liczebność  każdego  gatunku 
jest  mniejsza  niż  dla  trajektorii  A.  Na  odwrót  — 
zwiększenie  liczebności  gatunku  (I)  w fazie  A2  prze- 
prowadzi układ  na  trajektorię  C,  gdzie  oscylacje 


model 

Volterry 


tysiącach  skórek 


osiągają  większe  amplitudy,  a maksymalna  liczebność 
każdego  gatunku  jest  większa  niż  dla  początkowej 
trajektorii  A.  Takie  oscylacje  zaobserwowano  w re- 
alnych warunkach,  np.  oscylacje  liczebności  populacji 
ryb  w Morzu  Śródziemnym  oraz  liczebności  rysi 
i królików  w Kanadzie.  Drugi  przykład  zilustrowany 
jest  wykresem  (rys.  12  i 13),  gdzie  widoczny  jest  wy- 
raźnie oscylujący  przebieg  liczebności  obydwu  oma- 
wianych gatunków,  przy  czym  maksima  liczebności 
ofiar  wyprzedzają  w czasie  maksima  liczebności  dra- 
pieżników. Zauważmy,  że  zastosowany  model  mate- 
matyczny zawierał  szereg  upraszczających  założeń 
oraz  że  dane  przedstawione  na  rys.  1 3 dotyczą  liczby 
skór  zajęczych  i rysich  dostarczonych  do  punktów 


Rys.  12.  Zmiany  w czasie  liczby  ofiar  (AT,)  i drapieżników  (/V2) 
otrzymane  w wyniku  rozwiązania  równania  (10) 


skupu  przez  myśliwych,  co  nie  musi  być  ściśle  pro- 
porcjonalne do  liczebności  populacji.  Mimo  tych  za- 
strzeżeń zgodność  przewidywań  modelu  z danymi 
obserwacyjnymi  można  uznać  za  jakościowo  zadowa- 
lającą. 


Rys.  13.  Zmiany  liczby  skórek  zajęczych  i mysich  w Kanadzie 
w latach  1845-1935 


Natomiast  porównanie  ilościowe  przewidywań 
wypływających  z modelu  z wynikami  obserwacji  wy- 
kazało, że  model  Volterry  w wyżej  podanej,  najpro- 
stszej postaci  nie  daje  dostatecznie  dokładnego  opisu 
zjawisk  obserwowanych  w badaniach  ekologicznych. 
Wskazuje  to  na  konieczność  stosowania  modeli  bar- 
dziej złożonych,  uwzględniających  w szczególności 
czynniki  takie,  jak  ograniczoność  zapasów  pożywienia 
ofiar,  ograniczoność  terenu,  na  którym  współistnieją 
rozważane  gatunki  (efekt  ciasnoty),  i wiele  innych. 
Modele  takie  istotnie  szeroko  się  rozwija  i opraco- 
wuje. Warto  jednak  podkreślić,  że  u podstaw  tego 
rodzaju  modeli  leży  przeważnie  idea  prostego,  kla- 
sycznego modelu  Volterry. 

model  Model  procesu  glikolizy  stanowi  dobry  przykład 
procesu  procesu  wszechstronnie  zbadanego,  tzn.  zarówno 
glikolizy  eksperymentalnie,  jak  i z punktu  widzenia  modeli 
matematycznych.  Glikoliza  jest  jednym  z najpro- 
stszych i dobrze  zbadanych  procesów  odbywających 
się  w cytoplazmie  komórki.  Proces  ten  polega  na 
zamianie  glukozy  w kwas  pirowinogronowy.  Ponadto 
glikoliza  odgrywa  ważną  rolę  wśród  procesów  związa- 
nych z wytwarzaniem  spirytusu  etylowego.  Przepro- 
wadzono eksperymentalne  badanie  oscylacji  w pro- 
cesie glikolizy  zarówno  w cytoplazmie,  jak  i w układzie 


czystych  enzymów  i substratów  glikolizy,  przy  czym 
w tej  drugiej  grupie  eksperymentów  otrzymano  wia- 
rogodne  ilościowe  dane  doświadczalne  (eksperymenty  ekspery- 
Chance’a  i Hessa).  W wyniku  tych  eksperymentów  menty 
stwierdzono,  że  występują  periodyczne  zmiany  w cza-  ChanceJa 
sie  stężeń  produktów  reakcji  glikolizy.  i Hessa 

Model  matematyczny  procesu  zaproponował 
E.  Sielkow.  Za  podstawę  modelu  przyjął  ścisłe  rów- 
nania kinetyczne  odnoszące  się  do  całego  łańcucha 
reakcji  chemicznych  stanowiących  proces  glikolizy 
i oparł  się  na  znanych  właściwościach  enzymów  bio- 
rących udział  w tym  procesie.  Układ  stanowiący 
model  matematyczny  składał  się  z wielu  równań.  Na 
podstawie  reguł  i procedur  matematycznych  wspom- 
nianych w paragrafie.  „Modele  punktowe”  udało  mu 
się  zredukować  pierwotny  model  do  2 tylko  rów- 
nań różniczkowych  z dwiema  zmiennymi.  W uprosz- 
czonym wariancie  tego  modelu,  przeanalizowanym 
wcześniej  przez  Higginsa,  zmiennymi  dynamicznymi 
są:  będące  miarą  stężenia  sześciowęglowych  cu- 

krów, powstających  ze  stałą  prędkość  ą z glukozy 
(na  początku  łańcucha  reakcji  w procesie  glikolizy), 
oraz  y,  będące  miarą  stężenia  jednej  z substancji  — 
produktów  końcowej  części  łańcucha  procesu  gliko- 
lizy. Nie  podajemy  tu  pełnego  zapisu  modelu  nawet 
w prostszym  wariancie  Higginsa,  raczej  kładziemy 
nacisk  na  jakościową  stronę  zagadnienia. 

Obraz  fazowy  analizowanego  układu  po  wprowa- 
dzeniu bezwymiarowych  zmiennych  x'  i y'  (proporcjo- 
nalnych odpowiednio  do  x i y)  przedstawia  rys.  14. 

Na  rysunku  zaznaczono  główne  izokliny  I i //  oraz 
krzywą  zamkniętą  III,  stanowiącą  tzw.  cykl  graniczny. 

Bardziej  wnikliwa  analiza  modelu  pozwoliła  stwier- 
dzić, że  w wyniku  zmian  wartości  parametrów  wystę- 
pujących w modelu,  a w szczególności  — szybkości  v, 
dopływu  glukozy,  model  przewiduje  bądź  trwały, 
stabilny  przebieg  procesu  (przy  dużych  wartościach  v ), 
bądź  też  oscylacyjny  charakter  procesu  (przy  małych 
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v ),  co  odpowiada  wspomnianemu  już  cyklowi  gra- 
nicznemu. Rysunek  15  ilustruje  jakościowo  tę  za- 
leżność przebiegu  procesu  od  parametru  v.  Wyniki 
modelu  porównano  z danymi  eksperymentalnymi. 
Stwierdzono  słuszność  przewidywań  modelu  doty- 
czących przechodzenia  układu  od  zachowania  stabil- 
nego do  oscylującego  oraz  związku  tych  przejść  ze 
zmianami  wartości  parametrów  układu.  Analiza 
opisanego  modelu  ma  też  bardziej  ogólny  aspekt; 
stanowi  mianowicie  pewien  krok  naprzód  w zrozu- 
mieniu mechanizmu  regulacji  procesów  biochemicz- 
nych. Nieco  bardziej  złożony  wariant  modelu  zasto- 
sowano do  opisu  związku  między  procesem  glikolizy 
i oddychaniem,  co  umożliwiło  wyjaśnienie  efektów 
włączania  i wyłączania  procesu  glikolizy  w warunkach 
anaerobowych  (beztlenowych)  i aerobowych  (z  do- 
stępem tlenu). 

model  Model  generacji  impulsu  nerwowego  zaproponowa- 
generacji  ny  przez  Hodgkina  i Huxleya  w 1953  r.  jest  przykładem 
impulsu  modelu,  w którym  punkt  osobliwy  jest  węzłem.  Model 
(nerwowego  ten  opisuje  przechodzenie  jonów  potasu  (K)  i sodu 
(Na)  przez  membranę  komórek  nerwowych  oraz 
zmiany  potencjału  membrany;  zmiany  potencjału 
membrany  są  uwarunkowane  prądem  elektrycznym, 
a zmiany  przewodnictwa  — zmianami  stanu  elemen- 
tów- przewodzących  prąd  w membranie.  Nośnikami 
prądu  są  jony  potasu  i sodu,  przy  czym  zmiany 
przewodnictwa  jonów  sodu  są  znacznie  szybsze  niż 
jonów  potasu. 

Wykorzystując  reguły  matematyczne,  które  prowa- 
dzą do  redukcji  liczby  równań  stanowiących  model 
procesu,  można  sprowadzić  model  do  dwóch  tylko 
równań,  w których  zmiennymi  będą  napięcie  E oraz 
przewodnictwo  jonów  potasu  gx.  Obraz  fazowy  roz- 
ważanego układu,  reagującego  na  wzbudzenie  stan- 
dardowego impulsu,  przedstawia  schematycznie  rys. 
16a.  Przy  zmianie  napięcia  o wartość  E (tzw.  wzbu- 
dzenie progowe)  punkt-obraz  na  płaszczyźnie  fa- 
zowej przechodzi  do  obszaru  nietrwałego  i porusza 
się  po  trajektorii  oznaczonej  krzywą  przerwaną, 
po  czym  wraca  do  stanu  początkowego.  Trajektoria 
ta  na  niektórych  odcinkach  jest  prawie  równoległa  do 
osi  odciętych,  co  oznacza,  że  czas  zmiany  potencjału, 
zależny  od  elektrycznej  pojemności  membrany,  jest 


znacznie  krótszy  od  czasu  charakterystyczngo  dla 
zmian  przewodnictwa.  Rysunek  16a  daje  zatem  obraz 
generacji  impulsu  nerwowego  w normalnych  warun- 
kach. Przy  zmianie  parametrów  związanych  z elek-  model 
trycznymi  charakterystykami  (np.  z charakterystyką  stanu 
prądowo-napięciową)  izokliny  główne  (/  i //)  na  patoSogi- 
obrazie  fazowym  zmieniają  swe  położenie  tak,  że  cznego 
punkt  osobliwy  może  przejść  do  obszaru  nietrwałego. 

Sytuację  tę  ilustruje  rys.  16b.  Powstają  wówczas  nie- 
ustające drgania  relaksacyjne,  odbywające  się  wzdłuż 
cyklu  C,  zaznaczonego  na  rysunku.  Zdarza  się  to 
w warunkach  patologicznych.  Znaczenie  tego  modelu 
dla  medycyny  polega  przede  wszystkim  na  tym,  że 
umożliwia  on  opis  procesów  zarówno  w stanach 
normalnych,  jak  i w sytuacjach  patologicznych, 
a zarazem  wskazuje  na  możliwe  przyczyny  efektów 
patologicznych. 

Opisany  powyżej  model  generacji  impulsu  nerwowe- 
go należy  do  modeli  punktowych,  tzn.  opisuje  lokal- 
ną sytuację  odpowiadającą  małemu  odcinkowi  włókna 
nerwowego.  Analiza  zjawisk  związanych  z rozcho- 
dzeniem się  impulsu  nerwowego  wymaga  uwzględ- 
nienia w modelu  matematycznym  członu  wyższego 
rzędu,  odpowiadającego  zmianom  napięcia  wzdłuż 
zmiennej  przestrzennej;  model  staje  się  wówczas 
niepunktowy. 


Modele  przełączenia  (tryggerowe) 

Modele  tego  rodzaju  są  stosowane  przy  opisie  pro- 
cesów przełączeniowych  w biologii,  a zwłaszcza  przy 
opisie  sytuacji,  w których  obiekt  biologiczny  może 
dokonywać  wyboru  między  dwoma  możliwymi  sta- 
nami (reżimami)  pracy.  Z modeli  tego  rodzaju  ko- 
rzysta się  np.  przy  opisie  procesów  różnicowania  tka- 
nek w embriogenezie,  procesów  powstawania  i róż- 
nicowania gatunków  w ewolucji,  procesów  związanych 
z powstawaniem  informacji  biologicznej  (we  wczes- 
nych stadiach  ewolucji),  a także  przy  opisie  powstania 
asymetrii  optycznej  w biologii.  Najważniejszą  cechą 
modeli  tego  typu  jest  występowanie  w nich  co  naj- 
mniej dwóch  stanów  stacjonarnych,  oddzielonych 
od  siebie  na  obrazie  fazowym  nietrwałą  trajektorią 
(rys.  17). 

Do  bardziej  szczegółowo  zbadanych  biologicznych  embriogeneza 
modeli  przełączania  należy  model  opisujący  różnico- 
wanie tkanek.  Podstawowy  problem  wczesnej  embrio- 


genezy  można  przedstawić  w uproszczonej,  wyideali- 
zowanej postaci  w następujący  sposób:  dwie  (sąsied- 
nie) komórki  znajdujące  się  w jednakowych  warun- 
kach i zawierające  identyczną  informację  genetyczną 
po  procesie  różnicowania  zaczynają  pracować  w róż- 
nych reżimach.  Sytuacja  wygląda  zatem  tak,  jak  gdyby 
została  naruszona  symetria  przestrzenna  początkowych 
i granicznych  warunków  dla  stanu  początkowego. 
Analiza  odpowiedniego  modelu  matematycznego 
pozwala  prześledzić  proces  różnicowania  i wskazać 
przyczynę  wspomnianego  naruszenia  symetrii.  Mode- 
le matematyczne  opisujące  to  zjawisko  wychodzą 
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z założenia  przełączeniowego  (tryggerowego)  sche- 
matu regulacji  procesu  biosyntezy,  zaproponowanego 
przez  Jacoba  i Monoda.  W schemacie  tym  przyjmuje 
się,  że  metabolity  związane  z jednym  reżimem  (białka 
oraz  mRNA)  uniemożliwiają  syntezę  metabolitów 
związanych  z działaniem  układu  w drugim  reżimie  — 
i vice  versa.  Można  to  określić  jako  antagonistyczne 
oddziaływanie  między  metabolitami  charakterystycz- 
nymi dla  dwóch  rozważanych  reżimów.  Analiza  od- 
powiednio sformułowanego  modelu  matematycznego, 
w którym  zmiennymi  są  stężenia  dwóch  wyżej  wspom- 
nianych grup  metabolitów,  prowadzi  do  obrazu  fa- 
zowego przedstawionego  na  rys.  17,  gdzie  zaznaczo- 
no schematycznie  kształt  dwóch  głównych  izoklin 
oraz  linię  rozdzielającą  (separatrysę)  S.  Układ  biolo- 
giczny, którego  stanowi  odpowiada  punkt-obraz  po 
prawej  stronie  separatrysy,  dąży  nieuchronnie  do 
stanu  trwałego  /,  układ  zaś  w stanie  początkowym  po 
lewej  stronie  S dąży  do  stanu  trwałego  2.  Komórka 
znajdująca  się  początkowo  w stanie  0 (punkt  stacjo- 
narny nietrwały),  bądź  w stanie  odpowiadającym  ja- 
kiemuś punktowi  na  separatrysie  może  przejść  do 
stanu  I lub  2 pod  wpływem  dowolnie  słabego  czynni- 
ka zewnętrznego,  przy  czym  przejście  takie  jest  pro- 
cesem nieodwracalnym. 

Losy  sąsiedniej  (II)  komórki,  która  jest  związana 
z poprzednio  omawianą  (I)  przez  krążenie  i wymianę 
metabolitów  i substratów,  zależą  od  tego,  w jakim 
z dwóch  możliwych  reżimów  działa  komórka  (I), 
która  porzuciła  stan  nietrwały.  Jeżeli  wymiana  sub- 
stratów jest  procesem  szybkim,  a dopływ  ich  jest  ogra- 
niczony, to  komórka  (II)  przechodzi  do  stanu  prze- 
ciwnego niż  komórka  (I).  Powstaje  w ten  sposób 
pewna  struktura  — układ  komórek  działających 
w różnych  reżimach.  W zależności  od  takich  para- 
metrów, jak  zdolność  do  przenikania  metabolitów 
i substratów  między  sąsiadującymi  z sobą  komórka- 
mi, mogą  powstawać  różne  struktury,  złożone  z po- 
jedynczych komórek  lub  ich  zespołów,  przy  czym  ko- 
mórki w takim  zespole  pracują  w jednym  reżimie. 
Powstawanie  tego  rodzaju  struktur  nazywamy  aktem 
różnicowania  tkanek,  oczywiście  w bardzo  schema- 
tycznym i uproszczonym  ujęciu.  Analiza  powstawania 
struktur  w wypadku  bardzo  dużej  liczby  komórek  wy- 
maga stosowania  modeli  niepunktowych.  Warto  pod- 
kreślić, że  powstanie  zróżnicowania,  przestrzennej 
niejednorodności,  jest  wynikiem  nietrwałości  punktu 
osobliwego  w-  odpowiednim  modelu  punktowym, 
model  Podobne  właściwości  charakteryzują  modele  opi- 
powstatoania  sujące  powstawanie  i różnicowanie  gatunków  biolo- 
i różnicowa-  gicznych.  Z nietrwałym  symetrycznym  stanem  stacjo- 
nia  gatunków  namym  spotykamy  się,  gdy  próbujemy  skonstruować 
model  matematyczny  powstawania  asymetrii  optycz- 
nej w przyrodzie.  Stwierdzono  mianowicie,  że  amino- 
kwasy wchodzące  w skład  żywych  organizmów  na 
Ziemi  są  optycznie  prawoskrętne,  cukry  zaś  — lewo- 
skrętne.  Wydaje  się  oczywiste,  że  żywe  organizmy 
zawierające  aminokwasy  i cukry  o przeciwnej  aktyw- 
ności optycznej  mogłyby  z równym  powodzeniem  żyć 
i rozwijać  się,  niemniej  jednak  nie  występują  na  Ziemi. 
Tworząc  model,  który  wyjaśnia  powstawanie  takiej 
asymetrii  w przyrodzie,  wychodzimy  z założenia 
asymetria  o antagonistycznym  (wzajemnie  zgubnym)  oddziały- 
w przyrodzie  waniu  organizmów  zawierających  odpowiednie  sub- 
stancje o przeciwnej  aktywności  optycznej.  Stwier- 
dzono bowiem,  że  lewoskrętne  aminokwasy  nie  tylko 
nie  są  przyswajane,  lecz  nawet  stanowią  jakby  truciznę 
dla  organizmów  zawierających  prawoskrętne  amino- 
kwasy i — oczywiście  — na  odwrót.  Wynika  stąd 
nietrwałość  stanu,  w którym  współistniałyby  w rów- 
nych ilościach  lewo-  i prawoskrętne  żywe  obiekty. 
Niewielka  choćby  przewaga  liczbowa  jednych  nad 
drugimi  prowadzi  nieuchronnie  do  całkowitego  za- 
niku organizmów  drugiego  typu.  Można  zatem  sądzić, 
że  jeżeli  nawet  we  wczesnym  stadium  ewolucji  po- 
wstały dwa  „zwierciadlane”  rodzaje  żywych  organi- 
zmów, to  z biegiem  czasu  musiał  pozostać  praktycznie 
tylko  jeden. 


Analogicznie  rozumujemy,  gdy  chodzi  o podsta-  uniwersał- 
wowy  dla  w-spółczesnej  biofizyki  problem,  sprowadza-  nog£  kodu 
jący  się  do  pytania,  dlączego  kod  genetyczny  jest  urn*  genetycznego 
wersalny  (identyczny  w całej  przyrodzie),  mimo  że 
można  sobie  wyobrazić  inne,  równoważne  kody, 
w których  np.  aminokwasy  byłyby  poprzestawiane 
w porównaniu  z obecnie  istniejącym  wariantem  kodu 
(najkrócej  — kodem  można  by  nazwać  ustaloną  od- 
powiedniość  między  aminokwasami  a trójkami  nu- 
kleotydów).  Odpowiedzi  na  postawione  pytanie  moż- 
na szukać  w antagonistycznym  oddziaływaniu  obiek- 
tów charakteryzujących  się  różnymi  kodami.  Wyni- 
kiem oddziaływań  między  nimi  byłoby  naruszenie 
regularnej  syntezy  białek  u obydwu  obiektów,  co 
z kolei  musiałoby  być  zgubne  dla  obydwu  partnerów. 

Model  matematyczny  uwzględniający  to  zjawisko 
przewiduje,  że  stacjonarny  stan  symetryczny  jest  nie- 
trwały, co  w konsekwencji  prowadzi  do  nieuchron- 
nego wyginięcia  wszystkich  żywych  obiektów  prócz  \ 

pomyślnie  rozwijającej  się  jednej  grupy,  charaktery- 
zującej się  jednym  określonym  kodem.  Nie  sposób 
jednak  z góry  przewidzieć,  który  kod  odniesie  zwy- 
cięstwo; zależy  to  od  rodzaju  i kierunku  przypadko- 
wej fluktuacji,  wyprowadzającej  zespół  żywych  or- 
ganizmów we  wczesnym  stadium  ewolucji  z nietrwa- 
łego stanu  początkowego,  w którym  współistniały 
żywe  obiekty  o różnych  kodach.  Wybór  jednego 
wariantu  spośród  wielu  możliwości  jest  równoważny 
z powstaniem  uniwersalnego  alfabetu  dla  całej  żywej 
przyrody,  stanowi  zatem  podstawę  powstania  infor- 
macji biologicznej.  Aktowi  powstawania  informacji 
towarzyszą  bowiem  dwa  podstawowe  procesy:  wybór 
(decyzja)  i zapamiętanie.  Obydwa  te  procesy  wystę- 
pują w układach  przełączania  (tryggerowych). 


Inne  rodzaje  zastosowania 
modelowania  matematycznego 

Na  zakończenie  przeglądu  zagadnień  związanych 
z modelowaniem  matematycznym  procesów  biologicz- 
nych warto  poruszyć  jeszcze  dwa  tematy  nie  omawiane 
w zasadniczym  tekście  artykułu. 


Układy  otwarte 

Uważano  dawniej,  że  termodynamika  układów  ot- 
wartych pomoże  w znalezieniu  ogólnych  zasad  formu- 
łowania modeli  matematycznych  w zagadnieniach 
biologicznych.  Okazało  się  jednak,  że  termodynamika 
układów  bliskich  stanu  równowagi  napotyka  poważne 
trudności  przy  próbach  zastosowania  takiego  podej- 
ścia do  procesów  biologicznych  (próby  takie  podej-  termodyna- 
mował  J.  Prigogine,  który  wraz  z grupą  innych  na-  mika 
ukowców  pracuje  od  całego  szeregu  lat  nad  próbie-  układów 
mami  termodynamiki  tzw.  układów  otwartych),  otwartych 
zwłaszcza  przy  opisie  reżimów  oscylacyjnych.  Ter- 
modynamika układów  dalekich  od  stanu  równowagi 
nie  jest  jeszcze  dostatecznie  rozwiniętą  dziedziną. 

Można  sądzić,  że  analiza  konkretnych  modeli,  szcze- 
gólnie niektórych  spośród  omawianych  w niniejszym 
artykule,  będzie  pewną  pomocą  w znalezieniu  ogól- 
nych zasad  termodynamiki  układów  dalekich  od  rów- 
nowagi. Można  mieć  nadzieję,  że  w razie  pomyślnego 
rozwoju  tego  kierunku  zasady  takie  będą  pożyteczne 
i owocne  przy  formułowaniu  nowych  modeli  proce- 
sów biologicznych. 


Dziedziny  mniej  związane  z biofizyką 

Przykład  tego  kierunku  badań  może  stanowić  wy-  zastosowanie 
korzystanie  modeli  matematycznych  w medycynie,  w medycynie 
gdzie  sformułowanie  i analiza  odpowiedniego  modelu 
pomaga  niekiedy  w wyborze  optymalnego  wariantu 
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procedury  leczenia  środkami  farmaceutycznymi  lub 
fizykoterapeutycznymi.  Rozkład  w czasie  dozowania 
stosowanych  leków  czy  działań  terapeutycznych  ma 
niekiedy  podstawowe  znaczenie,  zwłaszcza  gdy  prze- 
bieg choroby  ma  charakter  oscylujący.  W takich  wy- 
padkach ten  sam  środek  stosowany  w różnych  mo- 
mentach (w  różnych  fazach)  może  prowadzić  do 
istotnie  różnych,  a niekiedy  wręcz  przeciwnych  rezul- 
tatów. Jako  przykład  takiej  sytuacji  można  wymienić 
wykorzystanie  modelowamia  matematycznego  w stra- 
tegii leczenia  periodycznie  występujących  nawrotów 
np.  malarii. 

Często  stosuje  się  modele  matematyczne  w zagad- 
nieniach epidemiologii,  gdzie  przedmiotem  modelu 
jest  rozprzestrzenianie  się  i skutki  choroby  zakaźnej, 
bądź  strategia  postępowania  przy  zwalczaniu  choro- 
by, np.  przez  masowe  szczepienia  ochronne.  Jako  przy- 
strategia  kład  można  tu  wymienić  modele  mające  na  celu  wy- 
szczepień  bór  optymalnej  strategii  szczepień  przeciwko  różycz- 
ce, która  — w przypadku  kobiet  we  wczesnym  okre- 
sie ciąży  — może  prowadzić  do  poważnych  wad  roz- 
wojowych u potomstwa.  Szczepienie  ochronne  zapo- 
biega zapadnięciu  na  różyczkę  w ciągu  pewnego 
ograniczonego  czasu  po  szczepieniu.  Skrajne  warianty 
strategii  stosowania  szczepień  ochronnych  przewidu- 
ją poddawanie  szczepieniu  albo  tylko  dorastających 
dziewcząt,  albo  powszechne  szczepienia  dzieci  obojga 
płci;  ponadto  istnieje  szereg  wariantów  pośrednich, 
takich  jak  np.  szczepienia  powtarzane  co  kilka  lat 
w wybranych  populacjach  dzieci  i młodzieży.  Uwzglę- 
dnienie w modelu  matematycznym  konkretnego 
wariantu  strategii  szczepień  ochronnych  takich  efek- 
tów, jak  zaraźliwość  choroby  w danej  populacji. 


trwałość  i skuteczność  szczepienia  i wreszcie  kosztów 
związanych  z przeprowadzaniem  szczepień,  pozwala 
na  ocenę  skuteczności  danego  wariantu  strategii  po- 
stępowania; ilościową  miarą  tej  skuteczności  może 
być  np.  średnia  wartość  prawdopodobieństwa  nie- 
zapadnięcia  na  różyczkę  we  wczesnym  okresie  ciąży. 

Wynikiem  analizy  modelu  odpowiadającego  okre- 
ślonemu wariantowi  strategii  postępowania  jest  osza- 
cowanie jego  skuteczności  i kosztu;  tego  rodzaju 
dane  pozwalają  na  podjęcie  decyzji  o wyborze  lub 
odrzuceniu  danej  strategii  postępowania. 

Inny  przykład  dziedziny,  w której  się  coraz  częściej  strategia 
stosuje  modelowanie  matematyczne,  stanowi  strategia  wyfcorzysty- 
wykorzystywania  naturalnych  bogactw  czerpanych  wania 
z fauny  i flory  naszego  globu  (np.  optymalizacja  od-  bogactw 
łowów  rybnych  w basenach  morskich  czy  długotermi- 
nowe prognozy  dotyczące  możliwości  zagwaranto- 
wania pożywienia  stale  rosnącej  liczbie  mieszkańców 
Ziemi). 

Rola  modeli  matematycznych  wzrosła  ostatnio 
w związku  z szybkim  rozwojem  techniki  i przemysłu, 
a co  za  tym  idzie  — ze  stale  wzrastającym  wpływem 
działania  człowieka  na  biosferę.  Uniknąć  katastrofal- 
nych skutków  tego  wpływu  można  tylko  przy  właści- 
wej strategii  gospodarowania  człowieka  na  Ziemi 
i właściwym  wpływaniu  na  biosferę.  Nie  sposób  wyo- 
brazić sobie  poważnych  prac  w tej  dziedzinie  bez 
stosowania  modeli  matematycznych. 

D.  S.  Czerna  wski  Model  matematyczny  powstawania  życia. 

Post.  Fiz.,  26,  153  (1975);  D.  S.  Czerna  wski  i in.  Co  to  jest  bio- 
fizyka matematyczna?  Warszawa  1974;  I.  Prigogine  i in.  Termo- 
dynamika ewolucji.  Post.  Fiz.,  26,  253  (1975);  I.  Rashevsky  Ma- 
thematical  Biophysics ; Physico-Mathematical  Fundations  in  Bio- 
logy , New  York  1960. 
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Fizyka  skorupy  i wnętrza  Ziemi 


Renata  Dmowska 

W latach  sześćdziesiątych  i siedemdziesiątych  naszego 
stulecia  nastąpił  znaczny  rozwój  wiedzy  o wnętrzu 
Ziemi.  Obraz  procesów  zachodzących  w jej  wnętrzu 
i kształtujących  zjawiska  powierzchniowe  zaczął  się 
nareszcie  wyłaniać  z gęstwiny  danych  i teorii,  zarówno 
tych  znanych  od  lat,  jak  i najnowszych.  Nastąpiło  to 
dzięki  wprowadzeniu  do  geofizyki  w ciągu  ostatnich 
kilkunastu  lat  nowych  metod  doświadczalnych  i teo- 
retycznych oraz  możliwości  prowadzenia  badań  na 
dużo  szerszą  skalę  niż  to  było  możliwe  dotychczas. 
Początkiem  przełomu  było  zgromadzenie  Międzyna- 
rodowej Unii  Geodezji  i Geofizyki  w Helsinkach 
w 1960  r.,  gdzie  postanowiono  skoncentrować  uwagę 
badaczy  na  zewnętrznej  warstwie  Ziemi  o grubości 
1000  km,  obejmującej  skorupę  i górny  płaszcz.  Przed- 
stawiony wówczas  ogólnoświatowy  program  badań 
geofizycznych  skorupy  i górnego  płaszcza,  tzw.  Pro- 
jekt Górnego  Płaszcza  (ang.  Upper  Mantle  Project), 
był  stymulatorem  wielu  interesujących  odkryć  i teorii. 
Po  raz  pierwszy  przeprowadzono  systematyczne  ba- 
dania różnic  w budowie  górnego  płaszcza,  rejonu, 
w którym  koncentrują  się  najistotniejsze  procesy  geo- 
dynamiczne  zachodzące  we  wnętrzu  Ziemi  i mające 
bezpośredni  wpływ  na  zjawiska  na  jej  powierzchni. 
Zgromadzona  ogromna  ilość  danych  dotyczących 
skorupy  i górnego  płaszcza  umożliwiła  powstanie  glo- 
balnych teorii  geodynamicznych. 

Na  przełomie  lat  1971  i 1972  zamknięto  Projekt 
Górnego  Płaszcza  i przystąpiono  do  realizacji  nowego, 
szerokiego  programu  badań,  nazwanego  Projektem 
Geodynamicznym  (ang.  Geodynamical  Project ).  Ce- 
lem programu  jest  kontynuowanie  badań  zjawisk  za- 
chodzących we  wnętrzu  Ziemi  oraz,  o ile  to  możliwe, 
skonstruowanie  jednolitej,  globalnej  teorii,  opisującej 
procesy  geodynamiczne  przekształcające  naszą  pla- 
netę od  momentu  jej  powstania  aż  do  chwili  obecnej, 
kształt  Kształt  Ziemi  opisywany  jest  zwykle  przy  użyciu 
Ziemi  dwu  powierzchni:  sferoidy,  tzn.  elipsoidy  obrotowej 
możliwie  najlepiej  odpowiadającej  powierzchniom 
morza,  i geoidy,  tzn.  powierzchni  jednakowego  po- 
tencjału siły  ciężkości.  Spłaszczenie  sferoidy  / okreś- 
lone jest  wzorem: 

/ = ( a-c)/a , 

gdzie  a jest  średnim  promieniem  równikowym  i wy- 
nosi 6378,160  km,  c — promieniem  biegunowym 
Ziemi  i wynosi  6356,775  km.  Spłaszczenie  sferoidy 
wynosi  1/298,25.  Ta  ostatnia  wielkość  została  wyzna- 
czona z obserwacji  orbit  sztucznych  satelitów  Ziemi. 
Metodami  geodezji  satelitarnej  stwierdzono  poza  tym, 
że  geoida  ma  kształt  gruszkowaty.  Gruszkowate  od- 


chylenia geoidy  od  sferoidy  wynoszą  mniej  niż  20  m, 
natomiast  wybrzuszenie  równikowe  sferoidy  wynosi 
ponad  20  km.  Średnie  odchylenia  geoidy  od  sferoidy 
wzdłuż  dowolnego  południka  ilustruje  rys.  1 ; nato- 
miast rys.  2 pokazuje  mapę  odchyleń  geoidy  od  sferoi- 
dy sporządzoną  na  podstawie  danych  satelitarnych 
i powierzchniowych  pomiarów  grawimetrycznych. 
Przewyższenia  geoidy  nad  sferoidą  odpowiadają 
większym  gęstościom  materiału  we  wnętrzu  Ziemi, 
a obniżenia  — obszarom  o mniejszych  gęstościach 
materiału,  przy  czym  anomalie  gęstości  dotyczą  przy- 
puszczalnie płaszcza  Ziemi. 


biegun 

północny 


Rys.  1.  Odchylenia  geoidy  od  sferoidy 


Budowa  Ziemi 

Gałąź  geofizyki,  dotycząca  powstawania  i propagacji 
fal  we  wnętrzu  Ziemi,  zwana  sejsmologią,  dostarczyła 
podstawowych  danych  o budowie  jej  wnętrza,  pra- 
wie całkowicie  niedostępnego  badaniom  bezpośred-  sejsmologia 
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l^/298^25*apa  ziems^ic^  anoma,ii  grawimetrycznych.  Wartości  anomalii  podane  w metrach,  w odniesieniu  do  sferoidy  o spłaszczeniu 


sejsmologia 

współczesna 


nim.  Powstała  na  początku  bieżącego  stulecia  sejsmo- 
logia instrumentalna  umożliwiła  rejestrację,  a następ- 
nie analizę  pola  falowego  generowanego  w ogniskach 
trzęsień  Ziemi.  Rozkład  prędkości  fal  sejsmicznych 
z głębokością  ujawnił  podstawowe  cechy  budowy 
Ziemi;  już  w 1910  r.  zbudowano  trójwarstwowy  mo- 
del jej  wnętrza,  składający  się  ze  skorupy,  płaszcza 
i jądra.  Dalsze  prace  sejsmologiczne,  uzupełnione 
analizą  ziemskiego  pola  magnetycznego  i powierzch- 
niowych anomalii  grawimetrycznych,  doprowadziły 
do  rozpoznania  bardziej  subtelnych  szczegółów  we- 
wnętrznej struktury  Ziemi  i ujawniły  cały  szereg  gra- 
nic oddzielających  obszary  o różnych  własnościach 
mechanicznych.  Sejsmologia  współczesna  umożliwiła 
wykrycie  wielu  szczegółów  budowy  horyzontalnej 
górnego  tysiąca  kilometrów  wnętrza  Ziemi,  a obecnie 
ujawnia  ona,  dotychczas  częściowo  tylko  zbadane, 
wielosetkilometrowe  anomalie  o granicach  piono- 
wych w górnym  płaszczu  Ziemi,  zarysy  których, 
wbrew  oczekiwaniom,  nie  pokrywają  się  z zarysami 
struktur  skorupy  ziemskiej. 


Własności  fizyczne  wnętrza  Ziemi 

Określenie  budowy  i własności  fizycznych  wnętrza 
Ziemi  jest  wynikiem  rozwiązania  tzw.  zagadnienia 
odwrotnego,  tzn.  określenia  struktury  wewnętrznej 
za  pomocą  obserwacji  dokonywanych  na  powierzchni 
i,  dodatkowo,  dzięki  wykorzystywaniu  wyników  la- 
boratoryjnych pomiarów  własności  fizycznych  zna- 
nych skał  i minerałów  w warunkach  wysokich  ciśnień 
i temperatur.  Większość  informacji  pochodzi  z analizy 
grawitacyjnego  pola  Ziemi  oraz  z obserwacji  sejsmo- 
logicznych, ponadto  z badań  powierzchniowego  stru- 


mienia cieplnego  i z obserwacji  magnetycznego  pola 
Ziemi.  Dane  dotyczące  wnętrza  Ziemi,  a w szczegól- 
ności jej  najgłębszych  warstw,  powinny  być  trakto- 
wane z dużą  ostrożnością  i uważane  raczej  za  pewne 
oszacowania  niż  dane  dokładne. 

Analiza  objętościowych  i powierzchniowych  fal 
sejsmicznych,  a także  swobodnych  drgań  Ziemi,  ge- 
nerowanych przez  wyjątkowo  silne  trzęsienia  Ziemi, 
prowadzi  do  określenia  rozkładów  modułu  ściśliwości 
K,  modułu  ścinania  fi  i gęstości  q w funkcji  promienia 
ziemskiego  r.  Dodatkowo  jest  wykorzystywane  rów- 
nanie Adamsa-Williamsona,  wiążące  prędkości  fal 
sejsmicznych  vp  i v s z gęstością  q : 


własności 

mechaniczna 


równanie  to  dotyczy  jednak  ośrodka  jednorodnego 
ściskanego  adiabatycznie  w polu  naprężeń  hydrosta- 
tycznych i nie  może  być  stosowane  w obszarach 
przejść  fazowych  oraz  w rejonach,  w których  rozkład 
temperatury  nie  jest  adiabatyczny.  Ze  znanych  roz- 
kładów q obi  iczone  są  rozkłady  przyspieszania  ziem- 
skiego g i ciśnienia  p we  wnętrzu  Ziemi,  wszystkie  te 
parametry  przedstawione  są  na  rys.  3 w funkcji  głę- 
bokości. Należy  tu  zauważyć,  że  konstruowanie  mo- 
deli dotyczących  rozkładu  gęstości  we  wnętrzu  Ziemi 
opiera  się  na  różnego  rodzaju  dodatkowych  założe- 
niach i hipotezach  co  do  własności  fizykochemicznych 
wnętrza  Ziemi,  gdyż  rozwiązanie  jednoznaczne  tego 
problemu  nie  jest  możliwe. 

Informacje  dotyczące  rozkładu  temperatury  we 
wnętrzu  Ziemi  są  silnie  ograniczone.  Znajomość  roz- 
kładu temperatury  nie  jest  możliwa  bez  pełnej  znajo- 
mości rozkładu  źródeł  ciepła  i mechanizmów  przeno- 


równaraie 

Adamsa- 

Wiilfiamsona 
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szenia  ciepła,  których  to  informacji  nie  jesteśmy  w sta- 
nie otrzymać,  jednakże  określenie  w pewnym  zakresie 
rozkład  rozkładu  temperatury  we  wnętrzu  Ziemi  jest  możliwe, 
temperatury  Jako  dane  wyjściowe  służą  wyniki  pomiarów  po- 
wierzchniowego strumienia  cieplnego  i założone  roz- 
kłady pierwiastków  promieniotwórczych  oraz  prze- 
wodnictwa cieplnego.  Ponieważ  średni  strumień 
cieplny  na  oceanach  i kontynentach  jest  jednakowy, 
przy  równoczesnym  różnym  rozkładzie  pierwiastków 
promieniotwórczych  (grubsza  kontynentalna  skoru- 
pa ziemska  sugeruje  obecność  większej  ilości  tych 
pierwiastków  pod  kontynentami),  rozkłady  tempera- 
tury dla  oceanów  i kontynentów  są  zwykle  różne  do 
głębokości  kilkuset  kilometrów,  na  której  to  głębo- 
kości temperatura  jest  przypuszczalnie  jednakowa 
pod  kontynentami  i oceanami. 

Ponieważ  materiał  płaszcza,  z wyjątkiem  pewnych 
lokalnych  inkluzji,  znajduje  się  w stanie  stałym,  tem- 
peratura topnienia  materiału  stanowi  niewątpliwie 
górną  granicę  rozkładu  temperatury  w płaszczu. 


Teoria  ciała  stałego  wiąże  temperaturę  topnienia  Tm 
ośrodka  jednorodnego  z prędkościami  fal  w tym 
ośrodku  vp  i vs  relacją: 

Tm  = C(l/v*  4-1/r*)-1'3. 

Związek  ten  pozwala  na  określenie  temperatury  top- 
nienia aż  do  granicy  płaszcz-jądro  i pomimo,  iż  rów- 
nanie to  nie  jest  prawdziwe  w rejonie  przejść  fazowych, 
gdyż  współczynnik  C silnie  zależy  od  masy  cząstecz- 
kowej, uzyskana  krzywa  (Uffen,  1952  r.)  stanowi  do- 
syć realistyczne  oszacowanie  górnej  granicy  tempera- 
tury w dolnym  płaszczu  Ziemi. 

Temperatura  na  granicy  płaszcz-jądro  może  być 
określona  przez  ekstrapolację  temperatury  topnienia 
żelaza  w obszar  wysokich  ciśnień.  Metoda  ta  opiera 
się  na  wykorzystaniu  empirycznego  związku  między 
temperaturą  topnienia  a ciśnieniem  (podanego  przez 
Simona  w 1953  r.): 

p =al(T-T0)'- 1], 

gdzie  a i c są  stałymi,  a Tp  jest  temperaturą  odniesienia. 
Otrzymane  wyniki  są  jednak  wątpliwe,  gdyż  jądro 
Ziemi  prawdopodobnie  nie  jest  zbudowane  z czystego 
żelaza. 

Rozkład  temperatury  we  wnętrzu  Ziemi  może  być 
również  uzyskany  z danych  o przewodnictwie  elek- 
trycznym, jednakże  przy  bardzo  silnym  i nierealnym 
założeniu  co  do  stałości  fizykochemicznego  składu 
płaszcza  Ziemi.  Wszystkie  omówione  tu  oszacowania 
temperatury  we  wnętrzu  Ziemi  przedstawiono  na 
rys.  4. 
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Rys.  4.  Oszacowanie  rozkładu  temperatury  w płaszczu  Ziemi 


Rys.  3.  Rozkład  we  wnętrzu  Ziemi:  a)  gęstości,  b)  modułu  sprę- 
żystości, c)  przyspieszenia  ziemskiego  i ciśnienia 


Rozkład  przewodności  elektrycznej  we  wnętrzu 
Ziemi,  uzyskany  przez  analizę  zmian  magnetycznego 
pola  ziemskiego  oraz  przez  zastosowanie  metody  ma- 
gnetotellurycznej,  pozwalającej  określać  przewod- 
ność elektryczną  skał  w * zakresie  głębokości 
10-100  km,  przedstawiony  jest  na  rys.  5.  Ostatnia 
z wymienionych  metod  polega  na  równoczesnym  po- 
miarze pola  magnetycznego  i indukowanego  w Ziemi 
pola  elektrycznego. 

Przewodność  elektryczna  wody  morskiej  wynosi 
około  4 (Q  m)_1,  a nasyconych  wodą  skał  osadowych 
od  ok.  10-3  do  1 (Q  m)-1.  Przewodność  suchych  skał 
skorupy,  leżących  poniżej  skał  osadowych,  wynosi 
od  ok.  10~6  do  10~3  (H  m)-1.  Zewnętrzne  warstwy 
Ziemi  są  więc  słabo  przewodzące,  oprócz  silnie  prze- 
wodzącej warstewki  stworzonej  przez  oceany  i skały 
osadowe. 


własności 

elektryczne 
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Płaszcz  Ziemi  do  głębokości  ok.  400  km  jest 
zbudowany  prawdopodobnie  z krzemianów,  wśród 
których  dominuje  bogaty  w magnez  oliwin;  w dolnym 
płaszczu  fazę  stabilną  tworzą  prawdopodobnie  tlenki 
magnezu,  żelaza  i metakrzemiany.  Jądro  jest  złożone 


zachowują  się  praktycznie  jak  izolatory,  tzn.  ich  pas- 
mo walencyjne  jest  wypełnione,  a pasmo  przewodni- 
ctwa oddzielone  od  pasma  walencyjnego  skończoną 
przerwą  energetyczną.  Ze  względu  na  aktywacyjny 
zależność  charakter  przewodnictwa  zależność  przewodności  o 
przewodno-  od  temperatury  jest  następująca: 

ŚC>  °d  _ _A]kT 

temperatury  a ~ * 

gdzie  7*jest  temperaturą,  k — stałą  Boltzmanna,  a a0 
— pewną  stałą.  Zależność  tę  potwierdzono  labora- 
toryjnie dla  skał,  przy  czym  A równe  jest  2 E dla  prze- 
wodnictwa jonowego  ( E opisuje  energię  aktywacji) 
i E dla  przewodnictwa  domieszkowego  i elektrono- 
wego. a i E zwykle  zależą  od  ciśnienia  i temperatury. 
Najsilniejszy  wzrost  przewodności  z temperaturą  na- 
stępuje przy  T — E/2k.  W temperaturze  dużo  niższej 
przewodność  jest  niewielka  w porównaniu  z wartością 
<t0,  a w temperaturach  wyższych  od  T = Efk  asympto- 
tycznie zbliża  się  do  maksymalnie  możliwej  wartości, 
czyli  cr0. 

przewodność  Przewodność  oliwinu  wzrasta  od  wartości  niższej 
oliwi  nu  od  10“ 5 (£2  m)_1  w temperaturze  pokojowej  do  10~2 
w 1000°C.  Przewodnictwo  domieszkowe  (cr0  = 10-4- 
lO-sn-^m-1)  dominuje  w zakresie  temperatur  do 
kilkuset  °C.  Powyżej  około  700°C  przewodnictwo  elek- 
tronowe (<t0  5 £2-1  m-1)  wzrasta  silnie  i przewyższa 

przewodnictwo  domieszkowe.  Powyżej  ok.  1100°C 
przewodnictwo  jonowe  (er0  ~ 10h4  ft-Hn-1)  zaczyna 
silnie  dominować. 

Przewodnictwo  domieszkowe  jest  spowodowane 
obecnością  obcych  atomów  w sieci  kryształu,  co 
powoduje  nadmiar  elektronów  lub  dziur,  które  poru- 
szają się  w sieci  przy  przyłożeniu  siły  elektromoto- 
rycznej. Ten  typ  przewodnictwa  przypuszczalnie 
występuje  w suchych  skałach  skorupy  i najwyższych 
partii  płaszcza. 

Przewodnictwo  jonowe  jest  silnie  hamowane  przez 
ciśnienie.  Przewodnictwo  to  nie  gra  prawdopodobnie 
żadnej  roli  poniżej  głębokości  500  km,  gdyż  prawdo- 
podobnie temperatura  jest  tam  zbyt  niska  na  to,  by 
przewodnictwo  to  mogło  przewyższyć  przewodnictwo 
elektronowe,  wywołane  ciśnieniem  panującym  na  tej 
głębokości.  Jednakże  ten  typ  przewodnictwa  może 
tłumaczyć  względnie  wysoką  przewodność  warstwy 
zaczynającej  się  na  głębokości  ok.  75  km.  Warstwa  ta 
jest  przypuszczalnie  identyczna  z kanałem  niskich 
prędkości,  przy  czym  oba  efekty  spowodowane  są 
bliskością  punktu  topnienia  w tym  obszarze.  Prze- 
wodnictwo jonowe  jest  przypuszczalnie  dominujące 
w magmie,  a także  w obszarach  o temperaturach  bli- 
skich temperaturze  topnienia,  co  może  również  tłu- 


maczyć pewne  lokalne  anomalie  przewodności 
w górnych  obszarach  płaszcza. 

Przewodnictwo  elektronowe  jest  przypuszczalnie 
dominującym  procesem  przewodzenia  w strefie  przej- 
ściowej i w dolnym  płaszczu. 


Trzęsienia  ziemi 

W ciągu  jednego  roku  nawiedza  Ziemię  nie  mniej 
niż  milion  wstrząsów  sejsmicznych,  z czego  ok. 
100  000  rejestrują  sejsmografy.  Na  szczęście  są  to 
w większości  trzęsienia  bardzo  słabe,  wykrywalne  je- 
dynie przez  sejsmografy  o powiększeniach  przekracza- 
jących 100  000  razy.  Jedynie  kilkadziesiąt  trzęsień 
rocznie  powoduje  widoczne  zmiany  na  powierzchni 
Ziemi  (il.  203  i 204.  tabl.  54;  ii.  205  i 206,  tabl.  55), 
a ujmując  rzecz  staty  stycznie  — tylko  jedno  z nich 
ma  przebieg  katastrofalny  (zob.  str.  822). 

Mieszkamy  na  terenie,  który  należy  do  obszarów 
asejsmicznych.  W części  Karpat  leżącej  w granicach 
Polski  obserwuje  się  wprawdzie  bardzo  słabą  aktyw- 
ność sejsmiczną,  ale  duże  trzęsienia  ziemi  nam  nie  za- 
grażają. W różnych  częściach  kuli  ziemskiej  istnieją 
jednak  obszary  o silnej  sejsmiczności.  Tam  trzęsienia 
ziemi  powodują  śmierć  setek  tysięcy  ludzi  i ogromne 
zniszczenia  na  powierzchni.  Obok  wybuchów  wulka- 
nów, powodzi,  huraganów  i tornado  zjawiska  te  na- 
leżą do  najważniejszych  klęsk  żywiołowych  z uwagi  na 
częstość  występowania  i szerokie  rozprzestrzenienie. 
Ocenia  się,  że  w wyniku  trzęsień  zginęło  w obecnym 
tysiącleciu  co  najmniej  5 milionów  ludzi;  niektóre 
źródła  podają  liczby  dwukrotnie,  a nawet  trzykrotnie 
wyższe.  Badanie  procesów  fizycznych  zachodzących 
w obszarze  ogniska  trzęsienia  ziemi,  a także  rejestra- 
cja i analiza  związanych  z tymi  procesami  anomalii 
pewnych  parametrów  fizycznych  (prędkości  fal  sej- 
smicznych, namagnesowania  i przewodności  elek- 
trycznej skał,  koncentracji  radonu  w wodach  grunto- 
wych, ilości  i gęstości  występowania  słabych  trzęsień 
ziemi  itp.),  występujących  w obszarze  przyszłego  trzę- 
sienia ziemi,  stanowi  jeden  z podstawowych  celów 
sejsmologii  i jest  pierwszym  krokiem  ku  prawidłowym 
prognozom  katastrofalnych  trzęsień  ziemi. 


Procesy  fizyczne  w ognisku 

Trzęsieniem  ziemi  nazywamy  proces  nagłego  wyzwo- 
lenia energii  w stosunkowo  niewielkim  obszarze  we 
wnętrzu  Ziemi  zwanym  ogniskiem  trzęsienia.  Obszar 
położony  bezpośrednio  nad  ogniskiem  jest  nazywany  obszar 
obszarem  epicentralnym  i w nim  najsilniej  dają  się  od-  epicentralny 
czuć  skutki  trzęsienia. 

Trzęsienia  ziemi  klasyfikuje  się  w zależności  od  głę- 
bokości ogniska  w sposób  następujący:  0-70  km  — 
trzęsienia  płytkie,  70-300  km  — trzęsienia  średniogłę-  trzęsienia 
bokie,  300-720  km  — trzęsienia  głębokie.  Na  głębo-  płytkie, 
kościach  większych  od  720  km  nie  wykryto  żadnych  średniogłę- 
trzęsień  ziemi.  Ponad  75%  energii  wyzwala  się  w trzę-  bokie  i 
sieniach  płytkich  i jedynie  około  3%  — w trzęsieniach  głębokie 
głębokich.  Średnio  rocznie  w trzęsieniach  ziemi  wy- 
zwala się  ok.  1018  J,  przy  czym  większość  tej  energii 
w czasie  jednego  lub  kilku  największych  trzęsień.  Wy- 
zwalana energia  tylko  częściowo  przekształca  się 
w energię  fal  sejsmicznych;  duża  jej  część  przekształca 
się  bezpośrednio  w ciepło  na  skutek  tarcia  w płasz- 
czyźnie rozrywu  w ognisku  trzęsienia. 

Trzęsienie  ziemi  trwa  zwykle  krótko  — od  kilku  se- 
kund do  kilkunastu  minut,  często  jednak  po  głównym 
silnym  wstrząsie  następują  wstrząsy  następcze  (repli- 
ki), nieraz  przez  kilka  dni  lub  nawet  kilka  miesięcy, 
o sile  zwykle  malejącej,  czasem  jednak  prawie  równej 
sile  trzęsienia  początkowego. 

Trzęsienia  ziemi  należą  do  klasy  zjawisk  związanych 
z przekroczeniem  pewnej  granicy  krytycznej  (w  tym 
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wypadku  granicy  wytrzymałości  materiału  skalnego 
we  wnętrzu  Ziemi)  i mogą  być  wywoływane  przez  bar- 
dzo wiele  różnorodnych  czynników,  takich  jak  zmiana 
ciśnienia  atmosferycznego,  naprężenia  pływowe,  po- 
bliskie trzęsienia  ziemi,  niemożliwe  do  przewidzenia 
zjawiska  pełzania  materiału  w górnym  płaszczu  lub 
skorupie  ziemskiej,  czy  też  chwilowy  wzrost  naprężeń 
tektonicznych. 

Energia  wyzwalająca  się  w sposób  gwałtowny  w cza- 
sie trzęsienia  została  uprzednio  nagromadzona  w pro- 
cesie powolnej  akumulacji  naprężeń  tektonicznych  we 
wnętrzu  Ziemi.  Pierwotnym  źródłem  tej  energii,  a tak- 
że źródłem  energii  wielu  innych  procesów  geodyna- 
micznych,  jest  energia  cieplna  wnętrza  Ziemi. 

Większość  trzęsień  ziemi  to  trzęsienia  typu  tekto- 
nicznego, polegające  na  niestacjonarnym  rozwoju  jed- 
nej lub  kilku  szczelin;  w wypadku  trzęsień  powierzch- 
niowych szczeliny  te  wychodzą  na  powierzchnię  i są 
obserwowane  w postaci  głębokich  uskoków  przc- 
suwczych  na  powierzchni  Ziemi.  Przypuszczalnie 
możliwy  jest  również  inny  mechanizm  powstania  og- 
niska, sugerowany  głównie  dla  trzęsień  głębokich,  pole- 
gający na  szybkim  przejściu  fazowym  materiału  skal- 
nego w rejonie  ogniska  ze  stanu  metastabilnego,  w ja- 
kim znalazł  się  na  skutek  powolnych  ruchów  mas  skal- 
nych we  wnętrzu  Ziemi,  do  stanu  stabilnego,  odpo- 
wiadającego aktualnie  panującym  w tym  rejonie  wa- 
runkom temperatury  i ciśnienia. 


Fale  sejsmiczne 

W ognisku  materiał  skalny  ulega  nagłemu  przesunię- 
ciu i zniszczeniu  wzdłuż  pewnej  płaszczyzny,  zwanej 
płaszczyzną  ogniskową,  a sam  proces  w ognisku  jest 
przyczyną  powstania  fal  sejsmicznych.  W czasie  trzę- 
sień tektonicznych  fale  emitowane  są  w trakcie  niesta- 
cjonarnego rozprzestrzeniania  się  szczeliny. 

Ze  względu  na  panujące  we  wnętrzu  Ziemi  ciśnienie 
już  poniżej  górnych  20-30  km  szczeliny  te  są  wyłącznie 
szczelinami  ścinania;  w obrębie  skorupy  ziemskiej 
możliwe  bywają  również  szczeliny  otwarte,  obserwo- 
wane często  w rejonach  epicentralnych  silnych  po- 
wierzchniowych trzęsień  ziemi. 

W ognisku  generowane  są  różnego  rodzaju  fale, 
głównie  fale  objętościowe:  fale  podłużne  (zgęszczeń 
i rozrzedzeń),  zwane  falami  P (od  łac.  primae  — 
'pierwsze’,  gdyż  ich  prędkość  jest  większa  niż  innych 
rodzajów  fal  i dochodzą  one  najwcześniej  do  miejsca 
obserwacji)  i fale  poprzeczne  (fale  ścinania),  zwane  fa- 
lami S (od  łac.  secundae  — 'drugie’).  Po  dojściu  do  po- 
wierzchni swobodnej  Ziemi  fale  objętościowe  mogą 
generować  fale  powierzchniowe  Love’a  lub  fale  po- 
wierzchniowe Rayleigha,  w zależności  od  budowy 
warstwy  przypowierzchniowej  (rys.  6). 

Jak  wynika  z analizy'  pola  falowego  generowanego 
w trakcie  trzęsienia,  ruch  mas  skalnych  po  przeciw- 
nych stronach  płaszczyzny  ogniskowej  może  być  opi- 
sany prawidłowo  jako  wynik  działania  pary  sił  (rys. 
7a)  lub  podwójnej  pary  sił  bez  momentu  (rys.  7b). 
Przestrzeń  wokół  ogniska  trzęsienia  można  podzielić 
na  cztery  jednakowe  obszary,  w których  na  przemian 
pierwszy  ruch  fali  P (znak  fazy)  odpowiada  zgęszcze- 
niu  lub  rozrzedzeniu.  Jedna  z płaszczyzn  rozdzielają- 
cych te  obszary  to  właśnie  płaszczyzna  ogniska;  druga 
z nich  jest  prostopadła  do  pierwszej,  a obie  tworzą 
układ  tzw.  płaszczyzn  nodalnych.  Pole  falowe  fal  P 
emitowanych  w ognisku  trzęsienia  jest  identyczne  dla 
obu  modeli  mechanizmów  trzęsień,  tzn.  pary  sił  (rys. 
7c)  i podwójnej  pary  sił  bez  momentu  (rys.  7d),  nato- 
miast pole  falowe  fal  S jest  charakterystycznie  różne 
dla  obu  modeli  (rys.  7e,  f).  Tak  więc  analiza  pierw- 
szych ruchów  w fali  P pozwala  wyłącznie  na  określe- 
nie położenia  płaszczyzn  nodalnych,  z których  jedna 
odpowiada  płaszczyźnie  ogniska,  ale  nie  wiadomo 
która,  dopiero  równoczesna  analiza  pierwszych  ru- 
chów fali  S umożliwia  wydzielenie  z płaszczyzn  no- 
dalnych płaszczyzny  ogniskowej. 


W trzęsieniach  ziemi  wywołanych  szybką  przemianą 
fazową  znak  pierwszej  fazy  fali  Pjest  jednakowy  w ca- 
łej przestrzeni,  a więc  również  i na  powierzchni  Ziemi, 


fala  poprzeczna 
o pionowych-drganiach  (S) 


fala  Rayleigha 


fala  poprzeczna  Love’a 


Rys.  6.  Podstawowe  rodzaje  fal  sejsmicznych 


przy  czym  znak  ten  jest  określony  kierunkiem  przej- 
ścia fazowego. 

Badanie  położeń  płaszczyzn  ogniskowych  trzęsień 
ziemi  stanowi  źródło  cennych  informacji  o rozkładzie 
naprężeń  działających  we  wnętrzu  Ziemi  i o współ- 
czesnych ruchach  geodynamicznych. 

W ośrodku  sprężystym  mającym  powierzchnię  swo- 
bodną mogą  rozprzestrzeniać  się  — oprócz  fal  objęto- 


Rys.  7.  Układ  sił  w ognisku  trzęsienia:  a)  pojedyncza  para  sił 
(układ  sił  typu  I),  b)  podwójna  para  sił  (układ  sił  typu  II),  c)  i 
d)  pole  fal  P generowane  przez  pojedyncza  parę  sił  (c)  i podwójną 
parę  sił  (d),  e)  i f)  pole  fal  S generowane  przez  pojedynczą  parę 
sił  ( e ) i podwójną  parę  sił  (/) 


ściowych  — także  fale  powierzchniowe.  Są  to  fale  dłu- 
gie o znacznych  amplitudach  i one  to  powodują  naj- 
silniejszy wstrząs  podczas  trzęsienia.  Amplitudy  tych 
fal  maleją  odwrotnie  proporcjonalnie  do  pierwiastka 
z odległości  od  epicentrum,  podczas  gdy  amplitudy 
fal  objętościowych  maleją  odwrotnie  proporcjonalnie 
do  samej  odległości,  tak  więc  na  dużych  odległościach 
fale  powierzchniowe  zapisywane  są  wyraźniej,  niż  fale 
objętościowe.  Amplitudy  fal  powierzchniowych  ma- 
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leją  z głębokością  według  prawa  wykładniczego.  Fale 
powierzchniowe  wykazują  silną  dyspersję  (prędkości 
ich  silnie  zależą  od  długości  fali).  Analiza  długookre- 
sowych fal  powierzchniowych  jest  jedną  z najcenniej- 
szych metod  badania  wewnętrznej  struktury  Ziemi, 
a przede  wszystkim  budowy  skorupy  i górnych  warstw 
płaszcza. 

Dwa  najprostsze  typy  fal  powierzchniowych  to  fale 
Rayleigha  i fale  Love’a  (— ► Akustyczne  fale  po- 
wierzchniowe i ich  zastosowanie). 

Fale  Rayleigha  są  jedynym  rodzajem  fal  powierzch- 
niowych możliwych  w jednorodnej  przestrzeni  spręży- 
stej. Cząstki  ośrodka  zataczają  elipsy  w płaszczyźnie 
pionowej  równoległej  do  kierunku  rozchodzenia  się 
fal  (rys.  6).  Amplituda  fali  maleje  wykładniczo  wraz  ze 
wzrostem  odległości  od  powierzchni  swobodnej. 
W ośrodku  o stałej  Poissona  równej  0,25  prędkość  fal 
Rayleigha  vr  wynosi  0,92  vs , gdzie  vs  jest  prędkością 
fali  5. 

Fale  Rayleigha  ulegają  dyspersji,  jeżeli  własności 
mechaniczne  oraz  gęstość  ośrodka  zmieniają  się  wraz 
z odległością  od  powierzchni  swobodnej.  Fale  o dłu- 
gości 2 są  czułe  na  własności  sprężyste  i gęstość  ośrod- 
ka do  głębokości  2/5,  tak  więc  prędkość  fal  Ray- 
leigha na  powierzchni  Ziemi  zależy  od  długości  fali, 
przy  czym  im  większa  jest  długość  fali,  tym  głębsze 
warstwy  wpływają  na  jej  prędkość. 

Każdą  falę  można  rozłożyć  na  fale  płaskie  jedno- 
rodne i fale  niejednorodne,  z nich  tylko  fale  niejedno- 
rodne powodują  powstawanie  fal  powierzchniowych 
Rayleigha.  Płaskie  jednorodne  fale  padając  na  po- 
wierzchnię swobodną  nie  dają  fai  powierzchniowych 
i odwrotnie,  im  większa  jest  krzywizna  frontu  fali  pa- 
dającej, tym  silniejsze  są  fale  powierzchniowe.  Ponie- 
waż przy  ogniskach  głębokich  lub  przy  dużych  odle- 
głościach od  epicentrum  trzęsienia  front  fali  jest  pra- 
wie płaski,  to  powstające  fale  Rayleigha  są  bardzo 
słabe,  natomiast  silne  fale  Rayleigha  są  obserwowane 
w wypadku  ognisk  niegłębokich  i w rejonach  blisko 
epicentrum. 

Najprostszym  typem  struktury,  w której  mogą  roz- 
chodzić się  fale  Love’a,  jest  jednorodna  warstwa 
z jedną  powierzchnią  swobodną,  a drugą  leżącą  na 
jednorodnej  półprzestrzeni  sprężystej,  przy  czym  pręd- 
kość fali  S w warstwie  jest  mniejsza  niż  w półprze- 
strzeni. Drgania  odbywają  się  w płaszczyźnie  pozio- 
mej, prostopadłej  do  kierunku  rozchodzenia  się  fal. 
W obrębie  półprzestrzeni  amplituda  fali  maleje  wy- 
kładniczo z odległością  od  granicy  oddzielającej  pół- 
przestrzeń  od  warstwy.  Fale  Love’a  ulegają  dyspersji, 
przy  czym  ich  prędkość  fazowa  zmienia  się  od  warto- 
ści prędkości  fali  S w warstwie  (dla  bardzo  krótkich 
fal  Love’a)  do  prędkości  fal  S w półprzestrzeni  (dla 
bardzo  długich  fal  Love’a).  Fale  Loveła  istnieją  rów- 
nież w ośrodkach  o bardziej  skomplikowanej  budo- 
wie, tzn.  w ośrodkach  o większej  liczbie  warstw,  jeżeli 
tylko  prędkość  fal  S rośnie  wraz  z odległością  od  po- 
wierzchni swobodnej,  przy  czym  krzywe  dyspersji  tych 
fal  odzwierciedlają  strukturę  ośrodka. 

Skomplikowana  struktura  wnętrza  Ziemi  jest  przy- 
czyną tego,  że  rejestrowane  pole  falowe  jest  bardzo 
złożone  i oprócz  fal  objętościowych  i powierzchnio- 
wych obserwowane  są  również  i inne  typy  fal.  Ostat- 
nio np.  (1974  r.)  wykryto  fale  charakterystyczne  dla 
ośrodków  o złożonej  strukturze  wewnętrznej,  jak 
ośrodki  mikromorficzne  lub  mikropolame.  Fale  te 
rozchodzą  się  w rejonach  bliskich  epicentrum  niektó- 
rych trzęsień,  w obszarach  o silnie  zakłóconej  tekto- 
nice i wyraźnej  strukturze  blokowej.  Fale  te  charakte- 
ryzuje m.in.  rotacja  elementów  ośrodka  przy  przejściu 
fali  i one  to  przypuszczalnie  wywołują  dobrze  znane 
efekty  skręcenia  kolumn,  cokołów  pomników  i tym 
podobnych  elementów  architektonicznych  w obsza- 
rach epicentralnych  niektórych  silnych  trzęsień  ziemi. 

Analiza  pola  falowego  rejestrowanego  na  po- 
wierzchni Ziemi  jest  głównym  źródłem  informacji  o 
strukturze  wnętrza  oraz  współczesnych  ruchach  geody- 
namicznych  zachodzących  we  wnętrzu  naszej  planety. 


Drgania,  które  docierają  do  powierzchni  Ziemi 
w wyniku  trzęsienia,  składają  się  z ruchów  o różnych 
kierunkach,  z różnymi  amplitudami  i różnymi  okresa- 
mi. Bezpośrednie  rejestrowanie  takich  przestrzennych 
drgań  jest  niemożliwe  i dlatego  rozkłada  się  je  na  3 
wzajemnie  prostopadłe  składowe  i notuje  oddzielenie. 
Całość  zapisu  umożliwia  w pełni  odtworzenie  drgań 
przestrzennych  cząstek  podłoża. 

Zapis  trzęsienia  ziem  i 

Zapis  trzęsienia  ziemi,  zwany  sejsmogramem,  składa 
się  zazwyczaj  z trzech  zasadniczych  części : fazy  wstęp- 
nej (fale  objętościowe),  fazy  głównej  (fale  powierzch- 
niowe) i „ogona”  (rys.  8). 


Rys.  8.  Sejsmogram  trzęsienia  ziemi  w Turcji  (1909  r.)  zareje- 
strowany w stacji  Pułkowo  w Rosji  (wg  Galicyna) 


Bezpośrednio  biegnące  fale  P docierają  jedynie  do 
odległości  epicentralnej  A = 103°  (ok.  11  600  km); 
w odległościach  większych  (do  130°)  dają  się  zauważyć 
jedynie  słabe  ślady  fal  ugiętych  na  powierzchni  jądra. 
Dopiero  w odległości  142-145°  pojawiają  się  znowu 
bardzo  wyraźne  fale  podłużne,  jakkolwiek  znacznie 
opóźnione  (tzw.  fale  PKP).  Strefa,  do  której  fale  sej- 
smiczne nie  docierają  wskutek  odchylenia  przez  jądro 
ziemskie,  nazywa  się  „strefą  cienia”. 

Gdy  odległości  epicentralne  są  małe  faza  wstępna 
trwa  krótko:  ok.  1 min  przy  A — 500  km  i ok.  2 min 
przy  A = 2000  km,  po  czym  pojawiają  się  silniejsze 
impulsy  pochodzące  od  fal  powierzchniowych.  Wraz 
ze  wzrostem  odległości  epicentralnej  wzrasta  czas 
trwania  fazy  wstępnej.  Maksymalna  długość  fazy 
wstępnej  dochodzi  do  niespełna  1 h przy  A = 20  000 
km. 

W fazie  głównej  najdłuższymi  okresami  drgań  od- 
znaczają się  zawsze  fale  Loveła.  Gdy  odległości  epi- 
centralne są  średnie,  ich  okresy  wynoszą  12-20  s,  gdy 
duże  — przekraczają  nawet  1 min.  Przy  trzęsieniach 
średniogłębokich  i najgłębszych  (głębokość  ogniska 
700  km)  faza  główna  jest  bardzo  słabo  zaznaczona, 
bywa  też  czasem  zupełnie  niedostrzegalna. 

Gdy  odległości  epicentralne  są  małe,  nie  ma  zasad- 
niczych różnic  w zewnętrznym  wyglądzie  sejsmogra- 
mu  trzęsienia  płytkiego  i głębokiego,  prócz  tego,  że 
grupy  fal  P i S dla  trzęsień  głębokich  są  zwykle  wy- 
raźniejsze i mają  krótszy  okres. 

W polu  falowym  generowanym  przez  słabe  trzęsie- 
nia ziemi  dominują  fale  o krótkich  okresach  rzędu 
1 s lub  mniejszym.  Wielkie  trzęsienia  ziemi  generują 
fale  zarówno  krótkie  — jak  i długookresowe,  przy 
czym  fale  P mogą  mieć  okresy  nawet  rzędu  25  s,  a nie- 
które rodzaje  fal  powierzchniowych  okresy  osiągające 
wielkość  trzech  minut. 

Fale  krótkookresowe  są  tłumione  silniej  we  wnętrzu 
Ziemi  niż  długookresowe. 
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Badanie  wewnętrznej  budowy  Ziecru 

Kształt  zapisu  pola  falowego,  generowanego  w ogni- 
sku trzęsienia  ziemi,  określony  jest  przez  trzy  podsta- 
wowe czynniki,  a mianowicie:  proces  w ognisku  trzę- 
sienia (prędkość  rozrywu  w ognisku,  tarcie  w płasz- 
czyźnie rozrywu,  wielkość  naprężeń  tektonicznych 
wyzwolonych  w czasie  trzęsienia,  wielkość  i kształt 
płaszczyzny  rozrywu  itp.),  własności  Teologiczne 
i strukturę  ośrodka,  przez  który  przeszły  fale  na  dro- 
dze ognisko-rejestrator,  a także  charakterystykę  sa- 
mego urządzenia  rejestrującego.  Przyjęcie  pewnych 
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założeń  modelowych  dotyczących  procesu  w ognisku 
trzęsienia  i znajomość  charakterystyk  amplitudowych 
i częstościowych  sejsmografu  pozwala  na  wyodrębnie- 
nie informacji  o wewnętrznej  budowie  Ziemi. 

Prędkość  fal  sejsmicznych  jest  funkcją  własności 
mechanicznych  ośrodka,  tzn.  gęstości,  ściśliwości 
i sztywności  skał  we  wnętrzu  Ziemi.  Znajomość  pręd- 
kości fal  sejsmicznych  (rys.  9)  umożliwia  określenie 
zmian  tych  parametrów  wraz  ze  zmianą  głębokości 
oraz  pozwala  na  stawianie  hipotez  dotyczących  stanu 
wnętrza  Ziemi. 


Rys.  9.  Rozkład  prędkości  fal  sejsmicznych  P i 5 we  wnętrzu 
Ziemi 


Pierwszym  ważnym  krokiem  w tej  dziedzinie  było 
wyróżnienie  przez  R.  Oldhama  w 1897  r.  dwóch  ro- 
dzajów objętościowych  fal  sejsmicznych  (fal  P i S). 
Analiza  zapisów  trzęsień  ziemi  ujawniła  istnienie 
ciekłego  jądra  Ziemi,  obszaru  o mniejszej  prędkości 
fali  Py  otoczonego  grubym,  półplastycznym  płasz- 
czem. Granicę  pomiędzy  jądrem  a płaszczem  charak- 
teryzuje skokowa  zmiana  prędkości  fal  sejsmicznych 
(nieciągłość  Gutenberga,  rys.  10).  Nieciągłość  ta  może 
być  wywołana  zarówno  różnym  składem  chemicznym 
poszczególnych  warstw  jak  i zmianą  struktury  fazo- 
wej tego  samego  materiału  skalnego.  Skokowa  zmiana 
prędkości  występuje  również  pomiędzy  skorupą,  a 
płaszczem  Ziemi  (nieciągłość  Mohorowićicia),  w któ- 
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rym  prędkości  fal  P i S są  znacznie  większe,  niż  w sko- 
rupie. 

Analiza  zapisów  sejsmicznych  umożliwia  również 
wykrycie  stałego  jądra  wewnętrznego. 

Ostatnim  odkryciem  dotyczącym  rozpoznania  za- 
sadniczych elementów  struktury  Ziemi  było  wykrycie 
istnienia  silnie  plastycznej  warstwy  w górnym  płasz- 
czu (warstwa  ta  ma  różną  grubość  dla  fal  P i S)  o 
mniejszych  prędkościach  fal  sejsmicznych  — asteno- 
sfery.  Analizując  zapisy  trzęsień  zarejestrowane  w róż- 
nych punktach  powierzchni  Ziemi  można  ustalić  tory 
fal  sejsmicznych  w jej  wnętrzu  (rys.  1 1),  a tym  samym 
uzyskać  pewne  informacje  o gęstości  i własnościach 
mechanicznych  ośrodka,  przez  który  przechodzą. 


0 180° 


Rys.  11.  Tory  niektórych  typów  fal  sejsmicznych  we  wnętrzu 
Ziemi,  gdzie  P — oznacza  fale  podłużne  idące  przez  wnętrze 
Ziemi  bezpośrednio  z ogniska;  5 — analogiczne  faie  poprzeczne; 
PS  — fale  odbite  od  powierzchni  Ziemi,  biegnące  początkowo 
jako  podłużne,  a po  odbiciu  jako  poprzeczne,  SP  — fale  odbite 
od  powierzchni  Ziemi,  biegnące  początkowo  jako  poprzeczne, 
a po  odbiciu  jako  podłużne,  PP  — raz  odbite  od  powierzchni 
Ziemi  fale  podłużne,  55  — raz  odbite  od  powierzchni  Ziemi  fale 
poprzeczne,  PPP>  555,  PSP  itd.  — dwukrotnie  odbite  fale ; 
ich  charakter  jest  podany  przez  odpowiednie  litery,  PKP  — fala 
podłużna  przechodząca  przez  jądro  Ziemi  bez  odbicia  wewnątrz 
jądra,  ale  załamująca  się  na  jego  granicy  (litera  K — od  nie- 
mieckiego kernwellen  oznacza  fale,  które  przeszły  przez  jądro), 
PKS  — analogiczna  fala  podłużna  wychodząca  z jądra  jako  fala 
poprzeczna,  PKKP  — faia  podłużna  przechodząca  przez  jądro 
z jednym  odbiciem  wewnątrz  jądra  (przez  jądro  przechodzą  fale 
zawsze  jako  P , gdyż  jego  część  jest  w stanie  ciekłym) 


Cennym  źródłem  wiadomości  o budowie  skorupy 
i głównych  warstw  płaszcza  jest  analiza  krzywych 
dyspersji  fal  powierzchniowych. 

Współczesna  sejsmologia  coraz  dokładniej  rejestru- 
je szczegóły  wewnętrznej  budowy  Ziemi  i jej  warstw, 
ukazuje  różnice  w strukturze  wgłębnej  między  ocea- 
nem a kontynentem,  a także  między  różnymi  regio- 
nami Ziemi.  I tak  np.  grubość  skorupy  waha  się  od 
kilkunastu  kilometrów  w rejonie  oceanów  do  kilku- 
dziesięciu kilometrów  w niektórych  rejonach  konty- 
nentalnych, przy  czym  różnice  w strukturze  dotyczą 
nie  tylko  skorupy  Ziemi,  lecz  sięgają  również  głęboko 
w obszary  górnego  płaszcza. 

W przeciwieństwie  do  sejsmografów  dawniejszych, 
o wielkich  masach,  koniecznych  ze  względu  na  reje- 
strację mechaniczną,  ostatnio  buduje  się  sejsmografy 
o masach  niewielkich.  Jako  przykład  może  służyć  stru- 
nowy sejsmograf  Wooda  i Andersona,  w którym  masa 
wynosi  zaledwie  0,7  g.  Jest  ona  przymocowana  eks- 
centrycznie do  struny  wolframowej,  która  działa  w tym 
wypadku  jak  oś  obrotu.  Sejsmograf  ten  ma  rejestrację 
optyczną  i powiększa  400-2000  razy. 

Najstarszą  metodą  określania  wielkości  trzęsienia 
była  skala  intensywności  oparta  na  efektach  powierz- 
chniowych wstrząsu.  Niestety  efekty  te  nie  są  pro- 
porcjonalne do  energii  trzęsienia,  gdyż  silnie  zależą  od 
głębokości  ogniska  oraz  od  lokalnych  warunków  tek- 
tonicznych, tak  więc  skala  ta  nie  nadaje  się  do  prawid- 
łowej klasyfikacji  trzęsień  ziemi.  Obecnie  w celu  skla- 
syfikowania energii  trzęsienia  stosuje  się  skalę  instru- 
mentalną, tzw.  skalę  magnitud.  Wielkość  zwana  mag- 
nitudą  określana  jest  na  podstawie  amplitudy  maksy- 
malnych ruchów  cząsteczek  gruntu  i jest  związana 
z energią  trzęsienia.  Dla  trzęsień  głębokich,  generują- 
cych niewiele  fal  powierzchniowych,  wprowadzono 
inną  skalę  magnitud,  związanych  z maksymalną  am- 
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plitudą  fal  objętościowych.  Obie  skale  są  ze  sobą  zwią- 
zane tak,  że  możliwe  jest  porównywanie  trzęsień  płyt- 
kich i głębokich. 

Energia  najsilniejszych  obserwowanych  trzęsień 
ziemi  jest  szacowana  na  1018  dżuli. 

Sejsmiczność  Ziemi 

Mapy  rozmieszczenia  obszarów  epicentralnych  na  ca- 
łym świecie  wykazują  istnienie  dwu  głównych  stref 
strefy  sejmicznych:  okołopacyficznej  oraz  śródziemnomor- 
sejsmiczne  skiej  (rys.  12). 

Strefa  okołopacyficzna  (tzw.  ando-japońsko-malaj- 
ska)  biegnie  dookoła  Oceanu  Spokojnego.  Do  strefy 
tej  włączone  są  nie  tylko  wybrzeża  lądu  stałego  i wys- 
py, ale  także  znaczne  obszary  morskie,  w których  sil- 
nym trzęsieniom  ulega  dno,  zwłaszcza  w obrębie  głę- 
bokich rowów  oceanicznych.  Strefa  ta  jest  siedliskiem 


ziemi  było  trzęsienie  assamskie  w 1897  r.  o epicentrum  leżącym  w 
prowincji  Assam,  między  Himalajami  a Zatoką  Bengalską.  Trzę- 
sienie trwało  niecałe  3 minuty,  a obszar  całkowitego  zniszcze- 
nia objął  100  tys.  km*.  Szereg  domów  zbudowanych  na  bardzo 
miękkim  gruncie  pogrążyło  się  w nim  aż  do  poziomu  dachów. 
W pobliżu  epicentrum  powstały  liczne  uskoki,  największy  z 
nich  miał  długość  20  km,  przy  czym  jedna  jego  strona  góro- 
wała o 10  m nad  drugą.  Wstrząsy  następcze  w tym  rejonie 
trwały  ponad  półtora  roku. 

Wielkie  trzęsienie  ziemi,  które  nawiedziło  Kalifornię  18  kwiet- 
nia 1906  r.  (il.  205  a,  tabl.  55)  zasługuje  na  szczególną  uwagę  ze 
względu  na  wyjątkowe  rozmiary  ruchów  tektonicznych,  które 
były  jego  przyczyną.  Widoczne  na  powierzchnj  przemieszczenia 
poziome  wzdłuż  znanego  geologom  uskoku  tektonicznego  San 
Andreas  (il.  204,  tabl.  54)  ciągnęły  się  na  przestrzeni  około 
430  km,  największe  z nich  wynosiły  6,5  m.  Obszar  najsilniej  zni- 
szczony miał  kształt  wąskiego  pasa  ciągnącego  się  wzdłuż  usko- 
ku. Trzęsienie  trwało  jedynie  ok.  40  s,  a wstrząsy  następcze 
trwały  ok.  półtora  roku;  niektóre  z nich  osiągnęły  duże  natężenie. 
Bardzo  silnym  było  również  trzęsienie  w 1923  r.,  którego  ogni- 
sko leżało  pod  dnem  morskim  zatoki  Sagami,  w odległości  około 
90  km  od  Tokio  i 65  km  od  Jokohamy.  Jak  to  miało  miejsce 
podczas  trzęsienie  w San  Francisco,  rozmiary  katastrofy  zostały 
kilkakrotnie  powiększone  przez  pożary.  W samej  Jokohamie 
zginęło  27  tys.  osób,  40  tys.  osób  zostało  rannych,  a 70  tys. 


Rys.  12.  Rejony  sejsmiczne 
świata:  obszary  o silnym  na- 
tężeniu trzęsień  - ciemne,  ob- 
szary asejsmiczne  — szare 


80%  trzęsień,  w tej  liczbie  wielu  trzęsień  katastrofal- 
nych, 40%  płytkich  ognisk,  90%  średniogłębokich 
i wszystkich  głębokich. 

Strefa  śródziemnomorska  zorientowana  jest  prawie 
równoleżnikowo;  zawiera  ona  ogniska  średniej  głę- 
bokości. 

obszary  Przeciwieństwem  stref  sejsmicznych  są  obszary 
asejsmiczne  asejsmiczne,  pokrywające  wielkie  tarcze  lądowe  spo- 
czywające na  starych  cokołaęh  kontynentalnych,  w 
których  ustały  już  ruchy  górotwórcze.  Do  obszarów 
asejsmicznych  należą:  basen  Oceanu  Spokojnego 
(z  wyjątkiem  Wysp  Hawajskich),  płyta  kanadyjska, 
płyta  brazylijska,  płyta  eurazjatycka,  Afryka  (z  wy- 
jątkiem wybrzeży  Morza  Śródziemnego  i górnego  do- 
rzecza Nilu),  Antarktyda  i inne  drobniejsze  połacie 
kuli  ziemskiej. 

trzęsienia  w Strefach  sejsmicznych  co  jakiś  czas  zdarzają  się  trzęsienia 
cata^trofaine  2*cm*  ° przebiegu  katastrofalnym.  Jedną  z najcięższych  kata- 
° strof  sejsmicznych  w historii  było  trzęsienie  ziemi  lizbońskie 

w 1755  r.  Obszar  dotknięty  zniszczeniami  był  niezwykle  roz- 
legły i objął  południowo-zachodnią  Europę  i północno-wschod- 
nią Afrykę.  Zginęło  ok.  60  000  mieszkańców  Lizbony,  mia- 
sta, które  liczyło  wówczas  235  000  mieszkańców.  Zniszcze- 
niu uległo  3/4  miasta.  Na  wodach  stawów  i jezior,  nawet  znaj- 
dujących się  w znacznej  odległości  od  epicentum,  trzęsienie 
wzbudziło  sejsze  (długotrwałe  oscylacje  poziomu  wody  o czę- 
stościach równych  częstościom  własnym  danego  zbiornika);  oscy- 
lacje jeziora  w Loch  Lomond  w Szkocji  trwały  półtorej  godzi- 
ny. Rzeka  Trave  w Lubece  podniosła  nagle  swój  poziom  o 
1,5  m.  Obszar,  na  którym  wstrząsy  były  wyraźnie  odczuwalne, 
oceniany  jest  na  co  najmniej  1,5- 10*  km*. 

Katastrofalne  trzęsienia  ziemi,  ze  względu  na  ogrom  strat  i zni- 
szczeń, silnie  pobudzały  rozwój  nauki  o trzęsieniach  ziemi.  Pier- 
wszym naukowo  dobrze  udokomentowanym  silnym  trzęsieniem 


domów  uległo  całkowitemu  zniszczeniu.  Jedenastometrowa  fala 
morska  (tzw.  tsunami)  spowodowana  trzęsieniem  wyrządziła 
wiele  szkód  na  wybrzeżu.  Trzęsienie  to  stanowiło  jedną  z naj- 
cięższych katastrof  sejsmicznych  w dziejach  ludzkości,  zginęło 
99  tys.  osób.  Równocześnie  było  ono  pierwszym  z wielkich 
trzęsień  dokładnie  zarejestrowanych  przez  nowoczesne  sejsmo- 
grafy we  wszystkich  obserwatoriach  świata. 

Największe  straty  ponosi  się,  gdy  epicentum  znajduje  się  w po- 
bliżu dużych  skupisk  ludzkich.  W 1960  r.  na  skutek  trzęsienia 
ziemi  prawie  całkowicie  został  zniszczony  Agadir  i zginęła  1/3 
mieszkańców  miasta  (11  tys.  osób).  Trzęsienie  to  było  6 tys.  razy 
słabsze,  niż  trzęsienie  z San  Francisco,  ale  epicentrum  trzęsienia 
leżało  w odległości  paru  zaledwie  kilometrów  od  granic  miasta. 
Ostatnio  takie  katastrofalne  trzęsienie  ziemi  miało  miejsce  we 
Włoszech  10  stycznia  1981  r.,  epicentrum  znajdowało  się  wpo- 
blżu  miejscowości  AveIlino.  Zginęło  tam  ok.  3 tys.  osób. 


Prognozowanie  trzęsień  ziemi, 
sztuczne  trzęsienia 

Niektóre  zjawiska  sejsmiczne  w regionach  o prostej 
strukturze  tektonicznej  i dokładnie  znanym  mechaniz- 
mie trzęsień  mogą  być  całkowicie  prawidłowo  przewi- 
dziane, podczas  gdy  w złożonej  sytuacji  tektonicznej 
możliwe  są  jedynie  prognozy  oparte  na  probabilistyce 
i dokładnej  znajomości  historii  sejsmicznej  danego  re- 
gionu. Ten  ostatni  typ  prognoz  oparty  jest  na  dokład- 
nej rejestracji  miejsc  występowania  i siły  poszczegól- 
nych trzęsień  ziemi,  co  w zestawieniu  z tektoniką 
danego  obszaru  pozwala  na  wykreślenie  map  sejsmicz- 
ności, z uwzględnieniem  rejonów  niebezpiecznych 
sejsmicznie.  Zakłada  się  tu  stałość  reżimu  sejsmiczne- 
go w obrębie  danej  jednostki  tektonicznej,  tzn.  zakła- 


822 


da  się,  że  jeżeli  w danym  regionie  miało  miejsce  silne 
trzęsienie  ziemi,  to  może  się  ono  powtórzyć  z tą  samą 
siłą  w obrębie  tej  samej  jednostki  tektonicznej.  Ze 
względu  na  występowanie  tzw.  cykli  sejsmicznych 
mapy  sejsmiczności  uwzględniają  również  powtarzal- 
ność silnych  trzęsień. 

Mapy  sejsmiczne  umożliwiają  obecnie  precyzyjną 
prognozę  miejsca  i siły  przyszłego  trzęsienia  ziemi, 
natomiast  jedyną  nadzieją  na  prawidłowe  prognozy 
momentu  wystąpienia  takiego  zjawiska  jest  znalezienie 
zjawisk  fizycznych,  poprzedzających  trzęsienie,  czyli 
zjaw-isk  towarzyszących  akumulacji  naprężeń  w rejonie 
ogniska  przyszłego  trzęsienia  ziemi.  Zjawiska  te  są 
obecnie  intensywnie  badane;  mniej  systematyczne 
poszukiwania  były  prowadzone  już  od  prawie  stu  lat, 
zjawiska  jednakże  bez  widocznych  wyników.  Zjawiska  te  są 
poprzedza-  związane  ze  wzrostem  naprężeń  w pewnym  rejonie 
jące  wnętrza  Ziemi.  Należą  do  nich:  zmiany  prędkości  fal 
trzęsienie  P i S,  spowodowane  wzrostem  ilości  drobnych  szczelin 
w obszarze  przyszłego  ogniska  (przy  czym  prędkość 
fal  P ulega  zmianie  nawet  do  20%,  a prędkość  fal 
S — o kilka  procent),  powolna  ciągła  deformacja  po- 
wierzchni Ziemi  mająca  miejsce  przed  niektórymi  sil- 
nymi płytkimi  trzęsieniami  ziemi,  zmiany  przewod- 
nictwa elektrycznego  mas  skalnych  w rejonie  przy- 
szłego ogniska,  zmiany  niektórych  parametrów  ziem- 
skiego pola  magnetycznego,  anomalne  zmiany  po- 
ziomu w'ody  (rys.  13-15  prezentują  rejestracje  niektó- 
rych z tych  efektów  przed  i w trakcie  silnych  trzęsień 
ziemi). 

Współcześnie  (Nur,  1972  r.)  opracowano  model  wy- 
jaśniający wiele  z obserwowanych  zjawisk  poprzedza- 
jących silne  płytkie  trzęsienia  ziemi.  W modelu  tym 
wzrost  naprężeń  prowadzi  do  obserwowalnego  roz- 
szerzenia (dylatacji)  naprężonego  regionu,  co  w na- 
stępstwie powoduje  przepływ  wody  zawartej  w porach 
i szczelinach  skał  otaczających  ten  obszar  w głąb  roz- 
szerzonego regionu.  Ten  przepływ  wody  powoduje 
wzrost  ciśnienia  cieczy  w porach  skał  w napreżonvm 
obszarze  oraz  nasycenie  wodą  porów  i szczelin,  co 
może  być  bezpośrednią  przyczyną  trzęsienia.  Obec- 
ność dodatkowej  ilości  cieczy  w naprężonym  rejonie 
może  wywołać  zmianę  przewodnictwa  elektrycznego 
skał,  a globalna  deformacja  mogłaby  być  przyczyną 
obserwowanych  deformacji  powierzchniowych,  po- 
przedzających niektóre  silne  płytkie  trzęsienia  ziemi. 
Model  ten  tłumaczy  również  obserwowane  zmiany  po- 
ziomu wód  gruntowych.  Obecnie  prowadzone  syste- 


cm 

Rys.  13.  Anomalne  zmiany  wysokości  n.p.m.  zanotowane  przed 
trzęsieniem  Ziemi  w Niigata  w 1964  r. 


Rys.  14.  Anomalne  zmiany  wysokości  n.p.m.  zarejestrowane 
przed  taszkenckim  trzęsieniem  ziemi  w 1966  r.,  pokazujące  trzy 
fazy  a,  fł,  y deformacji  skorupy  ziemskiej:  a)  i b)  pomiary  były 
robione  przy  samym  epicentrum,  c)  i d)  daleko  od  epicentrum 
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trzęsienie  ziemi  w Niigata 


Rys.  15.  Zmiany  średniej  miesięcznej  poziomu  morza  przed 
trzęsieniem  ziemi  w Niigata  w 1964  r. 


matyczne  badania  nad  zjawiskami  poprzedzającymi 
silne  trzęsienia  ziemi  mają  na  celu  m.in.  udokumen- 
towanie prawdziwości  tego  modelu  lub  też  znalezienie 
innego,  właściwego  opisu  obserwowanych  procesów 
fizycznych. 

Seria  nieoczekiwanych  odkryć,  poczynionych  w cią- 
gu ostatnich  kilkunastu  lat,  a konkretnie  od  wczesnych 
lat  sześćdziesiątych,  rzuciła  światło  na  możliwości 
kontrolowania  trzęsień  ziemi  oraz  wywoływania 
sztucznych  trzęsień.  Odkrycia  te  dotyczą  zjawisk  sej- 
smicznych wyzwalanych  przy  tworzeniu  dużych  zbior- 
ników wodnych  oraz  przy  wpompowywaniu  cieczy 
w głąb  szybów  (jest  to  metoda  usuwania  szkodliwych 
odpadów  radioaktywnych  i chemicznych).  Po  raz 
pierwszy  zjawiska  takie  zarejestrowano  we  wczesnych 
latach  40-ych  bieżącego  stulecia  przy  budowie  zapory 
wodnej  Hoover  Dam  na  jeziorze  Mead  w USA ; po- 
wstały zbiornik  wodny  wyzwolił  w uprzednio  asej- 
smicznym rejonie  wiele  słabych  trzęsień  ziemi  o epi- 
centrach wyraźnie  koncentrujących  się  wokół  zbior- 
nika. Analogiczne  zjawisko  wystąpiło  w rejonie  zbior- 
nika Koyna  w Indiach,  napełnianego  w latach  1962- 
65,  przy  czym  w dwa  lata  po  zakończeniu  napełniania 
zbiornika  (1967  r.)  miało  tam  miejsce  silne  trzęsienie 
ziemi  (177  osób  zginęło,  a 2300  zostało  rannych).  To 
ostatnie  trzęsienie  było  potwierdzeniem  wcześniej 
zauważonego  braku  korelacji  czasowej  pomiędzy  po- 
ziomem wody  w zbiorniku,  a powstającymi  trzęsie- 
niami ziemi;  jak  obecnie  wiadomo,  wzmożona  sej- 
smiczność ma  zwykle  pewne  opóźnienie  czasowe  w 
stosunku  do  wzrostu  ciężaru  wody  w zbiorniku,  jed- 
nakże w niektórych  wypadkach  to  opóźnienie  jest 
bliskie  zeru.  Wyzwalanie  zjawisk  sejsmicznych  w rejo- 
nie dużych  zbiorników  wodnych  było  obserwowane 
jeszcze  wielokrotnie.  Obecnie  wiadomo  już,  że  nie 
zawsze  budowa  dużego  zbiornika  wodnego  wyzwala 
w danym  rejonie  zjawiska  trzęsień  ziemi  (jako  przy- 
kład służyć  może  budowa  zapory  w-odnej  Grand 
Coulee,  USA,  gdzie  nie  zarejestrowano  żadnych  trzę- 
sień ziemi).  O ile  zjawiska  te  występują,  są  one  zwią- 


sztuczne 

trzęsienia 


położenie  200  min.  lat  temu 


- - kierunek  ruchu  kontynentów 
Rys.  16.  Wędrówka  kontynentów 
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zane  przypuszczalnie  z uaktywnieniem  istniejących 
w tym  obszarze  starych  uskoków  tektonicznych  na 
skutek  ciężaru  wody  w zbiorniku  oraz  przenikania 
cieczy  w pory  i szczeliny  otaczających  zbiornik  mas 
skalnych. 

Tego  samego  typu  efekty  związane  są  z wpompo- 
wywaniem  cieczy  w głąb  głębokich  szybów,  co  zareje- 
strowano po  raz  pierwszy  w Denver  w stanie  Colora- 
do (USA)  w latach  1961-65  (głębokość  szybu  wynosi- 
ła ponad  3,5  km).  Wyzwalane  trzęsienia  są  zwykle 
trzęsieniami  słabymi,  co  sugeruje  możliwość  kontro- 
lowanego powolnego  wyzwalania  energii  sejsmicznej 
w rejonach  o dużym  niebezpieczeństwie  katastrofal- 
nych trzęsień  ziemi,  jednakże  zebrane  dotychczas  in- 
formacje są  jeszcze  niewystarczające  do  stosowania 
takich  metod  w praktyce. 


Globalne  teorie  geodynamiczne 

Już  wiele  lat  temu  zauważono  szczególne  podobień- 
stwo linii  brzegowych  poszczególnych  kontynentów, 
głównie  zwrócono  uwagę  na  prawie  identyczny  zarys 
zachodniego  wybrzeża  Afryki  i wschodniej  linii  brze- 


odbicie  w pracach  niem.  naukowca  A.  von  Humbold- 
ta. Przez  cały  XIX  w.  gromadzono  dowody  ruchu 
kontynentów  polegające  na  przyporządkowaniu  sobie 
identycznych  warstw  skalnych  i skamieniałości  orga- 
nicznych występujących  na  brzegach  obu  tak  odle- 
głych od  siebie  lądów  jak  Afryka  i Ameryka  Południo- 
wa, jednakże  dopiero  w XX  w.  zaczęto  na  serio  roz- 
ważać możliwość  ruchu  kontynentów  jako  całości. 

Po  raz  pierwszy  myśl  tę  zaprezentował  geolog  ame- 
rykański Frank  B.  Taylor  w latach  1908-10,  jednakże 
idea  ta  jest  znana  głównie  z prac  meteorologa  i teore- 
tyka niem.  A.  Wegenera,  z których  pierwszą  przed- 
stawił w 1912  r.  W swojej  pracy  „Pochodzenie  konty- 
nentów i oceanów”,  opublikowanej  w 1915  r.,  Wege- 
ner  przedstawił  teorię  ruchu  lekkich  granitowych  mas 
kontynentalnych  po  cięższym  bazaltowym  podłożu 
den  oceanicznych,  ruchu  wywołanego  ruchem  obroto- 
wym Ziemi.  Rozpad  pierwotnego  superkontynentu 
miał  miejsce  wg  Wegenera  „miliony  lat  temu”.  Kon- 
serwatywnie mysiący  geologowie  odrzucili  zdecydo- 
wanie tę  teorię.  Nie  zrażony  negatywnym  przyjęciem 
Wegener  wielokrotnie  ponownie  przedstawiał  udosko- 
nalone wersje  swej  teorii  ruchu  kontynentów.  Zmarł 
w 1930  r.  podczas  wyprawy  meteorologicznej  na 
Grenlandię,  w czasie,  gdy  jego  teoria  była  ciągle  cał- 
kowicie negowana. 


Grzbiet  Śródatlantycki 


Ocean— Atlantycki 


Rys.  17.  Przesuwanie  się  płyt  tektonicznych  i powstawanie  Grzbietu  Śródatlantyckiego 


gowej  Ameryki  Południowej.  W 1620r.  F.  Bacon  wy- 
raził pogląd,  iż  trudno  przypuścić,  by  zbieżność  taka 
była  całkowicie  przypadkowa,  chociaż  nie  mógł  on 
sobie  wyobrazić  mechanizmu,  który  byłby  odpowie- 
dzialny za  to  zjawisko.  W połowie  XVII  w.  Francuz 


Sytuacja  nie  uległa  zmianie  aż  do  II  wojny  świato- 
wej, po  której,  w wyniku  rozwinięcia  i zastosowania 
nowych  technik  instrumentalnych  badania  den  oce- 
anicznych, a także  rejestrowania  fal  sejsmicznych, 
uzyskano  bardzo  wiele  nowych  informacji.  Przede 
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Rys.  18.  Przekrój  schematyczny  przez  skorupę  ziemską  wzdłuż  równika  — ukazuje  ukształtowanie  kontynentów  i den  oceanicz- 
nych. Widać  Grzbiet  Południowoatlantycki  i głębokie  rowy  w Oceanie  Spokojnym. 


F.  Placet  zasugerował,  iż  rozbicie  kontynentów  na 
istniejące  obecnie  miało  miejsce  w czasie  czterdziesto- 
dniowej powodzi  opisywanej  przez  Biblię.  Pogląd  ten 
utrzymał  się  aż  do  początków  XIX  w.  i znalazł  swe 


wszystkim  zwrócono  uwagę  na  ogromne  łańcuchy  gór- 
skie wyrastające  z dna  oceanów  (zob.  rys.  18).  Naj- 
większym i najciekawszym  z nich  okazał  się  Grzbiet 
Śródatlantycki,  ciągnący  się  na  przestrzeni  19  tys.  km, 
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system  większy  niż  Andy,  Góry  Skaliste  i Himalaje 
wzięte  razem.  Przebieg  podwodnego  grzbietu  zgadzał 
się  z zarysem  dodatniej  anomalii  ziemskiego  strumie- 
nia cieplnego,  grzbietowi  towarzyszyła  także  słaba 
aktywność  sejsmiczna  i wulkaniczna.  Przez  środek 
rozsuwanie  grzbietu  przebiegała  długa,  wąska  dolina,  tzw.  bruzda 
się  dna  grzbietowa.  Wysunięto  hipotezę,  że  nowa  skorupa 
oceanów  ziemska  powstaje  właśnie  w rejonie  tej  bruzdy,  wy- 
pływając powoli  z głębszego  wnętrza  Ziemi,  a następ- 
nie oziębia  się  i rozsuwa  na  boki,  przy  czym  procesowi 
temu  towarzyszą  trzęsienia  ziemi  i wybuchy  wulka- 
nów. Zgodnie  z tą  teorią  dna  oceanów  rozszerzają  się, 
powodując  rozsuwanie  się  kontynentów  z prędkością 
kilku  centymetrów  rocznie.  W innych  miejscach  tego 
systemu,  w rejonie  głębokich  rowów  oceanicznych, 
związanych  również  z głębokimi  trzęsieniami  ziemi, 
stara  skorupa  ziemska  znika  we  wnętrzu  Ziemi,  jest 
wciągana  w głąb,  pod  kontynenty, 
badania  Teoria  rozprzestrzeniania  się  den  oceanicznych  zna- 
paleo-  lazła  swe  potwierdzenie  w badaniach  paleomagnetycz- 
magnetyczne  nych.  Badania  paleomagnetyczne  to  pomiary  tej  skła- 
dowej namagnesowania  skały,  która  powstała  w mo- 
mencie tworzenia  się  skały  i oddaje  wartość  i kierunek 
pola  magnetycznego  w tym  momencie  czasu.  Prowa- 
dzone intensywnie  w latach  sześćdziesiątych  badania 
paleomagnetyczne  wykazały,  że  skorupa  ziemska  rze- 
czywiście tworzy  się  w rejonie  bruzdy  śródgrzbieto- 
wej,  ulegając  następnie  rozsunięciu  na  boki;  pomiary 
te  pozwoliły  również  na  określenie  prędkości  tego  pro- 
cesu. Równocześnie  analizowanie  wieku  badanych 
skał  pozwoliło  na  uzyskanie  obrazu  powolnych,  glo- 
balnych wędrówek  kontynentów. 

Zgodnie  z tą  teorią  jeszcze  200  min  lat  temu  obszary 
Pangea  lądowe  tworzyły  jeden  ogromny  superkontynent,  Pan- 
geę  (tak  jak  postulował  Wegener),  oblany  jednym  tyl- 
Panthalassa  ko  oceanem,  Panthalassą.  Około  180  min  lat  temu  ten 
gigantyczny  kontynent  rozpadł  się  początkowo  na  dwa 
Laurazja  bloki  (rys.  16):  północny  — Laurazję,  złożony  z Ame- 
ryki Północnej,  Europy  i Azji,  oraz  południowy  — 
Gondwana  Gondwanę,  złożony  z Afryki,  Ameryki  Południowej, 
Antarktydy,  Australii  i Indii.  135  min  lat  temu  pojawił 
się  grzbiet  rozdzielający  Afrykę  i Amerykę  Południo- 
wą, które  zaczęły  oddalać  się  od  siebie.  Afryka  oddzie- 
liła się  od  Antarktydy,  również  Indie  oderwały  się 
i przesunęły  o 8 tys.  km  na  północ,  zderzając  się  z Azją 
około  40  min  lat  temu.  W wyniku  zderzenia  uległ  wy- 
piętrzeniu łańcuch  Himalajów.  Teoria  przewiduje 
również  dalszy  ruch  kontynentów;  Australia  ma  kon- 
tynuować posuwanie  się  na  północ,  oba  oceany: 
Atlantycki  i Indyjski  mają  się  nadal  rozszerzać, 
a Morze  Śródziemne  kurczyć. 

Współcześnie  najszerzej  akceptowaną  globalną 
teorią  dotyczącą  procesów  geodynamicznych  jest  tzw. 
tektonika  płyt,  powstała  w końcu  lat  sześćdziesiątych, 
a właściwie  jej  zmodernizowana  wersja,  zwana  nową  te- 
ktoniką globalną,  opracowywana  obecnie.  Zasadniczą 
ideą  jest  istnienie  kilkunastu  różnej  wielkości  płyt  (lub 


bloków)  tektonicznych,  na  obrzeżach  których  zew- 
nętrzna warstwa  Ziemi  ulega  silnej  deformacji.  Ry- 
sunek 16  przedstawia  jak  zmieniały  się  te  płyty. 

Grubość  poszczególnych  płyt  szacowana  jest  na  50- 
100  km.  Aktywność  tektoniczna  koncentruje  się  w wą- 
skich strefach  brzegowych,  przy  czym  odróżnia  się 
trzy  podstawowe  rodzaje  granic  pomiędzy  płytami: 
obszary,  w których  ma  miejsce  rozszerzanie  się  grani- 
cy i gdzie  powstaje  nowa  skorupa  ziemska  (grzbiety 
śródoceaniczne),  obszar  kompresji,  gdzie  skorupa 
ulega  zniszczeniu  w wyniku  zachodzenia  na  siebie  dwu 
płyt,  oraz  tzw.  uskoki  przesuwcze  (rys.  17, 18),  gdzie 
płyty  poruszają  się  równolegle  do  siebie  i skorupa  ani 
nie  jest  produkowana,  ani  też  nie  ulega  destrukcji. 

Teoria  płyt  zawiera  w sobie  wcześniejsze  teorie  roz- 
szerzania się  den  oceanicznych  w wyniku  tworzenia 
się  nowej  skorupy  w regionach  grzbietów  śródoce- 
anicznych  oraz  teorię  wędrówek  kontynentów,  zasu- 
gerowaną przez  Wegenera.  W swym  pierwotnym 
kształcie  teoria  tektoniki  płyt,  a także  obecna  nowa 
tektonika  globalna  stanowią  próbę  globalnego  opisu 
i interpretacji  wielu  różnorodnych  zjawisk,  jednak  bez 
wyjaśnienia  ich  pierwotnego  mechanizmu,  jakkolwiek 
dotychczas  sugerowano  wiele  bardzo  różnych  me- 
chanizmów mających  stanowić  siłę  napędową  obser- 
wowanych zjawisk ; sprawa  ta  jest  jeszcze  nie  wyjaś- 
niona i stanowi  jeden  z najciekawszych  otwartych  pro- 
blemów, przed  którymi  stoi  współczesna  nauka.  Za 
najciekawsze  rozwiązanie  uważa  się  obecnie  teorię 
konwekcji  cieplnej  występującej  w niektórych  obsza- 
rach górnego  płaszcza;  równocześnie  jednak  istnieje 
wiele  innych  teorii.  Problem  ten  powinien  uzyskać 
rozwiązanie  już  w ciągu  najbliższych  kilku  lat,  w czasie 
realizowanego  obecnie  Projektu  Geodynamicznego. 
W ramach  tego  programu  prowadzone  są  intensywne 
badania  całości  zjawisk  geodynamicznych,  a także 
szczególnie  dokładnie  badane  są  najciekawsze  z punk- 
tu widzenia  tych  zjawisk  obszary  globu,  jak  np.  rejon 
Grzbietu  Śródatlantyckiego,  tzn.  obszar,  w któ- 
rym powstaje  nowa  skorupa  ziemska  (zob.  rys.  17). 
W ramach  trzyletniego  francusko-amerykańskiego 
planu  badań,  nazwanego  FAMOUS  (French-Ameri- 
can  Mid-Ocean  Undersea  Study),  w latach  1973-1975 
przebadano  dokładnie  wybrany  obszar  dna  oceanicz- 
nego o powierzchni  156  km2  w rejonie  Wysp  Azor- 
skich. Projekt  FAMOUS  potwierdził  teorię  rozszerza- 
nia się  dna  oceanicznego  (w  tym  rejonie  prędkość  tego 
procesu  wynosi  2-3  cm  na  rok)  oraz  dostarczył  og- 
romnej ilości  danych,  zebranych  w trakcie  powierzch- 
niowych i podwodnych  wypraw  eksploracyjnych. 
Dane  te,  opracowywane  obecnie,  umożliwią  być 
może  lepsze  zrozumienie  skomplikowanych  procesów 
geodynamicznych. 

K.  Bal  Ińska- Wuttke  Powstanie  i budowa  kontynentów , Warszawa 
1970;  R.  Fraser  Ziemia,  planeta,  na  której  żyjemy.  Warszawa 
1968;  E.W.  Janczewski  Zarys  sejsmologii  ogólnej  i stosowanej , 
Warszawa  1955;  Planeta  Ziemia,  Warszawa  1962;  E.  Stenz, 
M.  Mackiewicz  Geofizyka  ogólna.  Warszawa  1964. 


Fizyka  atmosfery 

Krzysztof  Haman 


Atmosfera  ziemska  — gazowa  otoczka  Ziemi  jest  pod- 
stawowym składnikiem  środowiska  człowieka.  Wa- 
runki atmosferyczne  miały  — i w dalszym  ciągu  ma- 
ją — zasadnicze  znaczenie  dla  tak  kluczowych  dzie- 
dzin działalności  ludzkiej  jak  rolnictwo  czy  transport 
i wyciskają  swoje  piętno  na  różnych  przejawach  życia 
społecznego.  Próby  poznania  praw  rządzących  za- 
równo pojedynczymi  zjawiskami  pogody  jak  i ich 
właściwościami  statystycznymi  czyli  klimatem,  a także 
próby  kształtowania  ich  w sposób  pożądany,  towa- 
rzyszą chyba  całej  historii  ludzkości  niezależnie  od 
technicznych  możliwości  ich  realizacji.  Badania  at- 
mosfery prowadzone  w ostatnich  dziesięcioleciach 
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przyniosły  w tej  dziedzinie  poważne  sukcesy,  a także 
doprowadziły  do  wykrycia  w atmosferze  i wyjaśnienia 
wielu  nowych  zjawisk  wykraczających  poza  potocznie 
rozumianą  pogodę.  Jednakże  bardzo  wiele  — czasem 
bardzo  pospolitych  — zjawisk  atmosferycznych  jak 
chociażby  zwykły  deszcz  kryje  w sobie  sporo  dotąd 
niewyjaśnionych  zagadek.  Trzeba  też  pamiętać,  że 
atmosfera  ziemska  należy  do  najbardziej  zagrożonych 
działalnością  człowieka  elementów  środowiska. 

Wszystko  to  powoduje  rosnące  zainteresowanie 
naukami  o atmosferze  ziemskiej,  wśród  których  na 
czołowe  miejsce  wysuwa  się  fizyka  atmosfery. 

Przez  termin  fizyka  atmosfery  rozumieć  będziemy 


całokształt  wiedzy  o zjawiskach  fizycznych  zachodzą- 
cych w atmosferze  ziemskiej.  Fizyka  atmosfery  jest 
nauką  złożoną  wewnętrznie,  odzwierciedlającą  za- 
równo strukturę  samej  fizyki  jak  i strukturę  atmosfe- 
ry. Mamy  więc  z jednej  strony  np.  mechanikę,  termo- 
dynamikę, elektryczność  atmosfery,  z drugiej  zaś  — 
działy  fizyki  atmosfery  poświęcone  kompleksowym 
badaniom  określonych  zjawisk  atmosferycznych,  jak 
np.  fizyka  chmur  lub  fizyka  wysokich  warstw  atmo- 
sfery. Na  szczególne  wyodrębnienie  ze  względu  na  zna- 
czenie praktyczne  zasługuje  meteorologia  — dział  fizy- 
ki atmosfery  zajmujący  się  zespołem  zjawisk  potocznie 
zwanych  pogodą.  Zjawiska  te  koncentrują  się  głównie 
w dolnych  kilkudziesięciu  lub  nawet  kilkunastu 
kilometrach  atmosfery  i są  natury  głównie  mechanicz- 
nej i termodynamicznej. 

Pomocną  przy  czytaniu  tego  hasła,  poświęconego 
głównie  problemom  meteorologii,  może  być  il.  8 z 
tabl.  1 , zawierająca  szereg  informacji  o atmosferze. 


Zasady  fizycznego  opisu 
atmosfery 

Zjawiska  fizyczne  w atmosferze  opisuje  się  ilościowo 
podając  wartości  pewnych  parametrów  fizycznych 
(np.  temperatury,  ciśnienia,  prędkości  wiatru  itp.). 
Najczęściej  podaje  się  je  w funkcji  czasu  i przestrzeni, 
pola  czyli  w postaci  tzw.  pól.  Pierwotnym  źródłem  infor- 
parametrów  macji  o tych  zjawiskach  jest  — jak  we  wszystkich  nau- 
fizycznych  kach  przyrodniczych  — obserwacja  i pomiar.  W od- 
różnieniu od  innych  działów  fizyki,  w których  domi- 
nują pomiary  i obserwacje  dokonywane  podczas 
eksperymentów  laboratoryjnych  — kontrolowanych 
i powtarzalnych,  zjawiska  atmosferyczne  bada  się  na 
ogół  obserwując  procesy  naturalne,  nie  poddające  się 
kontroli  obserwatora  i powtarzalne  o tyle,  o ile  leży 
to  w charakterze  zjawiska.  Sytuacja  taka  jest  charak- 
terystyczna w geofizyce,  a także  w astrofizyce  i astro- 
nomii. W geofizyce,  a zwłaszcza  w licznych  działach 
fizyki  atmosfery,  dochodzi  jeszcze  jedna  trudność  — 
wiele  zjawisk  ze  względu  na  ich  rozległość  nie  mieści 
się  w polu  widzenia  pojedynczego  obserwatora  i ich 
obraz  uzyskuje  się  dopiero  przez  syntezę  obserwacji 
wykonanych  przez  różnych  obserwatorów.  W wyniku 
tej  syntezy  otrzymuje  się  mapy  lub  przekroje  pól  pa- 
rametrów atmosferycznych  (w  formie  graficznej  lub 
cyfrowej),  których  najpospolitszym  przykładem  może 
być  np.  mapa  ciśnienia  przedstawiona  w telewizyjnej 
prognozie  pogody.  Mapy  te  uzyskiwane  są  przez  in- 
terpolację między  zwykle  dość  odległymi  w czasie 
i przestrzeni  pomiarami.  W zależności  od  gęstości 
tych  pomiarów  oraz  sposobów  ich  nanoszenia  i inter- 
polacji otrzymane  mapy  mogą  być  bardziej  lub  mniej 
szczegółowe  czyli  — jak  się  to  w geofizyce  zwykle  mó- 
wi — mogą  przedstawiać  składowe  pól  o różnych  ska- 
lach, które  służą  do  opisywania  zjawisk  różnych  skal. 
skala  Pojęcie  skali  pola  i ogólnie  skali  odgrywa  wielką  rolę 
zjawisk  w naukach  geofizycznych.  Ścisła  definicja  tego  pojęcia 
atmosfe-  jest  dość  skomplikowana,  ale  jego  sens  ogólny  spro- 
rycznych  wadza  się  do  charakterystyki  przestrzennych  rozmia- 
rów zjawiska  (skala  przestrzenna)  oraz  czasu  jego 
trwania  (skala  czasowa);  skala  charakteryzuje  jedno- 
cześnie gęstość  sieci  obserwacyjnej  niezbędnej  do  do- 
statecznie dokładnej  obserwacji  danego  zjawiska. 

Dla  przykładu  rozpatrzymy  skalę  czasową  tempe- 
ratury. Obserwując  bieg  temperatury  przez  dłuższy 
czas  stwierdzimy,  że  można  przedstawić  go  jako  sumę 
średniej  wieloletniej  temperatury  w danym  miejscu 
oraz  wahań  sezonowych  związanych  ze  zmianami  pór 
roku,  wahań  dobowych  związanych  z cyklem  dnia 
i nocy,  a także  nieregularnych  oscylacji,  w których 
przedziały  czasu  pomiędzy  kolejnymi  przejściami  — 
od  wzrostu  do  spadku  temperatury  — wynoszą  od  kil- 
ku do  kilkunastu  minut;  za  pomocą  bardzo  czułych 
i szybko  reagujących  termometrów  dałoby  się  wykryć 


całkiem  znaczne  wahania  temperatury  zachodzące  w 
czasie  kilku  sekund  lub  mniejszym.  Jest  przy  tym  rze- 
czą oczywistą,  że  scharakteryzowanie  rocznego  prze- 
biegu temperatury  jest  możliwe  przy  pomiarach  wy- 
konywanych np.  raz  na  dzień,  biegu  dobowego  przy 
pomiarach  wykonywanych  co  godzina,  podczas  gdy 
wyznaczenie  pozostałych  wymienionych  składowych 
wypadkowego  biegu  temperatury  wymaga  pomiarów 
znacznie  częstszych  — co  najmniej  kilku  w każdym 
okresie  o ustalonym  kierunku  zmian  temperatury 
(rys.  1 ).  Liczbę  charakteryzującą  w przybliżeniu  czas, 
w ciągu  którego  dana  składowa  biegu  temperatury  za- 
chowuje znak  pochodnej  — tzn.  wzrasta  lub  maleje  — 
będziemy  nazywać  skalą  czasową  tej  składowej. 


Rys.  1.  Obserwowany  przebieg  parametru  meteorologicznego  S 
można  zwykle  rozłożyć  (choć  nie  w sposób  jednoznaczny)  na 
sumę  szeregu  składowych  o różnych  skalach  czasowych.  Krzywa 
I — skala  czasowa  rzędu  doby,  //  — skala  czasowa  rzędu  godzin. 

Ul  — skala  czasowa  rzędu  minut.  Przebieg  na  rysunku  jest 
fikcyjny  i stanowi  jedynie  wyjaśnienie.  Podobnie  można  by  przed- 
stawić składowe  o różnych  skalach  przestrzennych 

W podobny  sposób  można  wprowadzić  pojęcie  ska- 
li przestrzennej  (pionowej  lub  poziomej)  danej  skła- 
dowej pola  temperatury  lub  innego  parametru  fizycz- 
nego. Zwróćmy  uwagę,  że  tak  wprowadzona  skala  nie 
jest  dokładnie  określona  i składowa  pola  o danej  skali 
może  być  wyodrębniona  na  różne  sposoby  prowadzą- 
ce do  nieco  odmiennych  wyników.  W badaniach  geo-  badanie 
fizycznych  składowe  pola  o różnych  skalach  rozpa-  składowych 
trujemy  zazwyczaj  jako  odrębne  obiekty  badań,  ponie-  poja 
waż  dysponując  ograniczonymi  możliwościami  zbie-  0 różnych 
rania  i przetwarzania  informacji  o polach  parame-  skalach 
trów  geofizycznych  musimy  wybierać  pomiędzy  do- 
kładniejszą analizą  mniejszego  (w  sensie  rozciągłości 
w czasie  i przestrzeni)  obiektu  lub  mniej  dokładną  — 
większego.  Ponadto  składowe  te  mają  zazwyczaj  od- 
mienne przyczyny  fizyczne.  Dlatego  rozpatrując  różne 
prawidłowości  należy  zawsze  brać  pod  uwagę,  do 
jakich  skal  danego  zjawiska  one  się  odnoszą. 

Nakładające  się  na  siebie  pola  różnych  skal  można 
porównać  do  interferujących  fal  elektromagnetycz- 
nych o odmiennych  długościach  i okresach.  W odnie- 
sieniu do  fal  elektromagnetycznych  stosuje  się  na  ogół 
zasadę  prostego  sumowania,  tak  że  rozchodzenie  się 
jednej  fali  nie  ma  wpływu  na  rozchodzenie  się  innych. 

Procesy  atmosferyczne  różnych  skal  natomiast  na  ogół 
na  siebie  oddziałują,  np.  pola  skali  większej  zmieniają 
swoje  zachowanie,  gdy  nakładają  się  na  nie  pola  skali 
mniejszej  i odwrotnie.  Uwzględnienie  tych  oddziały- 
wań jest  jednym  z najtrudniejszych  problemów  w fizy- 
ce atmosfery  (i  w geofizyce  w ogóle). 


Budowa  i skład  atmosfery 

Atmosfera  ziemska  znajduje  się  stale  w stanie  bardzo 
bliskim  lokalnej  równowagi  hydrostatycznej  w tym 
sensie,  że  różnica  ciśnienia  atmosferycznego  pomiędzy 
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dwoma  poziomami  jest  zawsze  bardzo  bliska  ciężaro- 
wi zawartego  pomiędzy  nimi  pionowego  słupa  powie- 
trza o jednostkowej  powierzchni  przekroju  poprzecz- 
nego. Dokładność  tego  przybliżenia  wynosi  ok.  10_4% 
i poważniejsze  odchylenia  (z  reguły  nie  przekraczające 
1%)  zdarzają  się  jedynie  w niewielkich  obszarach  bar- 
dzo intensywnych  ruchów  powietrza.  Wynika  to  stąd, 
że  przyspieszenia  w ruchach  atmosfery  o znaczniejszej 
rozciągłości  przestrzennej  są  z reguły  małe  w porów- 
naniu z przyspieszeniem  grawitacyjnym.  Fakt  ten  pro- 
wadzi do  charakterystycznego  pionowego  rozkładu 
ciśnienia  (a  więc  i masy)  w atmosferze;  przykładem 


Typowy  wysokościowy  rozkład  ciśnienia  w atmosferze 


Wysokość 
km  n.p.m. 

Ciśnienie 

Pa 

% masy  atmosfery 
powyżej 

0 

1,01-10* 

100 

10 

2,65-10* 

26,2 

20 

5,5- 10* 

5,4 

50 

9-  10l 

0,1 

100 

1,74-10-* 

1,7-10”* 

200 

1,95- 10-* 

500 

2,9-10-* 

1000 

1,9-10-* 

takiego  rozkładu  mogą  być  dane  przytoczone  w tabeli. 
Ogólnie  można  przyjąć,  że  ciśnienie  do  wysokości  ok. 
100  km  — a wraz  z nim  i masa  atmosfery  pozostająca 
ponad  danym  poziomem  — spada  dziesięciokrotnie  co 
16-20  km.  Podobnie  przedstawiają  się  zmiany  gęsto- 
ści w atmosferze.  Zatem  troposfera  (średnio  pierwsze 
10  km  atmosfery)  zawiera  ok.  75%  masy  atmosfery, 
a wraz  ze  stratosferą  (średnio  pierwsze  50  km)  — po- 
nad 99,9%.  Typowy  skład  suchego  powietrza  atmo- 
sferycznego w pobliżu  powierzchni  Ziemi  przedstawia 
tabela. 


Koncentracja  głównych  składników  atmosfery  suchej  do 
wysokości  90  km 


Składnik 

% masy  po- 
wietrza 
suchego 

Składnik 

% masy  po- 
wietrza 
suchego 

Azot  N, 

75,527 

Neon  Ne 

1,25.10“* 

Tlen  O, 

24,143 

Krypton  Kr 

3,3  10-* 

Argon  A 

1,282 

Hel  He 

7,24-10-* 

Dwutlenek  węgla 
CO, 

4,5-6  10* 

Wodór  H 

3,4810-« 

Koncentracja  poszczególnych  składników  atmosfe- 
ry kształtuje  się  lokalnie  w wyniku  działania  procesów 
dwóch  typów  — produkcji  (dodatniej,  a także  ujem- 
nej — czyli  likwidacji)  oraz  transportu.  Produkcja  jest 
wynikiem  działalności  źródeł  (dodatnich  i ujemnych) 
takich,  jak  reakcje  chemiczne,  przemiany  fazowe,  ad- 
sorpcja i wydzielanie  przez  minerały  i wodę  oceanicz- 
ną, fotosynteza  itp.  Transport  jest  superpozycją  uno- 
szenia przez  uporządkowany  ruch  powietrza,  miesza- 
nia przez  nieuporządkowane  ruchy  różnych  skal  oraz 
dyfuzji  molekularnej.  Produkcja  przy  pominięciu  po- 
zostałych procesów  prowadzi  do  lokalnych  zmian 
koncentracji  w obszarze  źródeł;  mieszanie  — do  po- 
wstania mieszaniny  o składzie  jednorodnym  prze- 
strzennie, dyfuzja  zaś  (której  intensywność  rośnie 
wraz  ze  średnią  drogą  swobodną  molekuł)  do  ustale- 
nia równowagi  hydrostatycznej  każdego  składnika 
z osobna,  co  prowadzi  z kolei  do  względnego  wzrostu 
koncentracji  składników  lżejszych  wraz  ze  wzrostem 
wysokości. 

Stwierdzany  pomiarami  wysoki  stopień  jednorod- 
ności atmosfery  w odniesieniu  do  jej  głównych  skład- 
ników (02,  N2,  Ar)  w warstwie  do  wysokości  50-60  km 
świadczy  o tym,  że  dominującym  czynnikiem  trans- 
portu jest  mieszanie,  zaś  wydajność  źródeł  jest  sto- 
sunkowo mała.  Powyżej  tej  wysokości  zaczynają  się 


zaznaczać  procesy  dysocjacji  pod  wpływem  promie- 
niowania Słońca  oraz  rekombinacji  molekuł  głównych 
gazów  atmosferycznych.  Prowadzi  to  do  lokalnych 
zmian  składu  atmosfery  — pojawienia  się  większych 
ilości  tlenu  i azotu  atomowego.  Względna  wydajność 
tych  procesów  traktowanych  jako  źródła  jest  znaczna, 
lecz  wobec  wielkiego  rozrzedzenia  wysokich  warstw 
atmosfery  ich  udział  w łącznym  bilansie  gazów  atmo- 
sferycznych jest  niewielki.  Powyżej  120  km  droga 
swobodna  molekuł  staje  się  tak  duża,  że  dyfuzja  za- 
czyna dominować  jako  mechanizm  transportu  i w at- 
mosferze zaczyna  stopniowo  wzrastać  koncentracja 
gazów  lekkich  — wodoru  i helu,  które  stają  się  głów- 
nymi składnikami  atmosfery  na  wysokości  powyżej 
1000  km. 

Głównymi  źródłami  azotu,  tlenu  i dwutlenku  węgla 
są  procesy  fotosyntezy  i przemiany  materii  w szacie 
roślinnej  lądowej  i morskiej  a ewolucja  tej  szaty  jest 
sprzężona  z ewolucją  składu  atmosfery.  Na  uwagę  za- 
sługują też  ze  względu  na  swoje  znaczenie  biologiczne 
lub  pośredni  wpływ  na  ważne  zjawiska  atmosferyczne 
niektóre  składniki  atmosfery  występujące  w ilościach 
śladowych  (03,  NH4,  SOs,  N20). 

Szczególnym  składnikiem  atmosfery  jest  para  wod- 
na — jedyny  gaz  atmosferyczny  przechodzący  w wa- 
runkach atmosferycznych  w stan  ciekły  i stały.  W od- 
niesieniu do  pary  wodnej  procesy  produkcji  i likwidacji 
(parowanie  i kondensacja  wody)  często  dominują  nad 
mieszaniem  — stąd  znaczne  niejednorodności  jej  kon- 
centracji zawierającej  się  w granicach  0-4%.  Dzięki 
dużym  wartościom  ciepła  topnienia  i kondensacji 
przemiany  fazowe  wody  są  istotnym  czynnikiem  ener- 
getycznym w atmosferze,  a związane  z nimi  zja- 
wiska — powstawanie  chmur  i opadów  — należą 
do  najważniejszych  dla  człowieka  procesów  pogo- 
dowych. 

Ważnym  składnikiem  atmosfery  są  też  mikrosko- 
pijne cząstki  ciał  stałych  i cieczy  unoszące  się  w po- 
wietrzu — tzw.  aerozol  atmosferyczny.  Choć  jego 
koncentracja  rzadko  przekracza  10“6,  odgrywa  on 
ważną  rolę  w licznych  procesach  atmosferycznych 
oraz  może  mieć  bezpośrednie  działanie  biologiczne. 

W fizyce  atmosfery  stosuje  się  różnego  rodzaju  po- 
działy atmosfery  na  warstwy.  Najczęściej  stosowanym 
kryterium  jest  pionowy  rozkład  tenperatury,  według 
którego  wyróżnia  się  kolejno:  1)  troposferę  — war- 
stwę atmosfery  ziemskiej,  w której  temperatura  maleje 
wraz  ze  wzrostem  wysokości  niemal  jednostajnie;  roz- 
ciąga się  ona  od  powierzchni  Ziemi  do  wysokości  ok. 
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Rys.  2.  Rozkład  temperatury  i ciśnienia  w atmosferze  standardo- 
wej 


pionowa 

struktura 

atmosfory 


828 


pochłanianie, 
rozpraszanie 
i odbicie 


7 km  w okolicach  podbiegunowych,  a do  ok.  16  km 
w pobliżu  równika;  2)  stratosferę  — warstwę  atmo- 
sfery ziemskiej  o temperaturze  prawie  stałej  (strato- 
sfera  dolna)  lub  rosnącej  wraz  z wysokością  (strato- 
sfera  górna) ; 3)  mezosferę  — warstwę  atmosfery  ziem- 
skiej, w której  ponownie  następuje  spadek  temperatu- 
ry wraz  z wysokością  i 4)  termosferę  — warstwę  atmo- 
sfery, w której  ponownie  wzrasta  temperatura  (do 
kilku  tys.  K);  rozciąga  się  ona  aż  do  granic  atmosfery. 
Powierzchnie  rozgraniczające  te  warstwy  nazywają 
się  odpowiednio:  tropopauza,  stratopauza  i mezopau- 
za.  Standardowy  rozkład  temperatury  w atmosferze 
przedstawia  rys.  2.  Rozkłady  rzeczywiste  mogą  dość 
znacznie  różnić  się  od  niego  w zależności  od  położenia 
geograficznego,  pory  dnia  lub  roku.  W atmosferze 
ziemskiej  wyróżnia  się  również  warstwy  wg  innych  niż 
temperatura  kryteriów  fizycznych:  np.  jonosfera  jest 
warstwą  powyżej  80  km,  którą  charakteryzuje  znacz- 
ny stopień  jonizacji,  ozonosfera  — warstwą  na  wyso- 
kości 25-40  km,  która  odznacza  się  znacznie  podwyż- 
szoną koncentracją  ozonu  (ok.  10-5  wobec  ok.  10-8 
przy  powierzchni  Ziemi);  egzosfera  — warstwą  po- 
wyżej 300  km,  która  charakteryzuje  się  ucieczką  naj- 
szybszych molekuł  gazów  atmosferycznych  w prze- 
strzeń międzyplanetarną.  Wyodrębnia  się  też  tzw.  pla- 
netarną warstwę  graniczną,  obejmującą  pierwsze 
1,5-2  km  atmosfery,  w której  ruch  powietrza  w spo- 
sób istotny  jest  zakłócany  przez  tarcie  o powierzchnię 
Ziemi. 


Promieniowanie  słoneczne 
źródłem  energii  w atmosferze 


Pierwotnym  źródłem  energii,  dzięki  której  zachodzą 
zjawiska  fizyczne  w atmosferze  jest  promieniowanie 
słoneczne.  Dla  pewnej  grupy  zjawisk  (np.  zjawisk 
optycznych,  zorzy  polarnej)  jest  to  bezpośrednie  źród- 
ło energii,  jednak  dla  większości  zjawisk  badanych 
obecnie  przez  fizykę  atmosfery  jest  to  głównie  źródło 
energii  cieplnej,  która  zostaje  następnie  zmieniona 
w inne  formy  energii  w różnych  procesach  termody- 
namicznych. Promieniowanie  słoneczne  docierające 
do  górnych  granic  atmosfery  jest  w przybliżeniu  (do- 
syć dokładnym)  promieniowaniem  ciała  doskonale 
czarnego  o temperaturze  ok.  6000  K nieco  zdeformo- 
wanym przez  zjawiska  zachodzące  w atmosferze  sło- 
necznej. Niemal  cała  energia  tego  promieniowania  jest 
skoncentrowana  w promieniowaniu  widzialnym  i bli- 
skiej podczerwieni.  Promieniowanie  krótkofalowe 
(nadfioletowe  i krótsze)  oraz  promieniowanie  korpu- 
skulame,  odgrywa  znaczną  rolę  w fizyce  wysokich 
warstw  atmosfery,  lecz  stanowi  niewielki  ułamek  całej 
energii  słonecznej  docierającej  do  Ziemi. 

W atmosferze  ziemskiej  promieniowanie  słoneczne 
ulega  częściowemu  pochłanianiu,  rozpraszaniu  i odbi- 
ciu na  drobnoskalowych  niejednorodnościach  gęstości 
powietrza,  cząstkach  chmurowych  i aerozolu  atmo- 
sferycznym — częściowo  zaś  dociera  do  powierzchni 
Ziemi.  Pochłaniane  jest  głównie  promieniowanie  nad- 
fioletowe (przez  tlen  i ozon.  w górnych  warstwach  at- 
mosfery); znaczniejsze  pochłanianie  w szerokim  prze- 
dziale widmowym  występuje  niekiedy  przy  dużej  kon- 
centracji aerozolu.  Ogólnie  pochłanianie  promienio- 
wania słonecznego  w atmosferze  jest  niewielkie  i wy- 
nosi ok.  10%.  Rozpraszanie  przebiega  różnie  w róż- 
nych kierunkach  i zależy  od  długości  fali  świetlnej. 
W kierunku  poprzecznym  do  padających  promieni 
najsilniej  jest  rozpraszane  promieniowanie  o falach 
najkrótszych  — stąd  przewaga  niebieskiej  części  wid- 
ma w barwie  nieba,  które  jest  barwą  światła  rozpro- 
szonego. Odbicie  następuje  głównie  od  cząstek  dużych 
w porównaniu  z długością  fali  świetlnej  — głównie  od 
cząstek  chmurowych.  Promieniowanie  odbite  od 
obiektów  atmosferycznych  i od  powierzchni  Ziemi 
w przestrzeń  kosmiczną  oraz  promieniowanie  rozpro- 


szone wstecz,  nie  bierze  udziału  w procesach  atmo- 
sferycznych jako  źródło  energii.  Stosunek  natężenia 
tego  promieniowania  do  natężenia  promieniowania 
padającego  nosi  nazwę  albedo.  Średnie  albedo  Ziemi 
dla  widma  słonecznego  wynosi  ok.  0,3. 

Nie  odbite  promieniowanie  słoneczne  zostaje  po- 
chłonięte przez  obiekty  atmosferyczne  i powierzchnię 
Ziemi  stając  się  składnikiem  ich  bilansu  cieplnego. 
Z kolei  Ziemia  i atmosfera  promieniują  same.  Skład 
widmowy  promieniowania  powierzchni  Ziemi  odpo- 
wiada w przybliżeniu  (z  dosyć  dużą  dokładnością) 
promieniowaniu  ciała  doskonale  czarnego  o tempera- 
turze tej  powierzchni  — niemal  cała  jego  energia  przy- 
pada na  daleką  podczerwień  (maksimum  dla  fal  o dłu- 
gości 10-12  pm).  W tym  obszarze  widmowym  leżą 
intensywne  pasma  pochłaniania  pary  wodnej  i C02 
(rys.  3).  Przypowierzchniowa  warstwa  powietrza  gru- 


albedo 


promienio- 
wanie Ziemi 


efekt 

inspektowy 


Rys.  3.  Widmo  promieniowania  ciała  doskonale  czarnego  w tem- 
peraturze 6000  K.  (co  w przybliżeniu  odpowiada  promieniowaniu 
słonecznemu)  i 270  K (co  w przybliżeniu  odpowiada  promienio- 
waniu Ziemi),  oraz  położenie  pasm  pochłaniania  najważniej- 
szych składników  atmosfery.  Atmosfera  jest  przezroczysta  dla 
znacznej  części  promieniowania  słonecznego  i niemal  nieprze- 
zroczysta dła  promieniowania  Ziemi 

bości  kilkudziesięciu  metrów  pochłania  niemal  całko- 
wicie promieniowanie  leżące  w tych  pasmach.  Wypro- 
mieniowanie  z powierzchni  Ziemi  może  się  odbywać 
jedynie  w drodze  tzw.  transferu  promieniowania,  tzn. 
pochłaniania  promieniowania  przez  kolejne  warstwy 
atmosfery  i retransmitowania  go  dalej  jako  własnego 
promieniowania  cieplnego  o odpowiednio  zmienio- 
nym składzie  widmowym.  Bezpośrednio  w przestrzeń 
kosmiczną  powierzchnia  Ziemi  promieniuje  jedynie 
w przedziale  tzw.  okna  atmosferycznego  — przedzia- ' 
łu  widmowego  ok.  9-12  jim  wolnego  od  pasm  po- 
chłaniania głównych  składników  atmosfery.  Dopiero 
powyżej  6-10  km  możliwe  staje  się  bezpośrednie  wy- 
promieniowanie  z atmosfery  w przestrzeń  kosmiczną 
większych  ilości  energii.  Ponieważ  retransmisja  pro- 
mieniowania odbywa  się  zarówno  w kierunku  warstw 
leżących  wyżej  jak  i w kierunku  powierzchni  Ziemi, 
znaczna  część  energii  wypromieniowanej  przez  po- 
wierzchnię Ziemi  wraca  do  niej  z powrotem.  W rezul- 
tacie temperatura  powierzchni  Ziemi  ustala  się  na  po- 
ziomie wyższym  niżby  to  zachodziło  przy  braku  atmo- 
sfery. Efekt  ten  wynikający  ze  znacznej  przezroczy- 
stości atmosfery  dla  promieniowania  słonecznego 
i nieprzezroczystości  dla  podczerwonego  promienio- 
wania Ziemi  nosi  tradycyjną  nazwę  efektu  inspekto- 
wego, ponieważ  uważano  dawniej  (nie  całkiem 
słusznie),  że  jest  on  analogiczny  do  procesu  podno- 
szenia temperatury  w szklarniach  i inspektach  ogrod- 
niczych. 

Pionowy  rozkład  temperatury  w atmosferze  jest  hiSans 
wynikiem  równowagi  pomiędzy  transferem  promie-  cieplny 
niowania  podczerwonego,  transportem  ciepła  przez 
konwekcję  i turbulencję,  wydzielaniem  ciepła  utajo- 
nego w przemianach  fazowych  wody  oraz  w pewnym 
stopniu  (głównie  w wyższych  warstwach  atmosfery) 
także  bezpośrednim  pochłanianiem  promieniowania 
słonecznego  i molekularnym  przewodnictwem  ciepl- 
nym (rys.  4).  W troposferze  dominują  trzy  pierwsze 
czynniki,  w stratosferze  dolnej  — transfer  promienio- 
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Rys.  4.  Schemat  średniego  bilansu  cieplnego  Ziemi  i atmosfery 
w jednostkach  umownych  (stała  słoneczna  = 100);  I promie- 
niowanie słoneczne  dochodzące  do  górnych  granic  atmosfery, 
2 pochłanianie  w atmosferze,  3 pochłanianie  na  powierzchni 
Ziemi,  4 odbicie  od  powierzchni  Ziemi,  5 i 6 rozpraszanie  w atmo- 
sferze, 7 odbicie  od  chmur,  8 promieniowanie  powierzchni  Ziemi, 
z tego  9 pochłonięte  w atmosferze,  10  przepuszczone  przez  atmo- 
sferę, 11  i 12  promieniowanie  atmosfery,  13  transport  ciepła 
w postaci  utajonej,  14  transport  ciepła  w postaci  „odczuwalnej” 
(wg  S.  P.  Chromowa  i L.  I.  Mamontowej) 


wania,  do  którego  w stratosferze  górnej  dołącza  się 
pochłanianie  nadfioletowego  promieniowania  sło- 
necznego przez  ozon.  Wraz  ze  zmniejszaniem  się  gę- 
stości powietrza,  coraz  większego  znaczenia  nabiera 
pochłanianie  promieniowania  krótkofalowego  i kor- 
puskulamego  Słońca  w procesach  fotochemicznych 
oraz  przewodnictwo  molekularne;  czynniki  te  stają  się 
dominującymi  w bilansie  cieplnym  termosfery.  Tem- 


albedo,  mogą  wykazywać  znaczne  różnice  lokalne  (np. 
pustynia  i ocean). 

Lokalne  różnice  w dopływie  promieniowania  sło- 
necznego zależą  od  położenia  geograficznego,  pory 
dnia  i roku  oraz  od  stanu  przezroczystości  atmosfery 
(zachmurzenia,  zapylenia  oraz  albedo).  Pomijając  osła- 
bienie w atmosferze,  największą  ilość  promieniowania 


N zima  wiosna  lato  jesień 


Rys.  5.  Rozkład  dopływu  bezpośredniego  promieniowania  sło- 
necznego do  górnych  granic  atmosfery  w zależności  od  pory  roku 
i szerokości  geograficznej  (cal/(cm2d» 
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peratura  powierzchni  Ziemi,  która  ma  zasadnicze 
znaczenie  w kształtowaniu  się  warunków  atmosferycz- 
nych w troposferze,  jest  konsekwencją  bilansu  ciepl- 
nego, w którym  poza  promieniowaniem  i wymianą 
ciepła  z atmosferą  przez  przewodnictwo  i konwekcję 
istotną  rolę  odgrywa  transport  ciepła  w głąb  podłoża 
oraz  jego  ciepło  właściwe.  Parametry  te,  podobnie  jak 


Rys.  6.  Geograficzny  rozkład  rocznego  bilansu  promieniowania 
powierzchni  Ziemi  w kcal/cm*  (1  kcal  = 0,41868  -10:4J).  Zależy 
on  nie  tylko  od  szerokości  geograficznej,  ale  także  zachmurzenia 
i przezroczystości  atmosfery 

w skali  doby  uzyskują  rejony  podbiegunowe  w czasie 
dnia  polarnego  — najmniejszą,  te  same  rejony  w cza- 
sie nocy  polarnej  (rys.  5).  W ciągu  roku  najwięcej 
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promieniowania  otrzymują  obszary  międzyzwrotni- 
kowe.  Także  bilans  promieniowania  pochłanianego 
i emitowanego  wykazuje  znaczne  zróżnicowanie 
(rys.  6).  Obszary  podzwrotnikowe  (powierzchnia  Zie- 
mi i atmosfera  łącznie)  mają  natomiast  w ciągu  roku 
średnio  nadwyżki  promieniowania,  podczas  gdy  okoli- 
ce podbiegunowe  — niedobór.  Aby  lokalnie  tempera- 
tura utrzymywała  się  w obserwowanych  granicach, 
bilans  cieplny  musi  być  wyrównywany  inną  formą 
transportu  energii.  Jest  nią  przede  wszystkim  tzw. 
unoszenie  ciepła  przez  ruchy  powietrza.  Ruchy  powie- 
trza transportują  ciepło  zarówno  w formie  „odczuwal- 
nej” tzn.  związanej  bezpośrednio  z temperaturą  po- 
wietrza jak  i utajonej  w parze  wodnej.  Ciepło  utajone 
jest  oddawane  atmosferze  podczas  kondensacji  w 
chmurach.  Występuje  przy  tym  sprzężenie  zwrotne, 
ponieważ  właśnie  przestrzenne  niejednorodności  w bi- 
lansie cieplnym  powodują  powstawanie  różnic  tem- 
peratur, które  umożliwiają  zamianę  energii  cieplnej 
w inne  postaci  energii.  W szczególności  dzięki  nim 
funkcjonuje  cyrkulacja  atmosferyczna  i oceaniczna, 
stanowiąca  podłoże  niemal  wszystkich  zjawisk  będą- 
cych przedmiotem  badań  współczesnej  fizyki  atmo- 
sfery. 


Dynamika  atmosfery 


Ruchy  powietrza  atmosferycznego  rozpatruje  się 
zwykle  w układzie  odniesienia  związanym  z obracają- 
cą się  wokół  osi  Ziemią.  Są  one  wynikiem  działania 
różnorodnych  sił,  które  zazwyczaj  odnosi  się  do  jed- 
nostki masy  lub  jednostki  objętości  powietrza, 
siły  Najważniejsze  z nich  to: 

działające  — gradient  ciśnienia, 

w atmosferze  — siła  ciążenia  — mająca  największe  znaczenie 

w statyce  oraz  ruchach  pionowych  atmosfery; 

— siła  Coriolisa  związana  z dobowym  obrotem 
Ziemi  — skierowana  prostopadle  do  wektora  prędko- 
ści i do  osi  obrotu  Ziemi. 

Praktyczne  znaczenie  ma  jedynie  część  jej  składowej 
poziomej,  która  w odniesieniu  do  jednostki  masy  jest 
dana  wzorem  (4n/T)v  siny,  gdzie  T długość  doby, 
v — prędkość  pozioma  powietrza,  y — szerokość  geo- 
graficzna. W dalszym  ciągu  przez  termin  „siła  Corio- 
lisa” rozumieć  będziemy  właśnie  tę  wielkość.  Jest  ona 
skierowana  prostopadle  do  wektora  prędkości  w pra- 
wo na  półkuli  północnej  — w lewo  na  południowej. 

— tarcie  wewnętrzne  (lepkość  molekularna),  które 
jest  wynikiem  molekularnej  dyfuzji  pędu  makroskopo- 
wego. Z energetycznego  punktu  widzenia  prowadzi 
ono  ostatecznie  do  zamiany  energii  kinetycznej  w 
cieplną  (dyssypacja  energii). 

Efektem  działania  tych  sił  jest  przyspieszenie  ruchu 
powietrza.  W pewnych  sytuacjach  siły  te  w znacznym 
stopniu  się  równoważą,  tak  że  ich  wypadkowa  jest 
znacznie  mniejsza  od  głównych  składników;  mówi 
się  wówczas,  że  składniki  te  są  w stanie  kwazirówno- 
wagi. 

Ponieważ  w dynamice  atmosfery  z reguły  rozważa 
się  ruchy  jedynie  powyżej  pewnej  skali,  której  repre- 
zentację umożliwia  zdolność  rozdzielcza  stosowanej 
mapy,  należy  uwzględnić  wpływ  na  ruch  atmosfery  ru- 
lepkość  chów  mniejszych  skal  (tzw.  ruchów  podskalowych). 
turbulencyjna  Fizycznie  oddziaływanie  to  jest  równoważne  pojawie- 
powietrza  niu  się  dodatkowych  sił  — podobnie  jak  wzajemne 
oddziaływanie  ruchu  makroskopowego  gazu  z ruchem 
molekularnym  równoważne  jest  pojawieniu  się  sił  tar- 
cia wewnętrznego.  Jeżeli  efekty  te  są  spowodowane 
ruchami  bardzo  małych  skal  — rzędu  kilkuset  me- 
trów i mniej  — analogia  ta  sięga  tak  daleko,  że  można 
wręcz  mówić  o tzw.  lepkości  turbulencyjnej  powietrza. 
Charakteryzujący  ją  współczynnik  lepkości  turbulen- 
cyjnej jest  z reguły  103— 105  razy  większy  od  współczyn- 
nika lepkości  molekularnej. 

Rola  poszczególnych  sił  jest  różna  w różnych  kate- 


goriach ruchów.  Tak  więc  np.  tarcie  molekularne  (po- 
za wysokimi  warstwami  atmosfery)  ma  istotne  znacze- 
nie jedynie  w ruchach  bardzo  małych  skal  (centymetry 
i mniej),  którymi  zajmuje  się  raczej  aerodynamika  niż 
geofizyka  (choć  ma  pośredni  wpływ  również  na  proce- 
sy większych  skal).  Tarcie  turbulencyjne  jest  istotnym 
czynnikiem  w ruchach  skal  małych  i średnich  (do 
kilkudziesięciu  kilometrów),  w ruchach  zaś  o więk- 
szych skalach  przestrzennych  odgrywa  rolę  głównie 
w obszarach,  w których  pionowe  gradienty  prędkości 
wielkoskalowych  są  duże  (warstwy  tarcia).  Odbywa 
się  to  głównie  w pobliżu  powierzchni  Ziemi  (plane- 
tarna warstwa  graniczna),  choć  zdarza  się  także  na 
wysokościach  większych.  W obszarach  poza  warstwa- 
mi tarcia  czyli  w tzw.  atmosferze  swobodnej,  w odnie- 
sieniu do  ruchów  o skalach  największych  (powyżej 
1000  km  w poziomie),  występuje  na  dużych  obszarach 
Ziemi  tzw.  równowaga  kwazigeostroficzna,  tzn.  stan 
kwazirównowagi  między  siłą  Coriolisa  i siłą  gradientu 
ciśnienia  (można  pominąć  siłę  tarcia). 

Wzajemne  oddziaływanie  ruchów  różnych  skal  jest 
często  charakteryzowane  przez  rozmiary  i kierunek 
przekazywania  energii  kinetycznej  od  skali  do  skali. 
Na  przykład  ruchy  o skalach  poniżej  kilkuset  metrów 
(nazywane  potocznie  turbulencją  atmosferyczną)  cha- 
rakteryzuje przekazywanie  energii  kinetycznej  ku  co- 
raz mniejszym  skalom  aż  do  ruchów  molekularnych, 
w których  ulega  dyssypacji  (zamianie  na  ciepło). 
W tym  sensie  lepkość  turbulencyjna  wpływa  hamująco 
na  ruchy  skal  większych  (odbierając  energię  kine- 
tyczną), podobnie  jak  lepkość  molekularna  hamuje  ru- 
chy makroskopowe.  Przy  większych  skalach  (rzędu 
setek  i tysięcy  kilometrów)  obserwuje  się  jednak  także 
przekazywanie  energii  kinetycznej  skalom  większym. 
Chcąc  w tym  przedziale  skal  traktować  oddziaływa- 
nie skal  mniejszych  na  większe  jako  analog  lepkości, 
należałoby  niekiedy  mówić  o lepkości  ujemnej. 

W oddziaływaniu  ruchów  skal  większych  na  mniej- 
sze ważną  funkcję  spełnia  zjawisko  niestabilności. 
Polega  ono  na  tym,  że  obszary  dużych  gradientów 
temperatury  i prędkości  mogą  być  niestabilne  wzglę- 
dem ruchów  skal  mniejszych,  tzn.  powstające  w tych 
obszarach  przypadkowe,  niewielkie  zaburzenia  ruchu 
o odpowiedniej  skali  mają  tam  tendencje  do  samorzut- 
nej intensyfikacji.  Fizyczne  mechanizmy  zjawiska  nie- 
stabilności są  dość  złożone  i nie  będą  tu  szczegółowo 
omawiane. 

Analizę  dynamiki  atmosfery  ułatwia  występowanie 
w atmosferze  stanów  kwazirównowagi.  Na  przykład 
rozkład  ciśnienia  w atmosferze  jest  lokalnie  bardzo 
bliski  rozkładowi  hydrostatycznemu,  dzięki  czemu 
można  w wielu  zagadnieniach  wyznaczać  z dostatecz- 
ną dokładnością  pole  gęstości  (a  za  pomocą  równania 
stanu  także  pole  temperatury)  z pola  ciśnienia.  W ten 
sposób  zmniejsza  się  liczba  parametrów,  których 
ewolucję  trzeba  analizować  niezależnie. 

Podobne  znaczenie  ma  równowaga  kwazigeostro- 
ficzna (rys.  7),  dzięki  której  wiatr  rzeczywisty  można 
w wielu  rozważaniach  zastępować  tzw.  wiatrem  geo- 
stroficznym, wyznaczonym  z warunku  równoważenia 
poziomej  składowej  sił  gradientu  ciśnienia  przez  siłę 
Coriolisa  (rys.  7).  Wiatr  geostroficzny  wieje  równo- 

niż 
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Rys.  7.  Równowaga  geostroficzna  — w wietrze  geostroficznym 
gradient  ciśnienia  (spadek  na  jednostkę  odległości  w kierunku 
prostopadłym  do  izobar)  jest  równoważony  przez  siłę  Coriolisa 
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legie  do  izobar  w ten  sposób,  że  na  półkuli  północnej 
niskie  ciśnienie  pozostaje  na  lewo  od  kierunku,  w któ- 
rym wieje  wiatr,  a na  południowej  — na  prawo.  Rów- 
nowaga kwazigeostroficzna  w atmosferze  swobodnej 
jest  realizowana  z dokładnością  10-15%,  a więc  znacz- 
nie mniejszą  niż  równowaga  hydrostatyczna.  W sy- 
tuacjach, w których  można  ją  założyć,  pole  prędkości 
wiatru  można  wyznaczyć  z pola  ciśnienia.  Znając  więc 
ewolucję  pola  ciśnienia  można,  korzystając  z kwazi- 
hydrostatyczności  i kwazigeostroficzności  wielkoska- 
łowych  ruchów  powietrza,  wyznaczyć  w przybliżeniu 
ewolucję  wielkoskalowego  pola  temperatury  i wiatru. 
Stąd  wynika  znane  powszechnie  znaczenie  ciśnienia 
w prognozie  pogody. 

Charakterystycznymi  układami  wielkoskalowej  cyr- 
kulacji poziomej  są  niże  i wyże  baryczne  zwane  też 
cyklonami  i antycyklonami ; są  to  układy  ciśnienia 
z izobarami  w postaci  krzywych  zamkniętych  z mini- 
mum lub  maksimum  ciśnienia  w środku.  Wobec  kwa- 
zigeostroficzności ruchu  cyrkulacja  w niżach  odbywa 
się  niemal  dokładnie  wzdłuż  izobar,  przeciwnie  do 
ruchu  wskazówek  zegara  (na  półkuli  północnej),  w 
wyżach  zaś  — zgodnie  z tym  ruchem. 

W planetarnej  warstwie  granicznej  (pierwsze  1- 
2 km)  siły  tarcia  turbulencyjnego  nie  mogą  już  być  po- 
minięte wobec  siły  Coriolisa.  Pozioma  kwazirówno- 
waga  sił  gradientu  ciśnienia,  siły  Coriolisa  i siły  tarcia 
(która  z reguły  ma  składową  skierowaną  przeciwnie  do 
kierunku  wiatru)  prowadzi  do  odchylenia  wektora 
prędkości  w tej  warstwie  w kierunku  niższych  ciśnień, 
tzn.  do  środka  układu  w niżu,  na  zewnątrz  zaś  ukła- 
du — w wyżu  (rys.  8).  Spowodowany  tym  napływ 
względnie  odpływ  masy  powietrza  od  centrum  układu 
musi  być  skompensowany  ruchem  pionowym  (rys. 
9),  jeżeli  układ  ma  się  utrzymać  przez  dłuższy  czas. 


niż 


Rys.  8.  Równowaga  geostroficzna  z tarciem.  Przy  istnieniu  rów- 
nowagi siły  tarcia  gradientu  ciśnienia  i siły  Coriolisa  wiatr  jest 
skręcony  w kierunku  mniejszych  ciśnień 
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Rys.  9.  Zachowanie  się  mas  powietrza  w niżu  (cyklonie):  a)  zbież- 
ność masy  spowodowana  tarciem  w pobliżu  powierzchni  Ziemi; 
b)  spowodowana  tym  kompensująca  ją  cyrkulacja  pionowa. 
W wyżu  (antycyklonie)  kierunek  obu  cyrkulacji  jest  przeciwny 
niż  niżu 


Wynikiem  tego  efektu  są  powolne  wielkoskalowe  ru- 
chy powietrza  wstępujące  — w niżach  i zstępujące  — 
w wyżach.  Ma  to  ogromne  znaczenie  dla  kształtowa- 
nia pogody  w tych  układach,  ponieważ  ruchy  wstę- 
pujące sprzyjają  powstawaniu  zachmurzenia  i opa- 
dów, natomiast  ruchy  zstępujące  powodują  ich  zanik. 
Stąd  związek  niżu  z tzw.  złą  pogodą,  wyżu  zaś  — 
z dobrą. 


Ogólna  cyrkulacja  atmosfery 


Ogólną  cyrkulację  atmosfery  możemy  rozpatrywać 
jako  nakładające  się  na  siebie  ruchy  różnych  skal, 
tworzące  całą  hierarchię  od  skali  ogólnoplanetarnej  do 
mikroturbulencji,  w której  energia  kinetyczna  ulega 
dyssypacji  (zamianie  na  ciepło)  w wyniku  występo- 
wania lepkości  molekularnej.  W węższym  sensie, 
przez  ogólną  cyrkulację  atmosfery  rozumie  się  pierw- 
sze elementy  tej  hierarchii,  tzn.  pola  głównych  para- 
metrów mechanicznych  i termodynamicznych  uśred- 
nione w czasie  i wzdłuż  równoleżników  — a więc  za- 
leżne jedynie  od  szerokości  geograficznej  i wysokości. 

Schemat  tak  rozumianej  ogólnej  cyrkulacji  atmosfe- 
ry w troposferze  przedstawia  rys.  10. 

Cechą  charakterystyczną  tej  cyrkulacji  jest  wystę- 
powanie na  każdej  półkuli  dwóch  komórek  cyrkula- 
cji południkowo-pionowej : tzw.  komórki  Hadleya, 
w małych  szerokościach  geograficznych,  oraz  tzw.  ko- 
mórki Ferrela,  która  obejmuje  szerokości  średnie 
i duże.  W obszarze  komórek  Hadleya  południkowe  komórka 
składowe  wiatru  przy  ziemi  są  skierowane  ku  ich  Hadleya 
wspólnej  granicy  wewnątrz  tzw.  międzyzwrotnikowej 
strefy  zbieżności,  natomiast  składowa  równoleżniko- 
wa jest  wschodnia  (wiatry  są  odchylone  na  zachód).  Są 
to  znane  powszechnie  pasaty.  Mechanizm  działania 
komórki  Hadleya  polega  na  tym,  że  w pobliżu  mię- 
dzyzwrotnikowej strefy  zbieżności  troposfera  jest  in- 
tensywnie nagrzewana  (głównie  w wyniku  uwalniania 
ciepła  utajonego  kondensacji  w tym  rejonie  obfitują- 
cym w chmury).  Nagrzewanie  to  wywołuje  konwekcję 
termiczną  w skali  planetarnej  (tzn.  wznoszenie  się 
ciepłego,  lżejszego  powietrza,  a osiadanie  chłodniej- 
szego) w przekroju  południkowo-pionowym  i kon- 
wekcja ta  jest  zasadniczym  powodem  cyrkulacji  w tej 
komórce.  Wschodnia  składowa  równoleżnikowa  przy 
powierzchni  Ziemi  jest  wynikiem  działania  siły  Corio- 
lisa. 

Bardziej  skomplikowany  jest  mechanizm  cyrkula-  komórka 
cyjny  komórki  Ferrela.  Obecność  wiatrów  wschód-  Ferrela 
nich  w komórce  Hadleya  wymusza  w pewnym  sensie 
istnienie  strefy  wiatrów  zachodnich  w innym  obszarze, 
gdyż  w przeciwnym  razie  moment  pędu  układu 
Ziemia-atmosfera  (połączonego  siłami  tarcia)  nie 
mógłby  być  zachowany  i dlatego  w komórce  Ferrela 
dominują  wiatry  o zachodniej  składowej  równoleż- 
nikowej ; w związku  z tym  obszar  tej  komórki  nazywa 
się  także  strefą  wiatrów  zachodnich.  Wobec  istnienia 
równowagi  kwazigeostroficznej  strefę  wiatrów  za- 
chodnich musi  charakteryzować  spadek  ciśnienia  w 
stronę  biegunów,  tarcie  zaś  w pobliżu  powierzchni 
Ziemi  powoduje  pojawienie  się  składowej  dobiegu- 
nowej.  Tak  więc,  w komórce  Ferrela  cyrkulacja  po- 
łudnikowo-pionowa  nie  jest  elementem  pierwotnym 
całej  cyrkulacji  w tej  komórce,  lecz  wtórnym  wynika- 
jącym z istniejącej  cyrkulacji  równoleżnikowej.  W od- 
różnieniu od  komórki  Hadleya,  w której  ciepłe  po- 
wietrze unosi  się  do  góry  i następuje  przemiana 
energii  cieplnej  i potencjalnej  w kinetyczną,  w ko- 
mórce Ferrela  następuje  przemiana  odw-rotna.  W tym 
sensie  komórka  Ferrela  nie  jest  silnikiem  cieplnym 
lecz  pompą  cieplną. 

Źródła  takich  parametrów  fizycznych  atmosfery 
jak  wilgotność,  energia,  moment  pędu  itp.,  wykazują 
znaczną  zależność  od  szerokości  geograficznej.  Na 
przykład  strefa  okołorównikowa  ma  znaczną  nad- 
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Rys.  10.  Fragment  ogólnej  cyrkulacji  atmosfery:  a)  Pionowo-poludnikowy  przekrój  przez  troposferę  półkuli  północnej  przedstawiający 
średnią  cyrkulację  południkową  (kolor  niebieski)  i równoleżnikową  (kolor  czarny)  w zimie.  Prędkość  cyrkulacji  jest  scharakteryzowa- 
na za  pomocą  izotach  (linii  jednakowej  prędkości)  składowych:  zachodniej  w m/s  (czarny)  i południowej(niebieski);b)  Intensywność 
cyrkulacji  południkowej  jest  scharakteryzowana  przez  zagęszczenie  linii  prądu  przepływu  masy  (czarny).  Odpowiadające  jej  prędkości 
przedstawione  są  w postaci  izotach  składowej  południowej  przeniesionej  z rys.  a.  Wyraźnie  zaznacza  się  intensywna  cyrkulacja  połud- 
nikowa komórki  Hadleya  i słaba  cyrkulacja  komórki  Ferreła 

wyżkę  parowania  nad  opadami  — przeciwnie  niż 
strefa  umiarkowana,  a moment  siły  tarcia  między 
Ziemią  i atmosferą  maleje  z szerokością  geograficzną. 

Ponieważ  średni  bilans  tych  wielkości  w dużej  skali 
czasowej  jest  wszędzie  bliski  zeru,  musi  być  wyrówny- 
wany południowym  transportem  przez  cyrkulację 
atmosfery  i oceanów. 

O ile  średnia  cyrkulacja  południkowo-pionowa  w 
komórce  Hadleya  jest  dość  intensywna  i w znacznym 
stopniu  zapewnia  ten  transport  w obszarze  swego 
działania,  o tyle  cyrkulacja  południkowo-pionowa 
w komórce  Ferrela  jest  na  to  za  słaba.  Transport  ten 
musi  zapewniać  nie  cyrkulacja  pionowa,  lecz  pozioma 
realizowana  przez  zależne  od  długości  geograficznej 
i czasu  zakłócenie  cyrkulacji  równoleżnikowej  (tzw. 

„falowanie”  strefy  wiatrów  zachodnich).  Dotyczy  to 
zwłaszcza  momentu  pędu,  którego  stały  dopływ 
z niższych  szerokości  geograficznych  umożliwia  utrzy- 
mywanie stabilnej  cyrkulacji  zachodniej.  Z tego 
punktu  widzenia  bardzo  ważny  jest  rejon  styku  ko- 
mórki Hadleya  i Ferrela.  W obszarze  tym  występuje 
duży  poziomy  gradient  temperatury.  W wielu  miejs- 
cach jest  on  tak  duży,  że  można  mówić  o skoku 
front  temperatury  w danej  skali — jest  to  rejon  tzw.  pla- 
polarny  netarnej  strefy  frontalnej,  zwanej  niekiedy  frontem 
polarnym.  Duże  poziome  gradienty  temperatury  po- 
wodują koncentrację  energii  osiągalnej  (tzn.  możliwej 
do  zmiany  w energię  kinetyczną)  w związku  z tym 
jest  to  strefa  szczególnie  intensywnych  zjawisk  atmo- 
prąd  sferycznych.  Jednym  z nich  jest  tzw.  prąd  strumienio- 
strumieniowy  wy  ( jet  stream)  dość  wąski  (kilkaset  kilometrów  sze- 
rokości — przy  tysiącach  kilometrów  długości)  stru- 
mień bardzo  silnych  wiatrów  występujący  często  w 
pobliżu  tropopauzy.  Na  froncie  polarnym  pojawiają 


się  też  zafalowania,  które  często  tracą  stabilność 
przekształcając  się  w cyklony  umiarkowanych  szero- 
kości (nie  mylić  z cyklonami  tropikalnymi),  czyli 
niże  baryczne  kształtujące  w znacznym  stopniu  po- 
godę w naszej  strefie  geograficznej  (il.  190,  tabl.  49). 
Cyklony  i towarzyszące  im  antycyklony  (wyże)  są 
głównym  mechanizmem  transportu  południkowego 
w strefie  wiatrów  zachodnich. 

W klasycznym  modelu  niżu  atmosferycznego  wy- 
różnia się  tzw.  wycinek  chłodny  i wycinek  ciepły 
oddzielone  od  siebie  tzw.  frontami  — ciepłym  i chłod- 
nym, które  łączą  się  w centrum  cyklonu  (rys.  11). 
Energię  swą  cyklon  czerpie  głównie  z obniżania  się 
środka  ciężkości  w wyniku  wypierania  ku  górze  lżej- 
szego powietrza  wycinka  ciepłego  przez  cięższe  po- 
wietrze wycinka  chłodnego.  Na  powierzchni  Ziemi 
proces  ten  prowadzi  do  połączenia  się  frontów  — 
zjawisko  to  nazywa  się  okluzją.  Intensywne  ruchy 
pionowe  w rejonie  frontów  i występujące  na  nich 
nieciągłości  parametrów  meteorologicznych  są  przy- 
czyną wielu  spektakularnych  zjawisk  meteorologicz- 
nych mniejszej  skali  — głównie  chmur  i opadów. 

Niezależnie  od  wędrownych  niżów  i wyżów,  sy- 
metryczną równoleżnikową  strukturę  komórek  Ha- 
dleya i Ferrela  zakłócają  mniej  więcej  stacjonarne 
zaburzenia  związane  z rozmieszczeniem  kontynen- 
tów i oceanów  oraz  wielkich  łańcuchów  górskich. 

Szczegóły  omówionej  wyżej  struktury  cyrkulacyj- 
nej  mają  wyraźny  bieg  roczny — międzyzwrotniko- 
wa  strefa  zbieżności  przemieszcza  się  wraz  z rocznym , 
pozornym  ruchem  Słońca  na  sferze  niebieskiej;  po- 
nadto w związku  z większymi  poziomymi  gradien- 
tami temperatury  intensywność  zjawisk  cyrkulacyj- 
nych  jest  większa  na  półkuli  zimowej  niż  na  letniej. 
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C)  d) 


* m A A front  stacjonarny  A — A — A_  front  chłodny 

^ ^ ^ — a-  front  ciepły  A ^ A ^ A a okluzja 

1 0 1 0 izobary 


Rys-  II.  Klasyczny  model  rozwoju  niżu  w umiarkowanych  sze- 
rokościach geograficznych,  a)  fala  na  froncie,  b)  fala  traci  sta- 
bilność — jej  amplituda  rośnie,  zaznacza  się  wyraźnie  wycinek 
ciepły,  c)  niż  w pełnym  rozwoju  — początek  okludowania,  d)  niż 
zokludowany  — cieplejsze  powietrze  zostaje  wyparte  do  góry 


wpływ 

oceanów 


cyrkulacja 
górnej 
strato  sfery 
i mezosfery 


Szczególne  osobliwości  wykazuje  też  cyrkulacja  at- 
mosfery w obszarach  objętych  nocą  polarną. 

Brak  miejsca  uniemożliwia  bardziej  szczegółowe 
omawianie  całego  łańcucha  procesów  o coraz  mniej- 
szych skalach  — cyrkulacji  lokalnych,  bryz,  zespołów 
chmur  burzowych  czy  wreszcie  drobnoskalowej  tur- 
bulencji, które  uczestnicząc  w wyrównywaniu  lokal- 
nych bilansów  różnych  wielkości  fizycznych,  tworzą 
łącznie  to,  co  się  potocznie  nazywa  pogodą. 

Jakkolwiek  cyrkulacja  w troposferze  i dolnej  strato- 
sferze  stanowi  zasadniczy  mechanizm  transportu 
(zwłaszcza  poziomego)  energii  i innych  wielkości 
fizycznych,  nie  należy  pomijać  jej  związków  z cyr- 
kulacją oceaniczną  (-*  Fizyka  morza)  oraz  cyrku- 
lacją w wyższych  warstwach  atmosfery.  Związek 
cyrkulacji  troposferycznej  z oceaniczną  ma  charakter 
sprzężenia  zwrotnego  — prądy  morskie  transportu- 
jące znaczne  ilości  ciepła,  które  — oddawane  atmo- 
sferze — modyfikuje  jej  cyrkulację,  same  są  w znacz- 
nym stopniu  wynikiem  działania  wiatru.  Ze  względu 
na  wielką  bezwładność  mechaniczną  i cieplną  wody, 
wpływ  oceanu  na  temperaturę  atmosfery  jest  znacznie 
większy  niż  wpływy  atmosferyczne  na  ocean.  W związ- 
ku z tym  wpływ  oceanu  daje  się  stwierdzić  w szero- 
kim przedziale  skal  ruchów  atmosferycznych,  podczas 
gdy  wpływ  atmosfery  na  ruchy  oceaniczne  — przede 
wszystkim  w procesach  o bardzo  długim  czasie  trwa- 
nia, liczonym  w miesiącach  i latach  (jeżeli  pominąć 
wzbudzenie  fal  wiatrowych  i lokalne  spiętrzenia 
wody). 

Cyrkulacja  górnej  stratosfery  i mezosfery  jest  sto- 
sunkowo słabo  zbadana,  ponieważ  sondowania  ra- 
kietowe— jedyne  kompletne  źródło  informacji  o 
niej  — są  bardzo  kosztowne.  Wpływ  tej  cyrkulacji 
na  zjawiska  troposferyczne  jest  kwestią  dyskusyjną ; 
wobec  bardzo  małej  masy  powietrza  zawartej  w tych 
częściach  atmosfery,  bezpośrednie  oddziaływanie 
energetyczne  na  troposferę  jest  znikome.  Górna  stra- 
tosfera  stwarza  jednak  warunki  brzegowe  cyrkulacji 
w niżej  leżących  warstwach  atmosfery  i może  w ten 
sposób  wpływać  na  procesy  troposferyczne. 

Cyrkulacja  wysokich  warstw  atmosfery  wykazuje 
silny  wpływ  rytmów  słonecznych  — dobowego,  rocz- 
nego, jedenastoletniego  — oraz  nieregularnych  zmian 
aktywności  słonecznej,  co  wiąże  się  z tym,  że  głów- 


834 


nym  źródłem  energii  w tych  warstwach  jest  pochła- 
nianie promieniowania  krótkofalowego  Słońca.  Cyr- 
kulacje te  odznaczają  się  też  pewnymi  osobliwościami, 
np.  kierunki  wiatru  w stratosferze  tropikalnej  mają 
nieco  zagadkowy  cykl  trwający  ok.  26  miesięcy.  Inną 
osobliwością  są  tzw.  nagłe  ogrzania  dolnej  strato- 
sfery (o  kilkanaście  K w ciągu  kilkunastu  godzin) 
związane  z kompresją  powietrza  przy  falowych  ru- 
chach pionowych  o dużej  amplitudzie. 


Chmury  i opady  atmosferyczne 


Chmury  i opady  należą  do  najważniejszych  zjawisk 
atmosferycznych  zarówno  ze  względu  na  swe  bezpo- 
średnie znaczenie  dla  człowieka  jak  i na  powiązania 
z innymi  zjawiskami  meteorologicznymi. 

Chmura  (lub  mgła,  która  jest  chmurą  stykającą  się 
z powierzchnią  Ziemi)  jest  zbiorowiskiem  mikrosko- 
pijnych kropelek  wody  lub  kryształków  lodu  o ty- 
powych średnicach  rzędu  10-30  pm,  których  pręd- 
kość spadania  jest  tak  mała,  że  zawsze  występująca 
w powietrzu  mikroturbulencja  nie  pozwala  im  opaść 
na  ziemię.  Powstanie  chmury  wymaga  przesycenia 
atmosfery  parą  wodną,  co  następuje  najczęściej  jako 
rezultat  ochłodzenia  wskutek  adiabatycznego  roz- 
prężania powietrza  w ruchach  wstępujących  — rza- 
dziej w wyniku  wypromieniowania  ciepła  lub  w wy- 
niku mieszania  się  dwóch  nienasyconych  mas  po- 
wietrza o różnych  temperaturach  i wilgotnościach. 
Ze  względu  na  mechanizm  powstawania,  chmury 
można  podzielić  na:  warstwowe,  kłębiaste  (konwek- 
cyjne), warstwowo-kłębiaste  oraz  orograficzne  (gór- 
skie), jakkolwiek  wobec  wielkiej  różnorodności  chmur 
pewne  rzadkie  ich  formy  mogą  się  znaleźć  poza  tym 
podziałem. 

Używana  w służbie  meteorologicznej  międzynaro- 
dowa klasyfikacja  chmur  przyjmuje  oparty  na  mor- 
fologii podział  na  rodzaje,  gatunki  i odmiany.  De- 
finicje podstawowych  rodzajów  chmur  wg  Między- 
narodowego Atlasu  Chmur  podane  wraz  z nazwami 
łacińskimi,  polskimi  oraz  skrótami  międzynarodo- 
wymi są  w tabeli  oraz  ukazane  na  il.  193  (tabl.  50). 

Pionowe  wstępujące  ruchy  powietrza  o wielkiej 
skali  (setki  — tysiące  kilometrów)  występujące  prze- 
ważnie w niżach  i w pobliżu  frontów  atmosferycz- 
nych są  główną,  choć  nie  jedyną,  przyczyną  powsta- 
wania chmur  warstwowych,  których  rozciągłość  po- 
zioma jest  dziesiątki  i setki  razy  większa  niż  ich 
grubość.  Do  chmur  warstwowych  należą  rodzaje  St, 
Ns,  As,  Cs. 

Chmury  konwekcyjne  (rodzaje:  Cu  i Cb),  których 
rozciągłość  pionowa  i pozioma  są  zbliżone,  powstają 
w wyniku  konwekcji  o skali  od  setek  metrów  do 
dziesiątków  kilometrów.  Konwekcja  ta  jest  wywołana 
przede  wszystkim  chwiejnością  równowagi  hydro- 
statycznej atmosfery,  która  się  przejawia  wówczas, 
gdy  wznosząca  się  masa  powietrza  pozostaje  lżejsza 
niż  jej  względnie  nieruchome  otoczenie.  Ponieważ 
głównym  czynnikiem,  który  o tym  decyduje,  jest  róż- 
nica temperatur  (powietrze  cieplejsze  jest  zazwyczaj 
lżejsze  od  chłodniejszego),  a temperatura  powietrza 
wznoszącego  się  maleje  wraz  z wysokością  na  skutek 
rozprężania  adiabatycznego  o ok.  10  K/km,  istnienie 
w powietrzu  gradientu  pionowego  temperatury  więk- 
szego niż  10  K/km  oznacza  stan  równowagi  chwiejnej. 
W razie  wystąpienia  kondensacji  wydzielane  ciepło 
utajone  zmniejsza  tę  krytyczną  wartość  niekiedy  na- 
wet do  5 K/km.  Konwekcja  może  się  także  rozwijać 
w wyniku  chwiejności  dynamicznej  spowodowanej 
niejednorodnością  przestrzenną  pola  wiatru,  w wyni- 
ku niejednorodności  pola  wilgotności  oraz  wzajem- 
nego współdziałania  wszystkich  tych  efektów.  Silnie 
rozbudowane  chmury  konwekcyjne  mogą  sięgać  na- 
wet do  stratosfery.  Prędkość  występujących  w nich 
ruchów  pionowych  może  przekraczać  50  m/s.  Chmu- 


chmury 

warstwowe 


chmury 

konwekcyjne 


Definicje  podst 

awowych  rodzajów  chmur 

Nazwa** 

Opis 

Cirrus  chmury  w kształcie  oddzielnych,  białych,  deli- 

( Cr,  pierzaste)  katnych  włókien  bądź  białych  lub  przeważnie 
białych  ławic,  czy  też  wąskich  pasm.  Chmury 
te  mają  włóknisty  wygląd  lub  jedwabisty  po- 
łysk albo  obie  te  cechy  jednocześnie 


Cirrocumulus 
(Cc,  kłębiasto- 
pierzaste) 


cienka  biała  ławica,  płat  lub  warstwa  chmur 
bez  cieni,  złożona  z bardzo  małych  członów 
w kształcie  ziaren,  zmarszczek  itp.,  połączo- 
nych lub  oddzielonych  od  siebie  i ułożonych 
mniej  lub  bardziej  regularnie.  Większość  czło- 
nów ma  pozorną  szerokość  mniejszą  od  jedne- 
go stopnia 


Cirrostratus 
(Cs,  warstwo- 
wo-pierzaste) 


przejrzysta,  biaława  zasłona  z chmur  o włókni- 
stym lub  gładkim  wyglądzie,  pokrywająca  nie- 
bo całkowicie  lub  częściowo  i zwykle  powodu- 
jąca występowanie  zjawisk  halo 


Altocumulus 
(Ac,  średnie 
kłębiaste) 


Altostratus 
(As,  średnie 
warstwowe) 


Nimbostratus 
(Ns,  warstwo- 
we deszczowe) 


biała,  szara  bądź  częściowo  biała,  częściowo 
szara  ławica  lub  warstwa  chmur,  wykazująca  na 
ogół  cienie  i złożona  z płatów,  zaokrąglonych 
brył,  walców  itp.,  połączonych  ze  sobą  lub  od- 
dzielonych od  siebie,  niekiedy  o wyglądzie  czę- 
ściowo włóknistym  lub  rozmytym.  Pozorna  sze- 
rokość większości  regularnie  ułożonych  ma- 
łych członów  chmury  zawiera  się  zwykle  w gra- 
nicach od  jednego  do  pięciu  stopni, 
płat  lub  warstwa  chmur  szarawych  bądź  nie- 
bieskawych, o wyglądzie  prążkowanym,  włók- 
nistym lub  jednolitym,  pokrywająca  niebo  cał- 
kowicie lub  częściowo  i miejscami  tak  cienka, 
że  słońce  jest  widoczne  jak  przez  matowe  szkło. 
Chmura  Altostratus  nic  powoduje  występowa- 
nia zjawisk  halo 

szara  warstwa  chmur,  często  ciemna  o wyglą- 
dzie rozmytym  wskutek  mniej  lub  bardziej  ciąg- 
łego opadu  deszczu  lub  śniegu,  w większości 
przypadków  dochodzącego  do  ziemi.  Chmura 
ta  jest  wszędzie  tak  gruba,  że  całkowicie  prze- 
słania Słońce.  Poniżej  tej  warstwy  często  wystę- 
pują niskie,  postrzępione  chmury,  które  mogą 
być  z nią  połączone  lub  od  niej  oddzielone 


Stratocumulus 
(Sc,  kłębiasto* 
warstwowe) 


Stratus 
(Sr,  niskie 
warstwowe) 


Szara,  biaława  bądź  częściowo  szara,  częścio- 
wo biaława  ławica,  płat  lub  warstwa  chmur,  po- 
siadająca prawie  zawsze  ciemne  części ; złożona 
z zaokrąglonych  brył,  walców  itp.,  połączonych 
ze  sobą  lub  oddzielonych  od  siebie  i nie  posia- 
dających wyglądu  włóknistego.  Większość  re- 
gularnie ułożonych  małych  członów  chmury  ma 
pozorną  szerokość  większą  od  pięciu  stopni 
na  ogół  szara  warstwa  chmur  o dość  jednolitej 
podstawie,  mogąca  dać  opad  mżawki,  słupków 
lodowych  lub  śniegu  ziarnistego.  Jeżeli  Słońce 
jest  widoczne  przez  chmurę,  jego  zarys  jest  wy- 
raźny. Chmura  Stratus  nie  powoduje  występo- 
wania zjawisk  halo,  z wyjątkiem  być  może 
przypadków,  gdy  temperatura  powietrza  jest 
bardzo  niska.  Chmura  Stratus  występuje  nie- 
kiedy w postaci  postrzępionych  ławic 


Cumulus 

(Cu,  kłębiaste) 


oddzielne  na  ogół  gęste  chmury,  o ostrych  zary- 
sach, rozwijające  się  w kierunku  pionowym 
w kształcie  pagórków,  kopuł  lub  wież,  których 
górna,  pączkująca  część  przypomina  często  ka- 
lafior. Oświetlone  przez  Słońce  części  tych 
chmur  są  przeważnie  lśniąco  białe.  Podstawa 
ich  jest  stosunkowo  ciemna  i prawie  pozioma. 
Czasami  chmury  Cumulus  są  postrzępione 


Cumulonibus 
(Cb,  kłębiaste 
deszczowe) 


potężna,  gęsta  chmura  o dużej  pionowej  roz- 
ciągłości w kształcie  góry  lub  wielkich  wież. 
Przynajmniej  część  jej  wierzchołka  jest  zazwy- 
czaj gładka,  włóknista  lub  prążkowana  i prawie 
zawsze  spłaszczona.  Część  ta  rozpościera  się 
często  w kształcie  kowadła  lub  rozległego  pió- 
ropusza. 


* Podana  jest  nazwa  łacińska,  skrót  międzynarodowy  i nazwa 
polska. 


rom  takim  towarzyszą  zwykle  intensywne  zjawiska 
elektryczne  prowadzące  do  wyładowań  atmosferycz- 
nych (chmury  burzowe). 

Warstwy  o małym  pionowym  gradiencie  tempera- 
tury (spadku  mniejszym  niż  5 K/km),  a zwłaszcza 
warstwy  inwersji,  w których  temperatura  rośnie  wraz 
z wysokością,  hamują  pionowy  rozwój  konwekcji 
i chmur  konwekcyjnych.  Chmury  konwekcyjne  zani- 
kają zazwyczaj  podczas  pojawienia  się  w nich  prą- 
dów zstępujących,  w których  powietrze  ulega  ogrza- 
niu i względnemu  wysuszeniu.  Czasem  w wyniku  roz- 
padu chmur  konwekcyjnych  pozostają  mniej  lub 


bardziej  rozległe  pola  chmur  warstwowych  lub  war- 
stwowo-kłębiastych. 

Chmury  warstwowo-kłębiaste  (rodzaje:  Sc,  Ac 
i Cc)  powstają  głównie  na  skutek  ruchów  falowych 
lub  konwekcyjnych  wewnątrz  chmur  warstwowych. 

Chmury  tworzące  się  w bardzo  niskich  temperatu- 
rach ok.  — 40°C  są  zbudowane  z kryształków  lodu, 
co  nadaje  im  charakterystyczny  włóknisty  wygląd. 
Nazywa  się  je  niekiedy  chmurami  pierzastymi  (ro- 
dzaje: Ci,  Cs,  Cc). 

Chmury  orograficzne  tworzą  się  w wyniku  ruchów 
pionowych  powietrza,  wymuszanych  przez  opływ 
góry.  Ich  cechą  charakterystyczną  jest  zwięzek  z te- 
renem — nie  są  one  unoszone  przez  wiatr,  lecz  po- 
wietrze przepływa  przez  nie. 

Zanik  chmur  warstwowych  i warstwowo-kłębia- 
stych  powodowany  jest  najczęściej  wielkoskalowymi 
ruchami  zstępującymi,  w wyniku  których  następuje 
ogrzewanie  powietrza  pod  wpływem  kompresji,  lub 
mieszaniem  z otoczeniem  bezchmurnym.  W pewnym 
stopniu  może  też  mieć  na  to  wpływ  ogrzewanie  pro- 
mieniowaniem słonecznym,  które  chmury  pochłaniają 
w szerokim  przedziale  widmowym. 

Chmury,  zwłaszcza  konwekcyjne  występują  często 
w postaci  układów  o wyraźnej  strukturze  mezoskalo- 
wej  (skala  rzędu  dziesiątków  i setek  kilometrów), 
których  wykrycie  stało  się  możliwe  dzięki  zdjęciom 
satelitarnym  (il.  192,  tabl.  49).  Układy  te  powstają 
w wyniku  stosunkowo  powolnych  pionowych  ruchów 
mezoskalowych,  które  mogą  lokalnie  zmienić  stopień 
chwiejności  równowagi  atmosfery.  Czasem  oddziały- 
wanie między  rozwijającą  się  chmurą  i otoczeniem 
tworzy  sprzężenie  zwrotne,  na  skutek  którego  w po- 
bliżu jednej  chmury  tworzą  się  intensywnie  następne. 
Mechanizm  ten  można  zaobserwować  przy  rozwoju 
chmur  burzowych  i ich  zespołów,  a także  w proce- 
sach takich  jak  powstawanie  cyklonów  tropikalnych. 
Szczegóły  mechanizmów  wzajemnego  oddziaływania 
chmur  na  siebie  oraz  na  otoczenie  są  obecnie  przed- 
miotem intensywnych  badań  i mają  wielkie  znaczenie 
dla  wielu  gałęzi  fizyki  atmosfery. 

Poza  omówionymi  wyżej  tzw.  makrofizycznymi 
procesami  zachodzącymi  w chmurach  istotną  rolę 
odgrywają  procesy  mikrofizyczne  związane  ze  zjawis- 
kami zachodzącymi  w pojedynczej  cząstce  chmuro- 
wej lub  ich  niewielkich  zespołach. 

Kondensacyjne  powstawanie  cząstki  chmurowej 
jest  procesem  skomplikowanym,  ponieważ  warunku- 
jące ją  przesycenie  pary  wodnej  zależy  nie  tylko  od 
temperatury,  ale  także  od  kształtu  i rozmiaru  powsta- 
jącej cząstki  oraz  ilości  i rodzaju  rozpuszczonych 
w niej  substancji.  Kondensacja  pary  wodnej  w czy- 
stym swobodnym  powietrzu  wymaga  przesycenia 
rzędu  500%  (w  stosunku  do  prężności  pary  nasyco- 
nej nad  płaską  powierzchnią  czystej  wody  podawanej 
w tablicach).  Kondensacja  w atmosferze  zachodzi  na 
jądrach  kondensacji,  którymi  są  głównie  cząstki  aero- 
zolu zawierające  substancje  rozpuszczalne  w wodzie. 
Dzięki  nim  kondensacja  w chmurach  i mgłach  może 
wystąpić  przy  wilgotności  względnej  nawet  poniżej 
100%.  Ilość,  wielkość  i skład  chemiczny  jąder  kon- 
densacji określa  w znacznym  stopniu  liczbę  i rozmia- 
ry kropli,  które  mogą  na  nich  powstać  drogą  konden- 
sacji. Typowe  średnice  kropli  uzyskiwane  na  drodze 
kondensacji  nie  przekraczają  30-35  pm. 

Dalszy  wzrost  kropli  zachodzi  przede  wszystkim 
wskutek  koalescencji.  Najbardziej  typowa  jest  koa- 
lescencja  grawitacyjna.  Polega  ona  na  tym,  że  krople 
różnych  rozmiarów  spadając  z różnymi  prędkościami 
zderzają  się  ze  sobą  i łączą. 

Skomplikowane  oddziaływania  aerodynamiczne 
między  opadającymi  kroplami  powodują,  że  krople 
o średnicach  poniżej  40-50  pm  nie  są  zdolne  do 
efektywnej  koalescencji  z kroplami  mniejszymi.  Wi- 
dać więc,  że  przy  typowych  rozmiarach  kropli  po- 
wstających w toku  kondensacji  koalescencja  jest  mało 
prawdopodobna.  Dlatego  wiele  rodzajów  chmur  nie 
daje  opadów.  Zapoczątkowanie  koalescencji,  która 
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może  doprowadzić  do  powstania  opadu,  wymaga 
ciepły  pojawienia  się  w chmurze  pewnej  liczby  cząstek  du- 
deszcz  żych  o średnicach  powyżej  40  pm.  Mogą  nimi  być 
np.  kropelki  kondensujące  na  tzw.  jądrach  gigan- 
tach — stosunkowo  dużych  kryształach  soli  morskiej 
lub  innych  substancji,  które  w pewnej  liczbie  mogą 
się  znaleźć  w powietrzu.  Taki  mechanizm  powstawa- 
nia opadu  jest  znany  pod  nazwą  mechanizmu  „ciep- 
łego deszczu”. 

mechanizm  Często  spotykanym  mechanizmem  kondensacji  jest 

trójfazowy  tzw.  mechanizm  lub  proces  trójfazowy,  zw.  inaczej 
mechanizmem  Findeisena-Bergerona,  działający  wów- 
czas, gdy  chmura  jest  mieszaniną  przechłodzonych 
kropelek  wody  i kryształów  lodu.  Przesycenie  pary 
nad  lodem  jest  większe  niż  nad  wodą,  wobec  czego 
w takiej  mieszaninie  kryształy  lodu  gwałtownie  rosną 
kondensacyjnie  kosztem  kropelek  wody  i mogą  szyb- 
ko osiągać  rozmiary  umożliwiające  efektywną  koa- 
lescencję.  Pojawienie  się  znaczniejszej  liczby  krysz- 
tałków lodu  w chmurach  następuje  zwykle  przy  tem- 
peraturze poniżej  — 12°C.  Wynika  to  stąd,  że  małe 
kropelki  wody  ulegają  silnemu  przechłodzeniu  (do 
ok.  — 40°C),  o ile  nie  zetkną  się  z kryształem  lodu 
lub  jakąś  inną  substancją,  która  może  zadziałać  jako 
tzw.  jądro  zamarzania.  Obecne  w aerozolu  atmosfe- 
rycznym typowe  jądra  zamarzania  zaczynają  działać 
właśnie  w temperaturze  poniżej  — 12°C.  Powstający 
w wyniku  procesu  trójfazowego  opad  stały  może 
stopnieć  i dotrzeć  do  ziemi  jako  deszcz  lub  — gdy 
temperatura  nie  jest  dość  wysoka  — jako  śnieg,  krupa 
(grad  miękki)  lub  grad.  Rodzaj  i wielkość  cząstek 
opadu  zależy  od  bilansu  ciepła  i wody  w procesie  ich 
wzrostu  oraz  od  jego  długotrwałości.  Silne  prądy 
pionowe  w dużych  chmurach  kłębiastych  nie  pozwa- 
lają na  wypadanie  z chmury  cząstek  zbyt  małych  — 
stąd  charakterystyczne  dla  tych  chmur  opady  prze- 
lotne często  zawierają  cząstki  o znacznych  rozmia- 
rach. 

W umiarkowanych  strefach  klimatycznych  ok.  90% 
opadów  powstaje  w procesie  trójfazowym.  W strefie 
tropikalnej  ok.  50%  opadów  to  tzw.  ciepły  deszcz. 
Poza  wspomnianymi  tu  mechanizmami  powstawania 
cząstek  dostatecznie  dużych,  by  zapoczątkować  sku- 
teczną koalescencję  grawitacyjną,  działają  jeszcze  cza- 
sem inne  mechanizmy,  których  natura  nie  jest  obecnie 
dostatecznie  wyjaśniona  — być  może  odgrywają  w 
nich  pewną  rolę  efekty  elektryczne  lub  mikroturbu- 
lencja. 

sztuczna  Zarówno  mechanizm  ciepłego  deszczu  jak  i trój- 
modyfikacja  fazowy  może  być  stosunkowo  łatwo  modyfikowany 
opadów  pr2ez  wprowadzenie  do  chmur  sztucznych  jąder  kon- 
densacji lub  zamarzania.  Na  tej  zasadzie  opierają  się 
próby  modyfikacji  chmur  i opadów  zmierzające  do 
wywoływania  sztucznego  deszczu  lub  zapobiegania 
szkodom  gradowym.  Pomimo  dużych  wysiłków  i nie- 
wątpliwych sukcesów  w indywidualnych  przypadkach, 
powszechne  stosowanie  tej  techniki  nie  jest  jeszcze 
możliwe;  procesy  fizyczne  w chmurach  nie  są  na  tyle 
dobrze  poznane,  by  z dostateczną  pewnością  można 
było  liczyć  na  pożądane  wyniki. 


Główne  problemy  i kierunki 
rozwoju  współczesnej 
fizyki  atmosfery 

Główne  problemy  i kierunki  współczesnej  fizyki  at- 
mosfery są  wyznaczane  przede  wszystkim  przez  spo- 
łeczne i gospodarcze  potrzeby  współczesności.  Bada- 
nia w tej  dziedzinie  są  bowiem  bardzo  kosztowne 
i wymagają  zorganizowanej  na  szeroką  skalę  współ- 
pracy międzynarodowej.  Wydaje  się,  że  na  obecnym 
etapie  najważniejszymi  są  następujące  problemy: 
prognozowanie  pogody,  ewolucja  klimatu  oraz  mo- 
dyfikacja pogody  i klimatu  (celowa  lub  niezamierzo- 
na) w wyniku  działalności  człowieka. 
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Prognozy  pogody 

Prognozy  pogody  mogą  być  subiektywne  (oparte 
głównie  na  subiektywnej  ocenie  sytuacji  i doświad- 
czeniu meteorologa)  lub  obiektywne  (oparte  na  usta- 
lonych regułach  niezależnych  od  stosującego  go  me- 
teorologa). Prognozy  obiektywne  mogą  być  progno- 
zami statystycznymi,  tj.  mogą  wykorzystywać  empi- 
rycznie stwierdzone  związki  między  różnymi  zjawis- 
kami meteorologicznymi,  ustalającymi  prawdopodo- 
bieństwa występowania  ich  w pewnych  sekwencjach 
czasowych,  lub  deterministycznymi  (czasem  nazywa 
się  je  dynamicznymi),  tj.  określającymi  przyszły  stan 
atmosfery  na  podstawie  znajomości  stanów  prze- 
szłych oraz  praw  fizycznych  rządzących  ewolucją 
zjawisk  atmosferycznych.  Do  połowy  XX  w.  domi- 
nowały w praktyce  prognozy  subiektywne.  Rozwój 
technik  obliczeniowych  i przetwarzania  danych  w 
drugiej  połowie  XX  w.  spowodował  szybki  rozwój 
metod  dynamicznych  i statystycznych.  Obecnie  sto- 
suje się  najczęściej  metody  stanowiące  kombinacje 
tych  trzech  rodzajów  prognoz.  Ponieważ  z metod 
fizyki  atmosfery  korzysta  się  najbardziej  przy  pro- 
gnozach deterministycznych,  więc  nimi  się  głównie 
zajmiemy. 

Podstawą  prognoz  deterministycznych  jest  fakt, 
że  znajomość  pól  ciśnienia,  wiatru  (dwie  składowe 
poziome)  i prędkości  pionowej  oraz  temperatury  i wil- 
gotności pozwala,  z wystarczającą  dla  celów  pra- 
ktycznych dokładnością,  określić  występujące  zja- 
wiska pogodowe.  Problem  sprowadza  się  więc  do  pro- 
gnozy pól  tych  sześciu  parametrów. 

Wyrażone  w postaci  równań  różniczkowych  zasady 
zachowania  pędu  energii,  masy  powietrza,  i masy  wo- 
dy dostarczają  w zasadzie  sześciu  równań  do  wyzna- 
czania sześciu  niewiadomych  pól.  Aby  je  rozwiązać, 
należy  znać  warunki  początkowe  (tzn.  stan  niewiado- 
mych pól  w chwili  uznanej  za  początkową),  a następ- 
nie zastosować  odpowiednią  procedurę  matematycz- 
ną w celu  wyznaczenia  stanu  w chwili  końcowej.  Przy 
wykonywaniu  tych  działań  w praktyce  napotyka  się 
niemało  trudności.  Przede  wszystkim  w równaniach 
występują  siły  i źródła  energii,  których  postać  ma- 
tematyczną nie  zawsze  umiemy  ustalić.  Następnie 
rozpatrujemy  zwykle  pewną  skalę  zjawisk  — oddzia- 
ływanie ze  skalami  leżącymi  poniżej  naszej  zdol- 
ności rozdzielczej  powoduje  pojawienie  się  w rów- 
naniach dodatkowych  wyrażeń  o charakterze  sił  lub 
źródeł  energii,  które  należy  traktować  jak  „nowe” 
niewiadome  i dla  których  należy  ułożyć  odrębne  rów- 
nania, wiążące  je  ze  „starymi”.  Szukanie  takich  rów- 
nań nazywa  się  parametryzacją  procesów  podskalo- 
wych.  Wamaga  ona  przede  wszystkim  dobrego  rozu- 
mienia strony  fizycznej  wchodzących  w grę  proce- 
sów; można  stwierdzić,  że  znaczna  część  wysiłku  ba- 
dawczego, tak  teoretycznego,  jak  i obserwacyjnego, 
współczesnej  fizyki  atmosfery  wiąże  się  mniej  lub 
bardziej  bezpośrednio  z próbami  znalezienia  dobrych 
metod  parametryzacji  procesów  podskalowych  w ma- 
tematycznych modelach  zjawisk  atmosferycznych. 
Pomimo  pewnych  sukcesów  na  tym  polu,  problem 
jest  daleki  od  rozwiązania  i nie  jest  przy  tym  wcale 
pewne,  czy  rozwiązanie  go  z zadowalającą  dokład- 
nością jest  w ogóle  możliwe. 

Trudności  nastręcza  też  formułowanie  warunków 
początkowych.  Źródłem  ich  są  obserwacje  meteorolo- 
giczne zawsze  obarczone  błędami  pomiarowymi  oraz 
błędami  wynikającymi  z interpretacji  między  rzadko 
rozmieszczonymi  stacjami  meteorologicznymi  — nie- 
które rejony  globu,  np.  oceany,  okolice  podbiegu- 
nowe i obszary  słabo  zamieszkałe,  nie  mają  niemal 
zupełnie  posterunków  meteorologicznych,  a zwłaszcza 
posterunków  aerologicznych  wykonujących  pomiary 
w atmosferze  swobodnej  do  wysokości  ok.  30  km.  To- 
też duże  nadzieje  wiąże  się  z wykorzystaniem  sztucz- 
nych satelitów.  Np.  satelitarne  pomiary  promienio- 
wania podczerwonego  atmosfery  w różnych  przedzia- 
łach widmowych  pozwalają  na  wyznaczenie  prze- 
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strzennych  rozkładów  temperatury  i wilgotności, 
z których  (korzystając  z kwazihydrostatyczności 
i kwazigeostroficzności  atmosfery)  można  w przybli- 
żeniu wydedukować  przestrzenne  rozkłady  pozosta- 
łych interesujących  nas  parametrów.  Jednakże  prak- 
tyczne wykorzystanie  tej  techniki  wymaga  jeszcze  po- 
konania wielu  trudności  fizycznych  i technicznych. 

Oprócz  powyższych  występują  też  problemy  natury 
matematycznej  (luki  w teorii  równań  różniczkowych 
i ich  przybliżonego  rozwiązywania)  oraz  technicznej 
związanej  z szybkim  wykonywaniem  obliczeń  i prze- 
twarzaniem danych,  ponieważ  moce  obliczeniowe  na- 
wet największych  współczesnych  komputerów  nie  są 
dostateczne  dla  rozwiązania  trudniejszych  zagadnień 
prognozy  pogody  z odpowiednią  prędkością, 
problem  Można  by  sądzić,  że  trudności  prognozy  determi- 
przewidy-  nistycznej  są  w gruncie  rzeczy  natury  technicznej, 
walności  tzn.  supergęsta  sieć  bardzo  dokładnych  pomiarów 
stanów  pozwoliłaby  uwzględniać  procesy  o bardzo  małych 
atmosfery  skalach  minimalizując  wpływ  efektów  podskalowych 
oraz  niedokładności  danych  początkowych,  a super- 
sprawne  komputery  pozwoliłyby  w przyszłości  poko- 
nać trudności  obliczeniowe.  Eksperymenty  numerycz- 
ne wykonane  na  różnych  modelach  atmosfery  zdają 
się  jednak  sugerować,  że  istnieje  także  pewien  teore- 
tyczny kres  dokładności  i wyprzedzenia  prognozy 
typu  deterministycznego.  Równania  hydrodynamiki 
stosowane  w prognozie  są  bardzo  bowiem  czułe 
na  warunki  początkowe,  tzn.  dwa  rozwiązania  wycho- 
dzące z mało  różniących  się  stanów  początkowych 
mogą  po  dość  krótkim  czasie  bardzo  się  różnić,  przy 
czym  narastanie  tych  różnic  jest  tym  szybsze,  im 
mniejsze  skale  przestrzenne  i czasowe  uwzględniają 
rozwiązania.  Efekt  ten  może  bardzo  ograniczyć,  a na- 
wet zniweczyć  korzyści  wynikające  z wprowadzenia 
bardzo  małych  skal  do  równań  i warunków  począt- 
kowych. jeżeli  nie  jest  to  własność  samego  modelu 
ale  także  realnej  atmosfery,  to  można  się  obawiać, 
że  działa  tu  jakby  pewna  zasada  nieoznaczoności: 
im  bardziej  szczegółowa  w sensie  przestrzennym  jest 
prognoza,  tym  na  krótszy  okres  można  ją  opracować. 
Problem  istnienia  takiego  teoretycznego  kresu  wy- 
przedzenia prognozy  nosi  nazwę  problemu  przewidy- 
walności stanów  atmosfery. 

Przypuszcza  się,  że  dla  prognoz  w skali  synop- 
tycznej kresem  wyprzedzenia  prognozy  jest  kilkanaś- 
cie dni.  Ponieważ  obecnie  prognozy  te  formułuje  się 
na  2-3  doby,  możliwości  postępu,  choć  ograniczone, 
są  jeszcze  znaczne.  Stworzenie  sieci  obserwacyjnej 
\ i środków  obliczeniowych  — wzajemnie  dopasowa- 
nych, które  pozwoliłyby  realizować  te  zadania  w spo- 
sób optymalny,  jest  celem  wielkiego,  wieloletniego, 
międzynarodowego  programu  badawczego  znanego 
pod  nazwą  GARP  ( Global  Atmospheric  Research 
Project). 

Prognozy  długoterminowe  — miesięczne  czy  sezo- 
nowe — są  z konieczności  odpowiednio  mniej  pre- 
cyzyjne. Podejmowane  obecnie  próby  opracowywania 
takich  prognoz  mają  wciążjeszcze  dość  słabe  podstawy 
fizyczne. 


Ewolucja  klimatu  i modyfikacja  pogody 

Klimat  jest  czynnikiem  niezwykle  ważnym  w dzia- 
m łalności  człowieka,  zwłaszcza  w jego  gospodarce 
ewolucja  żywnościowej  i energetycznej.  Choć  zmiany  klimaty  cz- 
klimatu  ne  w sIca^  czasu  życia  jednego  pokolenia  są  niewiel- 
kie, istnieją  przekonywające  dowody  poważnej  ewolu- 
cji klimatu  w dłuższym  czasie.  Wyjaśnienie  mecha- 
nizmów tej  ewolucji  jest  jednym  z głównych  zadań 
współczesnej  fizyki  atmosfery.  Zasadniczym  czynni- 
kiem powodującym  przemiany  klimatu  są  zmiany 
przestrzennego  rozkładu  bilansu  cieplnego  Ziemi  i at- 
mosfery. Przyczyny  tych  zmian  mogą  tkwić  bądź 
w zmianach  dopływu  promieniowania  słonecznego  na 
skutek  periodycznych  zmian  astronomicznych  lub 
nieperiodycznych  wahań  aktywności  słonecznej,  bądź 


w zmianach  własności  cieplnych  Ziemi  i atmosfery 
(zmiany  szaty  roślinnej,  zmiany  składu  atmosfery, 
przemieszczenia  biegunów  itp.). 

Szczególnie  istotny  jest  problem  stabilności  kli- 
matu — wyjaśnienie,  czy  pojawienie  się  jakiejś  szcze- 
gólnie silnej  jednorazowej  fluktuacji  pogody  nie 
wywoła  trwałej  i w dodatku  stosunkowo  szybkiej 
zmiany  klimatu  Ziemi.  Występuje  tu  pewna  analogia 
z równowagą  cegły  stojącej  na  płaskim  stole.  Leżąc 
na  którejkolwiek  ze  swych  ścian,  cegła  znajduje  się 
w stanie  równowagi  i na  małe  wychylenie  zareaguje 
powrotem  do  położenia  pierwotnego.  Jednak  przy  do- 
statecznie dużym  wychyleniu  stan  równowagi  może 
być  osiągnięty  już  w innym  położeniu.  Istnieje  wiele 
mechanizmów  atmosferycznych,  do  których  teoretycz- 
nie ta  analogia  mogłaby  się  stosować.  Na  przykład, 
znaczne  zwiększenie  zawartości  pary  wodnej  w powie- 
trzu spowoduje  podniesienie  temperatury  powierzchni 
Ziemi  w wyniku  spotęgowania  efektu  inspektowego, 
co  wywoła  dalsze  zwiększone  parowanie  itd.  (do- 
datnie sprzężenie  zwrotne).  Wzrost  temperatury  na- 
ruszy v/  końcu  równowagę  bilansu  cieplnego,  co  do- 
prowadzi do  zmiany  układu  cyrkulacji  przywracają- 
cej tę  równowagę,  lecz  — być  może  — przy  zmienio- 
nych przeciętnych  wartościach  temperatury,  wilgot- 
ności i układu  wiatrów.  Może  się  jednak  zdarzyć, 
że  wzrost  wilgotności  spowoduje  od  razu  np.  wzrost 
opadów,  który  przywróci  poprzedni  stan  równowagi 
(ujemne  sprzężenie  zwrotne).  Powstaje  pytanie,  który 
z tych  wariantów  odpowiada  rzeczywistości.  Rozstrzy- 
gnięcie problemów  tego  rodzaju  jest  szczególnie  istot- 
ne w perspektywie  dość  szybkich  zmian  w atmosferze 
i powierzchni  Ziemi  pod  wpływem  działalności  czło- 
wieka. Jak  wykazała  tragiczna  w skutkach  susza 
w krajach  Sahelu  w latach  1969-1975,  nawet  niewiel- 
kie przemieszczenie  stref  klimatycznych  może  mieć 
lokalnie  katastrofalne  skutki. 

W chwili  obecnej  największy  niepokój  budzą  na- 
stępujące możliwe  procesy.  W ostatnim  stuleciu 
obserwuje  się  stały,  stopniowy  wzrost  koncentracji 
C02  w powietrzu  (rys.  12)  w wyniku  spalania  paliw 
zawierających  węgiel,  oraz  być  może  także  na  skutek 
zanieczyszczenia  wód  oceanicznych  ropą  naftową  (po- 
gorszenie warunków  rozpuszczania  C02  w wodzie  oce- 
anicznej) lub  zmniejszenia  fotosyntezy  w skali  świato- 
wej. Istnieje  obawa,  że  dalszy  wzrost  koncentracji 
CÓ2,  który  odgrywa  istotną  rolę  w „efekcie  inspek- 
towym” może  uruchomić  dodatnie  sprzężenie  zwrotne 
omówione  wyżej. 

Zwiększona  w wyniku  procesów  spalania  koncen- 
tracja aerozoli  może  zmienić  albedo  Ziemi.  Ponadto 
aerozole  są  często  aktywnymi  jądrami  kondensacji 
i zamarzania,  co  prowadzi  do  zmian  w zachmurzeniu 
i opadach,  i co  za  tym  idzie  — do  zmiany  ilości  wy- 
dzielanego ciepła  kondensacji.  Ponadto  chmury  i po- 
krywa śnieżna  mają  istotne  znaczenie  w bilansie  ra- 
diacyjnym (wysokie  albedo  względem  promieniowania 
słonecznego,  silna  emisja  w podczerwieni).  W rezul- 
tacie może  dojść  do  ogólnej  zmiany  klimatu. 

W wyniku  emisji  związków  chloru  i tlenków  azotu, 
które  spełniają  funkcję  katalizatorów  w rozpadzie 
ozonu  może  nastąpić  naruszenie  równowagi  ozono- 
wej w górnej  stratosferze.  Ozon  ma  duże  znaczenie 
w bilansie  cieplnym  górnej  stratosfery,  który  z kolei 
może  mieć  pośredni  wpływ  na  cyrkulację  troposferycz- 
ną;  ponadto  ozon  pochłaniając  aktywne  biologicznie 
promieniowanie  nadfioletowe  ma  znaczenie  ochron- 
ne dla  istot  żywych.  Jednocześnie  jego  bezwzględna 
zawartość  w atmosferze  jest  tak  mała,  że  już  obecna 
aktywność  przemysłowa  człowieka,  a zwłaszcza  loty 
samolotów  stratosferycznych  (wydzielanie  pary  wod- 
nej i tlenków  azotu  w spalinach)  mogą  spowodować 
znaczące  zmiany  jego  koncentracji. 

Odpowiedzi  na  pytania  związane  z ewolucją  i sta- 
bilnością klimatu  względem  różnego  rodzaju  zakłóceń 
szuka  się  przeprowadzając  eksperymenty  obliczeniowe 
na  modelach  matematycznych  atmosfery.  Są  to  mo- 
dele w zasadzie  podobne  do  stosowanych  w celach 
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Rys.  12.  Zmiany  koncentracji  COs  w okresie  1958-75  r. 


prognozy  deterministycznej.  Ponieważ  czas  obliczeń 
nie  ma  w tym  wypadku  znaczenia  podstawowego, 
można  stosować  znacznie  bogatsze  układy  równań 
uwzględniające  bardziej  złożone  sprzężenia  między 
procesami  atmosferycznymi.  Ponadto  nie  jest  już 
istotne  uzyskanie  właściwej  prognozy  na  konkretny 
termin,  lecz  odtworzenie  statystycznych  własności 
pogody  w dłuższym  przedziale  czasu,  wobec  czego 
trudności  omówione  poprzednio  w związku  z pro- 
blemem przewidywalności  atmosfery  odgrywają  tu 
mniejszą  rolę.  Obecnie  istnieje  wiele  tego  rodzaju  mo- 
deli, na  których  przeprowadza  się  liczne  eksperymen- 
ty obliczeniowe.  Nie  dały  one  dotąd  definitywnych 
odpowiedzi  na  postawione  wyżej  pytania,  ponieważ 
nie  wszystkie  sprzężenia,  które  należałoby  uwzględnić 
w realistycznych  modelach  atmosfery,  są  dostatecznie 
dobrze  poznane.  Jednakże,  wyjaśniając  rolę  przynaj- 
mniej niektórych  mechanizmów  kształtowania  kli- 
matu, niewątpliwie  uzyskanie  tych  odpowiedzi  przy- 
bliżyły. 

lokalne  Niezależnie  od  perspektyw  globalnych  zmian  kli- 
zmiany  matu,  intensywnie  bada  się  zmiany  lokalne  powstające 
klimatu  np.  przez  zakładanie  wielkich  zespołów  miejskich 
lub  kompleksów  przemysłowych.  W zmianach  wa- 
runków klimatycznych  ma  znaczenie  nie  tylko  po- 
średni wpływ  na  naturalne  zjawiska  atmosferyczne 
(np.  własności  cieplne  asfaltu  i betonu,  emisja  aero- 
zoli), ale  nawet  bezpośrednie  efekty  energetyczne 
związane  z wydzielaniem  ciepła  i pary  wodnej  w róż- 
nych procesach  związanych  z życiem  i działaniem 
człowieka. 

modyfikacja  Poza  omówioną  wyżej  niezamierzoną  modyfikacją 
pogody  pogody,  wiele  uwagi  poświęca  się  celowemu  oddziały- 
waniu na  zjawiska  atmosferyczne.  Kwestia  ta  miała 
wielu  entuzjastów  zwłaszcza  w latach  czterdziestych, 
gdy  gwałtowny  rozwój  różnych  gałęzi  techniki  budził 
czasem  zbyt  daleko  idące  nadzieje.  W tym  czasie  po- 
wstało niemało  projektów  ulepszania  klimatu  czy  też 
„poprawiania  pogody”.  Najbardziej  typowymi  były 
projekty  budowy  tam  na  cieśninach  morskich  celem 
zmiany  cyrkulacji  oceanicznej  i pośrednio  atmosfe- 
rycznej, topienie  lodów  polarnych  przez  zmianę  ich 
albeda  lub  wielkie  prace  hydrotechniczno-irygacyjne 
(np.  nawodnienie  Sahary  lub  masowe  oddziaływanie 
na  chmury  i opady  za  pomocą  sztucznych  jąder  kon- 
densacji i zamarzania).  Proponowano  nawet  bezpo- 
średnie oddziaływanie  energetyczne  za  pomocą  energii 
atomowej  — co  było  raczej  projektem  fantastycznym 
wobec  zupełnej  dysproporcji  między  wydajnością  do- 
stępnych człowiekowi  źródeł  energii  a energią  wiel- 
koskalowych  procesów  atmosferycznych.  (Energia 
wyzwalana  przy  wybuchu  bomby  wodorowej  o mocy  1 
megatony  TNT  jest  rzędu  energii  wyzwalanej  przez 


niewielką  burzę).  Uświadomienie  sobie  w latach 
sześćdziesiątych  niebezpieczeństw  związanych  z na- 
ruszeniem równowagi  środowiska  przyrodniczego 
przez  uboczne  skutki  tego  rodzaju  poczynań  technicz- 
nych spowodowało  odłożenie  takich  projektów  — na- 
wet technologicznie  realnych — jeżeli  nie  na  zawsze, 
to  w każdym  razie  do  czasu  znacznie  lepszego  zrozu- 
mienia i przewidywania  wszystkich  ich  konsekwencji. 

Obecnie  intensywne  badania  w dziedzinie  modyfika- 
cji pogody  koncentrują  się  przede  wszystkim  na  lo- 
kalnym oddziaływaniu  na  chmury  i opady  (metodami 
wcześniej  opisanymi)  w celu  zapobiegania  klęskom 
takim  jak:  gradobicie,  tornado,  huragany  związane 
z cyklonami  tropikalnymi  lub  w celu  poprawienia 
bilansu  wodnego  na  ograniczonych  terytoriach.  Sama 
technika  oddziaływania  na  chmury  jest  obecnie  prak- 
tycznie rzecz  biorąc  opanowana  — niejasny  jednak 
pozostaje  problem,  gdzie  i kiedy  należy  ją  stoso- 
wać, aby  osiągnąć  pożądany  rezultat,  i w jakich  wa- 
runkach geograficznych  i klimatycznych  można  spo- 
dziewać się  sukcesów.  Reakcje  różnych  chmur  na  takie 
oddziaływanie  są  bowiem  wciąż  dość  nieoczekiwane. 
Jednakże  wielki  postęp  w dziedzinie  fizyki  chmur 
osiągnięty  w ostatnich  latach  pozwala  oczekiwać 
pozytywnych  rezultatów  również  w zakresie  operacyj- 
nego oddziaływania  na  chmury  i opady. 


Obserwacje  i pomiary  w atmosferze 

Obserwacje  i pomiary  zjawisk  atmosferycznych  — 
poza  zjawiskami  najmniejszych  skal  — muszą  być 
wykonywane  z wielu  miejsc  i następnie  syntetyzowa- 
ne w jeden  spójny  obraz.  Oznacza  to,  że  większość 
(są  bowiem  liczne  i ważne  wyjątki)  obserwacji  i po- 
miarów musi  być  wykonywana  w ramach  systemu, 
w skład  którego,  poza  siecią  punktów  obserwacyjno- 
pomiarowych,  wchodzi  organizacja  zbierania  i prze- 
twarzania wyników.  Przyrządy  pomiarowe  są  jedynie 
„końcówkami”  tego  systemu  i stanowią  w nim  za- 
zwyczaj najmniej  skomplikowane  pod  względem  tech- 
nicznym elementy.  Przy  organizacji  sieci  konieczne 
jest  zapewnienie  reprezentatywności  obserwacji  i po- 
miarów (tj.  by  sposób  ich  wykonywania  zapewniał 
uzyskanie  potrzebnej  informacji  o badanej  skali  zja- 
wiska) oraz  ich  porównywalności  (tj.  aby  jednakowym 
wynikom  pomiaru  w różnych  punktach  odpowiadały 
jednakowe  treści  fizyczne). 

Rozróżniamy  obserwacje  i pomiary  standardowe 
i specjalne.  Obserwacje  i pomiary  standardowe  są  to 
obserwacje  wykonywane  w ramach  międzynarodowej 
sieci  meteorologicznej  i są  wykorzystywane  przede 
wszystkim  przez  służby  meteorologiczne  wszystkich 
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krajów  świata.  Sieć  ta  składa  się  ze  stacji  meteorolo- 
gicznych różnych  rzędów  o różnym  zakresie  obser- 
wacji i pomiarów  — od  stacji  mierzących  jedynie 
opad  na  ziemi  — do  stacji  aerologicznych,  które  za 
pomocą  tzw.  radiosond  (ii.  191,  tabl.  49),  wypuszcza- 
nych na  balonach  i transmitujących  swe  pomiary  na 
ziemię  drogą  radiową,  mierzą  pionowe  rozkłady  tem- 
peratury, ciśnienia  i wilgotności  powietrza  oraz  wiatru 
do  wysokości  20  km  i wyżej.  Typowe  pomiary  standar- 
dowe obejmują  ciśnienie,  temperaturę  i wilgotność  po- 
wietrza, wysokość  opadu,  zachmurzenie,  elementy 
promieniowania  słonecznego  oraz  ważniejsze  zjawis- 
ka pogody.  Sposób  działania  tych  stacji  jest  ściśle 
określony  i ujednolicony  w ramach  danej  służby  me- 
teorologicznej— podejmowane  są  też  wysiłki  uzys- 
kania daleko  posuniętej  jednolitości  w skali  świa- 
towej. Jest  to  jedno  z zadań  Światowej  Organizacji 
Meteorologicznej . 

Standardowe  pomiary  meteorologiczne  muszą  być 
przeprowadzane  w sposób  eliminujący  wpływ  czynni- 
ków ubocznych  na  pomiar  i jednakową  metodą  na 
wszystkich  stacjach  w ten  sposób,  by  uzyskać  repre- 
zentatywną informację  o tej  skali  zjawisk,  która  ma 
być  badana  (rys.  13). 


Rys.  13.  Klatka  meteorologiczna  zabezpiecza  umieszczone  w niej 
przyrządy  przed  przypadkowymi  wpływami  zewnętrznymi,  ułat- 
wiając uzyskanie  pomiarów  reprezentatywnych  i porównywal- 
nych 

W wielu  rejonach  świata  występują  trudności  z za- 
pewnieniem odpowiednio  kwalifikowanej  obsługi  dla 
stacji  meteorologicznych.  Można  temu  częściowo  za- 
radzić instalując  automatyczne  stacje  meteorologicz- 
ne (rys.  14),  które  drogą  radiową  lub  kablową  prze- 
kazują wyniki  pomiarów  podstawowych  parametrów 
meteorologicznych.  Do  zbierania  informacji  tych  wy- 
ników ze  stacji  położonych  w obszarach  niezamiesz- 
kałych, lub  instalowanych  na  oceanach,  można  wyko- 
rzystać sztuczne  satelity  telekomunikacyjne.  Światowa 
Organizacja  Meteorologiczna  przywiązuje  wielką  wa- 
gę do  rozbudowy  sieci  stacji  tego  rodzaju, 
obserwacje  Obserwacje  i pomiary  specjalne  są  pomiarami  wy- 
i pomiary  konywanymi  w celach  badawczych  i sposób  ich  prze- 
specjalne  prowadzania  nie  jest  zazwyczaj  regulowany  przepisa- 
mi Światowej  Organizacji  Meteorologicznej  lub  służby 
państwowej,  choć  sami  naukowcy,  którzy  je  prowa- 
dzą, współpracują  na  ogół  z innymi  zespołami  i starają 
się  zapewnić  niezbędny  stopień  porównywalności  po- 
miarów. Niektóre  pomiary  i obserwacje  specjalne, 
zostają  z czasem  stopniowo  przekształcone  w pomiary 
standardowe. 

Pewien  przełom  w systemie  organizacji  standardo- 
wych obserwacji  meteorologicznych  zdają  się  zapo- 


wiadać satelity  meteorologiczne  działające  od  1961  r.,  satelity 
ponieważ  są  one  w stanie  zbierać  niektóre  informacje  meteoro- 

0 atmosferze  w skali  globalnej  bez  pośrednictwa  sieci  logiczne 
stacji  meteorologicznych.  Satelity  meteorologiczne  są 

albo  geostacjonarne  (ich  prędkość  kątowa  jest  iden- 
tyczna z prędkością  kątową  Ziemi,  tak  że  przez  cały 
czas  znajdują  się  nad  tym  samym  punktem  równika) 
albo  mogą  poruszać  się  po  różnych  orbitach.  Zasad- 
niczym ich  zadaniem  jest  dostarczenie  obrazów  za- 
chmurzenia (w  świetle  widzialnym  i w podczerwieni), 
które  jest  ważnym  źródłem  informacji  o różnych  zjawi- 
skach meteorologicznych.  Ilustracja  194  z tabl.  51 
przedstawia  mozaikę  zestawioną  ze  zdjęć  wykonanych 
przez  satelitę  Essa  9 poruszającego  się  na  orbicie  po- 
larnej. Dokonuje  się  również  pomiarów  promienio- 
wania w wybranych  wąskich  przedziałach  widmo- 
wych, w których  emitują  gazy  atmosferyczne  — przede 
wszystkim  C02  i para  wodna  — na  ich  podstawie 
próbuje  się  wyznaczać  pionowe  rozkłady  temperatury 

1 wilgotności.  Satelity  mogą  też  uzyskiwać  informacje 
z obszarów  trudno  dostępnych  (pustynie,  oceany),  ma- 
jące sieć  meteorologiczną  niedostatecznie  rozwiniętą. 

Wysiłki  zmierzające  do  częściowego  zastąpienia  sieci 
meteorologicznej  (a  zwłaszcza  bardzo  kosztownej  w 


eksploatacji  sieci  aerologicznej)  obserwacjami  sateli- 
tarnymi natrafiają  jednak  na  duże  trudności.  Wszy- 
stkie pomiary  wykonywane  za  pomocą  satelitów  są 
bowiem  pomiarami  promieniowania  elektromagnety- 
cznego. Pomiaryte  nie  dają  się  jak  dotąd  „przetłu- 
maczyć” z dostateczną  dokładnością  na  dane  o tem- 
peraturze, wietrze  itp.  potrzebne  służbie  meteorologi- 
cznej. Prace  w tej  dziedzinie  są  jednak  intensywnie 
kontynuowane  (il.  195,  tabl.  52). 

Za  pomocą  satelitów  uzyskano  szereg  ważnych  in- 
formacji o charakterze  globalnym  (np.  dokładne  dane 
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Do  badań  meteorologicznych  wykorzystuje  się  rów- 
nież radar.  Bada  się  chmury  a zwłaszcza  opady,  po- 
nieważ duże  cząstki  opadowe  silnie  odbijają  fale  ra- 
darowe. Obserwacje  radarowe  pozwoliły  m.in.  zba- 
dać strukturę  cyklonów  tropikalnych  (il.  196,  tabl.  52) 
oraz  wewnętrzną  budowę  chmur  burzowych,  umożli- 
wiają też  stosunkowo  dokładną  ocenę  ilości  opadów 
na  niewielkich  terytoriach,  co  ma  ogromne  znaczenie 
np.  dla  odpowiedniej  gospodarki  zbiornikami  wod- 
nymi. 

Wprowadzone  niedawno  do  użytku  w meteorologii 
radary  dopplerowskie  wyznaczające  składowe  pręd- 
kości namierzanych  obiektów  w kierunku  radaru, 
pozwoliły  zbadać  rozkład  prądów  powietrza  w chmu- 
rach burzowych.  Wyznaczono  go  mierząc  prędkości 
ruchu  cząstek  opadowych  z dwóch  punktów.  Kompu- 
ter przekształca  następnie  te  informacje  w obraz  gra- 
ficzny (rys.  16). 

D.  Blanchard  Od  kropel  deszczu  do  wulkanów , Warszawa 
1977;  S.  P.  Chromow  Meteorologia  i klimatologia.  Warszawa 
1977;  G.  M.  B.  Dobson  Badania  atmosfery.  Warszawa  1965; 
R.M.  Goody  Atmosfery  planet.  Warszawa  1978;  T.  Kopcewicz 
Atmosfera  i hydrosfera  w:  Ziemia , Warszawa  1977. 


Fizyka  przestrzeni  okołoziemskiej 

Anarzej  Wernik 

przestrzeń  Przestrzenią  okołoziemską  nazywamy  obszar  wokół 
okołoziemską  Ziemi,  w którym  dominującą  rolę  odgrywa  pole  grawi- 
tacyjne i magnetyczne  Ziemi  i który  obejmuje  jej  ga- 
zową otoczkę  — atmosferę.  Pole  grawitacyjne  Ziemi 
podlega  powszechnemu  prawu  grawitacji,  a więc  siła, 
z jaką  oddziałuje  na  inne  ciała,  maleje  odwrotnie  pro- 
porcjonalnie do  kwadratu  odległości.  Teoretycznie 
więc  — sfera  oddziaływania  Ziemi  przez  pole  grawi- 
tacyjne rozciąga  się  do  nieskończoności.  Jednak  na 
bardzo  dużych  odległościach  od  Ziemi  siła,  z jaką  jej 
pole  grawitacyjne  działa  na  ciało  o małej  masie,  mo- 
że być  znacznie  mniejsza  od  sił  grawitacji  innych 
masywnych  ciał,  takich  jak  Słońce  czy  planety.  Przyj- 
mujemy więc,  że  granica  grawitacyjnego  oddziaływa- 
nia Ziemi  znajduje  się  w odległości,  w której  pole  gra- 
witacyjne innych  ciał  niebieskich  dominuje  nad  polem 
ziemskim.  Warunek  ten  spełniony  jest  w odległości  ok. 

8*  106  km  od  środka  Ziemi.  Jeżeli  przyjmiemy,  że  pole 
magnetyczne  Ziemi  jest  polem  dipola,  to  musimy  rów- 
nież przyjąć,  że  natężenie  jego  maleje  odwrotnie  pro- 
porcjonalnie do  sześcianu  odległości,  a więc  teore- 
tycznie także  nie  ma  granic.  Praktycznie,  ograniczo- 
magnetosfera  ne  jest  jednak  do  obszaru  tzw.  magnetosfery,  która 
się  rozciąga  w kierunku  Słońca  na  odległość  równą 
ok.  dziesięciu  promieniom  Ziemi,  czyli  6 TO4  km. 

Oprócz  pól  grawitacyjnego  i magnetycznego  prze- 
strzeń okołoziemską  wypełnia  materia  — atmosfera, 
której  struktura  zależy  od  wysokości  nad  powierzch- 

atmosfera  nią  Ziemi  (tabl.  7,  il.  21).  Od  wysokości  zależy  jej 
gęstość,  temperatura  i skład  chemiczny.  Pod  wpły- 
wem ultrafioletowego  i rentgenowskiego  promienio- 
wania Słońca  pewna  liczba  molekuł  i atomów  ulega 
dysocjacji  i jonizacji.  Na  obie  składowe:  neutralną 
(molekuły,  atomy)  i zjonizowaną  (jony,  elektrony) 
działają  różnorodne  siły,  które  się  zmieniają  w czasie 
i przestrzeni,  nieraz  w bardzo  skomplikowany  spo- 
sób. Jednocześnie  w atmosferze,  podobnie  jak  w mag- 
netosferze,  występują  cząstki  naładowane  pochodzenia 
słonecznego,  meteory  z Układu  Słonecznego  i promie- 
niowanie kosmiczne  powstające  w Galaktyce.  Zatem 
w przestrzeni  okołoziemskiej  zachodzi  wiele  skompli- 
kowanych procesów  fizycznych,  warunkujących  kom- 
pleks zjawisk  obserwowanych  na  powierzchni  Ziemi 
i na  pokładach  sztucznych  satelitów.  Wyjaśnienie  wie- 
lu problemów  fizyki  przestrzeni  okołoziemskiej  zaw- 
dzięczamy postępom  techniki  satelitarnej  i rakieto- 
wej oraz  rozwojowi  takich  działów  fizyki  jak  fizyka 
plazmy  czy  fizyka  procesów  zderzeń  cząstek. 
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W dalszym  ciągu  przedstawimy  pokrótce  aktualny 
stan  badań  przestrzeni  okołoziemskiej.  Nie  będziemy 
jednak  rozważać  struktury  warstw  atmosfery  dostęp- 
nych dla  pomiarów  tradycyjnych  z powierzchni  Ziemi 
ani  procesów  w nich  zachodzących.  Jako  poziom  roz- 
graniczający przyjmiemy  wysokość  300-350  km,  na 
której  koncentracja  cząstek  naładowanych  jest  mak- 
symalna. Czytelników  zainteresowanych  fizyką  warstw 
atmosfery  leżących  poniżej  tej  wysokości  odsyłamy 
do  artykułu  Fizyka  atmosfery.  Tam  też  czytelnik  znaj- 
dzie wyjaśnienie  szeregu  pojęć  używanych  w niniej- 
szym artykule. 


Atmosfera  na  wysokości  powyżej  300  km 

Gaz  otaczający  Ziemię,  czyli  atmosferę,  charaktery- 
zuje gęstość,  ciśnienie,  temperatura  i skład  chemicz- 
ny. Do  wyznaczenia  wartości  tych  parametrów  na 
interesujących  nas  wysokościach  najczęściej  stosuje 
się  metodę  opartą  na  badaniu  zmian  kształtu  orbit  sa- 
telitów. Opiszemy  pokrótce  tę  metodę.  Satelita  poru- 
sza się  wokół  Ziemi  nie  w próżni,  lecz  w atmosferze, 
która  stawia  pewien  opór,  hamuje  satelitę.  Oczywiś- 
cie hamowanie  będzie  tym  większe,  im  większy  jest  sa- 
telita i jego  prędkość  oraz  im  gęstsza  jest  atmosfera 
(wpływ  hamowania  w atmosferze  na  orbitę  satelity 
obrazuje  rys.  1).  Pomiary  zmian  okresu  obrotu  sa- 
telity oraz  wysokości  apogeum  i perigeum  pozwalają 
na  określenie  gęstości  atmosfery  na  wysokości,  gdzie 
hamowanie  jest  największe,  a więc  na  wysokości  peri- 
geum. Badając  orbity  wielu  satelitów  (do  1974  r. 


Rys.  1.  Zmiana  kształtu  orbity  satelity  -na  skutek  hamującego 
działania  atmosfery  (p  perigeum,  a apogeum 


Rys.  15.  Rozkład  prądów  powietrza  w chmurze  burzowej  wy- 
znaczony za  pomocą  radaru  dopplerowskiego.  Strzałki  przed- 
stawiają wektory  prędkości  prądów  powietrznych  wg  skali  prą- 
dowej w m/s 

o bilansie  radiacyjnym)  jak  i mezoskalowym  — w 
przedziale  skal  10-1500  km,  które  są  poniżej  zdol- 
ności rozdzielczej  standardowej  sieci  meteorologicznej. 
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zbadano  przeszło  3000  satelitów)  o różnych  wysokoś- 
ciach perigeum  wyznaczono  gęstość  na  wysokościach 
od  1 20  do  kilkuset  kilometrów,  zbadano  również  zmia- 
ny gęstości  w ciągu  dnia,  jej  zależność  od  pory  roku 
i aktywności  Słońca.  Znając  gęstość  i skład  chemicz- 
ny atmosfery  na  określonej  wysokości  i zakładając, 
że  atmosfera  zachowuje  się  jak  gaz  idealny,  można 
wyznaczyć  jej  temperaturę.  Rezultatem  takich  pomia- 
rów było  stwierdzenie,  że  gęstość  atmosfery  jest  naj- 
większa po  południu,  a najmniejsza  w drugiej  połowie 
nocy.  Różnica  między  gęstością  w dzień  i w nocy  roś- 
nie ze  wzrostem  wysokości.  Tak  np.  na  wysokości 
200  km  gęstość  w dzień  jest  1,5  razy  większa  niż 
gęstość  v/  nocy,  ale  na  wysokości  600  km  dzienna  at- 
mosfera jest  ok.  8-10  razy  gęstsza  niż  nocna.  Podobnie 
w ciągu  doby  zmienia  się  temperatura,  chociaż  różni- 
ce nie  przekraczają  50% . Na  interesujących  nas  wyso- 
kościach, tzn.  powyżej  300  km,  temperatura  w nie- 
wielkim stopniu  zależy  od  wysokości;  waha  się  ona 
w granicach  od  ok.  1000  K w nocy  do  1300  K w dzień. 
Jednocześnie  temperatura  w znacznym  stopniu  zale- 
ży od  aktywności  Słońca,  wykazuje  więc  zmiany  z o- 
kresem  rotacji  Słońca  (27  dni)  i cyklem  11 -letnim. 
W okresie  dużej  aktywności  Słońca  temperatura  wy- 
sokich warstw  atmosfery  może  osiągać  w ciągu  dnia 
2000  K. 

wiatr  w Różnice  gęstości  i temperatury  między  dniem  i nocą 
atmosferze  powodują  powstawanie  wiatrów  w atmosferze.  Jak 
mówiliśmy,  w południe  zarówno  gęstość,  jak  i tempe- 
ratura są  największe,  zatem  duże  też  jest  ciśnienie. 
Stosując  nomenklaturę  meteorologów,  powiedzieli- 
byśmy, że  jest  to  obszar  „wyżu”.  Jednocześnie,  na  nie 
oświetlonej  części  kuli  ziemskiej  panuje  „niż”.  Wiemy, 
że  gaz  napływa  z miejsc  o wysokim  ciśnieniu  i stara 
się  zapełnić  miejsca  o niskim  ciśnieniu.  Ten  prze- 
pływ gazu  jest  właśnie  wiatrem.  Tak  więc  w górnej 
atmosferze  ciągle  wieją  wiatry.  Gdyby  oprócz  różni- 
cy ciśnień  nie  istniały  żadne  inne  czynniki  wpływa- 
jące na  kierunek  i siłę  wiatru,  wiatr  w atmosferze 
miałby  przed  południem  kierunek  ku  zachodowi,  a po 
południu  — ku  wschodowi.  W rzeczywistości  ruch 
obrotowy  Ziemi  ze  wschodu  na  zachód  powoduje,  że 
wiatry  popołudniowe  są  silniejsze  od  przedpołudnio- 
wych. Istotnym  czynnikiem  wpływającym  na  prędkość 
unoszenie  i kierunek  wiatru  jest  tzw.  unoszenie  jonami.  Chodzi 
jonami  mianowicie  o to,  że  obie  składowe  atmosfery,  neutral- 
na i zjonizowana,  nie  mogą  się  poruszać  niezależnie 
od  siebie;  zderzają  się  ze  sobą,  przekazując  sobie  na- 
wzajem pewną  prędkość.  Jednak  ruch  jonów  nie  jest 
swobodny.  Mogą  się  one  poruszać  jedynie  wzdłuż  linii 
sił  pola  magnetycznego  Ziemi.  Na  ruch  cząstek 
naładowanych  wpływa  bowiem  pole  magnetyczne 
Ziemi,  wskutek  czego  poruszają  się  one  po  spirali 
„nanizanej”  na  linie  sił  pola.  Zderzając  się  ze  sobą, 
jony  nadają  atomom  prędkość  w kierunku  pola  ma- 
gnetycznego. Składowa  prędkości  jonów  prostopadła 
do  pola  powoduje  jedynie  ruch  periodyczny  pojedyn- 
czych atomów  wokół  linii  sił  pola,  lecz  nie  przesuwa 
mas  gazu.  W zderzeniach  z atomami  jony  nadają 
atomom  prędkość  w kierunku  pola  magnetycznego. 
W rezultacie  wiatr  cząstek  neutralnych  odchyla  się 
w kierunku  pola  magnetycznego.  Układ  wiatrów 
w atmosferze  na  wysokości  300  km  przedstawiony  jest 
na  rys.  2.  Prędkości  wiatrów,  zwłaszcza  w nocy,  są 
bardzo  duże,  przekraczają  niekiedy  200  m/s.  Oznacza 
to,  że  element  gazu  atmosferycznego  może  przewędro- 
wać tysiące  kilometrów  w ciągu  jednego  dnia. 
ogrzewanie  Co  jest  przyczyną  ogrzewania  atmosfery  do  tem- 
się  atmosfery  peratury  wyższej  niż  1000  K?  Znaczne  różnice  tem- 
peratury między  dniem  i nocą  oraz  wyższe  temperatu- 
ry w dzień  sugerują,  że  źródłem  ogrzewania  atmosfe- 
ry jest  Słońce.  Na  wysokościach  powyżej  300  km  głów- 
nym mechanizmem  ogrzewania  jest  pochłanianie 
(absorpcja)  ultrafioletowego  promieniowania  Słońca. 
Mechanizm  przekazywania  energii  promieniowania 
cząsteczkom  gazu  jest  w zasadzie  prosty.  Pochłaniane 
promieniowanie  słoneczne  wzbudza  molekuły  i atomy 
oraz  wywołuje  dysocjację  molekuł  i jonizację  atomów. 


0200  0600  1000  1400  1800  2200 

czas  lokalny 


Rys.  2.  Układ  wiatrów  na  wysokości  300  km  wraz  z układem 
izobar  na  tej  wysokości  (W  wyż,  N niż).  Kierunek  i długość 
strzałek  obrazuje  kierunek  i wartość  prędkości.  Długość  odcinka 
(u  dołu  z lewej  strony)  odpowiada  prędkości  200  m/s 


Wzbudzone,  zdysocjowane  i zjonizowane  molekuły 
oraz  atomy  zderzają  się  z otaczającymi  cząsteczkami 
gazu  i przekazują  im  nadwyżkę  energii  uzyskaną  w wy- 
niku absorpcji  promieniowania.  Zwiększa  się  energia 
kinetyczna  cząsteczek  gazu,  co  jest  równoważne  ze 
wzrostem  temperatury  gazu. 

Na  dużych  wysokościach  gęstość  gazu  jest  mała, 
a zatem  ilość  pochłanianego  promieniowania  jest 
niewielka  i atmosfera  powinna  nagrzewać  się  nieznacz- 
nie. A przecież,  jak  mówiliśmy,  temperatura  na  dużej 
wysokości,  powiedzmy  1000  km,  prawie  się  nie  różni 
od  temperatury  na  wysokości  100  km.  Otóż  okazuje 
się,  że  na  dużych  wysokościach  atmosfera  jest  bardzo 
dobrym  przewodnikiem  ciepła.  Tak  więc  ciepło 
nagromadzone  w dolnych  jej  partiach  rozprzestrzenia 
się  szybko  w górę  i ogrzewa  gaz  do  temperatury  rów- 
nej temperaturze  na  mniejszych  wysokościach. 

Jakie  cząstki  neutralne  mogą  występować  w górnych 
warstwach  atmosfery?  Odpowiedź  na  to  pytanie  daje 
rys.  3,  na  którym  pokazano,  jak  się  wraz  z wysokością 
zmienia  skład  chemiczny  atmosfery  ziemskiej.  Zau- 
ważmy, że  powyżej  800  km  dominują  lekkie  atomy  tle- 
nu, helu  i wodoru,  podczas  gdy  powyżej  1400  km  za- 
sadniczymi składnikami  atmosfery  są  już  tylko  hel 
i wodór.  Gęstość  ich  jest  mała,  a więc  atom  helu  lub 
wodoru  może  przelecieć  znaczną  odległość,  zanim  się 
zderzy  z innym  atomem.  Odległość  ta,  tzw.  średnia 
droga  swobodna,  wynosi  ok.  180  m na  wysokości 
400  km,  ale  na  wysokości  1000  km  wynosi  aż  7 km. 


Rys.  3.  Rozkład  z wysokością  ważniejszych  składników  chemicz- 
nych atmosfery  (podana  jest  liczba  cząstek  w 1 cm’) 
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Między  zderzeniami  atom  porusza  się  jedynie  w polu 
ciężkości  Ziemi.  Zależnie  od  prędkości  tory  atomów 
mogą  mieć  różny  kształt.  Gdy  prędkość  atomu  jest 
mała,  porusza  się  on  po  elipsie  i jest  jakby  mikrosko- 
pijnym satelitą  Ziemi.  Gdy  prędkość  atomu  jest  duża, 
jego  energia  kinetyczna  może  się  okazać  większa  niż 
energia  potencjalna,  którą  ma  w polu  grawitacyjnym 
Ziemi,  a wówczas  atom  może  uciec  ze  sfery  przyciąga- 
nia Ziemi  i może  się  stać  jednym  z atomów  przestrzeni 
międzyplanetarnej.  Prędkość,  przy  której  obie  energie, 
kinetyczna  i potencjalna,  są  równe,  nazywa  się  pręd- 
II  prędkość  kością  ucieczki  lub  II  prędkością  kosmiczną  i na  wy- 
kosmiczna  sokości  1000  km  wynosi  10,4  km/s.  Co  najmniej  taką 
właśnie  prędkość  musi  mieć  nie  tylko  atom,  ale  i ra- 
kieta kosmiczna,  aby  dotrzeć  do  innych  planet. 

Cząstki  uciekają  z całej  atmosfery,  nie  tylko  z wy- 
sokich jej  warstw.  Jednak  na  małych  wysokościach 
bardzo  małe  jest  prawdopodobieństwo  znalezienia 
cząstki  o wystarczająco  dużej  energii,  ponieważ  tem- 
peratura atmosfery  jest  zbyt  niska.  Warunki  sprzyjają- 
ce ucieczce  atomów  istnieją  jedynie  na  wysokościach 
powyżej  600  km.  Tę  część  atmosfery  nazywamy  egzo- 
egzosf  era  sferą.  Wskutek  ciągłej  ucieczki  lekkich  atomów  z egzo- 
sfery  mogłoby  po  pewnym  czasie  dojść  do  tego,  że 
w atmosferze  w ogóle  nie  byłoby  atomów  wodoru  i he- 
lu. Istnieją  jednak  bogate  źródła  tych  atomów.  Na 
przykład  helu  dostarcza  radioaktywny  rozpad  ciężkich 
atomów,  takich  jak  uran,  tor  i rad,  występujących 
w pewnej  obfitości  w skorupie  ziemskiej.  Tak  utwo- 
rzony hel  dy funduje  w górne  partie  atmosfery.  Źród- 
łem wodoru  w atmosferze  jest  para  wodna  i metan. 
Mimo  iż  występują  one  głównie  w troposferze  i stra- 
tosferze,  mogą  dyfundować  do  wysokości,  na  których 
ultrafioletowe  promieniowanie  Słońca  powoduje  ich 
dysocjację.  Powstałe  czyste  atomy  wodoru  wobec 
małego  ciężaru  łatwo  się  rozprzestrzeniają  do  bardzo 
dużych  wysokości. 

cząstki  Znaczną  część  egzosfery  stanowią  cząstki  nałado- 
naładowane  wane  — jony  i elektrony.  Ich  koncentracja  w egzo- 
w atmosferze  sferze  zmniejsza  się  znacznie  wolniej  niż  koncentracja 
cząstek  neutralnych.  Mniej  więcej  powyżej  1000  km 
jest  już  w 1 cm3  więcej  jonów  i elektronów  niż  czą- 
stek neutralnych.  Na  tych  wysokościach  dominują- 
cymi cząstkami  neutralnymi  są  atomy  helu  i wodoru, 
a większość  jonów  stanowią  jony  helu  He+  i wodoru 
H+  (protony).  Od  pewnej  wysokości  koncentracja  H+ 
jest  większa  od  koncentracji  He+.  Obszar  atmosfery 
profonosfera  powyżej  tej  wysokości  (ok.  1200  km)  nazywamy  pro- 
tonosferą.  Koncentracja  cząstek  zjonizowanych  w 
protonosferze  maleje  stopniowo,  aby  w pewnej  od- 
ległości od  Ziemi  gwałtownie  spaść  z liczby  100  elek- 
tronów do  1 elektronu  w 1 cm3.  Miejsce,  w którym 
plazmopauza  następuje  skok  koncentracji,  nazywa  się  plazmopauzą. 

O przyczynie  skoku  koncentracji  mówić  będziemy 
w następującym  rozdziale,  poświęconym  magneto- 
sferze.  Odległość  do  plazmopauzy  jest  taka  jak  odle- 
głość do  linii  siły  ziemskiego  pola  magnetycznego, 
która  przecina  płaszczyznę  równika  w odległości 
równej  czterem  promieniom  Ziemi  (2-104  km).  Mó- 
wimy, że  plazmopauza  leży  w odległości  L — 4.  Sy- 


Rys.  4.  Schematyczny  przekrój  przez  magnetosferę  w płaszczyź- 
nie prostopadłej  do  równika 
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tuację  tę  obrazuje  rys.  4.  Naszkicowano  na  nim  kilka 
linii  sił  pola  i zaznaczono  obszar  poniżej  plazmo- 
pauzy, tzw.  plazmosferę.  Plazmosfera  obejmuje  oczy- 
wiście jonosferę,  egzosferę  i protonosferę.  Jak  widać 
z rysunku,  wysokość  plazmopauzy  jest  mniejsza  na 
dużych  szerokościach  geomagnetycznych. 

Procesem  fizycznym  o bardzo  istotnym  znaczeniu 
w fizyce  atmosfery  jest  dyfuzja  cząstek  naładowanych. 
Elektrony  jako  cząstki  najlżejsze  mają  tendencję  do 
„wypływania”  na  „powierzchnię”  atmosfery.  Jednak 
działa  na  nie  przyciągająca  siła  elektrostatyczna  do- 
datnio naładowanych  jonów.  Tak  więc  elektrony, 
„wypływając”,  jednocześnie  wyciągają  jony  na  większe 
wysokości.  Powoduje  to  zmianę  rozkładu  wysoko- 
ściowego cząstek  naładowanych.  Na  dużych  wyso- 
kościach jest  ich  więcej  niż  wówczas,  gdyby  proces 
tej  dyfuzji  nie  odgrywał  roli  (np.  poniżej  300  km). 
Dyfuzja  cząstek  naładowanych  może  się  odbywać 
tylko  wzdłuż  linii  pola  magnetycznego.  Stąd  wnio- 
skujemy, że  w pobliżu  równika  magnetycznego,  gdzie 
linie  pola  są  równoległe  do  powierzchni  Ziemi,  dy- 
fuzja nie  zmienia  rozkładu  wysokościowego  cząstek. 
Proces  .dyfuzji  może  powodować  przepływ  elektro- 
nów i jonów  między  jonosferą  i protonosferą. 


plazmosfera 


dyfuzja 

cząstek 

naładowa- 

nych 


Magneto  sfera 

Do  1960  r.  sądzono,  że  ziemskie  pole  magnetyczne 
mało  się  różni  od  pola  di  pola  magnetycznego  (-► 

Magnetyzm  ziemski),  jedynie  w okresie  dużych  roz- 
błysków na  Słońcu  jego  kształt  ulega  zmianie.  Roz- 
ważania teoretyczne  i pomiary  wykonywane  za  po- 
mocą aparatury  umieszczonej  na  pokładach  sateli- 
tów ziemskich  zmusiły  do  zrewidowania  pojęć  o 
kształcie  pola  magnetycznego  Ziemi.  W rzeczywisto- 
ści struktura  pola  magnetycznego  wygląda  najpraw- 
dopodobniej tak,  jak  to  przedstawia  prawa  strona 
rys.  5.  Do  odległości  równej  kilku  promieniom  Ziemi 
pole  geomagnetyczne  ma  rzeczywiście  kształt  taki, 
jak  pole  di  pola.  W większych  odległościach  na  pole 
magnetyczne  oddziałuje  strumień  cząstek  (elektro- 
nów, protonów  i jonów  helu)  wypływający  ze  Słoń- 
ca. Strumień  ten,  napotykając  przeszkodę  w postaci 
pola  magnetycznego  Ziemi,  „naciska”  na  nie  i de- 
formuje je.  Ciśnienie  wiatru  słonecznego  jest  bardzo 
małe  i wynosi  ok.  2*10~*  Pa.  Polu  magnetycznemu 
można  również  przypisać  pewne  ciśnienie  związane 
z naprężeniem  linii  pola.  Maleje  ono  szybko  wraz  z od- 
ległością. Odległość,  na  której  jest  ono  równe  ciśnie- 
niu wiatru  słonecznego,  określa  granicę  pola  magne- 
tycznego Ziemi,  tzw.  magnetopauzę.  Magnetopauza  ato- 

nie styka  się  bezpośrednio  z wiatrem  słonecznym,  pau2a 
lecz  oddzielona  jest  od  niego  warstwą,  w której  prze- 
pływ cząstek  wiatru  ma  charakter  turbulentny.  Obszar 
wewnątrz  magnetopauzy  nazywamy  magnetosferą. 

Od  strony  Słońca  magnetopauza  leży  w odległości 
ok.  10  promieni  Ziemi  (6-104  km).  Po  nocnej  stronie 
Ziemi  odległość  do  magnetopauzy  jest  rzędu  kilkuset 
promieni  ziemskich.  Jest  to  tzw.  ogon  magnetosfery  ogon  -nag- 
(rys.  5).  W obszarze  ogona,  w płaszczyźnie  równika  netosfery 
magnetycznego,  obserwuje  się  podwyższenie  kon- 
centracji cząstek  naładowanych  — warstwę  plazmo- 
wą. Pole  magnetyczne  w warstwie  plazmowej  jest 
bardzo  słabe  i na  stronie  północnej  ma  kierunek  ku 
Ziemi,  a na  stronie  południowej  — od  Ziemi.  W pła- 
szczyźnie równika  natężenie  pola  jest  równe  zeru. 

Po  dziennej  stronie  magnetopauzy,  w tzw.  punktach 
neutralnych,  następuje  rozdzielenie  linii  sił  pola 
magnetycznego : część  z nich  biegnie  przez  płaszczyznę 
równika  ku  przeciwnemu  biegunowi,  część  zaś  ku 
ogonowi  magnetosfery.  Wewnątrz  magnetosfery 
znajdują  się  pasy  promieniowania,  zwane  także  pa-  pasy 
sami  Van  Allena  (od  nazwiska  uczonego,  który  je  promienio- 
odkrył,  mierząc  na  satelitach  strumienie  cząstek  wania 
o dużych  energiach).  Umownie  rozróżniamy  dwa  pa- 
sy: wewnętrzny,  leżący  na  linii  siły  pola  magnetycz- 
nego, która  przecina  równik  w odległości  J,5  pro- 


mienia  Ziemi  (L  £5  1,5)  i zewnętrzny  — w odległości  Wiatr  słoneczny  opływający  magnetosferę  wywo- 
L « 3-4).  Należy  jednak  zauważyć,  że  granica  między  łuje  pole  elektryczne  skierowane  z zachodu  na  wschód 
pasami  nie  jest  ostro  zaznaczona.  Wewnętrzny  pas  i zw.  polem  elektrycznym  konwekcji.  Ponieważ  w róż- 
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Rys.  5.  Porównanie  kształtu  pola  magnetycznego  Ziemi  bez  wiatru  słonecznego  (z  lewej  strony)  i z wiatrem  słonecznym  (z  prawej 
strony)  (przekrój  płaszczyzną  prostopadłą  do  równika  geomagnetycznego,  przechodzącą  przez  linię  Słońce-Ziemia) 


promieniowania  składa  się  z protonów  o energiach 
równych  dziesiątkom  i setkom  MeV.  W zewnętrznym 
pasie  dominują  elektrony  o energiach  od  dziesiątków 
keV  do  kilku  MeV.  Koncentracja  cząstek  w zewnętrz- 
nym pasie  jest  bardzo  mała,  całkowita  ich  masa  nie 
przekracza  15  kg.  Strumienie  elektronów  w zewnętrz- 
nym pasie  promieniowania  silnie  fluktuują,  wskutek 
czego  zmienia  się  natężenie  pola  magnetycznego  na 
powierzchni  Ziemi.  Cząstki  uwięzione  są  w pasach 
promieniowania  i poruszają  się  po  skomplikowanych 
torach  (rys.  6),  przy  tym  ruch  jonów  i ruch  elektronów 
odbywają  się  we  wzajemnie  przeciwnych  kierun- 
kach. 


Rys.  6.  Tory  cząstek  w magnetosferze.  Protony  dryfują  na  za- 
chód, elektrony  na  wschód 


Przypomnijmy  znany  fakt,  że  ruch  przewodnika 
w polu  magnetycznym  prowadzi  do  powstania  pola 
elektrycznego  prostopadłego  do  kierunku  ruchu 
i kierunku  pola.  Natomiast  przewodnik  umieszczony 
w skrzyżowanych  polach  elektrycznym  i magnetycz- 
nym zostaje  wprawiony  w ruch  w kierunku  prosto- 
padłym do  obu  pól.  Plazma  w przestrzeni  okołoziem- 
skiej  jest  przewodnikiem  w polu  magnetycznym  Zie- 
mi. Jej  ruchowi  towarzyszyć  więc  będzie  pole  elek- 
tryczne i odwrotnie  — pole  elektryczne  spowoduje 
ruch  plazmy. 

Po  tej  uwadze  omówimy  zjawisko  konwekcji  mag- 
netosferycznej  i przyczyny  powstania  skoku  koncen- 
tracji elektronów  na  granicy  plazmosfery. 


nych  modelach  magnetosfeiy  mechanizm  generacji 
tego  pola  jest  różny,  nie  będziemy  go  szerzej  omawiali. 
Pole  elektryczne  konwekcji  przenosi  się  bez  strat 
wzdłuż  linii  sił  pola  geomagnetycznego  do  wewnątrz 
magnetosfery  i plazmosfery.  Jego  natężenie  jest  duże 
w pobliżu  magnetopauzy,  a więc  tam,  gdzie  parametr 
L jest  duży.  W warunkach  spokojnych  magnetycznie 
osiąga  ono  wartość  20  mV/m,  a w czasie  burz  magne- 
tycznych nawet  120  mV/m,  lecz  szybko  maleje  w mia- 
rę oddalania  się  od  magnetopauzy.  Pole  konwekcji 
wraz  z polem  geomagnetycznym  powodują  ciągły 
ruch  plazmy  wewnątrz  magnetosfery  w kierunku  od 
ogona,  czyli  od  strony  nocnej  do  dziennej.  Można 
więc  mówić  o cyrkulacji  plazmy  w magnetosferze : 
w pobliżu  magnetopauzy  wiatr  słoneczny  unosi  plaz- 
mę do  ogona  magnetosfery,  skąd  dzięki  polu  kon- 
wekcji przedostaje  się  ona  do  wnętrza  magneto- 
sfery. 

W przestrzeni  okołoziemskiej  oprócz  pola  elek- 
trycznego konwekcji  występuje  pole  elektryczne  ko- 
rotacji.  Wskutek  lepkości  plazma  w przestrzeni  oko- 
łoziemskiej rotuje  razem  z Ziemią.  Ruch  plazmy 
w polu  geomagnetycznym  powoduje  powstanie  pola 
elektrycznego.  Charakter  zależności  zmian  natężenia 
tego  pola  od  parametru  L jest  zupełnie  inny  niż  dla 
pola  konwekcji.  Natężenie  pola  korotacji  mało  za- 
leży od  L (aż  do  L x 4)  i wynosi  ok.  15  mV/m.  Ale 
jeśli  L jest  większe  od  4,  natężenie  pola  korotacji 
szybko  maleje. 

Istnienie  pól  konwekcji  i korotacji  warunkuje  po- 
wstanie skoku  koncentracji  elektronów  na  granicy 
plazmosfery.  Tam,  gdzie  natężenie  pola  korotacji  jest 
większe  od  natężenia  pola  konwekcji,  gęstość  plazmy 
powinna  być  większa  niż  w obszarze,  w którym  do- 
minuje pole  konwekcji.  Istotnie,  pole  konwekcji  jest 
przyczyną  cyrkulacji  magnetosferycznej,  która  po- 
woduje, że  cząstki  uciekają  do  ogona  magnetosfery, 
a następnie  w przestrzeń  międzyplanetarną.  Ich  kon- 
centracja jest  więc  mniejsza  niż  koncentracja  cząstek 
w obszarze,  w którym  natężenie  pola  korotacji  jest 
wystarczająco  duże.  A zatem  możemy  przyjąć,  że 
plazmopauza  jest  powierzchnią,  na  której  pola  elek- 
tryczne konwekcji  i korotacji  są  równe.  Poniżej  pla- 
zmopauzy  dominuje  pole  korotacji,  powyżej  zaś  — 
pole  konwekcji. 
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Burze  magnetyczne  i zorze  polarne 

Pole  magnetyczne  Ziemi  często  jest  zaburzone.  Prze- 
jawia się  to  w postaci  zmian  amplitudy  składowych 
pola  magnetycznego  rejestrowanych  na  magnetogra- 
mach  na  powierzchni  Ziemi  (— ► Magnetyzm  ziemski). 
Jeżeli  amplituda  zmian  jest  bardzo  duża,  mówimy  o 
burzy  magnetycznej.  Typowym  przykładem  magneto- 
gramu  otrzymanego  w czasie  burzy  magnetycznej 
jest  rys.  7.  Obrazuje  on  jedynie  zmiany  składowej  po- 
ziomej (horyzontalnej)  H.  Burza  często  zaczyna  się 
skokiem  natężenia  pola  magnetycznego.  Mówimy 
wówczas  o „nagłym  początku  burzy”  (SC  na  rys.  7). 
Po  nagłym  początku,  przez  kilka  godzin  natężenie 
pola  jest  duże.  Jest  to  początkowa  faza  burzy  ( DCF ). 
Po  kilku  godzinach  rozpoczyna  się  główna  faza  burzy, 
którą  charakteryzuje  znaczny  spadek  natężenia  pola 
(DR  1).  Z chwilą  osiągnięcia  minimum  natężenie  pola 
powraca  powoli  do  wartości,  jaką  miało  przed  burzą 
(DR2).  Niekiedy  natężenie  pola  w czasie  głównej  fazy 
burzy  silnie  maleje,  dając  efekty  oznaczone  na  rysunku 
literami  DP. 

czas 
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Rys.  7.  Przykład  magnetogramu  uzyskanego  w czasie  burzy  mag- 
netycznej (pokazano  tylko  składową  poziomą  H pola  magnetycz- 
nego). Czas  liczony  jest  od  momentu , .nagłego  początku  burzyć 
CSC).  Skala  zmian  uwidoczniona  jest  z prawej  strony  (1  y — 


Jak  wytłumaczyć  te  zjawiska?  Przyczyną  burz  ma- 
gnetycznych są  zaburzenia  na  Słońcu.  W wyniku  roz- 
błysku na  Słońcu  odrywa  się  od  niego  obłok  plazmy, 
która  jest  gęstsza  i porusza  się  szybciej  niż  plazma 
w spokojnym”  wietrze  słonecznym.  W ciągu  1-2  dni 
obłok  taki  dociera  w pobliże  Ziemi.  W momencie 
zetknięcia  się  jego  z magnetosferą  zostaje  ona  w spo- 
sób nagły,  impulsowy  zaburzona.  Powstaje  fala  ude- 
rzeniowa (-*  Fale  uderzeniowe),  która  rozchodzi  się 
w magnetosferze,  czego  efektem  jest  nagły  początek 
burzy  (SC).  Następnie  plazma  obłoku  opływa  magne- 
tosferę  i powstają  prądy  płynące  po  powierzchni  ma- 
gnetopauzy.  Prądy  te  zmieniają  natężenie  pola  magne- 
tycznego wewnątrz  magnetosfery,  co  się  przejawia 
w postaci  początkowej  fazy  burzy  (DCF).  Aby  wy- 
jaśnić główną  fazę  burzy,  należy  założyć,  że  w magne- 
tosferze płyną  prądy  pierścieniowe.  Powinny  one 
płynąć  ku  zachodowi,  by  się  zmniejszyła  składowa 
horyzontalna  pola  magnetycznego  (zgodnie  z „regułą 
lewej  ręki”).  W rzeczywistości  musimy  przyjąć,  że 
istnieją  dwa  prądy  pierścieniowe:  silny,  odpowie- 
dzialny za  zmiany  DRl,  którego  natężenie  szybko 
wzrasta  i który  znika  w ciągu  jednego  dnia,  oraz  słaby 
(Z>/?2),  którego  natężenie  maleje  powoli.  Przypuszcza 
się,  że  prądy  pierścieniowe  są  wynikiem  wstrzyknięcia 
do  magnetosfery  protonów  o małych  energiach,  które 
następnie  zmuszone  są  do  ruchu  po  torach  przedsta- 
wionych na  rys.  6.  Miejscem,  w którym  cząstki  wstrzy- 
kiwane są  do  magnetosfery,  jest  prawdopodobnie  jej 
ogon,  ale  problem  ten  nie  jest  w pełni  wyjaśniony. 
Na  rys.  8 prąd  pierścieniowy  przedstawiony  jest  w po- 
staci grubych  strzałek.  Rozpływa  się  on  ku  obszarom 
polarnym,  wzdłuż  linii  sił  poła  geomagnetycznego. 
W obszarze  polarnym  prądy  wzdłuż  linii  pola  zamy- 
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kają  się  ńa  wysokości  jonosferycznej  warstwy  E.  prąd 
tworząc  prąd  zorzowy  (DP  1),  zaznaczony  (rys.  8)  zorzowy 
grubą  strzałką  na  powierzchni  kuli  wyobrażającej 
Ziemię.  Płynie  on  w wąskim  (rzędu  400  km)  i cienkim 
(kilka  km)  pasie  wokół  biegunów  magnetycznych. 

Po  stronie  dziennej  prąd  płynie  ku  zachodowi,  po 
stronie  nocnej  — ku  wschodowi,  a zatem  w dzień  po- 
woduje zmniejszenie  się  składowej  H,  w nocy  zaś  — 
jej  zwiększenie. 


Rys.  8.  Rozkład  prądów  w magnetosferze  typowy  dla  burzy  mag- 
netycznej. Strzałki  pokazują  prąd  pierścieniowy,  który  rozpływa 
się  wzdłuż  linii  sił  pola  magnetycznego  do  jonosfery  polarnej, 
tworząc  tam  prąd  zorzowy 

Drugi  rodzaj  prądu  (DPI)  — to  układy  prądów  wi-  prądy 
rowych  w jonosferze  płynących  po  stronie  wschodniej  wirowe 
i zachodniej,  głównie  na  dużych  szerokościach  geo- 
magnetycznych. Efekt  ich  widoczny  jest  również  na 
średnich  szerokościach.  Powstanie  tych  prądów  zwią- 
zane jest  z konwekcją  magnetosferyczną. 

Należy  jeszcze  wspomnieć  o efekcie,  który  spowo- 
dowany jest  dużym  przewodnictwem  elektrycznym 
plazmy,  a polega  na  tym,  że  linie  sił  pola  magnetycz- 
nego poruszają  się  razem  z plazmą,  są  w nią  , ,wmro- 
żone”.  Tak  więc  z ruchem  konwekcyjnym  plazmy 
magnetosferycznej  związany  jest  ruch  linii  sił  pola. 

Bierze  w nim  udział  cała  linia  siły  łącznie  z częścią 
wnikającą  do  jonosfery.  „Przyczepione”  są  do  niej 
elektrony  i jony.  Jednak  praktycznie  biorąc,  tylko 
elektrony  mogą  uczestniczyć  w ruchu  linii  sił.  Jony 
bowiem  są  hamowane  przez  zderzenia  z cząstkami 
neutralnymi.  W rezultacie  elektrony,  unoszone  liniami 
sił  pola  magnetycznego  wprawionymi  w ruch  ruchami 
konwekcyjnymi  plazmy  magnetosferycznej,  poruszają 
się  w jonosferze  względem  prawie  nieruchomych  jo- 
nów. Powstaje  więc  prąd  płynący  w kierunku  prze- 
ciwnym do  ruchu  linii  sił  pola.  Ponieważ  w obszarach 
polarnych  konwekcja  ma  kierunek  od  Słońca,  przeto 
linie  sił  przemieszczają  się  od  Słońca,  a prąd  płynie 
ku  Słońcu.  W miarę  przechodzenia  do  coraz  mniej- 
szych szerokości  geomagnetycznych  kierunek  ruchu 
plazmy  w magnetosferze  coraz  bardziej  odchyla  się 
od  kierunku  od  Słońca  i na  średnich  szerokościach 
przybiera  już  kierunek  ku  Słońcu.  W efekcie  również 
prąd  w jonosferze  zmienia  kierunek.  Powstają  dwa 
układy  prądów  wirowych.  Na  rys.  8 są  one  zaznaczone 
cienkimi  strzałkami  na  powierzchni  Ziemi.  Układy 
prądów  DPI  i DP2  wywołują  zmiany  pola  magnetycz- 
nego oznaczone  na  rys.  7 literami  DP. 

Bardzo  spektakularnym  zjawiskiem,  występującym 
w okresie  burz  magnetycznych  na  dużych  szeroko- 
ściach geomagnetycznych,  są  zorze  polarne  (tabl.  6,  zorze 
ii.  20).  Zielone  i czerwone  obłoki,  promienie  lub  dra-  polarne 
perie  pobudzały  wyobraźnię  ludzką  od  najdawniej- 
szych czasów.  Jednak  na  wyjaśnienie  mechanizmu 
powstawania  zórz  musieliśmy  czekać  aż  do  dwudzie- 
stego wieku.  Jest  rzeczą  pewną,  że  zorze  to  świecenie 
atmosfery  wywołane  bombardowaniem  elektronami 
o energii  rzędu  kilkudziesięciu  keV.  Cząstki  te  wzbu- 
dzają atomy,  które  — wracając  do  stanu  podstawo- 
wego— wypromieniowują  energię  w postaci  kwantów 


światła.  Powstaje  pytanie,  skąd  się  biorą  cząstki  o ta- 
kiej energii  w atmosferze.  Na  rys.  5 zaznaczono  obszar 
leżący  poza  pasami  promieniowania  i łączący  się 
z ogonem  magnetosfery.  Obszar  ten,  zrzutowany 
wzdłuż  linii  sił  pola  magnetycznego  na  powierzchnię 
Ziemi,  daje  dwa  pasy  otaczające  bieguny  magnetyczne. 
Nazywamy  je  „owalami  zorzowymi”.  Owale  przy- 
bliżają się  do  bieguna  (do  ok.  78°  szerokości)  w dzień, 
a oddalają  (do  ok.  68°  szerokości)  w nocy.  Położenie 
owalu  względem  Słońca  nie  zmienia  się.  Gdy  Ziemia 
rotuje,  owal  przechodzi  przez  różne  obszary  jej  po- 
wierzchni. Na  przykład  nocna  część  owalu  zatacza 
okrąg  położony  na  szerokości  ok.  68°.  Ten  pas  na 
strefa  Ziemi  nazywa  się  strefą  zorzową,  tu  zorze  występują 
zorzowa  najczęściej.  Nocna  część  owalu  łączy  się  z ogonem 
magnetosfery.  Z ogona,  albo  nawet  spoza  magneto- 
sfery (ale  przez  ogon),  cząstki  przedostają  się  do  bliż- 


szych Ziemi  obszarów  magnetosfery.  W czasie  wę- 
drówki w ogonie  są  one  przyspieszane  i gdy  dochodzą 
wreszcie  do  granic  atmosfery,  mogą  mieć  energie  wy- 
starczająco duże  na  to,  aby  wywołać  zjawisko  zorzy 
polarnej. 

Na  zakończenie  możemy  tylko  wspomnieć,  że 
z burzami  magnetycznymi  i zorzami  polarnymi  wiąże 
się  wiele  zjawisk,  np.  wzrost  pochłaniania  fal  radio- 
wych, powstawanie  nieregularności  koncentracji  jo- 
nów i elektronów  w jonosferze,  okresowe,  o małej 
amplitudzie  pulsacje  pola  magnetycznego,  spadek 
natężenia  promieniowania  kosmicznego  (efekt  For- 
busha  -*  Promieniowanie  kosmiczne). 

A.  D.  Daniłow  Chemia , atmosfera,  kosmos.  Warszawa  1976; 
F.  Delobeau  The  Environment  of  the  Earth , Dordrecht-Holland 
1971 ; P.  Oberc  Magnetosfera , ActaGcophys.  Pol.  18,  103(1970); 
H.  Rishbeth.O.  K.  Garriott Introduction  to  lonospheric  Physics, 
New  York  1969. 
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Kilkaset  lat  przed  naszą  erą  zauważono  zjawiska, 
które  dzisiaj  określa  się  mianem  zjawisk  magnetycz- 
nych. W miarę  upływu  czasu  i przybywania  danych 
obserwacyjnych  powstała  nauka  o magnetyzmie  ziem- 
skim, z której  z kolei  wyodrębniły  się  bardziej  szcze- 
gółowe dyscypliny,  zajmujące  się  takimi  zagadnie- 
niami jak  stałe  pole  magnetyczne,  paleomagnetyzm, 
zmienne  pole  magnetyczne,  indukcja  elektromagne- 
tyczna we  wnętrzu  Ziemi. 

Pierwszych  odkryć  związanych  ze  zjawiskami  ma- 
gnetycznymi dokonali  Chińczycy;  już  w starożytnych 
Chinach  znane  były  przyciągające  własności  skały 
zawierającej  magnetyt.  Przypuszcza  się  również,  że 
Chińczycy  znal  i kierunkowe  składowe  pola  magne- 
tycznego Ziemi.  Najwcześniejszy,  z 720  r.  n.e.,  znany 
opis  wyznaczania  deklinacji  magnetycznej  pochodzi 
również  z Chin.  Pierwszym  instrumentem  wykorzy- 
stującym zjawisko  deklinacji  był  kompas,  znany  praw- 
dopodobnie od  czasów  starożytnych.  Najdawniejszy 
opis  tego  instrumentu,  sporządzony  w Europie,  po- 
chodzi dopiero  z 1 190  r.,  a jego  autorem  jest  angielski 
mnich,  Aleksander  Neckam. 

Przez  długie  lata  uważano,  że  kąt  deklinacji  za- 
leży od  używanego  instrumentu.  Dopiero  dokładne 
pomiary  tego  kąta,  dokonywane  w połowie  XVI  w. 
w różnych  punktach  kuli  ziemskiej  przez  portugal- 
skiego żeglarza  Joao  da  Castro,  wykazały  ostatecznie, 
że  deklinacja  zależy  od  miejsca,  w którym  się  doko- 
nuje pomiaru.  W XVI  wieku  zauważono  (G.  Hart- 
mann,  R.  Norman),  że  igła  kompasu  tworzy  pewien 
kąt  z płaszczyzną  horyzontu  — było  to  odkrycie  in- 
klinacji magnetycznej. 

Z upływem  czasu  przybywało  informacji  o zjawi- 
skach związanych  z magnetyzmem  ziemskim.  W 1600r. 
ukazało  się  dzieło  Wiliama  Gilberta  De  Magnete  ... 
(O  magnesie,  ciałach  magnetycznych  i największym 
magnesie  — Ziemi),  w którym  Gilbert  wykazał,  że 
pole  magnetyczne  Ziemi  ma  takie  cechy  jak  pole  jed- 
norodnie namagnesowanej  kuli,  przy  czym  położenie 
biegunów  magnetycznych  Ziemi  pokrywa  się  z po- 
łożeniem jej  biegunów  geograficznych.  Wnioski  Gil- 
berta miały  ogromne  znaczenie  dla  rozwoju  nauki 
o polu  geomagnetycznym.  Oprócz  wyjaśnienia  dekli- 
nacji i inklinacji  Gilbert  wykazał,  że  źródeł  pola  mag- 
netycznego Ziemi  należy  szukać  w jej  wnętrzu,  a nie 
poza  nią.  Z czasem  okazało  się,  że  wniosek  Gilberta 
jest  słuszny  nie  w odniesieniu  do  całego  pola  geomag- 
netycznego, lecz  do  jego  przeważającej  części,  zwanej 
stałym  polem  geomagnetycznym.  Na  stałe  pole  mag- 
netyczne, pochodzące  od  źródeł  znajdujących  się  we 
wnętrzu  Ziemi,  nakłada  się  bowiem  zmienne  pole 
magnetyczne,  którego  źródła  znajdują  się  w prze- 
strzeni pozaziemskiej. 


Natężenie  pola  magnetycznego  F mierzone  na  po- 
wierzchni Ziemi  jest  wielkością  wektorową  (właściwie 
wielkością  mierzoną  jest  indukcja  magnetyczna,  lecz 
przyjęto  stosować  nazwę  pole  magnetyczne).  Można 
je  przedstawić  (rys.  1)  za  pomocą  trzech  wielkości: 
2 składowych  — składowej  pionowej  Z (mierzonej 
pionowo  w dół),  składowej  poziomej  H — oraz  dekli- 
nacji D (deklinacja  magnetyczna  jest  to  kąt  pomiędzy 


Rys.  1 . Składowe 
całkowitego  wektora 
polamag  netycznego 

Ziemi  F 


północ 

geograficzna  północ 
/ magnetyczna 


/ 

/ 


południkiem  geograficznym  a magnetycznym  w miej- 
scu obserwacji;  mierzy  się  ją  w kierunku  wschodnim). 
Innym  sposobem  przedstawienia  pola  może  być  po- 
danie wartości  całego  natężenia  pola  F,  deklinacji  D 
i inklinacji /(inklinacja  jest  to  kąt,  który  tworzy  wektor 

F z poziomem;  inklinację  mierzoną  w dół  od  poziomu 
uważamy  za  dodatnią).  Rzadziej  stosuje  się  składowe 
X,  y,  Z skierowane  odpowiednio:  X — w kierunku 
północnym,  Y — w kierunku  wschodnim,  Z — pio- 
nowo w dół. 


Stałe  pole  geomagnetyczne 

Ukazanie  się  traktatu  W.  Gilberta  było  przełomo- 
wym wydarzeniem  w historii  magnetyzmu  ziemskiego. 
Coraz  waększa  liczba  prac  o zjawiskach  magnetyzmu 
oraz  większa  liczba  danych  obserwacyjnych  pozwoliły 
w 1839  r.  uczonemu  niemieckiemu  Fryderykowi  Gaus- 
sowi ująć  matematycznie  główny  wniosek  Gilberta, 
czyli  przedstawić  stałe  pole  magnetyczne  Ziemi 
w pierwszym  przybliżeniu  jako  pole  di  pola  umiesz- 
czonego w środku  Ziemi  i skierowanego  wzdłuż  jej 
osi  obrotu. 

Metoda  analizy  Gaussa — tzw.  analiza  sferyczno-harmoniczna 
pola  magnetycznego  Ziemi  — polega  na  przedstawieniu  natężenia 
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metoda  tego  pola  w każdym  punkcie  na  powierzchni  Ziemi  w funkcji 
analizy  wsP^łrz5dnych  geograficznych  tego  punktu.  Podstawą  analizy  są 
j»  wartości  natężenia  pola  otrzymane  w wielu  punktach,  rozmiesz- 

uaussa  czonych  możliwie  regularnie  na  powierzchni  Ziemi.  Z obliczeń 
otrzymuje  się  natężenie  całkowitego  wektora  F lub  jego  składo- 
wych X,YyZ  w postaci  nieskończonych  szeregów  współczynników 
stałych  pomnożonych  przez  funkcje  długości  i szerokości  geogra- 
ficznej. Ograniczając  się  do  kilku  pierwszych  wyrazów  tych  szere- 
gówt  otrzymuje  się  dla  poszczególnych  składowych  pola  w punkcie 
P (rys.  2)  wzory:  X = -gJsinfl+teJcosJŁ+AjsiniOcosĆł, 

^ = ffJsinA— Ajcos2,  Z = 2[gjcos0-f  (gj cosA+A}sinA)sin0], 

gdzie  dla  epoki  1955*  0 współczynniki  liczbowe  wynosiły:  gj  «= 
= — 3,05- 104  T,gJ  = —0,23*  10*  T,  h\  = 0,58  1 06T.  Wielkość  9 
jest  dopełnieniem  szerokości  geograficznej  punktu  /*,  X — dłu- 
gością geograficzną  punktu  P.  Wyrażenia  te  opisują  składowe  pola 
jednorodnie  namagnesowanej  kul  i,  w tym  wypadku  kul  i ziemskiej, 
i zarazem  składowe  pola  dipola  umieszczonego  w środku  Ziemi 
i skierowanego  wzdłuż  jej  osi  obrotu  (dipol  osiowy).  Linie  sił  pola 
takiego  dipola  układają  się  jak  na  rys.  2 — ,, wchodzą”  w głąb 
Ziemi  i „wychodzą”  z niej  w punktach  zwanych  biegunami.  Dalsze 
człony  szeregów  Gaussa  opisują  składowe  pola  niedipolowego. 


Rys.  2.  Linie  sił  pola  dipola  magnetycznego  (n-s)  umieszczonego 
w środku  Ziemi  i skierowanego  wzdłuż  jej  osi  obrotu.  N biegun 
północny,  5 biegun  południowy,  P punkt  na  powierzchni  Ziemi 
o szerokości  geograficznej  <p  i dopełnieniu  szerokości  geograficz- 
nej 9.  W przypadku  dipola  osiowego  współrzędne  geograficzne 
pokrywają  się  z geomagnetycznymi,  a inklinacja  1 wiąże  się 
z dopełnieniem  szerokości  0 następującym  wzorem : tg  / = 2 ctg  9 


Natężenie  stałego  pola  geomagnetycznego  stanowi 
ponad  99%  natężenia  całego  pola  obserwowanego  na 
powierzchni  Ziemi.  Lepiej  niż  dipol  osiowy  opisuje 
je  dipol  umieszczony  również  w środku  Ziemi,  ale 
tworzący  kąt  11J5  z jej  osią  obrotu  (rys.  3).  Moment 
magnetyczny  takiego  dipola  w^mosi  8-101*  Tm3.  (Mo- 
ment magnetyczny  kuli  o powierzchni  1 m2  wykona- 
poSe  nej  z miękkiego  żelaza  wynosi  ok.  1 • 10~4  Tm3).  Pole, 
dipolowe  które  on  wytwarza,  opisuje  ok.  90%  pola  stałego. 

Pozostałe  10%  to  wspomniane  już  pole  niedipolowe, 
o nieregularnym  rozkładzie  na  powierzchni  Ziemi. 

Stałe  pole  magnetyczne,  mimo  że  nosi  nazwę  sta- 
łego, ulega  powolnym  zmianom.  Obecnie  istnieje  na 
świecie  ponad  150  obserwatoriów  magnetycznych 
prowadzących  ciągłą  rejestrację  poszczególnych  skła- 
dowych. Poza  tym  co  kilka  lat  przeprowadza  się  po- 
miary pola  geomagnetycznego  w określonych  punk- 
tach, zwanych  wiekowymi.  Materiał  obserwacyjny 
uzupełniają  pomiary  dokonywane  ze  statków  na  ocea- 
nach i morzach  oraz  z samolotów  na  różnych  wyso- 
pu/ikty  kościach  nad  powierzchnią  Ziemi.  Dane  obserwa- 
wiekowe  cyjne  są  podstawą  do  sporządzania  co  kilka  lat  świa- 
towych map  poszczególnych  składowych  pola  magne- 
tycznego. Wyniki  uzyskane  w obserwatoriach  w po- 
staci ciągłego  zapisu  poszczególnych  składowych  po- 
la geomagnetycznego  — magnetogramu  (rys.  25)  — 
zawierają  zarówno  część  stałą  pola,  jak  i zmienną 
Aby  otrzymać  składowe  tylko  pola  stałego,  uśrednia 
się  wyniki  obserwacji  dotyczące  jakiegoś  okresu  — 
©trzymy-  najczęściej  jest  to  okres  jednego  roku.  Tę  wartość 
warcie  średnią,  zwaną  w tym  wypadku  średnią  roczną,  otrzy- 
wartości  muje  się  obliczając  kolejno  średnie  godzinne,  dobowe, 
Średnich  miesięczne  i — na  końcu  — roczne,  przy  czym  odrzu- 
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ca  się  wyniki  obserwacji  dokonanych  podczas  dni 
szczególnie  zaburzonych  magnetycznie.  Otrzymana 
w ten  sposób  średnia  roczna  wartość  pola  nie  zawiera 
zmian  godzinnych,  dobowych  ani  sezonowych.  Po- 
nieważ, o czym  będzie  mowa  później,  na  wymienione 
tu  zmiany  nakładają  się  zmiany  związane  z okreso- 
wym występowaniem  plam  na  Słońcu  (okres  ok.  11 
lat),  czasem  oblicza  się  średnie  wartości  pola  dla 
10-letnich  przedziałów  czasu.  Średnie  wartości  otrzy- 
mane dla  jakiegoś  przedziału  czasu  przypisuje  się 
momentowi  wypadającemu  w środku  tego  przedzia- 


Rys.  3.  Dipol  magnetyczny  umieszczony  w środku  Ziemi,  nachy- 
lony pod  kątem  Il°5  względem  jej  osi  obrotu.  Na  rysunku  są 
zaznaczone  bieguny  geograficzne  północny  i południowy  (N  i S ), 
bieguny  geomagnetyczne,  czyli  miejsca  przecięcia  osi  dipola  z po- 
wierzchnią Ziemi,  oraz  bieguny  magnetyczne,  czyli  miejsca,  w któ- 
rych inklinacja  magnetyczna  / wynosi  +90°  (biegun  północny) 
i —90°  (biegun  południowy).  Południowy  biegun  dipola  jest 
skierowany  w stronę  półkuli  południowej,  a biegun  północny  — 
w stronę  północnej.  A zatem  z punktu  widzenia  fizyki  na  półkuli 
geograficznej  południowej  znajduje  się  północny  biegun  magne- 
tyczny, a na  półkuli  północnej  — południowy.  Jednak  ze  względu 
na  tradycję  i wygodę  przyjęto  nazwy  i oznaczenia  zgodne  z naz- 
wami geograficznymi.  Na  rysunku  zaznaczony  jest  również  rów- 
nik geograficzny,  geomagnetyczny  i magnetyczny.  Analogicznie 
do  współrzędnych  geograficznych  wprowadzono  współrzędne 
geomagnetyczne:  szerokość  geomagnetyczna  punktu  jest  to  kąt, 
który  tworzy  wektor  wodzący  poprowadzony  ze  środka  Ziemi 
do  tego  punktu  z płaszczyzną  równika  geomagnetycznego,  a dłu- 
gość geomagnetyczna  jest  to  kąt,  który  tworzy  południk  geomag- 
netyczny przechodzący  przez  dany  punkt  z południkiem  przecho- 
dzącym przez  biegun  geograficzny.  Obecnie  bieguny  geomagne- 
tyczne zajmują  następujące  położenia:  biegun  geomagnetyczny 
północny  78®5  ^70°^,  biegun  geomagnetyczny  południowy 
78?5  S 110°E  (bieguny  geomagnetyczne  leżą  naprzeciwko  siebie). 
Położenia  biegunów  magnetycznych  były  w tym  czasie  następu- 
jące: biegun  magnetyczny  północny  75?5 N,  101°IV,  biegun  mag- 
netyczny południowy  66 °S  140 °E  (bieguny  magnetyczne  nie  leżą 
naprzeciwko  siebie)  (wg  M.  W.  Mc  Elhinny  Paleomagnetism  and 
piąte  tectonics , Cambridge  1973) 


łu;  moment  taki  nazywa  się  epoką.  Przeprowadzając 
analizę  sferyczno-harmoniczną  pola  dla  jakiejś  epoki, 
wykorzystuje  się  również,  jak  wspomniano,  wyniki 
jednorazowych  pomiarów  składowych  pola.  I tu  rów- 
nież uwzględnia  się  poprawki  na  pole  zmienne,  ko- 
rzystając w tym  celu  z rezultatów  uzyskanych  w naj- 
bliższych obserwatoriach.  Na  rys.  4a,  b,  c,  przedsta- 
wiono mapę  izogon  (linie  jednakowej  deklinacji), 
izoklin  (linie  jednakowej  inklinacji)  i izodynam  (linie 
jednakowego  natężenia  składowej  H)  dla  epoki 
1965,0.  Widoczne  na  rys.  4a  punkty,  w których  się 
zbiegają  izogony,  to  bieguny  magnetyczne,  północny 
N i południowy  S.  Na  biegunie  północnym  inklinacja 
wynosi  -f90°,  a na  południowym  —90°,  składowa  po- 
zioma H w miejscu  biegunów  wynosi  zero.  Charakte- 
rystyczną linią  widoczną  na  mapie  izoklin  jest  linia 


epoka 


— 


równika  magnetycznego  (oznaczona  kolorem  czar- 
nym — grubo),  wzdłuż  której  inklinacja  jest  0. 

W 1947  r.  ukazało  się  zestawienie  danych  obserwa- 
cyjnych za  lata  1905-1945.  Autorzy  przedstawili  wy- 
niki analizy  numerycznej,  przeprowadzonej  metodą 
Gaussa,  dla  wielu  epok  na  zebranym  materiale.  Od 
tej  pory  zaczęto  wykonywać  podobne  analizy  co  kilka 
lat.  Jednym  z najciekawszych  i chyba  najistotniejszych 
rezultatów  tych  prac  jest  możliwość  rozdzielenia  sta- 
łego pola  na  części  dipolową  i niedipolową.  Rysunek 
5 przedstawia  rozkład  pola  niedipolowego  na  po- 
wierzchni Ziemi  w epoce  1945,0.  Cechą  tego  pola  jest 
widoczna  na  rysunku  obecność  centrów,  wokół  któ- 
rych układają  się  izolinie.  Pole  niedipolowe  osiąga  w 
centrach  maksymalne  amplitudy,  sięgające  1,5  10  5 


Rys.  5.  Pole  niedipoJowe  dla  epoki  1945,0(w  odstępach  4-iO~7T). 
Znaki  + i — oznaczają  maksymalne  wartości  ujemne  i dodatnie 
pola  niedipolowego  (wg  D.  H.  Tarling  Principles  ąnd  Applica- 
tions of  Paleomagnetism , London  1971) 

848 


T.  Obszary  o średnicach  wielu  tysięcy  kilometrów  anomalie 
wokół  centrów  nazwano  anomaliami  regionalnymi,  regionalne 
Szczegółowe  pomiary  pola  geomagnetycznego  w po- 
szczególnych rejonach  kuli  ziemskiej  wykazują,  że 
istnieją  obszary,  w których  wartość  pola  jest  znacznie 
wyższa  (lub  niższa)  niż  w obszarach  sąsiednich.  Są  to 
tzw.  lokalne  anomalie  magnetyczne  związane  z wystę- 
powaniem skał  o dużej  zawartości  minerałów  magne- 


Rys.  6.  Zmiany  wiekowe  deklinacji  magnetycznej  w Gdańsku 
wg  obserwacji  J.  Retyka  (1539),  Anonima  (1600),  i.  Heweliusza 
(1628,  1635,  1642,  1670,  1667?,  1682)  i E.  Halleya  (1679)  (wg 
T.  Olczak  Jan  Heweliusz  i magnetyzm  ziemski , Postępy  Astro- 
nomii, 3 65, 1955) 


tycznych.  Przykładami  takich  anomalii  są  anomalia 
kurska  oraz  anomalie  w północnej  Szwecji.  Głębo- 
kości źródeł  wywołujących  anomalie  lokalne  nie  prze- 
kraczają 25  km,  podczas  gdy  źródła  pól  niedipolo- 
wego  i dipolowego  znajdują  się  nieporównanie  głę- 
biej, bo  poniżej  2900  km.  O pochodzeniu  pola  stałego 
będzie  mowa  przy  końcu  następnego  paragrafu, 
zmiany  Średnie  roczne  wartości  poszczególnych  składo- 
wiekowe  wych  pola  stałego,  otrzymywane  w opisany  wyżej 
sposób,  zmieniają  się  w miarę  upływu  czasu.  Długo- 
okresowe zmiany  pola  nazwano  zmianami  wiekowy- 
mi. W 1634  r.  angielski  uczony  H.  Gellibrand  zauwa- 
żył, że  deklinacja  mierzona  w Londynie  zmienia  się 
wraz  z czasem.  Przed  Gellibrandem  zmiany  dekli- 
nacji magnetycznej  obserwował  już  Jan  Heweliusz 
(161 1-1687),  wybitny  astronom  z Gdańska.  Na  rys.  6 
przedstawiona  jest  krzywa  zmian  wiekowych  dekli- 


deklinacja 


nacji  magnetycznej  w Gdańsku  zestawiona  przez 
T.  Olczaka  na  podstawie  obserwacji  z lat  1539-1679. 

Wiele  cennych  danych  o deklinacji  magnetycznej  do- 
starczają zegary  słoneczne  i instrumenty  astronomicz- 
ne. Zarówno  na  jednych,  jak  i na  drugich  twórcy 
bądź  uczeni,  którzy  z nich  korzystali,  zaznaczali  kąt 
deklinacji  właściwy  dla  miejsca  budowy  lub  użytko- 
wania instrumentu.  Z wykresów  zmian  deklinacji  czy 
inklinacji  w długich  okresach  czasu  widać,  że  zmiany 
te  są  cykliczne.  Na  rys.  7 przedstawiona  jest  krzywa 
zmian  wiekowych  deklinacji  i inklinacji  dla  Londynu 
od  1540  do  1960  r.  Przebieg  krzywej  wskazuje,  że 
okres  zmian  wynosi  ok.  400  lat.  Obecnie  wyróżnia  się 
kilka  typów  zmian  wiekowych,  o okresach  rzędu  kilku 
tysięcy,  kilkuset  i kilkudziesięciu  lat.  Ze  szczegóło- 
wych badań  części  dipolowej  i niedipolowej  stałego 
pola  wynika,  że  ulegają  one  zmianom  wiekowym. 

W ciągu  ostatnich  100  lat  natężenie  pola  dipolowego 
malało  o ok.  0,04%  rocznie  i pole  przesuwało  się 
w kierunku  zachodnim  ok.  0°05  w ciągu  roku.  Zja- 
wisko to  nazwano  dryfem  zachodnim  pola  niedipo-  dryf 
lowego.  Pole  niedipolowe  zmieniało  swoje  natężenie  zachodni 
mniej  systematycznie,  w jednych  okresach  rosło, 
w innych  znów  malało.  W 1950  r.  E.  Bullard  i in.  zau- 
ważyli, że  pole  niedipolowe  przesuwa  się  na  zachód 
z prędkością  0°18  rocznie. 

Zmiany  wiekowe  poszczególnych  składowych,  po- 
dobnie jak  same  składowe,  wygodnie  jest  przedstawić 
w postaci  map  izolinii,  zwanych  izoporami.  Mapy  izopory 
izopor  różnych  epok  zestawili  po  raz  pierwszy  E. 

Vestine  i in.  w 1947  r.  Jedną  z wykonanych  przez  nich 
map  przedstawia  rys.  8.  I tu,  podobnie  jak  na  mapie 
pola  niedipolowego,  zwracają  uwagę  charaktery- 
styczne centra,  w środku  których  zmiany  wiekowe 
przybierają  szczególnie  duże  wartości.  Centra  te  na- 
zwano ogniskami  izopor.  W pięciu  z nich  zmiany 
składowej  pionowej  przekraczają  10-7  T/rok.  Po- 


Rys.  8.  Zmiany  wiekowe  składowej  pionowej  dla  epoki  1922,5  w nanoteslach  na  rok  (wg  M.  H.  P.  Bott  The  Interior  o)  the  Earth,  London 
1971) 
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równanie  map  izopor  dla  różnych  epok  wykazało,  że 
ogniska  przesuwają  się  w kierunku  zachodnim  z pręd- 
kością ok.  0®2  rocznie.  A zatem  słuszny  był  wyrażony 
już  w 1692  r.  przez  Edmunda  Halleya  pogląd,  że  zmia- 
ny wiekowe  są  wywołane  dryfem  zachodnim  pola 
niedipolowego. 

W tym  miejscu  należy  zauważyć,  że  przedstawiony 
powyżej  podział  pola  geomagnetycznego  na  części 
dipolową  i niedipolową  jest  umowny  i nie  ma  sensu 
fizycznego,  pozwala  jednak  na  łatwiejsze  przedsta- 
wienie własności  pola  stałego. 


Paleomagnetyzm 


Kilkadziesiąt  lat  temu  zaczęła  się  gwałtownie  rozwijać 
nowa  dziedzina  magnetyzmu  ziemskiego  — paleo- 
magnetyzm, nauka  zajmująca  się  polem  magnetycz- 
nym Ziemi  w przeszłości  geologicznej.  Przedmiotem 
badań  są  skały,  które  w pewnych  warunkach  mogą 
paleomagne-  przechowywać  informacje  o natężeniu  i kierunku  pola 
tyzm  i geomagnetycznego  panującego  w okresie  ich  powsta- 
archeomag-  wania.  Dziedziną  pokrewną  paleomagnetyzmowi  jest 
netyzm  archeomagnetyzm  — nauka  zajmująca  się  ziemskim 
polem  magnetycznym  w przeszłości  historycznej  i pre- 
historycznej, wykorzystująca  wyniki  badań  wypala- 
nych glin. 

Dzięki  paleomagnetyzmowi  można  poznawać  nie 
tylko  przeszłość  pola  magnetycznego  Ziemi,  ale  i sa- 
mej Ziemi.  Wyniki  badań  są  niejednokrotnie  podsta- 
wą do  przyjęcia  lub  odrzucenia  jakiejś  hipotezy  geo- 
fizycznej czy  geologicznej.  Chociaż  paleomagnetyzm 
jako  nauka  zaczął  się  rozwijać  stosunkowo  niedawno, 
to  jednak  początki  jego  sięgają  czasów  starożytnych. 
We  wstępie  była  już  mowa  o odkryciu  w starożytnych 
Chinach  skały  magnetytowej  i jej  własności.  Jedną 
z najważniejszych  dat  w historii  paleomagnetyzmu 
jest  rok  1797,  kiedy  to  wielki  uczony  niemiecki  Alek- 
sander Humboldt  zauważył,  że  igła  kompasu  jest  przy- 
ciągana przez  skały  w wierzchołkowych  partiach  gór 
Palatynatu  Reńskiego.  A.  Humboldt  zupełnie  słusznie 
przypuszczał,  że  te  silnie  magnetyczne  skały  zawdzię- 
czają swoje  właściwości  uderzeniu  piorunu.  W 1849  r. 
A.  Delesse,  a następnie  w 1853  r.  M.  Melloni  stwier- 
dzili, że  młode  lawy  wulkaniczne  są  namagnesowane 
równolegle  do  kierunku  pola  geomagnetycznego. 
Systematyczne  badania  namagnesowania  skał  zapo- 
czątkował w dwudziestych  latach  naszego  wieku 
R.  Chevallier  swoimi  pracami  nad  lawami  Etny  wy- 
lanymi w czasach  historycznych. 


Pozostałość  magnetyczna  skał 

pozostałość  Zjawiskiem  będącym  podstawą  paleomagnetyzmu 
magnetyczna  Jest  zdolność  pewnych  skał  do  uzyskiwania  pozosta- 
łości magnetycznej  o kierunku  pola  działającego  na 
skałę  w okresie  jej  powstawania.  Mierząc  wektor  po- 
zostałości magnetycznej,  można  otrzymać  wartości 
kątów  deklinacji  i inklinacji  dawnego  pola  w miejscu, 
w którym  się  znajduje  badana  skała.  Następnie,  przy 
założeniu,  że  pole  geomagnetyczne  było  zawsze  po- 
lem dipola  umieszczonego  w środku  Ziemi  i skierowa- 
nego wzdłuż  jej  osi  obrotu,  można  znaleźć  położenie 
bieguna  magnetycznego  w okresie  powstawania  skały. 

właściwości  -*alc  wyżeJ  wspomniano,  informacje  o polu  geomagnetycznym 
w dawnych  epokach  geologicznych  są  zachowane  przez  skały. 

^ ^ ' '7  Stwierdzenie  to  należy  jednak  uściślić:  do  badań  paleomagnetycz- 

SkćSł  nych  stosuje  się  skały  zawierające  minerały  magnetyczne.  Właści- 
wości magnetyczne  skały  zależą  od  ilości  i rodzaju  zawartych  w 
niej  minerałów  tego  typu.  W zależności  od  pochodzenia  skały 
można  podzielić  na:  skały  magmowe  (wylewne,  np.  bazalt,  i głę- 
binowe, np.  granit),  skały  osadowe  (np.  piaskowce,  wapienie) 
i skały  zmetamorfizowane  (np.  gnejsy,  marmury).  Większość  skał 
zawiera  pewną  ilość  minerałów  magnetycznych.  Mianem  tym 
określa  się  minerały  o różnej  budowie,  zarówno  ferrimagnetyki, 
jak  i nieskompensowane  antyferromagnetyki.  Minerały  ferri- 
magnetyczne  zawierają  jony  żelaza  dwu-  i trójwartościowego 
ułożone  w dwóch  regularnych  podsieciach  w taki  sposób,  że 
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wektory  momentów  magnetycznych  obu  podsieci  są  antyrówno- 
ległe.  Wypadkowy  moment  magnetyczny  ferrimagnetyków  jest 
różny  od  zera,  ponieważ  momenty  magnetyczne  tych  podsieci  nie 
są  równe.  W nieskompensowanych  antyferromagnetykach  war- 
tości momentów  są  takie  same,  ale  wektory  momentów  nie  są 
wzajemnie  równoległe,  lecz  nachylone  względem  siebie  pod  pew- 
nym kątem.  Wzajemne  ustawienie  momentów  magnetycznych  w 
obu  typach  minerałów  jest  przedstawione  na  rys.  9. 


wypadkowy 

moment 

magnetyczny 


► 

wypadkowy 

moment 

magnetyczny 


Rys.  9.  Wzajemne  ustawienie  momentów  magnetycznych:  a)  w 
ferrimagnetykach,  b)  w nieskompensowanych  antyferromagne- 
tykach 


W przyrodzie  najczęściej  spotyka  się  następujące  minerały 
magnetyczne : 

tytanomagnetyty  (ferrimagnetyki)  — minerały  z szeregu  mag- 
netyt (FCjO«)-ulwospinel  (ulvit)  (Fe2TiO«), 

hemotfmenity  — minerały  z szeregu  hematyt  (a-Fe20,)-iIme- 
nit  (FeTiO*),  o strukturze  romboedralnej, 

tytanomaghemity  — tytanomagnetyty  z defektami  sieci  krysta- 
licznej, 

wodorotlenki  żelaza,  np.  getyt,  a FeOOH,  pirotyny  FeSt.fa: 
(0  jc  < 0,14). 

Spośród  wymienionych  minerałów  największą  wartość  namag- 
nesowania nasycenia  ma  magnetyt  — ok.  4,5*10-*  T.  Wartości 
namagnesowania  nasycenia  tytanomagnetytów  są  tym  mniejsze, 
im  więcej  tytanu  zawiera  minerał . Maghemit  charakteryzuje  nieco 
mniejsze  niż  magnetyt  namagnesowanie  nasycenia  4*10-ł  T.  W 
miarę  wzrostu  zawartości  tytanu  (czyli  w minerałach  szeregu 
tytanomaghemitowego)  wartość  tego  momentu  maleje.  Hematyt, 
jako  antyferromagnetyk  z pasożytniczym  ferromagnetyzmem,  ma 
znacznie  niższe  namagnesowanie  nasycenia,  0,5-2, 5* 10-ł  T. 
Najsilniej  magnetyczne  są  te  minerały  z szeregu  hemoilmenito- 
wego,  które  zawierają  55-75%  ilmenitu,  tzw.  ferriilmenity  (fer- 
rimagnetyki). Minerały  magnetyczne  charakteryzuje,  podobnie 
jak  wszystkie  materiały  o własnościach  magnetycznych,  pewna 
krytyczna  temperatura,  tzw.  temperatura  Curie  w wypadku  fer- 
rimagnetyków lub  temperatura  Nćela  w wypadku  antyferroma- 
gnetyków. Powyżej  tej  temperatury  materiały  stają  się  parama- 
gnetykami.  Temperatura  Curie  czystego  magnetytu  wynosi  ok. 
575°C  i maleje  ze  wzrostem  zawartości  tytanu  do  ok.  — 200°C 
dla  ulwospinelu.  Temperatura  Nćela  hematytu  oraz  Curie  czy- 
stego maghemitu  wynosi  ok.  675°C.  W miarę  wzrostu  zawartości 
tytanu  odpowiednie  temperatury  minerałów  obu  szeregów  maleją. 
Znajomość  temperatury  Curie  (lub  Nćela)  badanej  skały  pozwala 
stwierdzić,  jakie  minerały  znajdują  się  w jej  frakcji  magnetycznej. 

Pozostałość  magnetyczną,  którą  uzyskują  w czasie 
swojej  historii  geologicznej  skały  zawierające  mine- 
rały magnetyczne,  nazwano  naturalną  pozostałością 
magnetyczną  — NRM  (ang.  natural  remanent  magne- 
tization).  NRM  składa  się  na  ogół  ze  składowej  pier- 
wotnej, uzyskanej  przez  skałę  w okresie  jej  powsta- 
wania, i ze  składowych  wtórnych,  powstałych  w czasie 
historii  geologicznej  skały.  W skałach  magmowych 
składowa  pierwotna  NRM  jest  przeważnie  pochodze- 
nia termicznego;  ten  typ  pozostałości  powstaje  pod- 
czas stygnięcia  skały  w ziemskim  polu  magnetycznym, 
od  temperatur  wyższych  niż  temperatura  Curie  (lub 
Nćela)  minerałów  magnetycznych  do  temperatur  niż- 
szych od  tej  wartości.  Pierwotna  pozostałość  magne- 
tyczna w skałach  osadowych  jest  wynikiem  osadzania 
w ziemskim  polu  magnetycznym  ziaren  minerałów 
magnetycznych.  Każde  ziarno  ma  już  jakąś  pozosta- 
łość magnetyczną,  ziemskie  pole  jest  tylko  czynnikiem 
porządkującym. 

W wypadku  skał  przeobrażonych  (zmetamorfizo- 
wanych)  trudno  mówić  o określonym  typie  pozosta- 
łości. Historia  tych  skał  jest  zbyt  skomplikowana,  by 
można  ją  było  odtworzyć  na  podstawie  badań  ich  wła- 
sności magnetycznych.  Dlatego  przy  badaniach 
paleomagnetycznych  na  ogół  nie  bierze  się  ich  pod 
uwagę. 

Na  pierwotną  część  naturalnej  pozostałości  magne- 
tycznej nakładają  się  prawie  zawsze  składowe  wtórne, 
które  powstają  w wyniku  działania  różnych  czynników 
fizykochemicznych,  jak  np.  gorące  roztwory,  długo- 
trwałe podwyższenie  temperatury,  utlenianie,  magne- 
sujące działanie  obecnego  pola  geomagnetycznego. 
Uzyskane  w ten  sposób  wtórne  pozostałości  mają  inne 
kierunki  niż  kierunek  składowej  pierwotnej  i pierw- 
szym krokiem  w badaniach  paleomagnetycznych  jest 
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„oczyszczenie”  NRM  z tych  składowych.  W 1958  r. 
J.  A.  As  i J.D.A.  Zijderveld  zastosowali  po  raz  pierw- 
szy metodę  usuwania  wtórnych  składowych  działając 
na  próbki  skał  zmiennym  polem  magnetycznym 
o malejącej  amplitudzie.  W przeważającej  większości 


N 


Rys.  10.  Rozkład  kierunków  NRM  po  oczyszczeniu  dla  próbek 
skal  bazaltowych  z Ligoty  Tulowickiej  koło  Opola.  Położenie 
bieguna  dla  Ligoty  Tułowickicj  ę»'  = 66*W,  A'  «=  ] 8S°JST.  Każde 
kółeczko  przedstawia  kierunek  trwałej  pozostałości  magnetycznej 
dla  jednej  próbki.  Średni  kierunek  otrzymany  dla  całej  kolekcji 
wynosi  Dm  : 183°,  Im.  : —44°.  Krzyżykiem  zaznaczono  kierunek 
obecnego  pola  geomagnetycznego  w miejscu  pobrania  próbek 
(wg  J.  Kruczyk,  M.  Kądziałko-Hofmokl,  M.  Jeleńska  Origin 
of  Magnetic  Minerals  and  Naturał  Remanent  Magnetization  of 
Basaltic  Rocks  from  Lower  Silesia,  Roland , Pure  and  Applied 
Geophysics,  vol.  110,  IX,  2031,  1973) 


biegun  N 


Rys.  11.  Wyznaczanie  współrzędnych  geograficznych  bieguna 
paleomagnetycznego  P na  podstawie  średniego  kierunku  pozo- 
stałości magnetycznej  Dm,  Im  skał  oraz  współrzędnych  geogra- 
ficznych miejsca  pobrania  próbek  S.  X długość  geograficzna 
w punkcie  5’,  y szerokość  geograficzna  w punkcie  S , X'  długość 

geograficzna  bieguna,  <p'  szerokość  geograficzna  bieguna.  M 
dipol  magnetyczny  Ziemi  w okresie  powstania  badanych  skał. 
Jak  widać  z rysunku  współrzędne  geograficzne  bieguna  — dłu- 
gość X ' i geograficzna  szerokość  <p'  wiążą  się  z kierunkiem  pola 
Dm,  Im  czyli  średnim  kierunkiem  pozostałości  magnetycznej  całej 
kolekcji  oraz  współrzędnymi  geograficznymi  miejsca  pobrania 
próbek  X i <p  następującymi  wzorami : 

sin.?/  = sin  X cos/? -f  cos  A sinp  cos  Z)  (—90°  < X'  ^ +90c) 


<p'  = gdy  cos/?  ^ sinA  sinA' 
lub 

<!>’  — <p  + 180°— A gdy  cosp  < sin  A sin  A', 

gdzie 

sin  — sinpsinjD/cosA'  ( — 90°  ^ f ^ +90°), 


p dopełnienie  szerokości  geograficznej  miejsca  pobrania  próbek 
w okresie  powstawania  skały,  p wiąże  się  z inklinacją  I wzorem 
tg  / = 2ctg  p (wg  M.  W.  Mc  Elhinny  Paleomagnetism  and  piąte 
tectonics , Cambridge  1973) 


wypadków  okazało  się,  że  składowe  te  są  znacznie 
mniej  stabilne  niż  składowa  pierwotna.  Metoda  roz- 
magnesowywania  zmiennym  polem  magnetycznym 
jest  obecnie  powszechnie  stosowana.  Jednocześnie 
korzysta  się  również  z metody  oczyszczania  termicz- 
nego, która  polega  na  grzaniu  próbek  do  coraz  wyż- 
szej temperatury  i chłodzeniu  do  temperatury  poko- 
jowej. Metoda  ta  również  prowadzi  do  usunięcia 
wtórnych  składowych  NRM. 

Pozostała  po  oczyszczeniu  najbardziej  stabilna 
składowa  NRM  jest  już  na  ogół  składową  pierwotną, 
a jej  kierunek  jest  zgodny  z kierunkiem  pola  geoma- 
gnetycznego w okresie,  w którym  powstała  badana 
skała.  Aby  uzyskać  możliwie  wiarygodną  informację 
o kierunku  pola  w epoce  powstawania  badanego  kom- 
pleksu skalnego,  trzeba  dysponować  kolekcją  próbek 
liczącą  co  najmniej  10  okazów.  Otrzymane  po  oczy- 
szczeniu kierunki  pozostałości  magnetycznej  próbek 
badanej  kolekcji,  czyli  wartości  kątów  deklinacji  i in- 
klinacji, przedstawia  się  na  kołowym  wykresie,  który 
jest  rzutem  jednej  z półkul  na  płaszczyznę  równika. 
Deklinacja  zmienia  się  wzdłuż  obwodu  koła  od  N 
w kierunku  ruchu  wskazówek  zegara  od  0°  do  360°, 
a inklinacja  — wzdłuż  promienia  od  0°  na  obwodzie 
do  90°  w środku  koła.  Rysunek  10  przedstawia  otrzy- 
maną w ten  sposób  grupę  kierunków  pozostałości 
magnetycznej  kolekcji  próbek  skał  bazaltowych  z Li- 
goty Tułowickiej  pod  Opolem.  Średni  kierunek  pier- 
wotnej składowej  NRM,  obliczony  ze  wszystkich  pró- 
bek kolekcji,  jest  przeważnie  szukanym  kierunkiem 
dawnego  pola  ziemskiego.  Znając  go,  można  odtwo- 
rzyć położenie  bieguna  geomagnetycznego  w epoce 
powstawania  badanego  kompleksu  skalnego.  Rysu- 
nek 11  przedstawia,  jak  znaleźć  położenie  bieguna 
paleomagnetycznego  ówczesnego  pola,  znając  średni 
kierunek  pozostałości  magnetycznej  skał  w danym 
miejscu,  czyli  kierunek  pola  geomagnetycznego,  w któ- 
rym skała  uzyskała  tę  pozostałość. 


Inwersja  pola  geomagnetycznego 

Odkrycie  skał  namagnesowanych  w kierunku  prze- 
ciwnym niż  obecny  kierunek  pola  geomagnetycznego 
było  bardzo  ważne  dla  poznania  przeszłości  Ziemi 
oraz  rozwoju  teorii  pochodzenia  stałego  pola  ziem- 
skiego. Zjawisko  to  zauważył  po  raz  pierwszy  B. 
Brunhes  w 1906  r.  Z czasem  okazało  się,  że  skały 
o odwrotnej  naturalnej  pozostałości  magnetycznej 
występują  równie  często  jak  te,  które  mają  normalną 
pozostałość  (czyli  zgodną  z kierunkiem  obecnego 
pola).  Oba  rodzaje  NRM  występują  zarówno  wśród 
skał  magmowych,  jak  i osadowych.  A zatem  powstało 
pytanie,  czy  pozostałość  magnetyczna  skały  może  się 
odwrócić  wskutek  jakichś  procesów  fizycznych  (sa- 
moodwrócenie),  czy  też  pole  magnetyczne  zmieniało 
w przeszłości  swój  kierunek  (inwersja  pola). 

Pierwszą  skałą,  przy  badaniu  której  zaobserwowa- 
no samoodwrócenie  pozostałości  magnetycznej,  był 
dacyt  z góry  Haruna  (Japonia).  Stwierdzono,  że  skała 
ta  uzyskała  odwrotną  NRM  w normalnym  polu  ziem- 
skim i że  obserwuje  się  odwrócenie  pozostałości  ma- 
gnetycznej tej  skały  w warunkach  laboratoryjnych. 
L.  Nćel  podał  kilka  możliwych  wyjaśnień  zjawiska 
samoodwrócenia.  Istotę  tego  zjawiska  bardzo  dobrze 
tłumaczy  najprostszy  model.  L.  Nćel  zakłada,  że 
w skale  występują  przerastające  się  wzajemnie  fazy 
magnetyczne  o różnych  punktach  Curie.  Faza  o wyż- 
szym punkcie  Curie,  stygnąc,  ma  w normalnym  polu 
magnetycznym  pozostałość  o normalnym  kierunku. 
Faza  ta  wytwarza  w obszarze  zajętym  przez  fazę  drugą 
pole  o kierunku  przeciwnym  i niekiedy  natężenie  tego 
pola  może  przewyższyć  natężenie  pola  geomagnetycz- 
nego. Zatem  druga  faza,  stygnąc  do  temperatur  niż- 
szych niż  jej  temperatura  Curie,  uzyskuje  pozostałość 
odwrotną.  Jeżeli  ta  ostatnia  dominuje,  mamy  do  czy- 
nienia ze  skałą  o odwrotnej  NRM.  Jest  to  wypadek 
oddziaływania  magnetostatycznego.  Pozostałe  me- 
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chanizmy  Nćela  są  bardziej  skomplikowane  i nie  będą 
tu  omawiane.  Zjawisko  samoodwrócenia  zostało  nie- 
jednokrotnie zaobserwowane,  ale  najczęściej  przyczyn 
obserwowanej  odwrotnej  pozostałości  trzeba  szukać 
gdzie  indziej.  Przyjęto  więc  hipotezę,  zgodnie  z którą 
większość  skał  o odwrotnej  naturalnej  pozostałości 
magnetycznej  uzyskała  ją  w polu  ziemskim  o bieguno- 
wości przeciwnej  niż  obecnie,  czyli  w polu,  którego 
biegun  północny  znajdował  się  na  geograficznej  pół- 
kuli południowej,  a południowy  — na  północnej. 

Aby  możliwie  dokładnie  poznać  historię  inwersji 
pola  geomagnetycznego,  korzysta  się  obecnie  z wy- 
ników trzech  różnych  metod:  z badań  paleomagne- 
tycznych dobrze  datowanych  potoków  lawowych 
o dużej  miąższości  (grubości)  oraz  skał  osadowych, 
z badań  skał  z rdzeni  podmorskich  otrzymanych  me- 
todą wierceń  i z badań  oceanicznych  anomalii  magne- 
tycznych. Najlepiej  znany  jest  najmłodszy  okres  ży- 
cia Ziemi,  czyli  ostatnie  4,5  min  lat  (wiek  skał  tego 
okresu  można  określić  z największą  dokładnością). 
Dzięki  tym  trzem  metodom  ustalono  skalę  geochro- 
nologiczną  inwersji  w tym  okresie  (rys.  12).  Jak  widać, 
oprócz  długotrwałych  okresów  (epok  paleomagne- 
tycznych) o biegunowości  normalnej  (N)  i odwrotnej 
(jR)  zaobserwowano  szereg  okresów  krótszych,  trwa- 
jących około  !05  lat,  tzw.  zdarzeń.  Ostatnio  stwier- 
dzono, że  w czasie  trwającej  obecnie  normalnej  epoki 
Brunhesa  wystąpiły  jeszcze  krócej  trwające  inwersje, 
które  nazwano  wycieczkami  bieguna  geomagnetycz- 
nego. Wystąpiły  one  18,  30  i 49  tysięcy  lat  temu. 

Ze  statystycznych  opracowań  danych  paleomagne- 
tycznych wynika,  że  w czasie  inwersji  biegunowość 
pola  zmieniała  się  o 180°  (w  granicach  błędu)  i że  okre- 
sy normalny  i odwrotny  są  jednakowo  prawdopo- 
dobne. Próbowano  korelować  okresy  inwersji  z in- 
nymi zjawiskami  geofizycznymi,  np.  z gwałtownym 
wzrostem  natężenia  promieniowania  kosmicznego,  co 
z kolei  powinno  się  odbić  w zmianach  fauny,  ale  bada- 
nia nie  potwierdziły  tej  hipotezy. 
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Rys.  12.  Geochronologiczna  skala  inwersji  dla  ostatnich  4,5  mi- 
lionów lat.  Kolorem  białym  zaznaczono  okresy  o normalnej 
biegunowości,  czarnym  — o odwrotnej.  Nazwy  epok  pochodzą 
od  nazwisk,  nazwy  zdarzeń  — od  miejsc,  w których  stwierdzono 
okres  o określonej  biegunowości  (wg  D.  H.  Tarling  Principles 
and  Applications  of  Paieomagnetism , London  1971) 
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Interesujący  jest  okres  przejściowy,  kiedy  to  nastę- 
puje zmiana  kierunku  pola.  Obecnie  nie  ma  jednolitej 
teorii  co  do  przebiegu  inwersji,  ale  najsłuszniejsze  wy- 
dają się  sugestie  A.  Chramowa.  Według  niego  kieru- 
nek pola  oscyluje  kilkakrotnie  między  obydwoma 
stabilnymi  położeniami,  aż  wreszcie  ustala  się  w kie- 
runku przeciwnym  do  poprzedniego.  Wiele  analiz 
wskazuje  również  na  to,  że  natężenie  pola  w okresie 
przejściowym  maleje  do  0,1  -0,3  swojej  normalnej 
wartości,  a długość  trwania  okresu  przejściowego  wy- 
nosi prawdopodobnie  kilka-kilkanaście  tysięcy  lat. 


Dryf  kontynentów 

Jeżeli  byśmy  wszystkie  istniejące  dane  dotyczące  po- 
łożenia biegunów  paleomagnetycznych  potraktowali 
tak,  jakby  pole  nie  zmieniało  zwrotu,  to  by  się  oka- 
zało, że  bieguny  w najmłodszej  epoce  życia  Ziemi, 
czwartorzędzie  (podział  na  epoki  i okresy  geologiczne 
znajduje  się  w tabeli),  grupowały  się  wokół  obecnego 
bieguna  geomagnetycznego.  Inaczej  wyglądała  sytua- 
cja we  wcześniejszych  epokach  geologicznych.  Poło- 
żenia biegunów  paleomagnetycznych  nie  tylko  ulegały 
przesunięciu  w stosunku  do  położenia  obecnego  bie- 
guna, ale  i wyniki  otrzymane  z badań  skał  z różnych 


Skala  geochronologiczna 
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kontynentów  różnią  się  między  sobą.  Łącząc  ze  sobą 
uśrednione  położenia  bieguna  w kolejnych  okresach  wędrówki 
geologicznych  otrzymuje  się  tzw.  krzywą  wędrówki  bieguna 
bieguna  geomagnetycznego.  Krzywe  takie  dla  siedmiu 
obszarów  (Ameryka  Pn.,  Ameryka  Pd.,  Afryka,  Eu- 
ropa i pn.  część  Azji,  Australia,  Indie)  przedstawia 
rys.  13.  Należy  dodać,  że  dane,  na  podstawie  których 
sporządza  się  podobne  syntezy,  nie  są  ostateczne. 

W miarę  zwiększania  się  liczby  wyników  i dokład- 
ności ich  opracowania  wprowadza  się  poprawki,  cza- 
sem dość  istotne.  Mimo  to  prawdziwe  pozostaje  zja- 
wisko przesuwania  się  w czasie  bieguna  geomagne- 
tycznego względem  skorupy  ziemskiej  oraz  fakt,  że 
ruch  ten  jest  różny  z różnych  kontynentów.  Próby 
takiego  zestawienia  danych,  by  bieguny  z różnych  ob- 
szarów układały  się  na  jednej,  wspólnej  krzywej,  za- 
kończyły się  przypomnieniem  dawnej,  liczącej  sobie 
kilkadziesiąt  lat  hipotezy  Wegenera,  zgodnie  z którą, 
w górnym  paleozoiku  istniał  jeden  ląd  — Pangea, 
który  w erze  mezozoicznej  i triasie  podzielił  się  na  kil- 
ka części.  Obecnie,  w wyniku  szczegółowych  badań 
geofizycznych  i geologicznych,  przyjmuje  się  raczej  hipoteza 
hipotezę  du  Toit  wzajemnego  ruchu  (dryfu)  konty-  du  Toit 
nentów.  Hipoteza  du  Toit  mówi  o istnieniu  w paleo- 
zoiku nie  jednego,  jak  u A.  Wegenera,  lecz  dwóch 
pralądów.  Jeden  z nich,  Gondwana,  grupował  obszary 
dzisiejszej  Ameryki  Pd.,  Afryki,  Madagaskaru,  Indii, 

Australii  i Antarktydy;  drugi,  Laurazja,  składał  się 
z dzisiejszej  Ameryki  Pn.,  Grenlandii,  Europy  i Azji 
(bez  Indii).  Dane  paleomagnetyczne  wydają  się  po- 
twierdzać hipotezę  dwóch  pralądów,  które  w mezo- 
zoiku  zaczęły  się  dzielić  na  części  odpowiadające  wy- 
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_____  krzywa  wędrówki 
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Rys.  13.  Krzywe  wędrówki  bieguna  paleomagnetycznego  otrzy- 
mane na  podstawie  wyników  badań  paleomagnetycznych  skat 
z Ameryki  Północnej,  Ameryki  Południowej,  Europy  i północnej 
części  Azji,  Indii,  Australii,  Afryki.  Współcześnie  wszystkie 
krzywe  zbiegają  się  we  wspólnym  punkcie-biegunie,  im  starsza 
epoka  geologiczna,  tym  bardziej  są  od  siebie  odległe  {K  kambr, 
P paleozoik,  J jura,  C kreda,  M mezozoik  , L eocen,  T trzeciorzęd) 
(wg  H.  A.  Cook  Physics  oj  lł\e  Ecarth  and  Ptanets , Londyn  1973) 

mienionym  kontynentom,  a te  z kolei  w miarę  upływu 
czasu  przesuwały  się  w kierunku  swoich  obecnych 
położeń.  Jedną  z prób  rekonstrukcji  dawnego  wza- 
jemnego ułożenia  kontynentów  przedstawia  rys.  14. 
Taki  obraz  uzyskano  dopasowując  numerycznie  od- 
powiednie linie  brzegowe.  Dzięki  przyjęciu  hipotezy 
dryfu  kontynentów  udało  się  J.C.  Bridenowi  i A. 
Hallamowi  w 1970  r.  dopasować  kontynenty  w po- 
dobny sposób  i uzyskać  wspólną  dla  nich  wszystkich 
krzywą  wędrówki  bieguna  (rys.  15). 

Z badań  paleomagnetycznych  wynika  jeszcze  jedna 
informacja  dotycząca  dryfu  kontynentów:  ruchy 

dryfowe  nie  odbywały  się  stale  z tą  samą  prędkością. 
Dłuższe  okresy  kwazistatyczne  (późny  kambr-ordo- 
wik,  dewon-dolny  karbon,  górny  karbon-perm)  były 
przerywane  epizodami  dryfowymi.  Przypuszcza  się, 
że  nasileniu  dryfu  towarzyszyły  ruchy  górotwórcze. 
Na  podstawie  współcześnie  prowadzonych  badań 
astronomicznych  dryfu  Eurazji  i Ameryki  M.  Feissel 
obliczył,  że  obecna  prędkość  rozsuwania  się  tych  kon- 
tynentów wynosi  15  • 10-7  stopni/rok  (błąd  oznaczenia 
7* 10“ 7 stopni/rok). 

Spekulacje  dotyczące  dryfu  kontynentów  pozosta- 
wały w sferze  hipotez  do  ok.  1950  r.  Dzięki  wynikom 
badań  paleomagnetycznych,  w latach  1 950-60  zaczęto 
tę  hipotezę  nazywać  teorią,  ale  wciąż  nie  był  znany 
mechanizm,  który  mógłby  powodować  ruchy  tak 
wielkich  bloków,  jakimi  są  kontynenty.  Dopiero  od 
rozsuwanie  j 951  r ^ g(jy  przyjęto  hipotezę  rozsuwania  się  den  ocea- 
nię den  njcznych,  zaczęto  wyjaśniać  zjawiska  dryfu  poprzez 
oceanicznych  2jawisko  rozsuwania  się  den. 

W 1958  r.  po  raz  pierwszy  zauważono,  że  na  obsza- 
rze Oceanu  Spokojnego,  a następnie  na  oceanach 
Atlantyckim  i Indyjskim,  występują  anomalie  magne- 
tyczne w postaci  pasów'  anomalii  na  przemian  ujem- 
nych i dodatnich,  o amplitudach  przeważnie  2*  107  T- 
410"7  T i szerokości  kilkudzięsięciu  kilometrów. 
Pasy  tworzące  „żebrowaty”  obraz  układają  się  równo- 
legle do  grzbietów  oceanicznych,  symetrycznie  po  obu 
ich  stronach.  Taki  obraz  anomalii  zaobserwowanych 


Rys.  14.  Zrekonstruowane  wzajemne  położenie  kontynentów 
Ameryki  Południowej  i Afryki  oraz  Europy  i Ameryki  Północnej 
przed  mezozoikiem  (wg  A.  H.  Cook  Physics  oj  the  Earth  and  Pla- 
netSy  London  1973) 


Rys.  15.  Wspólna  krzywa  wędrówki  bieguna  południowego  dla 
okresu  od  syluru  S do  mezozoiku  M poprzez  perm  P i karbon  C 
(gruba  krzywa  przerywana  oznacza  przypuszczalne  drogi  bieguna 
dla  Gondwany  i Laurazji  przed  ich  połączeniem  się  w sylurze. 
Cienkie  linie  przerywane  — kierunki  rozdzielania  się  kontynen- 
tów począwszy  od  mezozoiku)  (wg  M.  W.  Mc  Elhinny  Pałeomag- 
netism  and  piąte  tectonics,  Cambridge  1973) 
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szerokość  geograficzna  północna 


po  obu  stronach  grzbietu  Reykjanes  przedstawiają 
rys.  16,  17,  18,  19.  Po  upływie  kilku  lat  od  pierwszych 
obserwacji  R.S.  Dietz,  a później  H.H.  Hess  wyrazili 
pogląd,  że  w strefach  grzbietów  tworzy  się  nowa  sko- 
rupa ziemska.  Materiał  z górnego  płaszcza  Ziemi  wy- 
dobywa się  na  powierzchnię  wzdłuż  grzbietów.  Wsku- 


tek nacisku  dotychczasowa  skorupa  pęka  i rozsuwa 
się  na  boki,  robiąc  miejsce  nowej.  Jednocześnie  ze 
stwierdzeniem  istnienia  w rejonach  oceanicznych  że- 
browatych anomalii  zauważono,  że  próbki  skał  pocho- 
dzące z obszarów  tych  anomalii  mają  normalną  lub 
odwrotną  pozostałość  magnetyczną.  W 1963  r.  F. 


Rys.  16.  Morskie  anomalie  magnetyczne  zaobserwowane  po  obu  stronach  grzbietu  oceanicznego  Reykjanes  (na  południowy  zachód 
od  Islandii)  (rys.  16-19  wg  A.  H.  Cook  Physies  of  the  Earth  and  Planels,  Loodon  1973) 


34°  30°  26°  22° 


Rys.  17.  Zmiany  natężenia  pola  geomagnetycznego  zarejestro- 
wane wzdłuż  kilku  profili  biegnących  prostopadle  do  linii  grzbie- 
tu. Grzbiet  jest  zaznaczony  literą  A.  Numery  1...5  oznaczają 
kolejne  anomalie  dodatnie  (powyżej  linii  zerowej  odpowiadającej 
średniej  wartości  pola  w badanym  rejonie)  i ujemne  (poniżej  tej 
linii).  Z boku  przedstawiono  skalę  wartości  natężenia  pola  wyra- 
żonych w gammach  (1  y=  1 nT).  Linie  kreskowane  (niebieskie) 
łączą  te  same  anomalie  występujące  na  różnych  profilach 


długość  geograficzna 


Rys.  18.  Anomalie  przedstawione  w postaci  pasów  czarnych  (do- 
datnie) i białych  (anomalie  ujemne),  A grzbiet  Reykjanes 


powierzchnia  morza 


Rys.  19.  Schemat  powstawania  żebrowatego  obrazu  anomali 
dodatnich  ( + ) i ujemnych  (— ) po  obu  stronach  grzbietu  ocea- 
nicznego. Wzdłuż  grzbietu  wydobywa  się  nowy  materiał  skorupy 
oceanicznej  (zaznaczony  strzałkami) 

Vine  i D.  M.  Matthews  uzupełnili  hipotezę  Dietza 
i Hessa  sugerując,  że  obserwowane  zjawisko  łączy  się 
z inwersjami  pola  geomagnetycznego.  Ta  część  sko- 
rupy, która  powstała  w okresie,  gdy  pole  miało  nor- 
malny kierunek,  jest  źródłem  dodatniej  anomalii 
i próbki  skał  z tego  obszaru  mają  normalną  pozo- 
stałość magnetyczną.  Odpowiednio,  anomalie  ujemne 
są  dowodem  na  to,  że  w okresie  powstawania  tych 
części  skorupy  pole  geomagnetyczne  miało  kierunek 
odwrotny.  W wyniku  szczegółowych  badań  anomalii 
w rejonach  grzbietów  oceanicznych,  próbek  z rdzeni 
podmorskich  i próbek  skał  kontynentalnych  udało  się 
stwierdzić  korelację  pomiędzy  anomaliami  i poszcze- 
gólnymi epokami  paleomagnetycznymi  (rys.  20). 

Oszacowano  również  prędkości  rozsuwania  się  dna 
w różnych  obszarach  kuli  ziemskiej  (1-6  cm/rok), 
a zatem  — poznano  historię  dryfu  kontynentów  do 
ok.  200  milionów  lat  wstecz. 

Omówione  w skrócie  hipotezy  Dietza-Hessa  i Vi- 
ne-Matthewsa  są  traktowane  jako  potwierdzenie 
teorii  dryfu  kontynentów ; zwolennicy  tej  teorii  widzą 
mechanizm  wywołujący  dryf  w procesach  rozsuwania 
się  den  oceanicznych.  Koncepcja  dryfu  kontynentów 
ma  wśród  geofizyków  wielu  przeciwników,  ale  jak 
dotychczas  nie  ma  lepszej  teorii  wyjaśniającej  dane 
dostarczane  przez  paleomagnetyzm.  Wnioski  wypły- 
wające z badań  paleomagnetycznych  znajdują  po- 
twierdzenie w wynikach  badania  klimatów  w różnych 
epokach  geologicznych  (paleoklimatów). 

Pozostaje  do  wyjaśnienia,  co  oznacza  krzywa  wę-  hipotezy 
drówki  bieguna.  I ten  problem  nie  został  jeszcze  osta-  wyjaśniające 
tecznie  rozwiązany.  Istnieje  kilka  hipotez  próbujących  wędrówkę 
tłumaczyć  to  zjawisko.  Wydaje  się,  że  najbardziej  bieguna 
prawdopodobna  jest  hipoteza  wychodząca  z założe- 
nia, że  Ziemia  nie  zachowuje  się  jak  ciało  sztywne, 
lecz  płynie.  W stanie  równowagi  oś  obrotu  Ziemi  po- 
krywa się  z osią  jej  głównego  momentu  bezwładności. 

Gdy  wskutek  ruchu  kontynentów  zmienia  się  rozkład 
mas  w skorupie  ziemskiej,  wówczas  zmienia  się  rów- 
nież moment  bezwładności.  Ziemia  powraca  do  stanu 
równowagi  wówczas,  gdy  się  przesuwa  jej  oś  obrotu, 
a zatem  położenia  biegunów  geograficznych  i geoma- 
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Rys.  20.  Schematyczna  korelacja  morskich  anomalii  magnetycz- 
nych z epokami  paleomagnetycznymi . Anomaliom  dodatnim  od- 
powiadają epoki  o normalnym  kierunku  pola  (pasy  czarne), 
anomaliom  ujemnym  — epoki  o kierunku  odwrotnym  (pasy  białe) 
(wg  M.  W.  Mc  Elhinny  Paleomagnetism  and  piąte  tectonicsy 
Cambridge  1973) 


Rys.  21.  Zmiany  momentu  magnetycznego  Ziemi  w ciągu  ostat- 
nich 500  milionów  lat  (wg  D.  H.  Tarling  Princples  and  Appli- 
cations of  Paleomagnetism , London  1971) 


gnetycznych.  Szybkość  tego  ruchu  zależy  od  lepkich 
własności  płaszcza,  które  nie  są  jeszcze  w pełni  zba- 
dane. Omówione  tu  pokrótce  zjawiska,  sugerujące 
przesuwanie  się  kontynentów  bądź  ich  części  względem 
siebie  i osi  obrotu  Ziemi,  zostały  ujęte  w jedną  gałąź 
tektonika  wiedzy  o Ziemi,  nazwaną  tektoniką  płyt  lub  tektoniką 
kier.  Dane  paleomagnetyczne  w ich  obecnej  postaci, 
podobieństwo  linii  brzegowych  niektórych  kontynen- 
tów, szereg  danych  geologicznych  wskazują  na  słusz- 
ność hipotez  stanowiących  podstawę  tej  dziedziny. 
Wciąż  jednak  brak  opisu  mechanizmów,  które  by 
mogły  wywoływać  procesy  wymagane  przez  tektoni- 
kę płyt.  Być  może  nowe  dane  geofizyczne  zmuszą 
do  skorygowania  dzisiejszych  teorii  i wskażą  na  zu- 
pełnie odmienną  interpretację  obserwowanych  do- 
tychczas zjawisk. 

Badania  paleomagnetyczne  pozwalają  poznać  nie 
tylko  zmiany  kierunku  pola  geomagnetycznego  w od- 
ległych epokach  geologicznych,  ale  i zmiany  jego  na- 
tężenia. 

Na  podstawie  dostępnych  obecnie  danych  można 
sądzić,  że  moment  magnetyczny  Ziemi  miał  wartość 


podobną  do  dzisiejszej  2,6  miliarda  lat  temu,  na- 
stępnie malał  i osiągnął  minimum  500  milionów  lat  te- 
mu; w ciągu  ostatnich  400  milionów  lat  wartość  mo- 
mentu wzrastała,  jak  to  widać  na  rysunku  21. 


Archeomagnetyzm 

Jak  już  wspomniano,  lukę  pomiędzy  obecnymi  ob- 
serwacjami pola  geomagnetycznego  a danymi  paleo- 
magnetycznymi wypełnia  archeomagnetyzm.  Archeo- 
magnetyzm zajmuje  się  badaniem  zmian  pola  ziem- 
skiego w przeszłości  prehistorycznej  i historycznej. 

Przedmiotem  badań  są  wypalane  gliny  (cegły,  pale- 
niska, wyroby  ceramiczne),  które  podczas  procesu  wy- 
palania uzyskują  stabilną  pozostałość  magnetyczną  w 
kierunku  istniejącego  ówcześnie  pola  geomagnetycz- 
nego. 

Pomiary  wartości  i kierunku  NRM  dobrze  datowa-  badanie 
nych  próbek  pozwoliły  na  odtworzenie  zmian  wieko-  zmian  pola 
wych  pola  geomagnetycznego  do  5500  lat  wstecz. 

Zgromadzone  dotychczas  dane  wskazują,  że  zmiany 
natężenia  pola  w tym  okresie  nie  przekraczają  15% 
jego  średniej  wartości,  amplituda  zmian  kierunku  pola 
wynosiła  ok.  20°,  a okres  tych  zmian  — ok.  1000  lat. 

Rysunek  22  przedstawia  zmiany  inklinacji  i deklinacji 
otrzymane  z badań  archeomagnetycznych  dla  Gdań- 
ska. Zmiany  inklinacji  obejmują  okres  od  1080  r.  do 
chwili  obecnej.  Linią  ciągłą  zaznaczono  zmiany  de- 
klinacji otrzymane  z pomiarów  obejmujących  okres 
od  1360  r.  do  chwili  obecnej,  a linią  przerywaną  — 
hipotetyczną  zmianę  ekstrapolowaną  tak,  by  była  po- 
dobna do  krzywej  doświadczalnej.  Wyniki  pozwalają 
sądzić,  że  zmiany  wiekowe  pola  geomagnetycznego 
w Gdańsku  w czasie  objętym  badaniami  przebiegały 
z okresem  ok.  600  lat. 

Badania  archeomagnetyczne  znajdują  praktyczne  zastosowanie 
zastosowanie  w archeologii;  pozwalają  na  datowanie  w 
fragmentów  wypalanych  glin,  których  wiek  nie  jest  archeologii 
dokładnie  znany,  z dokładnością  co  najmniej  25  lat, 
a stosowane  metody  nie  powodują  zniszczenia  bada- 
nych obiektów. 


Rys.  22.  Zmiany  inklinacji  w Gdańsku  od  1080  r.  i zmiany  de- 
klinacji w Gdańsku  od  1360  r.  do  chwili  obecnej  (wykorzystano 
tu  także  dane  przytoczone  na  rys.  6).  Krzywa  ciqgla  — wyniki 
pomiarów,  krzywa  przerywana  — hipotetyczna  ekstrapolacja 
(wg  W.  Czyszek  Archaeomagnetism : A preliminary  report , Ma- 
teriały i Prace  Inst.  Geof.  PAN,  voI.  76,  59,  1974) 
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Teoria  pochodzenia  stałego  pola 
geomagnetycznego 
i zmian  wiekowych 

Źródeł  stałego  pola  geomagnetycznego  obserwowane- 
go  obecnie,  w czasach  historycznych  i w dawnych  epo- 
kach geologicznych  należy  szukać  we  wnętrzu  Ziemi. 
Źródłem  stałego  pola  dipolowego  mogłaby  być  np. 
jednorodnie  namagnesowana  kula  ziemska  o nama- 
gnesowaniu 75-10~7  T lub  jednorodnie  namagneso- 
wane jądro  Ziemi  o namagnesowaniu  49  1 0-6  T. 
Mógłby  to  być  również  pewien  stacjonarny  układ 
prądów  elektrycznych  płynących  we  wnętrzu  Ziemi. 
Jednak  żaden  z tych  mechanizmów  nie  mógłby  spo- 
wodować ani  zjawiska  zmian  wiekowych,  ani  inwersji 
pola  geomagnetycznego.  Jedyną  istniejącą  obecnie 
teorią,  która,  jak  się  wydaje, potrafi  wyjaśnić  wszystkie 
cechy  stałego  pola,  jest  zaproponowana  w latach  czer- 
dziestych  tzw.  teoria  samowzbudnego  dynamo  El- 
sassera-Bullarda.  Aby  ją  opisać,  trzeba  powiedzieć 
parę  słów  o budowie  wnętrza  Ziemi.  Badania  fal 
sejsmicznych  przechodzących  przez  głębokie  (poniżej 
3000  km)  warstwy  Ziemi  pozwoliły  stwierdzić,  że 
wewnętrzna  część  kuli  ziemskiej,  o promieniu  ok. 
3500  km,  jądro,  zachowuje  się  inaczej  niż  jej  partie 
zewnętrzne.  Ustalono,  że  jądro  składa  się  z dwóch 
warstw,  z których  jedna,  zewnętrzna,  jest  ciekła,  na- 
tomiast wewnętrzna  jest  prawdopodobnie  stała  (— ► 
Fizyka  skorupy  i wnętrza  Ziemi).  Dane  dotyczące 
gęstości  i składu  chemicznego  jądra  wskazują,  że  do- 
minuje tam  żelazo  i nikiel,  a zatem  powinno  być  ono 
dobrym  przewodnikiem  elektryczności.  Te  własności 
jądra  leżą  u podstaw  działania  wewnątrz  Ziemi  me- 
chanizmu Elsassera-Bullarda.  Rysunek  23  przedsta 
wia  schematycznie  zasadę  działania  samowzbudnego 


Rys.  23.  Schemat  działania  samowzbudnego  dynamo  Elsas- 
sera-BuJIarda 

dynamo.  Tarcza  A wykonana  z dobrego  przewodnika 
elektryczności  obraca  się  w kierunku  wskazanym 
strzałką.  W otoczeniu  układu  istnieje  niewielkie  pole 
magnetyczne  skierowane  wzdłuż  osi  obrotu  tarczy. 
Tarcza  jest  połączona  z osią  przez  cewkę,  przedsta- 
wioną na  rysunku  jako  jeden  zwój  C.  Podczas  obrotu 
tarczy  w zewnętrznym  polu  magnetycznym  indukuje 
się  w niej  siła  elektromotoryczna  skierowana  wzdłuż 
jej  promienia.  Przez  cewkę  C zaczyna  płynąć  prąd, 
który  z kolei  jest  źródłem  dodatkowego  pola  magne- 
tycznego, równoległego  do  osi  obrotu  tarczy.  Przy 
odpowiednio  dobranym  kierunku  ruchu  to  nowo  po- 
wstałe pole  dodaje  się  do  istniejącego  już  pola  H. 
Wzrost  natężenia  pola  powoduje  wzmocnienie  siły 
elektromotorycznej  w tarczy,  a więc  i natężenia  prądu 
płynącego  przez  cewkę  — i tak,  dalej.  A zatem  taki 
układ  może  spowodować  znaczne  wzmocnienie  po- 
czątkowego pola  magnetycznego  o bardzo  małym  na- 
tężeniu. 

We  wnętrzu  Ziemi  rolę  obracającej  się  tarczy  prze- 
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wodzącej  i cewki  odgrywają  prądy  konwekcyjne  pły- 
nące w ciekłym,  przewodzącym  jądrze.  Jednakże  same 
tylko  ruchy  konwekcyjne  nie  wystarczyłyby  do  wy- 
tworzenia układu  dynamo;  poruszające  się  do  góry 
i na  dół  cząstki  cieczy  tworzyłyby  zamknięte  pętle 
tylko  w płaszczyźnie  południkowej.  Dzięki  sile  Corio- 
lisa,  wywołanej  ruchem  obrotowym  Ziemi,  „rurki’’ 
prądów  konwekcyjnych  wyciągają  się  wzdłuż  płasz- 
czyzn równoleżnikowych,  tworząc  odpowiednik  tar- 
czy. Przebieg  procesu  przedstawia  schematycznie  rys. 
24.  Niezbędne  do  funkcjonowania  dynamo  początko- 
we pole  magnetyczne  (w  wypadku  Ziemi  jest  to  skła- 
dowa słabego  pola  panującego  w przestrzeni  około- 
ziemskiej)  jest  skierowane  wzdłuż  osi  obrotu  Ziemi. 


Rys.  24.  Schemat  powstawania  toroidalnego  pola  w obracającej 
się  przewodzącej  kuli.  Cyfry  od  1 do  4 oznaczają  kolejne  etapy 

tego  procesu,  v wektor  prędkości  obrotu  Ziemi,  kierunek  obrotu 
jest  zaznaczony  strzałkami  (rys.  23,  24  wg  M.  W.  Mc  EJhinny, 
Pałeomagnetism  and  piąte  tectonics,  Cambridge  1973) 

Jest  to  tzw.  pole  poloidalne,  które  nie  ma  składowej 
w płaszczyźnie  równoleżnikowej.  Linie  sił  tego  pola 
poruszają  się  razem  z ciekłym  materiałem  jądra,  są 
w nim  niejako  zamrożone.  W ten  sposób  przez  „wy- 
ciągnięcie” linii  sił  pola  poloidalnego  powstaje  skła- 
dowa równoleżnikowa  pola,  tzw.  pole  toroidalne, 
wzmacniające  prądy  elektryczne,  co  z kolei  prowadzi 
do  wzmocnienia  pola  poloidalnego  obserwowanego 
na  powierzchni  Ziemi. 

Z przedstawionej  tu  schematycznie  teorii  dynamo 
samowzbudnego  wynika,  że  stałe  pole  geomagnetyczne 
powstaje  w wyniku  wzajemnego  oddziaływania  ru- 
chów cieczy  przewodzącej  i pola  elektromagnetycz- 
nego. Dziedzina  zajmująca  się  takimi  zjawiskami  nosi 
nazwę  magnetohydrodynamiki,  a fale,  których  opis 
zawiera  zarówno  elementy  hydrodynamiki,  jak  i elek- 
trodynamiki, nazywają  się  falami  magnetohydrody- 
namicznymi.  Równania  opisujące  działanie  ziemskie- 
go dynamo  są  bardzo  skomplikowane  i nie  będziemy 
ich  tu  przytaczać.  Próby  ich  rozwiązania,  przy  róż- 
nych założeniach  dotyczących  warunków  termodyna- 
micznych panujących  we  wnętrzu  Ziemi,  doprowadzi- 
ły do  wielu  ciekawych  wniosków.  Stwierdzono  np.,  że 
prędkość  obrotu  zewnętrznych  partii  jądra  jest  mniej- 
sza niż  jego  partii  wewnętrznych.  Zjawisko  to  może 
być  odpowiedzialne  za  dryf  zachodni  pola  niedipo- 
lowego  i centrów  zmian  wiekowych.  Istnienie  tych 
centrów  wiąże  się  z występowaniem  na  powierzchni 
jądra  układów  prądów  elektrycznych. 

Aby  wyjaśnić  możliwość  zmiany  kierunku  pola, 
T.  Rikitake  zaproponował  w 1958  r.  przyjęcie  dwóch 
sprzężonych  układów  dynamo.  W wyniku  prac  nad 
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układem  równań  opisujących  ten  model  okazało  się, 
że  przy  pewnych  założeniach  (co  do  warunków  pa- 
nujących we  wnętrzu  Ziemi)  prądy  elektryczne  wy- 
stępujące w równaniach  oscylują  wokół  stanu  stacjo- 
narnego przez  jakiś  czas,  przy  czym  w miarę  upływu 
czasu  rośnie  amplituda  tych  oscylacji.  W pewnym 
momencie  następuje  gwałtowny  przeskok  do  oscylacji 
wokół  innego  stanu  stacjonarnego.  A zatem  prąd 
elektryczny,  a w konsekwencji  pole  magnetyczne  wy- 
twarzane przez  układ  Rikitake,  może  w pewnych  wa- 
runkach zmienić  swój  kierunek.  Fizyczna  natura  im- 
pulsów, które  by  mogły  spowodować  taki  proces,  nie 
jest  jeszcze  znana,  ale  możliwość  oscylacji  prądów  po- 
zostaje w zgodzie  z obserwowanymi  na  powierzchni 
Ziemi  oscylacjami  pola  geomagnetycznego  w okre- 
sach przejściowych  pomiędzy  normalnym  i odwrot- 
nym kierunkiem  pola. 


Zmienne  pole  geomagnetyczne 

Zmienne  pole  magnetyczne,  które  stanowi  tylko  nie- 
wielki procent  pola  obserwowanego  na  powierzchni 
Ziemi,  pochodzi  od  źródeł  znajdujących  się  poza 
Ziemią.  Ta  część  pola,  mimo  że  tak  mała,  jest  przed- 
miotem ciągłych  obserwacji  oraz  analiz  i przynosi 
informacje  dotyczące  nie  tylko  pola  magnetycznego 
Ziemi,  ale  i własności  przestrzeni  okołoziemskiej.  Wy- 
niki ciągłych  obserwacji  gromadzone  od  szeregu  lat 
w postaci  magnetogramów  pozwoliły  na  rozróżnienie 
kilku  typów  zmian  pola.  Na  rys.  25  przedstawiony 
-est  magnetogram  otrzymany  w Centralnym  Obser- 


tach  1836-1841  jednoczesnych  pomiarów  magnetycz- 
nych w istniejących  ówcześnie  50  obserwatoriach. 
Następne  okresy  intensywnych  badań  zjawisk  magne- 
tycznych na  powierzchni  Ziemi  to  Pierwszy  Rok  Po- 
larny (1882-1883),  Drugi  Rok  Polarny  (1932-1933) 
i Międzynarodowy  Rok  Geofizyczny  (1957-1958). 

W Polsce  pierwsze  obserwatorium  magnetyczne 
założył  w 1910  r.  Stanisław  Kalinowski  w Świdrze  pod 
Warszawą.  Działalność  tej  placówki  została  w ostat- 
nich latach  zakłócona  przez  biegnącą  w pobliżu  linię 
kolei  elektrycznej.  Obecnie  ciągłą  rejestrację  składo- 
wych pola  geomagnetycznego  na  terenie  Polski  pro- 
wadzą : Obserwatorium  Geofizyczne  Polskiej  Akademii 
Nauk  na  Półwyspie  Helskim  w Helu  oraz  Centralne 
Obserwatorium  Geofizyczne  Polskiej  Akademii  Nauk 
w Belsku  Dużym  (woj.  radomskie).  Poza  tym  rejestrację 
magnetyczną  o charakterze  uzupełniającym  prowadzi 
Obserwatorium  Sejsmologiczne  Polskiej  Akademii 
Nauk  w Raciborzu. 

Analiza  danych  obserwacyjnych,  gromadzonych 
dzięki  pracy  obserwatoriów  magnetycznych,  pozwo- 
liła na  rozdzielenie  pola  zmiennego  na  część  zmienia- 
jącą się  spokojnie  (gładko)  i na  część  zawierającą  zmia- 
ny zachodzące  w sposób  nieuporządkowany.  Zmiany 
płynne  — to  tzw.  zmiany  spokojne  lub  niezaburzone, 
zmiany  nieuporządkowane  — to  tzw.  zmiany  zabu- 
rzone. 

Na  magnetogramie  zmiany  spokojne  charaktery- 
zują gładkie  odcinki  krzywych  przebiegających  po- 
niżej lub  powyżej  średniej  wartości  danej  składowej 
pola  w miejscu  obserwacji,  zaznaczonej  na  rys.  25  jako 
linia  bazy.  Wśród  zmian  spokojnych  poszczególnych 
składowych  można  wydzielić  zmiany  o okresach:  do- 
bowym, sezonowym,  rocznym,  jedenastoletnim. 


Rys.  25.  Magnetogram  przedstawiający  bieg  dobowy  składowej  poziomej  //.składowej  pionowej  Z i deklinacji  Z)  otrzymany  w Belsku 
I7.L-18.U975  r.  Linie  HuyZB  i Do  linie  baz  poszczególnych  składowych,  linia  Tbieg  dobowy  temperatury  w pomieszczeniu,  w którym 
jest  prowadzona  rejestracja.  Na  wykresach  H i D widoczne  są  zmiany  zatokowe  b 


watorium  Geofizycznym  Polskiej  Akademii  Nauk 
w Belsku  Dużym. 

W 1722  r.  londyńczyk  G.  Graham,  obserwując 
przez  mikroskop  igłę  kompasu,  zauważył,  że  wyko- 
nuje ona  pewne  ruchy  w płaszczyźnie  poziomej.  Są  to 
pierw-sze  obserwacje  zmian  deklinacji;  zmiany  te  były 
czasem  regularne  i niezbyt  szybkie,  kiedy  indziej  znów 
nieregularne  i gwałtowne.  Nieco  później  wspólnie 
z A.  Celsiusem,  który  podobne  obserwacje  prowadził 
w Uppsali,  stwierdzili,  że  często  w obu  miastach  jedno- 
cześnie panował  magnetyczny  spokój  lub  pojawiało 
się  zaburzenie. 

Początkowo  obserwowano  tylko  zmiany  deklinacji 
magnetycznej.  Dopiero  po  upływie  ok.  100  lat  od  od- 
krycia G.  Grahama  F.  Gauss  wykonał  w Getyndze 
pierwsze  pomiary  inklinacji  magnetycznej  i natężenia 
całkow-itego  wektora  pola.  Wkrótce  potem  pod  pa- 
tronatem F.  Gaussa  rozpoczęła  działalność  Unia 
Magnetyczna,  powołana  w celu  dokonywania  w la- 


Zmiany  spokojne  o okresie  dobowym  oznacza  się 
symbolem  Sq  i przypisuje  się  je  zmieniającemu  się 
z okresem  dobowym  wpływowi  Słońca.  Zmiany  Sq  są 
różne,  zależnie  od  szerokości  geograficznej  miejsca 
obserwacji  i pory  roku.  Na  rys.  26  przedstawione  są 
te  zmiany  na  różnych  szerokościach  geograficznych 
w trzech  sezonach  dla  składowej  poziomej,  deklinacji 
i inklinacji.  W naszych  szerokościach  geograficznych 
zmiana  spokojna  deklinacji  przebiega  w'  następujący 
sposób:  W pierwszej  ćwiartce  doby  liczonej  od  godzi- 
ny 0 czasu  miejscowego  południk  magnetyczny  prze- 
suwa się  powoli  na  wschód  i osiąga  maksimum 
wschodnie  w godzinach  7-9  czasu  miejscowego.  Na- 
stępnie zawraca  szybko  ku  zachodowi,  maksymalne 
położenie  zachodnie  osiąga  ok.  godziny  1330.  Potem 
kieruje  się  znów  na  wschód  i ok.  godziny  2230  osiąga 
drugie  wschodnie  maksimum. 

Oprócz  spokojnej  zmiany  słonecznej  istnieje  rów- 
nież spokojna  zmiana  księżycowa,  wywołana  wpły- 
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wem  Księżyca,  o okresie  doby  księżycowej,  oznaczana 
symbolem  L i zaobserwowana  po  raz  pierwszy  przez 
K.  Kreila  w 1850  r.  Szczegółowe  badania  zmian  L 


Rys.  26.  Uśrednione  dla  całej  kuli  ziemskiej  zmiany  SQ  składo- 
wej poziomej  dla  różnych  szerokości  geograficznych  dla  trzech 
sezonów:  D (styczeń,  luty,  listopad,  grudzień),  E (marzec,  kwie- 
cień, wrzesień,  październik),  J (maj,  czerwiec,  lipiec,  sierpień) 
(wg  S.  Matsushita  Solar  quiet  and  lunar  daily  variations  fields , 
w Physics  of  Geomagnetic  Phenomena , vol.  I,  New  York  1967 


wykazały,  że  zależą  one  od  szerokości  geograficznej 
miejsca  obserwacji  i od  pory  roku,  podobnie  jak  zmia- 
ny SQ.  Maksymalne  wartości  zmian  księżycowych  skła- 
dowych H i Z wynoszą  1-2  10_9T,  a deklinacji  — 
40".  Zmiany  Sq  są  kilkadziesiąt  razy  silniejsze. 

Źródeł  powstania  zmian  spokojnych,  zarówno 
słonecznych,  jak  i księżycowych,  upatruje  się  w wy- 
stępowaniu w warstwie  £jonosfery  (czyli  100-120  km 
nad  powierzchnią  Ziemi)  prądów  elektrycznych 

0 szczególnej  konfiguracji,  związanych  ze  zjawiskami 
pływowymi,  zależnymi  odpowiednio  od  Słońca 

1 Księżyca. 

Zmiany  zaburzone  pola  geomagnetycznego  składają 
się  z szeregu  nakładających  się  na  siebie  elementów, 
które  można  poklasyfikować  w następujący  sposób: 
zmiany  periodyczne  — zaburzone  dobowe  zmiany 
słoneczne  o okresie  doby  słonecznej  i pulsacje  magne- 
tyczne, których  okres  wynosi  kilka  minut,  zmiany  za- 
tokowe, które  na  magnetogramie  mają  kształt  zatoki, 
zmiany  aperiodyczne,  które  występują  w czasie  burz 
magnetycznych  przede  wszystkim  na  składowej  po- 
ziomej. Główną  część  zaburzeń  stanowią  nieprawi- 
dłowe fluktuacje,  które  się  składają  z szeregu  następu- 
jących po  sobie  zmian  o różnych  okresach  i amplitu- 
dach. 

Burzom  magnetycznym  towarzyszy  niejednokrot- 
nie zjawisko  zórz  polarnych,  szczególnie  na  dużych 
szerokościach  geograficznych.  Zjawisko  to  polega 
na  świeceniu  atomów  tlenu  i cząsteczek  azotu  znaj- 
dujących się  w atmosferze.  Zorze  przybierają  różne 
kształty:  spokojnych  lub  pulsujących  łuków,  wstęg, 
welonów,  promienistych  koron.  W tym  ostatnim  wy- 
padku promienie  układają  się  wzdłuż  linii  sił  pola 
geomagnetycznego,  co  zauważył  po  raz  pierwszy 
J.  C.  Wilcke  w 1 770  r.  Związek  zórz  polarnych  ze  zja- 
wiskami magnetycznymi  został  stwierdzony  właśnie 
dzięki  jego  obserwacjom. 

A.  Humboldt,  badając  burze  magnetyczne,  stwier- 
dził, że  najsilniejsze  z nich  zaczynają  się  niemal  rów- 
nocześnie na  całej  Ziemi  i że  powodują  zmniejszanie 
się  składowej  poziomej  pola,  która  następnie  rośnie 
powoli  do  poprzedniej  wartości.  Charakterystyczną 
cechą  większości  burz  jest  nagłość  ich  pojawiania  się. 
Pierwszy,  krótki  impuls  zwiększa  natężenie  składowej 
poziomej.  Ten  wzrost  trwa  krótko,  od  '/2  godziny  do 


czas  od  początku  burzy 


Rys.  27.  Zmiany  składowych  pola  — poziomej  //,  pionowej  Z i deklinacji  D — w czasie  burzy  magnetycznej,  otrzymane  w wyniku 
uśrednienia  zmian  zaobserwowanych  podczas  40  burz  dla  trzech  grup  obserwatoriów:  w niskich  szerokościach  geomagnetycznych  (a), 
w średnich  szerokościach  (b)  i w wysokich  szerokościach  (c)  (wg  S.  Chapman  Solar  emission  and  magnet  i c-aur orał  storms  on  the  Earth 
w Magnetism  and  Cosmos,  3,  Edinburgh,  London  1965) 
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godziny.  Zmniejszanie  się  natężenia  składowej  H 
trwa  kilka  godzin,  a powrót  do  stanu  normalnego 
może  trwać  kilka  dni.  W czasie  burzy  amplituda  zmian 
pola  może  osiągnąć  kilka  tysięcy  nanotesli.  Na  rys.  27 
przedstawiono  zmiany  H,  Z i D podczas  burz  ma- 
gnetycznych o średnim  natężeniu. 

aktywność  Miarą  zaburzenia  magnetycznego  jest  wprowadzo- 
magnetyczna  na  sztucznie  wielkość  zwana  aktywnością  magnetycz- 
ną. Jeżeli  jakiś  czas  pole  się  nie  zmienia,  to  aktywność 
wynosi  0.  Aktywność  jest  tym  większa,  im  większa  jest 
amplituda  zmian  pola  i im  szybsze  są  jego  zmiany. 
W 1939  r.  Międzynarodowe  Towarzystwo  Magne- 
tyzmu Ziemskiego  i Elektryczności  wprowadziło  dla 
określenia  stopnia  zaburzenia  tzw.  indeks  Ky  wyrażo- 
ny w baliach  od  K = 0 do  K = 9.  Każdemu  hal- 
lowi odpowiada  amplituda  wahań  składowych  pola 
geomagnetycznego  w trzygodzinnych  odstępach  cza- 
su — z uwzględnieniem  poprawki  na  spokojne  zmiany 
dobowe.  Za  amplitudę  przyjmuje  się  tu  maksymalną 
różnicę  między  największym  i najmniejszym  odchyle- 
niem jednej  ze  składowych  (Jf,  Z lub  D)  od  normalnej 
krzywej  biegu  dobowego  w trzygodzinnym  przedziale 
czasu.  Ponieważ  poziom  zaburzeń  zależy  od  szero- 
kości geograficznej  miejsca  obserwacji,  więc  w każdym 
obserwatorium  przyjmuje  się  nieco  inne  amplitudy 
zaburzeń  przy  tych  samych  wartościach  indeksu  K, 
np.  w Centralnym  Obserwatorium  Geofizycznym 
w Belsku  Dużym  przyjmuje  się  indeks  K — 9 dla  am- 
plitudy 500  nT.  Wspólny  dla  całej  Ziemi,  tzw.  plane- 
tarny indeks  Ky  otrzymuje  się  uśredniając  indeksy  K 
z obserwatoriów  położonych  między  50°  i 63°  szero- 


warstwach.  Natężenie  zewnętrznego,  pierwotnego  po- 
la geomagnetycznego  można  przedstawić  analitycznie 
jako  szereg  funkcyjny  o wyrazach  zależnych  od  współ- 
rzędnych geograficznych  miejsca  obserwacji  oraz  od 
promienia  ziemskiego  a i odległości  miejsca  obserwacji 
od  środka  Ziemi  r w postaci  czynników  (r/a)n.  W wy- 
padku wewnętrznej,  wtórnej  składowej  pola  ta  ostat- 
nia zależność  jest  inna  i ma  postać  ( afr)n&l . Dzięki  tej 
różnicy  można  rozdzielić  obserwowane  na  powierzch- 
ni Ziemi  zmiany  pola  na  części  pochodzące  od  źródeł 
zewnętrznych  i od  prądów  tellurycznych,  a następnie 
otrzymać  rozkład  przewodności  elektrycznej  we  wnę- 
trzu Ziemi.  Znaleziony  w ten  sposób  globalny  model 
rozkładu  przewodności  pozwala  rozróżnić  następu- 
jące warstwy:  dobrze  przewodzącą  warstwę  przypo- 
wierzchniową o kilkukilometrowej  miąższości,  na- 
stępnie źle  przewodzącą  warstwę  o miąższości  ok. 

250-300  km,  poniżej  której  przewodność  rośnie  o dwa 
rzędy  wielkości.  Zmiany  pola  geomagnetycznnego 

0 okresach  nie  przekraczających  roku  pozwalają  na 
poznanie  rozkładu  przewodności  do  głębokości  ok. 

1000  km.  O przewodności  głębszych  warstw  można 
sądzić  na  podstawie  prądów  indukowanych  przez  zmia- 
ny wiekowe  pola.  Bardziej  szczegółowy  obraz  rozkła- 
du przewodności  na  mniejszych  głębokościach,  tzn. 

10-150  km,  daje  metoda  sondowań  magnetotellurycz-  metoda 
nych  zapoczątkowana  w 1949  r.  przez  A.  Tichonowa  sondowań 

1 L.  Cagnarda.  Polega  ona  na  jednoczesnych  obser-  magneto- 
wacjach  zmian  składowych  poziomych  pola  magne-  tellurycznych 
tycznego  i elektrycznego.  Wyniki  badań  wskazują  na 

duże  regionalne  odstępstwa  od  globalnego  modelu. 


kości  geomagnetycznej.  Poza  tym  istnieje  wiele  in- 
nych miar  aktywności  magnetycznej.  Jedna  z nich, 
tzw.  miara  w,  uwzględnia  wpływ  burz  magnetycznych. 
Wyznaczenie  tego  wskaźnika  polega  na  znalezieniu 
różnicy  między  średnią  wartością  składowej  poziomej 
podczas  dwóch  kolejnych  dni,  bez  uwzględniania 
znaku  składowej.  Aktywność  magnetyczna  pozostaje 
w ścisłym  związku  z aktywnością  Słońca;  widać  to 
wyraźnie  na  rys.  28,  gdzie  przedstawione  są  krzywe 
zmian  obu  miar  aktywności  (aktywność  Słońca  określa 
się  tzw.  liczbą  Wolffa,  czyli  wskaźnikiem  liczby  plam 
na  Słońcu). 


Indukcja  elektromagnetyczna 
we  wnętrzu  Ziemi 

Zmiany  pola  geomagnetycznego  o okresach  od  kilku 
sekund  do  kilku  tysięcy  lat  indukują  prądy  elektryczne 
w przewodzących  warstwach  Ziemi.  Prądy  te,  zwane 
prądy  prądami  tellurycznymi,  są  źródłem  wtórnych  składo- 
telluryczne  wych  pola,  kóre  się  dodają  do  składowych  pochodzą- 
cych od  źródeł  zewnętrznych.  Rozkład  i natężenie 
prądów  tellurycznych  zależą  od  częstości  zmian  oraz 
od  rozkładu  przewodności  we  wnętrzu  Ziemi;  zmiany 
o okresach  krótszych  indukują  prądy  w płytszych 


Rysunek  29  przedstawia  rozkład  przewodności  elek- 
trycznej z głębokością  uzyskany  na  podstawie  uśred- 
nionych wyników  sondowań  magnetotellurycznych, 
wyników  badań  prądów  indukowanych  przez  zmiany 
dobowe  pola  geomagnetycznego,  burze  magnetyczne 
i zmiany  wiekowe.  Zjawiska  indukcji  elektromagne- 


Rys.  29.  Rozkład  przewodności  elektrycznej  we  wnętrzu  Ziemi 
(wg  M.  H.  P.  Bott  The  Interior  of  the  Earth , London  1971) 
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tycznej  we  wnętrzu  Ziemi  przyciągają  uwagę  geofizy- 
ków ze  względu  na  ścisły  związek  pomiędzy  rozkładem 
przewodności  elektrycznej  a rozkładem  temperatury 
we  wnętrzu  Ziemi.  Więcej  informacji  na  ten  temat 
można  znaleźć  w artykule  poświęconym  fizyce  sko- 
rupy i wnętrza  Ziemi. 

A.  N.  Chramów  Paleomagnietizm  pałeozoja,  Leningrad  1974; 
A H.  Cook  Physics  of  the  Earih  and  Piane  ts . London  1973; 
B.  Lisowski  O zmianach  dziennych  słonecznych  deklinacji  magne- 
tycznej w Świdrze,  Acta  Geophys.  Pol.  3,  35, 1955;  S.  Matsushita 


Fizyka  morza 

Dynamika  morza 

Czesław  Druet 

Około  70%  powierzchni  ziemskiego  globu  zajmują 
morza  i oceany,  olbrzymie  masy  wód,  które  są  w ciąg- 
łym ruchu.  Formy  tego  ruchu  zależą  od  rodzaju  czyn- 
nika zewnętrznego,  wywołującego  na  powierzchniach 
granicznych  zbiornika  wodnego  (powierzchnia  swo- 
bodna wód  i powierzchnia  dna)  oraz  w jego  wnętrzu, 
hydrostatyczne  i hydrodynamiczne  siły  tarcia  i ciśnie- 
nia. Woda  jest  ośrodkiem  łatwo  odkształcalnym 
i praktycznie  rzecz  biorąc  — nieściśliwym.  Jej  struk- 
tura określona  jest  gęstością,  wyrażającą  stosunek 
masy  m elementu  cieczy  do  jego  objętości  q.  W zbior- 
nikach wodnych,  których  masa  rozłożona  jest  równo- 
gęstość  miernie  (struktura  jednorodna),  gęstość  jest  wielkością 
wody  stałą  o = mjq  = const.  Natomiast  w dużych  zbiorni- 
kach oceanicznych  rozkład  gęstości  wody  jest  z reguły 
rozkładem  niejednorodnym,  zależnym  od  tempera- 
tury, zasolenia  i ciśnienia.  Na  pewnych  głęboko- 
ściach, wskutek  znacznych  różnic  gęstości  warstw 
wodnych,  tworzą  się  często  tzw.  powierzchnie  skoku 
gęstości. 

zawartość  Niezależnie  od  stanu  zasolenia  mórz  i oceanów  pro- 
soli  centowy  udział  poszczególnych  rodzajów  soli  w 1 kg 
wody  jest  wielkością  prawie  stałą  i znając  zawartość 
jednego  ze  składników  (np.  chlorku  sodu)  w 1 kg  wo- 
dy morskiej,  możemy  obliczyć  przybliżony  stan  jej 
zasolenia.  Stan  ten  waha  się  — w zależności  od  szero- 
kości geograficznej,  głębokości  akwenu  — od  kilku 
do  kilkudziesięciu  promili. 

temperatura  Temperatura  wód  morskich  zależy  również  od  sze- 
regu czynników,  spośród  których  najistotniejsze  są 
promieniowanie  słoneczne  oraz  mechanizmy  wymiany 
i przenoszenia  ciepła  wewnątrz  zbiornika.  Rozkład 
temperatury  wód  morskich  jest  znacznie  mniej  stabil- 
ny od  rozkładu  zasolenia  i zależy  od  szerokości  geo- 
graficznej, głębokości  akwenu  oraz  pory  roku,  mie- 
siąca, doby.  W zależności  od  tych  czynników  średnia 
temperatura  wód  morskich  przybiera  wartości  od  zera 
do  kilkudziesięciu  stopni  Celsjusza. 

Wpływ  ciśnienia  atmosfery  i górnych  warstw  wody 
na  gęstość  wody  morskiej  jest  niewielki,  ponieważ  — 
Jak  powiedzieliśmy  — woda  jest  ośrodkiem  prawie 
nieściśliwym.  Gdyby  jednak  wody  morskie  były  ideal- 
nie nieściśliwe,  wówczas  poziom  światowego  oceanu 
byłby  o ok.  30  m wyższy  od  poziomu  obecnego. 


Przyczyny  ruchu  mas  wodnych 

Stałymi  czynnikami  zewnętrznymi,  od  których  zależy 
ruch  mas  wodnych  w morzu  są: 

siła  ciężkości  Siła  ciężkości  F9y  będąca  wypadkową  dwóch  skła- 
dowych (rys.  1)  - — siły  grawitacji  ziemskiej  Fę0y  wy- 
wołanej zjawiskiem  wzajemnego  przyciągania  się 
masy  Ziemi  i elementu  wody  qt  oraz  siły  odśrodkowej 

wywołanej  obrotem  Ziemi  dookoła  jej  osi 
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Solar  quiet  and  lunar  daily  variation  fields,  w Physics  of  Geo- 
magnetic  Phenomena,\o\.  1 ,New  York  and  London  1967;  M.  W. 
Mc  Elhinny  Paleomagnetism  and  piąte  tectonics,  Cambridge  1973 ; 
A-  T.  Price  Electromagnetic  introduction  within  the  Earth,  w Phy- 
sics of  Geomagnctic  Phenomena , vol.  1 , New  York  and  London 
1967;  T.  Przypkowski  Zabytkowe  kompasy  magnetyczne  na  in- 
strumentarium astronomicznym  Marcina  Bylicy  z Olkusza  z lat 
1480-1487,  Acta  Geophys.  Pol.  4 , 245  (1956);  U.  Schmucker. 
J.  Jankowski  Geomagnctic  induction  studies  and  the  electrical 
State  of  the  upper  mantle , w The  Upper  Mantle  Developments  in 
Geotectonics,  4,  Amsterdam  1972;  R.  Sroczyński  Rozwój  eks- 
perymentu, pojęć  i teorii  magnetycznych.  Warszawa  1969. 


Siła  pływotwórcza  Fp,  będąca  wypadkową  rzutów  siła 
dwóch  sił  na  linię  styczną  do  krzywizny  swobodnej  pływotwór- 
powierzchni  wód,  w punkcie  położenia  elementu  q cza 

(rys.  2)  — siły  odśrodkowej  {F0)y  wywołanej  ruchem 


N 


siła 

Coriolisa 


ciśnienie 
atmosfe- 
ryczne 
i aero- 
dynamiczne 
tarcie 


kształt 
i dynamiczna 
aktywność 
akwenu 


okrężnym  Ziemi  dookoła  środka  („O”)  grawitacyjnej 
równowagi  układu  Ziemia-Księżyc  (wszystkie 
punkty  materialne  na  Ziemi  i w jej  wnętrzu  krążą 
w tym  ruchu  po  orbitach  kołowych  względem  róż- 
nych środków  obrotu  O,  ale  promienie  tych  orbit  r 

oraz  liniowe  prędkości  ruchu  ( V = co0r)  punktów  q 
są  jednakowe,  równe  r — rz  i V = Vz  (rys.  2)),  oraz 

rzutu  siły  grawitacji  księżycowej  (F*)  wywołanej  zja- 
wiskiem wzajemnego  przyciągania  się  elementów 
wody  i Księżyca.  Analogiczne  siły  pływotwórcze 
wzbudzane  są  również  w układzie  grawitacyjnym 

Ziemia-Słońce.  Obliczając  siły  Fv  w układzie  Ziemia 
-Księżyc  i układzie  Ziemia-Słońce  zobaczymy,  że  siły 
pływotwórcze  księżycowe  są  2,2  razy  większe  od  sił 
pływotwórczych  słonecznych. 

Na  elementy  wody  q poruszające  się  w akwenie 

z prędkością  postępową  u działa  siła  wywołana  ru- 
chem obrotowym  globu  ziemskiego  dookoła  własnej 

osi,  zwana  siłą  Corliolisa  Fc  = 2gq(uxcoz)  (gdzie 
uxcoz  jest  iloczynem  wektorowym,  czyli  wektorem 

0 kierunku  prostopadłym  do  kierunku  u i coz , o dłu- 
gości równej  ucoz sin(<£  u,oyz).  Siła  ta  odchyla  kierunek 

wektora  prędkości  w,  na  półkuli  północnej  zgodnie 
z ruchem  wskazówek  zegara  (w  prawo),  a na  półkuli 
południowej  w kierunku  przeciwnym  (w  lewo). 

Pozostałe  czynniki  zewnętrzne,  od  których  zależy 
ruch  mas  wodnych  w morzu  związane  są  z własnoś- 
ciami powierzchni  granicznych  zbiornika,  tj.  z wa- 
runkami panującymi  na  swobodnej  powierzchni  wód 
oraz  na  dnie  i brzegach  morskiego  zbiornika. 

Atmosfera  ziemska  oddziałuje  na  swobodną  po- 
wierzchnię akwenu  siłą  normalną  do  tej  powierzchni, 
zależną  od  ciśnienia  atmosferycznego  i siłą  styczną 
do  niej  zw-aną  siłą  tarcia  aerodynamicznego.  Ciśnie- 
nie atmosferyczne  ( pa ),  zmieniające  się  nieregularnie 
w-  czasie  i przestrzeni,  zależy  głównie  od  warunków 
termicznych  panujących  w atmosferze  na  różnych 
wysokościach.  Natomiast  styczne  siły  tarcia  aero- 
dynamicznego (Ta)  wzbudzane  są  ruchem  mas  po- 
wietrza (wiatrem)  w przyw-odnej  warstwie  atmosfery 

1 wynikają  z turbulentnej  wymiany  pędu  między  ele- 
mentami powietrza  i wody  w przypowierzchniowej 
granicznej  warstwie  morza  i atmosfery.  Siły  te  są 
proporcjonalne  do  kwadratu  prędkości  wiatru 
(r«  « 3*10_6£/2,  gdzie  U jest  prędkością  wiatru). 

Drugą  naturalną  powierzchnię  graniczną  morskiego 
zbiornika  tworzą  dno  i brzegi  akwenu.  Ich  kształt 
i aktywność  dynamiczna  wywołują  różnego  rodzaju 
procesy  brzegowe  lub  hydrodynamiczne  osobliwości. 
Kształt  i rodzaj  brzegu  morskiego  oraz  jego  stromość 
wywierają  znaczny  wpływ  na  procesy  hydrodyna- 
miczne w strefie  przybrzeżnej,  transformując  istnieją- 
ce i wzbudzające  nowe  (np.  fale  odbite  od  stromych 
brzegów  lub  przybrzeżne  spiętrzenia  mas  wodnych). 
Kształt  dna  morskiego  odgrywa  także  dużą  rolę 
w przydennych  przepływach  mas  wodnych  oraz  zwią- 
zanej z nimi  dyfuzji  pędu,  ciepła  i zawartych  w wodzie 
substancji  biernych.  Ale  najpoważniejsze  w skutkach 
są  zjawiska  wulkaniczne  i trzęsienia  dna  morskiego, 
wywołujące  groźne  dla  życia  i mienia  ludzkiego  po- 
wodzie morskie. 


Prawa  rządzące  ruchem  mas  wodnych 

Ruch  mas  wodnych  w morzach  i oceanach,  zależny 
od  wyżej  wymienionych  czynników',  przybiera  w czasie 
i przestrzeni  różne  formy,  spełniające  zaw-sze  trzy 
podstawowe  prawa  mechaniki  ośrodków'  ciągłych: 
prawo  zachowania  masy, 

JJJ  -^-Ą+ffeundA  =0; 

Q A 


prawo  zachowania  pędu, 

j - I I f nudą  = // pndA+  J ff  oFdą; 

" ą A C 

prawo  zachowania  energii, 

tl  t 

= I [// PnitdA+  JJJ  qFudq\dt , 

lX  A q 

gdzie  o jest  gęstością  wody  zawartej  w elementarnej 
objętości  dqy  A — powierzchnią  objętości  qyu  — pręd- 
kością ruchu  elementu  dqy  t — czasem,  pn  — ciśnie- 
niem (siłą  powierzchniową  normalną  do  elementu 
powierzchni  dA\  un  — prędkością  normalną  do  ele- 
mentu powierzchni  dAt  F — siłą  masową  zewnętrzną, 
działającą  na  element  objętości  dq. 

Praw'o  zachowania  masy  wyraża  fakt,  że  zmiana 
masy  w objętości  qy  uwarunkowana  zmianą  gęstości 
wody  w czasie  dt , musi  równać  się  masie,  która  w tym 
samym  czasie  dopłynie  do  w-nętrza  objętości  q lub 
wypłynie  z niego  przez  powierzchnię  A.  Jeżeli  zasada 
ta  nie  jest  spełniona  to  oznacza,  że  wewnątrz  obszaru 
q istnieją  źródła  produkujące  lub  pochłaniające  wodę. 
Prawo  zachowania  pędu  odwzorowuje  podstawową 
zasadę  Newtona,  dotyczącą  równowagi  sumy  sił 
zewnętrznych  działających  na  ciało  (siły  powierzch- 
niowe i siły  masowe  — prawa  strona  równania)  i ilo- 
czynu masy  ciała  oraz  jego  przyspieszenia  (lewa  strona 
równania).  Prawo  zachowania  energii  wyraża  zasadę, 
że  ilość  pracy  wykonanej  przez  siły  zewnętrzne  w cza- 
sie tz-tl  musi  być  równa  różnicy  energii  kinetycznej 
masy  wody  w dwóch  stanach  chwilowych;  w momen- 
cie tZy  w którym  masa  cieczy  ma  objętość  q2  i momencie 
/,,  odpowiadającym  objętości  qx. 

Stanem  spoczynkowym  morskiego  akwenu  jest 
Stan  równowagi  hydrostatycznej,  w którym  elementy 
wody  q nie  zmieniają  w czasie  i przestrzeni  swojego 
położenia.  Wówczas  jedyną  siłą  zewnętrzną  działa- 
jącą na  elementy  wody  jest  siła  ciężkości  warunku- 
jąca ciśnienie  hydrostatyczne.  Stan  równowagi  hy- 
drostatycznej możliwy  jest  oczywiście  jedynie  wów- 
czas, gdy  rozkład  gęstości  wody  w morzu  jest  bądź 
rozkładem  jednorodnym  w przestrzeni:  g(xyy,z)  = 
= const,  bądź  też  rozkładem  jednorodnym  w płasz- 
czyźnie poziomej:  £>(•*»  J')  = const  i stabilnym 

w płaszczyźnie  pionowej : qz  < gz+jz  (rys.  3).  W wa- 
runkach naturalnych  stan  taki  nie  może  wystąpić 


w czystej  postaci,  ponieważ  astronomiczne  siły  pływo- 
twórcze oraz  przestrzenna  i czasowa  zmienność  pól 
atmosferycznego  ciśnienia,  wzbudzać  będą  zawsze 
ruch  mas  wodnych  i jedynie  w szczególnych  okolicz- 
nościach (bardzo  słabe  pływy  w małym  akwenie, 
jednorodny  i stacjonarny  układ  baryczny,  brak  wiat- 
ru) i tylko  chwilowo  mogą  być  spełnione  w akwenie 
warunki  kwazihydrostatycznej  równowagi. 


prawa 

zachowania 


stan 

równowagi 

hydro- 

statycznej 


861 


ruch  W razie  naruszenia  gęstościowej  jednorodności  czy 
laminarny  stabilności  ośrodka  wodnego  lub  zadziałania  innego 
czynnika,  naruszającego  stan  równowagi  hydrosta- 
tycznej akwenu,  elementy  wody  rozpoczną  ruch, 
który  w fazie  początkowej,  bez  względu  na  rodzaj 
czynnika  wzbudzającego,  będzie  ruchem  laminamym. 
W ruchu  tym  poruszające  się  elementy  wody  q po- 
zostaną zawsze  w niezniennej  względem  siebie  pozy- 
cji, a jedynym  mechanizmem  przekazywania  energii 
ze  źródła  ruchu  w głąb  i wszerz  zbiornika  będzie 
v molekularna  wymiana  pędu  (wymiana  pędu  między 
molekułami)  między  sąsiadującymi  elementami  wody 
(rys.  4),  stanowiąca  istotę  molekularnego  tarcia  we- 
wnętrznego, zwanego  lepkością  wody. 


warstwa 

wody 


— TT 

/ 

/ 

►/pionowy  rozkład 
/prędkości  u ru- 
/chu  elementów  q 


Rys.  4.  Schemat  struktury  laminamego  ruchu  wody 


ruch  Jeżeli  prędkość  elementów  q przekroczy  pewną 
turbulentny  wartość  graniczną,  ruch  laminarny  wody  przechodzi 
w ruch  turbulentny,  który  charakteryzuje  się  chao- 
tyczną wymianą  elementów  wody  między  strugami. 
Elementy  te  poruszają  się  wówczas  po  nieregularnych 
krzywoliniowych  drogach,  tworząc  w ten  sposób 
różnorodne  struktury  wirowe,  których  wymiary  (skale 
turbulencji)  zmieniają  się  w oceanie  od  kilku  centy- 
metrów do  kilku  tysięcy  kilometrów,  w zależności 
od  rodzaju  czynnika  wzbudzającego  ruch.  Tego  typu 
wymiana  pędu  między  sąsiadującymi  warstwami 
mas  wodnych  stanowi  istotę  tzw.  turbulentnego  tarcia 
wewnętrznego. 

Siły  molekularnego  i turbulentnego  tarcia  wew- 
nętrznego i odpowiadające  im  naprężenia  styczne 
do  powierzchni  elementów  wody,  łącznie  z siłami 
ciśnienia  hydrodynamicznego,  działającego  prosto- 
padle do  powierzchni  tych  elementów  i wywołującego 
naprężenia  normalne,  warunkują  procesy  przekazy- 
wania energii  mechanicznej  mas  wodnych  wewnątrz 
morskiego  akwenu. 


Rodzaje  zjawisk  hydrodynamicznych 
w morzach  i oceanach 

Różnorodność  czynników  zewnętrznych  wzbudzają- 
cych i warunkujących  ruch  mas  wodnych  w morzu 
oraz  różnoskalowy  charakter  ich  oddziaływania  po- 
wodują powstawanie  złożonego  mechanizmu  prze- 
kazywania energii  zewnętrznej  w głąb  morskiego 
zbiornika,  od  większych  ustrojów  wirowych  do  mniej- 
szych. Mechanizm  ten  tworzy  pole  przepływu,  którego 
struktura  jest  wynikiem  przypadkowego  (losowego) 
nakładania  się  i przenikania  różnych  ruchów  składo- 
wych. Podstawową  wielkością  charakteryzującą  taki 
przepływ  jest  prędkość  chwilowa  u elementów  wody, 
która  zmienia  się  w sposób  przypadkowy  w czasie 
i przestrzeni.  Prędkość  tę  możemy  zawsze  rozłożyć 


Rys.  5.  Wycinek  oscylogramu  prędkości  turbulentnego  przepływu 
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charakteryzującą  turbulencję  (rys.  5).  W zależności 
od  wielkości  przedziału  czasu  lub  obszaru  przestrzeni, 
w których  wypadkowy  ruch  mas  wodnych  jest  uśred- 
niany, parametry  u i u]  mogą  mieć  różne  znaczenie 
i wartości  (ruch  makroskalowy,  mezoskalowy,  mikro- 
skalowy). 

Formy  mikroskalowe  charakteryzują  ruch  elemen- 
tów wody  bezpośrednio  i nie  podlegają  żadnemu 
podziałowi.  Natomiast  wielko-  i średnioskalowe 
ruchy  mas  wodnych  w morzu  możemy  podzielić  na 
różne  rodzaje.  W zależności  od  przyjętego  kryterium 
podziału  może  to  być  ruch  oscylacyjny,  postępowy, 
cyrkulacyjny  itp.,  lub  ruch  swobodnej  powierzchni 
morza,  ruch  powierzchni  skoku  gęstości,  termohali- 
nowa  cyrkulacja,  przepływy  geostroficzne,  dryfowe, 
gradientowe  itp. 

Scharakteryzujmy  pokrótce  najbardziej  znane  po- 
stacie zjawisk  hydrodynamicznych  w morzach  i ocea- 
nach. 


A)  Ruch  falowy 

Jeżeli  poziomy  rozkład  ciśnienia  atmosferycznego 
(układ  baryczny)  będzie  niejednorodny,  to  zgodnie 
z zasadą  naczyń  połączonych,  powierzchnia  swobod- 
na jednorodnego  gęstościowo  akwenu  nie  będzie 
miała  położenia  poziomego,  lecz  przybierze  kształt 
równoważący  ciśnienie  atmosferyczne  tak,  że  na  do- 
wolnej rzędnej  poniżej  powierzchni  swobodnej  ciśnie- 
nie będzie  stałe  (rys.  6).  Jeżeli  ponadto  pole  baryczne 
będzie  się  zmieniać  w czasie  i przemieszczać  w okreś- 
lonym kierunku,  to  procesowi  temu  będzie  towarzy- 
szyć odpowiedni  ruch  odkształcenia  swobodnej  po- 
wierzchni morza  zwany  falą  baryczną.  Fale  baryczne 
należą  do  kategorii  fal  nieokresowych,  wymuszonych. 
Ich  rozmiary  i prędkość  rozprzestrzeniania  się  zależą 
od  charakterystyki  układów  barycznych  wzbudzają- 
cych te  odkształcenia  oraz  od  głębokości  i rozmiarów 
morskiego  akwenu. 


Innym  rodzajem  występujących  w morzu  fal  nie- 
okresowych są  fale  samotne,  zwane  tsunami,  należą- 
ce do  kategorii  falowania  swobodnego,  a wzbudzane 
najczęściej  wybuchem  podwodnego  wulkanu,  trzęsie- 
niami dna  morskiego  lub  innymi  zjawiskami  sejsmicz- 
nymi. Tsunami  w płytkowodnych  rejonach  przybrzeż- 
nych osiągają  nieraz  wysokość  rzędu  kilkudziesięciu 
metrów  i są  zjawiskiem  bardzo  groźnym  dla  życia 
i mienia  ludzkiego.  Tak  np.  słynny  wybuch  wulkanu 
na  wyspie  Krakatau  w 1883  r.  był  przyczyną  kata- 
strofalnej powodzi  morskiej,  wywołanej  falą  tsunami, 
która  zniszczyła  szereg  miast  na  Jawie  i Sumatrze 
oraz  pochłonęła  ok.  40  000  istnień  ludzkich.  Powo- 
dzie morskie  zdarzają  się  dość  często  w rejonach  le- 


fale  baryczne 

I 


fale  tsunami 


żących  na  trasach  wędrówki  fal  tsunami.  Z tych 
względów  instaluje  się  tam  specjalne  systemy  ostrze- 
gawcze, rejestrujące  zachowanie  się  swobodnej  po- 
wierzchni wód  w strefie  przybrzeżnej.  Na  rys.  7 za- 
mieszczony jest  typowy  oscylogram  obrazujący 
przebieg  fali  tsunami.  Podstawowym  sygnałem  mó- 
wiącym o zbliżeniu  się  tsunami  jest  chwilowe  obniże- 
nie się  wód,  zwane  zwiastunem  (moment  f0  na  rys.  7). 
Później  następuje  faza  przejścia  tsunami  właściwej 
i faza  t > ti  oscylacji  wtórnych. 


Rys.  7.  Oscylogram  tsunami  (wg  Takashicgo) 


spiętrzenia  Najczęstszymi  przyczynami  nieokresowego  pod- 
i soh  wyższa nia  się  i opadania  swobodnej  powierzchni  wód 
dryfowe  w strefie  przybrzeżnej  morza  są  tzw.  spiętrzenia  i spły- 
wy dryfowe,  zwane  czasem  wiatrowymi  lub  sztor- 
mowymi (przy  silnych  wiatrach).  Wywołany  silami 
tarcia  aerodynamicznego  (wiatrem)  ruch  mas  wod- 
nych jest  w strefie  przybrzeżnej  tłumiony  konturem 
brzegu,  stanowiącym  dla  przepływu  wód  naturalną 
zaporę,  oraz  nierównościami  i szorstkością  dna,  któ- 
rych wpływ  jest  tym  większy,  im  mniejsza  jest  głę- 
bokość akwenu.  Dlatego  średnia  prędkość  ruchu  mas 
wodnych  jest  tym  mniejsza,  im  bliżej  brzegu  znajduje 
się  miejsce  obserwacji  przepływu.  Zatem  przy  brze- 
gach, na  które  wiatr  wieje  (nawietrznych)  masy  wodne 
spiętrzają  się,  a przy  brzegach  przeciwległych  (pod- 
wietrznych)  spływają.  W pierwszym  wypadku  ob- 
serwujemy podnoszenie  się  poziomu  wód,  w drugim  — 
obniżenie  (rys.  8). 


kierunek  wiatru 


powierzchnia  swobodna  poziom  normalny 


Rys.  8.  Schemat  spiętrzenia  i spływu  dryfowego 


pływy  Główne  okresowe  oscylacje  swobodnej  powierzchni 
morza  wzbudzane  są  astronomicznymi  siłami  pływo- 
twórczymi.  Oscylacje  te,  zwane  pływami,  należą  do 
kategorii  zjawisk  makroskalowych  w skali  ziemskiego 
globu.  Towarzyszą  im  zawsze  w przybrzeżnej  strefie 
morza  cykliczne  spływy  wód  i obniżanie  się  swobod- 
nej powierzchni  akwenu  zwane  odpływem  oraz  spię- 
trzanie wód  — zwane  przypływem.  W celu  zrozu- 
mienia mechanizmu  tych  procesów  przyjrzyjmy  się 
jeszcze  raz  rys.  2.  Układ  Ziemia-Księżyc  pozostaje 
w równowadze  dlatego,  że  średnia  siła  odśrodkowa 

ziemskiego  globu  (F0)ś r równa  jest  średniej  sile  gra- 
witacyjnej (Fk)śr . Ponieważ  siły  cząstkowe  F0,  dzia- 
łające na  dowolne  elementy  masy  ziemskiego  globu 

są  sobie  równe,  więc  (/7o)śr  = F0.  Natomiast  siła 

(f*)śr  równa  jest  sile  cząstkowej  jF*  jedynie  w środku 
masy  Ziemi.  Z tych  względów  w każdym  punkcie 


ziemskiego  globu  istnieć  będzie  różnica  sił  F0—Fk  — 

— AF,  przybierająca  największe  wartości  w punk- 
tach / i 3,  a najmniejsze  w punktach  2 i 4 (rys.  9), 
przy  czym  siły  pływotwórcze  na  półkuli  zorientowanej 
w stronę  Księżyca  (2  -►  3 4)  będą  nieco  większe 

od  sił  działających  na  półkuli  przeciwnej  (4  1 -+  2). 

Układ  sił  uwidoczniony  na  rys.  9 wywoła  odpływ  wód 
z obszarów  2 i 4 i obniżenie  swobodnej  powierzchni 
morza  w tych  rejonach,  przypływ  zaś  wód  i podwyż- 
szenie powierzchni  w obszarach  / i 3.  Z kolei  oś  ob- 
rotu Ziemi  nachylona  jest  pod  pewnym  kątem  w sto- 
sunku do  prostej  łączącej  środki  mas  Ziemi  i Księżyca. 
Przy  założeniu,  że  Ziemia  jest  całkowicie  pokryta  wo- 
dą, swobodna  powierzchnia  wód  ukształtowałaby  się 
jak  na  rys.  10. 


Księżyc 


Rys.  9.  Schematyczny  rozkład  sił  pły  wotwórczych  na  powierzchni 
Ziemi 


KUwjerzchnia 

Rys.  10.  Schemat  odkształcenia  swobodnej  powierzchni  wód  pod 
wpływem  sił  pływotwórczych  Fv 


Księżyc 
— © 


Gdybyśmy  teraz  przecięli  glob  ziemski  równoleż-  pływy 
nikowo,  to  obwiednie  przekroju  (rys.  11)  zawierałyby 
jeden  wysoki  i jeden  niski  stan  wód  w przekroju  rów-  5 połdobowe 
noleżnika  <p  = 45°  szerokości  geograficznej  północ- 
nej i południowej  oraz  dwa  wysokie  i dwa  niskie 
stany  wód  w przekroju  równikowym  q>  = 0.  I dla- 
tego w czasie  jednego  obrotu  Ziemi  dookoła  swojej 
osi  obserwujemy  równoleżnikowy  ruch  grzbietów 


pływ  dobowy 

pływ  półdobowy 

Rys.  11.  Schematy  pływów:  dobowego  i półdobowego 
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Rys.  14.  Układy  amfidromiczne  w Morzu  Bałtyckim,  dla  pływu 
półdobowcgo.  księżycowego  (wg  Defanta).  Położenia  linii  naj- 
większego spadku  podane  są  w stopniach,  a amplitudy  wahań 
przybrzeżnych  w centymetrach 


tek  tych  zjawisk  powstają  procesy  transformacji  fal 
pływowych  w obszarach  przybrzeżnych,  gdzie  wy- 
stępuje silny  wzrost  amplitudy  pływów,  osiągającej 
średnio  wartości  od  1,30  do  3,00  m (pływy  dobowe), 
a w szczególnych  okolicznościach  (zwężona  zatoka) 
dochodzącej  nawet  do  1 8 m. 

Długości  fal  pływowych  są  rzędu  połowy  długości 
obwodowej  równika.  Nic  więc  dziwnego,  że  w przy- 
brzeżnych rejonach  nawiedzanych  przez  pływy,  fazy 
przepływu  i odpływu  obserwowane  są  w postaci  po- 
stępowego ruchu  wód  zwanego  prądem  pływowym. 
Prądy  te  podlegają  znacznemu  oddziaływaniu  sił 
Coriolisa,  które  odchylają  tory  ruchu  elementów 
wody  w kierunku  prostopadłym  do  wektora  pręd- 
kości prądu,  w prawo  na  półkuli  północnej  i w lewo 
na  półkuli  południowej.  Zjawisko  to  wywołuje  w ak- 
wenach morskich  spiętrzenie  wód  w jednych  rejonach 
przybrzeżnych  i równoczesne  ich  opadanie  w rejonach 
przeciwległych.  Linia  największego  spadku  swobodnej 
powierzchni  akwenu,  łącząca  przeciwległe  punkty 
najwyższego  i najniższego  stanu  wód,  zatacza  w ciągu 
całego  okresu  pływowego  krąg,  którego  środkiem 
jest  punkt  amfidromiczny.  Stan  wód  w tym  punkcie 
przedstawia  poziom  średni.  Linie  największego  spadku 
swobodnej  powierzchni  wraz  z punktem  amfidro- 
micznym  tworzą  układ  amfidromiczny  (rys.  14), 
którego  znajomość  umożliwia  przewidywanie  mo- 
mentów występowania  ekstremalnych  stanów  pływo 
wych  w danym  rejonie. 

Pływy  astronomiczne  to  rodzaj  fa!  grawitacyjnych 
postępowych.  Innym  rodzajem  okresowych  oscylacji 
swobodnej  powierzchni  morza  są  tzw.  fale  grawita- 
cyjne stojące.  Każdy  akwen  morski,  w którym  naru- 
szona została  równowaga  hydrostatyczna  mas  wod- 
nych, wykonuje  okresowe  ruchy  swobodnej  powierz- 
chni wód,  zwane  sejszami.  Stanowią  one  odpowiednik 
drgań  własnych  ciała  materialnego,  a charakteryzują 
się  takimi  szczegółami  właściwymi  falom  stojącym 
(rys.  15),  jak  węzły,  w których  elementy  wody  znaj- 


prądy 

pływowe 


ukłaa 

amfidro- 

miczny 


sejsze 


Rys.  13.  Pływ  kwadraturowy 

transfor-  Gdyby  glob  ziemski  pokryty  był  całkowicie  wodą, 
macja  fali  maksymalna  wysokość  fali  pływowej  księżycowej 
pływowej  (różnica  między  najwyższym  i najniższym  stanem 
wód)  nie  przekraczałaby  55  cm,  a fali  pływowej 
słonecznej  — 24  cm.  Istnienie  lądów  i związanych 
z nimi  płycizn  szelfowych,  zatok  i cieśnin,  powoduje 
zmniejszanie  się  prędkości  rozprzestrzeniania  się  fali 
pływowej  w miarę  zbliżania  się  do  lądu  (wpływ  tarcia 
przydennego  i ograniczenie  głębokości  akwenu). 
Ponadto  przy  brzegach  stromych  część  energii  fali 
pływowej  zostaje  zamieniona  na  pracę  sił  wzbudza- 
jących falę  „odbitą”,  rozprzestrzeniającą  się  w kie- 
runku przeciwnym  do  ruchu  fali  nabiegającej.  Wsku- 
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i dolin  fali  pływowej  w prawo  względem  punktów 
stałych  na  Ziemi.  W obszarach  <p  = i 45°  w czasie 
jednej  doby  pojawia  się  tylko  jeden  wysoki  stan  wód 
i jeden  niski,  będące  tzw.  pływami  dobowymi  księży- 
cowymi o okresie  25,82  h.  W obszarach  równikowych 
natomiast  pojawiają  się  w tym  czasie  dwa  stany  wy- 
sokie i dwa  niskie,  będące  pływami  księżycowymi 
półdobowymi  o okresie  12,42  h.  Te  dwa  rodzaje 
pływów  przenikają  się  oczywiście  wzajemnie  i wystę- 
pują w każdej  szerokości  geograficznej,  z tym  że 
w rejonach  q>  = 0 i <p  = 45°  przybierają  wartości 
ekstremalne.  Analogiczne  pływy  (dobowe  i półdo- 
bowe)  występują  w układzie  wzajemnego  oddziały- 
wania Ziemia-Słońce.  Obserwujemy  zatem  na  Ziemi 
pływy  dobowe  słoneczne  o okresie  24,07  h i pływy 
półdobowe  słoneczne  o okresie  12  h. 
inne  rodzaje  Pływy  dobowe  i półdobowe  (słoneczne  i księżyco- 
pływów  we)  stanowią  główne  składowe  pływów  astronomicz- 
nych, ale  nie  jedyne.  Niezależnie  bowiem  od  omówio- 
nych już  mechanizmów — z faktu,  że  Ziemia  krąży 
wokół  Słońca  i Księżyc  wokół  Ziemi  po  orbitach  elip- 
tycznych wynikają  pływy  długookresowe:  księżycowy 
pólmiesięczny  o okresie  13,661  doby  i miesięczny 
o okresie  27,555  doby,  oraz  słoneczny  półroczny 

0 okresie  182,621  doby  i roczny.  Ponadto  płaszczyzny 
tych  orbit  nachylone  są  w stosunku  do  płaszczyzny 
równika,  z czego  wynikają  pływy  mieszane  dobowe 

1 półdobowe  o okresach  23,93  h i 12,97  h.  Inne  pływy 
mieszane  wynikają  z nakładania  się  i przenikania 
różnych  fal  pływowych  oraz  zjawisk  transformacji 
tych  fal  w rejonach  kontynentalnych  szelfów.  Wzajem- 
ne położenie  Księżyca  i Słońca  względem  Ziemi  wy- 
wiera również  wpływ  na  zjawiska  pływowe.  Najwięk- 
sze amplitudy  fali  pływowej  wzbudzane  są  wówczas, 
gdy  środki  mas  Ziemi,  Słońca  i Księżyca  leżą  na  jednej 
prostej  (pływ  syzygijny,  rys.  12),  najmniejsze  zaś  — 
gdy  proste  łączące  środki  mas  Ziemi,  Słońca  i Księżyca 
ustawione  są  prostopadle  do  siebie  (pływ  kwadra- 
turowy, rys.  13). 


Rys.  12.  Pływ  syzygijny 


^ Księżyc 


Księżyc 


Słońce 


dują  się  w stanie  nieruchomym  lub  wykonują  słabe 
poziome  ruchy  oscylacyjne  względem  punktu  cen- 
tralnego (węzła),  oraz  tzw.  strzałki,  w których  ruch 
elementów  wody  jest  ruchem  oscylacyjnym  piono- 
wym względem  poziomu  spokoju.  Czas,  w którym 
swobodna  powierzchnia  wód  w strzałce  powraca  do 
swego  pierwotnego  położenia,  nazywamy  okresem 
drgań  własnych.  W zależności  od  rozmiarów  i kształtu 
zbiornika  okres  ten  może  przybierać  szereg  wartości 
dla  n — 1 , 2,  3 ...  itd.  punktów  węzłowych.  Mówimy 
wówczas  o sejszy  jedno-,  dwu-  lub  w-węzłowej.  Ry- 
sunek 15  obrazuje  uproszczone  schematy  sejsz 
/i-węzłowych  w kanale  prostopadłym  o stałej  głębo- 
kości. 
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Rys.  15.  Schemat  sejszy  w prostokątnym,  wydłużonym  kanale 


W akwenach  szerokich  mamy  do  czynienia  z sejsza- 
mi  wzdłużnymi  i sejszami  poprzecznymi;  ich  charak- 
terystyki mogą  się  znacznie  różnić.  W naturalnych 
akwenach  morskich,  których  nie  można  w przybliże- 
niu traktować  jak  prostych  kształtów  kanonicznych 
(prostokąt,  koło,  elipsa)  i które  nie  mają  stałej  głębo- 
kości, procesy  sejszowe  są  bardzo  złożone  i opis  ich 
jest  bardzo  trudny.  Na  rys.  16  zamieszczone  są  dla 
przykładu  profile  sejsz  wzdłużnych  Morza  Bałtyckie- 
go w układzie  Bałtyk  Zachodni-Zatoka  Fińska. 

W warunkach  naturalnych  (morze  rzeczywiste) 
omówione  oscylacje  swobodnej  powierzchni  akwenu, 
wzbudzane  siłami  wiatrowego  oddziaływania  (spiętrze- 


Rys.  16.  Wykresy  profili  sejsz  Morza  Bałtyckiego  dla  układu  Bał- 
tyk Zachodni-Zatoka  Fińska  (wg  Kraussa  i Magaarda) 
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nia  i spływy  dryfowe),  dynamiką  dna  (fale  tsuna- 
mi), ciśnieniem  atmosferycznym  (fale  baryczne), 
astronomicznymi  siłami  pływotwórczymi  (fale  pły- 
wowe) oraz  drganiami  własnymi  akwenu  (sejsze), 
nakładają  się  wzajemnie  tworząc  wypadkowy  stan 
wód  w morzu.  Charakter  przestrzenno-czasowej 
zmienności  tego  stanu  zależy  od  rodzaju  dominującej 
oscylacji  składowej.  I tak  np.  jeżeli  oscylacją  dominu- 
jącą będą  pływy,  zmiany  stanu  wód  będą  miały  cha- 
rakter oscylacji  okresowych:  jeżeli  fale  baryczne  lub 
spiętrzenia  i spływy  dryfowe  — zmiany  te  będą  zmia- 
nami nieokresowymi,  o charakterze  losowym  (przy- 
padkowym). 

Na  opisane  wyżej  drgania  długookresowe  i nieokre- 
sowe  swobodnej  powierzchni  morskiego  akwenu  na- 
kładają się  różnorodne  oscylacje  krótkookresowe, 
wśród  których  falowanie  wiatrowe  jest  zjawiskiem 
najbardziej  powszechnym.  Turbulentny  ruch  mas 
powietrza  w dolnych  warstwach  atmosfery  charakte- 
ryzuje się  obecnością  różnowymiarowych  wirów, 
przemieszczających  się  nad  swobodną  powierzchnią 
morza  z różnorodną  prędkością.  Wskutek  przypadko- 
wości przestrzennego  układu  tych  wirów  oraz  ich 
zmienności  w czasie  ciśnienie  atmosferyczne  działają- 
ce na  swobodną  powierzchnię  morza  nie  jest  wielkoś- 
cią stałą,  lecz  ulega  zmiennym  przypadkowym  pul- 
sacjom.  Pulsacje  te  łącznie  z siłami  tarcia  aerodyna- 
micznego wzbudzają  ruch  swobodnej  powierzchni 
akwenu  w postaci  przestrzenno-czasowych  chaotycz- 
nych oscylacji,  zwanych  falowaniem  wiatrowym 
(il.  198,  tabl.  53). 

Wzrost  amplitudy  niektórych  składowych  losowego 
pola  fal  wiatrowych  następuje  wskutek  mechaniczne- 
go rezonansu  powstającego  wówczas,  gdy  częstość 
pulsacji  ciśnień  atmosferycznych,  przemieszczających 
się  w określonym  kierunku  z prędkością  równą  pręd- 
kości wiatru,  jest  równa  częstości  drgań  swobodnej 
powierzchni  akwenu,  rozchodzących  się  z prędkoś- 
cią fazową  równą  prędkości  wiatru.  Gdy  warunek  ten 
nie  jest  spełniony,  drgania  ulegają  bardziej  lub  mniej 
intensywnemu  tłumieniu.  Wskutek  istnienia  sił  tarcia 
aerodynamicznego  możliwy  jest  również  wzrost 
wysokości  i długości  fali  tych  składowych  falowania 
wiatrowego,  których  prędkość  rozprzestrzeniania  się 
jest  mniejsza  od  prędkości  wiatru. 

Fizyczną  strukturę  losowego  pola  fal  wiatrowych 
można  odwzorować  w postaci  czasowo-przestrzennej 
superpozycji  nieskończonej  liczby  regularnych  fal 
elementarnych  (składowych  harmonicznych)  o róż- 
nych amplitudach  i częstościach  (stałych  w obrębie 
poszczególnych  ciągów),  rozprzestrzeniających  się  pod 
różnymi  kątami  względem  kierunku  działania  wiatru. 
Fale  te  nakładają  się  wzajemnie  z losowym  przesu- 
nięciem fazowym,  tworząc  chaotycznie  sfalowaną  po- 
wierzchnię morza. 

Ruch  falowy  swobodnej  powierzchni  morza  jest 
w stosunku  do  akwenu  ruchem  powierzchni  górnej. 
Natomiast  w stosunku  do  atmosfery  ziemskiej  jest  to 
ruch  falowy  powierzchni  dolnej,  atmosferycznego 
podłoża.  W stosunku  do  obu  warstw  swobodna  po- 
wierzchnia akwenu  jest  powierzchnią  rozdziału  dwóch 
ośrodków  płynnych  o różnej  gęstości.  Wewnątrz 
morskiego  akwenu  (szczególnie  w akwenie  oceanicz- 
nym) takie  powierzchnie  rozdziału  występują  wszędzie, 
gdzie  istnieje  pionowe  zróżnicowanie  (ciągłe  lub  sko- 
kowe) gęstościowej  struktury  wód.  Ruch  oscylacyjny 
takiej  powierzchni  to  tzw.  falowanie  wewnętrzne. 

Przyczynami  wzbudzającymi  fale  wewnętrzne  mogą 
być  ruchy  swobodnej  powierzchni  akwenu,  mechaniz- 
my wywołujące  przejście  układu  barotropowego 
w układ  baroki inowy,  siły  pływotwórcze,  drgania 
własne  zbiornika,  zjawiska  sejsmiczne  itp.  Charakte- 
rystyki fal  wewnętrznych  są  zatem  bardzo  różnorodne 
i zależą  od  rodzaju  czynnika  wzbudzającego.  Ogólnie 
można  powiedzieć,  że  fale  wewnętrzne  są  formą  ru- 
chu analogiczną  do  fal  powierzchniowych  z tym  uzu- 
pełnieniem, że  intensywność  tego  ruchu  w poważnej 
mierze  zależy  od  gęstości  górnej  warstwy  wód. 
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Zjawiskiem  mającym  duże  znaczenie  praktyczne 
dla  podwodnej  żeglugi  jest  zjawisko  rezonansu  fali 
wewnętrznej  z czynnikiem  wymuszającym.  W wa- 
runkach takich  wysokość  fal  wewnętrznych  może 
przybierać  bardzo  duże  wartości  (kilkudziesięciu, 
a nawet  kilkuset  metrów)  i może  być  powodem  trud- 
ności w podwodnej  nawigacji,  a nawet  awarii  pod- 
wodnego pojazdu. 


B)  Prądy  morskie 

Drugim,  po  falowaniu,  powszechnym  zjawiskiem 
hydrodynamicznym  w morzu  jest  postępowy  ruch 
mas  wodnych,  zwany  prądem  morskim.  Wśród  róż- 
prądy  norodnych  rodzajów  tego  zjawiska  na  pierwszym 
dryfowe  miejscu  wymienić  należy  prądy  dryfowe.  Żeby  zrozu- 
mieć, jak  powstają  takie  prądy,  załóżmy,  że  osie 
współrzędnych  prostokątnych  xy  y (rys.  17)  leżą 
w płaszczyźnie  swobodnej  powierzchni  akwenu  i są 
tak  ustawione,  że  wiatr  wieje  równolegle  do  osi  y. 
Wektor  prędkości  ruchu  wód  w warstwie  powierz- 
chniowej ( V0 ) wywołanego  siłami  aerodynamicznymi 
tarcia  (ra)  jest  w początkowym  okresie  skierowany 
zgodnie  z kierunkiem  wiatru  (kierunek  siłra).  W miarę 
wzrostu  prędkości  przepływu  siła  Corliolisa  ( Fc ) bę- 


Rys.  17.  Schemat  rozkładu  prędkości  prądu  dryfowego  (spirala 
Ekmana) 

dzie  coraz  bardziej  odchylać  wektor  Vo  (w  prawo  na 
półkuli  północnej,  w lewo  na  półkuli  południowej, 
patrząc  zgodnie  z kierunkiem  ruchu)  do  położenia, 
w którym  składowa  siły  tarcia  aerodynamicznego 

(*ln)  prostopadła  do  wektora  V0  zrównoważy  siłę  Fc 
(rys.  18).  Stan  równowagi  wystąpi  wówczas,  gdy  wek- 
tor ~V0  będzie  odchylony  o 45°  od  początkowego  po- 
łożenia. Ze  wzrostem  głębokości  wpływ  siły  aerody- 
namicznego tarcia  będzie  stopniowo  malał  i jedno- 
cześnie będzie  malał  moduł  prędkości  ruchu  mas  wod- 
nych, a kierunek  prądu  odchylany  będzie  przez  siłę 
Coriolisa  o kąt  tym  większy,  im  głębiej  będzie  się 
znajdować  miejsce  obserwacji,  tj.  im  mniejszy  będzie 
wpływ  tarcia  aerodynamicznego.  Na  pewnej  głębo- 
kości ze,  zależnej  od  prędkości  wiatru,  kierunek  prądu 
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(wektora  Vz ) będzie  przeciwstawny  kierunkowi  prądu 

powierzchniowego  (kierunkowi  wektora  V0),  a moduł 
prędkości  \VZ\  będzie  tak  mały,  że  z praktycznego 
punktu  widzenia  prąd  dryfowy  na  głębokości  zK, 
zwanej  grubością  warstwy  Ekmana,  nie  będzie  istniał. 


Drugim  rodzajem  postępowego  ruchu  mas  wod-  prądy 
nych  w morzu  są  prądy  gradientowe,  wzbudzane  róż-  gradientowe 
nicą  ciśnień  hydrostatycznych  panujących  w sąsiadu- 
jących ze  sobą  obszarach  akwenu.  Przypuśćmy,  że 
wiatr,  który  wywołał  spiętrzenie  dryfowe,  ucichł  i spię- 
trzone masy  wód  znajdujących  się  pod  przeważają- 
cym wpływem  sił  ciężkości.  Nachylenie  swobodnej 
powierzchni  akwenu  będzie  w przybliżeniu  takie,  jak 
na  rys.  18.  Różnica  ciśnień  hydrostatycznych  panują- 
cych w dwóch  punktach  znajdujących  się  na  prostej 
poziomej,  równoległej  do  osi  y9  zawsze  będzie  miała 
tę  samą  wartość,  niezależnie  od  głębokości  z.  Wy- 
wołana tą  różnicą  ciśnień  pozioma  siła  gradientu 
ciśnienia  będzie  powodować  ruch  mas  wodnych.  Siła 
ta  będzie  miała  taką  samą  wartość  w całym  piono- 
wym przekroju  akwenu  od  dna  do  swobodnej  po- 
wierzchni wód,  ale  prędkość  mas  wodnych  na  różnej 
głębokości  będzie  różna.  Przy  samym  dnie  ruch  będzie 
tłumiony  siłami  tarcia  przydennego  i jego  kierunek 
będzie  zgodny  z kierunkiem  gradientu  ciśnienia  (kie- 
runek osi  y).  W miarę  oddalania  się  od  dna  tłumiący 
wpływ  sił  tarcia  maleje,  prędkość  przepływu  rośnie, 
a wraz  z nią  rośnie  siła  Cariolisa  odchylająca  wektor 
prędkości  przepływu.  Na  pewnej  głębokości  zp,  za- 
leżnej od  wartości  gradientu  ciśnienia,  wektor  siły 
Coriolisa  skierowany  będzie  przeciwnie  do  wektora 
siły  wywołanej  różnicą  ciśnień.  Prędkość  przepływu 
mas  wodnych  zorientowana  będzie  w tym  w'ypadku 
równolegle  do  osi  x.  Powyżej  głębokości  zg  prędkość 
prądu  będzie  stała,  prostopadła  do  kierunku  działania 


swobodna  powierzchnia 
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z£  gradientowe  geostrograficzne 
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Rys.  19.  Schemat  rozkładu  prądów  w głębokim  oceanie 
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gradientu  ciśnienia.  Zatem  w warstwie  akwenu  od  kierunek  wiatru 
swobodnej  powierzchni  do  głębokości  zg  prądy  gra- 

dientowe  będą  miały  charakter  przepływów  geostro- £P£i l°iU 

ficznych. 

Jeżeli  rozkład  gęstości  wód  morskich  jest  rozkładem 
niejednorodnym  w przestrzeni,  to  wskutek  istnienia 
różnicy  gęstości  powstają  poziome  siły  wywołane 
różnicą  ciśnienia,  analogiczne  do  wyżej  opisanych, 
wzbudzające  ruch  mas  wodnych  w morzu,  zwany 
prądem  gęstościowym.  Fizyczny  opis  tych  prądów 
jest  bardzo  złożony,  ponieważ  wraz  z przepływem  wód 
zmieniają  się  gradienty  gęstości  (woda  napływająca 
ma  często  inną  temperaturę  i zasolenie). 

W warunkach  naturalnych  prądy  dryfowe  i prądy 
gradientowe  przenikają  się  i nakładają  wzajemnie, 
powodując  wzrost  lub  osłabienie  wypadkowego  prze- 
pływu wód. 

W górnych  warstwach  akwenu  z reguły  mamy  do 
czynienia  z prądami  mieszanymi : dryfowymi  i gradien- 
towymi geostroficznymi  (rys.  19).  Poniżej  warstwy 
Ekmana  przepływ  ma  charakter  prądów  gradiento- 
wych geostroficznych,  a jeszcze  niżej  — gradientowych 
niegeostroficznych. 

Jeżeli  w akwenie  morskim  występuje  wewnętrzna 
powierzchnia  skoku  gęstości  (rys.  20),  co  się  często 
zdarza,  to  przez  pewien  stosunkowo  krótki  czas  prze- 
pływy dryfowe  są  wzbudzane  w obu  warstwach. 

Układ  taki  nazywamy  barotropowym.  Po  pewnym 
czasie  różnice  ciśnień  wywołane  spiętrzeniem  dryfo- 
wym  w górnej  warstwie  zostają  wyrównane  w dolnej 
warstwie  i dryfowy  przepływ  mas  wodnych  odbywa 
się  wyłącznie  w warstwie  górnej.  Powierzchnia  skoku 
gęstości  zmienia  przy  tym  swoje  położenie  na  prze- 
ciwstawne. Układ  taki  nazywamy  baroklinowym. 

Przy  długotrwałym  działaniu  wiatru  mamy  do  czynie- 
nia prawie  wyłącznie  z układami  baroklinowymi. 

Zmiany  prędkości  pola  wiatru  w okresach  krótszych 
od  godziny  tworzyć  będą  układy  barotropowe. 

W okresach  zmienności  od  godziny  do  doby  mamy 
do  czynienia  z układami  mieszanymi.  Okresom  zbli- 
żonym do  okresu  tzw.  doby  wahadłowej  towarzyszą 
zawsze  układy  baroki inowe,  a w okresach  większych 
od  1 doby  a mniejszych  od  7 dób  akwen  reaguje  znów 
jak  ośrodek  jednorodny. 


b) 

Rys.  20.  Schemat  układów  : a)  barotropowego  i b)  baroklinowego 
w uwarstwionym  oceanie 
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Rys.  21.  Schemat  głównych  układów  cyrkulacyjnych  wód  w południkowym  przekroju  środkowej  części  Oceanu  Atlantyckiego 
(wg  Defanta) 
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Rys. 22.  Rozkład  prądów  powierzchniowych  w oceanie  światowym  w miesiącach  luty-marzec  (wg  Sverdrupa).  Strzałki  oznaczają  wektory  prędkości 


wielko-  Postępowy  ruch  mas  wodnych  w wielkich  zbiorni- 
skalowa  kach  oceanicznych  jest  niewspółmiernie  bardziej 
cyrkulacja  złożony  niż  prądy  w akwenach  jednorodnych.  Istnie- 
nie dwóch  biegunów  zimna  i związany  z tym  niejedno- 
rodny rozkład  gęstości  wód  jest  czynnikiem  wzbu- 
dzającym cyrkulację  mas  wodnych  i zjawiska  termo- 
halinowej  dyfuzji  na  wielką  skalę,  w pionowej  płasz- 
czyźnie południkowej  (rys.  21).  Z kolei  zmienność 
siły  Coriolisa  ze  zmianą  szerokości  geograficznej 
oraz  oddziaływanie  wielkoskalowych  poziomych 
układów  cyrkulacyjnych  atmosfery  w warstwie  przy- 
wodnej  wywołują  obszerne  zamknięte  układy  cyrku- 
lacyjne  oraz  intensyfikują  przepływy  mas  wodnych 
przy  wschodnich  brzegach  kontynentów  półkuli  pół- 
nocnej. Na  rys.  22  uwidoczniony  jest  przykładowy 
rozkład  prądów  powierzchniowych  w oceanie  świato- 
wym. Widoczna  jest  na  nim  wyraźna  intensyfikacja 
przepływu  w pobliżu  wschodnich  brzegów  kontynen- 
talnych półkuli  północnej  (Golfsztrom,  Kuro-siwo, 
1-2  m/s),  strefy  silnych  prądów  podzwrotnikowych 
oraz  dwa  równoległe  układy  cyrkulacyjne:  jeden  na 
półkuli  północnej,  gdzie  ruch  mas  wodnych  skiero- 
wany jest  zgodnie  z ruchem  wskazówek  zegara,  i drugi 
na  półkuli  południowej  o orientacji  przeciwnej. 


WSetody  badania  morskich  procesów 
dynamicznych 

Badanie  praw  rządzących  ruchem  mas  wodnych  oraz 
różnorodnymi  jego  osobliwościami  w morzach  i ocea- 
nach realizowane  jest  współcześnie  metodami  empi- 
rycznego i matematycznego  modelowania  przy  wy- 
korzystaniu znajomości  równań  hydrodynamiki  (mo- 
dele hydrodynamiczne),  oraz  zasad  teorii  podobień- 
stwa, statystyki  matematycznej  i teorii  funkcji  loso- 
wych (modele  stochastyczne). 

modelowanie  Badania  na  modelach  hydrodynamicznych  (teore- 
hydro-  tyczne  i empiryczne)  mogą  być  prowadzone  w dwóch 
dynamiczne  układach  analitycznych:  w układzie  analizy  wędrow- 
nej (współrzędne  Lagrange’a)  opisującej  w czasie 
i przestrzeni  ruch  konkretnego,  ciągle  tego  samego 
elementu  wody  oraz  w’  układzie  analizy  lokalnej 
(współrzędne  Eulera)  opisującej  zmiany  w czasie 
charakterystyk  ruchu  różnych  elementów  w wybranym 
stałym  punkcie. 

Modelowanie  empiryczne  polega  na  hydraulicznym 
odwzorowaniu  w zmniejszonej  skali,  całego  zbiornika 
morskiego,  lub  jego  wycinka,  oraz  symulowaniu  w ta- 
kim modelowym  akwenie  (ii.  199,  tabl.  53)  czynników 
wzbudzających  ruch  masy  wodnej,  zgodnie  z zasadami 
teorii  podobieństwa.  Badania  prowadzone  tą  metodą 
dotyczą  przeważnie  rozpoznawania  czasowo-prze- 
strzennych  zmian  takich  charakterystyk  jak  fluktuacja 
położenia  swobodnej  powierzchni  wód,  stany  i zmien- 
ność ciśnień  hydrodynamicznych,  prędkości,  przy- 
spieszeń, drogi  ruchu  elementów  wody,  linii  prądu 
oraz  różnorodnych  charakterystyk  pochodnych.  Za- 
rejestrowane za  pośrednictwem  specjalnej  aparatury 
pomiarowej  wartości  bezwzględne  tych  charaktery- 
styk poddaje  się  różnorodnej  analizie,  umożliwiającej 
rozpoznanie  praw  rządzących  przebiegiem  badanego 
procesu  hydrodynamicznego. 

Modelowanie  matematyczne  polega  na  numerycz- 
nym lub  analitycznym  odwzorowaniu  procesu,  w skali 
1 :1,  w oparciu  o hydrodynamiczne  równania  ruchu. 
W modelowaniu  tym  przyjmuje  się  pewne  warunki 
początkowe  i warunki  brzegowe,  określające  a priori 
charakterystykę  procesu  w momencie  rozpoczęcia 
badań  (obserwacji  procesu)  oraz  jego  stanu  na  gra- 
nicznych powierzchniach  morskiego  akwenu  (po- 
wierzchnia swobodna  wód,  dno  i brzegi  morskiego 
zbiornika).  Ponadto  przyjmuje  się  szereg  założeń 
upraszczających,  jak  np.  że  woda  jest  nieściśliwa  i nie- 
lepka,  a wektorowe  pole  prędkości  ruchu  elementów 
wody  jest  polem  potencjalnym. 

Rejestrując  bezpośrednio  w morzu  (w  stanie  na- 
turalnym) czasowe  i przestrzenne  zmiany  różnorod- 


nych parametrów  ruchu  masy  wodnej  otrzymujemy 
dane  opisujące  własności  empirycznej  funkcji  odwzo- 
rowującej określoną  charakterystykę  ruchu  (kinema- 
tyczną lub  dynamiczną) zmienną  w czasie  i przestrzeni. 
Te  funkcje  empiryczne  mają  z reguły  charakter  funk- 
cji losowych,  których  właśności  mogą  być  opisane 
metodami  opartymi  na  teorii  prawdopodobieństwa 
i statystyce  matematycznej.  Charakterystyki  morskich 
procesów  hydrodynamicznych  mają  w znacznej  więk- 
szości rozkład  normalny  funkcji  gęstości  prawdopo- 
dobieństwa oraz  taką  własność,  że  operacje  uśred- 
niania w zespole  realizacji  funkcji  losowej  mogą 
być  zastąpione  operacją  uśredniania  w jednej,  do- 
statecznej długości  realizacji  czasowej  lub  przestrzen- 
nej. Modelowanie  stochastyczne  tego  rodzaju  proce- 
sów może  być  realizowane  za  pośrednictwem  czterech 
charakterystyk:  wartości  przeciętnej,  charakteryzu- 
jącej najbardziej  prawdopodobną  wartość  danego  pa- 
rametru (np.  średnią  prędkość  prądu,  średnią  wyso- 
kość falowania),  wariancji  charakteryzującej  inten- 
sywność fluktuacji  wartości  chwilowych  względem 
średniej  (np.  pulsacje  prędkości  ruchu  elementów 
wody,  chwilowe  amplitudy  falowania  wiatrowego), 
funkcji  korelacji  charakteryzującej  związek  między 
chwilowymi  wartościami  danej  charakterystyki  lub 
wartościami  dwóch  dowolnych,  różnych  charaktery- 
styk oraz  funkcji  widmowej  gęstości  mocy  pulsacji 
procesu,  charakteryzującej  energię  falowania  lub  moc 
fluktuacji  dowolnej  charakterystyki.  Modelowanie 
stochastyczne  może  być  realizowane  również  w opar- 
ciu o teoretyczną  postać  przyjętej  a priori  funkcji  lo- 
sowej. 

Często  stosowaną  metodą  badania  morskich  pro- 
cesów hydrodynamicznych  jest  modelowanie  deter- 
ministyczno-stochastyczne.  Przeważnie  modele  takie 
uzyskuje  się  przez  wprowadzenie  do  hydrodynamicz- 
nych równań  ruchu  warunków  brzegowych  w postaci 
funkcji  losowej  lub  jej  statystycznych,  lub  stocha- 
stycznych charakterystyk. 

Matematyczne  modelowanie  (hydrodynamiczne 
i stochastyczne)  oraz  system  badań  empirycznych 
prowadzonych  na  statkach,  bojach  oceanograficznych 
i różnorodnych  stacjach  autonomicznych  (il.  197, 
tabl.  52),  stanowią  dziś  główne  źródło  informacji 

0 prawach  rządzących  złożonym,  różnowymiarowym 

1 wielorodzajowym  ruchem  mas  wodnych  w morzach 
i oceanach. 


modelowanie 

stocha- 

styczne 


modelowanie 

determine- 

styczno- 

stochastycz- 

ne 


Praktyczne  problemy  dynamiki  morza 

Ruch  mas  wodnych  w morzach  i oceanach  jest  zja- 
wiskiem ważnym  dla  technicznej  i gospodarczej  dzia- 
łalności człowieka.  Niemal  każde  przedsięwzięcie 
techniczne  w przybrzeżnej  strefie  morza  uzależnione 
jest  od  intensywności  i zasięgu  tych  procesów  hydro- 
dynamicznych. Budowle  osłonowe  nowoczesnych  por- 
tów morskich,  autonomiczne  stanowiska  przeładun- 
kowe i morskie  szyby  wiertnicze  w akwenie  odsłonię- 
tym, elektrownie  pływowe,  urządzenia  dla  zrzutu 
i poboru  wód  morskich  i tym  podobne  inwestycje 
techniczne  uwarunkowane  są  zawsze  zakresem  zmien- 
ności stanu  wód  i dynamicznym  oddziaływaniem  fa- 
lowania morskiego.  Przenikające  do  wnętrza  portu  fale 
wiatrowe  są  czynnikami  generującymi  wzmożone 
drgania  swobodnej  powierzchni  portowego  akwenu, 
które  utrudniają  lub  wręcz  uniemożliwiają  przeładun- 
kową działalność  w porcie.  Działanie  fal  wiatrowych  działanie 
jest  często  przyczyną  naruszania  stateczności  budowli  niszczące 
hydrotechnicznej,  stałego  niszczenia  naturalnych  brze- 
gów morskich  i konstrukcji  ochronnych  (il.  200, 
tabl.  53)  oraz  zapiaszczenia  torów  i kanałów  żeglugo- 
wych. Groźne  powodzie  morskie,  wywołane  falą 
tsunami  i silnym  spiętrzeniem  sztormowym,  są  dla 
nawiedzanych  przez  nie  krajów  (np.  Japonia  lub  Ha- 
waje) istną  plagą,  pochłaniają  znaczne  środki  material- 
ne, a przede  wszystkim  narażają  życie  ludzkie. 

Możliwości  wykorzystania  mechanicznej  energii 
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morza  do  praktycznych  potrzeb  człowieka  związane 
są  dziś  głównie  z pływami  oraz  prądami  morskimi. 
Wywołane  nimi  kilkunastometrowej  wysokości  spię- 
trzenia wód  w przybrzeżnej  strefie  morza  mogą  służyć 
do  produkcji  energii  elektrycznej  (elektrownie  pływo- 
we). Astronomiczne  pływy  w fazie  przepływu  umożli- 
wiają statkom  morskim  żeglugę  w głąb  lądu  (np.  do 
Londynu).  Prądy  morskie  i termohalinowa  cyrkulacja 
wód  to  w głównej  mierze  mechanizmy  przenoszenia 
zawartych  w wodzie  substancji  biernych  (sole,  zawie- 
siny, zanieczyszczenia).  Każdemu  rejonowi  odpływu 
wód  powierzchniowych  towarzyszy  skierowany  ku 
górze  napływ  wód  głębinowych,  przenoszących  sub- 
stancje biogenne.  W konsekwencji  rejony  te  charakte- 
ryzuje wzmożona  produkcja  pożywienia  dla  ryb  i wy- 
soki stan  zarybienia. 

Ponadto  konieczność  intensyfikacji  lądowych  źró- 
deł surowców  żywnościowych  stawia  dziś  przed  nauką 
i praktyką  zadanie  zwiększenia  dokładności  prognoz 
meteorologicznych  i klimatycznych  z dowolnym  dys- 
tansem wyprzedzenia  w czasie.  Dziś  wiemy  już,  że 
ziemskie  lądy  wywierają  na  zjawiska  meteorologiczne 
i klimatyczne  wpływ  niewielki  w porównaniu  z wpły- 
wem mórz  i oceanów.  Z tych  względów  dokładne 
poznanie  różnowymiarowych  procesów  wzajemnego 
oddziaływania  morza  i atmosfery  oraz  związanych 
z nimi  zjawisk  hydrodynamicznych,  nabiera  z roku 
na  rok  coraz  większego  znaczenia. 

Turbulentne  zjawiska  dyfuzji  i mieszania  wód 
odgrywają  dziś  w dobie  intensywnego  zanieczyszcze- 
nia wód  morskich,  które  towarzyszy  współczesnej 
cywilizacji  i pociąga  za  sobą  ekologiczne  zmiany 
środowiska,  rolę  naturalnego  mechanizmu  oczyszcza- 
nia wód.  Dzięki  tym  procesom  do  dziś  jeszcze  odpro- 
wadza się  do  morza  różnego  rodzaju  ścieki  i odpady 
bez  katastrofalnie  negatywnych  dla  siebie  skutków 


Optyka  morza 

Jerzy  Dera 

Optyka  morza  zajmuje  się  badaniem  rozchodzenia 
się  i oddziaływania  światła  w morzu,  a szczególnie 
światła  słonecznego,  niosącego  energię,  która  pod- 
trzymuje życie  wszystkich  organizmów  morskich 
oraz  procesy  termodynamiczne  decydujące  o klimacie 
ziemskim.  Około  98%  energii  wchodzącego  do  morza 
promieniowania  słonecznego  (głównie  o długościach 
fal  X < 4 pm)  pochłania  woda  morska,  zamieniając 
je  na  ciepło.  Energia  ta,  dostarczana  nierównomiernie 
masom  wodnym  w przestrzeni  oceanu,  podtrzymuje 
potężne,  międzykontynentalne  cyrkulacje  tych  mas 
i powoduje  wyparowywanie  z powierzchni  oceanu 
do  atmosfery  średnio  ok.  metrowej  warstwy  wody 
rocznie  oraz  wypromieniowywanie  olbrzymich  ilości 
ciepła.  Pociąga  to  za  sobą  również  cyrkulacje  mas 
powietrza  wraź  z parą  wodną,  odbywające  się  czasem 
w sposób  bardzo  burzliwy,  w postaci  huraganów. 
Masy  wodne  i powietrze,  niosące  w ten  sposób  ciepło 
z mocno  nasłonecznionych  stref  gorących  ku  biegu- 
nom, wyrównują  i łagodzą  klimat  ziemski  oraz  pod- 
trzymują odżywczy  obieg  wody  w przyrodzie. 

Nie  mniej  ważną  rolę  w kształtowaniu  środowiska 
życia  na  Ziemi  odgrywa  pozostała  drobna  część 
energii  światła  słonecznego  w morzu.  Zaledwie  ułamek 
procenta  wchodzącej  do  morza  energii  zostaje  zuży- 
wany na  fotosyntezę  materii  organicznej  w komór- 
fotosynteza  kach  fitoplanktonu.  Ta  produkowana  z wody,  dwu- 
w morzu  tlenku  węgla  i zawartych  w wodzie  pierwiastków 
chemicznych  materia  organiczna  (węglowodany, 
tłuszcze,  białka)  jest  pierwszym  ogniwem  łańcucha 
pokarmowego  wszystkich  organizmów  morskich  (stąd 
fotosyntezę  i towarzyszące  jej  procesy  wzrostu  ko- 
mórek zwiemy  biologiczną  produkcją  pierwotną). 
Produktem  reakcji  fotosyntezy  jest  także  wolny  tlen, 
który  służy  do  oddychania  roślinom  i zwierzętom 
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morskim  oraz  do  utleniania  nie  zużywanych  i zanie- 
czyszczających wodę  substancji  organicznych.  Znacz- 
na część  produkowanego  w procesie  fotosyntezy  wol- 
nego tlenu  ulatnia  się  z morza  do  atmosfery,  dzięki 
czemu  60-90%  (wg  różnych  oszacowań)  wolnego 
tlenu  w atmosferze  ziemskiej  pochodzi  z morza. 
Oprócz  fotosyntezy  materii  organicznej,  pod  wpły- 
wem światła  w morzu  zachodzi  wiele  innych  ważnych, 
mało  jeszcze  zbadanych  reakcji  fotochemicznych, 
prowadzących  np.  do  rozpadu  niektórych  szkodli- 
wych związków  organicznych,  do  wydzielania  jodu 
czy  zabijania  niektórych  gatunków  bakterii. 

Najczystsze  morza  świata  mają  w świetle  słonecz- 
nym wyraźny  ciemnobłękitny  kolor;  jest  to  skutek 
silnego  rozpraszania  fioletu  na  cząsteczkach  wody. 
Ze  wzrostem  głębokości  w morzu  energia  światła 
dziennego  znacznie  maleje  wskutek  jego  rozpraszania 
i absorpcji  przez  wodę,  oraz  przez  zawarte  w niej 
zawiesiny  i rozpuszczone  substancje  organiczne,  któ- 
rych ilość  zależy  od  stopnia  zanieczyszczenia  danego 
akwenu.  Zawarta  w wodzie  sól  morska  osłabia  światło 
widzialne  w minimalnym  stopniu.  Pomimo  to  nawet 
w najczystszych  i najbardziej  nasłonecznionych  mo- 
rzach (np.  w Morzu  Sargassowym  lub  we  wschodniej 
części  Morza  Śródziemnego)  na  głębokości  1000  m 
panuje  ciemność.  Nie  jest  to  jednak  ciemność  abso- 
lutna, ponieważ  wiele  organizmów  morskich  posiada 
zdolność  świecenia,  zwanego  bioluminescencją. 

Wraz  z głębokością  zmienia  się  w morzu  skład 
widmowy  światła,  stopień  jego  rozproszenia,  stopień 
polaryzacji,  fluktuacje  natężenia,  wywołane  falowa- 
niem powierzchni  morza,  i inne  właściwości,  do  któ- 
rych przystosowują  się  rośliny  i zwierzęta  żyjące  na 
różnych  głębokościach.  I tak  np.  barwniki  w komór- 
kach fitoplanktonu  pochłaniające  światło  potrzebne 
do  fotosyntezy  są  tak  dobierane  przez  naturę,  że 
maksymalnie  wykorzystują  całe  widmo  światła  do- 
stępne na  danej  głębokości.  Nie  jest  też  przypadkowe 
zabarwienie  ryb;  służy  im  ono  przede  wszystkim  do 
maskowania  się  w środowisku  wodnym  (jasne  pod- 
brzusze ryby  jest  zwykle  słabo  widoczne  z dołu,  na 
tle  jasnej  powierzchni  morza,  ciemny  zaś  grzbiet 
ryby  jest  źle  widoczny  z góry,  na  tle  ciemnej  toni  wod- 
nej; czerwony  kolor  ryb  głębinowych  jest  zupełnie 
niewidoczny  w pozbawionym  czerwieni  świetle  na- 
turalnym na  dużych  głębokościach,  a to  wskutek 
silnego  pochłaniania  czerwieni  przez  molekuły  wody). 
Skomplikowane  są  także  organy  wzroku  niektórych 
gatunków  zwierząt  morskich;  dzięki  temu  są  one 
zdolne  rozróżniać  wiele  cech  światła,  jak  barwa, 
kątowy  rozkład  natężeń,  czy  kierunek  polaryzacji. 
Różne  cechy  podwodnego  światła  są  wykorzysty- 
wane przez  ryby  i inne  zwierzęta  morskie  do  ich 
orientacji  podczas  wędrówek  w przestrzeni  wodnej, 
pozbawionej  często  innych  znaków  szczególnych; 
wiele  organizmów  wędruje  wraz  z dobowymi  zmiana- 
mi oświetlenia,  przemieszczając  się  na  dużą  głębokość 
w dzień,  a ku  powierzchni  — w nocy. 

Zasięg  widoczności  przedmiotów  w wodzie,  za- 
równo gołym  okiem,  jak  i za  pomocą  przyrządów 
optycznych  lub  kamer  telewizyjnych,  nie  przekracza 
100  m nawet  w najczystszych  morzach,  a na  ogół 
jest  dużo  mniejszy  (w  Bałtyku  np.  od  kilku  do  kilku- 
nastu metrów). 


Badania  rozchodzenia  się  światła  w morzu 

Ten  rodzaj  badań  rozpoczęto  pod  koniec  XIX  w.; 
używano  przy  tym  klisz  fotograficznych  naświetla- 
nych naturalnym  światłem  panującym  na  różnych 
głębokościach.  Już  wówczas  stwierdzono  znaczne 
różnice  w poszczególnych  akwenach  morskich.  Stop- 
niowe udoskonalanie  fotograficznych  metod  badań 
doprowadziło  w 1922  r.  znanego  oceanologa  duńskie- 
go, M.  Knudsena,  do  zastosowania  spektrografu.  Za 
pomocą  spektrografu  stwierdzono,  że  nie  tylko  na- 
tężenie, ale  i widmo  światła  dziennego  zmienia  się 
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wraz  z głębokością  w morzu  i jest  bardzo  różne  w róż- 
nych morzach  (rys.  23).  W tym  samym  czasie  zasto- 
sowano pierwsze  detektory  fotoelektryczne.  Spowo- 
dowało to  przełom  w badaniach,  gdyż  pozwoliło  na 
zdalne  dokonywanie  pomiarów  światła  w głębi  morza 
za  pomocą  przyrządu  opuszczanego  z burty  statku, 
a połączonego  kablem  z miernikiem  prądu  fotoelek- 
trycznego  znajdującym  się  na  pokładzie  statku. 
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Rys.  23.  Oświetlenie  w morzu:  a)  rozkład  widmowy  oświetlenia 
dziennego  (odgórnego)  na  powierzchni  morza  i na  różnych  jego 
głębokościach  (w  jednostkach  względnych)  wg  N.  G.  Jerlova 
(1968  r.),  b)  przykłady  osłabiania  oświetlenia  odgórnego  z głę- 
bokością w różnych  morzach  dla  fal  długości  ok.  530  nm  (światło 
zielone) 

Kolejny  znaczny  skok  w postępie  badań  nastąpił 
dopiero  w latach  sześćdziesiątych  naszego  stulecia, 
kiedy  to  powszechnie  wprowadzono  do  pomiarów 
światła  w morzu  czułe  fotopowielacze  i filtry  inter- 
ferencyjne, pozwalające  precyzyjnie  wydzielić  z wid- 
ma światła  dowolne,  wąskie  pasmo  badanych  fal 
świetlnych.  Postęp  ten  wiąże  się  oczywiście  z ogólnym 
rozwojem  fizyki  i techniki  badań  naukowych  oraz 
z nowymi,  doskonalszymi  metodami  matematycznej 
analizy  procesów  fizycznych  za  pomocą  komputerów. 

Współczesne  urządzenia  do  badań  optycznych 
w morzu  działają  prawie  wyłącznie  na  zasadzie  wy- 
korzystania zjawiska  fotoelektrycznego  w takich  prze- 
twornikach jak  fotopowielacze,  fotokomórki  próż- 
niowe, ogniwa  selenowe  i fotooporniki  półprzewodni- 
kowe. Przetwornik  umieszcza  się  w wodoszczelnej 
morskie  zanurzanej  części  przyrządu,  zwanej  sondą  optyczną. 

sondy  Sonda  jest  ponadto  wyposażona  w precyzyjny  układ 
optyczne  optyczny,  w skład  którego  wchodzi  wodoszczelne 
okienko  (wejście  dla  światła),  układ  filtrów  optycz- 
nych lub  monochromator  oraz  odpowiedni  układ 
soczewek  i przesłon  (zależnie  od  potrzeb  i przezna- 
czenia przyrządu).  Na  ogół  niezbędnym  elementem 
sondy  optycznej  jest  też  precyzyjny  wzmacniacz  linio- 
wy, który  wzmacnia  prąd  fotoelektryczny  z przetwor- 
nika przekazywany  za  pośrednictwem  kabla  do  od- 
biornika na  pokładzie  statku.  Niektóre  przyrządy 
optyczne,  służące  np.  do  pomiarów  rozpraszania 
światła  lub  osłabiania  wiązki  światła,  wymagają  także 


wyposażenia  sondy  we  własne  źródło  światła.  Jest 
to  najczęściej  żarówka  punktowa  z kolimatorem 
optycznym  lub  laser  umieszczony  na  konstrukcji 
nośnej  sondy  w oddzielnym,  wodoszczelnym  pojem- 
niku. Bardziej  złożone  urządzenia  mają  ponadto 
zdalny  elektromechaniczny  zmieniacz  filtrów  lub 
układ  sterowania  monochromatora  (wybierania  żą- 
danej długości  fali),  urządzenie  do  zmiany  zakresu 
czułości  przyrządu,  urządzenie  do  zamiany  prądu  fo- 
toelektrycznego w impulsy  elektryczne,  które  mogą 
być  przesyłane  kablem  o mniejszej  liczbie  przewodów, 
a nawet  poprzez  wodę  w postaci  impulsów  dźwięko- 
wych. Gdy  w sondzie  znajduje  się  fotopowielacz, 
musi  tam  również  być  zasilacz  wysokiego  napięcia, 
regulowany  napięciem  niskim  (z  akumulatora)  po- 
przez kabel  z pokładu  statku.  Przy  wnikliwych  po- 
miarach rozpraszania  światła  konieczny  jest  także 
elektromechaniczny  układ  do  zmiany  i zdalnego 
odczytu  kąta  położenia  odbiornika  w stosunku  do 
rozpraszanej  wiązki  światła.  W badaniach  dopływu 
strumieni  światła  z różnych  kierunków  w przestrzeni 
wodnej  sonda  musi  być  ponadto  wyposażona  w kie- 
runkowy odbiornik  światła  oraz  skomplikowany 
i zdalnie  regulowany  układ  śrub  napędowych  i sterów, 
aby  wisząc  na  linie  na  dowolnej  głębokości  w morzu, 
ustawiała  się  w żądanym  i kontrolowanym  kierunku. 

Zależnie  od  budowy  i przeznaczenia  rozróżnia  się 
sondy  zw-ane  przezroczomierzami,  miernikami  pod- 
wodnego oświetlenia,  miernikami  rozpraszania  świat- 
ła, miernikami  radiacji  itp.  (rys.  24  i il.  201,  202  z tabl. 

53). 

Drugą  część  aparatury  pomiarowej  stanowią  zwyk-  pokładowa 
le  urządzenia  zasilające,  sterujące  i rejestrujące,  in-  aparatura 
stalowane  na  pokładzie  statku  i połączone  z sondą  rejestrująca 
wodoszczelnym  kablem  elektrycznym.  Ze  względu 
na  statystyczne  fluktuacje  mierzonych  wielkości 
i wynikającą  stąd  potrzebę  wykonywania  dużych 
serii  pomiarów,  sygnały  z sond  optycznych  coraz 
rzadziej  odczytuje  się  mikroamperomierzem.  Używa 
się  raczej  miliwoltomierzy  z automatycznym  zapisem 
analogowym  na  taśmie  papierowej,  a w najnowszych 
urządzeniach  — perforatorów  lub  rejestratorów  mag- 
netycznych rejestrujących  sygnały  w postaci  dostoso- 
wanej do  komputera.  Najnowocześniejsze  statki 
badawcze,  np.  polski  statek  badawczy  „Profesor 
Siedlecki'*,  wyposażone  są  w komputer,  który  może 
bezpośrednio  odbierać  sygnały  z sond  pomiarowych 
i automatycznie  obliczać  żądane  wielkości,  takie  jak 
współczynniki  absorpcji  i rozpraszania  światła, 
współczynniki  osłabiania  oświetlenia  z głębokością, 
a także  korelacje  tych  wielkości  z innymi  wielkościami 
opisującymi  stan  badanego  środowiska  wodnego. 

Tak  dalece  skomplikowana  automatyzacja  jest  jednak 
opłacalna  tylko  przy  masowych  pomiarach  prze- 
strzennych. 

Wszystkie  morskie  urządzenia  pomiarowe,  zarów- 
no pracujące  pod  wodą,  jak  i nad  wodą,  muszą  być 
szczególnie  odporne  na  działanie  niszczących  czyn- 
ników żywiołu  morskiego  (korozję,  przyspieszenia 
wstrząsy  i wibracje,  ciśnienie  hydrostatyczne,  sól 
morska  itp.). 

Pomimo  tych  znacznych  trudności  technicznych, 
praktycznie  wszystkie  właściwości  optyczne  wody 
morskiej  i mas  wodnych  w morzu  badane  są  zdalnie 
in  situ  (w  naturalnych  warunkach  w danym  miejscu 
toni  wodnej),  a nie  w laboratorium  na  próbkach  wody. 

Jest  to  konieczność  podyktowana  szybkimi  zmianami 
zachodzącymi  w próbce  wody  morskiej  po  jej  za- 
czerpnięciu, spowodowanymi  działaniem  bakterii 
i planktonu,  obumieraniem  komórek  planktonu, 
koagulacją  i opadaniem  zawiesin,  zmianami  chemicz- 
nymi pod  wpływem  zmian  oświetlenia,  ciśnienia, 
temperatury  itp.  Niektóre  trudniejsze  pomiary  mo- 
żna wykonać  w laboratorium  na  pokładzie  statku 
natychmiast  po  zaczerpnięciu  próbki  wody  z morza. 

Postęp  w rozwoju  metod  i techniki  optycznych  osiągnięcia 
badań  morza  umożliwił  rozpoznanie  większości  skom-  naukowe 
plikowanych  procesów  optycznych  w morzu.  Zbada- 
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no  absorpcję  i rozpraszanie  energii  światła  słonecz- 
nego w przestrzeni  wodnej,  powstawanie  specyficz- 
nych pól  podwodnego  światła  dziennego,  o różnych 
właściwościach  wfdmowych  w różnych  wodach  i w 
różnych  warunkach  zewnętrznych  (zależnych  np.  od 
położenia  Słońca  na  niebie,  od  zachmurzenia,  falo- 
wania powierzchni  morza),  zbadano  selektywne  od- 
działywanie różnych  składników  wody  morskiej  ze 
światłem,  polaryzację  podwodnego  światła,  przeno- 
szenie informacji  w postaci  optycznego  obrazu  przed- 
miotów zanurzonych  w wodzie  (widoczność  pod- 
wodna, zastosowanie  kamer  telewizyjnych  i fotogra- 


a)  L 


ficznych),  obraz  i kolor  morza  widoczny  z przestrzeni 
nadmorskiej  (interpretacja  zdjęć  lotniczych  i satelitar- 
nych morza)  i wiele  innych. 

Obecnie  trwają  intensywne  badania  i poszukiwania 
ilościowych  związków  między  właściwościami  skład- 
ników wody  morskiej  i rozmieszczeniem  tych  skład- 
ników w oceanach  a optycznymi  właściwościami  mo- 
rza oraz  uzależnieniem  tych  właściwości  od  innych 
procesów  przyrodniczych  zachodzących  w środo- 
wisku morskim.  Opracowuje  się  modele  matematyczne 
tych  zjawisk,  tak  by  na  podstawie  mniej  licznych 
pomiarów  można  było  przewidywać  przebieg  proce- 
sów optycznych  i ich  wpływ  na  przemiany  energii 
słonecznej  w olbrzymich  przestrzeniach  oceanów. 


promienie  padające  pod  znacznym  kątem  do  osi 
optycznej  (a  >0.5  ) nie  wchodzą  do  odbiornika 

- pole  widzenia 


okienko  optyczne 

filtr  interferencyjny 
kolimator  optyczny 


pole  widzenia 
. w kącie  bryłowym  2/r 

kolektor  Lamberta 
(mleczne  szkło) 


osłona  ogran, czająca 
kat  widzenia  do  2 tz 


przesłony 

przeciwodbiciowe 


obudowa  wodoszczelna 


nasadka  na  okienko  miernika  radiacji 
która  zmienia  go  w miernik  oświetlenia 


odbiornik  światła 
(fotopowieiacz) 


kabel 

doprowadzający 


Rys.  24.  Sondy  optyczne  do  badań  morza:  a)  Schemat  przekroju 
sondy  miernika  radiacji  i oświetlenia  w morzu,  b)  Schemat  kon- 
strukcji sondy  do  pomiarów  współczynnika  osłabiania  światła  w 
morzu  zw.  przezroczomierzcm  morskim,  c)  Schemat  konstrukcji 
miernika,  funkcji  rozpraszania  światła  w morzu,  d)  Schemat  ukła- 
du optycznego  miernika  radiacji  i oświetlenia  tzw.  spektroradio- 
metru  Scrippsa  (od  nazwy  słynnego  Instytutu  Oceanografii  Scripp- 
sa  w Kalifornii)  przeznaczonego  do  bardzo  dokładnych  pomiarów 
widmowych  w morzu.  Na  schemacie  rozróżnić  można  dwa  wejścia 
optyczne  otwierane  alternatywnie  przez  ruchome  zwierciadło  (np. 
dla  światła  badanego  i wzorcowego  lub  dla  radiacji  i oświetlenia), 
dwa  sprzężone  ze  sobą  monochromatory  zbudowane  na  siatkach 
dyfrakcyjnych,  fotopowieiacz  jako  odbiornik  światła  oraz  dodat- 
kowy (przesuwany)  filtr  optyczny  odcinający  ślady  światła  czer- 
wonego przy  pomiarach  w obszarze  krótkofalowej  części  widma. 
Całość  wbudowana  jest  w wodoszczelną  obudowę  i zdalnie  za  po- 
średnictwem kabla  rejestruje  automatycznie  widma  oświetlenia 
lub  radiacji  w morzu  (I.  E.  Tyler,  1965  r.).  e)  Szkic  konstrukcji 
i ustawienia  radiopławy  do  zdalnych  pomiarów  optycznych  w mo- 
rzu zbudowanej  w Zakładzie  Oceanologii  PAN  w Sopocie  w 1971  r. 


konstrukcja  nośna  z zawieszeniem 
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I 

(właściwości 
rzeczywisto 
i i pozorne 


radiacja 


Właściwości  optyczne  morza  rzeczywiste 
i pozorne 


Rzeczywiste  właściwości  optyczne  morza  zależą  wy- 
łącznie od  natury  samej  wody  morskiej  i zawartych 
w niej  składników,  nie  są  zależne  od  zewnętrznych 
warunków  oświetlenia  morza.  Do  rzeczywistych 
właściwości  optycznych  zaiicza  się  współczynnik  zała- 
mania światła  n,  funkcję  rozpraszania  światła  £ opi- 
sującą kątowy  rozkład  rozpraszania,  całkowity 
współczynnik  rozpraszania  światła  ó,  współczynnik 
absorpcji  a i współczynnik  osłabiania  (wiązki)  świa- 
tła c.  Pozorne  właściwości  optyczne  morza  zależą 
zarówno  od  właściwości  rzeczywistych,  czyli  od  natury 
wody  morskiej,  jak  i od  warunków  zewnętrznego 
oświetlenia  morza.  Pozornymi  właściwościami  optycz- 
nymi morza  są  np.:  współczynnik  dyfuzyjnego  osła- 
biania oświetlenia  odgórnego  z głębokością  Ka, 
współczynnik  odbicia  światła  w toni  wodnej  (na  sku- 
tek rozpraszania)  Rd  i kilkanaście  innych. 

Podstawową  wielkością  fotometryczną  jstosowaną 
w optyce  morza  jest  funkcja  radiacyjna,  zwana  w skró- 
cie radiacją  L,  która  opisuje  wartość  strumienia  ener- 
gii światła  F przychodzącego  z dowolnego,  lecz  okre- 
ślonego kierunku  w jednostkowym  kącie  bryłowym 
co  wokół  tego  kierunku  i przypadającego  na  jednostkę 
powierzchni  An  prostopadłej  do  tego  kierunku.  Jeśli 
ten  dowolny  kierunek  oznaczymy  wektorem  jedno- 


stkowym £,  to  w myśl  definicji  i oznaczeń  na  rys.  25 
radiacja 


L(£)  = 


AF(Q 

JAn-Acotf)  * 


0) 


co  zapisuje  się  ściśle  stosując  różniczki: 


L(Z)  = 


d2F(Q 

dAn>cte{£)  * 


da) 





Promieniowanie  słoneczne  wchodzące  do  morza 
przenika  w głąb  toni  wodnej,  ulegając  stopniowemu 
pochłanianiu  przez  składniki  wody  morskiej  oraz 
rozpraszaniu  na  molekułach  wody  i na  licznie  wystę- 
pujących w morzu  zawiesinach.  W przestrzeni  wodnej 
powstaje  w rezultacie  pole  światła  o ciekawych  i zło- 
żonych właściwościach,  które  najdokładniej  można  by 
opisać  zdefiniowaną  wyżej  funkcją  radiacyjną,  gdyż 

zmierzona  lub  obliczona  dla  wszystkich  kierunków  ć, 
funkcja  ta  informuje  po  prostu  o wartościach  liczbo- 
wych strumieni  światła  przychodzących  z tych  wszy- 
stkich kierunków  w badanym  miejscu.  Jeślibyśmy 
znali  wartości  radiacji  ze  wszystkich  kierunków,  w 
każdym  miejscu  toni  wodnej  i w dodatku  dla  wszy- 
stkich długości  fal  światła,  mielibyśmy  pełną  infor- 
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mację  o rozkładzie  energii  światła  i jej  przenoszeniu 
w morzu.  Na  ogół  takiej  informacji  nie  można  uzys- 
kać, gdyż  radiacja  przybiera  w morzu  bardzo  różne 
wartości,  zależne  od  kierunku  i głębokości,  a rozkłady 
przestrzenne  radiacji  są  bardzo  różne  w różnych  ak- 
wenach i zmieniają  się  w zależności  od  pory  roku,  pory 
dnia  i warunków  meteorologicznych.  Często  bada  się 
względne  zmiany  wartości  radiacji  z różnych  kierun- 
ków £ (pod  różnymi  kątami  0 do  pionu)  tylko  w płasz- 
czyźnie padania  promieni  słonecznych,  które  pozwa- 


' wektor 
jednostkowy 
wyznaczający 
kierunek  w prze- 
strzeni wodnej 

£)—  strumień  światła 
kierunku  £ wchodzący 
w kąt  bryłowy 

bryłowy  wokół  _ 
kierunku  £ 


AAn~  składowa  powierzchni  AA 

prostopadła  do  kierunku  £ 


AoĄi) 


kąt 


A - dowolna  powierzchnia  w morzu 


AA—  element  tej  powierzchni  w miejscu  badań 


Rys.  25.  Szkic  wyjaśniający  definicję  radiacji  L(£)  zgodnie  ze 
wzorem 


kątowy 
rozkład 
radiacji 
w morzu 


połę  światła 
asympto- 
tyczne 


detektor 

kierunkowy 


łają  wyznaczyć  tzw.  kątowy  rozkład  radiacji  w tej 
płaszczyźnie.  Rozkład  taki  zawiera  również  wiele 
ścisłych  informacji  o panującym  w morzu  polu 
światła  oraz  o absorpcyjnych  i rozpraszających  wła- 
ściwościach wód,  które  otaczają  badane  miejsce. 

Kątowy  rozkład  radiacji  wykreślony  we  współrzęd- 
nych biegunowych  dla  niedużych  głębokości  jest 
w słoneczne  dni  bardzo  wydłużony  w kierunku,  z któ- 
rego dochodzą  bezpośrednie,  załamane  na  powierz- 
chni morza  promienie  słoneczne  (rys.  26);  jest  przy 
tym  znacznie  bardziej  wydłużony  w wodach  czystych 
niż  w wodach  zmętnionych  — to  wynik  rozpraszania 
światła  we  wszystkich  kierunkach  w każdym  miejscu 
toni  wodnej,  wskutek  czego  badane  miejsce  jest 
oświetlane  również  rozproszonym  światłem  ze  wszy- 
stkich kierunków,  lecz  z każdego  kierunku  w stopniu 
zależnym  od  właściwości  rozpraszających  wody  mor- 
skiej. W miarę  wzrostu  głębokości  procentowy  wkład 
światła  rozproszonego  i dyfundującego  ze  wszystkich 
kierunków  rośnie  w stosunku  do  osłabianych  wraz 
z głębokością  bezpośrednich  promieni  słonecznych 
i z tej  przyczyny  rozkład  kątówy  radiacji  staje  się 
na  wykresie  coraz  bardziej  zaokrąglony,  a jego  mak- 
simum zbliża  się  do  kierunku  pionowego  (zenitałne- 
go).  Na  pewnej  głębokości  (np.  100,  200  lub  800  m — 
zależnie  od  przezroczystości  wód)  rozkład  kątowy 
radiacji  staje  się  symetryczny  względem  pionu,  niezale- 
żnie od  położenia  słońca  na  niebie.  Pole  światła  poni- 
żej tej  głębokości  nazywa  się  polem  asymptotycznym 
lub  granicznym.  Cechują  je  swoiste  prawa,  np.  dalsze 
osłabianie  radiacji  lub  oświetlenia  z głębokością  ma 
przebieg  idealnie  wykładniczy,  jeśli  koncentracja 
zawiesin  i składników  wody  morskiej  w otaczającej 
przestrzeni  wodnej  jest  stała.  Światło  rozproszone 
jest  też  w znacznym  stopniu  spolaryzowane. 

Pomiary  kątowych  rozkładów  radiacji  w morzu 
wymagają  właśnie  tych  wspomnianych  wyżej,  naj- 
bardziej skomplikowanych  urządzeń,  tj.  detektorów 
kierunkowych  zaopatrzonych  w śruby  napędowe  i stery 
(i!.  202,  tabl.  53)  celem  zdalnego  regulowania  ustawie- 
nia mierników  radiacji  w przestrzeni  wodnej.  Jest  to 
bardzo  złożone  i rzadko  spotykane  urządzenie,  lecz 


zmierzone  za  jego  pomocą  rozkłady  radiacji  pozwa- 
lają wyznaczyć  wszystkie  inne  właściwości  optyczne 
badanego  obszaru  morza. 

W ostatnich  latach  do  pomiarów  kątowych  roz- 
kładów radiacji  próbuje  się  zastosować  metodę  foto- 
graficzną z wykorzystaniem  specjalnego  obiektywu, 
zwanego  rybim  okiem,  o kącie  widzenia  2n  (bryło- 
wym). Wykorzystanie  tej  metody  wniesie  zasadniczy 
postęp  do  pomiarów,  gdyż  pozwoli  na  jednej  foto- 
grafii odwzorować  rozkład  kątowy  radiacji  z całej 
półsfery.  Ciągle  jednak  istnieje  problem  dokładności 
takiego  odwzorowania  z uwzględnieniem  widmowych 
właściwości  podwodnego  światła.  Można  by  oczy- 
wiście zamiast  kliszy  fotograficznej  umieścić  pod  ta- 
kim obiektywem  odpowiedni  zestaw  detektorów  foto- 
elektrycznych,  ale  to  by  znacznie  skomplikowało 
konstrukcję  i działanie  całego  urządzenia. 

W teoretycznym  opisie  właściwości  optycznych 
morza  przyjmuje  się,  najczęściej  z dobrym  przybli- 
żeniem, model  morza  poziomo  uwarstwionego,  tzn. 
wychodzi  się  z założenia,  że  wielkości  optyczne 
w płaszczyźnie  poziomej  na  dowolnej  głębokości  są 
stałe,  a zmieniają  się  jedynie  z głębokością.  W układzie 
współrzędnych  prostokątnych,  z płaszczyzną  xy 
ustawioną  poziomo  i osią  z skierowaną  pionowo 
w dół,  na  dowolnej  głębokości  składowe  radiacji 

przy  tym  założeniu  są  £*(£)  = Ljś)  = const,  czyli 
radiacja  L(x,  y,  z,  £)  = L(z , £)  jest  tylko  funkcją 

głębokości  i orientacji  wektora  £ w przestrzeni. 

Często  zakłada  się  także,  że  rozkład  przestrzenny 
i kątowy  radiacji  (pole  radiacji)  w morzu  nie  zmienia 
się  w pewnym  okresie  czasu  (jest  stacjonarny  np. 
w ciągu  1 godziny,  podczas  której  niewielkie  są  zmia- 
ny naturalnego  oświetlenia  powierzchni  morza). 
Wówczas  zmiany  przestrzenne  (osłabienie)  radiacji 

L (z,  f)  z kierunku  { na  odcinku  drogi  r opisuje  się  tzw. 


1 00  m Vb 
rjs 

200  m W 
głębokość 
w morzu 

Z ''  2 ” 


Rys.  26.  Szkic  rozkładów  radiacji  w morzu  w płaszczyźnie  pa- 
dania promieni  słonecznych  — w wodach  czystych  (z  lewej)  i w wo- 
dach zmętnionych  (z  prawej).  Przerywana  linia  wyznacza  we 
współrzędnych  biegunowych  wartość  radiacji  (długość  strzałki 

obrazującej  porównanwezo  wartość  radiacji  L(£)  z dowolnego 

kierunku  £ (lub  pod  dowolnym  kątem  0)  w danym  punkcie  prze- 
strzeni wodnej  na  głębokości  z 


obiektyw 
„rybie  oko" 


model 
poziomo 
uwarstwio- 
nego morza 


stacjonarne 
pole  radiacji 
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równanie  równaniem  przenoszenia  energii  promienistej,  uprosz- 
przenoszenia  czonym  do  postaci : 

energii  _ 

promienistej  = -CL(z,Z) 4 L*(z,  ©+  L„(z,  {).  (2) 


W równaniu  tym  dL(z,0  oznacza  nieskończenie  ma- 
łe osłabienie  radiacji  na  nieskończenie  małym  od- 
cinku drogi  dr  (różniczka  dL  po  dr ),  c oznacza  rze- 
czywisty współczynnik  osłabienia  światła,  L*  jest 
tzw.  funkcją  drogową,  która  opisuje  ilość  energii 
światła,  jaka  się  dodaje  do  radiacji  osłabionej  na  jed- 
nostkowym odcinku  drogi  r w wyniku  rozpraszania 
w tym  kierunku  wszystkich  innych  strumieni  światła 
dopływających  z otaczającej  przestrzeni  wodnej, 
wreszcie  L„  jest  tzw.  funkcją  źródłową,  która  opisuje 
zwiększenie  radiacji  na  jednostkowym  odcinku  drogi 
r spowodowane  istnieniem  źródeł  światła  na  tej 
drodze,  np.  świecących  mikroorganizmów,  których 
wpływ  może  być  znaczny  na  dużych  głębokościach 
(poniżej  300  m)  lub  w nocy,  tj.  wówczas,  kiedy  udział 
bioluminescencji  w oświetleniu  toni  wodnej  jest 
znaczny  w porównaniu  z oświetleniem  przez  źródła 
zewnętrzne. 

Jeżeli  wiązkę  światła  biegnącą  w kierunku  f wzdłuż 
drogi  r osłonimy  od  świateł  dochodzących  z innych 
kierunków  (L*  = 0)  i przyjmiemy,  że  nie  ma  w ba- 
danej wodzie  źródeł  światła  (L„  = 0),  to  równanie 
(2)  przybierze  prostą  postać,  którą  można  zapisać 
w skrócie  dL/dr  = -cL  i która  określa  najprostszy 
sposób  wyznaczania  współczynnika  osłabiania  świa- 
tła c.  Scałkowanie  powyższego  równania  różniczko- 
wego wzdłuż  drogi  r daje  rozwiązanie  Lr/L*  = e~er, 
gdzie  L0  jest  wartością  radiacji  wchodzącej  do  war- 
stwy wody,  a Lr  — wartością  tej  radiacji  po  przejściu 
odległości  r w tej  wodzie.  Stosunek  Lr/L0,  który 
można  precyzyjnie  mierzyć  (w  sposób  pokazany  na 
rys.  24b),  nazywa  się  transmisją  radiacji  (na  drodze  r) 
transmisja  iub  transmisją  równoległej  wiązki  światła,  albo  krótko 
wiązki  — transmisją  światła,  a wartość  tej  transmisji  dla 
światła  warstwy  wody  r = Im  nazywa  się  przezroczystością 
w wodzie  wody. 

Przykładowe  widma  transmisji  Lr/L0  w różnych 
wodach  naturalnych  ilustruje  rys.  27.  Krzywa  1 na 
tym  rysunku  przedstawia  typowy  przebieg  widma 
transmisji  wiązki  światła  w stosunkowo  czystej,  lecz 
bardzo  zasolonej  (3,5%  soli)  wodzie  oceanicznej. 


długość  fali  A 


Rys.  27.  Typowe  widma 
transmisji  światła  w róż- 
nych wodach  natural- 
nych. 7 względnie  czy- 
sta woda  oceaniczna 
(Prąd  Zatokowy  w Cie- 
śninie Florydzkiej),  2-7 
wody  szelfowe  i przy- 
brzeżne (2-6  z okolic 
Florydy,  7 z Zatoki 
Gdańskiej),  8 wody  uj- 
ściowe Wisły,  9 wody 
przybrzeżne  silnie  zmę- 
tnione w czasie  sztormu 
(zatoka  Biscayne) 


Widmo  to  różni  się  od  widma  transmisji  czystej  wody 
destylowanej  nieznacznie  (w  granicach  błędu  po- 
miaru), co  świadczy  o tym,  że  osłabianie  przez  sól 
morską  światła  w obszarze  fal  widzialnych  i bliskiego 
nadfioletu  jest  niezauważalne.  Z rysunku  widać,  że 
maksimum  transmisji  przypada  w przedziale  długości 
fal  470-550  nm.  Spadek  transmisji  (spadek  przezro- 
czystości wody)  w obszarze  fioletu  spowodowany  jest 
w bardzo  czystych  wodach  przede  wszystkim  rozpra- 
szaniem światła  na  molekułach  wody  (rozpraszanie 
molekularne  lub  R.ayleigha),  którego  natężenie  jest 
odwrotnie  proporcjonalne  do  czwartej  potęgi  długości 
fali  (/~  1/A4).  To  rozpraszanie  jest  np.  powodem 
pojawiania  się  ciemnobłękitnego  koloru  morza  (także 
nieba)  wtedy,  gdy  jego  wody  są  bardzo  czyste  i panuje 
w nich  dzienne  światło  rozproszone  na  molekułach. 

Natomiast  spadek  transmisji  światła  w obszarze 
czerwieni  (długość  fal  powyżej  600  nm)  i podczer- 
wieni jest  w czystych  wodach  spowodowany  przede 
wszystkim  intensywnym  pochłanianiem  fal  o tej  ener- 
gii przez  molekuły  wody,  w których  wzbudzają  się 
oscylacje  atomów  i rotacje  całych  molekuł  — w efek- 
cie zwiększa  się  ruch  molekuł,  czyli  wzrasta  tempera- 
tura. Jest  to  pochłanianie  rezonansowe,  tzn.  energia 
pochłanianych  kwantów  świetlnych  musi  odpowiadać 
energii  określonego  sposobu  drgań  molekuły.  Fale 
świetlne  różnych  długości  mogą  być  przez  wodę 
pochłaniane,  bo  istnieją  różne  sposoby  drgań  molekuł 
wody.  Woda  absorbuje  najsilniej  fale  świetlne  dłu- 
gości ok.  730  nm  i fale  świetlne  z zakresu  podczer- 
wieni, co  jest  uwidocznione  na  wykresie.  Z tej  przy- 
czyny światło  czerwone,  a tym  bardziej  podczerwone, 
pochłonięte  zostaje  w znacznym  stopniu  już  w po- 
wierzchniowej kilkunastocentymetrowej  warstwie  wód 
w morzu,  jak  to  widać  z rys.  23.  Tym  się  tłumaczy  na- 
grzewanie powierzchniowej  warstwy  wód  w słoneczne 
dni. 

Wracając  do  przedstawionych  na  rys.  27  wykresów 
widm  transmisji  światła  w różnych  wodach  natural- 
nych, zwróćmy  uwagę  na  ich  zróżnicowanie.  Optyczne 
i inne,  zarówno  fizyczne,  jak  chemiczne  badania 
tych  wód  wykazały,  że  przesuwanie  się  kolejnych 
wykresów  w dół,  czyli  spadek  transmisji  w całym 
obszarze  widma  widzialnego,  spowodowany  jest 
absorpcją  i przede  wszystkim  rozpraszaniem  światła 
przez  znajdujące  się  w wodzie  zawiesiny.  Wykresy 
2-7  przedstawiają  widma  transmisji  światła  w wo- 
dach o coraz  większej  koncentracji  zawiesin.  Wobec 
dużej  różnorodności  zawiesin  w wodach  i ich  dużych 
rozmiarów  (na  ogół  znacznie  większych  od  długości 
fali  światła)  rozpraszanie  przez  te  zawiesiny  wszy- 
stkich długości  fal  światła  jest  prawie  jednakowo  silne, 
co  w efekcie  obniża  transmisję  w całym  przedziale 
widma  światła  — niezależnie  od  osłabiania  z przy- 
czyn wymienionych  powyżej,  gdy  była  mowa  o czystej 
wodzie. 

Poszczególne  widma  na  wykresie  różnią  się  także 
średnim  nachyleniem  po  stronie  fal  krótkich.  Jest  to 
wyrazem  zróżnicowania  absorpcji  światła  w paśmie 
fioletu  i ultrafioletu,  spowodowanej  zawartością 
w wodzie  różnych  organicznych  substancji  żółtych 
(humusy,  melanoidy  i in.).  Im  więcej  żółtych  substancji 
zawiera  woda,  tym  mniej  przepuszcza  światła  nie- 
bieskiego i fioletowego,  co  się  szczególnie  ostro  za- 
znacza np.  w wodach  ujść  rzecznych  — w tym  wy- 
padku Wisły,  a także  w wodach  Bałtyku  (w  porów- 
naniu np.  z Atlantykiem). 

Współczynnik  osłabienia  światła  s(z)  na  głębokości 
z w morzu  jest  sumą  współczynnika  absorpcji  a(z), 
czyli  pochłaniania,  i współczynnika  rozpraszania 
b (z),  co  można  zapisać:  c(z)  = a (z) +6  (z).  Wyznacza- 
nie współczynników  a i b w morzu  jest  nieco  bardziej 
skomplikowane  niż  wyznaczanie  c,  przy  czym  b 
oznacza  tzw.  całkowity  objętościowy  współczynnik 
rozpraszania,  który  jest  sumą  kierunkowych  współ- 
czynników rozpraszania,  czyli  sumą  wartości  funkcji 

rozpraszania  molekularnego  /?(<£<»  £)>  opisującej  pro- 
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pochłanianie 
światła 
czerwonego 
i podczer- 
wonego 


rozpraszanie 

przez 

zawiesiny 


funkcja 

rozpraszania 


centowy  rozkład  kątowy  rozpraszania  strumienia 
światła  biegnącego  w kierunku  £0  i rozpraszanego  we 

wszystkich  poszczególnych  kierunkach £ dookoła  roz- 
praszającego elementu  objętości  wody.  Ze  względu  na 
znaczenie  rozpraszania  w transmisji  energii  światła  w 

morzu  funkcja  rozpraszania  £(£<>,£)  jest  jedną  z pod- 
stawowych wielkości  charakteryzujących  ośrodek 
wodny.  Jej  sens  fizyczny  i typowe  wykresy  ilustruje 
rys.  28. 

Funkcja  rozpraszania  jest  na  wykresie  symetryczna 
(jednakowe  rozpraszanie  w tył  i w przód),  a to  dlatego, 
że  w myśl  teorii  Rayleigha  bardzo  małe  zbiory  molekuł 
(dużo  mniejsze  od  długości  fali  światła)  zachowują  się 
jak  pojedyncze  dipole  elektryczne  pobudzane  do  drgań 
elektrycznych  przez  fale  światła  padającego  i emitu- 
jące we  wszystkich  kierunkach  fale  światła  rozpro- 
szonego (jak  antena  dipolowa).  Takie  mikrozbiory 
molekuł  powstają  w wodzie  w wyniku  termicznych 
fluktuacji  jej  gęstości.  Funkcja  rozpraszania  na  zawie- 
sinach morskich  jest  na  wykresie  bardzo  wydłużona  do 
przodu,  gdyż  zawiesiny  te  są  na  ogół  większe  od  dłu- 
gości fali  światła,  w różne  zatem  obszary  ich  objętości 
dochodzi  w tym  samym  czasie  różne  pole  elektryczne 
padającej  fali  światła  (różne  natężenie  i faza  drgań), 
które  pobudza  te  różne  obszary  do  drgań  elektrycz- 
nych w różnych  fazach.  Tak  więc  duża  cząstka  zacho- 
wuje się  jak  zbiór  dipoli  drgających  w różnych  fazach. 
Światło  emitowane  przez  te  dipole  interferuje  (z  róż- 
nym efektem  w różnych  kierunkach),  dając  w rezulta- 
cie taki  właśnie  wydłużony  do  przodu  wypadkowy 
rozkład  natężeń,  opisany  funkcją  £.  Wokół  kierunku 
padającego  światła  wszystkie  funkcje  rozpraszania  są 


symetryczne,  tak  że  ich  wykresy  przestrzenne  są  bry- 
łami obrotowymi  o takich  samych  przekrojach  jak  na 
rysunku. 

Na  rys.  28c  przedstawiono  typowe  wykresy  funkcji 
rozpraszania  w oceanie  we  współrzędnych  prostokąt- 
nych. Widać  z nich,  że  w wodzie  morskiej  występuje 
bardzo  silne  rozpraszanie  w małym  kącie  do  przodu 
(bardzo  trudne  do  zmierzenia)  oraz  minimum  rozpra- 
szania w bok  pod  kątami  90-100°  — z przyczyn  wyja- 
śnionych powyżej.  Widać  też,  że  procentowo  mniej 
rozpraszane  do  przodu,  lecz  w całości  bardziej  rozpra- 
szane (wyżej  położona  krzywa)  jest  światło  niebieskie, 
co  wskazuje  na  to,  iż  w całkowitym  rozpraszaniu 
światła  przez  czyste  wody  Morza  Sargassowego 
dużą  rolę  odgrywa  rozpraszanie  Rayleigha. 

Dokładny  wykres  tej  funkcji  we  współrzędnych 
biegunowych  byłby  tu  w wypadku  światła  niebieskiego 
mniej  wydłużony  do  przodu  niż  w wypadku  światła 
czerwonego.  Niestety  — nie  jest  możliwe  zmierzenie 
wartości  funkcji  rozpraszania,  dla  bardzo  małych 
kątów  (<  1°),  a dla  kątów  małych  (1,2,3°),  gdzie 
rozpraszanie  jest  najsilniejsze,  potrzebne  jest  zastoso- 
wanie specjalnej  techniki  ze  światłem  laserowym  (il. 
201,  tabl.  53). 

Całkowity  współczynnik  rozpraszania  na  głęboko- 
ści z w morzu  b(z)  jest  sumą,  a ściślej  — całką  funkcji 

P(z,  U O po  wszystkich  kierunkach  £ sfery  Q ota- 
czającej rozpraszający  element  objętości  wody: 

b(z)  = J 

a 

gdzie  dco(0  jest  elementem  kąta  bryłowego  wokół 
kierunku  £. 


mała  cząstka  rozpraszająca  w polu  elektrycznym  E 
fali  światła  drga  i emituje  światło  jak  pojedynczy  dipoł  elektryczny 


c) 


Rys.  28.  Funkcja  rozpraszania  światła  w wodzie  morskiej, 
a)  Sposób  wyznaczania  funkcji  rozpraszania  £(£„,<?)  s 0(0)  = 
= dL(Ć)/^-(Ćo)dftx;0l  gdzie  L(£,)  radiacja  ze  źródła  w kierunku 

część  tej  radiacji  rozproszona  w kąt  bryłowy  w kie- 

runku 0 kąt  pomiędzy  kierunkami  i £.  J V oznacza  na  ry- 
sunku badaną  objętość  rozpraszającą,  b)  Szkice  wykresów  (we 
współrzędnych  biegunowych)  funkcji  rozpraszania  na  moleku- 
łach wody  (u  góry)  i na  zawiesinach  morskich  (u  dołu)  oraz  ry- 
sunki (z  prawej)  wyjaśniające  mechanizm  rozpraszania,  c)  Funkcje 
rozpraszania  zmierzone  w Morzu  Sargassowym  przez  G.  Kullen- 
berga  (1968  r.)  i wykreślone  we  współrzędnych  prostokątnych  dla 
3 różnych  długości  fal  światła 


współczynnik 

rozpraszania 


oświetlenie  Wielkością  powszechnie  mierzoną  i stosowaną 
odgórne  przy  analizie  optycznej  morza  jest  tzw.  oświetlenie 
odgórne  Ea(z)  panujące  na  danej  głębokości  z. 
Charakteryzuje  ono  moc  odgórnego  strumienia  pro- 
mieniowania przenikającego  w głąb  morza.  Oświetle- 
nie odgórne  na  dowolnej  głębokości  z w morzu  jest 
sumą  wszystkich  składowych  radiacji  z górnej  pół- 
sfery,  prostopadłych  do  elementu  płaszczyzny  pozio- 
mej z otaczającego  rozpatrywany  punkt  w morzu, 
co  można  krótko  zapisać: 

Ed(z)  = f L„(z,Qeh>(&,  (3) 

gdzie  Q+  oznacza  półsferę  górną  wektorów  jedno- 
stkowych Z,  Ln&Z)  — składową  radiacji  L(z,  O pro- 
stopadłą do  płaszczyzny  poziomej  na  głębokości  z. 

Oświetlenie  Ea(z)  można  bezpośrednio  mierzyć 
sondą  wyposażoną  w odbiornik  światła  z wejściem 
optycznym  w postaci  płytki  z odpowiedniego  mleczne- 
go szkła  (lub  tworzywa),  wystawionej  tak,  by  padało 
na  nią  światło  z całej  górnej  półsfery  (rys.  24a).  Taka 
płytka  zwana  jest  kolektorem  Lamberta  lub  kolek- 
torem kosinusowym  ( Ln  = Lcos0),  ponieważ  świa- 
tło, które  „widzi”  odbiornik  przez  taki  kolektor,  jest 
automatycznie  scałkowane  z półsfery  w myśl  równa- 
nia (3). 

spadek  Przebieg  spadku  oświetlenia  odgórnego  w miarę 
oświetlenia  wzrostu  głębokości  zależy  od  pochłaniania  i wielo- 
z głębokością  krotnego  rozpraszania  światła  w ośrodku.  Z tej 
w morzu  przyczyny  procentowy  spadek  oświetlenia  wraz  ze 
wzrostem  głębokości  charakteryzuje  dany  akwen  mor- 
ski do  tego  stopnia,  że  ta  okoliczność  posłużyła  — 
według  koncepcji  duńskiego  oceanologa  N.  G.  Jer- 
lova  — do  optycznej  klasyfikacji  mórz  i oceanów. 
Wyróżniono  mianowicie  2 szeregi  typów  wód : szereg 
/,  IAt  lBy  II  i ///,  który  nazwano  typem  wody  ocea- 
nicznej, oraz  szereg  7,  2y  3 ...  9,  nazwany  typem  wody 
przybrzeżnej,  i tym  sposobem  scharakteryzowano 
poszczególne  regiony  oceanu  światowego.  Procento- 
wy spadek  oświetlenia  odgórnego  wybranej  długości 
fali  oraz  widma  transmisji  oświetlenia  w poszczegól- 
nych typach  wód  ilustruje  rys.  29.  Na  rysunku  jest 
także  mapka  przedstawiająca  rozmieszczenie  tych 
wód  w oceanie  światowym. 

Nachylenie  linii  na  wykresie  (rys.  29a)  wskazuje 
wielkość  spadku  oświetlenia  na  jednostkę  wysokości 
kolumny  wody.  Dokładnie  spadek  ten  opisuje  się  za 


pomocą  tzw.  współczynnika  dyfuzyjnego  osłabiania 
oświetlenia  odgórnego: 


1 dEa(z,X) 
Ed{zyX)  dz 


o którym  wspomniano  wyżej  jako  o jednej  z ważnych 
pozornych  właściwości  optycznych  morza.  Po  raz 


oświetlenie  Ed(z)/ Ed(0)  dla  465  nm 


b) 


Zwrotnik  Raka 


Zwrotnik  Koziorożci 


Rys.  29.  Optyczna  klasyfikacja  wód  morskich  wg  N.G.Jerlova(1968  r):  a)  Względny  spadek  oświetleń, a z ^boJ0h^  .s*'f'0 

skie  — 465  nm)  w wodach  oceanicznych  typu  /,  IA,  IB,  II  i III  oraz  wodach  przybrzeżnych  różnych i typów  1,2 9.  b)  Widma  transmisji 

oświetlenia  (tj.  zmiany  na  drodze  1 m)  w wodach  różnych  typów,  c)  Rozmieszczenie  różnych  typów  wód  w oceanie  światowym 
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pierwszy  wypisano  tu  wyraźnie,  że  oświetlenie 
Ea(z>  A)  i współczynnik  jego  osłabiania  Ka(z,  A)  są 
funkcjami  długości  fali  A,  lecz  zależność  od  A dotyczy 

także  radiacji  L(z,£,A),  współczynników  c(z,  A), 

tf(z,  A),  ó(z,  A),  P(z,ę oraz  innych  funkcji  optycz- 
nych, a uproszczony  zapis  tych  funkcji,  bez  zazna- 
czania zależności  od  A,  odnosi  się  umownie  do  światła 
monochromatycznego  o dowolnie  wybranej  długości 
fali. 

zróżnicowa-  Poszczególne  typy  wód  morskich  różnią  się  wieloma 
nie  wód  właściwościami  optycznymi  (wyraźne  różnice  wykazu- 
morskich  ją  m.in.  widma  transmisji  oświetlenia  zilustrowane  na 
rys.  29b).  Pociąga  to  za  sobą  wielkie  zróżnicowanie 
dobowych  i rocznych  bilansów  energii  światła  sło- 
necznego o różnej  długości  fal,  dopływającej  i zużywa- 
nej na  procesy  fizyczne  i chemiczne  na  różnych  głę- 
bokościach w morzu.  Z tej  również  przyczyny  zróż- 
nicowane są  warunki  życia  i samooczyszczania  wód 
różnego  typu:  np.  w wodach  oceanicznych  typu  / do 
głębokości  kilkudziesięciu  metrów  dociera  jeszcze 
silny  strumień  ultrafioletu,  który  może  uśmiercać 
niektóre  mikroorganizmy,  podczas  gdy  w wodach 
przybrzeżnych  typu  1 (także  w Bałtyku),  a tym  bar- 
dziej typu  2,  3t  4 itd.,  poniżej  10  m panuje  już  tylko 
słabe  światło  zielonożółte,  a promieniowanie  ultra- 
fioletowe zostaje  rozproszone  i pochłonięte  praktycz- 
nie w kilkucentymetrowej  warstwie  wody  przy  po- 
wierzchnio w-ej. 

Główną  przyczyną  zróżnicowania  wód  morskich 
pod  względem  optycznym  są,  jak  już  wspomniano, 
rozpuszczone  w wodzie  substancje  organiczne,  a głów- 
nie ich  niektóre  grupy  (np.  substancje  humusowe, 
meianoidy  i in.),  zwane  ogólnie  substancjami  żół- 
tymi, oraz  zawiesiny  morskie.  Ogólnie  wiadomo,  że 
substancje  żółte  są  wynikiem  metabolizmu  organiz- 
mów morskich  (także  wnoszone  są  do  morza  przez 
rzeki)  i że  charakteryzuje  je  silna  absorpcja  ultra- 
fioletu i fioletu,  wskutek  czego  nadają  wodzie  żółta- 
we zabarwienie.  Zawiesiny  morskie  mają  wiele  źródeł: 
są  produktami  kruszenia  skał,  pyłami  z atmosfery, 
mikroorganizmami  żywymi,  szczątkami  obumarłych 
roślin  i zwierząt  itp.  Ich  oddziaływanie  ze  światłem 
polega  przede  wszystkim  na  znacznym  rozpraszaniu 
fal  świetlnych  wszystkich  długości. 

Mechanizm  oddziaływania  obu  tych  grup  składni- 
ków na  pole  światła  oraz  na  transmisję  energii  pro- 
mienistej w wodzie  morskiej  jest  obecnie  przedmiotem 
intensywnych  badań. 


Zastosowanie  optyki  morza  w innych 
dziedzinach  oceanologii 

Na  zakończenie  warto  wspomnieć,  że  optyka  morza 
jest  szeroko  stosowana  w innych  badaniach  i pracach 
w morzu.  Optyczne  właściwości  morza  są  często  wy- 
jątkowo czułymi  wskaźnikami  wielu  zachodzących 
w oceanie  procesów  geofizycznych,  geochemicznych, 
biologicznych  i innych,  których  dokładne  poznanie 
jest  niezbędne  dla  racjonalnego  gopodarowania 
w środowisku  morskim  i zapobiegania  jego  przeobra- 
żeniom w niepożądanym  kierunku.  Bardzo  czułe  są 
np.  optyczne  wskaźniki  rozmieszczenia  i przenoszenia 
się  mas  wodnych  różnego  pochodzenia  w morzu. 

Widać  to  szczególnie  wyraźnie  w rejonach  ujść  rzecz- 
nych, gdzie  wody  rzeczne,  zawierające  dużo  zawiesin  badanie 
i substancji  żółtych,  rozpływają  się  i mieszają  w skom-  ujść 
plikowany  często  sposób  z wodami  morskimi.  Mierząc  rzecznych 
rozkład  przestrzenny  np.  współczynnika  osłabiania 
światła  c (szybko  i na  dużym  obszarze  wód),  można 
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Rys.  30.  Przykłady  optycznych  wskaźników  rozmieszczenia  i ruchu  mas  wodnych  w morzu:  a)  Przykładowy  rozkład  wartości  współ- 
czynnika c osłabiania  światła  zielonego  (A  = 0,5  pm)  w powierzchniowej  warstwie  wód  Zatoki  Gdańskiej  w czasie  wiosennych  wysokich 
stanów  spływających  wód  Wisły.  Duże  wartości  współczynnika  c pokazują  rozmieszczenie  wody  wiślanej,  nie  wymieszanej  jeszcze  z wodą 
morską,  b)  Szkic  pomiaru  pionowego  rozkładu  funkcji  rozpraszania  (pod  jednym  stałym  kątem, np.  0 — 45°),  który  informuje  o kie- 
runku ruchu  masy  wodnej  na  podstawie  rozpraszania  światła  przez  zawiesiny  unoszone  z opływanej  podwodnej  góry 
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łatwo  rozpoznać  drogi  rozchodzenia  się  w'ód  ujścio- 
wych rzeki,  a wraz  z nimi  zanieczyszczeń,  ścieków  itp. 
Przykład  taki,  ukazujący  skomplikowane  rozmieszcze- 
nie w’ód  ujściowych  Wisły  w Zatoce  Gdańskiej  przy 
wysokim  stanie  tej  rzeki  w okresie  wiosennym, 
przedstawiono  na  rys.  30a.  Obszary  wód,  na  których 
wartości  współczynnika  c są  duże  (6-7  irr1),  były 
zajęte  przez  bardzo  zanieczyszczone  wody  wiślane 
nie  wymieszane  jeszcze  z wodą  morską.  Widać,  że 
w sprzyjających  warunkach  dotarły  one  aż  do  wyso- 
kości Półwyspu  Helskiego  (w  warstwie  powierzch- 
niowej). W wyniku  późniejszej  zmiany  wiatru  i cyr- 
kulacji wód  głębinowych  domieszka  mniej  zanieczysz- 
czonej wody  morskiej  była  w pobliżu  ujścia  rzeki 
dużo  większa,  a w Zatoce  Puckiej  w tym  samym  cza- 
sie — woda  była  prawie  tak  czysta  jak  na  pełnym 
morzu.  Podobne  pomiary  wykonane  na  różnych  głę- 
bokościach wskazują  na  to,  że  woda  wiślana  rozpływa 
się  w cienkiej  warstwie  powierzchniowej  Zatoki 
Gdańskiej  (1-2  m),  a poniżej  podpływają  wody 
z otwartego  morza  Bałtyckiego. 

badanie  Na  wielkich  przestrzeniach  oceanu  oprócz  wyraź- 
ruchu  mas  nych  prądów  morskich  występuje  bardzo  powolne 
wodnych  przemieszczanie  się  olbrzymich  mas  wodnych;  ich 
wykrycie  jest  także  często  możliwe  za  pomocą  metod 
optycznych.  Kiedy  np.  taka  powoli  przemieszczająca 
się  masa  wodna  opływa  podwodne  góry,  to  po  drugiej 
stronie  gór  w kierunku  przepływu  notuje  się  wyraźny 
wzrost  rozpraszania  światła,  spowodowany  zawiesi- 
nami unoszonymi  z osadów  dennych  na  podwodnej 
górze,  jak  to  obrazuje  rys.  30b. 

badanie  Od  optycznych  właściwości  wód  danego  regionu 
strefy  morza  w znacznym  stopniu  zależy  szybkość,  wydaj - 
eufotycznej  ność  energetyczna  i pionowy  rozkład  produkcji 
materii  organicznej,  która  ma  miejsce  w procesie  foto- 
syntezy w komórkach  fitoplanktonu  morskiego.  Gru- 
bość wystarczająco  naświetlonej  powierzchniowej 
warstwy  wód,  w której  się  ta  produkcja  odbywa  z prze- 
wagą wydzielania  tlenu  nad  jego  zużyciem  przez 
komórki,  nazywa  się  strefą  eufotyczną  w morzu. 
Strefa  ta  dochodzi  w czystych  morzach  do  ok.  150  m 
głębokości,  podczas  gdy  np.  w Bałtyku  zaledwie  do 
ok.  20  m,  co  jest  wynikiem  różnic  we  właściwościach 
widmowych  tych  wód.  W dodatku  różne  widma  pa- 
nującego w różnych  wodach  światła  przyczyniają  się 
do  różnicowania  nie  tylko  gatunków  żyjącego  w nich 
fitoplanktonu,  lecz  także  składu  barwników  w ko- 
mórkach tego  samego  gatunku.  Komórki  te  mają 
bowiem  zdolność  fotoadaptacji,  tzn.  zmieniają  skład 
swoich  barwni ków  wyłapujących  dostępną  dla  foto- 
syntezy energię  światła  pod  wpływem  zmian  w zew- 
nętrznych warunkach  oświetleniowych  (np.  podczas 
zmian  zanieczyszczeń  w'ody,  a także  w czasie  powol- 


nego tonięcia  i znajdowania  się  w coraz  głębszych 
wodach,  gdzie  panuje  inne  pole  światła).  Niekiedy 
jednak  duże  zmiany  oświetlenia,  spowodowane  np. 
ogniskowaniem  promieni  słonecznych  przez  fale 
morskie,  mogą  znacznie  hamować  proces  fotosyntezy. 

Tak  więc  warunki  optyczne  mają  zasadniczy  wpływ 
na  wzrost  fitoplanktonu,  a stąd  — na  podtrzymywa- 
nie wszelkich  form  życia  w morzu,  gdyż  jak  już  wspo- 
mniano, wyprodukowana  przez  fitoplankton  w pro- 
cesie fotosyntezy  materia  organiczna  i tlen  są  niezbęd- 
ne do  życia  wszystkich  organizmów  morskich.  Bada- 
nie pola  światła  jest  zatem  również  bezpośrednio 
przydatne  do  określania  warunków  życia  w danym 
morzu  i sygnalizowania  ich  zmian. 

W ostatnich  latach  coraz  częściej  wykorzystuje  się 
do  różnych  badań  morza  zdjęcia  powierzchni  morza 
wykonane  z samolotów  i sztucznych  satelitów  oraz 
pomiary  radiacji  powierzchni  morza.  Interpretacja 
tych  zdjęć,  a zwłaszcza  badanie  na  podstawie  radiacji 
powierzchni  morza  różnych  właściwości  fizycznych, 
chemicznych  i biologicznych  dużych  przestrzeni 
morskich,  wymaga  wielu  szczególnie  dokładnych  in- 
formacji z optyki  morza,  w tym  bowiem  celu  po- 
trzebna jest  dokładna  znajomość  zależności  rozkła- 
dów radiacji  światła  wychodzącego  z morza  od  wielu 
złożonych  czynników  środowiskowych.  Te  zdalne 
metody  optyczne  wnoszą  jednak  kolosalny  postęp 
w rozpoznanie  pól  temperatur  powierzchni  morza, 
pól  lodowych,  rozmieszczenia  planktonu  (pośrednio 
ryb),  prądów  morskich  i in.  na  wielkich  obszarach 
oceanu.  Z tej  przyczyny  prowadzone  w tym  kierunku 
badania  optyczne  rozwijają  się  obecnie  bardzo  dy- 
namicznie. 

W wielu  pracach  podwodnych  związanych  z nowymi 
kierunkami  inżynierii  morskiej  (budownictwo  mor- 
skie, górnictwo  morskie,  nowe  techniki  połowów  itp.) 
niezbędne  jest  wykorzystywanie  telewizyjnych  i fo- 
tograficznych kamer  podwodnych  oraz  świateł  i szkieł 
optycznych  umożliwiających  obserwację  różnych 
obiektów.  Ze  względu  na  mały  zasięg  widzenia  (rys.  31) 
i zmiany  barwy  przedmiotów  w wodzie  konieczne 
jest  rozpoznanie  danych  optycznych  warunków  śro- 
dowiskowych i na  tej  podstawie  dobieranie  parame- 
trów stosowanych  urządzeń  optycznych,  takich  jak 
widmo  emisji  sztucznych  źródeł  oświetlenia,  filtry 
optyczne  i polaryzacyjne  w odbiornikach,  geometria 
ustawienia  układu  itp.  Odpowiedni  dobór  tych  para- 
metrów pozwala  znacznie  zwiększyć  zasięg  widzenia 
i kilkakrotnie  poprawić  kontrast  i jakość  obrazu. 

Podstawowe  znaczenie  procesów  oddziaływania 
światła  słonecznego  na  środowisko  morskie  oraz 
praktyczne  możliwości  wykorzystania  optyki  morza 
inspirują  współcześnie  wiele  badań  doświadczalnych 
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Rys.  31.  Zasięg  widzenia  w wodzie  dla  oka  ludzkiego  i dla  kamery  telewizyjnej  (wg  R.  O.  Briggs  i G.  L.  Hatchett,  1965  r.) 
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i teoretycznych  i przyczyniają  się  do  dynamicznego 
rozwoju  tej  gałęzi  fizyki.  Badania  w tym  kierunku 
prowadzą  liczne  współpracujące  ze  sobą  instytuty 
naukowe  w świecie,  szczególnie  w ZSRR,  Danii, 
USA,  we  Francji,  w Japonii  i NRD,  a także  w Polsce 
— w Zakładzie  Oceanologii  Polskiej  Akademii  Nauk 
w Sopocie. 

J.  Dera  Charakterystyka  oświetlenia  strefy  eufotycznej  w mo- 
rzu, Oceanologia  nr  I,  1971 ; J.  Dera,  J.  Kalinowski  Przenosze- 
nie energii  promienistej  w morzu.  Post.  Fiz.  17.  537  (1966);  J.  De- 
ra^. Olszewski  Widzialność  podwodna.  Post.  Fiz.  20,  473(1969); 
Fizyka  morza.  Studia  i Materiały  Occanologiczne  Komitetu  Ba- 
dań Morza  PAN  nr  6 i nr  7,  1973;  N.  G.  Jerloy  Marinę  Optics , 
Amsterdam  1976;  J.  Kalinowski,  J.  Dera  Metody  badań  zjawisk 
optycznych  w morzu.  Post.  Fiz.  19,  219  (1968);  Opticał  Aspects 
of  Oceanography  (N.  G.  Jerloy,  E.  Steemann  Nielsen,  ed.), 
London  1974;  W.  W.  Szulejkin  Fizyka  moria,  Moskwa  1968. 


ka.  Do  różnego  rodzaju  badań  akustycznych,  za- 
równo podstawowych,  jak  i stosowanych,  skłaniają 
nie  tylko  rozległe  przestrzenie  hydrosfery  i duża  liczba 
czynników  wpływających  na  przebieg  zjawisk,  ale 
również  sama  natura  fal  sprężystych,  które  jak  dotąd 
— stanowią  najlepsze  narzędzie  do  przenoszenia 
sygnałów  podwodnych  na  duże  odległości,  tysięcy 
metrów  a nawet  tysięcy  kilometrów  (zależy  to  od 
częstości  sygnału  i warunków  fizycznych  w danym 
akwenie),  a więc  wielokrotnie  większe  niż  zasięgi  fal 
elektromagnetycznych,  które  w morzu  są  silnie  tłu- 
mione. 


Charakter  rozprzestrzeniania  się  dźwięku 


Akustyka  morza 

Antoni  Śliwiński 

Akustyka  morza,  inaczej:  akustyka  podwodna,  hy- 
droakustyka,  obejmuje  całokształt  zjawisk  i procesów 
dotyczących  rozchodzenia  się  fal  sprężystych  w du- 
żych zbiornikach  wodnych  (w  hydrosferze).  Zjawiska 
akustyczne  w morzu  odpowiadają  bardzo  szerokiemu 
widmu  fal,  o częstościach  od  rzędu  ułamków  herca 
(infradźwięki)  aż  do  kilkuset  kiloherców  (ultra- 
dźwięki). Górną  granicę  tego  widma  wyznacza  natura 
środowiska  morskiego,  które  silnie  tłumi  fale  o du- 
żych częstościach,  a więc  fale  krótkie, 
zakres  Środowisko  morskie  bardzo  dobrze  nadaje  się  do 
przenoszo-  generacji  fal  akustycznych  i przesyłania  informacji 
nych  za  ich  pomocą.  Pasmo  częstości  użyteczne  ze  względu 
fal  na  komunikację  podwodną  i hydrolokację  rozciąga 
się  w granicach  10-100  kHz.  Fale  takie  można  wy- 
twarzać w morzu  za  pomocą  przetworników  elektro- 
akustycznych, wykorzystujących  zjawiska  piezoelek- 
tryczne lub  magnetostrykcyjne.  Często  też  stosuje  się 
impulsowe  źródła  akustyczne,  którymi  są  podwodne 
eksplozje  materiałów  wybuchowych,  eksplozje  sprę- 
żonych gazów  lub  też  wyładowania  elektryczne  dużej 
mocy. 

szumy  Niezależnie  od  pól  akustycznych  wytwarzanych 
własne  celowo  istnieją  w morzu  pola  akustyczne  stanowiące 
tło,  tzw.  szumy  własne,  pochodzące  z różnego  rodzaju 
źródeł,  zarówno  naturalnych,  jak  i sztucznych,  zwią- 
zanych z działalnością  człowieka  na  morzu. 

Zagadnienia  akustyki  morza  są  przedmiotem  za- 
interesowania od  kiludziesięciu  lat  i poświęca  się  im 
wiele  prac  naukowych,  bada  się  fizyczne  zjawisko 
rozchodzenia  się  fal  dźwiękowych  w morzu  i szuka 
się  możliwości  wykorzystania  go. 

Badaniem  akustycznych  zjawisk  w hydrosferze  zaj- 
ba  dania  w muje  się  obecnie  wiele  ośrodków  na  świecie,  także  w 
Bałtyku  Polsce.  Badania,  które  prowadzi  się  w Bałtyku,  obej- 
mują głównie  następujące  zagadnienia: 
charakter  i zasięg  rozchodzenia  się  dźwięków  w mo- 
rzu, 

rozkład  prędkości  rozchodzenia  się  dźwięku  wywo- 
łanego refrakcją  i występowanie  z tym  związanych 
tzw.  kanałów  akustycznych, 
rozpraszanie  fal  akustycznych  w morzu  i pogłos, 
tłumienie  fal  akustycznych  w morzu, 
dyspersja  fal  akustycznych  i jej  rola  w przenoszeniu 
sygnałów  ciągłych  i impulsowych, 
szumy  własne  morza  — ich  natężenie  i skład  wid- 
mowy, 

wykorzystanie  fal  akustycznych. 

Istnieją  pewne  prawidłowości  w przebiegu  zjawisk 
akustycznych  we  wszystkich  morzach  i oceanach,  ale 
jednocześnie  w każdym  zbiorniku  wodnym  zjawiska 
te  mają  specyficzny  charakter,  inny  w morzach  głę- 
bokich, inny  w płytkich;  przebieg  ich  zależy  od  sze- 
rokości geograficznej,  warunków  klimatycznych,  pór 
roku,  zmian  dobowych  oraz  wielu  dodatkowych  czyn- 
ników naturalnych  i modyfikowanych  przez  człowie- 
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Warunki,  w jakich  się  rozchodzi  dźwięk  w morzu, 
różnią  się  znacznie  od  idealnych,  z jakimi  mamy  do 
czynienia  w płynnych  środowiskach  jednorodnych 
(— * Przedmiot  i zakres  akustyki),  przy  rozpatrywaniu 
których  wychodzi  się  z założenia,  że  w całej  objętości 
własności  sprężyste  są  takie  same.  Niejednorodne 
własności  sprężyste  toni  morskiej  wypływają  ze 
zmian  temperatury,  zasolenia,  ciśnienia  hydrosta- 
tycznego, ruchu  mas  wodnych  (Rozdz.  Dynamika  mo- 
rza). Ma  też  znaczenie  zmieniająca  się  zawartość  ciał 
obcych  w wodzie,  np.  pęcherzy  powietrza,  których 
źródłem  powstawania  w toni  morskiej  są:  falująca 
powierzchnia  morza,  różne  procesy  fizykochemiczne, 
a także  organizmy  żywe.  Wszystkie  te  czynniki  de- 
cydująco wpływają  na  prędkość,  tłumienie  i kierunek 
rozchodzenia  się  dźwięku  w morzu. 

Ponieważ  zasięg  sygnałów  akustycznych  rozcho- 
dzących się  w morzu  jest  daleki,  duży  wpływ  na  cha- 
rakter rozchodzenia  się  dźwięku  mają  ograniczenia 
zbiorników  wodnych,  w szczególności  brzegi,  dno 
i powierzchnia  morza. 

Często  pole  akustyczne  w morzu  podobnie  jak 
w innych  ośrodkach  opisuje  się  funkcją  zwaną  po- 
tencjałem prędkości  drgań  cząstki  akustycznej.  Po-  potencjał 
tencjał  akustyczny  0 definiuje  się  jako  skalarną  funk-  akustyczny 
cję  określającą  pole,  której  pochodna  przestrzenna 
(gradient)  daje  bezpośrednio  mierzalną  wielkość 
wytwarzającą  to  pole.  W polu  akustycznym  wielkością 

tą  może  być  przesunięcie  £ (->  Przedmiot  i zakres 
akustyki,  rozdział  Teoria  ośrodków  ciągłych  i fale 

sprężyste),  albo  prędkość  cząstki  £ = ££/£/,  albo  też 
ciśnienie  akustyczne  p.  Jeżeli  0 oznacza  potencjał 

prędkości  £,  wtedy  £ — grad  <Z>,  co  z kolei  oznacza, 
że  p = ecgrad<P. 

Potencjał  0(x,  y,  zy  t)  spełnia  równanie  falowe 
d20  _ 1 e*0 

'exr~r  by*  +~ep  dr~Btr’ 

przy  czym  c jest  prędkością  rozchodzenia  się  dźwięku, 
a symbole  d2/3x2t  d2jdyz,  dzjoz2>  d2(dt 2 oznaczają  po- 
chodne cząstkowe  po  odpowiednich  zmiennych.  Rów- 
nanie to  jest  słuszne  tylko  w odniesieniu  do  fali  nie 
tłumionej,  tzn.  że  można  je  stosować  tylko  w przy- 
bliżeniu, gdyż  w rzeczywistości,  jak  już  wyżej  wspom- 
niano, fala  akustyczna  w toni  morskiej  ulega  tłumie- 
niu. Do  przybliżonego  opisu  pola  akustycznego  w mo- 
rzu używa  się  modelu  poziomo  uwarstwionych  mas 
wodnych,  w którym  prędkość  dźwięku  c jest  funkcją 
tylko  głębokości  morza  c = c(z).  Wynika  on  stąd, 
że,  w toni  morskiej  zarówno  temperatura  wody,  gęs- 
tość i zasolenie,  jak  i ciśnienie  hydrostatyczne  za- 
leżą regularnie  od  głębokości  (wpływ  pola  ciężkości 
Ziemi). 

Przy  założeniu  uwarstwionego  modelu  potencjał 
akustyczny  jest  tylko  funkcją  współrzędnych  x i z 
oraz  czasu  t.  Wtedy  rozwiązaniem  równania  falowego 
jest  funkcja  opisująca  falę  płaską,  a ogólna  jej  postać 
jest  następująca: 

0(x,  z,  t)  = ę>(z)e*<"*±aa:>,  (5) 


gdzie  <p(z)  oznacza  przestrzenną  część  potencjału  (fun- 
kcja ta  określa  rozkład  potencjału  wzdłuż  osi  z), 
w — częstość  kołową  fali,  znak  — lub  -f  odpowiada 
dodatniemu  łub  ujemnemu  kierunkowi  rozchodzenia 
się  fali  wzdłuż  osi  x z prędkością  fazową  c ' - (ofa 
a a jest  liczbą  falową  dla  kierunku  x (rys.  32). 


x 


c(z) 


■ = const 


Rys.  32.  Droga  promienia  dźwiękowego  w ośrodku  niejednorod- 
nym 


Po  podstawieniu  do  równania  (4)  rozwiązania  (5) 
(biorąc  tylko  znak  — , oznaczający  dodatni  kierunek 
rozchodzenia  się  fali)  otrzymuje  się  równanie  okre- 
ślające funkcję  ę?(z): 


d2<p 


+y2  <p  = o. 


(6) 


fi  >2  / /.'i  \ 

gdzie  y*  = — -«»  = 

Rozwiązanie  równania  (6)  ma  ogólną  postać  na- 
stępującą : 

<P  = 


gdzie  A i B są  stałymi  całkowania.  Pierwszy  składnik 
opisuje  zaburzenie  rozchodzące  się  w dół  (w  dodatnim 
kierunku  osi  z),  drugi  — w górę.  Jeśli  się  ograniczymy 
do  zaburzenia  w dół,  to  rozwiązanie  (2)  można  będzie 
napisać  w postaci: 

0(xy  z,  t)  = Ae-^eW-***. 

Dla  fali  rozchodzącej  się  nie  w kierunku  osi  xy  lecz 
w płaszczyźnie  xy  z rozwiązanie  będzie  miało  postać  : 


0(xyzy  t)  = Aeiiwt-kr*\ 
gdzie  rz  — j/*2-b J'2*  a kz  = a2-f-y2  — <o2/czy 


k jest  liczbą  falową  fali  wypadkowej,  której  kierunek 
rozchodzenia  się  wyznacza  wektor  falowy  ky  przy 

czym  \k\  = ky  a i y są  liczbami  falowymi  fal  skła- 
dowych biegnących  odpowiednio  wzdłuż  osi  x oraz  z. 

Wektory  a i y są  składowymi  wektora  k dla  tych 
kierunków  (sytuację  ilustruje  rys.  32).  Zachodzi  przy 
tym  zależność:  oc  = &sin0,  y = £cos0,  gdzie  0 

jest  kątem  między  osią  z a wektorem  k.  W środowisku 
poziomo  uwarstwionym  0 odpowiada  kątowi  zała- 
mania na  granicy  dowolnych  dwu  warstw. 

W środowisku  zupełnie  jednorodnym,  w którym 

c = const,  również  wektor  k jest  stały  i jego  wartość 
k = co/c  = 2nfjc  = 2j z/X,  gdzie  l — długość  fali,  / — 
częstość.  Natomiast  w morzu,  dla  którego  przyjęliśmy 
poziome  uwarstwienie  i c = c(z),  wielkości  ky  X i y 
są  funkcjami  głębokości  z,  podczas  gdy  a pozostaje 
stałe.  Wynika  to  z wyżej  rozpatrzonych  zależności 
i z prawa  Snella,  określającego  współczynnik  zała- 
mania „promienia”  dźwiękowego: 

sin0  _ c(z) 
sin0o  c0 


skąd  wynika,  że 

sinO 

- , . = const. 

c(z) 

Jeśli  fala  biegnie  w kierunku  poziomym  (0  = n/2) 
a — k i y — 0,  wtedy  (por.  rys.  32) 

c'  = c(z).  (7) 

Jeżeli  fala  biegnie  na  określonej  głębokości  z,  refrakcja  fał 
a wektor  k tej  fali  przybiera  kierunek  poziomy,  dźwiękowych 
to  promień  fali  w dalszym  swym  biegu  zmienia 
zwrot:  przestaje  biec  w dół,  zawraca  ku  górze,  lub 
w przeciwnym  przypadku  — przestaje  biec  ku  górze 
i zawraca  w dół.  Obydwa  te  przypadki  zachodzą 
w morzu,  a zjawisko  nazywa  się  refrakcją  fal  dźwię-  kanały 
kowych  i prowadzi  do  powstawania  tzw.  kanałów  dźwiękowe 
dźwiękowych,  zwanych  z angielskiego  SOFAR  (Sound 
Fixing  and  Ranging). 


prędkość  dźwięku  c 


Rys.  33.  Pionowe  rozkłady  prędkości  dźwięku  w morzu:  a)  ty- 
powy rozkład  wg  W.  W.  Szulkina;  b)  rozmaite  rozkłady  w morzu 
głębokim;  1 rozkład  typowy  w oceanie , temperatura  wody  przy 
powierzchni  wyższa  niż  głębiej,  2 sezon  zimowy  w strefie  umiar- 
kowanej, 3 morze  arktyczne,  c)  rozkłady  przy  powierzchni  w mo- 
rzach płytkich  w zależności  od  pory  roku 


a) 


prędkość 


zasięg  powierzchnia 


b)  prędkość  zasięg  powierzchnia 

» l 

Rys.  34.  Schemat  biegu  promieni  dźwiękowych  w morzu  głębo- 
kim: a)  w kanale  przypowierzchniowym,  b)  w kanale  głębinowym 
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56  - Encyklopedia  fizyki  współczesnej 


wzór  Wilsona 


Zjawisko  to  odpowiada  znanemu  w optyce  zjawisku 
całkowitego  wewnętrznego  odbicia  na  nieciągłej  gra- 
nicy dw-óch  ośrodków  przy  przejściu  światła  z ośrod- 
ka optycznie  gęstszego  do  rzadszego,  co  zachodzi 
wtedy,  gdy  przy  danej  wartości  współczynnika  zała- 
mania kąt  padania  w ośrodku  optycznie  gęstszym 
przekracza  wartość  kąta  granicznego.  Tutaj  w wodzie 
morskiej  sytuacja  jest  jednak  ogólniejsza,  a przy  tym 
zjawisko  może  wystąpić  na  różnych  głębokościach 
i przy  różnych  kątach  padania.  Wskutek  ciągłej  zmia- 
ny współczynnika  załamania  wraz  z głębokością  (ciąg- 
ła zmiana  prędkości  c{z ) związana  ze  zmianą  gęstości 
wynikającej  z gradientu  temperatury,  rys.  33  i 34 
kierunek  rozchodzenia  się  promienia  dźwiękowego 
zmienia  się  od  punktu  do  punktu  (rys.  32). 


Prędkość  rozchodzenia  się  dźwięku 

Zróżnicowanie  prędkości  rozchodzenia  się  dźwięku 
w toni  morskiej  na  ogół  komplikuje  i znacznie  wy- 
dłuża drogę  dźwięku  od  źródła  do  odbiornika  w po- 
równaniu z linią  prostą. 

Prędkość  dźwięku  jest  bezpośrednio  powiązana  ze 
ściśliwością  i gęstością  środowiska,  co  przy  założe- 
niu, że  rozchodzenie  się  fal  akustycznych  ma  charak- 
ter procesu  adiabatycznego,  wyraża  wzór: 

~V+-j/e7-  (8> 

gdzie  /?ad  — współczynnik  ściśliwości  w procesie 
adiabatycznym,  Piz  — współczynnik  ściśliwości  w 
procesie  izoterm icznym,  * = cvJcv  (*  wody  morskiej 
wynosi  1,00-1,02),  cp  — ciepło  właściwe  przy  stałym 
ciśnieniu,  cv  — ciepło  właściwe  przy  stałej  objętości, 
Q — gęstość. 

Ściśliwość  wody  morskiej  jest  mniejsza  od  ściśli- 
wości wody  czystej  i maleje  zarówno  ze  wzrostem 
ciśnienia  (głębokości),  jak  i temperatury  oraz  zasole- 
nia. Na  przykład  przy  temperaturze  T = 0°C  i za- 
soleniu S — 34,85 %<>  w warstwie  powierzchniowej  ściś- 
liwość wody  morskiej  ma  wartość  4,658  10~5cm2/kG, 
a na  głębokości  10  000  m — 3,993  TO-  10“5cm2/kG. 
Gęstość  wody  morskiej  jest  w porównaniu  z wodą 
czystą  trochę  większa  i maleje  ze  wzrostem  tempera- 
tury, natomiast  rośnie  ze  wzrostem  zasolenia  i ciśnie- 
nia. 

Zależność  prędkości  dźwięku  od  zasolenia,  tempe- 
ratury i ciśnienia  w wodzie  morskiej  ujmują  różne 
wzory  empiryczne,  z których  najbardziej  znany  w oce- 
anografii jest  wzór  Wilsona: 

c(S,  r,  P)  = c(35,  0,  0)+  cs-f  cr+o>-{-csrp. 


gdzie  c(35,  0,  0)  = 1449,22  m/s  jest  wartością  pręd- 
kości przy  zasoleniu  35 %0,  temperaturze  0°C  i ciś- 
nieniu atmosferycznym  na  poziomie  morza,  dalsze 
zaś  składniki  po  prawej  stronie  wzoru  stanowią 
poprawki,  które  trzeba  uwzględnić  przy  zmianie  każdej 
wielkości  z osobna;  ostatni  wyraz  określa  poprawkę 
wynikającą  z ich  wzajemnego  wpływu.  Poszczególne 
poprawki  w postaci  wielomianów  o różnych  współ- 
czynnikach liczbowych  podane  są  w literaturze  fa- 
chowej i oblicza  się  je  dla  danych  warunków. 

Wzór  Wilsona  pozwala  obliczyć  prędkość  dźwięku 
w morzu  w zakresie  temperatur  od  — 4°C  do  30°C, 
ciśnień  — od  1 kG/cm2  do  1000  kG/cm2  i zasoleniu 
od  0 do  37%o,  z dokładnością  do  +0,3  m/s.  Dokład- 
ność ta  jest  tego  samego  rzędu  co  dokładność  pomia- 
rów prędkości  w wodzie. 

W miarę  spadku  temperatury  wraz  z głębokością 
zmniejsza  się  prędkość  dźwięku  — głównie  wskutek 
wzrostu  gęstości.  W warstwie  przypowierzchniowej 
obniżenie  to  wynosi  ok.  3 m/s  na  1°C.  Wzrostowi 
zasolenia  wraz  z głębokością  towarzyszy  wzrost 
prędkości  mniej  więcej  o 1,3  m/s  na  1 %*>  — wynika 
to  z faktu,  że  wzrost  gęstości  przy  wzroście  zasolenia 
jest  powolniejszy  niż  spadek  ściśliwości  (zob.  wzór  8). 
Wzrost  ciśnienia  hydrostatycznego  wraz  z głęboko- 
ścią daje  wzrost  prędkości  dźwięku  mniej  więcej 

0 1 ,8  m/s  na  każde  100  m słupa  wody. 

Rozkłady  prędkości  c(z ) są  więc  bardzo  zróżnico- 
wane w przestrzeni  i zmieniają  się  także  w czasie 
(zmiany  dobowe  i sezonowe).  Kilka  najbardziej 
charakterystycznych  rozkładów  przedstawia  rys.  33. 
Niektóre  z nich  wykazują  wyraźne  minimum  pręd- 
kości dźwięku  na  określonej  głębokości.  W obrębie 
warstw  wyznaczonych  przez  takie  minima  funkcji 
c(z)  wytwarzają  się  kanały  dźwiękowe.  Są  to  obszary, 
w których  wskutek  refrakcji  fale  dźwiękowe  biegną 
jak  w falowodzie,  oscylując  pomiędzy  dwoma  gra- 
nicznymi powierzchniami,  na  których  zachodzi  wa- 
runek (7)  całkowitego  wewnętrznego  odbicia.  Przy- 
kład schematycznego  biegu  promieni  dźwiękowych 
w charakterystycznych  wypadkach  — w kanale  dźwię- 
kowym przypowierzchniowym  (na  głębokości  40-70 
m)  oraz  w kanale  głębinowym  (1000-1500  m)  — po- 
kazuje rys.  34.  Na  rys.  35  przedstawione  są  wyniki 
pomiarów  wykonanych  w oceanie  na  dużej  głębokości. 

Szczególnego  rodzaju  falowód  dla  dźwięku  może 
stanowić  akwen  morza  płytkiego,  gdzie  rozchodzące 
się  fale  dźwiękowe  ulegają  kolejno  odbiciom  od  dna 

1 od  powierzchni  morza.  Ilustrację  wyników  badań 
kanałów  dźwiękowych  w Bałtyku  przedstawiają  rys. 
36  i 37.  Na  rys.  37  jest  uwidoczniona  oś  kanału  dźwię- 
kowego c{z ) = minimum,  oszacowana  z pomiarów 
temperatury  i zasolenia. 


prędkość 

zasięg  o O </> 

0 10  20  30  40  50  60  70  km  ^ £ 


Rys.  35.  Zmierzone  przebiegi  sygnałów  dźwiękowych  w kanale  głębinowym  SOFAR  wg  M.  Ewinga  i in. 
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Rys.  36.  Zmiany  sezonowe  pionowego  rozkładu  średnich  pręd- 
kości dźwięku  w’  Głębi  Bornholmskiej,  wyznaczone  na  podsta- 
wie dziesięcioletniej  serii  pomiarów  temperatury  i zasolenia 
wody.  Krzywe  umieszczono  na  szarym  tle,  którego  granice  sta- 
nowią pionowe  rozkłady  minimalnych  i maksymalnych  pręd- 
kości dźwięku.  Cyfry  rzymskie  oznaczają  miesiące  (wg  P.  Ty- 
mańskiego) 


Rys.  37.  Rozkład  poziomy  średnich  prędkości  dźwięku  w morzu 
w (m/s)  wg  danych  z sierpnia  oraz  profil  dna  morskiego  wzdłuż 
przekroju  pionowego  Głębia  Gdańska-Rynna  Słupska  (P7-P4), 
wyznaczony  na  podstawie  wyników  serii  pomiarów  temperatury 
i zasolenia  wody,  trwającej  dziesięć  lat  (wg  P.  Tymańskiego) 


Rozpraszanie  dźwięku 

Zjawisko  rozpraszania  dźwięku  występuje  zarówno 
przy  jego  odbiciu  od  pofalowanej  powierzchni  morza 
oraz  nierównego  dna,  jak  i przy  odbiciu  od  niejedno- 
rodności wewnętrznych,  takich  jak  pęcherzyki  gazów, 
fluktuacje  termiczne  ośrodka,  elementy  biologiczne 
i in.  Rozpraszaniu  sygnałów  akustycznych  w różnych 
kierunkach  towarzyszą  fluktuacje  amplitudy  i fazy 
tych  sygnałów,  utrudniające  w praktyce  interpretację 
przy  ich  rejestracji.  Ze  względów  teoretycznych  i prak- 
tycznych zjawisku  temu  poświęca  się  w fizyce  morza 
wiele  uwagi.  Zagadnienia  związane  z poszukiwaniem 
odpowiedniego  modelu  rozpraszania  dźwięku  przez 
nierówne  powierzchnie  można  podzielić  na  dwie  gru- 
py. W pierwszej  grupie  wychodzi  się  z założenia,  że 
charakter  powierzchni  rozpraszających  jest  zdetermi- 
nowany (ma  np.  kształt  o przekroju  sinusoidalnym 
lub  piłowatym),  natomiast  w drugiej  grupie  przyjmuje 
się  statystyczny  rozkład  nierówności  elementów  roz- 
praszających i również  pole  akustyczne  opisuje  się 
statystycznie.  Wiele  prac  eksperymentalnych  prze- 
prowadza się  na  modelach  w basenach  przeznaczonych 
specjalnie  do  badań  akustycznych. 


Wskutek  rozpraszania  dźwięku  w morzu  część 
energii  akustycznej  rozchodzi  się  we  wszystkich  kie- 
runkach — także  pod  kątem  180°  (wstecz) — i po- 
wraca do  źródła  dźwięku.  Odbiornik  umieszczony 
w takim  polu  akustycznym  rejestruje  nie  tylko  falę, 
która  do  niego  dochodzi  bezpośrednio  od  źródła,  ale 
również  szereg  fal  rozproszonych  przychodzących 
z różnych  stron.  Jeśli  w pewnej  chwili  źródło  dźwięku 
zostanie  nagle  wyłączone,  odbiornik  po  zaniknięciu 
fali  bezpośredniej  będzie  jeszcze  przez  pewien  czas 
rejestrować  fale  rozproszone.  Jest  to  tzw.  zjawisko 
pogłosu  lub  rewerberacji  w morzu.  Zniekształca  ono 
przesyłane  w morzu  sygnały  dźwiękowe,  powoduje 
„rozciąganie”  ich  w czasie  i maskowanie  sygnału 
dźwięku  pożądanego  przez  powstające  sygnały  pa- 
sożytnicze (rozproszone). 


Tłumienie  dźwięku 

Wskutek  absorpcji  przez  ośrodek  dźwięk  w morzu 
jest  tłumiony,  czyli  zmniejsza  się  jego  amplituda 
w miarę  rozchodzenia  się  sygnału.  Wpływają  na  to 
głównie  dwa  czynniki.  Jeden  określa  się  jako  tzw. 
tłumienie  klasyczne,  w którym  decydującą  rolę  od- 
grywa lepkość  środowiska,  mniejszą  — przewodnictwo 
cieplne;  drugi  wiąże  się  z tzw.  relaksacją  strukturalną 
(-►  Przedmiot  i zakres  akustyki,  rozdział:  Akustyka 
molekularna),  a tu  główną  rolę  odgrywa  oddziaływa- 
nie fali  z drobinami  rozpuszczonego  w wodzie  mor- 
skiej siarczanu  magnezu  MgS04.  W praktyce  do  okre- 
ślenia współczynnika  tłumienia  amplitudy  fali  dźwię- 
kowej w wodzie  morskiej  używa  się  zwykle  empirycz- 
nego wzoru,  ustalonego  przez  W.  W.  Schulkina 
i Marsha,  który  uwzględnia  zarówno  istniejące  teorie 
absorpcji  dźwięku  w cieczach,  jak  i szereg  wyników 
doświadczalnych  uzyskanych  w morzu  przez  wielu 
autorów.  W szczególności  wzór  ten  uwzględnia  za- 
leżność od  głębokości  (poprzez  ciśnienie  hydrosta- 
tyczne) oraz  od  temperatury : 


a = 8,686*1 0~6v2 


/ 2,34 S-vT 


+ 


3,38 

VT 


X 


X (l  — 6,54*  10~4/?),  (9) 


gdzie  vt  ~ 21,9*  10"®~1520/<r+273),  S — zasolenie  w 
T — temperatura  bezwzględna,  v — częstość  fali 
w kHz,  p — ciśnienie  hydrostatyczne  w atm. 

W przestrzeni  otwartej  (w  praktyce  — w morzu 
głębokim)  natężenie  fali  dźwiękowej  wytworzonej 
przez  źródło  bezkierunkowe,  mierzone  w pewnej  od- 
ległości od  tego  źródła,  wyraża  się  wzorem 


gdzie  / — natężenie  w odległości  R od  źródła,  I0  — 
natężenie  odniesienia  w odległości  R0  = 1 m. 

Natężenie  dźwięku  maleje  odwrotnie  proporcjonal- 
nie do  kwadratu  odległości  od  źródła  oraz  eksponen- 
cjalnie  wskutek  absorpcji  w toni  wodnej.  Współczyn- 
nik absorpcji  zależy  od  częstości  fali  dźwiękowej,  od 
zasolenia,  temperatury  i ciśnienia  hydrostatycznego. 
Poziom  natężenia  dźwięku  (w  dB)  określony  jest  jako: 

L = 10  Ig-/-. 

*00 


Uwzględniając,  że  natężenie  dźwięku  jest  proporcjo- 
nalne do  kwadratu  amplitudy,  otrzymujemy 


L = 


gdzie  A i A00  — amplitudy  fali  akustycznej  odpowia- 
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zjawisko 
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Marsha 


dające  natężeniom  / i /«>  odpowiednio  (/00  — poziom 
odniesienia,  np.  1 W/m2).  Zatem 

L = L0  — (201g  e)a/?  — 20Jg  R, 

wyznaczanie  gdzie  e — podstawa  logarytmów  naturalnych.  Na 
współczyn-  podstawie  tego  wzoru  wyznacza  się  współczynnik 
nika  tłumienia  dźwięku  mierząc  poziom  natężenia  fali 
tłumienia  w dwóch  odległościach  R0  i R od  źródła.  Współczyn- 
nik tłumienia  a wyrażany  jest  w dB/m  lub  dB/km  — 
w zależności  od  tego,  czy  R mierzymy  w metrach  czy 
kilometrach.  Ostatni  składnik  20  Ig  R uważać  można 
za  regularną  poprawkę,  wynikającą  z kulistego  roz- 
chodzenia się  fali,  a liniowa  zależność  poziomu  natę- 
żenia L od  R pozwala  z nachylenia  prostej  znaleźć 

a = (201ge)a  = 8,686a, 

gdzie  a — współczynnik  tłumienia  w dB/km. 

Pomiary  takie  były  w oceanie  wielokrotnie  przepro- 
wadzane i wykazały  liniową  zależność  od  głębokości 
(od  ciśnienia  hydrostatycznego): 

a = a 0 — ap, 

gdzie  a0  — współczynnik  tłumienia  w dB/km  dla 
ciśnienia  odniesienia  (na  poziomie  morza),  a — współ- 
czynnik ciśnieniowy  tłumienia  w dB/(km-at). 

Na  rys.  38  są  porównane  wyniki  pomiarów  wyko- 
nane w morzu  z wynikami  uzyskanymi  z obliczeń  na 
podstawie  wzoru  (6). 
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Rys.  38.  Zależność  natężenia  fali  ultradźwiękowej  o częstości 
75  kHz  od  odległości  od  źródła.  Linie  ciągłe  — zależności  wy- 
znaczone w Oceanie  Spokojnym  przy  różnych  głębokościach 
— linie  przerywane  — zależności  przewidywane  przez  wzórSchul- 
kina-Marsha  (wg  Bezdeka) 


dyspersja  Zjawisko  dyspersji  prędkości  dźwięku,  czyli  za- 
prędkości  leżność  prędkości  od  częstości  fali,  pozostaje  w związ- 
ku głównie  z występowaniem  wspomnianej  wyżej 
relaksacyjnej  części  absorpcji  dźwięku.  Ta  dyspersja 
wykrywana  jest  w morzu  w zakresie  częstości  100- 
150  kHz.  Dyspersyjny  wpływ,  szczególnie  w morzach 
płytkich,  mają  także  procesy  tłumienia  i rozpraszania 
dźwięku  przez  dno  i sfalowaną  powierzchnię  morza. 
Dyspersyjne  własności  środowiska  morskiego  wy- 
raźnie mogą  wpływać  na  przesyłane  sygnały  dźwię- 
kowe, gdy  te  mają  szerokie  widmo  częstości,  co  ma 
przede  wszystkim  miejsce  przy  krótkich  w czasie 
przebiegach  impulsowych. 


Szumy  własne  morza 

Szumy  własne  morza,  które  ze  względu  na  pochodze- 
nie dzielimy,  jak  już  wspomniano,  na  naturalne 
i sztuczne,  stanowią  nie  mniej  bogaty  świat  dźwięków 
niż  otaczający  nas  bardziej  bezpośrednio  poznawalny 
świat  dźwięków  w atmosferze.  Jako  przykłady  źródeł 
naturalnych  szumu  morza  należy  wymienić : falowanie 


powierzchni  morza,  tarcie  wiatru  o powierzchnię, 
opady  atmosferyczne,  fluktuacje  termiczne,  burzliwe 
przepływy  mas  wodnych  oraz  aktywność  różnych  ga- 
tunków fauny  morskiej  (krewetki,  ryby,  delfiny  i wiele 
innych).  Szumy  pochodzące  od  technicznej  działal- 
ności człowieka  — to  głównie  hałasy  związane  z ru- 
chem statków  i innymi  operacjami  na  morzu  (np. 
poszukiwaniami  geologicznymi),  a w strefie  przy- 
brzeżnej — również  z działalnością  na  lądzie,  gdyż 
hałasy  łatwo  się  przez  ląd  przenoszą  do  wody. 

Pole  akustyczne  szumów  własnych  panujące  w toni 
morskiej  stanowi  ciągle  — mimo  intensywnych  ba- 
dań — temat  mało  znany,  gdyż  jest  ono  zależne  od 
bardzo  wielu  zmiennych  czynników.  Jako  pewną 
ogólną  charakterystykę  tego  pola  często  się  w litera- 
turze przytacza  widmo  szumów  własnych  morza 
(rys.  39),  w którym  się  rozróżnia  szereg  składowych 
pochodzących  z rozmaitych  źródeł.  Rysunek  40 
przedstawia  jako  przykład  dźwięków  biologicznych 
w morzu  zapis  sygnału  (i  jego  widmo)  wydawanego 
przez  rybę.  Ilustracja  26  (tabl.  8)  ukazuje  hydrofon 
rejestrujący  szumy  podwodne  w toni  morskiej. 


Rys.  39.  Składowe  akustycznego  pola  szumów  własnych  w morzu. 
Wykresy  przedstawiają  uśrednione  wyniki  wielu  badań  określa- 
jące poziomy  ciśnienia  akustycznego  i obszary  widmowe  (nie- 
bieskie strzałki  poziome)  przyporządkowane  prawdopodobnym 
źródłom  szumów  w zakresie  od  I Hz  do  100  Hz  (wg  Z.  Kluska) 
/ minimalny  i maksymalny  poziom  szumu  własnego;  2 szumy 
zależne  od  prędkości  wiatru,  niebieskie  okółkowane  cyfry  — siła 
wiatru  w skali  Beauforta,  których  źródłem  mogą  być  pęcherzyki 
gazów  i bryzgi;  linie  przerywane  określają  ekstrapolację  danych 
pomiarowych  do  poziomu  szumów  cieplnych;  3 tzw.  pseudo- 
dźwięki  — pulsacje  ciśnienia,  których  prędkość  fazowa  rozcho- 
dzenia się  jest  mniejsza  od  prędkości  dźwięku  w danym  środo- 
wisku w zakresie  małych  częstości;  4 szumy  rejestrowane  przy 
obfitych  opadach  atmosferycznych;  5 szumy  powstające  przy 
ożywionym  ruchu  statków;  6 hałasy  statków  na  wodach  płyt- 
kich; 7 hałasy  statków  na  wodach  głębokich;  8 szumy  cieplne; 
9 wybuchy  i wstrząsy  sejsmiczne;  10  krzywa  ekstrapolowana 
składowej  zależnej  od  wiatru;  11  szumy  rejestrowane  w akwenie 
całkowicie  pokrytym  lodami 
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Rys.  40.  Dźwięk  wydawany  przez  rybę  ( Opiccphalus  argus ) 
w chwili  schwytania  zdobyczy  zarejestrowany  w basenie  rzeki 
Amur:  a)  zapis  dźwięku  na  oscylografie  i b)  jego  widmo  (wg 
W.  R.  Protasowa  i E.  W.  Romanienko) 


Zastosowanie 

Całokształt  omówionych  wyżej  zjawisk  akustycznych 
w morzu  warunkuje  możliwości  wykorzystania  fal 
akustycznych.  Są  one  szerokie  i obejmują  zastosowa- 
nia: komunikacja  podwodna,  zdalne  pomiary  wiel- 
kości fizycznych  charakteryzujących  hydrosferę  (tem- 
peratura, ciśnienie  hydrostatyczne,  zasolenie,  pręd- 
kość prądów  mas  wodnych  itp.),  echosondaż  (po- 
miary głębokości,  analiza  dna  i poddennych  warstw 
geologicznych,  wykrywanie  zasobów  rybnych,  stero- 
wanie i obserwacja  procesów  połowów  ryb),  sonar 
(przeszukiwanie  toni  wodnej  w określonym  sektorze 
azymutalnym  i wykrywanie  obiektów  podwodnych, 
np.  przeszkód  nawigacyjnych,  ławic  ryb  itp.),  nawi- 
gacja (np.  log  dopplerowski  do  określania  szyb- 
kości względnej  ruchomych  obiektów). 

Urządzenia  ultradźwiękowe  służące  do  komunika- 
cji podwodnej  i hydrolokacji,  przy  korzystaniu  z któ- 
rych ważny  jest  zarówno  zasięg,  jak  i kolimacja  wiązki 
fal,  pracują  zwykle  w zakresie  częstości  optymalnych, 
rzędu  kilkudziesięciu  kHz.  Kiedy  chodzi  o uzyskanie 
dużego  zasięgu,  stosuje  się  sygnały  o częstościach 
mniejszych  (z  uwagi  na  mniejsze  tłumienie).  W niektó- 
rych zagadnieniach  specjalnych,  jak  badanie  przepły- 
wów czy  wykrywanie  obiektów  małych  na  podstawie 
zjawiska  Dopplera,  stosuje  się  także  ultradźwięki  o 
większych  częstościach  — kilkuset  kHz,  a nawet  MHz. 

Po  raz  pierwszy  zastosowano  ultradźwięki  do  celów 
podwodnych  podczas  I wojny  światowej,  kiedy  to 
P.  Langevin,  fizyk  francuski,  zbudował  urządzenie 
echolokacyjne  — echosondę.  Echosonda  wysyła  syg- 
nał (krótki  impuls),  a następnie  odbiera  go  po  odbiciu 
od  przeszkody;  długość  odstępu  czasu  między  wysła- 
niem i odebraniem  sygnału  i zmiana  jego  natężenia 
daje  informacje  o przeszkodzie,  zwłaszcza  o odległo- 
ści, w jakiej  się  znajduje  (rys.  41). 

SONAR  Układy  echolokacyjne  oparte  na  wykorzystaniu  fal 
ultradźwiękowych  w morzu  określa  się  obecnie  nazwą 
SONAR  ( Sonic  Navigation  and  Ranging).  Współ- 
czesne statki  wyposażone  są  w szereg  urządzeń  ultra- 
dźwiękowych do  badania  i penetrowania  hydrosfery; 
najważniejsze  z nich  przedstawia  poglądowo  rys.  42. 
W zależności  od  typu  statku,  jego  wielkości  i przezna- 
czenia liczba  tych  urządzeń  jest  różna.  Na  statkach 
dużych  instaluje  się  często  po  kilka  echosond,  o róż- 
nych zasięgach  i różnych  szerokościach  wiązki.  Urzą- 
dzenia hydro  lokacyjne  na  nowoczesnych  statkach, 
szczególnie  okrętach  wojennych,  statkach  rybackich 
i pomiarowo-badawczych  (np.  m/s  ,, Profesor  Sie- 


Rys.  41.  Schemat  i zasada  działania  echosondy  ultradźwiękowej 
na  statku:  / generator  impulsów  elektrycznych,  2 przetwornik 
nadawczy  impulsów  ultradźwiękowych,  3 przetwornik  odbiorczy 
impulsów  ultradźwiękowych,  4 wzmacniacz,  5 układ  synchroni- 
zujący, 6 rejestrator  piszący,  7 rejestrator  oscyloskopowy 


Rys.  42. Urządzenia  hydroakustyczne  na  statku  morskim:  / urzą- 
dzenie do  zdalnego  pomiaru  wielkości  fizycznych  — dane  reje- 
strowane przez  czujnik  pomiarowy  M przekazywane  są  na  statek 
badawczy  (lub  na  ląd)  przy  pomocy  łącza  ultradźwiękowego; 
2 hydrotelcfon  — urządzenie  do  dwustronnej  komunikacji  tele- 
fonicznej z nurkiem  swobodnym  lub  innym  obiektem  zanurzo- 
nym; i echosonda  ultradźwiękowa  do  pomiaru  głębokości  morza, 
badań  struktury  dna  oraz  wykrywania  ławic  ryb;  4 echosonda 
sieciowa  — do  określania  położenia  włoka  (zwłaszcza  pelagicz- 
nego),  jego  rozwarcia,  naprowadzenia  na  ławicę  i obserwacji 
ryb  wpadających  do  włoka;  5 sonar  do  przeszukiwania  toni  wod- 
nej w określonym  sektorze  azymutalnym  (zwykle  ±120°)  celem 
wykrycia  i lokalizacji  obiektów  podwodnych,  np.  gór  lodowych-, 
wraków,  ławic  ryb  itp.;  6 log  dopplerowski  — do  pomiaru  pręd- 
kości rzeczywistej  statku.  Jest  to  jedyny  przyrząd  umożliwiający 
pomiar  prędkości  statku  względem  dna  morza  bez  błędów  pow- 
stających wskutek  prądów,  wpływu  wiatru  itp.  czynników  (wg 
Z.  Jagodzińskiego) 


dlecki”),  współdziałają  z komputerami,  które  w bar- 
dzo szybki  i dokładny  sposób  przetwarzają  rejestro- 
wane sygnały  akustyczne  na  pożądane  informacje. 

R.  D.  Bobber  Hydroak  ust  iczesk  i je  izmie  rieni ja,  Moskwa  1 974  • 
L.  M.  Brekhowskikh  (cd.)  Akustika  okieana , Moskwa  1 974i 
J.  Dera  iin.  Wybrane  zagadnienia  fizyki  morza.  Część  V.  Rozpra- 
szanie dźwięku  na  sfalowanej  powierzchni  morza  i dnie  morskim • 
Post.  Fiz.  25,  175(1974);  J.  Dera  i in.  Wybrane  zagadnienia  fizyki 
morza.  Część  IV.  Fale  dźwiękowe  w morzu,  Post.  Fiz.  23,  667 
(1972);  Fizyka  morza,  cz.  II  — Akustyka  morza,  Sopot  1974; 
Z.  Kowalik  i in.  Podstawy  hydroakustyki,  Gdynia  1965;  A.  B. 
Staszkiewicz  Akustika  moria,  Leningrad  1966;  R.  W.  B.Stephens 
Underwater  Acoustics,  London  1970;  Studia  i materiały  oceano- 
logiczne  7,  109  (1973);  W.  W.  Szulkin  Fizyka  moria,  Moskwa 
1968. 


hydrolokacja 
w nawigacji 
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Fizyka  wód  śródlądowych 

Bohdan  Utrysko 


wody  Przez  pojęcie  wód  śródlądowych  rozumie  się  w tech- 
śródlądowe  nice  cieki  i zbiorniki  naturalne  i sztuczne,  tzn.  stru- 
mienie, rzeki,  kanały,  jeziora  i zbiorniki  zaporowe. 
W fizyce  rozszerzamy  pojęcie  wód  śródlądowych  na 
całą  tę  część  obiegu  wody  w przyrodzie,  która  się 
odbywa  na  lądzie.  Woda  śródlądowa  pojawia  się 
w postaci  opadu  lub  kondensacji  pary  wodnej  na  cia- 
łach stałych,  a opuszcza  ląd  parując  lub  odpływając  do 
morza.  Woda  opadowa  częściowo  paruje,  spływa  po 
powierzchni  ziemi  lub  wsiąka  w grunt,  by  zasilić  po- 
tem znów  wody  powierzchniowe  albo  wyparować. 
Wyodrębnić  więc  można  dwa  środowiska  występowa- 
nia wód  lądowych:  w korytach  i zbiornikach  otwar- 
tych (wody  powierzchniowe)  oraz  w porach  gruntów 
i szczelinach  skał  (wody  podziemne). 

Przepływ  wody  powierzchniowej  podlega  prawom 
badanym  przez  dynamikę  cieczy  (hydrodynamikę, 
hydraulikę),  zmiany  cieplne  obejmuje  termika  wód, 
efekty  oddziaływania  płynącej  wody  na  jej  koryto  — 
dynamika  koryt.  Całość  zagadnień  przepływów  pod- 
ziemnych obejmuje  nauka  zwana  najczęściej  teorią 
filtracji.  W każdej  z tych  nauk  istnieje  szereg  proble- 
mów, które  naukowcy  starają  się  rozwiązać  w aktual- 
nie prowadzonych  badaniach.  Aby  je  zrozumieć, 
konieczne  jest  wprowadzenie  w najogólniejsze  pojęcia 
i prawa  rządzące  w wymienionych  dziedzinach. 


Mechanika  przepływów  wód 
powierzchniowych 

Wody  powierzchniowe  pozostają  w kontakcie  z atmo- 
sferą całą  swą  powierzchnią,  zwaną  zwierciadłem 
albo  swobodną  powierzchnią  wody.  Na  powierzchni 
tej  panuje  wszędzie  jednakowe  ciśnienie. 

Woda  znajdująca  się  w stanie  spoczynku  w nie- 
ruchomym zbiorniku  poddana  jest  działaniu  sił  cięż- 
kości i ciśnienia,  równoważących  się  wzajemnie. 
Z warunku  równowagi  sił  wynika  wzór  na  ciśnienie 
hydrostatyczne : 

p 

w którym  /?„  jest  ciśnieniem  na  powierzchni,  h — 
zagłębieniem  punktu,  w którym  ciśnienie  wynosi  /?, 
Q — gęstością  wody. 

W wodzie  płynącej  związki  są  bardziej  złożone. 
W dowolnym  punkcie  obszaru  wypełnionego  cieczą 
i w dowolnej  chwili  t występuje  pewna  prędkość  v, 
ciśnienie  p,  a woda  posiada  gęstość  q.  Dla  znale- 
zienia wartości  tych  trzech  niewiadomych  potrzebne 
są  trzy  równania.  Są  to:  równanie  stanu,  wyrażające 
zależność  gęstości  wody  od  jej  ciśnienia  i temperatury, 
równanie  ciągłości,  wyrażające  warunek  zachowania 
masy,  oraz  równanie  ruchu,  wyrażające  zależność 
wszystkich  sił  działających  na  cząstkę  cieczy, 
charakterys-  W wielu  zagadnieniach  praktycznych,  szczególnie 
tyka  dotyczących  przepływów  wód  powierzchniowych, 
strumienia  w rozważaniach  traktuje  się  cały  strumień  cieczy  łącz- 
cieczy  nie  i bada  się  parametry  opisujące  globalnie  sytuację 
w danym  przekroju  strumienia.  Do  podstawowych 
wielkości  charakteryzujących  strumień  należą : 

— objętościowe  natężenie  przepływu  (krócej  prze- 


pływ) Qy  będące  stosunkiem  objętości  wody  dV , 
przepływającej  przez  pewien  przekrój  w czasie  dty  do 
tego  czasu. 

— pole  przekroju  poprzecznego  S.  Jeśli  chodzi  o prze- 
pływ w przewodach  zamkniętych,  jest  ono  z góry 
znane,  natomiast  w korytach  otwartych  zależy  od 
napełnienia  koryta.  Jeśli  kształt  koryta  jest  znany, 
pole  jest  jednoznacznie  określone  przez  rzędną  swo- 
bodnej powierzchni  z.  Niekiedy,  zwłaszcza  gdy  prze- 
krój koryta  jest  regularny,  wygodniej  jest  operować 
głębokością  średnią,  określoną  jako  r = S\By  gdzie 
B jest  szerokością  strumienia. 

— energia  potencjalna  płynącej  wody,  charaktery- 
zowana przez  hp  = z+pftgg),  tzw.  wysokość  energii 
potencjalnej. 

Gdy  kierunek  ruchu  jest  niewiele  odchylony  od 
poziomu,  a tak  jest  przecież  w rzekach  i kanałach, 
ciśnienie  wzdłuż  linii  pionowych  zmienia  się  niemal  tak 
jak  w wypadku  wody  stojącej  i hp  wszystkich  cząstek 
w przekroju  jest  wtedy  identyczne  i równe: 


*pow-i . 

eg 

Ponieważ  p0  jest  jednakowe  we  wszystkich  przekro- 
jach, do  określenia  energii  potencjalnej  strumienia 
w podanych  wyżej  warunkach  wystarczy  znajomość 
rzędnych  zwierciadła  wody  zp0w. 

Wielkościami  pochodnymi  od  wyżej  podanych  są 
występujące  często  we  wzorach  i obliczeniach: 
prędkość  średnia  w przekroju  v$r  = Q/S , 
promień  hydrauliczny  przekroju  Rh  = S/Oz.  Sym- 
bolem Oz  oznaczono  obwód  zwilżony,  czyli  długość 
tej  części  obwodu  przekroju  Sy  na  której  woda  sty- 
ka się  z ciałami  stałymi.  Przyjmuje  się,  że  w korytach 
naturalnych,  szerokich  i płytkich  ( B > 30^r)  Rh  = 

= hśT- 

Najogólniejszym  rodzajem  ruchu  wody  jest  prze- 
pływ nieustalony  (zmienny  w czasie).  W przepływie 
ustalonym  parametry  ruchu  nie  zależą  od  czasu,  a na- 
tężenie przepływu,  przynajmniej  między  dopływami 
lub  rozgałęzieniami  kanału,  pozostaje  stałe.  Jeżeli 
kształt  koryta  jest  niezmienny,  jego  kierunek  prosto- 
liniowy i głębokość  wszędzie  jednakowa,  to  mamy  do 
czynienia  z ruchem  jednostajnym.  Jest  to  najprostszy 
rodzaj  ruchu. 

W dynamice  przepływów  wód  powierzchniowych 
zmiany  gęstości,  wywołane  zmianami  ciśnienia  i tem- 
peratury, mają  najczęściej  znikome  znaczenie  i do  roz- 
ważań można  przyjąć  równanie  stanu  w postaci : 

q = const. 


Dla  koryt  otwartych,  przy  rozpatrywaniu  całościo- 
wym przekrojów  i założeniu  q = const,  równanie 
ciągłości  ma  postać  dQj3l+dSf£t  = 0.  W ruchu  usta- 
lonym (niezależnym  od  /)  równanie  to  upraszcza  się 
do  warunku  Q = const. 

W ruchu  jednostajnym  oraz  w zbliżonym  do  niego 
ustalonym  ruchu  wolnozmiennym  zależności  dyna- 
miczne wyraża  równanie  Bernoulliego  (rys.  1): 

eg  2g  eg  2 g 


linia  energii 


p] 

r 

" .i 

i 

r poziom  porównawczy 

Rys.  1.  Interpretacja  równa- 
nia Bernoulliego:  a)  ciecz  do- 
skonała, b)  ciecz  rzeczywista 
(w  równaniu  należy  wówczas 
uwzględnić  straty  energii) 


przepływ 
ustalony 
i nie- 
ustalony 


równanie 

Bernoulliego 
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wspólczyn-  Wielkości  z indeksami  1 i 2 dotyczą  dwóch  kolejnych 
nik  przekrojów  strumienia.  Współczynnik 

Coriolisa 


a = -4-  f 


zwany  współczynnikiem  Coriolisa  lub  Saint-Venanta, 
pozwala  na  uwzględnienie  nierównomiernego  roz- 
kładu energii  kinetycznej  w strumieniu.  Każdy  z wy- 
razów równania  Bernoulliego  ma  wymiar  liniowy  i wy- 
raża wysokość  odpowiedniego  rodzaju  energii  (po- 
tencjalnej i kinetycznej),  tzn.  stosunek  wielkości  e- 
nergii  do  ciężaru  cieczy.  Ostatni  symbol  Ahc  przedsta- 
wia różnicę  wysokości  łącznej  energii  mechanicznej 
w obu  przekrojach.  Ten  ubytek  energii  pochodzi  stąd, 
że  płynąca  ciecz  musi  pokonać  pewne  opory,  które 
są  analogiczne  do  sił  tarcia  ale  których  wielkość 
zależy  od  prędkości  ruchu. 

Bezwymiarowa  wielkość: 

1 dE 
mg  dl 

przedstawiająca  straty  energii  mechanicznej  E na 
jednostkę  długości  odniesione  do  ciężaru  płynącej 
wody,  nazywana  jest  spadkiem  hydraulicznym. 

Ruch  jednostajny  w korycie  otwartym  opisuje 
równanie  Bernoulliego  zredukowane  do: 

Zy  — Zo  = Jl. 


Wielkość /jest  więc  wtedy  równa  spadkowi  zwier- 
ciadła wody. 

Określenie  ilości  energii  zużytej  na  pokonanie  o- 
porów  ruchu  i wyjaśnienie  mechanizmu  powstawania 
tych  strat  stanowi  jedno  z najważniejszych  zadań 
dynamiki  przepływów.  Jeśli  prędkość  jest  bardzo 
mała,  cząsteczki  wody  płyną  wzdłuż  regularnych  to- 
ruch  rów,  tworząc  warstewki  posuwające  się  jedne  po  dru- 
laminarny  gich.  Ruch  taki  nazwano  uwarstwionym,  czyli  lami- 
narnym. 

Wyobraźmy  sobie  dwie  bardzo  duże  płaskie  płyty 
(rys.  2),  między  którymi  znajduje  się  ciecz.  Górna 
płyta  przesuwa  się  względem  dolnej  równolegle  i ze 


Rys.  2.  Ruch  cieczy  lepkiej  między  płytami  ruchomą  i nieruchomą 


stałą  prędkością  v0.  Cząsteczki  wody  przylegające 
do  obu  płyt  mają  prędkości  takie  jak  płyty,  tzn. 
w pobliżu  płyty  górnej  mają  prędkość  v0.  Natomiast 
cząsteczki  znajdujące  się  dalej  płyną  z coraz  mniej- 
szą prędkością;  płyną  one  warstewkami  (stąd  nazwa 
uwarstwiony,  laminarny)  jedna  po  drugiej.  Newton 
podał  wzór  wiążący  występującą  między  sąsiednimi 
warstewkami  siłę  tarcia  wewnętrznego  T z prędkością 
ruchu : 


(Sjest  powierzchnią,  na  której  działa  siła  styczna  T). 
Występujący  we  wzorze  współczynnik  proporcjo- 
nalności //  zwany  jest  dynamicznym  współczynnikiem 
lepkości.  Jest  to  wielkość  charakteryzująca  dany 
płyn,  np.  dynamiczny  współczynnik  lepkości  wody 
w temperaturze  20°C  ma  wartość  0,001  Ns/m2,  oliwy 


zaś  0,084  Ns/m2.  Maleje  on  szybko  ze  wzrostem  tem- 
peratury; zależność  dynamicznego  współczynnika 
lepkości  wody  od  temperatury  jest  przedstawiona  na 
rys.  3. 


temperatura 

Rys.  3.  Wykres  zależności  lepkości  wody  od  temperatury 


Przy  nieco  większych  prędkościach  obraz  ruchu 
bardzo  się  komplikuje.  Cząsteczki  wody,  poruszając 
się  wzdłuż  torów  chaotycznych  i splątanych,  tworzą 
mniejsze  i większe  zawirowania.  Nawet  w ruchu 
makroskopowo  ustalonym  chwilowa  prędkość  i ciśnie- 
nie w każdym  punkcie  podlegają  bardzo  szybkim 
i przypadkowym  zmianom.  Ruch  taki  nazywa  się 
burzliwym  lub  turbulentnym.  W ruchu  burzliwym  tar- 
cie wewnętrzne  jest  o wiele  większe  niżby  to  wynikało 
z wzoru  Newtona  przy  założeniu,  że  vQ  jest  prędkością 
przeciętną,  tzn.  średnią  w czasie  w każdym  punkcie. 
Co  więcej,  z tego  wzoru  wynika,  że  straty  powinny 
być  proporcjonalne  do  prędkości,  natomiast  doświad- 
czenia wykazują,  że  w ruchu  burzliwym  dwukrotny 
wzrost  prędkości  średniej  powoduje  prawie  cztero- 
krotny wzrost  strat.  Znaczy  to,  że  szukana  zależność 
jest  zbliżona  do  parabolicznej.  We  wszystkich  rodza- 
jach przepływu  wód  powierzchniowych  interesujących 
ze  względu  na  znaczenie  praktyczne  występuje  roz- 
winięty ruch  turbulentny. 

W praktyce  do  obliczeń  prędkości  średniej  najczęściej 
stosuje  się  wzór  Chezy’ego: 

Vśr  ==  c \/  Rh  • J . 

Współczynnik  c może  być  wyznaczony  z różnych  wzo- 
rów empirycznych,  np.  ze  wzoru  Manninga: 


gdzie  n jest  współczynnikiem  szorstkości.  Niektóre 
wartości  tego  współczynnika  dotyczące  przepływów 
w korytach  otwartych  podano  w tabeli. 


Wartości  współczynnika  szorstkości  n do  wzoru  Manninga 


Rodzaj  koryta 

n 

Kanały  betonowe 

0,017 

Kanały  w zwartej  ziemi 

Małe  kanały  ziemne,  rzeki  o czystym  i prostym 

0,020 

korycie 

Kanały  w złym  stanie,  rzeki  o dobrych  warunkach 

0,025 

przepływu 

0,030 

Rzeki  o przeciętnych  warunkach  przepływu 

0,035 

Rzeki  kręte,  częściowo  zarośnięte 

0,040 

W ruchu  wolnozmiennym,  tzn.  takim,  w którym  za- 
równo przekroje  5,  jak  i rozkłady  prędkości  wzdłuż 
strumienia  zmieniają  się  płynnie  i niezbyt  szybko, 
równanie  Bernoulliego  dotyczące  odcinka  / ma  postać: 


2 g 


Z równania  tego  można  wyznaczyć  położenie  zwier- 
ciadła w kolejnych  przekrojach  (rys.  4). 


ruch 

turbulentny 


wzór 

Chezy'ego 


wzór 

Manninga 
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Rys.  4.  Przepływ  wolnozmienny  w rzece  — bilans  energii 


Bardzo  istotną  sprawą,  zwłaszcza  gdy  chodzi  o prze- 
pływy niejednostajne,  jest  określenie  typu  ruchu. 
Ta  sama  ilość  wody  może  płynąć  w danym  korycie 
prędzej,  mniejszym  przekrojem,  lub  wolniej  — kory- 
tem o większej  powierzchni  i głębokości.  Zależnie  od 
głębokości  i prędkości  zmienia  się  energia  strumienia : 
gdy  przekrój  strumienia  dąży  do  zera,  prędkość  i e- 
nergia  kinetyczna  rośnie  nieograniczenie;  natomiast 
gdy  głębokość  i energia  potencjalna  dąży  do  nieskoń- 
czoności, prędkość  i energia  kinetyczna  maleje  do 
zera  (rys.  5).  Pomiędzy  tymi  dwoma  skrajnymi  ro- 
dzajami przepływu  mieszczą  się  przepływy  rzeczy- 


Rys.  5.  Zależność  energii  strumienia  od  jego  głębokości,  przy 
stałym  natężeniu  przepływu 


przepływ  wiste,  o ograniczonej  energii,  a wśród  nich  prze- 
krytyczny  pływ  o energii  minimalnej,  nazywany  krytycznym. 

Jest  to  taki  przepływ,  w którym  przy  danym  Q ener- 
gia całkowita  (określona  sumą  wyrazów  równania 
Bernoulliego)  jest  najmniejsza  z możliwych.  Para- 
metry ruchu  krytycznego  są  związane  równaniem 

B g * 

Odpowiada  to  prędkości  zwanej  również  krytyczną: 


prędkość 

krytyczna 


Vk  = 


Prędkość  ta  jest  niemal  równa  prędkości  rozchodze- 
nia się  fal  powierzchniowych.  Ruch  krytyczny  jest 
istotny  z dwóch  względów:  1)  Szereg  zjawisk  w przy- 
rodzie zachodzi  według  zasady  minimum  energii,  np. 
przypływy  przez  progi,  przewężenia,  jeżeli  strumień 
przy  tym  ulega  spiętrzeniu,  odbywają  się  ruchem  kry- 
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tycznym.  2)  Po  przekroczeniu  vk  żadne  zaburzenia  nie 
mogą  się  już  przenosić  pod  prąd.  Prędkość  wody  jest 
większa  od  prędkości  fal  biegnących  po  jej  powierzchni 
w przeciwnym  kierunku. 

Ze  względu  na  tę  ostatnią  cechę  dzielimy  przepływy 
na  dwa  rodzaje:  przepływy  spokojne,  v < w któ- 
rych zaburzenia  przenoszą  się  w obie  strony  cieku 
(ruchem  spokojnym  płynie  ogromna  większość  rzek, 
strumieni  i potoków);  przepływy  rwące,  v > vk>  w 
których  górna  część  cieku  jest  izolowana  od  wpływu 
czynników  występujących  poniżej  (ruch  ten  występuje 
w niektórych  potokach  górskich  i u podnóża  budo- 
wli piętrzących  wodę). 

Oprócz  wymienionego  już  ustalonego  ruchu  wolno- 
zmiennego  spotyka  się  w naturze  przepływy  z gwał- 
townymi zmianami  warunków  ruchu.  Jako  ciekawy 
przykład  takiego  przepływu  można  podać  przejście 
z ruchu  rwącego  do  ruchu  spokojnego.  Strumień  pły- 
nący ruchem  rwącym  o niewielkiej  głębokości  na- 
trafia na  wodę  płynącą  ruchem  spokojnym,  wolniej- 
szym, o powierzchni  wzniesionej  dużo  wyżej  (rys.  6). 
Powstaje  niepodparta  ściana  wody,  z której  spływa  ona 
w kierunku  pod  prąd.  Woda  ta  nie  możejednak  płynąć 
dalej,  porywa  ją  bowiem  i unosi  z powrotem  strumień 
rwący.  Powstaje  spłaszczony  walec  o poziomej  osi, 
w którym  krąży  woda.  Strumień  przepływający  pod 


Rys.  6.  ^Odskok”  — przejście  strumienia  z ruchu  rwącego  w ruch 
spokojny 


spodem  walca  jest  hamowany  przez  różnicę  ciśnień  do 
prędkości  ruchu  spokojnego  — i dalej  znów  całym 
przekrojem  płynie  w kierunku  zasadniczym.  Zjawisko 
to  nazywa  się  odskokiem  i można  je  często  obserwo- 
wać, gdy  woda  spływa  po  stromej  ścianie  i trafia  do 
zbiornika  lub  na  płaski  odcinek  koryta. 

W badaniach  ruchów  nieustalonych  wyodrębnić  na- 
leży przede  wszystkim  ruchy  okresowe  i nieokresowe. 
Ruchy  okresowe,  czyli  falowanie,  odgrywają  w dyna- 
mice wód  śródlądowych  mniejszą  rolę,  natomiast 
stanowią  istotny  element  dynamiki  morza.  Ruchy  nie- 
okresowe można  podzielić  na  przepływy  o zmianach 
powolnych  i zmianach  gwałtownych.  Przykładem 
przepływu  pierwszego  rodzaju  jest  fala  powodziowa; 
długość  fali  jest  tysiące  razy  większa  od  jej  wysokości, 
prędkość  przesuwania  się  szczytu  fali  jest  nieco  więk- 
sza niż  prędkość  przepływu,  ale  wznoszenie  zwierciad- 
ła odbywa  się  bardzo  powoli.  Z gwałtownymi  zmiana- 
mi przepływa  możemy  mieć  do  czynienia  np.  w mo- 
mencie przerwania  zapory  piętrzącej  wodę.  W dół  rze- 
ki biegnie  wtedy  potężna  i stroma  fala  o wielkiej 
energii,  ale  dość  szybko  rozpływająca  się,  zwłaszcza 
gdy  objętość  zbiornika  jest  niewielka,  a dolina  — 
szeroka.  Jednocześnie  w samym  zbiorniku  powstaje 
gwałtowna  fala  obniżenia,  idąca  w górę  cieku.  Jest 
ona  również  niebezpieczna  (chociaż  w mniejszym 
stopniu  niż  fala  przyboru),  może  bowiem  spowo- 
dować obsunięcie  zboczy  zbiornika  i zniszczyć  jego 
brzegi. 

Prowadzone  współcześnie  badania  w dziedzinie 
przepływów  wód  powierzchniowych  skupiają  się  na 
następujących  zagadnieniach: 

a)  zrozumieniu  zjawisk  zachodzących  wewnątrz 
strumienia  cieczy,  przede  wszystkim  turbulencji 
i związanego  z nią  zjawiska  dyfuzji; 

b)  badaniu  zjawisk  wzajemnego  oddziaływania 
dwóch  strumieni,  np.  wody  słodkiej  i słonej  (ujścia 
rzek),  ciepłej  i zimnej  (zrzuty  wody  chłodzącej), 
czystej  i zanieczyszczonej : 

c)  bardzo  istotnych  i ciekawych  doświadczeniach 
na  modelach  kanałów,  rzeki  budowli  wodnych.  Zja- 


przeplywy 
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odskok 


badania 

współczesne 
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transportowa 

strumienia 


wiska  zachodzące  w strumieniu  wody  płynącym  kory- 
tem o skomplikowanym  kształcie  są  tak  złożone,  że 
nie  znane  są  jeszcze  metody  opisu  matematycznego  te- 
go ruchu  ani  sposoby  rozwiązania.  Jeżeli  się  chce  wie- 
dzieć, co  się  będzie  działo  po  zbudowaniu  zapory  czy 
uregulowaniu  rzeki,  uciec  się  trzeba  do  doświadczeń. 
Oczywiście  nie  może  to  być  doświadczenie  w warun- 
kach naturalnych,  bo  nie  do  pomyślenia  jest  wznosze- 
nie na  próbę  kosztownych  budowli.  Odtwarza  się  je 
więc  w laboratorium  w zmniejszonej  skali  i na  takim 
modelu  wykonuje  się  doświadczenia.  Zasady  odtwa- 
rzania zjawisk  dynamicznie  podobnych,  konstruo- 
wania modeli  i wykonywania  na  nich  badań  stanowią 
dziś  już  odrębny  dział  mechaniki  cieczy.  Coraz  częś- 
ciej badania  modelowe  wspomaga  się  aparaturą  elek- 
tronową i maszynami  liczącymi,  które  rejestrują  i o- 
pracowują  wyniki  pomiarów,  a ponadto  służą  do  wy- 
konywania— jednocześnie  z doświadczeniami  fi- 
zycznymi — obliczeń  tego  samego  zadania. 

d)  technice  cyfrowej,  która  pozwoliła  również  na 
przeprowadzenie  bardzo  skomplikowanych  obliczeń 
i rozwiązywanie  metodami  przybliżonymi  złożonych 
równań  (dotyczących  np.  ruchu  nieustalonego). 


Dynamika  koryt 

Woda  płynąca  korytem  rzeki  oddziałuje  na  nie  po- 
wodując erozję  (rozmycie),  transport  cząstek  sta- 
łych i ich  sedymentację  (osadzanie).  Energia  prze- 
pływu zużywana  jest  nic  tylko  na  pokonanie  oporów 
ruchu,  ale  również  na  odspojenie  materiału,  jego  tran- 
sport i obróbkę  (rozdrobnienie  i wygładzenie). 
Wszystko  to  powoduje,  że  spadek  hydrauliczny  w ko- 
rycie niosącym  rumowisko  jest  większy  niż  w odpo- 
wiadającym mu  korycie  o dnie  stałym.  Istnieje  zależ- 
ność między  ilością  i jakością  (wielkością  i gęstością) 
materiału  wleczonego  i unoszonego  a parametrami 
samego  przepływu,  a więc  głębokością  wody  h i spad- 
kiem hydraulicznym  J.  Każdy  strumień  posiada  pew- 
ną zdolność  transportową,  którą  stara  się  wykorzystać. 
Jeśli  więc  na  jakimś  odcinku  cieku  ilość  materiału 
dostarczana  przez  przekrój  początkowy  jest  mniejsza 
niż  zdolność  transportowa  w dolnej  części  odcinka, 
następuje  erozja  i wynoszenie  dodatkowych  ilości  ma- 
teriału. Prowadzi  to  do  silnych  rozmyć,  głównie 
brzegów,  rzeka  zaczyna  meandrować,  jej  bieg  się  wy- 
dłuża, maleje  spadek,  a z nim  i zdolność  transporto- 
wa. Jeżeli  brzegi  są  zabezpieczone  przed  rozmyciem, 
następuje  silne  pogłębienie  koryta.  Zjawisko  to  wy- 
stępuje wyraźnie  np.  po  wybudowaniu  zapory  i stwo- 
rzeniu zbiornika.  Spadki  powyżej  zapory  są  bardzo 
małe  i całe  rumowisko  osadza  się  w zbiorniku  lub 
przy  wlocie  do  niego.  Następuje  przy  tym  rozsorto- 
wanie  materiału.  Im  bliżej  zapory,  tym  mniejsza 
prędkość  wody  i tym  drobniejszy  materiał  osiada  na 
dnie.  Przez  zaporę  przepływa  już  tylko  czysta  woda 
i strumień  stara  się  jak  najszybciej  „nasycić”  ma- 
teriałem rozmywając  i pogłębiając  koryto  poniżej 
budowli. 

Ilości  transportowanego  materiału  mogą  być  bar- 
dzo duże  (np.  Wisła  środkowa  przenosi  w przybliże- 
niu masę  3 min  ton  rocznie).  Sprawy  określenia 
bilansu  rumowiska,  jego  ilość  i jakość  są  więc  istotne, 
ale  i bardzo  skomplikowane.  Powodem  tego  jest  nie 
tylko  niedostateczna  jeszcze  znajomość  mechanizmu 
unoszenia  i wleczenia,  duża  różnorodność  kształtu 
i wielkości  ziaren  oraz  form  dna,  ale  i ciągła  zmiana 
warunków  przepływu:  prędkości,  głębokości,  a nawet 
spadku.  Otrzymane  z doświadczeń  liczne  wzory  o- 
kreślające  ilość  rumowiska  mają  wciąż  jeszcze  charak- 
ter empiryczny  i dość  wąskie  zastosowanie. 

Graniczna  prędkość  przepływu,  poniżej  której 
ziarna  pozostają  nieruchome,  zależy  od  wielkości 
ziaren,  z których  zbudowane  jest  dno  (od  ich  średnicy 
d ) i wyznacza  się  ją  doświadczalnie.  Zależnie  od  pręd- 
kości przepływu  materiał  dna  tworzy  różne  formy. 
Jeśli  prędkość  jest  mała,  ale  przekracza  prędkość 


graniczną,  na  płaskim  dnie  powstają  drobne  zmarszcz- 
ki. Przy  wzroście  prędkości  pojawiają  się  większe 
fałdy  (diuny),  pokryte  często  zmarszczkami.  Ziarna 
wtaczają  się  po  łagodnym  stoku  fałdy  i przesypują 
się  przez  jej  krawędź.  Przy  dalszym  wzroście  prędkości 
dno  znowu  staje  się  płaskie  i wszystkie  cząstki  biorą 
jednocześnie  udział  w ruchu.  Wreszcie  przy  bardzo  du- 
żej prędkości  wystąpić  mogą  znowu  fałdy  (antydiuny). 
Stroną  o łagodniejszym  stoku  są  one  zwrócone  w kie- 
runku przepływu  i przesuwają  się  (fałdy,  a nie  tworzą- 
ce je  ziarna!)  pod  prąd.  Zależnie  od  istniejących  form 
dennych  zmienia  się  szorstkość  dna  i opór  stawiany 
przepływowi  wody. 


Mechanika  przepływów  wód  podziemnych 

Grunty  sypkie  składają  się  z ziaren  różnej  wielkości 
i kształtu.  Między  ziarnami,  w porach  gruntu,  może 
się  znajdować  i przepływać  woda.  Jeżeli  woda  wy- 
pełnia wszystkie  pory,  mówimy,  że  grunt  jest  całko- 
wicie nasycony  wodą,  jeżeli  nie  — nasycenie  jest 
niepełne.  Kanaliki,  którymi  przepływa  woda  w grun- 
cie, mają  bardzo  skomplikowane  i różnorodne  formy. 
Nie  jest  więc  możliwe  ani  konieczne  określenie  rze- 
czywistej prędkości  cząstek  wody.  W rozważaniach 
zastępuje  się  prędkość  rzeczywistą  fikcyjną  pręd- 
kością filtracji.  Jest  to  iloraz  przepływu  i całkowi- 
tego pola  przekroju  warstwy,  tzn.  łącznie  pola  kana- 
lików i ziaren:  ty  = Q/Sw.  Oczywiście  prędkość 
filtracji  jest  mniejsza  od  prędkości  rzeczywistej.  Z wy- 
jątkiem wypadków  przepływu  wody  przez  złoża  ru- 
moszu i bardzo  grubego  żwiru,  gdzie  się  może  pojawić 
turbulencja,  przepływ  w gruntach  odbywa  się  ruchem 
laminamym.  Opory  ruchu  wyrażają  się  wtedy  wzorem 
Darcy’ego: 

, r , dh 
vf  = kJ  = —k-jf* 

Współczynnik  filtracji  k zależy  od  rodzaju  gruntu, 
tzn.  od  wielkości  ziaren,  ilości  porów  i temperatury 
wody  (lepkości);  współczynnik  k żwirów  wynosi 
ok.  3 *10~2  m/s,  piasków  średnioziamistych  10“ 4 m/s, 
glin  10”8m/s. 

Ponieważ  hp  = z+pl(Qg)  oznacza  wysokość  energii 
potencjalnej  wody,  a równanie  ciągłości  w wypadku 

nieściśliwego  gruntu  i wody  wyraża  wzór  div  ty  = 0, 
złożenie  obu  tych  wzorów,  gdy  grunt  jest  jednorodny 
(stałe  k ),  prowadzi  do  równania  Laplace’a: 

V2hp  = 0. 

Jest  to  równanie  identyczne  co  do  postaci  z rów- 
naniem określającym  przepływ  prądu  elektrycznego. 
Można  mówić  o analogii  dwóch  zjawisk:  przepływu 
wody  w gruncie  i prądu  w przewodniku.  Wysokość 
energii  hp  odpowiada  napięciu  prądu,  przepływ  wo- 
dy Q — natężeniu  prądu,  a odwrotność  k — opornoś- 
ci przewodnika.  Analogię  tę  wykorzystuje  się  dziś 
powszechnie  przy  badaniu  skomplikowanych  prze- 
pływów wód  podziemnych  — stosuje  się  mianowicie 
albo  modele  AEHD  (modele  analogii  elektro-hydro- 
dynamicznej),  albo  specjalne  urządzenie  zwane  ana- 
lizatorem pola. 

W metodzie  AEHD  modelami  gruntu  są  przewodni- 
ki o kształcie  geometrycznie  podobnym  do  badanej 
warstwy.  Jeżeli  model  może  być  płaski,  tzn.  gdy  prze- 
pływ odbywa  się  w równoległych  płaszczyznach  (np. 
pionowych),  jako  przewodnika  używa  się  papieru  ele- 
ktroprzewodzącego ; wycina  się  z niego  kształt  (rys. 
7b)  odpowiadający  rzeczywistym  warunkom  przepły- 
wu (rys.  7a).  Jeśli  zadanie  jest  bardziej  złożone,  użyć 
można  elektrolitu,  wypełniającego  wanienkę  o odpo- 
wiednim kształcie.  Sondą  podłączoną  przez  galwano- 
metr  do  dzielnika  napięcia  wyznacza  się  przebieg  linii 
jednakowego  napięcia,  odpowiadających  liniom  jedna- 
kowej energii  wody.  Linie  przepływu  wody  (linie 
prądu)  są  prostopadłe  do  linii  jednakowej  energii, 
a szybkość  filtracji  — odwrotnie  proporcjonalna  do 
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odległości  między  dwoma  kolejnymi  liniami  energii. 
Można  więc  określić  zarówno  przepływ,  jak  i ciśnie- 
nie w całym  obszarze.  Metoda  AEHD  została  bardzo 
rozwinięta.  Przy  użyciu  tzw.  modeli  odwrotnych  moż- 
na wyznaczać  w doświadczeniach  przebieg  linii  prą- 
du ; dołączając  do  modelu  głównego  dodatkowe  opor- 
niki, można  rozwiązywać  zadania  bardziej  złożone, 
a nawet  — na  modelach  płaskich  — można  badać 
pewne  przepływy  trójwymiarowe. 


modelowanie 

filtracji 


analizator 

pola 


ruch  w 
strefie  nie- 
nasyconej 


grunt  przepuszczalny 
a) 


Rys.  7.  Filtracja  wody  pod  budowlą:  a)  przekrój  przez  jaz  pię- 
trzący wodę,  przepływ  w warunkach  rzeczywistych,  b)  model 
typu  AEHD  przepuszczalnej  warstwy,  na  której  zbudowany 
jest  jaz,  c)  model  warstwy  przepuszczalnej  zbudowany  z oporni- 
ków w analizatorze  pola 

Analizator  pola  jest  urządzeniem  umożliwiającym 
rozwiązywanie  pewnego  rodzaju  równań  różniczko- 
wych, między  innymi  równania  przepływu  wód  pod- 
ziemnych. Warstwę  wodonośną  gruntu  dzieli  się  na 
prostokątne  pola,  w środku  których  umieszcza  się 
węzły.  Przewodność  gruntu  między  dwoma  sąsiednimi 
polami  zastępują  na  modelu  odpowiednio  dobrane 
oporniki,  wstawione  między  węzły  (rys.  7c).  Warstwę 
wodonośną  zastępuje  siatka  oporników,  do  której 
na  brzegach  przykłada  się  napięcie.  Badania  na  anali- 
zatorze pola  są  szybsze  i wygodniejsze  niż  na  modelach 
AEHD,  ale  wymagają  dalej  idącej  schematyzacji  wa- 
runków przepływu. 

Wiele  ostatnio  prowadzonych  badań  dotyczy  ruchu 
wody  w strefie  niepełnego  nasycenia.  Siły  powodujące 
ruch  w tej  strefie  to  ciężar  wody,  napięcie  kapilarne, 
ewentualnie  ciśnienie  osmotyczne  przy  zmiennym 
zasoleniu  wody  w różnych  miejscach  warstwy.  Jeżeli 
wyrazimy  te  siły  przez  wysokość  energii  hv , a ilość 
płynącej  wody  — przez  umowną  średnią  prędkość 
filtracji  v,  to  i w strefie  nienasyconej  słuszny  będzie 

wzór:  , « 


Współczynnik  ko  jest  jednak  zależny  nie  tylko  od 
jakości  gruntu,  ale  i od  ilości  wody  zawartej  w jed- 
nostce objętości  gruntu  0.  Również  potencjał  h za- 
leży od  0.  Badania  przepływów  w strefie  nienasyconej 
wymaga  więc  ciągłych  badań  wilgotności  gruntu. 
Najwygodniejszą  metodą  okazał  się  pomiar  pochłania- 
nia promieni  gamma  emitowanych  przez  izotop  pro- 
mieniotwórczy. Pozwala  to  na  badanie  próbek  bez  ich 
suszenia  i naruszania  struktury,  a więc  podczas  do- 
świadczeń. Ruch  wody  w strefie  nie  nasyconej  ma 
duże  znaczenie,  woda  bowiem  wznosząca  się  w górę 
zasila  korzenie  roślin,  zwilża  grunt  i zwiększa  paro- 
wanie. Po  deszczu  natomiast  woda  wsiąkająca 
w grunt  (infiltrująca)  musi  przebyć  tę  strefę,  zanim 
osiągnie  warstwę  wodonośną. 


Termika  wód 

Woda  znajdująca  się  w zbiorniku  lub  między  dwoma 
przekrojami  cieku  posiada  w danej  chwili  ilość  cie- 
pła Q.  Wskutek  dopływu  ciepła  do  zbiornika  i odpły- 
wu ciepła  do  otoczenia  ilość  ta  zmienia  się  o AQy  co 
powoduje  zmiany  temperatury  wody.  Ilości  ciepła 
biorące  udział  w wymianie  w pewnym  czasie  / ujmuje 
równanie  bilansu  cieplnego: 


R -r  Qe  -\-Qa  -f  Qv  — AQ. 


bilans 

cieplny 


R oznacza  ilość  ciepła  przenoszoną  przez  promienio- 
wanie (krótkie  i długofalowe),  Qe  — ciepło  zużywane 
w związku  z procesem  parowania,  Qa  — ciepło  wy- 
mieniane z atmosferą  przez  konwekcję,  Qv  — ilość 
ciepła  transportowaną  z wodą  wpływającą  i wypły- 
wającą z badanego  obszaru.  W okresie  letnim  woda 
ochładza  się  głównie  przez  parowanie,  w okresie  zi- 
mowym większą  rolę  odgrywa  czynnik  Qa. 

W wodach  płynących  i w płytkich  jeziorach  woda 
ulega  często  wymieszaniu  i znajduje  się  pod  wpływem 
dobowych  zmian  temperatury.  Natomiast  w głębo-  rozkład 
kich  jeziorach  wytwarza  się  pewien  typowy  rozkład  temperatury 
temperatur,  zasadniczo  różny  w okresie  letnim  i zimo-  w jeziorze 
wym  (rys.  8).  W lecie  temperatura  wody  w pobliżu  dna 
wynosi  ok.  10°C  (tzn.  nieco  więcej  niż  średnia  tempe- 
ratura w Polsce);  powyżej  zalega  warstwa  wody  cie- 
plejszej, podlegającej  wpływom  atmosfery.  W zimie 


Rys.  8.  Wykresy  rozkładu  temperatury  w głębokich  jeziorach: 
a)  w lecie,  b)  w zimie 

na  powierzchni  wody  tworzy  się  powloką  lodowa, 
pod  nią  temperatura  wody  wynosi  0°C,  niżej  woda  jest 
coraz  cieplejsza  — aż  do  4°C  w pobliżu  dna.  To  cieka- 
we zjawisko  odwrócenia  rozkładu  temperatur  wystę- 
puje dzięki  anomalii,  jaką  posiada  gęstość  wody.  Dwa 
razy  do  roku  — na  wiosnę  i na  jesieni  — występuje 
przemieszczenie  wód  w jeziorze  i wówczas  temperatura 
w całej  masie  wody  jest  wyrównana. 

Poważnym  problemem  technicznym  i naukowym  zrzucenie 
jest  wymiana  ciepła  w zbiornikach  i rzekach,  do  któ-  podgrzanej 
rych  zrzuca  się  podgrzaną  wodę  z elektrowni  lub  in-  wody 
nych  zakładów  przemysłowych.  Z punktu  widzenia 
sprawności  chłodzenia  aparatury  i kosztów  inwestycyj- 
nych jest  to  rozwiązanie  najwygodniejsze,  wymaga 
jednak  spełnienia  dwóch  warunków:  woda  w rzece 
czy  jeziorze  nie  może  być  podgrzana  powyżej  pewnej 
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granicy,  przekroczenie  której  stanów  zagrożenie  dla 
życia  biologicznego  (w  Polsce  ok.  26 °C);  w zbiorni- 
kach pobór  i zrzut  muszą  być  tak  usytuowane  wzglę- 
dem siebie,  aby  do  ujęcia  dopływała  woda  odpo- 
wiednio ochłodzona. 

Na  ogół  w rzekach  następuje  szybkie  wymieszanie 
wody  na  całej  głębokości,  natomiast  jest  wyraźne 
zróżnicowanie  temperatur  w poprzek  cieku.  Całymi 
kilometrami  woda  przy  jednym  brzegu  może  być  wy- 
raźnie cieplejsza  niż  przy  drugim  (np.  na  odcinku  ok. 
40  km  poniżej  elektrowni  w Kozienicach  utrzymuje  się 
różnica  temperatur  ok.  2°C  pomiędzy  wodą  płynącą 
przy  brzegu  lewym  i prawym).  Podobnie  wygląda 
sytuacja  w płytkich  jeziorach.  W rzekach  głębokich 
zjawisko  przebiega  inaczej,  np.  poniżej  elektrowni 
„Dolna  Odra”  przy  głębokości  rzeki  10  m ciepła  woda 
miesza  się  tylko  w górnej  4-metrowej  warstwie.  Bar- 
dziej złożony  układ  powstaje  w głębokich  jeziorach. 
Woda  ciepła  tworzy  strumień  powoli  rozlewający  się 
po  powierzchni  i zmierzający  do  miejsca  poboru  wody 
(rys.  9).  Strumień  ten  porywa  ze  sobą  pewne  ilości 
wody  zimnej  i miesza  się  z nią.  Ochłodzenie  następuje 
częściowo  przez  wymieszanie,  a głównie  przez  paro- 
wanie i oddawanie  ciepła  do  atmosfery.  Na  większej 


Rys.  9.  Mieszanie  się  ciepłego  strumienia  z chłodnymi  wodami 
głębokiego  zbiornika 


głębokości,  pod  strumieniem  ciepłym,  tworzy  się  po- 
wrotny prąd  wody  zimnej,  który  uzupełnia  wodę  po- 
rywaną przez  prąd  ciepły.  Zachodzące  zjawiska  są 
bardzo  złożone  i trudne  do  odtworzenia  w warunkach 
laboratoryjnych,  w skali  zmniejszonej.  W tym  wy- 
padku odtworzyć  należy  procesy  dynamiki  i termiki, 
które  się  rządzą  różnymi  prawami  i wymagają  spełnie- 
nia zupełnie  różnych  zależności  przy  odtwarzaniu  wa- 
runków zewnętrznych  powodujących  przepływ  i ochła- 
dzanie. 
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Warszawa  1969;  J.  Gruat  i in.  Teoria  i praktyka  badań  hydraulicz- 
nych,  Wrocław  1970;  Z.  Mikulski  Zarys  hydrografii  Polski,  War- 
szawa 1965. 


Geofizyka  poszukiwawcza 


Zbigniew  Fajklewicz 

Geofizyka  poszukiwawcza  (zwana  też  stosowaną  lub 
geologiczną)  jest  nauką  wyodrębnioną  z geofizyki 
ogólnej.  Przedmiotem  jej  są  własności  fizyczne  i bu- 
dowa ośrodka  geologicznego  przypowierzchniowej 
części  skorupy  ziemskiej  oraz  zależności  między  włas- 
nościami fizycznymi  ośrodka  skalnego  a występowa- 
niem w nim  struktur  geologicznych  i złóż  kopalin 
użytecznych.  Metodami  geofizycznymi  wykryto  i zba- 
dano wiele  złóż  o znaczeniu  światowym.  Metody  geo- 
fizyki poszukiwawczej  są  obecnie  najważniejszymi  me- 
zadania  todami  poszukiwawczymi,  oddają  one  nieocenione 
geofizyki  usługi  w wykrywaniu  złóż  ropy  i gazu,  rud,  soli,  siarki 
poszukiwa-  i innych  kopalin  użytecznych. 

wczej  Do  geofizyki  poszukiwawczej  należy  także  badanie 
zmian  parametrów  fizycznych  złóż  oraz  otaczających 
je  skał,  będących  wynikiem  prowadzonych  w nich 
prac  górniczych,  jak  również  poznawanie  własności 
fizykotechnicznych  podłoża  przeznaczonego  pod  bu- 
dowę dużych  budowli,  a następnie  wpływ  takich  bu- 
dowli na  własności  ośrodka  skalnego.  Poszukiwanie 
i badanie  wód  podziemnych  to  jeszcze  jedna  dziedzina 
wchodząca  w zakres  tej  nauki.  Metody  badawcze  geo- 
fizyki poszukiwawczej  stosowane  są  nie  tylko  w ge- 
ologii i górnictwie,  lecz  również  w budownictwie  wod- 
nym i lądowym,  a nawet  w archeologii. 

Ze  względu  na  zakres  zastosowań  rozróżnia  się  ze- 
społy metod,  które  tworzą  geofizykę:  strukturalną, 
złożową,  górniczą,  inżynierską  i techniczną.  Specy- 
fika pomiarów  pozwala  wyodrębnić  geofizykę  po- 
wierzchniową i wiertniczą,  a także  podziemną,  lotni- 
czą (aerogeofizykę)  oraz  morską.  Natomiast  przyjmu- 
jąc za  kryterium  podziału  badane  wielkości  fizyczne 
rozróżnia  się  następujące  metody:  grawimetrię  po- 
szukiwawczą, magnetometrię  poszukiwawczą,  geo- 
elektrykę  poszukiwawczą,  sejsmikę  poszukiwawczą 
oraz  radiometrię  poszukiwawczą. 

W zależności  od  postawionego  do  rozwiązania  za- 
dania dobiera  się  taki  zestaw  różnych  uzupełniających 
się  wzajemnie  metod,  który  pozwala  osiągnąć  cel 
szybciej  i przy  mniejszych  nakładach  - wykonuje  się 
w ten  sposób  kompleksowe  badania  geofizyczne. 
Kompleksowa  interpretacja  pomiarów  geofizycznych 
polega  na  korelacji  wszystkich  otrzymanych  wyników 
w celu  uzyskania  rozwiązania  optymalnego,  ograni- 
czającego wieloznaczność  rozwiązań  metod  geo- 
fizycznych. 


Grawimetria  poszukiwawcza 

Niejednorodny  rozkład  mas  w ośrodku  geologicznym 
wpływa  na  wartość  natężenia  pola  siły  ciężkości  na 
powierzchni  Ziemi.  W geofizyce  natężenie  pola  siły 
ciężkości  (stosunek  siły  do  masy,  na  którą  działa) 
nazywa  się  krótko  polem  siły  ciężkości.  Struktury 
geologiczne  i antropogeniczne  (będące  wynikiem 
działalności  człowieka)  oraz  złoża  kopalin  użytecz- 
nych nazywa  się  ciałami  zaburzającymi  lub  anomal- 
nymi. Rozkład  pola  siły  przyciągania  grawitacyjnego 
ciał  zaburzających  jest  funkcją  różnicy  między  ich 
gęstością  i gęstością  skał  otaczających,  a także  zależy 
od  ich  wielkości,  kształtu  i głębokości  występowania. 

Pola  tych  ciał  wpływają  na  rozkład  wartości  ziemskie- 
go pola  siły  ciężkości.  Wykrywanie  tych  ciał  oraz 
określenie  wyżej  podanych  parametrów  należy  do  gra- 
wimetrii poszukiwawczej.  Podstawę  metody  stanowią 
pomiary  grawimetryczne,  tj.  pomiary  względne  (war-  pomiary 
tości)  siły  ciężkości  (wyznaczenie  wartości  różnicy  grawimetry- 
siły  ciężkości  między  punktami  pomiarowymi)  wyko-  czne 
nywane  w punktach  położonych  na  powierzchni  tere- 
nu lub  na  innym  poziomie  pomiarowym. 

Do  pomiarów  względnych  siły  ciężkości  służą  gra- 
wimetry (ii.  209,  tabl.  56).  Zasadniczym  elementem 
systemu  pomiarowego  grawimetru  jest  ramię  ze  sku- 
pioną na  końcu  masą.  W czasie  pomiaru  siłę  ciężkości  grawimetry 
działającą  na  masę  równoważy  najczęściej  siła  spręży- 
stości powstała  wskutek  wydłużenia,  skręcenia  lub 
ugięcia  sprężyny  lub  układu  sprężyn  utrzymujących 
ramię.  Deformacja  sprężyny  jest  miarą  zmiany  siły 
ciężkości. 

Dokładność  nowoczesnych  grawimetrów  jest  bar- 
dzo duża  — dochodzi  do  jednej  stumilionowej  części 
wartości  siły  ciężkości  na  powierzchni  Ziemi.  Oznacza 
to,  że  dokładność  pomiaru  dochodzi  do  0,01  mGal 
(jednostką  natężenia  siły  ciężkości  stosowaną  w gra- 
wimetrii jest  gal,  1 Gal  = 10“2  N/kg). 

Punkty  pomiarowe  na  powierzchni  terenu  są  z re- 
guły lokalizowane  na  różnych  względem  siebie  wy- 
sokościach i położone  są  na  kompleksie  skalnym  o nie- 
jednakowej grubości,  często  bardzo  zróżnicowanym, 
odmienna  jest  również  rzeźba  terenu  otaczającego  te 
punkty.  Z tych  względów  zmierzone  wartości  nie  są  ze 
sobą  porównywalne  i nie  mogą  stanowić  podstawy  do 
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wyciągnięcia  wniosków  na  temat  budowy  geologicz- 
redukcja  nej.  Należy  zatem  wyeliminować  wpływ  wspomnia- 
pomiarów  nych  czynników  na  zmierzone  wartości  i sprowadzić 
je,  czyli  zredukować,  do  jednego  poziomu  odniesienia. 
Zazwyczaj  poziomem  takim  jest  poziom  morza  (po- 
wierzchnia geoidy). 

Wyniki  pomiarów  grawimetrycznych  wykonywa- 
nych dla  celów  poszukiwawczych  sprowadza  się  do 
poziomu  odniesienia,  stosując  redukcję  Bouguera, 
która  uwzględnia  wpływ  wysokości  punktu  pomiaro- 
wego nad  przyjęty  poziom  odniesienia  oraz  wpływ 
grawitacyjny  mas  występujących  nad  tym  poziomem. 
Redukcja  ta  zazwyczaj  jest  uzupełniona  poprawką  to- 
pograficzną do  siły  ciężkości,  która  eliminuje  składo- 
wą pionową  siły  przyciągania  pochodzącą  od  nierów- 
ności terenowych. 

Wnioski  dotyczące  budowy  geologicznej  badanego 
obszaru  wyciąga  się  na  podstawie  wartości  anomalii 
siły  ciężkości,  czyli  różnicy  między  zredukowaną 
anomałśe  si«y  wartością  siły  ciężkości  w danym  punkcie  i odpowia- 
ciężkcści  dającą  jej  wartością  normalną  w tym  samym  punkcie. 

Jako  wartości  normalne  przyjęto  wartości  obliczone 
dla  wyidealizowanej  Ziemi  w kształcie  elipsoidy  z jed- 
norodnym rozkładem  masy.  Anomalie  siły  ciężkości 
wskazują  na  stopień  niejednorodności  rzeczywistego 
rozkładu  mas  w ośrodku  skalnym.  Ponieważ  sposób 
redukcji  pomiarów  może  być  różny,  mówi  się  więc 
np.  o anomalii  siły  ciężkości  w redukcji  Bouguera. 
Stosuje  się  również  podział  anomalii  ze  względu  na 
obszar,  w którym  występują;  można  wyodrębnić  ano- 
malie lokalne  i regionalne  siły  ciężkości.  Zmierzony 
rozkład  jest  zwykle  superpozycją  obu  wymienionych 
typów  anomalii.  Pierwsze  z nich  związane  są  z lokal- 
nymi, a drugie  — z regionalnymi  ciałami  zaburzają- 
cymi a więc  np.  strukturami  geologicznymi,  złożami 
kopalin  użytecznych  itp. 


r>  ' J - wysad  solny  0 400  m 

i i i 


Rys.  1.  Rozkład  anomalii  siły  ciężkości  nad  wysadem 
solnym 

892 


W celu  graficznego  przedstawienia  rozkładu  ano- 
malii siły  ciężkości  wykreśla  się  na  mapie  izolinie,  tj. 
linie  łączące  punkty  o tej  samej  wartości  anomalii. 

Mapy  grawimetryczne  są  syntezą  materiału  pomiaro-  mapy 
wego  i stanowią  podstawę  wnioskowania  geologicz-  grawś- 
nego.  Dla  przykładu  na  rys.  1 został  przedstawiony  metryczne 
rozkład  anomalii  siły  ciężkości  nad  jednym  z wykrytych 
w Polsce  wysadów  solnych.  Pasmo  ujemnych  anomalii 
siły  ciężkości  występujące  w centrum  zdjęcia  grawi- 
metrycznego (rys.  2)  jest  odbiciem  jednego  z wykry- 
tych w naszym  kraju  złóż  węgli  brunatnych  wypełnia- 
jącego rów  erozyjny  w utworach  mezozoiku. 


£ • . J — złoże  węgli  brunatnych 

^ ' ' ' J 0 3 km 

i i i 

Rys.  2.  Rozkład  anomalii  siły  ciężkości  nad  złożem  węgli  brunat- 
nych (wg  Przedsiębiorstwa  Badań  Geofizycznych  w Warszawie) 


Podziemne  pomiary  grawimetryczne  pozwalają 
poznać  szczegóły  budowy  geologicznej  eksploatowa- 
nego górotworu.  Na  rys.  3 jest  przedstawiony  rozkład 
anomalii  siły  ciężkości  zmierzony  w chodniku  górni- 
czym. Na  jego  podstawie  wykryto  uskoki  przecinające 
pokład  węgla  kamiennego  w jednej  z kopalń  na  Gór- 
nym Śląsku. 

W zakres  grawimetrii  wchodzi  również  rozwijana 
w ostatnich  latach  metoda  gradientu  pionowego  siły 


metoda  ciężkości,  polegająca  na  pomiarze  za  pomocą  grawi- 
gradientu  metru  i specjalnie  do  tego  celu  skonstruowanej  wieży 
pionowego  pomiarowej  (il.  208,  tabl.  56),  różnicy  siły  ciężkości 
między  dwoma  punktami  leżącymi  na  pewnej  znanej 
odległości  pionowej  nad  sobą.  Służy  ona  do  wykrywa- 
nia małych  form  tektonicznych,  erozyjnych  i antropo- 
genicznych, jak  np.  stare  wyrobiska  górnicze.  Na  il. 
208  (tabl.  56)  pokazano  rozkład  anomalii  gradientu 
pionowego  siły  ciężkości  nad  takim  wyrobiskiem  wy- 
krytym na  terenie  jednego  z miast  w Polsce. 


Magnetometria  poszukiwawcza 


Przy  poszukiwaniu  i eksploatacji  niektórych  złóż  ko- 
palin użytecznych  cennych  informacji  dostarcza  ba- 
danie pól  magnetycznych  indukowanych  w skałach 
przez  stałe  pole  magnetyczne  Ziemi.  Obserwowane  w 
przestrzeni  otaczającej  Ziemię  pole  magnetyczne  jest 
sumą  jej  stałego  pola  naturalnego,  które  nazywa  się 
normalnym,  pól  zmiennych  oraz  pól  indukowanych 
anoraaBte  w-  skałach  (-►  Magnetyzm  ziemski).  Różnicę  między 
magnetyczne  polem  mierzonym,  z którego  zostały  wyeliminowane 
zmiany  dobowe,  a normalnym  w danym  punkcie 
nazywa  się  anomalią  magnetyczną.  Rozróżnia  się  ano- 
malie natężenia  całkowitego  oraz  anomalie  elementów 
i składowych  pola  magnetycznego  Ziemi.  Ze  względu 
na  obszar  występowania,  w magnetometrii  poszuki- 
wawczej wyróżnia  się  anomalie  regionalne  i lokalne. 

Na  podstawie  map  anomalii  magnetycznych,  wy- 
kreślanych analogicznie  do  map  grawimetrycznych, 
można  scharakteryzować  ciała  namagnesowane,  po- 
dając ich  głębokość  występowania,  rozmiary  i kształt. 
Skonstruowanie  precyzyjnych  przyrządów  mierzących 
pole  magnetyczne  z dokładnością  do  1 y (gamma  jest 
stosowaną  w geofizyce  jednostką  indukcji  magnetycz- 
nej l y = 10_!>  T),  znacznie  poszerzyło  zakres  zasto- 
sowań metody  magnetycznej,  która  nie  tylko  stała  się 
nieodzowna  przy  poszukiwaniu  złóż  żelaza  czy  innych 
ferromagnetyków-,  ale  z powodzeniem  można  ją  rów- 
nież stosować  w poszukiwaniu  złóż  metali  i surowców 
skalnych  o słabych  własnościach  magnetycznych.  Me- 
tody magnetyczne  stosuje  się  obecnie  również  przy 
badaniu  zagadnień  tektonicznych,  np.  do  wyznaczania 
kontaktów  skał  osadowych  i magmowych. 

Rozwój  techniki  aparaturowej  umożliwił  wykony- 
wanie pomiarów  aeromagnetycznych  i hydromagne- 
tycznych,  w których  odpowiednia  aparatura  pomia- 
rowa jest  umieszczona  w samolocie  lub  na  statku. 

Powszechnie  stosowanymi  przyrządami  do  wykony- 
wania pomiarów  magnetycznych  są  wagi  magnetyczne 
służące  do  względnych  pomiarów  składowych:  pio- 
nowej Z i poziomej  H pola  magnetycznego  Ziemi  oraz 
magnetometr  magnetometr  protonowy.  Magnetometr  protonowy 
protonowy  jest  najnowocześniejszym  przyrządem  używanym  do 
pomiarów  bezwzględnych  wartości  całkowitego  na- 
tężenia pola  magnetycznego  Ziemi  Ty  a także  jego 
poziomej  i pionowej  składowej.  Zasadniczą  częścią 
przyrządu  jest  sonda  — puszka  z wodą  destylowaną 
umieszczona  wewnątrz  solenoidu  tak  ustawionego,  że 
stały  prąd  elektryczny  płynący  przez  solenoid  wy- 
twarza pole  magnetyczne  o kierunku  w przybliżeniu 
prostopadłym  do  kierunku  pola  magnetycznego 
Ziemi.  Pole  solenoidu  polaryzuje  swobodne  protony 
występujące  w wodzie  (protony  orientują  się  w ten 
sposób,  że  osie  ich  momentów  magnetycznych  są  rów- 
noległe do  linii  tego  pola).  Po  wyłączeniu  pola  pola- 
ryzującego protony  poddane  działaniu  ziemskiego 
pola  magnetycznego  zaczynają  wykonywać  ruch  pre- 
cesyjny  wokół  jego  kierunku.  Częstość  precesji  jest 
proporcjonalna  do  natężenia  pola  magnetycznego 
Ziemi.  Mierząc  częstość  zmian  siły  elektromagnetycz- 
nej powstałej  w uzwojeniu  solenoidu  można  wyzna- 
czyć wartość  tego  natężenia.  Ilustracja  210  (tabl.  56) 
przedstawia  magnetometr  protonowy  do  pomiarów' 
naziemnych  polskiej  konstrukcji. 
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Rys.  4.  Rozkład  anomalii  składowej  pionowej  pola  magnetycz- 
nego Ziemi  nad  złożem  kwarcytów  żelazistych  — Kurska  ano- 
malia magnetyczna  (opracował  K.  P.  Sokołow) 


anomalie  natężenia  całkowitego 
pola  magnetycznego  Ziemi 


technicznych 
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Rys.  5.  a)  Rozkład  anomalii  natężenia  całkowitego  pola  magne- 
tycznego Ziemi  nad  złożem  bazaltu,  b)  złoże  bazaltu  (opracował 
St.  Małoszewski) 


Zmierzone  anomalie  magnetyczne  mogą  wskazy- 
wać na  miejsce  występowania  złóż  rud  żelaza  (magne- 
tytu, tytanomagnetytu,  kwarcytów  żelazistych,  itp.), 
miedzi,  ołowiu,  glinu,  manganu  i innych  metali,  w 
których  to  rudach  mogą  występować  w postaci  do- 
mieszek minerały  ferromagnetyczne.  Przykładowo 
na  rys.  4 jest  pokazany  przekrój  geologiczny  jednego 
ze  złóż  kwarcytów  żelazistych  wykrytych  w Związku 
Radzieckim  w wyniku  wykonanych  pomiarów  ano- 
malii składowej  pionowej  pola  magnetycznego  Ziemi. 

Metodę  magnetyczną  można  również  z dużym  po- 
wodzeniem stosować  do  wykrywania  złóż  surowców 
skalnych.  Zapis  anomalii  natężenia  całkowitego  pola 
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magnetycznego  w pewnym  obszarze  na  Dolnym  Śląs- 
ku oraz  zarys  wykrytego  złoża  bazaltu,  ukazuje  rys.  5. 
Interpretacja  anomalii  doprowadziła  nie  tylko  do 
zlokalizowania  złoża,  ale  również  do  wyróżnienia 
w nim  stref  występowania  surowca  o pożądanych 
własnościach  technicznych  oraz  bazaltu  zwietrzałego. 


GeoelektrySca  poszukiwawcza 


Do  geoelektryki  poszukiwawczej  należy  badanie  na- 
turalnych i sztucznie  wzbudzonych  pól  elektrycznych 
i elektromagnetycznych  w ośrodku  geologicznym. 
Istnieją  różne  metody  elektryczne  (rys.  6),  któ- 
rych efektywność  w poszukiwaniu  złóż  kopalin  uży- 
tecznych i badaniu  budowy  geologicznej  ośrodka 
skalnego  zależy  od  zróżnicowania  skał  pod  względem 
oporu  właściwego,  przenikalności  elektrycznej  i mag- 
netycznej oraz  zdolności  do  polaryzowania  się  pod 
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Rys.  6.  Podział  metod  geoelektrycznych  (wg  J.  Miecznika) 


wpływem  przepływającego  przez  nie  prądu.  Większość 
tych  metod  można  stosować  nie  tylko  w badaniach 
naziemnych,  ale  również  lotniczych  i podziemnych. 


Metodą  elektrooporowa 

W praktyce  poszukiwawczej  najszersze  zastosowanie 
znalazła  metoda  elektrooporowa.  Polega  ona  na 
wyznaczaniu  elektrycznego  oporu  właściwego  kom- 
pleksów skalnych;  stosuje  się  ją  do  poszukiwania 
surowców  skalnych,  wód  podziemnych  i badania 
podłoża  skalnego  będącego  przedmiotem  zaintereso- 
wania budownictwa  lądowego  i wodnego. 

Warstwy  skalne  są  zwykle  niejednorodne  pod  wzglę- 
dem własności  elektrycznych,  toteż  w rzeczywistości 
opór  wyznacza  się  tzw.  opór  pozorny,  czyli  opór  właściwy 
pozorny  warstwy  traktowanej  jako  jednorodna,  zależny  przy 
tym  od  geometrii  układu  pomiarowego.  Opór  pozorny 
warstwy  skalnej  wyznacza  się  przepuszczając  stały 
prąd  elektryczny  o znanym  natężeniu  między  dwiema 
elektrodami  prądowymi  wbitymi  w grunt  i mierząc,  za 
pomocą  dwu  elektrod  pomiarowych  i miernika  geo- 
elektrycznego. wartość  różnicy  potencjału  wywołanej 
przepływem  prądu  przez  warstwę  skalną. 
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Serie  pomiarów,  w których  rozstaw  elektrod  prą- 
dowych zmienia  się  tak,  że  znajdują  się  stale  na  jednej 
linii,  a punkt  leżący  pośrodku  między  nimi  (tzw. 
środek  sondowania)  pozostaje  nieruchomy,  stanowią  pionowe 
pionowe  sondowanie  elektrooporowe.  Ten  system  sondowanie 
pomiarowy  pozwala,  stosując  zmianę  głębokości  pe-  elektro- 
netracji  (przez  zmianę  rozstawu  elektrod),  wyodrę-  oporowe 
bnić  warstwy  skalne  różniące  się  oporem  elektrycznym. 

Stosując  sondowanie  elektrooporowe,  np.  w po- 
szukiwaniu wód  podziemnych,  można  wyodrębnić 
w badanym  ośrodku  skalnym  skały  wodonośne, 
określić  warunki  ich  występowania  oraz  formę  geo- 
metryczną złoża,  co  pozwala  ocenić  jego  zasoby. 

Pozorny  opór  właściwy  strefy  występowania  wód 
podziemnych  zawiera  się  w przedziale  100-300  £2m, 
a wapieni  kredowych  podścielających  skały  wodo- 
nośne— w przedziale  500-1500  firn.  Przykład  zasto- 
sowania metody  sondowania  elektrooporowego 
przedstawia  rys.  7.  Należy  tutaj  nadmienić,  że  ok. 

90%  wszystkich  kosztów  poszukiwania  wód  na  ca- 
łym świecie  przypada  właśnie  na  tę  metodę. 


a) 


opór  pozorny  skały 


Rys.  7.  Wyniki  zastosowania  metody  elektrooporowej  do  poszu- 
kiwań wód  podziemnych  w skrasowiałych  wapieniach  jurajskich 
w jednym  z rejonów  w Polsce:  a)  krzywe  pionowych  sondowań 
elektrooporowych,  b)  przekrój  geologiczny  opracowany  na  pod- 
stawie wykonanych  sondowań  (opracował  A.  Iciek) 
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uskok 


Rys.  8.  Rozkład  izoom  nad  wykrytym  złożem  marmuru  wyzna- 
czony metodą  elektrooporową  (opracował  St.  Małoszewski) 
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Pomiary,  w których  odległość  wzajemna  elektrod 
prądowych  pozostaje  stała,  zmienia  się  zaś  ich  po- 
łożenie, stanowią  profilowanie  elektrooporowe.  Sys- 
tem ten  (przy  ustalonym  zasięgu  głębokości)  umożli- 
wia dokładniejsze  poznanie  budowy  geologicznej 
ośrodka  lub  ustalenie  położenia  granic  warstw  geo- 
logicznych o różnych  oporach  elektrycznych.  W ten 
sposób  jest  możliwe  wykrywanie  złóż  surowców  skal- 
nych występujących  płytko  pod  powierzchnią  terenu. 
Wyniki  poszukiwań  i okonturowanie  złoża  marmu- 
rów metodą  profilowania  elektrooporowego  są  przed- 
stawione na  rys.  8.  Widać  na  nim  że  rozkład  izoom 
jest  ściśle  związany  z odkrytym  złożem. 


Inne  metody  elektryczne 

Górne  części  złóż  rud  i kruszców  znajdują  się  — w wy- 
niku działania  wód  podziemnych  bogatych  w tlen  — 
w warunkach  utleniających,  a części  dolne  — w warun- 
kach redukcyjnych.  Powoduje  to  przeciwstawne  na- 
elektryzowanie  stropu  i spągu,  tak  że  złoże  staje  się 
naturalnym  źródłem  prądu  elektrycznego.  Podobny 
efekt  polaryzacji  powoduje  ruch  roztworów  wodnych 
w skałach.  Z tego  względu  metoda  potencjałów  wła- 
snych — posługująca  się  pomiarami  potencjałów  wła- 
snych — służy  głównie  do  poszukiwania  przypowierz- 
chniowych złóż  rud  oraz  do  wyznaczania  kierunku 
i szybkości  spływu  wód  podziemnych  i miejsc  filtracji 
wody.  Pomiary  potencjału  własnego  na  powierzchni 
terenu  wykonuje  się  za  pomocą  układu  składającego 
się  z miernika  potencjału  i dwu  elektrod  pomiaro- 
wych, z których  jedna  jest  nieruchoma,  a druga  prze- 
mieszczana w terenie. 

Zjawisko  chwilowej  polaryzacji  skał  i złóż,  wywo- 
łanej przepływem  impulsu  elektrycznego  wykorzy- 
stuje metoda  polaryzacji  wzbudzonej.  Pozwala  ona  na 
bezpośrednie  poszukiwania  złóż  będących  dobrymi 
przewodnikami  elektrycznymi,  a więc  siarczków  żela- 
za, miedzi,  niklu,  ołowiu,  srebra,  itp. 

Zależność  kształtu  izopowierzchni  potencjału  elek- 
trycznego od  kształtu  naelektryzowanego  sztucznie 
złoża  kopalin  użytecznych  będących  dobrym  prze- 
wodnikiem elektrycznym,  a występujących  pośród 
skał  o dużym  oporze  właściwym,  wykorzystuje  me- 
toda ciała  naładowanego.  Metoda  ta  służy  głównie 
do  badania  form  występowania  wykrytych  złóż  i wy- 
znaczania kierunku  i prędkości  przepływu  wód  pod- 
ziemnych w otworze  wiertniczym. 

Fale  elektromagnetyczne,  których  źródłem  jest 
jonosfera,  rozprzestrzeniają  się  w ośrodku  geologicz- 
nym w sposób  zależny  cd  oporu  właściwego  skał 
i częstości  drgań.  Zależność  tę  wykorzystuje  metoda 
magnetotelluryczna.  Wielkościami  podlegającymi 
bezpośredniemu  pomiarowi  są  składowe  natężenia 
pola  elektrycznego  i magnetycznego  oraz  kąt  prze- 
sunięcia fazowego  między  tymi  składowymi.  Za 
wariant  tej  metody  można  uznać  metodę  telluryczną, 
w której  pomiar  ogranicza  się  tylko  do  składowej 
elektrycznej.  Obie  metody  stosuje  się  do  wykrywania 
struktur  roponośnych  oraz  badania  wgłębnej  tekto- 
niki i morfologii  podłoża  krystalicznego. 

Fala  elektromagnetyczna  może  być  również  sztucz- 
nie wzbudzona  w ośrodku  geologicznym,  co  wyko- 
rzystuje się  między  innymi  w metodzie  sondowań 
elektromagnetycznych. 

Wspomnimy  jeszcze  o stosowanej  do  rozwiązywa- 
nia problemów  geologii  strukturalnej  metodzie  sta- 
bilizacji pola,  w której  wykorzystuje  się  zależność 
rozprzestrzeniania  się  impulsu  prądowego  od  oporu 
elektrycznego  warstw  skalnych. 

Do  bezpośrednich  poszukiwań  złóż  kopalin  uży- 
tecznych będących  dobrymi  przewodnikami  elek- 
trycznymi jest  jeszcze  stosowana  metoda  indukcyjna, 
polegająca  na  badaniu  sztucznie  wzbudzonego  indu- 
kowanego pola  elektromagnetycznego,  oraz  metoda 
radiofalowa,  polegająca  na  badaniu  pochłaniania  lub 
odbicia  fal  radiowych  o częstości  powyżej  105  Hz. 


Sejsmika  poszukiwawcza 

0 budowie  geologicznej  i własnościach  sprężystych 
ośrodka  skalnego  można  wnioskować  na  podstawie 
rozchodzenia  się  w nim  fal  sprężystych  (sejsmicz- 
nych). Do  sejsmiki  poszukiwawczej  należy  badanie 
rozchodzenia  się  sztucznie  wzbudzonych  fal  sejsmicz- 
nych. Źródłem  fal  jest  detonacja  materiału  wybucho- 
wego umieszczonego  w specjalnie  przygotowanym 
płytkim  otworze  lub  w otworze  wiertniczym.  Niekiedy 
do  przekazywania  drgań  cząsteczkom  gruntu  czy 
skał  stosuje  się  także  wibratory  elektromagnetyczne 
lub  hydrauliczne,  udary  mechaniczne  lub  eksplozje 
sprężonych  gazów. 

Na  każdej  granicy  sejsmicznej  rozdzielającej  dwie 
warstwy  o różnym  oporze  akustycznym  właściwym 
(zw.  w geofizyce  twardością  akustyczną;  jest  to 
iloczyn  gęstości  ośrodka  i prędkości  rozchodzenia  się 
w nim  fali  sprężystej)  powstaje  fala  odbita,  czyli 
refleksyjna.  Jeżeli  prędkość  fal  w warstwie  nad  gra- 
nicą jest  mniejsza  niż  w warstwie  pod  granicą,  w tej 
pierwszej  może  powstać  fala  refrakcyjna.  Pojawiają 
się  one  wówczas,  gdy  fala  sejsmiczna  pada  na  granicę 
dwóch  ośrodków  pod  kątem  krytycznym  i fala  zała- 
mana pod  kątem  90°  biegnie  wzdłuż  granicy  dwóch 
ośrodków.  Inicjuje  ona  falę  sejsmiczną  refrakcyjną 
biegnącą  od  granicy  ku  powierzchni  terenu. 

Fale  sejsmiczne  są  odbierane  na  powierzchni  terenu 
przez  specjalne  odbiorniki  drgań  zwane  geofonami 

1 rejestrowane  wraz  z ich  czasem  przyjścia  w postaci 
sejsmogramu  czyli  obrazu  falowego.  Rejestrację 
można  wykonać  w postaci  analogowej  na  papierze 
światłoczułym  lub  na  taśmie  magnetycznej,  stosuje 
się  też  zapis  cyfrowy.  W sejsmicznych  badaniach  po- 
szukiwawczych używa  się  też  wielu  geofonów  poło- 
żonych na  powierzchni  terenu  w różnych  odległo- 
ściach od  punktu  wzbudzenia  fal  sejsmicznych,  zwy- 
kle na  jednej  linii  prostej  zwanej  profilem  sejsmicz- 
nym. Analiza  sejsmogramu  pozwala  wyznaczyć  czas 
przyjścia  fal  sejsmicznych  do  geofonów  oraz  umożliwia 
porównanie  amplitud  zarejestrowanych  drgań.  Zależ- 
ność czasu  przyjścia  fali  sejsmicznej  od  odległości 
między  punktem  wzbudzenia  a geofonami  jest  zwana 
hodografem  fali  sejsmicznej.  Czas  przebiegu  fal  sejs- 
micznych zależy  od  geometrii  układu  pomiarowego, 
położenia  i kształtu  granic  sejsmicznych  w ośrodku 
skalnym  oraz  prędkości  rozchodzenia  się  fal  sejsmicz- 
nych w poszczególnych  warstwach  skalnych. 

W badaniach  sejsmicznych  rozróżnia  się  dwie  pod- 
stawowe metody:  refrakcyjną  i refleksyjną. 

Metoda  refrakcyjna  polega  na  rejestrowaniu  fal 
refrakcyjnych  oraz  czasu  ich  dojścia  do  geofonów. 
Rejestruje  się  albo  tylko  pierwsze  impulsy,  albo  reje- 
struje się,  a następnie  koreluje  impulsy  dalsze  (kore- 
lacyjna metoda  refrakcyjna).  Wyniki  pomiarów  przed- 
stawia się  w postaci  hodografów  fal  refrakcyjnych, 
na  podstawie  których,  używając  specjalnie  opracowa- 
nych metod  obliczeń,  wyznacza  się  w profilu  głębo- 
kościowym bieg  granic  sejsmicznych  refrakcyjnych. 
Metoda  ta  jest  najczęściej  stosowana  do  wyznaczania 
granic  warstw  geologicznych  znacznie  różniących  się 
prędkością  rozchodzenia  się  w nich  fal  sejsmicznych, 
stąd  służy  do  wyznaczania  głębokości  i kształtu  stropu 
podłoża  krystalicznego. 

Metoda  refleksyjna  polega  na  rejestracji  fal  odbi- 
tych od  granic  sejsmicznych  oraz  ich  czasu  dojścia 
do  geofonów’.  Analiza  zarejestrowanych  sejsmogra- 
mów  pozwala  na  odtworzenie  rzeczywistego  położe- 
nia i kształtu  granic  sejsmicznych  refleksyjnych. 
W tym  celu  dokonuje  się  licznych  operacji,  które 
przekształcają  zarejestrowany  sejsmogram  w prze- 
krój czasowy.  Odzwierciedla  on  rzeczywiste  poło- 
żenie tych  granic  w układzie  współrzędnych  karte- 
zjańskich:  długość  profilu,  wzdłuż  którego  umieszczo- 
ne są  geofony  i czas  przyjścia  fal  do  geofonów,  mie- 
rzony wzdłuż  drogi  prostopadłej  do  granicy  odbija- 
jącej. Gdy  tę  ostatnią  współrzędną  zastąpić  głęboko- 
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ścią  położenia  granic  refleksyjnych,  otrzymuje  się 
przekrój  głębokościowy.  Wykreślenie  tych  przekrojów 
wymaga  znajomości  prędkości  średniej  fal  sejsmicz- 
nych w badanym  ośrodku  skalnym  czyli  stosunku 
długości  całkowitej  drogi  promienia  fali  sejsmicznej 
do  czasu  przebiegu  fali  wzdłuż  tej  drogi. 

Określenie  położenia  i kształtu  sejsmicznych  granic 
odbijających  ma  zasadnicze  znaczenie  przy  wykrywa- 
niu struktur  geologicznych.  Stąd  metoda  refleksyjna 
jest  najważniejszą  metodą  stosowaną  do  poszukiwań 
struktur  gazo-  i roponośnych.  Charakteryzuje  się  ona 
dużym  stopniem  rozdzielczości,  dzięki  czemu  można 
rozróżnić  granice  refleksyjne  występujące  blisko  siebie. 

Na  uwagę  zasługuje  też  duży  zasięg  głębokościowy 
metody,  wynosi  on  bowiem  kilka  do  kilkunastu  km. 
Najlepsze  wyniki  w wyznaczaniu  granic  osiąga  się, 
gdy  nachylenie  warstw  nie  przekracza  10-20°. 

Na  il.  207  (tabl.  56) jest  przedstawiony  przekrój 
czasowy  odpowiadający  jednemu  z profilów  sejsmicz- 
nych, w którym  zostały  wykonane  badania  refleksyjne 
w synklinorium  łódzkim  koło  Uniejowa.  Dostarcza 
on  bardzo  istotnych  informacji  o budowie  geologicz- 
nej tego  rejonu.  Wykryte  granice  sejsmiczne  wskazują 
na  narastanie  utworów-  cechsztynu  w kierunku  mezo- 
zoicznej  struktury  Uniejowa  oraz  na  niezgodność  za- 
legania granicy  podsolnej  cechsztynu  w stosunku  do 
kompleksu  cechsztyńsko-mezozoicznego. 

W celu  lepszego  rozpoznania  budowy  geologicznej 
badania  sejsmiczne  prowadzi  się  w taki  sposób,  aby 
można  było  na  ich  podstawie  wykonać  mapy  głębo- 
mapy  kościowe  granic  sejsmicznych  — tzw.  mapy  struktu- 
strukturalne  ralne.  Rysunek  9,  to  właśnie  mapa  strukturalna  stro- 
pu podłoża  miocenu  w zachodniej  części  zapadliska 
rzeszowskiego). 


Rzeszów 


-Ł..i  i.m> 


izorytmy  stropu  podłoża  miocenu 
uskoki  i strefy  dyslokacyjne 
orograficzny  brzeg  Karpat 

zasięg  występowania  ewaporytów  w spągu  miocenu 
wiercenia 

Rys.  9.  Mapa  strukturalna  stropu  podłoża  miocenu  w zachodniej 
części  zapadliska  rzeszowskiego  (ewaporyty  są  to  osady  wytrą- 
cone z wody  morskiej  lub  jeziornej,  przy  jej  wyparowywaniu). 
Opracował  A.  Lapinkicwicz,  M.  Nowicki 
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Zasadniczym  przełomem  w rozwoju  badań  sejs-  zastosowanie 
micznych  było  wprowadzenie  zapisu  cyfrowego  do  komputerów 
pomiarów  polowych  oraz  do  procesów  przetwarzania 
wyników  otrzymywanych  z terenu.  Umożliwił  on 
zastosowanie  komputerów  do  skomplikowanych 
i czasochłonnych  obliczeń  mających  na  celu  uzyskanie 
jak  największej  ilości  danych  o budowie  geologicznej 
ośrodka.  Przekrój  czasowy  przedstawiony  na  il.  207 
(tabl.  56)  opracowany  został  za  pomocą  komputera. 

Badania  sejsmiczne  mogą  być  prowadzone  nie  tylko 
na  lądzie,  lecz  również  na  morzu,  w celu  poznania 
budowy  geologicznej  dna  morskiego.  Dobre  rezultaty 
przynosi  również  zastosowanie  metod  sejsmicznych 
w górnictwie  do  badania  warunków  występowania 
złóż  stałych  kopalin  użytecznych. 

Coraz  powszechniejsze  jest  zastosowanie  badań 
sejsmicznych  w geologii  inżynierskiej.  Mała  przenośna 
aparatura  rejestrująca  równocześnie  przebieg  refrak- 
cyjnych fal  podłużnych  i poprzecznych  pozwala  obli- 
czyć parametry  sprężyste  i wytrzymałościowe  skał 
i gruntów,  dostarczając  tym  samym  niezbędnych  in- 
formacji przy  projektowaniu  lokalizacji  budowli 
i zapór  wodnych. 


Radiometria  poszukiwawcza 


Do  radiometrii  poszukiwawczej  (zwanej  też  geofizyką 
jądrową  lub  jądrowymi  metodami  poszukiwawczymi) 
należy  badanie  własności  promieniotwórczych  skał 
oraz  efektów  działania  promieniowania  jądrowego  na 
badany  ośrodek.  Na  podstawie  tych  badań  wyznacza 
się  miejsca  występowania  złóż  pierwiastków  promie- 
niotwórczych, złóż  metali  oraz  innych  kopalin,  takich 
jak  beryl,  bar,  siarka,  itp.  Wyznacza  się  również 
strefy  zaburzeń  tektonicznych  oraz  zróżnicowanie  skał. 
Radiometria  służy  także  do  wyznaczania  gęstości 
i porowatości  skał  oraz  stopnia  ich  nasycenia  wodą 
lub  ropą  naftową.  Metodą  atomów  znaczonych  można 
wyznaczyć  kierunki  i prędkości  przemieszczania  się 
wód  w ośrodku  skalnym. 

Pomiary  radiometryczne  wykonuje  się  na  powierz- 
chni terenu,  w kopalniach,  na  dnie  mórz,  z pokładów 
samolotów  oraz  w otworach  wiertniczych  (geofizyka 
wiertnicza).  W badaniach  radiometrycznych  stosuje 
się  metody  pasywne,  aktywne  i otwartych  źródeł  pro- 
mieniowania. 

Metody  pasywne  polegają  na  pomiarze  promienio- 
twórczości naturalnej  skał.  Podczas  badań  tereno- 
wych mierzy  się  przede  wszystkim  natężenie  promie-  metody 
niowania  y (metoda  y)  lub  promieniowania  a izo-  pasywne 
topów  radonu  (lotnych)  powstających  z rozpadu  radu, 
toru  lub  aktynu  (metoda  emanacyjna). 

Wyodrębnienie  obszarów  o podwyższonej  promie- 
niotwórczości yjest  szczególnie  przydatne  przy  spo- 
rządzaniu map  geologicznych.  Pomiary  na  dużych  ob- 
szarach zwykle  wykonuje  się  z samolotu.  Wariant 
tej  metody  przystosowany  do  pomiarów  natężenia 
promieniowania  y w otworach  wiertniczych  nosi  na- 
zwę profilowania  y. 

Pomiar  promieniowania  radonu  wykonuje  się  zwy- 
kle na  powierzchni  terenu.  Metody  emanacyjne 
umożliwiają  wykrywanie  rud  oraz  zaburzeń  tekto- 
nicznych na  podstawie  wielkości  stężenia  radonu 
w próbkach  powietrza  glebowego. 

Metody  aktywne  polegają  na  wprowadzeniu  do 
ośrodka  skalnego  (otworu  wiertniczego)  zamkniętego 
źródła  promieniowania  y lub  neutronów  i na  pomia-  metody 
rze  produktów  reakcji  tego  promieniowania  z ośrod-  aktywne 
kiem  skalnym  (promieniowanie  y,  neutrony  lub  inne 
produkty).  Odpowiednio  do  tego  rozróżnia  się  pro- 
filowanie y-y  (PGG),  y-neutron  (PGN),  neutron- 
neutron  (PNN),  neutron-y  (PNG)  oraz  metody 
aktywacyjne.  Metody  PGG  stosuje  się  do  wyznacza- 
nia gęstości  skał  oraz  do  wydzielania  w profilu 
geologicznym  otworu  wiertniczego  złóż  węgli  kamien- 
nych, brunatnych,  złóż  rud  metali,  itp. 


Metody  PNN  służą  do  określania  porowatości  prze- 
wiercanych skał  oraz  do  poszukiwania  złóż  manganu, 
boru  i innych  pierwiastków  silnie  absorbujących  neu- 
trony. Metody  PNG  są  stosowane  głównie  w celu 
wykrywania  zbiorników  ropo-,  gazo-  i wodonośnych, 
określenia  budowy  przewiercanych  skał  oraz  do  wy- 
krywania złóż  rud  żelaza,  niklu  itp. 

Zastosowanie  impulsowych  źródeł  neutronów  pręd- 
kich wprowadzanych  do  otworów  wiertniczych  (tzw. 
odwiertowe  generatory  neutronów)  i pomiar  czaso- 
wych charakterystyk  produktów  reakcji  tych  neutro- 
nów ze  skałami  umożliwia  wyznaczenie  wielkości 
charakteryzujących  ich  zbiornikowe  własności,  a za- 
tem wykrywanie  kontaktów  woda-ropa,  gaz  ziemny- 
-ropa  oraz  wyznaczenia  roponasycenia.  Impulsowe 
źródła  neutronów  służą  również  do  badania  zmien- 
ności składu  przewiercanych  skał  oraz  do  wykrywa- 
nia złóż  uranu. 

metody  Metody,  w których  stosuje  się  otwarte  źródła  pro- 
otwarfego  mieniowania  polegają  na  pomiarze  kierunku  i szyb- 
źródla  kości  przemieszczenia  się  wód,  w których  zostały 
rozpuszczone  związki  pewnych  izotopów  promienio- 
twórczych. Służą  one  do  ustalenia  kierunku  i pręd- 
kości przepływu  wód  gruntowych,  wyznaczania 
współczynnika  filtracji,  określania  wieku  i pocho- 
dzenia wód,  badania  szczelności  zapór  wodnych  itp. 


Geofizyka  wiertnicza 


Geofizyka  wiertnicza,  inaczej  — geofizyka  otworowa, 
jest  działem  geofizyki  poszukiwawczej  obejmującym 
metody  geofizyczne  przystosowane  do  pomiarów  w 
otworach  wiertniczych,  służące  do  badania  własności 
fizycznych  skał,  a zwłaszcza  ich  własności  zbiorni- 
kowych (porowatość,  przepuszczalność,  nasycenie 
itp.)  jako  kolektorów  złożowych.  Na  podstawie 
kompleksu  zastosowanych  metod  prowadzi  się  także 
badania  zmienności  składu  i wieku  przewiercanych 
skał,  wykrywa  się  i bada  złoża  kopalin  użytecznych. 
Do  geofizyki  wiertniczej  zalicza  się  również  metody 
fizyczno-chemiczne  mające  na  celu  lokalizowanie  na 
podstawie  profilu  otworu  wiertniczego  złóż  gazu 
i ropy  naftowej  a także  metody  badania  stanu  tech- 
nicznego otworów  wiertniczych. 

profilowanie  Pomiary  zmian  parametru  fizycznego  wzdłuż  otwo- 
ru wiertniczego  nazywa  się  profilowaniem  (karota- 
żem).  W odróżnieniu  od  instrumentów  pomiarowych 
stosowanych  w geofizyce  powierzchniowej  w tym 
przypadku  aparatura  składa  się  z dwóch  oddzielnych 
elementów:  urządzenia  pomiarowo-nadawczego,  czy- 
li sondy  wprowadzanej  do  otworu  wiertniczego,  oraz 
z bloku  kontrolno-rejestrującego  pozostającego  na 
powierzchni  terenu.  Oba  te  urządzenia  są  ze  sobą 
połączone  wielożyłowym  przewodem  elektrycznym 
przeznaczonym  do  zawieszenia  sondy  i przesyłania 
informacji  między  sondą  a aparaturą  kontrolno-re- 
jestrującą. Sposób  wykonywania  pomiarów  . geofi- 
zycznych w otworze  wiertniczym  jest  przedstawiony 
na  rys.  10. 

Sonda  jako  element  pomiarowo-nadawczy  jest 
sondy  wyposażona  w detektor  wykrywający  zmiany  natu- 
ralnych lub  sztucznie  wzbudzonych  pól  fizycznych 
(w  drugim  wypadku  sonda  zawiera  również  nadajnik, 
czyli  źródło  pola  pierwotnego).  Sonda  kompleksowa 
ma  kilka  odbiorników,  co  pozwala  na  równoczesny 
pomiar  wielu  parametrów.  W zależności  od  potrzeb 
(badanie  warstw  o różnej  grubości  i oporze  stosuje 
się  różne  wzajemne  położenia  elektrod  w sondzie 
pojedynczej,  jak  również  zamienia  się  ich  bieguno- 
wość oraz  funkcje.  Używa  się  też  sondy  o różnych 
długościach. 

Najprostsza  pojedyncza  sonda  elektryczna,  tzw. 
dwubiegunowa  jest  wyposażona  w trzy  elektrody  — 
dwie  prądowe  i jedną  pomiarową.  Druga  elektroda 
pomiarowa  jest  umieszczona  na  powierzchni  terenu, 


PS  PO  png  PG 

Rys.  10.  Zasada  geofizycznego  profilowania  w otworach  wiertni- 
czych wraz  z wynikami  profilowań  stosowanych  do  wykrywania 
pokładów  węglowych  PS  krzywa  profilowania  potencjałów  po- 
laryzacji naturalnej,  PO  krzywa  profilowania  oporności,  PG 
krzywa  profilowania  y,  PNG  krzywa  profilowania  neutron-y 
(opracował  St.  Plewa) 


a więc  nie  wchodzi  w skład  sondy.  Sonda  taka  naj- 
częściej jest  stosowana  do  profilowania  oporu  prze- 
wiercanych skał  (profilowanie  elektrooporowe). 

Po  wyłączeniu  elektrod  zasi łających  sondę,  można 
wykonywać  profilowanie  potencjałów  polaryzacji  na- 
turalnej skał  (metoda  potencjałów  własnych  w geo- 
elektryce  poszukiwawczej).  W tym  wypadku  mierzy 
się  różnicę  potencjału  pola  elektrycznego  samoistnie 
powstałego  w przewiercanych  przez  otwór  warstwach. 
Potencjał  pojawia  się  w wyniku  procesów  dyfuzyjno- 
absorpcyjnych  w ścianach  otworu,  przez  które  prze- 
nikają wodne  roztwory  soli,  ośrodka  skalnego  i płucz- 
ki, jako  rezultat  filtracji  tych  roztworów  oraz  wsku- 
tek procesów  utleniająco-redukcyjnych  zachodzących 
w pokładach  węgli,  złóż  rud  siarczkowych  i w struktu- 
rach zawierających  tlenki  metali. 

W"  zakres  elektrometrn  wiertniczej  wcnoazą  rożne 
warianty  profilowania  oporu  (PO),  profilowanie  po- 
tencjałów polaryzacji  naturalnej  (spontanicznej,  PS), 
profilowanie  potencjałów  polaryzacji  wzbudzonej 
(PW)  i profilowanie  indukcyjne  (PI). 

W radiometrii  wiertniczej  do  profilowania  wyko- 
rzystuje się  sondy  zawierające  detektory  promienio- 
wania y lub  neutronów,  ewentualnie  także  źródło 
promieniowania. 

W termometrii  wiertniczej  wyróżnia  się  profilo- 
wanie cieplnego  oporu  skał  (PTu)  i profilowanie 
przewodzenia  temperatury  (PTn).  Metodę  PTu  sto- 
suje się  w warunkach  ustalonej  równowagi  cieplnej 
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Rys.  1 1 . Przykład  zastosowania  radiometrycznego  profilowania  otworów  do  określenia  litologii  przew  ierconych  skal  oraz  do 
ich  korelacji  międzyotworowej;  PG  krzywa  profilowania  y,  PNG  krzywa  profilowania  neutron-y,  Ing  — natężenie  wtórnego 
promieniowania  y,  Ig  natężenie  naturalnego  profilowania  y,  B-l,T-3  nazwy  otworów  wiertniczych  (opracował  St.  Plewa) 
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Rys.  12.  Przykład  wykrywania  horyzontów  roponośnych  na  pod- 
stawie profilowania  potencjałów  polaryzacji  naturalnej  PS  i pro- 
filowania oporności  PO  oraz  kontroli  stanu  zacementowania 
otworu  metodą  profilowania  y (PG)  i y izotopowego  (PGi), 
Kv)  współczynnik  nasycenia  skal  wodą,  KWR  kontakt  woda- 
-ropa  (opracował  St.  Plewa) 


w otworze  wiertniczym;  służy  ona  do  pomiaru  stop- 
nia geotermicznego  i gęstości  strumienia  cieplnego 
Ziemi.  Metoda  PTn  polega  na  pomiarze  temperatury 
w warunkach  nieustalonej  równowagi  cieplnej; 
wartość  temperatury  w otworze  jest  wówczas  pro- 
porcjonalna do  współczynnika  przewodzenia  tempe- 
ratury przewierconych  skał.  PTu  wykonuje  się  w celu 
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Stuttgard  1974;  Z.  Faiklewicz,  Grawimetria  poszukiwawcza 
Warszawa  1973;  St.  Plewa,  Geofizyka  wietrnicza,  Katowice  1972 
Przewodnik  pracownika  służby  geologicznej , Warszawa  1971 
Sostojanije  i zadaczi  razwiedocznoj  gieofiziki,  Moskwa  1971 
Z.  FAJKLEWicz(red.),  Zarys  geofizyki  stosowanej.  Warszawa  1 972. 


wyodrębnienia  różnego  typu  skał  i warstw  gazo- 
nośnych oraz  określania  stanu  zacementowania  od- 
wiertu. 

Do  sejsmometrii  wiertniczej  należą  pomiary  pręd- 
kości rozchodzenia  się  fal  sejsmicznych  w przewier- 
conych skałach.  Wykonuje  się  np.  profilowanie  aku- 
styczne prędkości  (PAP)  na  potrzeby  sejsmiki  poszu- 
kiwawczej oraz  w celu  skorelowania  warstw  przewier- 
conych w różnych  miejscach  i obliczenia  ich  współ- 
czynnika porowatości. 

W zakres  magnetometrii  wiertniczej  wchodzi  pro- 
filowanie podatności  magnetycznej  (PPM)  skał,  któ- 
rego celem  jest  wykrywanie  i lokalizowanie  ciał 
o dużej  podatności  magnetycznej,  np.  niektórych  ty- 
pów złóż  rud  żelaza.  Jeżeli  tego  rodzaju  złoże  nie 
zostało  przewiercone,  a może  występować  w pobliżu 
otworu,  to  w celu  wykrycia  stosuje  się  profilowanie 
pola  magnetycznego  (PZM),  na  podstawie  którego 
wyznacza  się  w otworach  wiertniczych  nachylonych 
zmiany  wartości  natężenia  i kierunku  pola. 

W celu  ograniczenia  wieloznaczności  interpretacji 
pojedynczych  krzywych  pomiarowych,  w otworach 
wiertniczych  wykonuje  się  komplet  profilowań  dobra- 
ny odpowiednio  do  podstawowego  zadania  geolo- 
gicznego. Analiza  otrzymanych  w ten  sposób  wyni- 
ków w powiązaniu  z dostępnymi  danymi  geologicz- 
nymi i górniczymi  nosi  nazwę  kompleksowej  inter- 
pretacji profilowań.  Dla  przykładu  na  rys.  10  przed- 
stawiony jest  kompleks  profilowań  stosowany  do  wy- 
krywania pokładów  węglowych,  a na  rys.  1 1 są  poda- 
ne wyniki  zastosowania  metod  radiometrycznych  do 
określania  składu  i wykształcenia  przewierconych  skał 
oraz  do  ich  korelacji  międzyotworowej.  Na  rys.  11 
zwraca  uwagę  wykryte  złoże  fosforytów. 

Komplet  profilowań  wykonany  na  potrzeby  gór- 
nictwa naftowego  pokazano  na  rys.  1 2,  podane  dane 
stanowią  pełną  informację  o wykrytym  złożu  ropy 
naftowej. 
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ASTROFIZYKA  1 KOSMOCHEMIA 

Kosmologia  Antymateria  we  Wszechświecie  Radioastronomia 
Astronomia  promieni  X i y Astronomia  w podczerwieni  • Ewolu- 
cja gwiazd  • Galaktyki  Gwiazdy  zmienne  pulsujące  • Kwazary  • Pul- 
sary  Czarne  dziury  i zapadanie  grawitacyjne  - Fale  grawitacyjne 
Promieniowanie  kosmiczne  Rozpowszechnienie  pierwiastków 
chemicznych  i molekuł  we  Wszechświecie  Reakcje  jądrowe  w 
gwiazdach  • Powstawanie  pierwiastków  chemicznych  • 


Kosmologia 

Michał  Heller 


Obserwowainy  Wszechświat 

Podstawowe  znaczenie  dla  kosmologii  współczesnej 
ma  doświadczalny  fakt,  że  wszystkie  informacje  we 
Wszechświecie  mogą  być  przenoszone  tylko  ze  skoń- 
czoną prędkością.  Istnieje  górna,  nieprzekraczalna 
granica  prędkości  przenoszenia  informacji,  zwana 
prędkością  światła  i oznaczana  przez  c.  Prędkość 
Wszechświat  światła  nie  zależy  — to  również  fakt  doświadczalny  — 
— zbiór  od  wyboru  układu  odniesienia.  Jeżeli  przyjmiemy,  że 
zdarzeń  Wszechświat  jest  największym  możliwym  zbiorem 
zdarzeń,  z których  każde  scharakteryzujemy  przez 
podanie  miejsca  (x,  y,  z)  i chwili  (r),  w której  ono 
zaszło  (rys.  1),  to  z faktu  istnienia  nieprzekraczal- 
nej prędkości  c rozchodzenia  się  informacji  natych- 
miast wynika,  że  muszą  istnieć  zdarzenia  dla  nas  nie- 
obserwowalne.  Jeżeli  bowiem  dwa  zdarzenia  A(xa , 


dojść  do  miejsca  ( xb , ys,  zb ) przed  chwilą  t b , czyli: 

(xb— xA)Zjr(yB  — yA)2+(zB  — zA)2  > c\tB—tA)2, 

to  zdarzenie  B jest  nieobserwowalne  dla  A.  Mówimy, 
że  zdarzenia  A i B są  oddzielone  od  siebie  w cza- 
soprzestrzeni przedziałem  przestrzeń  nopodobnym 
(rys.  2). 

Dla  zdarzeń,  które  mogą  wymieniać  ze  sobą 
informację,  mamy: 


zdarzenia 
obserwował- 
ne  i 

naeobserwo- 

waine 


(xb— xAY+(yB—  yA)2jr(zB  — zA)2  < c\tB-tA). 


Gdy  obowiązuje  znak  <,  zdarzenia  mogą  sobie 
przekazywać  informacje  za  pomocą  sygnałów  wol- 
niejszych od  c;  mówimy  wówczas,  że  zdarzenia  są 
oddzielone  od  siebie  w czasoprzestrzeni  przedziałem 
czasopodobnym  (rys.  3).  Gdy  obowiązuje  znak  =, 


Rys.  I.  Zdarzenie, 
którego  wszystkie 
współrzędne  są  rów- 
ne zeru:  x — y — 

= z - t = 0 


Rys.  2.  Dwa  zdarze- 
nia o różnych  współ- 
rzędnych przestrzen- 
nych, lecz  zachodzące 
w tej  samej  chwili. 
Przedział  s między 
tymi  zdarzeniami  wy- 
nosi : j8  = ( xb-xaY  + 
+ Uh- 

~za)s  > 0.  Przedziały, 
dla  których  r*  > 0 na- 
zywamy przedziała- 
mi przestrzennopodo- 
bnymi 


yA,  z Aj  tA)  i B(xn , ys,  zb,  Ib)  są  tak  rozmieszczone, 
że  informacja  wysłana  w chwili  tA  z miejsca  ( xA ,• 
yx,  zA),  przenosząca  się  z prędkością  c,  nie  zdąży 


Rys.  3.  Zdarzenie,  dla 
którego:  x = y — 

— z — 0,/  = f,.  Prze- 
dział s między  tym 
zdarzeniem  a zdarze- 
niem z rys.  1 wynosi: 
*8  = -c8??  <0.  Prze- 
działy, dla  których 
s*  < 0,  nazywamy  prze- 
działami czasopodob- 
nymi 


zdarzenia  mogą  się  kontaktować  tylko  za  pomocą 
sygnałów  rozchodzących  się  z prędkością  c (sygnałów 
świetlnych);  mówimy  wówczas,  że  zdarzenia  są  od- 
dzielone od  siebie  przedziałem  typu  zerowego  (zero- 
wym, świetlnym). 

Rozważmy  zbiór  zdarzeń,  z którymi  zdarzenie  O 
(określone  przez : xo  = yo  = zo  = 0)  może  kon- 
taktować się  za  pomocą  sygnałów  świetlnych,  tzn.: 

ct  — ±]/ xiJryi-}-z2  . 

Równanie  to  opisuje  powierzchnię  dwóch  cztero-  stożki 
wymiarowych  stożków  stykających  się  ze  sobą  wierz-  świetlne 
chołkami  w początku  układu  odniesienia  (rys.  4).  zdarzenia 
Nazywamy  je  stożkami  świetlnymi  zdarzenia  O.  Na 
powierzchni  stożków  leżą  zdarzenia,  z którymi  O 
może  się  kontaktować  używając  sygnałów  świetlnych; 
wewnątrz  dolnego  i górnego  stożka  leżą  zdarzenia, 
z którymi  O może  się  kontaktować  za  pośrednictwem 
sygnałów  wolniejszych  niż  światło.  Poza  tymi  stoż- 
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kami  znajdują  się  zdarzenia,  z którymi  O nie  może 
się  kontaktować.  Ze  stożka  dolnego  zdarzenie  O 
może  odbierać  informacje,  nazywamy  go  stożkiem 
świetlnym  przeszłości  zdarzenia  0\  do  stożka  gór- 
nego O może  przesyłać  informacje,  nazywamy  go 
stożkiem  świetlnym  przyszłości  zdarzenia  O. 


astronomiczne  wykonane  na  Ziemi  są  typowe  dla 
całego  Wszechświata.  Przyjęcie  położenia  Ziemi  we 
Wszechświecie  za  typowe  wiąże  się  zwykle  z nazwis- 
kiem Kopernika.  Założenia  a)  i b)  łącznie  nazywa  się 
zasadą  kosmologiczną. 


Obserwacyjne  podstawy  kosmologii 

Obserwowany  Wszechświat  wypełniony  jest  galakty- 
kami i gromadami  galaktyk  (*-►  Galaktyki).  Oszaco- 
wania średniej  gęstości  materii  we  Wszechświecie  dają 
wartości  pomiędzy  10“ 28  a 10“ 31  g/cm3.  Zbiór  galak- 
tyk nie  jest  zbiorem  statycznym.  Systematyczne  prze- 
sunięcia ku  czerwieni  w widmach  galaktyk,  zinter- 
pretowane jako  zjawisko  Dopplera  oznaczają,  że  ga- 
laktyki oddalają  się  od  obserwatora  jednakowo  we 
wszystkich  kierunkach  (czyli  izotropowo),  z pręd- 
kościami v wprost  proporcjonalnymi  do  odległości  r 
(od  danej  galaktyki  do  obserwatora),  tzn.  według 
prawa : 

7=h79  (i) 

zw.  prawem  Hubble’a,  gdzie  H — stała  Hubble’a 
(rys.  5).  Rozszerzanie  się  przestrzeni  2- wymiarowej 
można  przedstawić  poglądowo  w przestrzeni  3-wy- 
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Rys.  4.  Stożki  świetlne  obserwatora  O (ziemskiego  astronoma). 
Dla  jaśniejszego  zobrazowania  stosunków  czasoprzestrzennych 
pominięto  dwa  wymiary  przestrzenne  ( y i z),  zachowując  tylko 
wymiar  ct  i jeden  wymiar  przestrzelmy  x 

Ponieważ  za  O można  przyjąć  dowolny  punkt  w 
czasoprzestrzeni  (w  dowolnym  miejscu  można  wy- 
brać początek  układu  odniesienia),  powiadamy,  że 
czasoprzestrzeń  ma  strukturę  stożkową.  Dotychczas 
milcząco  zakładaliśmy,  że  czasoprzestrzeń  jest  płas- 
ka — tak  czyni  się  w szczególnej  teorii  względności  — 
ale,  jak  wiemy  z ogólnej  teorii  względności,  tak  wcale 
być  nie  musi.  Czasoprzestrzeń  może  być  zakrzywiona 
lub  nawet  nieregularnie  pofałdowana.  Wówczas, 
oczywiście,  deformują  się  także  stożki  świetlne.  Może- 
my jednak  zawsze  rozważać  tak  małe  obszary  czaso- 
przestrzeni, żeby  w dobrym  przybliżeniu  można  je 
było  uważać  za  płaskie;  w obrębie  takich  obszarów 
spełnione  są  wszystkie  powyższe  wzory.  Od  dokład- 
ności pomiarów,  którymi  dysponujemy  badając  dane 
zagadnienie,  zależy,  jak  duże  obszary  czasoprzestrzeni 
można  uważać  jeszcze  za  płaskie.  Tak  np.  R.  V.  Pound 
i G.  A.  Rebka  (1960  r.)  wykorzystując  zjawisko  rezo- 
nansu jądrowego  (— ► Jądrowy  rezonans  magnetyczny) 
i efekt  Mossbauera  (-►  Zjawisko  Mossbauera),  zmie- 
rzyli krzywiznę  czasoprzestrzeni  w obszarach  prze- 
strzennych zaledwie  kilkunastu  metrów  i w przedziale 
czasu  potrzebnym  do  pokonania  tej  odległości  przez 
promień  świetlny.  Natomiast  w zagadnieniach  astro- 
nomicznych, przy  obecnej  technice  obserwacyjnej, 
poprawki  wynikające  z ogólnej  teorii  względności 
można  mierzyć  dopiero  na  granicy  odległości,  do 
których  w ogóle  sięgamy. 

Przyjmijmy  teraz,  że  O jest  ziemskim  astronomem, 
który  bada  obecnie  Wszechświat.  Dla  niego  obser- 
wowalnym  Wszechświatem  może  być  tylko  jego  sto- 
żek przeszłości.  Astronom,  badając  Wszechświat, 
posługuje  się : a)  znajomością  fizyki  sprawdzonej  eks- 
perymentalnie na  Ziemi  i w jej  bezpośrednim  sąsiedz- 
twie (loty  kosmiczne)  oraz  b)  obserwacjami  polegają- 
cymi na  rejestrowaniu  fal  elektromagnetycznych 
(w  zakresie  optycznym  i radiowym)  przychodzących 
z przestworzy  kosmicznych.  A zatem  w praktyce  nie 
penetrujemy  całego  naszego  stożka  świetlnego  prze- 
szłości, lecz  tylko  jego  obszary  zakreślone  na  rys.  4 
niebieskim  kolorem. 

Chcąc  na  tak  małej  bazie  obserwacyjnej  odtworzyć 
strukturę-ewolucję  Wszechświata,  musimy  przyjąć 
pewne  uogólnienia,  a mianowicie:  a)  prawa  fizyki 
sprawdzone  na  Ziemi  i w jej  najbliższym  sąsiedztwie 
obowiązują  w całym  Wszechświecie,  b)  obserwacje 


Rys.  5.  Zależność  prędkości  ucieczki  galaktyk  od  odległości 
określona  przez  Hubble’a 


Rys.  6.  Powierzchnia  balonika  zakrzywiona  i zamknięta  sta- 
nowi przykład  przestrzeni  2- wymiarowej.  Przy  równomiernym 
nadmuchiwaniu  balonika  kropki  na  jego  powierzchni  oddalają 
się  od  siebie  zgodnie  z prawem  Hubbie’a.  Żadna  z nich  nie  zaj- 
muje wyróżnionego  położenia.  Hubbleowskie  rozszerzanie  nie 
łamie  zasady  Kopernika 


Wartość  stałej  H otrzymana  przez  różnych  badaczy 


Nazwisko 

Rok  | 

| H,  (km/s)/Mps* 

E.  Hubble 

1936 

526 

W.  Baade 

1950 

200 

A.  R.  Sandage 

1968 

75,J+j» 

S.  Van  den  Bergh 

1970 

G.  De  Vaucouleurs 

1970 

50 

A.  R.  Sandage,  G.  A.  Tammann 

1975 

S5±5 

P.  Tecrikorpi 

1976 

41  ±3 

L.  Bottinelli,  L.  Gouguenheim 

1976 

76±8 

*1  Mps  = 10'  ps  * 3-10*2  m. 
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miarowej  (rys.  6).  Poglądowe  przedstawienie  rozsze- 
rzania się  przestrzeni  3-wymiarowej  nie  jest  możliwe. 

Wyznaczenie  wartości  stałej  H z danych  obserwa- 
cyjnych ma  zasadnicze  znaczenie  dla  kosmologii. 
Hubblc  przyjmował  pierwotnie,  że  wartość  stałej  H 
równa  się  ok.  500  (km/s)/Mps.  Jego  oszacowanie 
oparte  na  błędnej  ocenie  odległości  do  najbliższych 
galaktyk  kilkakrotnie  poprawiano.  Niektóre  wyniki 
przedstawia  tabela  na  str.  900. 

Przyjmujemy  za  Sandagem,  że  prawdziwa  wartość 
stałej  H znajduje  się  pomiędzy  50  a 100  (km/s)/Mps. 
Zgodnie  z tym  mamy: 

H - /r- 100  (km/s)/Mps, 

przy  czym  zakładamy,  że  h jest  zawarte  pomiędzy 
0,5  a 1,0. 

Wielkość  przesunięcia  ku  czerwieni  w widmie  danej 
galaktyki  z definiuje  się  następująco: 

Aotos  — hj 
2 Xg 

gdzie  Aobs  — długość  fali  zmierzonej  przez  obserwa- 
tora, Xg  — długość  fali  emitowanej  przez  galaktykę. 

Ponieważ  prawo  Hubbłe*a  przypisuje  jednoznacznie 

galaktyce  znajdującej  się  w określonej  odległości  r 
przesunięcie  z,  to  w praktyce  można  przyjąć  z jako 
miarę  odległości.  Z kolei  w astronomii  „głębia  od- 
ległości” odpowiada  „głębi  czasu”  (galaktykę  od- 
ległą o 10  min  lat  świetlnych  oglądamy  taką,  jaka 
była  10  min  lat  temu),  zatem  w kosmologii  przyjęto 
wyrażać  czas  poprzez  wartości  z. 

Obserwacje  radioastronomiczne  (wykonane  po  raz 
pierwszy  przez  A.  A.  Penziasa  i R.  W.  Wilsona  w 
1965  r.)  wykazały,  że  przestrzeń  Wszechświata  jest 
izotropowo  wypełniona  promieniowaniem  elektro- 
magnetycznym, zwanym  promieniowaniem  relikto- 
wym lub  promieniowaniem  tła.  W promieniowaniu 
tła  przeważają  fale  o długościach  milimetrowych. 
Jego  temperatura  wynosi  Tpr0m  x 2,7  K,  a odpowia- 
dająca jej  liczba  fotonów  na  jednostkę  objętości 
/iprom  ^ 103/cm3  i gęstość  energii  £pr0m  410~14 
J/m3.  Mierząc  temperaturę  promieniowania  tła  w 
różnych  kierunkach  otrzymano  jednakowe  wyniki 
(odchylenia  są  rzędu  10” 4 K);  zatem  pole  promie- 
niowania jest  izotropowe. 

Zgodnie  z zasadą  kosmologiczną  izotropowość 
ucieczki  galaktyk  i izotropowość  promieniowania  tła 
możemy  ekstrapolować  na  cały  Wszechświat.  Zakła- 
damy więc,  że  obserwator  umieszczony  w dowolnym 
punkcie  przestrzeni  widzi  wokół  siebie  materię  roz- 
mieszczoną izotropowo  (gromady  galaktyk  i promie- 
niowanie). Jeżeli  rozkład  materii  jest  izotropowy 
względem  każdego  punktu  przestrzeni,  to  jest  on 
również  jednorodny  (prawo  Schura).  Izotropowość 
(brak  wyróżnionych  kierunków  w przestrzeni)  i jed- 
norodność (brak  wyróżnionych  punktów  w prze- 
strzeni) są  zasadniczą  treścią  zasady  kosmologicznej. 
Innymi  słowy,  zasada  kosmologiczna  postuluje  sfe- 
ryczną symetrię  rozkładu  materii  względem  każdego 
obserwatora  w przestrzeni.  Z obserwacji  zaś  wynika, 
że  średnia  gęstość  materii  w przestrzeni  jest  stała, 
jeśli  uśrednienia  dokonywać  po  obszarach  obejmują- 
cych wiele  gromad  galaktyk  (po  obszarach  o linio- 
wych rozmiarach  większych  niż  100  Mps).  Byłoby  to 
dodatkowym  obserwacyjnym  potwierdzeniem  zasady 
kosmologicznej  i wskazywałoby,  że  „elementarną 
cegiełką”  w kosmologii  jest  gromada  galaktyk. 


Konstrukcja  modeli  kosmologicznych 

Ze  wszystkich  oddziaływań  (-►  Cząstki  elementarne 
i ich  oddziaływanie)  znanych  współczesnej  fizyce 
(silne,  słabe,  elektromagnetyczne,  grawitacyjne)  od- 
działywania grawitacyjne,  choć  najsłabsze,  mają  naj- 
większy (teoretycznie  nieograniczony)  zasięg  (jeśli 
pominąć  oddziaływania  elektromagnetyczne,  których 


efektywny  zasięg  jest  zmniejszony  przez  to,  że  ładunki 
dodatnie  znoszą  się  z ujemnymi).  Przede  wszystkim 
więc  one  są  odpowiedzialne  za  strukturę  Wszechświa- 
ta. Dlatego  też  współczesna  kosmologia  teoretyczna 
opiera  się  na  einsteinowskiej  teorii  grawitacji,  czyli  na 
ogólnej  teorii  względności;  jest  więc  kosmologią  re- 
latywistyczną. 

W ogólnej  teorii  względności  pole  grawitacyjne 
jest  reprezentowane  przez  zakrzywienie  czasoprze- 
strzeni. Ilościowy  związek  między  rozkładem  materii 
będącej  źródłem  pola  grawitacyjnego  a geometrią 
czasoprzestrzeni  wyrażają  równania  pola  grawitacyj- 
nego: 

Rab  \Rgab  - ~ xTab’  (2) 

Lewa  strona  tego  równania  tensorowego  (równo- 
ważnego dziesięciu  równaniom  skalarnym)  jest  zbu- 
dowana z wielkości  geometrycznych;  reprezentują 
one  geometryczną  strukturę  czasoprzestrzeni.  Prawa 
strona  to  tensor  energii  — pędu  Tab,  opisujący  roz- 
kład gęstości,  ciśnień,  pędów  i energii,  jest  on  pomno- 
żony przez  stałą  grawitacji  Einsteina  « = SnGfc \ 
gdzie  G — newtonowska  stała  grawitacji.  Tak  więc 
równania  (2)  ukazują,  w jaki  sposób  rozkład  materii 
określa  geometrię  czasoprzestrzeni ; a czytane  w drugą 
stronę  informują  o tym,  jak  geometria  czasoprze- 
strzeni determinuje  ruchy  materii:  swobodne  cząstki 
materialne  ^izn.  takie,  na  które  nie  działają  żadne 
siły  z wyjątkiem  grawitacyjnych)  poruszają  się  po 
liniach  najprostszych  (tzw.  liniach  geodezyjnych  lub 
geodetykach)  w czasoprzestrzeni. 

Z równań  (2)  nie  wynika  statyczny  model  Wszech- 
świata, co  wydawało  się  być  ich  wadą.  Bezpośrednio 
po  powstaniu  ogólnej  teorii  względności  (1917  r.) 
Einstein  nie  podejrzewał  nawet,  że  Wszechświat  się 
rozszerza,  sądził,  że  świat  jest  statyczny.  Aby  otrzy- 
mać statyczny  model  Wszechświata  dodał  do  równań 
pola  tzw.  człon  kosmologiczny  Aga 6,  gdzie  A — 
pewna  nowa  stała  o wymiarze  [długość!-2,  zwana 
stałą  kosmologiczną.  Zmodyfikowane  równania  pola 
miały  postać: 

Rab-  \Rgab-\-  Agat  — —xTab.  (2a) 

Obecnie,  na  podstawie  danych  obserwacyjnych, 
sądzi  się,  że  wartość  stałej  kosmologicznej  jest  równa 
zeru,  lub  mało  od  niego  różna.  Dlatego  w dalszym 
ciągu  bardziej  szczegółowo  omówimy  modele  Wszech- 
świata bez  stałej  kosmologicznej. 

Podstawowe  zagadnienie  kosmologiczne  polega  na 
tym,  by  na  podstawie  danych  obserwacyjnych  o roz- 
mieszczeniu materii  we  Wszechświecie  i równań  pola 
ogólnej  teorii  względności  odpowiedzieć  na  pytanie, 
jaka  jest  globalna  (w  największej  skali)  geometryczna 
struktura  Wszechświata.  Informacje  zawarte  w zasa- 
dzie kosmologicznej  znacznie  ułatwiają  znalezienie 
odpowiedzi  na  to  pytanie.  Geometryczna  treść  zasady 
kosmologicznej  sprowadza  się  bowiem  do  następu- 
jących stwierdzeń:  a)  Można  wybrać  taki  układ  od- 
niesienia, względem  którego  materia  wypełniająca 
Wszechświat,  średnio  rzecz  biorąc,  spoczywa;  ina- 
czej: ponieważ  cząstki  materialne  (galaktyki,  groma- 
dy galaktyk)  mogą  oddalać  się  od  siebie  (lub  zbliżać), 
układ  odniesienia  nie  jest  sztywny,  lecz  rozszerza  się 
(lub  kurczy)  razem  z materią.  Nazywamy  go  współ- 
poruszającym  się  układem  odniesienia.  Jego  matema- 
tycznym odpowiednikiem  jest  współporuszający  się 
układ  współrzędnych  (współrzędne  są  jakby  przycze- 
pione do  cząstek  materialnych  i poruszają  się  razem 
z nimi),  b)  We  współporuszającym  się  układzie  od- 
niesienia czasoprzestrzeń  daje  się  w każdym  punkcie 
rozłożyć  na  uniwersalny  czas  kosmiczny  / i prosto- 
padłą do  niego  3-wymiarową  przestrzeń  równocze- 
sności,  / = consf.  Tak  więc  z upływem  czasu  (uniwer- 
salnego) zmieniają  się  w sposób  ciągły  różne  obser- 
wowane własności  geometryczne  3-wymiarowej  prze- 
strzeni. Przestrzenie  równoczesności  są  przestrzenia- 
mi o stałej  krzywiźnie:  dodatniej  (dwuwymiarowym 
przykładem  przestrzeni  o stałej  dodatniej  krzywiźnie 
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jest  powierzchnia  kuli,  rys.  7),  zerowej  (przestrze- 
nie płaskie,  rys.  8)  lub  ujemnej  (dwuwymiarowym 
przykładem  jest  powierzchnia  wklęsłego  siodła, 
rysunek  9). 


Rys.  7.  Powierzchnia 
kuli  jest  przykładem 
dwuwymiarowej  prze- 
strzeni o dodatniej 
krzywizn  ie.  Jest  to 
przestrzeń  zamknię- 
ta: promień  światła 
po  skończonym  czasie 
wraca  do  punktu  wyj- 
ścia. Wszystkie  linie 
geodezyjne  (południ- 
ki) ogniskują  się  na 
biegunach.  Suma  ką- 
tów w trójkącie  jest 
większa  od  180° 
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gdzie  q — gęstość  materii,  a p — ciśnienie  gazu 
galaktyk. 

Musimy  teraz  przyjąć  pewne  upraszczające  zało- 
żenia dotyczące  materii  we  Wszechświecie.  Jeśli  wy- 
obrazimy sobie  zbiór  galaktyk  (ściślej  gromad  ga- 
laktyk) jako  gaz  o stałej  gęstości  przestrzennej  (gęstość 
gazu  w czasie  może  ulegać  zmianom  wskutek  eks- 
pansji), to  okazuje  się,  że  ciśnienie  tego  gazu  jest 
pomijalnie  małe  w porównaniu  z jego  gęstością. 
Przyjęcie  zasady  kosmologicznej  i założenie,  że  ciś- 
nienie gazu  galaktyk  jest  równe  zeru,  pozwala  z rów- 
nań pola  otrzymać  jedno  równanie,  zwane  równaniem 
Friedmana. 

W rzeczywistym  Wszechświecie  stosunek  p(c2q 
wynosi  ok.  10~6.  Możemy  więc  przyjąć,  że  ciśnienie 
znika : 

P = 0.  (5) 


Rys.  8.  Przykład  dwuwymiarowej  przestrzeni  płaskiej  — płasz- 
czyzna euklidesowa.  Jest  to  przestrzeń  otwarta:  promień  światła 
wysłany  w przestrzeń  nie  powróci  do  punktu  wyjścia.  Do  danej 
prostej  / istnieje  tylko  jedna  prosta  równoległa  przechodząca 
przez  punkt  A nie  leżący  na  prostej  / (piąty  postulat  Euklidesa). 
Suma  kątów  w trójkącie  jest  równa  180° 


Związek  (5)  nazwano  równaniem  stanu  dla  nieod- 
działującej  ze  sobą  materii  pyłowej  (gaz  galaktyk  fizy- 
cznie jest  podobny  do  cieczy  doskonałej  bez  ciśnie- 
nia). Wstawiając  warunek  (5)  do  równania  (4b) 
otrzymujemy,  po  prostych,  ale  dość  żmudnych  prze- 
kształceniach, równanie  Friedmana* 


gdzie  występuje  stała  całkowania  £: 

E = QWc\  (7) 


równanie 

Friedmana 


czynnik 
skali  92 


Rys.  9.  Przykład  dwuwymiarowej  przestrzeni  o krzywiźnie  ujem- 
nej. Jest  to  przestrzeń  otwarta.  Do  danej  prostej  (geodetyki) 
/ istnieje  nieskończenie  wiele  równoległych  przechodzących 
przez  punkt  A nic  leżący  na  /.  Suma  kątów  w trójkącie  jest 
mniejsza  od  180 


H.  P.  Robertson  i A.  G.  Walker  (niezależnie  od  sie- 
bie) pokazali,  że  każda  czasoprzestrzeń  spełniająca 
zasadę  kosmologiczną  musi  mieć  następującą  metrykę 
(czyli  wzór  na  przedział  między  dwoma  dowolnie 
sobie  bliskimi  zdarzeniami;  metryka  jest  jednym  z naj- 
bardziej podstawowych  wyrażeń  geometrycznych 
charakteryzujących  daną  przestrzeń): 


<fc*=cW-92*(0 


dx2+dy2-\-dz2 
[\+\k{x2+y2  + z2)]2' 


(3) 


gdzie  t — czas  kosmiczny,  9 2(/) — czynnik  skali 
(zwany  też  promieniem  Wszechświata).  Czynnik  skali 
charakteryzuje  zmianę  odległości  między  dowolnymi 
punktami  przestrzeni:  jeśli  w pewnej  chwili  odległość 
między  dwoma  obiektami  wynosi  L,  to  po  upływie 
czasu  / odległość  ta  będzie  równa  K{i)-L.  Stała  k 
może  przybierać  jedną  z trzech  wartości : 0,  fi. 
Jeśli  k — t 1,  przestrzenie  stałego  czasu  mają  stałą 
dodatnią  krzywiznę;  jeśli  k — 0,  przestrzenie  te  są 
płaskie,  i jeśli  k = - 1 — są  to  przestrzenie  o ujem- 
nej krzywiźnie. 

Dziesięć  równań  pola  (2a),  po  uwzględnieniu  me- 
tryki (3),  sprowadza  się  do  następujących  dwóch  wy- 
rażeń : 


XQC2  = 


„ , , kc2  HWIdt)2 
— . 


(4a) 


odgrywająca  rolę  całkowitej,  zachowującej  się  energii 
pyłu  (suma  energii  spoczynkowych  wszystkich  czą- 
stek w określonej  początkowo,  współporuszającej  się 
objętości). 

Równanie  (6)  określa  zmianę  92  w czasie.  Każde 
jego  rozwiązanie  przedstawia  ewolucję  określonego 
modelu  kosmologicznego. 


Modele  Friedmana 

Równanie  (6)  dla  A = 0 ma  trzy  rozwiązania.  Bę- 
dziemy je  nazywać  modelami  kosmologicznymi 
Friedmana.  Modele  te  przedstawia  rys.  10. 

Ewolucja  trzech  modeli  Friedmana  rozpoczyna  się 
od  stanu  „osobliwego’’,  który  charakteryzują  nastę- 


Rys.  10.  Modele  kosmologiczne  z A — 0 
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model  £-, 


model 

Einsteina 


pujące  zależności : gdy  / ->  0,  wówczas  92  ->  0 i g ->  oo. 
W pobliżu  początkowej  osobliwości  wszystkie  trzy 
rozwiązania  przebiegają  jednakowo.  Plaski  model 
Friedmana  (określony  przez:  k — A = p = 0),  zwany 
również  kosmologicznym  modelem  EinsteinaAie  Sit- 
tera  (model  E~S)y  rozszerza  się  z prędkością  ucieczki. 
Jeżeli  tempo  ekspansji  jest  mniejsze  od  prędkości 
ucieczki,  jak  dla  zamkniętego  (Je  — -f  1)  modelu 
Friedmana,  model  po  osiągnięciu  maksymalnych  roz- 
miarów kurczy  się  do  punktu  stanowiącego  końcową 
osobliwość.  Jeżeli  tempo  ekspansji  równa  się  (jak  w 
modelu  iT-S)  lub  przewyższa  (jak  w modelu  z k = — 1) 
prędkość  ucieczki,  ekspansja  trwa  nieograniczenie 
długo  i po  nieskończenie  długim  czasie,  gdy  / ->  oo, 
gęstość  materii  wypełniającej  Wszechświat  spada  do 
zera  (e  ->  0). 

Jak  można  tego  oczekiwać,  prędkość  ucieczki  jest 
zależna  od  gęstości  materii.  W modelu  Einsteina-de 
Sittera  gęstość  qe~s  jest  równa: 

qe~s  = 1,9-  10_2d/z2  g/cm3 

(wielkość  h wprowadziliśmy  na  str.  901). 

W modelu  zamkniętym  mamy:  q > qe~s,  a w mo- 
delu otwartym  q < qes . Zależności  te  są  prostym 
testem  obserwacyjnym  mogącym  rozstrzygnąć,  który 
z trzech  modeli  Friedmana  odpowiada  rzeczywistości. 
Niestety,  obecne  oszacowania  średniej  gęstości  ma- 
terii we  Wszechświecie  są  obarczone  tak  dużym  błę- 
dem, że  test  ten  nie  daje  rozstrzygających  wyników. 


Rys.  12.  Modele  kosmologiczne  otwarte  płaskie,  z k — 0,  oraz 
A * 0.  Model  z A ~ 0 wyróżniono  niebieskim  kolorem 


Modele  Friedmana- Lemaitre'a 

Jeżeli  przyjmiemy,  że  stała  kosmologiczna  A może 
być  różna  od  zera,  to  otrzymujemy  wiele  modeli 
kosmologicznych.  Będziemy  je  nazywać  modelami 
Friedmana-Lemaitre’a.  Przedstawia  je  rys.  11  i 12. 

Wśród  modeli  zamkniętych  (rys.  11)  znajduje  się 
jeden  model  statyczny  (bez  ewolucji),  tzw.  statyczny 
model  Einsteina  (model  E).  Jest  to  historycznie  pierw- 
szy spośród  relatywistycznych  modeli  Wszechświata, 
podany  przez  Einsteina  w 1917  r.  Rok  ten  można 
uważać  za  datę  powstania  kosmologii  relatywistycz- 


Rys.  11.  Modele  kosmologiczne  zamknięte,  z k=  +1,  oraz 
A jt  0.  Model  z A = 0 wyróżniono  niebieskim  kolorem.  Na  rys. 
II  i 12  przy  każdej  krzywej  podano  wartości  stałej  kosmolo- 
gicznej A w pewnych  umownych  jednostkach,  aby  zobrazować, 
w jaki  sposób  jej  wartość  wpływa  na  kształt  ewolucji  modelu. 
Zwróćmy  uwagę,  że  dla  A = 4,  oprócz  statycznego  modelu 
Einsteina,  możliwe  są  jeszcze  dwa  rozwiązania,  tzw.  modele 
asymptotyczne  At  i Ax 


nej.  Zauważmy,  że  w modelu  E stała  kosmologiczna 
A ^ 0.  Właśnie  po  to  Einstein  wprowadził  do  teorii 
stałą  kosmologiczną,  aby  uzyskać  model  statyczny. 

Historycznie  drugim  modelem  kosmologicznym  był 
model  opisywany  przez  tzw.  rozwiązanie  de  Sittera  model 
(model  Ś).  Swoimi,  zdawałoby  się  paradoksalnymi,  de  Sittera 
własnościami  model  ten  w pewnym  czasie  sprawił 
teoretykom  sporo  kłopotów.  Świat  de  Sittera  jest 
pusty,  a mimo  to  się  rozszerza  i jest  stacjonarny. 

Pojęcie  stacjonarności  jest,  w pewnym  sensie,  uogól- 
nieniem pojęcia  statyczności:  układ  jest  statyczny, 
jeśli  nic  się  w nim  nie  zmienia;  układ  stacjonarny 
może  ulegać  zmianom,  ale  jako  całość  średnio  pozo- 
staje zawsze  taki  sam.  Liczba  mieszkańców  zamarłego 
w rozwoju  miasteczka  może  być  wielkością  stacjonar- 
ną — mimo  że  poszczególni  ludzie  rosną  i starzeją 
się  — jeśli  średnio  tyle  samo  osób  rodzi  się,  ile  umiera. 

Stacjonarność  świata  de  Sittera  wynika  z jego  pustki, 
nie  ulega  on  rozrzedzaniu  w trakcie  ekspansji,  gdyż 
średnia  gęstość  zawartej  w nim  materii  równa  się  zeru. 

Ale  jak  może  się  rozszerzać  będąc  pustym?  Otóż  z 
równań  opisujących  modele  kosmologiczne  wynika, 
że  każdy  rozszerzający  się  nieograniczenie  model 
Wszechświata,  w miarę  gdy  czas  dąży  do  plus  nie- 
skończoności, przechodzi  w świat  de  Sittera.  Fizycz- 
nie jest  to  zrozumiałe:  w trakcie  rozszerzania  ilość 
mas  zawartych  we  Wszechświecie  pozostaje  stała, 
a objętość  rośnie,  świat  staje  się  rzadszy,  gęstość  ma- 
terii maleje,  w granicy  — gdy  czas  trwania  ekspansji 
dąży  do  nieskończoności  — gęstość  materii  dąży  do 
zera.  Pusty  świat  de  Sittera  jest  granicą,  ku  której 
zmierza  kosmiczna  ekspansja. 

W historii  kosmologii  ważną  rolę  odegrał  model  model 
Lemaitreła  ( L na  rys.  11).  Ewolucja  tego  modelu  Lemaitre'a 
przebiega  wyraźnie  w trzech  etapach:  w pierwszym 
i ostatnim  tempo  ekspansji  jest  duże,  w środkowym  — 
wolniejsze.  Model  ten  ma  ciekawą  własność.  Im  bar- 
dziej zbliżamy  się  z wartością  A do  wartości  A 
charakterystycznej  dla  modelu  £,  tym  bardziej  wy- 
dłuża się  środkowy  etap  ewolucji  świata  Lemaitre’a 
(rys.  13).  Dzięki  temu  można  dowolnie  wydłużać 
wiek  świata  Lemaitre’a  (tzn.  okres,  jaki  upłynął  od 
początkowej  osobliwości). 

Modele  otwarte  z ujemną  krzywizną  (k  = —1) 
pod  względem  ewolucji  czasowej  nie  różnią  się  istot- 
nie od  modeli  płaskich  ( k = 0).  Przedstawiają  je 
krzywe  jakościowo  takie  same  (rys.  1 2). 
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modele  Modele  kosmologiczne  mające  początkową  oso- 
wielkiego  bliwość  nazywa  się  niekiedy  modelami  wielkiego  wy- 
wybuchu  buchu  („Big  Bang").  Zwróćmy  uwagę  na  fakt,  że 
wszystkie  modele  Friedmana-Lemaitre*a,  z wyjąt- 
kiem stosunkowo  nielicznych  odznaczających  się  dużą 
dodatnią  wartością  stałej  kosmologicznej  (A  ^ 4), 
są  modelami  wielkiego  wybuchu. 


Rys.  13.  Model  kosmologiczny  Lemaitre’a  z A niewiele  więk- 
szym od  4 (/I  = 4 w naszych  jednostkach  charakteryzuje  sta- 
tyczny model  Einsteina).  Zmierzając  z wartością  lambda  do  4, 
okres  prawie  statyczny,  zaznaczony  linią  przerywaną,  można 
dowolnie  wydłużać 

Światy  promieniste 

Istotną  składową  materii  we  Wszechświecie  oprócz 
gaz  gazu  galaktyk  jest  gaz  fotonów.  Dlatego  z teore- 
fotonów  tycznego  punktu  widzenia  ważną  klasą  modeli  ko- 
smologicznych są  jednorodne  i izotropowe  modele 
wypełnione  samym  promieniowaniem , tzw.  światy 
promieniste. 

Gaz  fotonów  można  uważać  za  ciecz  doskonałą 
opisaną  równaniem  stanu: 

P = V*.  (8) 

Konstrukcja  modeli  promienistych  jest  zasadniczo 
taka  sama  jak  światów  Friedmana-Lemaitre^,  z tym, 
że  w miejsce  równości  (5)  przyjmuje  się  wzór  (8). 

Dla  dalszych  rozważań  istotne  okaże  się  porówna- 
nie gęstości  energii  otrzymanych  na  drodze  teorety- 
cznych rozważań  dla  świata  wypełnionego  materią 
(gazem  galaktyk)  i dla  świata  wypełnionego  promie- 
niowaniem (gazem  fotonów). 

W rozważanych  modelach  kosmologicznych  obję- 
tość jest  proporcjonalna  do  dlattego  dla  gęstości 
materii  pyłowej  można  napisać: 

Omal  ~ -^3  ■ (9) 

Związek  ten  wynika  także  bezpośrednio  z wzoru  (7). 
Liczba  fotonów  w jednostce  objętości  jest  oczywiście 
również  proporcjonalna  do  70-3,  ale  obliczając  gę- 
stość promieniowania  należy  uwzględnić  poprawkę 
wynikającą  stąd,  że  energia  każdego  fotonu  zmienia 
się  wraz  z ekspansją  (lub  kontrakcją)  Wszechświata 
wskutek  efektu  Dopplera.  Z teorii  wynika,  że  ener- 
gia każdego  fotonu  wskutek  tego  efektu  zmienia  się 
proporcjonalnie  do  R~l.  A zatem  gęstość  energii  pro- 
mieniowania : 

{?  prom  ~ -gi  • (10) 

'6* 

Inne  modele  kosmologiczne 

Omówione  modele  Wszechświata,  spełniające  zasadę 
kosmologiczną,  są  najprostszymi  modelami  relatywi- 
stycznymi. Z teoretycznego  punktu  widzenia  jest  rze- 
czą bardzo  interesującą  studiowanie  modeli  z odchyle- 
niami od  izotropowości  lub  jednorodności.  Tym  bar- 
dziej, że  w małej  skali  świat  na  pewno  nie  jest  jed- 
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norodny  (materia  skupia  się  w galaktyki  i gromady 
galaktyk),  a w dawniejszych  epokach  mógł  być  na- 
wet silnie  anizotropowy. 

W 1949  r.  Kurt  Godeł  zbudował  model  obracające- 
go się  Wszechświata.  Model  ten  jest  jednorodny:  model 
w każdym  punkcie  można  umieścić  początek  lokalnie  Godła 
inercjalnego  układu  odniesienia,  względem  którego 
Wszechświat  wykonuje  obrót  „absolutny",  ale  ani- 
zotropowy: rotacja  wyróżnia  pewien  kierunek  — oś 
obrotu  Wszechświata.  Model  Godła  nie  tłumaczy 
poczerwienienia  w widmach  galaktyk,  świat  gódlow- 
ski  się  nie  rozszerza.  Ponadto,  we  Wszechświecie 
Godła  nie  można  czasoprzestrzeni  jednoznacznie 
rozłożyć  na  czas  kosmiczny  i przestrzenie  chwilowe, 
co  więcej  — w czasoprzestrzeni  Godła  istnieją  zam- 
knięte krzywe  czasowe.  Podróżując  wzdłuż  takiej 
krzywej  można  by  wrócić  do  swojej  przeszłości. 

Dziś  znamy  wiele  modeli  kosmologicznych  obraca- 
jącego się  Wszechświata.  Okazuje  się,  że  w kosmologii 
relatywistycznej  wszystkie  modele  rotujące  są  anizo- 
tropowe, ale  niekoniecznie  odwrotnie  — istnieją 
modele  anizotropowe  bez  obrotu. 

Zadaniem  znacznie  bardziej  skomplikowanym  jest  model 
zbudowanie  modelu  niejednorodnego.  Badania  w tej  niejedno- 
dziedzinie  są  raczej  mało  zaawansowane.  Zwykle  za-  rodny 
gadnienie  upraszcza  się  w ten  sposób,  że  w modelu 
jednorodnym,  wypełnionym  materią  o stałej  gęstości, 
rozważa  się  małe  zaburzenia  gęstości  (odchylenia 
od  stałej  gęstości).  Tego  rodzaju  rozważania  wiążą 
się  z zagadnieniem  powstawania  galaktyk  (które 
są  przecież  lokalnymi  zaburzeniami  gęstości). 

W 1948  r.  powstała  nowa  teoria  kosmologiczna.  Wszechświat 
zwana  teorią  Wszechświata  w stanie  stacjonarnym,  stacjonarny 
której  twórcami  byli  H.  Bondi  i T.  Gold.  Jej  podsta- 
wą jest  tzw.  idealna  (zwana  również  doskonałą  lub 
mocną)  zasada  kosmologiczna,  która  do  postulatów 
jednorodności  i izotropowości  wymaganych  przez 
zwykłą  zasadę  kosmologiczną  dodaje  postulat  sta- 
cjonarności  Wszechświata:  obraz  Wszechświata  jest 
niezależny  nie  tylko  od  położenia  obserwatora 
w przestrzeni,  lecz  także  od  chwili,  w jakiej  dokonuje 
on  obserwacji.  Jeżeli  świat  się  rozszerza  (co  autorzy 
teorii  uznali  za  fakt  obserwacyjny)  a nie  jest  pusty, 
to  jego  obraz  jako  całości  może  się  nie  zmieniać  w cza- 
sie tylko  wtedy,  gdy  gęstość  materii  jest  stale  uzu- 
pełniana przez  powstającą  materię.  Materia,  zdaniem 
Bondiego  i Golda,  powstaje  w przestrzeni  z niczego 
w ilości  średnio:  masa  równoważna  masie  jednego 
atomu  wodoru  na  jeden  litr  objętości  na  5-1011  lat. 

W ten  sposób  kosztem  odstępstwa  od  zasady  zacho- 
wania energii  teoria  Wszechświata  stacjonarnego 
unika  kłopotów  kosmologii  relatywistycznej  związa- 
nych z występowaniem  początkowej  osobliwości. 

Relatywistyczną  wersję  teorii  Wszechświata  w sta- 
nie stacjonarnym  stworzył  F.  Hoyle.  Do  einsteino- 
wskich  równań  pola  wprowadził  on  wyrażenie  opisu- 
jące tzw  pole  tworzenia  materii.  Rozwiązania  tych 
równań  dają  modele  kosmologiczne  przedstawiające 
zasadniczo  ten  sam  obraz  Wszechświata,  co  model  za- 
proponowany przez  Bondiego  i Golda.  Wszystkie  roz- 
wiązania HoyIe’a  zmierzają  asymptotycznie  do  roz- 
wiązania de  Sittera,  które  — jak  pamiętamy  — przed- 
stawia świat  stacjonarny.  Wprowadzone  do  równań 
pole  tworzenia  materii  sprawia,  że  rozwiązanie  de 
Sittera  nie  opisuje  teraz  świata  pustego. 

Odkrycie  izotropowego  promieniowania  tła  pod- 
ważyło teorię  Wszechświata  stacjonarnego,  która  — 
w swojej  oryginalnej  wersji  — nie  potrafiła  wyjaśnić 
genezy  tego  promieniowania.  Mimo  prób  uratowania 
tej  teorii,  czynionych  zwłaszcza  przez  Hoyle ’a,  opinia 
naukowców  jest  jej  nadal  nieprzychylna. 


Historia  Wszechświata 

Dane  obserwacyjne  przedstawione  w paragrafie:  Ob- 
serwacyjne podstawy  kosmologii  (jednostajny  rozkład 
gromad  galaktyk,  izotropowe  promieniowanie  tła 


o temperaturze  2,7  K)  świadczą,  że  Wszechświat  w obe- 
cnej chwili  jest  poprawnie  opisywany  przez  któryś  z 
modeli  Friedmana. 

Wiele  danych  obserwacyjnych  wskazuje  na  to,  że 
świat  jako  całość  podlega  ewolucji;  prześledźmy  jego 
dzieje.  W tym  celu  wykorzystamy  modele  Friedmana 
(ze  stałą  kosmologiczną  równą  zeru).  Jak  już  wspo- 
mniano, różnice  między  trzema  modelami  Friedmana 
są  istotne  dopiero  w późniejszych  stadiach  ewolucji. 
Przy  cofaniu  się  wstecz  w czasie  modele  te  zmierzają 
do  rozwiązania  Einsteina-de  Sittera.  A zatem  historia 
Wszechświata  jest  w przybliżeniu  jednakowa  dla 
wszystkich  trzech  modeli  Friedmana.  Najczęściej 
przeprowadza  się  obliczenia  dla  modelu  Einsteina-de 
Sittera,  gdyż  jest  on  matematycznie  najmniej  skom- 
plikowany (ciśnienie,  stała  kosmologiczna  oraz  krzy- 
wizna przestrzenna  są  równe  zeru). 

Obecna  teoria  mówi,  że  gdy  promień  Wszechświata 
9?  zmierza  do  zera,  to  temperatura,  ciśnienie  i gęstość 
dążą  do  nieskończoności.  Co  było  przedtem  — pozo- 
staje wielką  niewiadomą.  Sądzi  się,  że  przy  pewnej 
krytycznej  nadgęstości  einsteinowska  teoria  grawi- 
tacji przestaje  obowiązywać,  gdyż  zaczynają  odgry- 
wać rolę  kwantowe  efekty  grawitacji.  W obecnych 
teoriach  fizycznych  istotną  rolę  odgrywają  tzw.  pod- 
stawowe stałe  fizyczne,  są  to:  c — prędkość  światła, 
h — stała  Plancka  i G — newtonowska  stała  grawi- 
tacji, z których  można  zbudować  wielkość  o wymiarze 
gęstości : 

ekryt  = = 5-  10“  g/cm3. 

Przypuszcza  się,  że  powyżej  tej  krytycznej  gęstości 
świat  opisuje  kosmologia  kwantowa,  której  dotych- 
czas nie  znamy. 

®ra  Okres,  w którym  we  Wszechświecie  panowała  gę- 
Planoka  stość  krytyczna  nazywamy  erą  Plancka  lub  epoką 
progu  (tabela:  Ewolucja  Wszechświata).  Począwszy 
od  tego  progu  słuszne  są  znane  nam  dziś  prawa 
fizyki,  a szczególnie  einsteinowska  teoria  grawitacji. 
Wszechświat  był  wówczas  wypełniony  cząstkami 
elementarnymi,  niezwykle  stłoczonymi,  odznaczają- 
cymi się  ogromnymi  energiami  kinetycznymi.  A po- 
nieważ miarą  średniej  energii  kinetycznej  jest  tem- 
peratura, więc  i temperatury  panujące  wówczas  we 
Wszechświecie  były  niewyobrażalnie  wielkie.  Tak  np. 
można  obliczyć,  że  przy  planckowskiej  gęstości  kry- 
tycznej musiały  panować  temperatury  rzędu  1033  K. 

Chwile  następujące  bezpośrednio  po  erze  Plancka 
giną  w mroku  domysłów.  Grawitony,  czyli  kwanty 
pola  grawitacyjnego,  bardzo  słabo  oddziałują  z in- 


nymi cząstkami  elementarnymi.  Jednakże  w ekstre- 
malnych warunkach  gęstości  i temperatur  oddziały- 
wania takie  musiały  być  znaczące.  Czas  ustalenia  się 
równowagi  termodynamicznej  między  grawitonami 
a innymi  cząstkami  elementarnymi  był  bardzo  krótki 
i odpowiadał  mniej  więcej  erze  Plancka.  Oznacza  to, 
że  zaraz  po  erze  Plancka  grawitony  oddzieliły  się  od 
reszty  gorącej  materii  i przestały  z nią  oddziaływać. 

Jeśli  hipoteza  ta  jest  słuszna,  to  we  Wszechświecie  do 
dziś  powinno  znajdować  się  tzw.  tło  grawitonowe.  tlo 
Detekcja  grawitonów  tła  mogłaby,  w zasadzie,  przy-  grawitonowe 
nieść  empiryczne  informacje  o warunkach  fizycznych 
panujących  w pobliżu  ery  Plancka.  Niestety,  prak- 
tyczne przeprowadzenie  tego  obserwacyjnego  testu 
wykracza  daleko  poza  nasze  obecne  możliwości  tech- 
niczne. 

Przy  ogromnych  gęstościach  (o  rzędy  wyższych  niż 
gęstość  1014  g/cm3  charakterystyczna  dla  materii 
wewnątrz  jądra  atomowego)  i temperaturze  ponad 
1012  K o stanie  materii  decydowały  przede  wszyst- 
kim oddziaływania  silne.  Najważniejszym  składni- 
kiem materii  na  tym  etapie  były  cząstki  silnie  od- 
działujące— hadrony  (bariony  i mezony).  Najroz- 
maitsze odmiany  hadronów  znajdowały  się  w równo- 
wadze termodynamicznej  ze  sobą,  nie  tylko  te  najbar- 
dziej trwałe,  znane  nam  z wielu  laboratoriów  ziem- 
skich, jak  nukleony,  hiperony,  piony,  kaony,  ale 
i wiele  tak  krótko  żyjących  (w  warunkach  laboraryj- 
nych),  że  być  może  jeszcze  ich  nie  zdołaliśmy  zaob- 
serwować. Poza  cząstkami  istniały  w dużych  ilościach 
antycząstki  oraz  promieniowanie.  Nieustannie  po- 
wstawały pary  cząstka-antycząstka  w wyniku  oddzia- 
ływań promieniowania  z innymi  cząstkami,  jednocze- 
śnie przebiegały  procesy  anihilacji  par. 

Wraz  z rozszerzaniem  się  Wszechświata  zmniejszała 
się  gęstość  materii  i temperatura  oraz  malała  energia 
promieniowania.  Warunki  równowagi  między  wy- 
sokoenergetycznym promieniowaniem  a parami  ule- 
gały stopniowo  zmianie  na  niekorzyść  par,  które  po- 
wstawały coraz  rzadziej  z uwagi  na  malejącą  energię 
kwantów  promieniowania.  Równowaga  dynamiczna 
przesuwała  się  wyraźnie  na  korzyść  procesów  anihi- 
lacji. W końcu  wszystkie  pary  barion-antybarion 
uległy  anihilacji.  Pozostały  tylko  te  bariony,  które 
nie  miały  z czym  zanihilować.  Erę  powyższą,  zwaną 
erą  hadronową,  trwającą  ok.  10" 4 s,  aż  do  ustalenia 
się  gęstości  rzędu  1014  g/cm3  i temperatury  rzędu  era 
1012  K,  przeżyć  mogły  tylko  najtrwalsze  hadrony:  hadronowa 
proton  p i neutron  n.  Obok  nich  pozostały  jeszcze 
leptony,  które  poprzednio  stanowiły  nic  nie  znaczącą 
domieszkę,  obecnie  wysunęły  się  na  pierwsze  miejsce. 


Ewolucja  Wszechświata 


Czas 

Gęstość 

g/cm1 

Tempe- 
ratura, K 

Procesy  fizyczne 

Co  pozostało  do  dziś? 

? 

7 

? 

Kosmologia  kwantowa 

Era  Plancka 

10-**  s 

Era  hadronowa 

10®* 

10” 

Oddzielenie  się  grawitonów  (?) 

plazma  w równowadze  termodynamicznej  (nukleony- 

tio  grawitonowe  (?) 

antynukleony,  mezony-antymezony,  elektrony-pozytony, 
neutrina-antyneutrina,  kwarki-antyk  warki  (?)) 
anihilacja  pionów-antypionów  (mezonów  n) 

nukleony 

10-*s 

Era  leptonowa 

10*« 

10” 

anihilacja  mionów-antymionów  (mezonów  //) 
elektrony-pozytony,  neutrina-antyneutrina  w równowadze 
oddzielenie  się  neutrin 
anihilacja  elektronów-pozytonów 

tło  neutrinowe 

10  s 

Era  promienista 

10* 

1010 

plazma  i promieniowanie  w równowadze 
synteza  helu  i lekkich  pierwiastków  aż  do  litu 

hel,  lekkie  pierwiastki 

rekombinacja  wodoru  i oddzielenie  się  promieniowania 

wodór,  promieniowanie 

(fotonów) 

tla 

10«  lat 

Era  galaktyczna 

10-*1 

3000 

powstanie  galaktyk 

galaktyki 

powstanie  gwiazd 

gwiazdy 

synteza  reszty  pierwiastków  chemicznych 
we  wnętrzach  masywnych  gwiazd 

pierwiastki  chemiczne 

powstanie  planet  i Ziemi 

planety,  Ziemia 

1010  lat 

10-31-J0-2» 

2,7 

powstanie  życia  na  Ziemi  — kosmiczne  „teraz’ * 

życie,  człow-iek 
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Stąd  też  nazwa  następnej  ery : era  leptonowa.  W tem- 
peraturach między  1012  i 1010  K (podajemy  je  w ko- 
lejności, w jakiej  następowały  w czasie  po  sobie)  ma- 
era  teria  obok  nukleonów  (p  i n)  składała  się  z leptonów 
leptonowa  j ich  antycząstek  (obecnie  znamy  ich  cztery,  ale 
być  może  istnieje  ich  sześć  lub  więcej).  Były  więc 
pary  elektron-pozyton,  p~-p+,  obok  nich  dwa  ro- 
dzaje neutrin  i dwa  rodzaje  antyneutrin  oraz  fotony. 
Wraz  z postępującą  ekspansją  Wszechświata  spadała 
temperatura  i gęstość,  pary  ulegały  anihilacji,  w końcu 
erę  leptonową  przetrwały  tylko  elektrony  oraz  pro- 
mieniowanie. (Przypominamy,  że  promieniowaniem 
zwykło  się  nazywać  cząstki  o zerowej  masie  spoczyn- 
kowej; zalicza  się  więc  do  niego  promieniowanie 
elektromagnetyczne,  jak  również  neutrina  vtt  vv  i ich 
antycząstki  ve>  vu).  Miony,  ze  średnim  czasem  zaniku 
rzędu  10-6,  nie  miały  większej  szansy  na  przeżycie 
ery  leptonowej,  trwającej  zaledwie  ok.  10  sekund. 

Podczas  ery  leptonowej  — w chwili,  którą  ozna- 
czmy /++ — neutrina  przestały  niemal  oddziaływać 
z resztą  materii;  jako  wartość  krytyczną  temperatury 
poniżej  której  nastąpiło  oddzielenie  się  neutrin  od 
reszty  materii  przyjmuje  się  2 - 10ł0  K.  Począwszy  od 
chwili,  gdy  temperatura  ta  została  osiągnięta,  plazma 
(złożona  przede  wszystkim  z elektronów,  protonów 
i neutronów)  jest  dla  neutrin  całkiem  przezroczysta. 
Gdyby  się  nam  udało  zaobserwować  te  pierwotne 
neutrina,  tworzące  tzw.  promieniowanie  neutrinowe 
tła,  to  otrzymalibyśmy  informację  z chwili  ostatniego 
ich  oddziaływania  z materią,  tj.  o stanie  Wszechświata 
w chwili / + + . Chociaż  detekcja  tła  neutrinowego  jest 
teoretycznie  łatwiejsza  od  obserwacyjnego  wykrycia 
tła  grawitonowego,  i ona  obecnie  leży  poza  naszymi 
praktycznymi  możliwościami. 

Gdy  zakończyła  się  przewaga  leptonów,  podobnie 
jak  przewaga  barionów  w poprzedniej  erze,  zaczyna 
. ,era  się  następna  era,  zwana  erą  promienistą.  Największy 
promienista  wkład  do  gęstości  materii  (i  energii)  na  początku 
tej  ery  wnoszą  cząstki  promieniowania:  fotony, 
neutrina,  antyneutrina.  Ale  zgodnie  z teorią  względ- 
ności gęstość  energii  związanej  z cząstkami  o zerowej 
masie  spoczynkowej  maleje  ze  wzrostem  czynnika 
skali  90  jak  90“ 4,  gęstość  zaś  energii  związanej  z czą- 
stkami o niezerowej  masie  spoczynkowej  (takich  jak 
e , P,  ri)  maleje  jak  90“3  (por.  wzory  (9)  i (10)).  Stąd  też  z 
upływem  czasu  gęstość  promieniowania  zmniejsza  się 
szybciej  niż  gęstość  materii  korpuskulamej.  Wresz- 
cie — pod  koniec  ery  promienistej  — wkład  od  pro- 
mieniowania do  całkowitej  gęstości  energii  jest  już 
do  pominięcia.  Wraz  z ekspansją  Wszechświata  oraz 
jego  stygnięciem,  podczas  ery  promienistej,  maleje 
średnia  energia  fotonów.  Dopóki  była  ona  większa 
od  energii  wiązania  najlżejszego  jądra  atomówego, 
deuteronu  (/>+/?),  równej  2,2  MeV,  nie  mogły  tworzyć 
się  oddzielne  jądra  atomowe  z gęstego  gazu  nukleo- 
nów. Gdy  tylko  powstał  jakiś  deuteron,  natychmiast 
trafiał  weń  foton  i rozbijał  go  z powrotem  na  neutron 
i proton.  Dopiero  gdy  średnia  energia  fotonu  spadła 
poniżej  1 MeV,  deuterony  stały  się  trwałe.  Mogły 
one  jednocześnie  reagować  z sobą,  tworząc  dalsze 
jądra,  np.  22D  -►  4He  + y,  a także  wychwytywać 
obecne  wciąż  jeszcze  protony  i neutrony.  Tworzyły 
się  pierwsze  jądra  atomowe,  aż  do  litu  włącznie. 

Gdy  gęstość  materii  promienistej  stała  się  równa 
gęstości  materii  korpuskulamej,  temperatura  ośrodka 
era  wyPe^n-iaJ^ceS°  Wszechświat  wynosiła  3000-30  000  K 
galaktyczna  (trudno  nam  dziś  jeszcze  podać  jej  wartość  z większą 
dokładnością);  było  to  jeszcze  podczas  ery  promie- 
nistej. Wciąż  jeszcze  nie  istniały  atomy,  jedynie  jądra 
atomowe  (wodoru,  helu  i litu)  oraz  swobodne  elek- 
trony. Dopiero  w temperaturach  poniżej  3000  K 
wodór  ulega  rekombinacji,  kończy  się  okres,  podczas 
którego  promieniowanie  elektromagnetyczne  ulegało 
łatwo  rozpraszaniu  thompsonowskiemu  na  elektro- 
nach swobodnych.  Materia  staje  się  plazmą  nieprze- 
zroczystą dla  pozostającego  z nią  w równowadze  (do 
tej  chwili!)  promieniowania  elektromagnetycznego. 
Promieniowanie  to  oddziela  się  od  materii  korpusku- 


larnej  i niemal  przestaje  z nią  oddziaływać.  Ma  to 
doniosłe  konsekwencje  obserwacyjne.  Promieniowa- 
nie tła,  jakie  dziś  obserwujemy  (porównaj  paragraf: 
Obserwacyjne  podstawy  kosmologii),  jest  źródłem 
informacji  o stanie  świata  w okresie,  gdy  fotony  tego 
promieniowania  po  raz  ostatni  oddziaływały  z ma- 
terią korpuskularną,  a więc  o stanie  świata  w pewnej 
chwili  /+.  Obserwatorzy  nazywają  stan  świata  w chwi- 
li /+  powierzchnią  ostatniego  oddziaływania  (pro- 
mieniowania z materią  korpuskularną). 

Dopiero  gdy  gęstość  energii  promieniowania  jest 
znacznie  mniejsza  od  gęstości  materii  korpuskulamej, 
mogą  się  tworzyć  lokalne  zagęszczenia  materii. 
Ciśnienie  promieniowania  nie  spowoduje  już  ich  na- 
tychmiastowego rozbicia.  Z zagęszczeń  tych  mogą 
się  tworzyć  galaktyki,  z mniejszych  zagęszczeń  ma- 
terii w tych  ostatnich  — gwiazdy.  Nastaje  era  gwia- 
zdowa, zwana  też  erą  galaktyczną.  Era  ta  trwa  do 
dziś. 


Fizyka  w pobliżu  osobliwości 

Współczesna  kosmologia  daje  teoretycznie  zadowa- 
lający obraz  ewolucji  Wszechświata  począwszy  od  ery 
Plancka.  Ale  co  było  przedtem?  Początkowa  osobli- 
wość nakłada  ograniczenia  na  nasze  możliwości  ba-  osobliwość 
dawcze.  Dlatego  też  podejmuje  się  liczne  próby  zbu-  początkowa 
dowania  modelu  kosmologicznego  bez  początkowej 
osobliwości.  Teoretycznie  można  to  zrobić  wprowa- 
dzając do  równań  pewne  nowe  elementy  (np.  tzw. 
spin  makroskopowy,  lepkość  objętościową),  jednakże 
oznacza  to  odejście  od  pierwotnych  — logicznie  naj- 
prostszych — równań  Einsteina  i powoduje  nowe 
trudności  interpretacyjne.  S.  W.  Hawking,  R.  Penrose 
i R.  Geroch  udowodnili  szereg  twierdzeń,  z których 
wynika,  że  przy  realistycznych  założeniach  fizycznych 
równania  Einsteina  z reguły  prowadzą  do  osobliwości, 
takich  jak  osobliwość  początkowa  w kosmologii. 

Ponadto,  przyjmowana  obecnie  interpretacja  pro- 
mieniowania tła  jest  silnym  argumentem  przemawia- 
jącym za  tym,  że  świat  u początku  swojej  obecnej 
ewolucji  przechodził  przez  stan  nadgęsty,  który 
z punktu  widzenia  naszej  dzisiejszej  wiedzy  fizycznej 
na  pewno  zasługuje  na  miano  „osobliwego”. 

Znamy  dziś  wiele  modeli  kosmologicznych,  które 
mogą  opisywać  historię  Wszechświata  w nadgęstych 
stanach  bliskich  osobliwości.  Wszystkie  one  — z wy- 
jątkiem tylko  „nielicznych”  — przedstawiają  światy 
anizotropowe.  Kosmologowie  zwykli  mawiać,  że  w 
zbiorze  wszystkich  możliwych  modeli  kosmologicz- 
nych modele  jednorodne  i izotropowe  są  podzbiorem 
miary  zero.  Powstaje  pytanie:  dlaczego  właśnie  któryś 
z tych  nielicznych,  a więc  mało  prawdopodobnych 
modeli,  w dobrym  przybliżeniu  opisuje  rzeczywisty 
świat?  Wydaje  się,  że  istnieją  dwie  możliwe  odpowie- 
dzi na  to  pytanie,  pierwsza:  świat  od  początku  jest 
opisywany  przez  jednorodny  i izotropowy  model  i nie 
należy  zadawać  pytania,  dlaczego  akurat  przez  taki 
model  a nie  inny;  druga:  w stanach  bliskich  osobli- 
wości świat  był  chaotyczny,  niejednorodny  i nieizo- 
tropowy,  dopiero  wskutek  pewnych  procesów  fizycz- 
nych stosunkowo  szybko  nastąpił  proces  wyrówny-  friedmaniza- 
wania  się  niejednorodności  i izotropizacji  świata  cja  świata 
(w  związku  z tym  przyjęło  się  mówić  o friedmanizacji 
świata). 

Z obserwacji  promieniowania  tła  wiadomo,  że 
świat  jest  izotropowy  przynajmniej  od  chwili  t+ . 

Można  obliczyć,  że  jeżeli  chwili  tej  odpowiada  z ^ 7, 
to  fotony  promieniowania  tła,  jakie  rejestrujemy  obec- 
nie z kierunków  na  sferze  niebieskiej  różnych  co 
najmniej  o 30°,  w chwili  /+  znajdowały  się  w obszarach 
czasoprzestrzeni  fizycznie  całkowicie  odizolowanych 
od  siebie.  Aby  jakikolwiek  sygnał  mógł  przeniknąć 
z jednego  takiego  obszaru  do  drugiego,  musiałby  się 
poruszać  z prędkością  większą  od  prędkości  światła. 

A zatem  żaden  proces  fizyczny  nie  mógł  doprowadzić 
do  wyrównania  się  temperatur  w obu  tych  obszarach. 
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co  z kolei  jest  niezbędne,  by  Wszechświat  mógł  stać 
się  w przybliżeniu  friedmanowski. 

Aby  pokonać  tę  trudność,  C.  W.  Misner  skonstru- 
ował modele  kosmologiczne  z tzw.  wielkim  miesza- 
niem. Są  to  anizotropowe  modele  kosmologiczne  ma- 
jące zamknięte  przestrzenie  chwilowe.  Proces  mie- 
szania polega  na  tym,  że  we  wczesnych  stadiach  ewo- 
lucji promień  światła  zdąży  kilkakrotnie  obiec  świat 
dookoła,  dzięki  temu  nie  ma  izolowanych  od  siebie 
obszarów  czasoprzestrzeni  i występuje  zjawisko  wy- 
gładzania się  Wszechświata. 

Okazało  się  jednak,  że  w zbiorze  wszystkich  mo- 
deli kosmologicznych  podzbiór  modeli  z wielkim 
mieszaniem  jest  także  bardzo  mały  i pytanie,  dlaczego 
świat  jest  jednorodny  i izotropowy,  pozostaje  otwarte. 
Misner  zaproponował  więc  inny  mechanizm  wygła- 
dzania się  nierównomierności  Wszechświata. 

Anizotropowa  ekspansja  Wszechświata  powoduje 
występowanie  zjawiska  lepkości  (tarcia  sąsiednich 
warstw  materii  rozszerzającej  się  z różnymi  prędko- 
ściami), które  z kolei  działa  wygładzająco.  Duży 
wkład  do  tego  procesu  mogła  dawać  lepkość  powo- 
dowana przez  oddziaływanie  neutrin  z elektronami 
w temperaturze  ponad  1010  K,  w stanach  bardzo 
bliskich  osobliwości. 

Modele  anizotropowe  jeszcze  z innego  powodu  oka- 
zały się  przydatne  do  opisu  świata  w pobliżu  osobli- 
wości. J.  B.  Zeldowicz  i A.  A.  Starobiński  wykazali,  że 
wskutek  działania  efektów  kwantowych  w bardzo 
wczesnych  stadiach  ewolucji  anizotropowych  modeli 
kosmologicznych  następuje  intensywne  tworzenie  się 
cząstek  elementarnych  z krzywizny  czasoprzestrzeni. 
Mówiąc  obrazowo,  krzywizna  czasoprzestrzeni  odpo- 
wiada pewnej  energii  pola  grawitacyjnego.  Przy  bar- 
dzo wielkich  krzywiznach  w pobliżu  osobliwości  ener- 
gia ta  może  przetwarzać  się  w cząstki.  W modelach 
izotropowych,  w zasadzie,  proces  ten  nie  występuje. 
Powstawanie  cząstek  z silnie  zakrzywionej  czasoprze- 
strzeni jest  również  źródłem  pewnego  rodzaju  lepkości, 
bardzo  silnie  wygładzającej  pierwotną  anizotropię 
Wszechświata.  W pobliżu  osobliwości  gęstość  energii 
pochodząca  od  cząstek  wypełniających  Wszechświat 
nie  ma  żadnego  wpływu  na  przebieg  jego  ewolucji, 
dominującą  rolę  odgrywa  krzywizna  czasoprzestrzeni 
(okres  ten  nazywa  się  stadium  próżniowym) ; z czasem 
jednak  gęstość  energii,  pochodząca  od  cząstek  po- 
wstających z próżni,  wzrasta  i całkowicie  determinuje 
dynamikę  ekspansji  Wszechświata.  Jak  piszą  C.  W. 
Misner,  K.  S.  Thorne  i J.  A.  Wheeler,  „być  może  ani- 
zotropia stworzyła  materialną  zawartość  naszego 
Wszechświata,  sama  przy  tym  ulegając  wygładzeniu”. 


Parametr  q określa  krzywiznę  wykresu  92  = 9 ?(/). 
Jeżeli  q jest  dodatnie,  tempo  ekspansji  maleje  z cza- 
sem. Wyznaczenie  q0  jednoznacznie  wybiera  jeden 
z modeli  Friedmana.  Przedstawia  to  tabela: 


Modele  Friedmana 


Model  Friedmana  wy- 

<ło 

pełniony  materią  pyłową 

(P  = 0) 

< 1/2 

otwarty,  k — — I 

- 1/2 

płaski,  k = 0 

> 1/2 

zamknięty,  k =»  + 1 

Na  podstawie  każdego  modelu  kosmologicznego 
można  przewidywać  wartości  liczbowe  różnych  wiel- 
kości obserwowanych.  Wymienimy  dla  przykładu 
kilka  takich  wielkości: 

(a)  przesunięcie  ku  czerwieni  w widmach  galaktyk ; 

(b)  liczba  obiektów  (galaktyk,  radioźródeł)  wi- 
dzialnych aż  do  pewnej  odległości ; 

(c)  średnice  kątowe  obiektów  astronomicznych; 

(d)  jasność  obiektu  (mierzona  w tzw.  wielkościach 


Rys.  14.  Odwrotność  stałej  Hubblc’a  T0  oznacza  wiek  Wszech- 
świata, czyli  okres  od  początku  ekspansji  / = 0 aż  do  chwili 
obecnej  przy  założeniu  że  ekspansja  zawsze  odbywała  się 
z jednostajną  prędkością.  W rzeczywistości  ekspansja  nie  mu- 
siała być  jednostajna 


Testowanie  modeli  kosmologicznych 

Testowanie  modeli  kosmologicznych  jest  odrębnym 
działem  kosmologii,  który  bardzo  silnie  wiąże  ją 
z astronomią  pozagalaktyczną.  Przedstawimy  tu  tylko 
samą  zasadę  testowania.  Dla  uproszczenia  ograniczy- 
my się  do  modeli  Friedmana,  przyjmując,  że  stała 
kosmologiczna  jest  równa  zeru. 

W testowaniu  modeli  ważną  rolę  odgrywają  na- 
stępujące wielkości:  a)  średnia  gęstość  materii  we 
Wszechświecie  q\  b)  stała  Hubble’a  H = (^92/^0/92; 

920f292/t#2) 

c)  parametr  hamowania  (deceleracji)  q = , , - , - - 

{a^Rjaty 

Wartości  tych  parametrów  dla  obecnej  epoki  można 
wyznaczyć  obserwacyjnie  (oznaczać  je  będziemy  in- 
deksem zero). 

Gdyby  Wszechświat  zawsze  rozszerzał  się  dokład- 
nie według  prawa  Hubb!e’a  (równanie  1),  to  odwrot- 
ność stałej  Hubble’a  T0  = 1 /H0  określałaby  wiek 
Wszechświata,  tzn.  okres  czasu,  jaki  upłynął  od  po- 
czątkowej osobliwości  do  chwili  obecnej.  W ogólniej- 
szym przypadku,  gdy  rozszerzanie  się  Wszechświata 
nie  odbywa  się  dokładnie  według  prawa  Hubble’a, 
wiek  Wszechświata  może  być  mniejszy  od  T0  (rys.  14). 


Rys.  15.  Zależność  przesunięcia  ku  czerwieni  (z)  od  wielkości 
gwiazdowej  (m<);  wykres:  a = f(d) 


wyznaczanie 

wieku 

Wszech- 

świata 
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Rys.  16.  Zależność  liczby  galaktyk  A f(nu)  widzialnych  aż  do  wiel- 
kości gwiazdowej  rtu  od  danej  wielkości  gwiazdowej  nu  (wykres: 
b = h(d )) 


Rys.  17.  Zależność  średnic  kątowych  Q galaktyk  od  przesunięcia 
ku  czerwieni  z (wykres:  c — g(a)). 


gwiazdowych)  przyjęta  jest  za  miarę  jego  odległości: 
im  obiekt  jest  bardziej  odległy,  tym  jego  jasność  wi- 
dzialna jest  mniejsza. 

Ponieważ  wielkości  te  nie  są  na  ogół  niezależne, 
między  wieloma  ich  parami  można  określić  zależności 
funkcyjne:  a=f(d ),  c = g{a)  itp.  Różne  modele 
prowadzą  do  różnych  postaci  takich  funkcji  — po- 
równanie krzywych  teoretycznych  z wynikami  obser- 
wacji daje  możliwość  wyboru  tego  modelu  (lub  tej  kla- 
sy modeli),  który  najlepiej  zgadza  się  z danymi  obser- 
wacyjnymi. Przykłady  takich  „wykresów  testujących” 
(w  uproszczeniu)  przedstawiają  rys.  15,  16  i 17. 

Obserwacyjnych  danych  potrzebnych  do  testowania 
dostarcza  radioastronomia  i astronomia  pozagalak- 
tyczna.  Precyzja  współczesnych  obserwacji  znajduje 
się  na  granicy  dokładności  potrzebnej  do  testowania. 
W najbliższych  dziesiątkach  lat  — zwłaszcza  dzięki 
możliwości  przeprowadzania  obserwacji  poza  atmo- 
sferą ziemską  — należy  się  spodziewać  napływu  cie- 
kawych informacji.  Niezbędny  jest  także  postęp  teorii. 
Dziś  znacznie  więcej  wiemy  o zależnościach  między 
wielkościami  dającymi  się  obserwować,  niż  o ewolucji 
obiektów,  na  których  przeprowadza  się  testowanie 
(galaktyk,  ich  gromad,  radioźródeł,  kwazarów).  Tym- 
czasem uwzględnienie  efektów  ewolucyjnych  tych 
obiektów  może  istotnie  zmienić  „krzywe  testujące” 
w różnych  modelach  kosmologicznych. 

Dotychczas  najskuteczniejszym  testem  obserwacyj- 
nym okazało  się  odkrycie  i zbadanie  własności  izo- 
tropowego promieniowania  tła.  Istnienie  tego  promie- 
niowania — przy  obecnej  jegó  interpretacji  — dowo- 
dzi, że  nasz  świat  przynajmniej  od  epoki  t+  jest  świa- 
tem Friedmana  — lub  prawie  friedmanowskim  (tzn. 
z dobrą  dokładnością  jednorodnym  i izotropowym)  — 
ze  stanem  nadgęstym  u początków  swojej  ewolucji. 

H.  Bondi  Kosmologia,  Warszawa  1965;  H.  Bondi  Wszech- 
świat nieznany , Warszawa  1964;  M.  Heller  Początek  świata, 
Kraków  1976;  M.  Heller  Wobec  Wszechświata,  Kraków  1971; 
D.  W.  Sciama  Kosmologia  współczesna.  Warszawa  1975  ; J.  B.  Zel- 
dowicz,  I.  D.  Nowikow  Strojenije  i cwolucyja  wsielennoj , Mo- 
skwa 1975;  W.  Zonn  Kosmologia  współczesna.  Warszawa  1968. 


Antymateria  we  Wszechświecie 

Marcin  Kubiak 


Z punktu  widzenia  fizyki  współczesnej  nie  ma  zasad- 
niczej różnicy  między  cząstkami  i antycząstkami. 
Antycząstki  doskonale  mieszczą  się  w schematach 
teoretycznych  i obficie  występują  w laboratoriach. 
Istnienie  antycząstek  jest  przejawem  spełnienia  przez 
przyrodę  pewnych  ogólnych  praw  symetrii  (-*  Cząstki 
elementarne  i ich  oddziaływania),  które  w wypadku 
cząstek  trwałych,  takich  jak  elektrony,  protony  i neu- 
trony, sprowadzają  się  do  prawa  symetrii  ładunkowej. 
Zgodnie  z tym  prawem,  równie  prawdopodobne  jest 
istnienie  elektronu  o ładunku  ujemnym  jak  i elektronu 
o ładunku  dodatnim  (pozytonu).  Podobnie  proton 
może  być  nośnikiem  zarówno  ładunku  dodatniego 
(zwykły  proton)  jak  i ujemnego  (antyproton).  Makro- 
skopowe własności  materii  zbudowanej  z antycząstek, 
czyli  tzw.  antymaterii  powinny  być  identyczne  z wła- 
snościami materii  zbudowanej  ze  zwykłych  cząstek 
elementarnych  (dla  której  szwedzki  fizyk  H.  A!fvćn 
koinomaferia  zaproponował  nazwę  koinomaterii,  od  greckiego  sło- 
a antymateria  wa  koinos  oznaczającego  rzecz  dobrze  znaną).  Atomy 
antymaterii  różniłyby  się  od  atomów  materii  tylko 
tym,  że  ich  jądra  miałyby  ujemne  ładunki,  zobojętnio- 
ne przez  powłokę  dodatnio  naładowanych  pozyto- 
nów. Poza  tym  wszystkie  ich  własności  fizyczne  i che- 
miczne byłyby  takie  same  jak  zwykłych  atomów;  anty- 
atomy  wysyłałyby  np.  dokładnie  takie  same  linie  wid- 
mowe i wchodziłyby  w identyczne  reakcje  chemiczne 
jak  zwykłe  atomy. 

Lokalnie  w sposób  trwały  może.  istnieć  tylko  jeden 
rodzaj  materii : spotykające  się  ze  sobą  cząstki  i anty- 
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cząstki  tego  samego  rodzaju  ulegają  niemal  natych-  anihalacja 
miastowej  anihilacji,  polegającej  na  zamianie  całej  materii 
masy  obu  cząstek  (oraz  ich  łącznej  energii  kinetycznej  5 antymaterii 
przed  spotkaniem)  w energię  fotonów  promieniowania 
elektromagnetycznego.  Materia  i antymateria  nie 
mogą  istnieć  obok  siebie.  Na  Ziemi  antycząstki  poja- 
wiają się  tylko  w bardzo  szczególnych  okolicznościach 
i żyją  do  pierwszego  spotkania  z odpowiednią  cząstką 
materii,  wraz  z którą  ulegają  anihilacji.  Podobny  los 
byłby  udziałem  cząstki  naszej  materii,  która  znalazła- 
by się  w’  otoczeniu  zbudowanym  z antymaterii. 

Stwierdzenie  pełnej  symetrii  właściwości  materii 
i antymaterii  w skali  mikroskopowej  nasuwa  w sposób 
naturalny  pytanie,  czy  symetria  ta  jest  również  spełnio-  zasada 
na  w skali  całego  Wszechświata,  tzn.  czy  oba  jej  ro-  symetrii 
dzaje  występują  w nim  w jednakowych  ilościach,  czy  materii 
też  jest  on  zdominowany  przez  jeden  tylko  rodzaj  ma-  i antymaterii 
terii.  Gdyby  okazało  się,  że  cały  Wszechświat  jest 
zbudowany  z jednego  rodzaju  materii,  wówczas  nale- 
żałoby wyjaśnić,  dlaczego  przyroda  — mając  do  wy- 
boru dwa  identyczne  rodzaje  materii  — wybrała  tylko 
jeden.  Uznanie  tego  za  przypadek  byłoby  oczywiście 
tylko  pozornym  wyjaśnieniem;  wybór  jednego  rodza- 
ju materii  oznaczałby  raczej,  że  własności  materii 
i antymaterii  nie  są  tak  dokładnie  symetryczne  jak  to 
sobie  obecnie  wyobrażamy. 

Przy  teraźniejszym  stanie  naszej  wiedzy  o materii, 
założenie  pełnej  równoważności  materii  i antymaterii 
wydaje  się  bardziej  atrakcyjne,  zwłaszcza  z filozoficz- 
nego punktu  widzenia,  i dlatego  warto  jest  zastanowić 


się  przez  chwilę  nad  płynącymi  z niego  konsekwencja- 
mi kosmologicznymi.  Warunek  symetrii  materii  i anty- 
materii we  Wszechświecie  może  być  spełniony  w różny 
sposób.  Wprawdzie  materia  i antymateria  nie  mogą 
istnieć  w bezpośrednim  sąsiedztwie,  ale  możemy  przy- 
jąć, że: 

a)  antymateria  istnieje  w odległych  obszarach 
Wszechświata,  których  nie  możemy  obserwować,  na- 
tomiast nasza  Metagalaktyka  ( ► Galaktyki),  czyli 
część  Wszechświata  dostępna  obserwacjom,  jest  zbu- 
dowana z materii, 

b)  antymateria  istnieje  również  w Metagalaktyce, 
np.  średnio  co  druga  galaktyka  jest  zbudowana  z anty- 
materii, 

c)  antymateria  istnieje  w obrębie  każdej  galaktyki, 
tzn.  średnio  co  druga  gwiazda  jest  zbudowana  z anty- 
materii. 

metody  Obecnie  brak  jest  jakichkolwiek  danych  obserwa- 
rozróżniania  cyjnych  na  temat  ewentualnego  istnienia  lub  braku 
materii  od  antymaterii  w obserwowanej  przez  nas  części  Wszech- 
antymaterii  świata.  Wyda  się  to  może  zaskakujące,  ale  nie  jesteś- 
my w stanie  jednoznacznie  stwierdzić  nawet  tego,  czy 
najbliższa  nas  gwiazda,  Proxima  Centauri,  jest  zbudo- 
wana z materii  czy  z antymaterii.  Zastanów-my  się  bo- 
wiem w jaki  sposób  moglibyśmy  na  odległość  odróż- 
nić gwiazdę  zbudowaną  z materii  od  gwiazdy  zbudo- 
wanej z antymaterii.  Teoretycznie  możliwe  są  dwa 
sposoby.  Po  pierwsze,  moglibyśmy  starać  się  wyko- 
rzystać zjawisko  Zeemana  w widmach  gwiazd  mają- 
cych silne  pole  magnetyczne:  atomy  materii  i anty- 
materii, których  ładunki  są  nawzajem  wymienione, 
różnie  reagują  na  obecność  sił  magnetycznych  (i  elek- 
trycznych). Mówiąc  dokładniej,  obraz  rozszczepienia 
zeemanow-skiego  linii  widmowych  wysyłanych  przez 
antyatomy  znajdujące  się  w polu  magnetycznym 
o danym  kierunku  jest  taki,  jak  obraz  rozszczepienia 
zeemanowskiego  linii  wysyłanych  przez  zwykłe  atomy 
znajdujące  się  w polu  magnetycznym  o przeciwnym 
kierunku.  Gdybyśmy  więc  znali  kierunek  pola  magne- 
tycznego, moglibyśmy  bez  trudu  stwierdzić,  czy  pro- 
mieniujące atomy  są  zbudowane  z materii,  czy  z anty- 
materii. Niestety,  obecnie  nie  znamy  żadnych  metod 
określania  kierunku  pola  magnetycznego  gwiazd, 
a tym  samym  nie  potrafimy  odróżnić  namagnetyzowa- 
nej  antymaterii  od  materii  namagnetyzowanej  w kie- 
runku przeciwnym. 

Inną  możliwość  odróżnienia  gwiazd  zbudowanych 
z materii  i antymaterii  mogłyby  dać  obserwacje  stru- 
- - _ mienia  neutrin  opuszczających  — jak  się  powszechnie 

P sądzi  — wnętrza  gwiazd,  w których  przebiegają  reak- 

neutrinoyi/e  cje  -itrowe  przemiany  wodoru  w hel  ( > Ewolucja 
gw-iazd).  Reakcjom  tym  towarzyszy  emisja  pewnej  licz- 
by neutrin,  które  ze  względu  na  bardzo  mały  przekrój 
czynny  na  oddziaływanie  z materią  bez  trudu  opusz- 
czają miejsce  swego  powstania  i swobodnie  przebie- 
gają ogromne  przestrzenie  Wszechświata.  Oczywiście, 
reakcje  takie  przebiegające  między  atomami  antyma- 
terii byłyby  źródłem  strumienia  antyneutrin.  Chociaż 
laboratoryjne  odróżnienie  neutrina  od  antyheutrina 
nie  nastręcza  obecnie  większych  trudności,  to  jednak 
obie  te  cząstki  są  tak  bardzo  „nieuchwytne”,  że  do- 
tychczas  nie  udało  się  nawet  uzyskać  jednoznacznych 
informacji  na  temat  strumienia  neutrin  słonecznych; 
tym  mniejsze  są  też  nadzieje  na  zbudowanie  w niedale- 
kiej przyszłości  znacznie  czulszego  „neutri nowego  te- 
leskopu gwiazdowego”. 

Tak  więc,  obecność  antymaterii  możemy  stwierdzić 
tylko  wówczas,  gdy  wchodzi  ona  w'  bezpośredni  kon- 
anihilacja  ta*ct  z mater‘3  1 ulega  anihilacji.  Dzięki  tej  własności 
antymaterii . możemy  wykluczyć  istnienie  większy  ch 
jej  skupisk  w Układzie  Słonecznym,  którego  niemal 
cała  objętość  jest  wypełniona  rozrzedzonym  obłokiem 
materii  opuszczającej  Słońce  w postaci  tzw.  wiatru 
słonecznego  (->  Promieniowanie  kosmiczne).  Gdyby 
cząstki  wiatru  słonecznego  były  innego  rodzaju  niż 
cząstki  tworzące  planety,  wówczas  obszar  spotkania 
się  materii  słonecznej  z materią  planetarną  byłby  sil- 
nym źródłem  promieniowania  ( -*•  Astronomia  pro- 


mieni X i y)  pochodzącego  z anihilacji.  W Układzie 
Słonecznym  źródeł  takich  jednak  nie  obserwujemy. 

Z podobnych  powodów  możemy  uznać  za  mało 
prawdopodobne,  by  nasza  Galaktyka  zawierała  dużą 
liczbę  gwiazd  zbudowanych  z antymaterii.  W tym  wy- 
padku należałoby  oczekiwać  anihilacji  materii  gwiaz- 
dowej z otaczającą  materią  rozproszoną,  chociaż  samo 
zjawisko  przebiegałoby  w sposób  nieco  bardziej  zło- 
żony i nasze  wnioski  nie  byłyby  tak  jednoznaczne. 

W warunkach  panujących  w Galaktyce  najprawdo- 
podobniejsze jest  oddziaływanie  na  siebie  materii 
w stanie  rozproszonym.  Zetknięcie  się  ze  sobą  dwu 
gwiazd  (prowadzące  w przypadku  spotkania  się 
gwiazdy  zbudowanej  z materii  z gwiazdą  zbudowaną 
z antymaterii  do  gwałtownej  eksplozji  o niespotyka- 
nej sile)  jest  wydarzeniem  niezwykle  mało  prawdopo- 
dobnym ze  względu  na  małe  rozmiary  gwiazd  w po- 
równaniu z ich  średnimi  odległościami.  Znacznie  bar- 
dziej prawdopodobne  jest  zetknięcie  się  ze  sobą  dwóch 
obłoków  materii  rozproszonej,  przy  czym  jeden  z nich 
może  być  związany  z gwiazdą,  np.  jako  obłok  stano- 
wiący pozostałość  po  obłoku  materii,  z którego  po- 
wstała gwiazda,  lub  jako  obłok  materii  wyrzuconej 
z gwiazdy  w postaci  wiatru  gwiazdowego.  Z reguły, 
obłoki  materii  międzygwiazdowej,  jak  również  rozrze- 
dzone obłoki  materii  okołogwiazdowej,  są  przeniknię- 
te słabym  polem  magnetycznym  (np.  wiatr  słoneczny 
unosi  ze  sobą  nie  tylko  zjonizowaną  materię  słonecz- 
ną, ale  również  „wmrożone”  w nią  pole  magnetycz- 
ne). Nie  tracąc  więc  nic  z ogólności  rozważań,  może-  zderzenie 
my  wziąć  pod  uwagę  zderzenie  dwóch  obłoków'  roz-  obłoków 
rzedzonej  materii  w obecności  pola  magnetycznego.  materii  i 

Zderzenie,  o którym  mowa,  jest  przedstawione  antymaterii 
schematycznie  na  rys.  1.  W miarę  zbliżania  się  obło- 
ków ku  sobie,  w obszarze  ich  zetknięcia  utworzy  się 
warstwa  graniczna,  w której  będą  przebiegać  procesy 


Rys.  J.  Warstwa  graniczna  powstająca  podczas  zderzenia  się 
obłoków  rozrzedzonej  materii  i antymaterii  jest  źródłem  promie- 
niowania neutrir.owego,  promieniowania  y i promieniowania  ra- 
diowego 

anihilacji.  Ponieważ  materia  we  Wszechświecie  składa 
się  na  ogół  z wodoru,  wystarczy  rozważyć  tylko  ani- 
hilację  par  elektron-pozyton  i proton-anty proton. 

Anihilacja  pary  elektron-pozyton  polega  na  bezpo-  anihiłacja 
średniej  zamianie  masy  spoczynkowej  (i  energii  kine-  pary 
tycznej)  obu  cząstek  w dwa  lub  trzy  fotony  y o łącznej  elektron- 
energii  ok.  1 MeV  (w  wypadku  zderzenia  dwóch  obło-  pozyton 
ków  materii  międzygwiazdowej  możemy  pominąć 
energię  kinetyczną  cząstek  przed  zderzeniem).  Fotony 
te  bez  przeszkód  opuszczają  miejsce  powstania  i do- 
dają się  do  ogólnego  tła  promieniowania  elektroma- 
gnetycznego we  Wszechświecie. 
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Anihilacja  pary  proton-antyproton  jest  zjawiskiem 
nieco  bardziej  złożonym  (rys.  2).  Pierwszym  produk- 
tem anihilacji  są  głównie  mezony  7iy  które  za  pośred- 
nictwem mezonów  //  rozpadają  się  ostatecznie  na 
elektrony  i pozytony.  Bilans  energetyczny  całej  reakcji 
przedstawia  się  następująco:  z 1800  MeV  energii 
odpowiadającej  masie  spoczynkowej  pary  proton-an- 
typroton, 900  MeV  unoszą  neutrina  i antyneutrina, 
600  MeV  unoszą  kwanty  y,  a 300  MeV  przypada 
na  energię  kinetyczną  elektronów  i pozytonów  (ich 
masa  spoczynkowa  odpowiadająca  energii  ok.  1 MeV 
jest  w tym  wypadku  całkowicie  do  pominięcia). 


Neutrina,  antyneutrina  oraz  kwanty  y opuszczają 
bez  przeszkód  miejsce  anihilacji,  natomiast  elektrony 
i pozytony,  jako  cząstki  obdarzone  ładunkiem  elek- 
trycznym, zakreślają  spirale  wokół  linii  pola  magnety- 
cznego, które  nie  pozwala  im  oddalić  się  zbytnio  od 
miejsca  powstania.  Przy  energiach  rzędu  150  MeV  i 
przy  natężeniach  pola  rzędu  10~9T  (typowa  wartość 
natężenia  kosmicznych  pól  magnetycznych)  rozmiary 
spirali  są  rzędu  1011  m,  czyli  ok.  10"5  roku  świetlnego, 
co  w skali  kosmicznej  jest  odległością  bardzo  małą. 
Pojawienie  się  cząstek  o dużych  energiach  kinetycz- 
nych prowadzi  do  szybkiego  wzrostu  temperatury 
gazu  w warstwie  granicznej.  Wzrost  temperatury  po- 
ciąga za  sobą  wzrost  ciśnienia,  które  doprowadza  do 
rozdzielenia  obszarów  zajmowanych  przez  materię 
i antymaterię,  a tym  samym  do  zmniejszenia  tempa 
anihilacji.  Zderzenie  obłoku  materii  z obłokiem  anty- 
materii jest  więc  zjawiskiem  przebiegającym  stosun- 
kowo spokojnie  i wbrew  oczekiwaniom  nie  prowadzi 
do  wydzielania  się  ogromnych  — przynajmniej  w 
skali  kosmicznej  — ilości  energii. 

Warstwa  graniczna,  chociaż  cienka  (jej  rozmiary 
są  określone  przez  promienie  torów  zakreślanych 
przez  elektrony  i pozytony  w polu  magnetycznym), 
jest  jednak  źródłem  promieniowania,  które  mogli- 
byśmy starać  się  wykryć  na  drodze  obserwacji.  Jak 
wynika  z podanego  wyżej  bilansu  energii,  ok.  połowa 
energii  anihilacji  par  proton-antyproton  jest  uno- 
szona przez  neutrina,  jedna  trzecia  — przez  promie- 
niowanie y i co  najwyżej  jedna  szósta  pozostaje  na 
miejscu  w postaci  energii  kinetycznej  elektronów 
i pozytonów.  Elektrony  i pozytony  poruszające  się 
w polu  magnetycznym  wysyłają  tzw.  promieniowanie 
synchrotronowe,  tak  więc  pewna  część  ich  energii 
kinetycznej  może  również  opuścić  obszar  anihilacji 


w postaci  promieniowania  radiowego.  Przy  obecnym 
stanie  techniki  obserwacyjnej  wykrycie  strumienia 
neutrin  pochodzących  z przeciętnej  warstwy  granicz- 
nej w naszej  Galaktyce  jest  zupełnie  niemożliwe. 
Podjęte  stosunkowo  niedawno  obserwacje  kosmicz- 
nego promieniowania  y pozwoliły,  co  prawda,  na 
wykrycie  ogólnego  tła  galaktycznego,  ale  są  jeszcze 
zbyt  mało  dokładne,  by  dostarczyć  jakichkolwiek 
informacji  na  temat  ewentualnych  warstw  granicz- 
nych w naszej  Galaktyce.  Jedyne  nadzieje  można  by 
w tej  sytuacji  wiązać  z obserwacjami  radiowymi, 
jednak  z bardziej  szczegółowych  obliczeń  natężenia 
promieniowania  radiowego  typowych  warstw  gra- 
nicznych wynika,  że  warstwy  te  są  zbyt  słabymi 
radioźródłami,  by  mogły  być  wykryte  przez  dzisiejsze 
radioteleskopy.  Zresztą  samo  zaobserwowanie  źródła 
promieniowania  synchrotronowego  (a  źródeł  takich 
znamy  dość  dużo)  nie  jest  jeszcze  dowodem,  że  pro- 
mieniowanie to  jest  związane  z anihilacją  materii 
i antymaterii. 

Przeciwko  istnieniu  antymaterii  w Galaktyce  prze- 
mawia również  fakt,  że  w pierwotnym  promienio- 
waniu kosmicznym  nie  udało  się  wykryć  złożonych 
antyjąder.  Domieszka  takich  antycząstek  jak  anty- 
protony,  a zwłaszcza  pozytony  nie  stanowi  żadnego 
dowodu  istnienia  antymaterii,  ponieważ  są  one  pro- 
duktami oddziaływań  wysokoenergetycznego  pro- 
mieniowania kosmicznego  przechodzącego  przez 
ośrodek  międzygwiazdowy.  (W  celu  uniknięcia  nie- 
porozumień należy  podkreślić,  że  chodzi  tu  o pro- 
mieniowanie kosmiczne  w takiej  postaci,  w jakiej  do- 
biega ono  do  nas  z przestrzeni  kosmicznej).  Badania 
promieniowania  kosmicznego  przyczyniły  się  w is- 
totny sposób  do  poznania  właściwości  antycząstek, 
jednak  obserwowane  antycząstki  były  cząstkami  wtór- 
nymi, powstającymi  w wyniku  zderzeń  szybkich  czą- 
stek pierwotnego  promieniowania  kosmicznego  z ma- 
terią ziemską.  Wprawdzie  nie  znamy  jeszcze  dokład- 
nie natury  źródeł  promieniowania  kosmicznego, 
jednak  wydaje  się  bardziej  prawdopodobne,  że  źród- 
łami promieniowania  kosmicznego  złożonego  ze  zwy- 
kłych cząstek  są  obiekty  zbudowane  ze  zwykłej 
materii  aniżeli  obiekty  zbudowane  z antymaterii. 

Jak  więc  widzimy,  obserwacje  nie  dają  nam  żadnej 
zdecydowanej  odpowiedzi  co  do  istnienia  wielkoskalo- 
wych  skupisk  antymaterii  we  Wszechświecie  i co  naj- 
wyżej pozwalają  przypuszczać,  że  w obrębie  naszej 
Galaktyki  antymateria  nie  występuje  w większych 
ilościach.  Innymi  słowy,  obserwacje  nie  zaprzeczają 
wyraźnie  uczynionemu  na  wstępie  założeniu  o istnie- 
niu symetrii  między  materią  i antymaterią  w skali 
kosmicznej.  Jeżeli  chcemy  pozostać  przy  tym  zało- 
żeniu, to  musimy  znaleźć  odpowiedź  na  dwa  zasadni- 
cze pytania:  kiedy  powstała  materia  i antymateria, 
oraz  w jaki  sposób  nastąpiło  ich  rozdzielenie?  Nie 
trzeba  chyba  specjalnie  podkreślać,  że  oba  problemy 
są  jeszcze  dalekie  od  rozwiązania  i można  co  naj- 
wyżej wskazać  ogólne  kierunki,  w których  idą  roz- 
ważania. Rozważania  te  muszą  być  oczywiście  zgodne 
z tym  co  wiemy  (lub  spodziewamy  się,  że  wiemy)  na 
temat  powstania  i ewolucji  Wszechświata. 

Istniejące  dane  obserwacyjne  świadczą  o tym,  że 
kilkanaście  miliardów  lat  temu  Wszechświat  przecho- 
dził przez  fazę  dużego  zgęszczenia  materii.  W tzw. 
teorii  wielkiego  wybuchu  (— ► Kosmologia)  zakłada 
się  nawet,  że  gęstość  materii  była  wówczas  znacznie 
większa  od  gęstości  materii  tworzącej  jądra  atomowe. 
Wszechświat  o tak  dużej  gęstości  (i  odpowiednio 
wysokiej  temperaturze)  był  niestabilny,  wskutek  czego 
zaczął  ekspandować.  Za  takim  właśnie  obrazem  ewo- 
lucji Wszechświata  przemawia  znany  od  dawna  fakt 
ucieczki  galaktyk  (opisywanej  przez  prawo  Hubble'a) 
oraz  istnienie  wykrytego  kilkanaście  lat  temu  pro- 
mieniowania reliktowego. 

W klasycznym  modelu  wielkiego  wybuchu,  w któ- 
rym Wszechświat  „pojawił  się”  w postaci  gęstego 
i gorącego  praatomu,  trudno  jest  znaleźć  miejsce  dla 
antymaterii:  w stanie  silnego  zgęszczenia  materia 
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odległość  dwóch  punktów  Wszechświata 


i antymateria  nie  mogłyby  ze  sobą  współistnieć  (jeśli 
pominiemy  dość  szczególny  przypadek,  że  materia 
i antymateria  pojawiły  się  od  razu  rozdzielone). 
Z punktu  widzenia  naszych  rozważań  najwłaściwsze 
wydaje  się  założenie,  że  materia  i antymateria  istniały 
początkowo  w równych  ilościach  i były  ze  sobą  do- 
kładnie wymieszane;  założenie  takie  spełnia  bowiem 
w najbardziej  naturalny  sposób  nasz  postulat  nie- 
odróżnialności  materii  i antymaterii.  Ma  ono  jednak 
sens  tylko  wówczas,  jeżeli  przyjmiemy  równocześnie, 
że  gęstość  materii  była  początkowo  bardzo  mała 
(rzędu  jednej  cząstki  w km3),  znacznie  mniejsza  od 
gęstości  dzisiejszej  materii  międzygwiazdowej.  Wbrew 
pozorom,  założenie  takie  nie  jest  sprzeczne  z faktami 
obserwacyjnymi,  na  których  opiera  się  teoria  wielkie- 
go wybuchu.  Przyjęty  model  przesuwa  po  prostu 
Wszechświat  znany  nam  początek  Wszechświata  o wiele  miliardów 
przed  lat  wstecz,  do  czasów,  gdy  Wszechświat  miał  postać 
wielkim  gigantycznego  obłoku  rozrzedzonej  mieszaniny  obu 
wybuchem  rodzajów  materii.  Taki  stan  Wszechświata  był  rów- 
nież niestabilny.  Jeżeli,  jak  się  powszechnie  przypusz- 
cza antymateria  ma  masę  grawitacyjną  dodatnią,  tzn. 
jeżeli  siła  grawitacji  działająca  między  cząstkami  anty- 
materii jest  siłą  przyciągającą,  wówczas  wzajemne 
przyciąganie  się  wszystkich  cząstek  obłoku  powodo- 
wało jego  kurczenie  się.  Swobodne  kurczenie  się  obło- 
ku trwało  dopóty,  dopóki  gęstość  nie  osiągnęła  war- 
tości rzędu  jednej  cząstki  w m3.  Przy  tej  gęstości  roz- 
poczęły się  procesy  anihilacji  prowadzące  do  poja- 
wienia się  w obłoku  coraz  to  silniejszego  strumienia 
promieniowania  y.  Promieniowanie  to  oddziałując 
z materią  powodowało  pojawienie  się  siły  pochodzącej 
od  ciśnienia  (termicznego  ciśnienia  gazu  oraz  ciśnie- 
nia promieniowania),  skierowanej  odwrotnie  do  kie- 
runku działania  sił  grawitacji.  Postępująca  kontrakcja 
obłoku  pociągała  za  sobą  wzrost  tempa  anihilacji, 
a tym  samym  wzrost  ciśnienia  przeciwstawiającego 
się  kontrakcji.  Pozornie  pusty  i zimny  Wszechświat 
sprzed  wielu  bilionów  lat  wkroczył  wówczas  w dra- 
matyczną fazę  ścierania  się  siły  samograwitacj  i z prze- 
ciwnie skierowaną  i stałe  rosnącą  siłą  ciśnienia  pro- 
mieniowania. W pewnym  momencie  ciśnienie  promie- 
niowania nie  tylko  zrównoważyło,  ale  znacznie  prze- 
wyższyło siłę  przyciągania,  powodując  w rezultacie 
odwrócenie  kierunku  ruchu  materii.  Nasz  obłok 
osiągnął  wówczas  swoje  najmniejsze  rozmiary,  a na- 
stępnie zaczął  rozszerzać  się  ze  stale  wzrastającą 
prędkością.  Można  teoretycznie  wykazać,  że  ruch  na 
zewnątrz  powinien  odbywać  się  zgodnie  z prawem 
Hubble’a,  inaczej  mówiąc,  dalsza  ewolucja  naszego 


Rys.  3.  Schematyczny  przebieg  historii  Wszechświata  wg  teorii 
wielkiego  wybuchu  i w modelu  rozrzedzonego  obłoku  materii 
i antymaterii.  Oba  modele  przewidują  taki  sam  obecny  stan 
Wszechświata 

obłoku  powinna  wyglądać  tak  samo,  jak  ewolucja 
Wszechświata  powstałego  w wyniku  wielkiego  wybu- 
chu (rys.  3). 

Obecny  Wszechświat  nie  jest  jednak  zbudowany 
z materii  rozproszonej,  lecz  z galaktyk,  a więc  obiek- 


tów o bardzo  dużej  koncentracji  materii.  Wprawdzie 
nie  wiemy  jeszcze,  w którym  momencie  pojawiły  się 
galaktyki,  jednak  musimy  założyć,  że  zanim  one  po- 
wstały, nastąpiło  rozdzielenie  materii  od  antymaterii, 
co  najmniej  w skali  odpowiadającej  masom  gwiazd. 

Problem  wielkoskalowego  rozdzielania  się  materii 
i antymaterii  nie  został  jeszcze  wystarczająco  ściśle 
rozwiązany,  jednak  mimo  to  wydaje  się  celowe  przy- 
toczenie w tym  miejscu  jako  ilustracji  najprostszego 
modelu  zjawisk,  które  do  takiego  rozdzielenia  się 
mogły  doprowadzić. 

Rozważmy  w tym  celu,  znajdujący  się  w polu  gra-  rozdzielanie 
witacyjnym,  obłok  plazmy  składającej  się  z miesza-  materii 
niny  lekkiego  gazu  elektronowo-pozytonowego  i zna-  f antymaterii 
cznie  cięższego  gazu  protonowo-antyprotonowego 
(rys.  4).  Pole  grawitacyjne  doprowadzi  do  wyraźnej 
separacji  cząstek  cięższych  od  cząstek  lżejszych:  pro- 
tony i antyprotony  znajdą  się  przede  wszystkim  „na 
dole”,  podczas  gdy  obszar  zajmowany  przez  cząstki 
lżejsze  będzie  rozciągał  się  znacznie  wyżej  — „na 
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Rys.  4.  Jeden  z możliwych  sposobów  rozdzielenia  materii  i anty- 
materii 


górze”  (oczywiście  słowa  „dół”  i „góra”  mają  tu 
tylko  znaczenie  umowne).  Nietrudno  zrozumieć,  że 
prąd  elektryczny  płynący  ku  górze  spowoduje  ruch 
elektronów  w dół,  a protonów  — do  góry.  Na  po- 
średniej wysokości,  na  której  protony  spotykają  się 
z elektronami  utworzy  się  obszar  zajęty  przede 
wszystkim  przez  zwykłą  materię;  obdarzone  prze- 
ciwnymi ładunkami  antycząstki  popłyną  w kierun- 
kach przeciwnych,  tzn.  pozytony  ku  górze,  a anty- 
protony w dół.  Oczywiście  zmiana  kierunku  prze- 
pływu prądu  doprowadziłaby  do  wydzielenia  „czy- 
stej” antymaterii.  Istnienie  pola  grawitacyjnego  oraz 
prądu  elektrycznego  wydaje  się  założeniem  zupełnie 
naturalnym:  pole  grawitacyjne  może  pochodzić 

z ogólnego  pola  grawitacyjnego  Wszechświata,  nato- 
miast przepływ  prądu  zawsze  towarzyszy  polom  ma- 
gnetycznym, które  we  Wszechświecie  występują  bar- 
dzo pow-szechnie  z różnym  natężeniem  i w różnej 
skali. 

Opisany  model  jest  tylko  jakościowym  przykładem 
procesów,  które  mogły  prowadzić  do  pożądanego 
rozdzielenia  materii  i antymaterii,  nie  stanowi  jednak 
dowodu,  że  rozdzielenie  takie  było  możliwe  w skali 
rzeczywistych  obiektów  Wszechświata  (galaktyk, 
gwiazd). 

Jak  wynika  z tego,  co  zostało  powiedziane  wyżej, 
problem  istnienia  antymaterii  we  Wszechświecie, 
choć  niezwykle  ważny  z punktu  widzenia  naszych 
ogólnych  poglądów  na  budowę  Wszechświata  i wy- 
pełniającej go  materii,  nie  wyszedł  jeszcze  poza  gra- 
nice dość  ogólnikowych  spekulacji.  Jest  też  mało 
prawdopodobne,  by  nawet  istotne  rozszerzenie  na- 
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szych  możliwości  obserwacyjnych  mogło  doprowa- 
dzić do  zmiany  sytuacji,  która  wydaje  się  szczególnie 
paradoksalna:  pełna  symetria  własności  materii  i an- 
tymaterii, będąca  wyrazem  prostoty  otaczającego  nas 
świata,  jest  zarazem  okolicznością  poważnie  utrud- 


niającą zebranie  dowodów  na  to,  że  Wszechświat 
jest  zbudowany  w sposób  możliwie  najprostszy. 

H.  Alven  Kosmologia  i antymateria , Warszawa  1973;  J.  No- 
wożyłow  Cząstki  elementarne.  Warszawa  1961 ; Mezony , grawi- 
tacja, antymateria , Warszawa  1962. 


Radioastronomia 

Stanisław  Zięba 

Radioastronomia  jest  nauką  badającą  ciała  niebieskie 
przez  odbiór  wysyłanych  przez  nie  fal  radiowych. 
Należy  do  grupy  tych  dziedzin  wiedzy,  których  wła- 
ściwy rozwój  nastąpił  dopiero  w ciągu  ostatnich 
trzydziestu  lat. 

Faktycznie  jednak  narodziny  radioastronomii  na- 
początki  stąpiły  wcześniej,  bo  w roku  1932,  kiedy  to  amery- 
radioastro-  kański  inżynier,  Karl  Jansky,  po  raz  pierwszy  za- 
nomii  rejestrował  fale  radiowe  pochodzące  z przestrzeni  po- 
zaziemskiej. Odkrycie  Jansky łego  było  przypadkowe 
i do  czasu  zakończenia  II  wojny  światowej  radio- 
astronomia pozostawała  nauką  zapomnianą.  Pewne 
pionierskie  prace  w tej  dziedzinie  prowadzone  były 
w tym  czasie  tylko  w Stanach  Zjednoczonych  przez 
radioamatora  Grotę  Rebera,  który  z własnych  fun- 
duszów konstruował  i budował  specjalne  układy  do 
odbioru  pozaziemskiego  promieniowania  radiowego. 
Wyniki  swoich  prac  opublikował  on  w latach  1940 
i 1942,  a więc  wtedy,  gdy  nie  było  sprzyjającej  atmo- 
sfery do  rozwijania  czystej  nauki.  Mimo  to  prace 
te  nie  pozostały  niezauważone  i wraz  z interesują- 
cymi obserwacjami  dokonanymi  przy  okazji  badań 
związanych  z radarem  stały  się  podstawą  i począt- 
kiem współczesnej  radioastronomii: 


Radioteleskopy 

Promieniowanie  radiowe  dochodzące  z kosmosu, 
podobnie  jak  promieniowanie  widzialne,  dociera  bez 
przeszkód  przez  atmosferę  do  powierzchni  naszego 
globu.  Atmosfera  ziemska  przepuszcza  bowiem  z pa- 
dającego na  nią  widma  fal  elektromagnetycznych 
fale  w dwóch  zakresach  częstości,  tworząc  jak 


względna  przepuszczalność 
atmosfery 

Gromienie  X fale  widzialne 
(-•nadfiolet  podczerwień 


całkowite 

pochła-  b.oóTo.ói 


absorpcja  molekularna 


1 mm_J  centymetry 
długość  fali 


Rys.  1.  Przechodzenie  fal  elektromagnetycznych  przez  ziemską 
atmosferę  (rys.  I,  2,  8 i 13  wg  J.  D.  Kraus  Radio  Astronomy , New 
York  1966) 


gdyby  dwa  okna,  przez  które  możemy  spoglądać 
we  Wszechświat  (rys.  1).  Rozmiary  interesującego 
nas  okna  radiowego  są  ograniczone  od  strony  fal 
milimetrowych  pochłanianiem  przez  tlen  atmosferycz- 
ny i parę  wodną,  od  strony  fal  dekametrowych  zaś 
przepuszczalnością  jonosfery,  która  odbija  fale  dłuż- 
sze. Aby  zarejestrować  dochodzące  do  nas  promienio- 
wanie radiowe,  musimy  stosować  skomplikowane 
układy  odbiorcze,  zwane  radioteleskopami.  Schemat 
najprostszego  radioteleskopu  przedstawiony  jest  na 
rys.  2.  Zasadnicze  jego  części  to  antena  — zbierająca 
padające  na  nią  fale  elektromagnetyczne,  oraz  od- 


biornik — wzmacniający  i zapisujący  sygnał  powsta- 
jący w oświetlaczu  anteny.  Sygnał  ten  zależy  od  wiel- 
kości promieniowania  odbieranego  przez  antenę  ze 
wszystkich  „widzianych”  przez  nią  kierunków.  Jeżeli 
antena  nastawiona  jest  na  obiekt  promieniujący  ra- 
diowo, to  z odebranego  sygnału  można  wyznaczyć 
gęstość  strumienia  fal  radiowych  wysyłanych  przez 
obiekt  w określonym  przedziale  częstości  i w określo- 
nym kącie  bryłowym.  Im  mniejszy  jest  kąt  bryłowy, 
w którym  następuje  uśrednienie  promieniowania. 


tym  dokładniej  można  przebadać  strukturę  źródła, 
czyli  rozkład  kierunków  silniej  i słabiej  promieniują- 
cych podobszarów.  Parametr  decydujący  o tej  włas- 
ności radioteleskopu  nazwano  jego  zdolnością  roz- 
dzielczą, która  najczęściej  definiowana  jest  jako  naj- 
mniejsza odległość  kątowa  konieczna  do  odróżnienia 
dwóch  bliskich  źródeł  promieniowania. 

Drugim,  poza  zdolnością  rozdzielczą,  podstawo- 
wym parametrem  charakteryzującym  radioteleskop 
jest  jego  czułość,  czyli  zdolność  do  odbierania  mo- 
żliwie słabych  sygnałów.  Duże  czułości  uzyskuje  się 
budując  anteny  o dużych  aperturach  (tj.  o dużych 
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Rys.  3.  Układ  i charakterystyka  prostego  interferometru  złożo- 
nego z dwóch  jednakowych  anten 


powierzchniach  zbierających),  jak  również  stosując 
wzmacniacze  o małych  szumach  własnych,  poszerza- 
jąc pasma  odbiorników  i wydłużając  czas  uśredniania 
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(integracji)  sygnału.  Dzięki  złożonym  metodom  ob- 
serwacji i odpowiednim  układom  radioteleskopów 
zwanych  interferometrami  (rys.  3)  można  znacznie 
polepszyć  zdolność  rozdzielczą  tworzonych  syste- 
mów, a więc  zmniejszyć  rozróżniany  już  przez  układ 
odstęp  kątowy  między  dwoma  źródłami.  Zależy  on 
bowiem  odwrotnieproporcjonalnie  od  odległości  L 
(długość  bazy)  między  antenami  tworzącymi  inter- 
ferometr. Obecnie  w interferometrii  o bardzo  długich 
bazach  (rzędu  tysięcy  kilometrów)  uzyskuje  się  zdol- 
ności rozdzielcze  w granicach  0,1-0,001  sekundy  luku, 
zależnie  od  długości  fali,  na  której  prowadzone  są 
obserwacje.  Najmniejsze  wartości  otrzymuje  się  dla 
fal  najkrótszych.  Ponieważ  przy  długich  bazach 
trudno  jest  połączyć  odległe  anteny  w jeden  system 
odbiorczy,  obserwacje  wybranego  obiektu  prowadzi 
się  niezależnie,  ale  jednocześnie,  w obu  miejscach, 
rejestrując  odbierane  sygnały  na  taśmach  magnetycz- 
nych, na  których  dodatkowo  zapisuje  się  czas  z do- 
kładnie zsynchronizowanych  zegarów  atomowych. 
Po  zakończeniu  obserwacji  otrzymane  taśmy  umiesz- 
cza się  w maszynie  cyfrowej,  która  dokonuje  wspól- 
nego opracowania  obserwacji  obu  pozornie  nieza- 
leżnych układów. 

metoda  inną  metodą,  wykorzystującą  współczesną  technikę 

syntezy  obliczeniową,  jest  metoda  syntezy  apertury.  Jej  za- 
apertury  sada  została  opracowana  przez  radioastronomów 
brytyjskich.  Sir  Martina  Ryle’a  i Anthona  Hewisha, 
laureatów  nagrody  Nobla  w dziedzinie  fizyki  z 1974  r. 
W metodzie  tej  (rys.  4)  radiowy  obraz  nieba,  jaki 
można  byłoby  otrzymać  za  pomocą  bardzo  dużej, 
a więc  niemożliwej  do  zbudowania  anteny,  uzyskuje 
się  zapisując  w maszynie  cyfrowej  obserwacje  ustalo- 
nego obszaru  nieba,  wykonane  przez  układ  dwu  lub 


Rys.  4.  Metoda  syntezy  apertury.  Pojedynczą  dużą  antenę  można 
zastąpić  przez  dwie  mniejsze  anteny  (interferometr),  które  ko- 
lejno umieszcza  się  w różnych  położeniach  względem  siebie, 
w obrębie  pierwotnej  apertury 


więcej  małych  anten,  umieszczanych  kolejno  w róż- 
nych względem  siebie  położeniach,  wybieranych 
z syntetyzowanej  apertury.  W metodzie  tej,  oprócz 
, zmian  położeń  anten,  często  wykorzystuje  się  obrót 
Ziemi  dookoła  własnej  osi.  Stwarza  to  bowiem  możli- 
wość (rys.  5)  prowadzenia  obserwacji  przy  różnych 
kierunkach  i długościach  bazy.  Za  pomocą  stosowa- 
nych obecnie  układów  syntezy  apertury  można  re- 
jestrować gęstości  strumienia  rzędu  10~3  Jy  (1  Jy  = 1 
Jansky  = 10-2®  W-m-2*  Hz-1). 

Przytoczone  wielkości  liczbowe  charakteryzują 
aktualne  możliwości  pracujących  układów  odbior- 

biegun północny 


Rys.  5.  Zmiany  położe- 
nia prostego  interfero- 
metru na  powierzchni 
Ziemi  w ciągu  dnia  oglą- 
dane z ustalonego  punk- 
tu w przestrzeni 


czych.  Liczby  te  nie  powinny  w najbliższej  przy- 
szłości ulec  zasadniczym  zmianom,  gdyż  głównym 
celem  w konstruowanych  obecnie  układach  jest  zwię- 
kszenie efektywności  ich  pracy,  poprzez  zmniejszenie 
czasu  potrzebnego  na  wykonanie  pełnych  obserwacji. 


Mechanizmy  promieniowania 

Zanim  przejdziemy  do  omawiania  wyników  obserwa- 
cji radioastronomicznych,  zajmiemy  się  mechaniz- 
mami promieniowania  prowadzącymi  do  emisji  fal 
radiowych.  Obecnie  przypuszcza  się,  że  generacja  fal 
radiowych  w kosmosie  powodowana  jest  przez  pro- 
mieniowanie synchrotronowe,  promieniowanie  ter- 
miczne, drgania  plazmy  oraz  przez  radiowe  promie- 
niowanie monochromatyczne.  Jeżeli  w prowadzonych 
badaniach  udaje  się  zidentyfikować  mechanizm  wy- 
wołujący odbierane  sygnały  radiowe,  to  istnieje  wtedy 
możliwość  poznania  szczegółów  związanych  z naturą 
fizyczną  emitującego  obszaru.  Różne  mechanizmy 
promieniowania  są  wytwarzane  bowiem  w różnych 
warunkach  fizycznych.  I tak  np.  trzy  ostatnie  z wyżej 
wymienionych  nie  wymagają  obecności  pola  magne- 
tycznego, które  jest  konieczne  jeżeli  generacja  fal  ma 
być  wywołana  przez  promieniowanie  synchrotrono- 
we. Właściwie  jedyna,  jak  na  razie,  droga  prowadząca 
do  określenia  mechanizmu  wytwarzania  fal  sprowa- 
dza się  do  badania  widma  radiowego  promieniują- 
cego obszaru,  czyli  do  wyznaczenia  zależności  gę- 
stości strumienia  od  częstości.  Badania  polaryzacji 
fal  radiowych  byłyby  tutaj  bardzo  przydatne,  jed- 
nakże z powodu  dużych  trudności,  występujących 
przy  tego  typu  pomiarach,  nie  są  one  jeszcze  stoso- 
wane szerzej  w radioastronomii. 

Źródłem  promieniowania  synchrotronowego  są 
naładowane  cząstki  poruszające  się  w polu  magne- 
tycznym. Jeżeli  energia  tych  cząstek  jest  nierelaty- 
wistyczna,  promieniowanie  to  nazywamy  promienio- 
waniem cyklotronowym,  pozostawiając  nazwę  pro- 
mieniowanie synchrotronowe  dla  cząstek  ultrarela- 
tywistycznych,  których  energia  jest  znacznie  większa 
niż  m0c2.  Pojedynczy  relatywistyczny  elektron  krążący 
w polu  magnetycznymi?  promieniuje  fale  elektromag- 
netyczne w małym  stożku  o osi  skierowanej  wzdłuż 
kierunku  chwilowej  prędkości  (rys.  6).  Promieniowa- 


Rys.  6.  Mechanizm  synchrotronowy.  Elektron  poruszając  się 
w polu  magnetycznym  po  linii  śrubowej  wysyła  fale  elektro- 
magnetyczne 


nie  to  jest  silnie  spolaryzowane,  a wektor  elektryczny 
fali  leży  w płaszczyźnie  orbity  elektronu.  Gdy  w polu 
magnetycznym  znajdują  się  elektrony  o izotropowym 
rozkładzie  prędkości  i rozkładzie  energii  elektronów 
opisanym  prawem  potęgowym  N(E)  ~ gdzie 
y — wskaźnik  energetyczny  cząstek,  to  natężenie  pro- 
mieniowania synchrotronowego  wyraża  się  wzorem 
J(v)  ~ v~*.  Wskaźnik  widmowy  a jest  powiązany  z 
wskaźnikiem  y zależnością  a = (y— 1)/2.  Dla  elek- 
tronów kosmicznych  y x 2,5.  Jeżeli  przyjmie  się,  że 
elektrony  odpowiedzialne  za  promieniowanie  syn- 
chrotronowe radioźródeł  mają  taki  sam  rozkład 
energetyczny,  to  l{v ) y-0-75.  Wartość  a = 0,75  jest 

zgodna  z obserwowanym  średnim  wskaźnikiem  wid- 
mowym radioźródeł  (zob.  też  il.  211,  tabl.  57). 


promienio- 

wanie 

synchro- 

tronowe 


58  - Encyklopedia  fizyki  współczesnej 
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promienio-  Wszystkie  ciała,  których  temperatura  jest  większa 
wanie  od  zera  bezwzględnego,  emitują  fale  elektromagne- 
termiczne  tyczne  o różnych  długościach.  Wykorzystując  równa- 
nie promieniowania  ciała  doskonale  czarnego  można 
ocenić,  ile  energii  wypromieniuje  ciało  w poszczegól- 
nych przedziałach  częstości.  Dla  fal  radiowych  uzys- 
kuje się  dostatecznie  dokładną  zależność  natężenia 
od  częstości  stosując  przybliżenie  Rayleigha-Jeansa, 
które  prowadzi  do  wzoru 

/«  = 2 Tb/c\ 

gdzie  k — stała  Boltzmanna,  a 7& — tzw.  temperatura 
jasnościowa,  czyli  temperatura  jaką  posiadałoby  ciało 
doskonale  czarne  wysyłające  w przedziale  fal  radio- 
wych energię  równą  energii  wypromieniowywanej 
przez  dane  ciało. 

Jak  widzimy  na  rys.  7 widmo  promieniowania  syn- 
chrotronowego różni  się  w sposób  zasadniczy  od  wid- 
ma promieniowania  termicżnego,  którego  wskaźnik 
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Rys.  7.  Widmo  promieniowania  termicznego  i synchrotronowego 


widmowy  a jest  równy  —2.  Na  tej  podstawie  odróż- 
niamy od  siebie  radioźródła  galaktyczne,  a więc  pro- 
mieniujące termicznie  obszary  zjonizowanego  wodoru 
od  radioźródeł  pozagalaktycznych. 

Sporadyczne  promieniowanie  radiowe  w stosunko- 
wo wąskim  paśmie  częstotliwości,  ok.  v = ( e2Nefm )1/2, 
może  powstawać  w wyniku  występowania  fluktuacji 
drgania  gęstości  elektronowej  Ne  w plazmie.  Proces  taki  jest 
plazmy  możliwy  przy  wzbudzaniu  niejednorodnej  plazmy 
strumieniem  cząstek  poruszających  się  z prędkościami 
przewyższającymi  prędkość  dźwięku.  Promieniowanie 
radiowe  tego  rodzaju  generowane  jest  podczas  nie- 
których wybuchów  radiowych  obserwowanych  w ko- 
ronie słonecznej,  którą  można  uważać  za  plazmę 
o temperaturze  ok.  dwóch  milionów  stopni  i gęstości 
108  elektronów/cm3.  Ponieważ  materia  w kosmosie  naj- 
częściej występuje  w stanie  plazmy,  promieniowanie 


to  może  być  wytwarzane  w wielu  obiektach  astrono- 
micznych. Teoria  tych  procesów  na  razie  nie  jest 
jednak  dokładnie  ilościowo  opracowana. 

Radiowe  promieniowanie  monochromatyczne  po- 
wstaje przy  przejściach  energetycznych  między  blis- 
kimi poziomami  energetycznymi  atomów  i cząsteczek. 
Jest  ono  scharakteryzowane  długością  fali  oraz  jej 
profilem.  Spośród  kilkudziesięciu  odkrytych  już  w 
kosmosie  linii  radiowych  najbardziej  rozpowszech- 
niona jest  linia  neutralnego  wodoru  o długości  fali 
21,1  cm,  emitowana  przy  przejściach  między  podpo- 
ziomami  struktury  nadsubtelnej  stanu  podstawowego. 
Na  możliwość  występowania  takiej  linii  oraz  na  jej 
znaczenie  w badaniach  rozmieszczenia  chmur  chłod- 
nego wodoru  w przestrzeni  kosmicznej  zwrócił  uwagę 
w 1944  r.  holenderski  uczony  van  de  Hulst.  Przewi- 
dywaną przez  niego  linię  po  raz  pierwszy  zaobserwo- 
wano w 1951  r.  Obecnie  obserwuje  się  już  wiele  róż- 
nego rodzaju  linii  radiowych.  Dużą  grupę  wśród  nich 
stanowią  linie  rekombinacyjne,  związane  z przejścia- 
mi pomiędzy  sąsiednimi  poziomami  o dużych  głów- 
nych liczbach  kwantowych  oraz  linie  molekularne 
prostych  związków  organicznych,  których  mechaniz- 
my powstawania  nie  są  na  razie  dostatecznie  zbadane. 
Niektóre  z obserwowanych  linii  molekularnych  przed- 
stawia poniższa  tabela. 


radiowe 

promienio- 

wanie 

monochro- 

matyczne 


Rok 

odkry- 

cia 

Nazwa  atomu 
lub  cząsteczki 

Symbol 

Długość 

fali 

1951 

wodór  (neutralny) 

HI 

21,1  cm 

1963 

grupa  hydroksylowa 

OH 

18,0  cm 

1964 

wodór  (zjonizowany) 

HU 

3,4  cm 

1966 

hel  (zjonizowany) 

He 

18,0  cm 

1967 

węgiel  (zjonizowany) 

C 

6,0  cm 

1968 

amoniak 

NH, 

1,3  cm 

1968 

woda 

HtO 

1,3  cm 

1969 

formaldehyd 

HjCO 

6,2  cm 

1970 

tlenek  węgla 

CO 

2,6  mm 

1970 

cyjanowodór 

HCN 

3,4  mm 

1970 

alkohol  metylowy 

CH,OH 

36,0  cm 

1970 

kw'as  mrówkowy 

HCOOH 

18,0  cm 

1971 

siarczek  węgla 

CS 

2,0  mm 

1971 

formamid 

HCONH, 

6,5  cm 

1971 

tlenek  krzemu 

SiO 

2,7  mm 

1971 

cyjanek  metylu 

CH,CN 

2,7  mm 

1971 

metyloacetylen 

CH,CCH 

3,5  mm 

1972 

siarkowodór 

H,S 

1,8  mm 

1973 

tlenek  siarki 

SO 

2,9  mm 

obserwowa- 
ne linie 
molekularne 


Źródła  promieniowania  radiowego 

Radiowy  obraz  nieba,  jaki  możemy  sobie  wytworzyć 
na  podstawie  wykonywanych  radioteleskopami  obser- 
wacji, różni  się  całkowicie  od  obrazu  nieba  oglądane- 
go w pogodne  noce.  Obraz  ten  zmienia  się  ponadto 
dość  znacznie  wraz  ze  zmianą  długości  fali,  gdyż 
w różnych  obiektach,  zależnie  od  istniejących  w nich 
warunków  fizycznych,  dominują,  w różnych  przedzia- 
łach częstości,  różne  mechanizmy  promieniowania  (il. 
218,  tabl.  58  oraz  rys.  3 i 4,  str.  938). 


Rys.  8.  Radiowa  panorama  nieba,  pokazująca  obraz  nieba  „widziany  oczyma”  czułymi  na  fale  radiowe  o częstości  250  MHz  (otrzymana 
przez  zacienio wanie  obszarów  między  kolejnymi  izofotami  mapy  konturowej) 


radiowy  Obiektem  najbardziej  charakterystycznym  na  ra- 
obraz  diowym  niebie  jest  Droga  Mleczna  (rys.  8).  Kontury 
nieba  jej  są  nieostre,  lecz  nie  dlatego,  że  składa  się  z wielu 
oddzielnych  gwiazd.  Jest  ona  po  prostu  dużą  chmurą, 
w której  widać  kilkanaście  jasnych  obiektów,  znacz- 
nie większych  od  znanych  nam  dobrze  punktów 
świetlnych.  Na  próżno  można  szukać  na  radiowym 
niebie  charakterystycznych  gwiazd  z konstelacji  Wiel- 
kiego Wozu,  Oriona  czy  Kasjopei.  Niebo  pokryte 
jest  wieloma  nowymi  obiektami.  Po  dokładnym  po- 
równaniu z atlasem  gwiazd  można  przekonać  się,  że 
niektóre  z nich  znane  są  z obserwacji  wizualnych. 
Są  to  takie  obiekty,  jak  np.:  Mgławica  Krab,  Mgławi- 
ca Andromedy  i inne,  z których  większość,  to  poło- 
żone daleko  w przestrzeni  mgławice  pozagalaktyczne, 
zwane  inaczej  galaktykami.  Słońce,  które  wygląda 
jak  dziwny  przyćmiony  obiekt,  dookoła  którego  po- 
jawiają się  nieregularne  kontury  korony  słonecznej, 
jest  w zakresie  radiowym  tak  słabym  źródłem,  że 
z trudnością  ,, oświetla  ł Księżyc,  który  dostrzegamy 
tylko  dzięki  jego  własnemu  promieniowaniu.  Planety 
są  również  ledwo  „widoczne”.  Wyjątkiem  jest  Jowisz, 
który  wysyła  impulsowe  błyski  promieniowania  ra- 
diowego. 

Już  z tego  krótkiego  i uproszczonego  opisu  nieba 
radiowego  wynika,  że  w kosmosie  występują  rozmaite 
obiekty  promieniujące  radiowo.  Przejdźmy  teraz  do 
bardziej  szczegółowego  opisu  promieniowania  ra- 
diowego tych  obiektów  oraz  do  wniosków,  jakie  moż- 
na stąd  wysunąć  co  do  ich  budowy  fizycznej. 


obszarami  plam  i pochodni.  Odmienne  mechanizmy 
powodują  rejestrowane  wybuchy  radiowe,  które  są 
najsilniejsze  i najbardziej  złożone  w metrowym  za- 


1 ^ rn  i mm  1 cm 

długość  fali 

Rys.  9.  Widmo  promieniowania  Słońca 


I 


promienio- 
wanie 
termiczne 
i sporadyczne 


Promieniowanie  radiowe  Słońca  i gwiazd 

Słońce  jest  najważniejszym  spośród  ciał  niebieskich 
oświetlających  nasze  radiowe  niebo,  chociaż  nie  do- 
minuje na  tym  niebie  tak  wyraźnie,  jak  Słońce  wi- 
dzialne, a wypromieniowywane  przez  nie  fale  radiowe 
nie  wpływają  bezpośrednio  na  bieg  naszego  codzien- 
nego życia.  Hipotezy,  że  Słońce  promieniuje  również 
radiowo  wysuwane  były  już  w parę  lat  po  odkryciu 
przez  Heinricha  Hertza  fal  radiowych.  Wszystkie 
jednak  próby  detekcji  tych  fal  kończyły  się  niepowo- 
dzeniami. Dopiero  w latach  II  wojny  światowej  zare- 
jestrowano za  pomocą  urządzeń  radarowych,  w kilku 
ośrodkach  niezależnie  od  siebie,  silne  sygnały  w po- 
staci szumu,  który,  jak  się  okazało,  emitowany  był 
z aktywnych  obszarów  na  Słońcu.  Wyniki  te  zostały 
opublikow-ane  po  zakończeniu  wojny  w 1945  r.  Od 
tego  czasu  prowadzone  są  systematyczne  badania 
promieniowania  radiowego  Słońca.  Obecnie  uważa 
się,  że  na  promieniowanie  to  składa  się:  stałe  promie- 
niowanie termiczne  spokojnego  Słońca  oraz  promie- 
niowanie sporadyczne  zależne  od  stanu  aktywności 
Słońca.  Promieniowanie  sporadyczne  można  podzie- 
lić na  tzw.  składową  wolno  zmienną  — wykazującą 
zmiany  z dnia  na  dzień  z okresem  około  dwudziestu 
siedmiu  dni,  oraz  na  wybuchy  radiowe  — charaktery- 
zujące się  dużymi  zmianami  gęstości  strumienia  w 
przedziałach  czasu  rzędu  sekund,  minut  lub  godzin. 

Widmo  promieniowania  Słońca,  zarówno  w zakre- 
sie fal  radiowych,  jak  i optycznych,  przedstawia 
rys.  9.  Jak  widać,  termiczne  promieniowanie  Słońca 
spokojnego  nie  odpowiada  jednej  określonej  tempera- 
turze. Związane  to  jest  z tym,  że  promieniowanie 
o różnych  długościach  fal  emitowane  jest  z różnych 
warstw  atmosfery  Słońca.  Fale  metrowe  wysyłane  są 
z gorącej,  mającej  ponad  milion  stopni  korony,  fale 
centymetrowe  zaś  z chłodnej,  dolnej  chromosfery 
o temperaturze  ok.  10  000  stopni.  Składowa  wolna 
zmienna  jest  obserwowana  w zakresie  fal  od  3 do 
ok.  60  cm,  a jej  maksimum  znajduje  się  w pobliżu 
8 cm.  Charakterystyczne  zmiany  składowej  wolno 
zmiennej  zgodne  są  ze  zmianami  powierzchni  plam 
na  Słońcu.  Źródłem  tej  składowej  jest  najprawdopo- 
dobniej promieniowanie  termiczne  powstające  w jas- 
nych i gęstych  kondensacjach  koronalnych,  o tempe- 
raturze, ok.  dwu  milionów  stopni,  położonych  ponad 


kresie  długości  fal.  Są  one  z reguły  stowarzyszone 
z obserwowanymi  w świetle  widzialnym  rozbłyskami 
chromosferycznymi.  Większość  z nich  rozpoczyna  się 
w chwili  wyrzucenia  strumienia  naładowanych  cząste- 
czek z aktywnych  obszarów  związanych  z plamami. 
Mechanizmy  powstawania  i rozwijania  się  wybuchów 
radiowych  nie  są  jeszcze  dokładnie  poznane.  Są  to 
bowiem  bardzo  złożone  procesy,  w których  powstanie 
fal  radiowych  może  być  spowodowane  zarówno  pro- 
mieniowaniem synchrotronowym,  jak  i różnego  ro- 
dzaju drganiami  plazmy. 

Promieniowanie  radiowe  z innych  gwiazd  niż  Słoń- 
ce przez  długi  okres  czasu  nie  było  rejestrowane. 
Przyczyną  tego  stanu  była  przede  wszystkim  zbyt  mała 
czułość  pracujących  układów.  W końcu,  po  wielu 
fałszywych  alarmach,  w 1963  r.  udało  się  zaobserwo- 
wać krótkotrwały  impuls  promieniowania  radiowego 
(rozbłysk)  dochodzący  do  nas  od  czerwonego  karła 
UV  Ceti.  W latach  następnych  zaobserwowano  jeszcze 
kilkanaście  gwałtownych  radiowych  i optycznych 
rozbłysków  z gwiazd  tego  typu,  które  w rezultacie 
zyskały  nazwę  gwiazd  rozbłyskowych.  W miarę  upły- 
wu czasu  wzrastała  liczba  obiektów  gwiazdowych, 
których  promieniowanie  radiowe  udało  się  odebrać. 

I tak  w 1970  r.  zarejestrowano  na  falach  centymetro- 
wych promieniowanie  dochodzące  od  dwóch  gwiazd 
nowych  oraz  od  trzech  znanych  układów  podwójnych 
a Scorpii  B , fi  Persei  (Algol)  i p Lyrae.  Promieniowa- 
nie radiowe  tych  układów  wykazywało  w latach 
1970-1972  bardzo  osobliwe  cechy  wskazujące  na  to, 
że  znajdowały  się  one  w tym  czasie  w okresie  silnej 
aktywności  powodującej  powstawanie  rozbłysków 
radiowych.  Potwierdzeniem  takiego  przypuszczenia 
może  być  fakt,  że  na  60  badanych  w tym  czasie  ukła- 
dów podwójnych  tylko  w tych  zarejestrowano  dosta- 
tecznie silną  emisję  radiową.  Wartości  wskaźnika 
widmowego,  otrzymywane  z obserwacji  na  różnych 
długościach  fal,  wskazywały  na  termiczną  naturę  tych 
rozbłysków.  Hipoteza  ta  wymaga  jednak  dalszych 
potwierdzeń,  które  możemy  między  innymi  uzyskać 
z obserwacji  w paśmie  promieni  X (—Astronomia 
promieni  X i y).  Gdyby  bowiem  obserwowane  roz- 
błyski faktycznie  powstawały  w wyniku  wzmożonego 
promieniowania  termicznego  pewnych  obszarów 
w atmosferach  tych  gwiazd,  to  warunki  fizyczne  pa- 
nujące w tych  obszarach  musiałyby  również  powodo- 


gwcazdy 

rozbłyskowe 
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wać  emisję  promieniowania  X.  Prawie  w tym  samym 
rozbłyski  czasie  stwierdzono,  że  niektóre  znane  źródła  promie- 
radiowe  niowania  X emitują  z kolei  silne  strumienie  fal  radio- 
wych w postaci  rozbłysków.  Szczególnie  silne  tego 
typu  zjawisko  wystąpiło  we  wrześniu  1972  r.  w obiek- 
cie znanym  jako  Cyg  X-3.  Reasumując,  można 
stwierdzić,  że  badania  radiowe  gwiazd,  w których 
stawiamy  powoli  pierwsze  kroki,  przyczynią  się  do 
dokładniejszego  zrozumienia  ewolucji  i budowy  zło- 
żonych układów  gwiazd. 


Promieniowanie  radiowe  Księżyca  i planet 

Planety,  podobnie  jak  Księżyc,  „widoczne”  są  na 
falach  radiowych  dzięki  własnemu  promieniowaniu 
emitowanemu  z nagrzanych  powierzchniowych 
warstw  swych  globów.  Gdyby  warstwy  te  nagrzewały 
się  tylko  wskutek  promieniowania  Słońca,  tempera- 
tura jasnościowa  wyznaczana  z obserwacji  radiowych 
nie  powinna  się  zasadniczo  różnić  od  temperatury 
mierzonej  w zakresie  fal  optycznych  i podczerwonych. 
Taką  właśnie  zgodność  obserwujemy  dla  Księżyca 
i większości  planet.  Dla  Wenus  otrzymywane  tempe- 
ratury jasnościowe  ł>ą  jednak  wyższe,  co  związane 
jest  z obecnością  gęstej  atmosfery,  która  może  za- 
trzymywać wtórne  promieniowanie  termiczne  (efekt 
szklarniowy).  Najbardziej  złożone  promieniowanie 
radiowe  wysyła  Jowisz,  Poza  promieniowaniem  ter- 
micznym wyodrębniamy  tu  składową  nietermiczną 
oraz  tzw.  błyski  dekametrowe  składające  się  z izolo- 
wanych grup  krótkich  impulsów.  Błyski  te  powstają 
prawdopodobnie  wskutek  oddziaływania  strumieni 
prędkich  naładowanych  cząstek  z polem  magnetycz- 
nym Jowisza. 


Promieniowanie  radiowe  Galaktyki 

Jednym  z dużych  osiągnięć  radioastronomii  było  zba- 
danie i zrozumienie  struktury  naszej  Galaktyki.  Sy- 
stematyczne obserwacje  Drogi  Mlecznej  na  różnych 
częstościach  doprowadziły  do  utworzenia  dokładnych 
izofoty  map  linii  jednakowych  jasności  (izofoty).  łzofoty  dla 
różnych  długości  fal  różnią  się  znacznie  między  sobą 
zarówno  kształtem,  jak  i wielkością  temperatury 
jasnościowej  7&.  W paśmie  fal  dekametrowych  pro- 
mieniowanie jest  izotropowe,  a Tb  x 100  000  K. 
Przechodząc  do  fal  krótszych  Tt  maleje  (1000-100  K) 
i wyraźnie  spada  w miarę  oddalania  się  od  równika 
galaktycznego  (rys.  10).  Wskaźnik  widmowy  a dla  fal 
dekametrowych  i metrowych  wskazuje  na  promienio- 
wanie synchrotronowe.  W przedziale  fal  krótszych 
natomiast  ogólne  promieniowanie  Galaktyki  ma  cha- 
rakter termiczny.  Z przebiegu  izofot  ogólnego  promie- 
niowania radiowego  Galaktyki  wynika,  że  składa  się 
ono  (rys.  11)  z promieniowania  sferycznego  korony 
składowa  galaktycznej  (składowa  sferyczna)  oraz  promieniowa- 
sferyczna  nia  płaszczyzny  galaktycznej  (składowa  płaska  — 
i płaska  dysk  radiowy).  Składowa  sferyczna  pochodzi  z hamo- 
wania elektronów  relatywistycznych  w chaotycznych 
polach  magnetycznych  korony  galaktycznej.  Składo- 


wa płaska  jest  związana  z promieniowaniem  termicz- 
nym cienkiej  warstwy  obłoków'  wodoru  między- 
gwiazdowego,  zjonizowanego  przez  gorące  gwiazdy 
koncentrujące  się  w płaszczyźnie  Galaktyki,  oraz  pro- 
mieniowaniem elektronów  relatywistycznych  w upo- 
rządkowanych polach  magnetycznych  ramion  spiral- 
nych Galaktyki.  Składowa  sferyczna  oraz  synchro- 
tronowa część  składowej  płaskiej  decydują  o kształcie 
izofot  dla  długofalowej  części  widma,  termiczna  część 
składowej  płaskiej  zaś  dla  krótkofalowej  części  wid- 
ma. 


Rys.  II.  Budów?  Ga- 
laktyki według  danych 
radiowych:  rozmiary  w 
parsekach 


Badania  natężenia  promieniowania  i profilu  linii  rozkład 
wodoru  neutralnego  umożliwiły  określenie  jego  roz-  wodoru 
kładu  w Galaktyce  (ramiona  spiralne,  rys.  12),  jego  w Galaktyce 
gęstości  (ok.  0,1-100  atomów/cm3)  i całkowitej  masy, 
temperatury  (ok.  100  K)  i prędkości  radialnych  spo- 


kps 

4 ' 

Rys.  12.  Rozkład  wodoru  neutralnego  w Galaktyce  (C  środek 
Galaktyki,  S Słońce) 


Rys.  10.  Izofoty  promieniowania  radiowego  Galaktyki  przy  X — 3,5  m;  1 jednostka  wynosi  1000  K 
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wodowanych  obrotem  Galaktyki,  jak  również  rucha- 
mi własnymi  obłoków  gazu.  Wszystkie  przedstawione 
powyżej  wyniki  uzyskane  zostały  w żmudnym  proce- 
sie opracowywania  wyników  obserwacji.  Wykorzy- 
stując teoretyczne  zależności  wiążące  parametry 
obserwowane  z warunkami  fizycznymi,  starano  się 
określić  te  ostatnie  tak,  aby  obserwowane  natężenia 
i profile  linii  były  jak  najlepiej  przez  nie  odtworzone. 

Oprócz  termicznych  źródeł  galaktycznych,  jakimi 
są  obłoki  zjonizowanego  wodoru,  obserwuje  się  w Ga- 
laktyce wiele  źródeł  promieniujących  synchrotronowo. 
Są  to  między  innymi  rozszerzające  się  otoczki  będące 
pozostałościami  po  wybuchach  gwiazd  supernowych. 
Nowy  typ  galaktycznych  źródeł  punktowych  odkryto 
pulsary  w 1967  r.  Nazwano  je  pulsarami.  Emisja  z pulsa- 
rów  charakteryzuje  się  występowaniem  silnych  krót- 
kotrwałych impulsów  o zmiennej  amplitudzie  poja- 
wiających się  regularnie  w równych  odstępach  czasu, 
których  wartości  wahają  się  od  0,01  do  kilku  sekund 
w zależności  od  pulsara.  Obecnie  najczęściej  uważa 
się,  że  pulsary  są  prawdopodobnie  szybko  rotującymi 
gwiazdami  neutronowymi  z silnym  polem  magnetycz- 
nym, na  powierzchni  których  znajdują  się  obszary 
będące  źródłem  impulsów  (— ► Pulsary). 


Radioźródła  pozagalaktyczne 

Odbierając  promieniowanie  radiowe  od  mniej  lub 
bardziej  punktowych  źródeł,  od  początku  starano  się 
identyfikować  obserwowane  obiekty  radiowe  z obiek- 
tami optycznymi.  Identyfikację  taką  można  przepro- 
wadzać w zasadzie  tylko  na  podstawie  zgodności 
położeń,  co  jest  zadaniem  trudnym  a wyniki  nie  za- 
wsze są  całkowicie  jednoznaczne,  pomimo  że  zdolność 
rozdzielcza  tworzonych  systemów  antenowych  została 
w ostatnich  latach  znacznie  polepszona.  Pomimo  tych 
trudności  już  w 1949  r.  jedne  z silniejszych  źródeł, 
Virgo  A i Centaurus  A,  zostały  zidentyfikowane 
z bliskimi  galaktykami  M 87  i NGC5128.  Dopiero 
jednak  identyfikacja  bardzo  silnego  źródła  Cygnus  A 
z odległą  o 600  milionów  lat  światła  galaktyką  uzmy- 
słowiła wyraźnie  pozagalaktyczną  naturę  wielu  źródeł 
i postawiła  jasno  problem  wyjaśnienia  ich  ogromnych 
źródeł  energii.  Na  początku  lat  60-ych  niektóre  radio- 
źródła zostały  zidentyfikowane  z punktowymi,  gwiaz- 
dowymi z wyglądu  obiektami  optycznymi  odznacza- 
jącymi się  bardzo  dużymi  przesunięciami  swoich  linii 
kwazary  emisyjnych  ku  czerwieni.  Obiekty  te  nazwano  kwaza- 
rami,  a ich  dalsze  badania  wykazały,  że  wiele  spośród 
nich  jest  silnymi  radioźródłami  ( -*  Kwazary). 

W wyniku  ogromnej,  wieloletniej  pracy  różnych 
ośrodków  radioastronomicznych  znamy  obecnie  po- 
nad 10  000  radioźródeł,  z których  zaledwie  kilkaset 
jest  w sposób  pewny  zidentyfikowanych  z galaktykami 
lub  kwazarami.  Wprawdzie  dokładne  pozycje  radiowe 
znane  są  dla  znacznie  większej  liczby  radioźródeł, 
jednakże  nie  znajduje  się  dla  nich  obiektów  optycz- 
nych na  płytach  atlasu  Palomarskiego.  Dokładne  ba- 
dania radioźródeł  za  pomocą  interferometrów  są  pod- 
stawą analizy  ich  struktury,  która  z reguły  jest  dość 
złożona.  Konfiguracją  najczęściej  występującą  jest 
układ  dwu  obszarów  położonych  symetrycznie  wzglę- 
dem obiektu  optycznego  (rys.  13)  emitujących  fale 
radiowe.  To  symetryczne  położenie  oraz  silniej  lub 
słabiej  zaznaczone  pomosty  promieniowania  radio- 
wego, łączące  obszary  wzmożonej  emisji  radiowej 
z centralnie  położonym  obiektem  optycznym,  wska- 
zują na  ich  wspólne  pochodzenie  (rys.  14).  W nie- 
których przypadkach  obserwujemy  również  bardzo 
zwarte  składniki  struktur.  Często  też  wśród  zwartych 
źródeł  można  zauważyć  silne  zmiany  wysyłanych 


przez  nie  strumieni  mające  jakby  charakter  burz 
pojawiających  się  najpierw  na  falach  krótkich.  Obser- 
wując radioźródła  na  różnych  częstościach  można 
badać  ich  widma,  które  mimo  różnic  wskazują  na 
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Rys.  13.  Radiowa  (kolor  niebieski)  i optyczna  (kolor  czarny, 
szary)  struktura  różnych  radioźródeł  pozagalaktycznych  w przy- 
bliżeniu w tej  samej  skali 
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rektascensja  22h43m 

Rys.  14.  Struktura  radioźródła  3C  452  obserwowana  na  częstości 
1407  MHz.  Krzyżyk  oznacza  obiekt  optyczny — galaktykę  16m 

synchrotronową  emisję  fal  radiowych.  Mechanizm 
ten  jest  więc  ogólnie  przyjęty,  pozostaje  jednak  nadal 
nie  rozwiązany  problem  źródeł  energii  dostarczają- 
cych relatywistycznych  elektronów.  Wysuwane  są 
różne  koncepcje,  jak  np.  zderzenie  galaktyk,  ich 
eksplozje  czy  też  ich  grawitacyjne  zapadanie  się.  Wy- 
magają one  jednak  jeszcze  wielu  opracowań,  tak  że 
nie  należy  się  spodziewać  szybkiego  rozwiązania  tego 
problemu. 

J.  D.  Kraus  Radio  Astronomy,  New  York  1967;  G.  L.  Ver- 
SCHUUR,  K.  I.  Kellermann  Galactic  and  Extra-Galactic  Radio 
Astronomy , New  York  1974. 


Astronomia  promieni  X i y 

Marc/n  Kubiak 


Przedmiotem  zainteresowania  tej  nowej  i szybko  roz- 
wijającej się  gałęzi  astronomii  jest  pozaziemskie  pro- 
mieniowanie elektromagnetyczne  o długości  fali 
mniejszej  od  ok.  10  nm.  Promieniowanie  X i y wy- 
godnie jest  charakteryzować  za  pomocą  energii  foto- 
nów wyrażonej  w kiloelektronowoltach  (1  keV  = 
= 1000  eV  = 1,602  -10~16  J).  Długość  fali  X wyra- 
żona w nanometrach  jest  związana  z energią  fotonu 
wyrażoną  w keV  za  pomocą  związku  ż(nm)  = 124/ 
/E{ keV).  Umowną  granicą  między  promieniowaniem 
X i y jest  energia  0,51  MeV  (1  MeV  = 1000  keV)  od- 
powiadająca energii  spoczynkowej  elektronu.  Fizycz- 
ną podstawą  rozróżnienia  obu  rodzajów  fotonów 
pochodzenie  jest  ich  pochodzenie:  fotony  X powstają  przede 
fotonów  wszystkim  w procesach  atomowych,  natomiast  źród- 
X i y łem  fotonów  y są  oddziaływania  jądrowe. 

Fotony  o energii  z omawianego  zakresu  są  całko- 
wicie pochłaniane  w atmosferze  ziemskiej  i mogą  być 
obserwowane  w sposób  bezpośredni  tylko  z pokładów 
wysoko  wznoszących  się  balonów,  rakiet  i sztucznych 
satelitów  Ziemi.  Wprawdzie  fotony  o energiach  więk- 
szych od  ok.  10n  eV  można  obserwować  z powierzchni 
Ziemi  za  pośrednictwem  wielkich  pęków  atmosferycz- 
nych (-*  Promieniowanie  kosmiczne),  jednak  zasad- 
niczo możliwości  obserwacyjne  astronomii  X i y są 
określone  przez  stan  techniki  rakietowej  i satelitarnej. 


Metody  obserwacji 


Technika  odbioru  promieniowania  X i y zależy  od  za- 
kresu energii,  w którym  prowadzone  są  obserwacje. 
Granice  poszczególnych  zakresów  są  określone  przez 
0,1  keV-  właściwości  detektorów. 

10  keV  0,1  keV-10  keV  (miękkie  promieniowanie  X).  Ob- 
serwacje w tym  zakresie  prowadzi  się  w zasadzie  po- 
dobnie jak  w dalekim  nadfiolecie.  Detektorami  pro- 
mieniowania są  rentgenowskie  emulsje  fotograficzne, 
elektronowe  przetworniki  obrazów  oraz  liczniki  pro- 
porcjonalne. W zakresie  tym  możliwe  jest  również 
ogniskowanie  promieniowania  i tworzenie  obrazów 
źródeł  dzięki  wykorzystaniu  posiadanych  przez  nie- 
które powierzchnie  metaliczne  (np.  beryl,  glin,  nikiel, 
złoto)  właściwości  odbijania  promieniowania  X pa- 
dającego pod  bardzo  małymi  kątami.  Zasadę  dzia- 
łania teleskopu  ogniskującego  miękkie  promienio- 
wanie X wyjaśnia  rys.  1.  Fotografię  takiego  teleskopu 
przedstawia  il.  212  (tabl.  57).  Obecnie  kątowa  zdol- 
ność rozdzielcza  teleskopów  tego  rodzaju  jest  rzę- 
du 2%  choć  w niedalekiej  przyszłości  można  spo- 
dziewać się  jej  zwiększania  aż  do  0,3",  tj.  do  granicy 
określonej  przez  geometryczną  aberrację  układu. 

W omawianym  zakresie  promieniowania  możliwe 
jest  również  prowadzenie  obserwacji  spektroskopo- 
wych; jako  elementy  dyspersyjne  służą  metalizowane 


Rys.  1.  Zasada  działania  teleskopu  ogniskującego  miękkie  pro- 
mieniowanie X.  Użycie  dwu  zwierciadeł  pozwala  na  skrócenie 
ogniskowej  układu 


siatki  dyfrakcyjne  lub  kryształy.  Stosunkowo  mała 
powierzchnia  czynna  teleskopów  rentgenowskich 
sprawia,  że  jak  dotychczas  obserwacje  takie  zostały 
wykonane  z powodzeniem  tylko  w przypadku  Słońca. 

Duże  znaczenie  dla  astrofizyki  ma  możliwość  po- 
miaru polaryzacji  promieniowania  X w tym  zakresie. 
Wykorzystuje  się  do  tego  celu  zjawisko  nieizotropo- 
wego  rozpraszania  spolaryzowanej  wiązki  fotonów  X 
w blokach  substancji  rozpraszających,  np.  LiH  (rys.  2). 


Rys.  2.  Zasada  działania 
polarymetru  rentgeno- 
wskiego. Kąt  rozpro- 
szenia zależy  od  kierun- 
ku polaryzacji  promie- 
niowania padającego 


1 keV-20  keV.  Detektorami  fotonów  X o energii 
z tego  zakresu  są  liczniki  proporcjonalne.  Fotony 
wbiegające  do  takiego  licznika  wywołują  lawinowe 
wyładowanie  elektryczne  w gazie  wypełniającym  prze- 
strzeń między  anodą  i katodą.  Ponieważ  wielkość  wy- 
ładowania jest  proporcjonalna  do  energii  padającego 
fotonu,  połączenie  licznika  z analizatorem  wysokości 
impulsów  prądu  umożliwia  określenie  energii  reje- 
strowanego fotonu  (spektroskopia  niedyspersyjna). 
Zakres  pomiarowy  urządzenia  ustala  się  z jednej  stro- 
ny przez  zastosowanie  odpowiedniego  okna  wejścio- 
wego, absorbującego  wszystkie  fotony  o energii 
mniejszej  od  wybranej  energii  progowej,  a z drugiej 
strony  — przez  właściwości  gazu  wypełniającego  ob- 
szar między  elektrodami : fotony  o energiach  bardzo 
dużych  mają  zbyt  mały  przekrój  czynny  na  oddziały- 
wanie z materią,  by  wywołać  jonizację  w danej  ilości 
gazu.  Ograniczenie  pola  widzenia  urządzenia  odbior- 
czego osiąga  się  przez  zastosowanie  odpowiednich 
kolimatorów  mechanicznych  umieszczonych  przed 
oknem  wejściowym  (rys.  3). 

10  keV-ok.  3Ó0  keV  (twarde  promieniowanie  X). 
Detektorami  promieniowania  w tym  zakresie  energii 
są  liczniki  scyntylacyjne.  Zasadniczą  częścią  licznika 
jest  kryształ  (o  możliwie  dużych  rozmiarach),  w któ- 
rym fotony  X wywołują  błyski  luminescencyjne. 
Kryształ  taki  musi  zawierać  centra  łuminescencji  wy- 
chwytujące elektrony  swobodne  uwalniane  z atomów 
zjonizowanych  w wyniku  absorpcji  lub  rozpraszania 
komptonowskiego  fotonów  X;  wychwytowi  towarzy- 
szy emisja  fotonu  światła  widzialnego.  Najczęściej 
używa  się  kryształów  NaJ(Tl) — aktywowanych  talem 
kryształów  jodku  sodu  — wysyłających  promienio- 
wanie widzialne  w zakresie  długości  fali  od  420  do 
435  nm.  Jedna  powierzchnia  kryształu  pozostaje 
w kontakcie  optycznym  z fotopowielaczem  rejestru- 
jącym poszczególne  błyski  światła  widzialnego,  pod- 
czas gdy  pozostałe  powierzchnie  są  zazwyczaj  pokryte 
substancjami  odblaskowymi  w celu  zwiększenia  ilości 
światła  zbieranego  przez  fotopowielacz.  ilość  światła 
zawarta  w błysku  jest  tylko  w przybliżeniu  proporcjo- 
nalna do  energii  kwantu  padającego,  w związku 
z czym  energetyczna  zdolność  rozdzielcza  liczników 


1 keV- 
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scyntylacyjnych  jest  znacznie  mniejsza  niż  liczników 
proporcjonalnych  i wyraźnie  pogarsza  się  ze  wzrostem 
energii  kwantów.  Dlatego  też  liczniki  scyntylacyjne 
są  użyteczne  tylko  do  energii  kilkuset  keV,  chociaż 
w zasadzie  reagują  one  również  na  przelot  kwantów 
o znacznie  większych  energiach. 


pole  widzenia 


b)  Rys.  3.  Przykłady  kolimatorów  mechanicznych:  a)  kolimator 
płytkowy,  b)  obrotowy  kolimator  siatkowy 


Obserwacje  w tym  zakresie  energii  są  skompliko- 
wane, ponieważ  istnieje  niepożądane  tło  kwantów  X 
i y powstających  w materialnym  otoczeniu  licznika 
(obudowa,  satelita  itp.)  pod  wpływem  szybkich  czą- 
stek promieniowania  kosmicznego.  W celu  wyelimi- 
nowania tego  tła,  a jednocześnie  ograniczenia  pola 
widzenia  układu  odbiorczego,  licznik  scyntylacyjny 
otacza  się  dodatkowymi  licznikami  ekranującymi. 


wysokość  ok.  0.7  m 


Rys.  4.  Schemat  ekranującego  licznika  scyntylacyjnego.  Liczni- 
kiem zasadniczym  jest  kryształ  NaJ(TI),  scyntylatory  ekranujące 
są  zbudowane  z kryształów  CsJ(Tl).  Zarejestrowany  zostanie  tylko 
sygnał  pochodzący  od  licznika  głównego  w nieobecności  sygna- 
łów z liczników  ekranujących  i scyntylatora  plastykowego 


tworzącymi  z licznikiem  głównym  układ  antykoincy- 
dencyjny.  Zasadę  działania  takiego  układu  wyjaśnia 
rys.  4. 

0,3  MeV-10  MeV  (miękkie  promieniowanie  y). 
Ponieważ  kryształy  scyntylacyjne  są  mało  wydajnymi 
detektorami  kwantów  o tak  dużych  energiach,  nato- 
miast są  dobrymi  detektorami  cząstek  naładowanych 
elektrycznie,  używane  obecnie  teleskopy  y są  zaopa- 
trzone w układ,  który  zamienia  wbiegający  kwant  y 
w mniej  lub  bardziej  liczną  lawinę  cząstek  wtórnych 

0 mniejszych  energiach.  W najprostszy  sposób  można 
to  osiągnąć  umieszczając  na  drodze  kwantu  np.  płytę 
ołowianą  o odpowiedniej  grubości.  Cząstki  wtórne 
wybite  z płyty  ołowianej  są  następnie  rejestrowane 
przez  licznik  lub  liczniki  scyntylacyjne.  Łączna  energia 
zawarta  w błyskach  dawanych  przez  cząstki  wtórne 
jest  proporcjonalna  do  energii  kwantu  pierwotnego. 

10  MeV-kilkaset  MeV.  Kwanty  o tak  dużych  ener- 
giach są  źródłem  cząstek  wtórnych  poruszających  się 
z prędkościami  bliskimi  prędkości  światła,  co  umożli- 
wia zwiększenie  dokładności  określenia  kierunku  przy- 
lotu poszczególnych  kwantów  y bez  jednoczesnego 
zawężania  całkowitego  pola  widzenia  teleskopu.  Jest 
to  o tyle  ważne,  że  strumień  kwantów  o tych  energiach 
jest  już  niezwykle  mały  i teleskop  o małym  polu  wi- 
dzenia rejestrowałby  kwanty  tak  rzadko,  że  wykorzy- 
stywanie do  takich  obserwacji  kosztownych  rakiet 

1 satelitów  byłoby  pozbawione  celu.  Zjawiskiem,  któ- 
re w tym  wypadku  wykorzystujemy,  jest  promienio- 
wanie Czerenkowa  wysyłane  przez  szybkie  cząstki 
wtórne  w bloku  przezroczystej  substancji  o odpo- 
wiednio dużym  współczynniku  załamania  (prędkość 
światła  w takim  ośrodku  jest  istotnie  mniejsza  niż 
w próżni).  Promieniowanie  Czerenkowa  pojawia  się 
wówczas,  gdy  przez  dany  ośrodek  przebiega  cząstka 
z prędkością  większą  od  prędkości  światła  w tym  oś- 
rodku i jest  skierowane  niemal  dokładnie  wzdłuż 
drogi  cząstki.  Oprócz  licznika  Czerenkowa,  pozwala- 
jącego określić  kierunek  biegu  cząstek,  a tym  samym 
również  kierunek  wlotu  pierwotnego  kwantu  y,  na 
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Rys.  5.  Licznik  Czerenkowa.  Liczby  w półkolach  oznaczają  fo- 
topowielacze.  Zarejestrowany  zostanie  tylko  taki  przypadek, 
w którym  nie  będzie  sygnału  z ekranu  (fotopowielaczc  8- 1 5), 
natomiast  nadejdzie  sygnał  z któregoś  z fotopowielaczy  /,  2,  3, 
sygnał  z co  najmniej  jednego  fotopowielacza  7 i 8 oraz  sygnał 
z fotopowielacza  4 lub  4 i 5 


drodze  cząstek  wtórnych  umieszcza  się  również  układ 
wielu  scyntylatorów  lub  komór  iskrowych,  śledzących 
ruch  cząstek  wtórnych  aż  do  ich  całkowitego  wyha- 
mowania. Długość  drogi  hamowania  cząstek  wtór- 
nych jest  miarą  ich  energii  początkowej,  a więc  rów- 
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nież  miarą  energii  pierwotnego  kwantu  y.  Schemat 
teleskopu  opisanego  typu  jest  przedstawiony  na  rys.  5. 

10łleV-1013  eV.  Strumień  pozaziemskiego  promie- 
niowania y o energii  powyżej  ok.  1010  eV  jest  zbyt 
mały,  by  można  było  prowadzić  jego  obserwacje  za 
pomocą  opisanych  poprzednio  przyrządów  wymaga- 
jących przecięcia  się  drogi  kwantu  z detektorem.  Uzy- 
skanie znaczącej  liczby  zliczeń  wymaga  użycia  detek- 
torów o rozmiarach  porównywalnych  z rozmiarami 
Ziemi.  Dlatego  też  do  obserwacji  kwantów  o tak  du- 
żych energiach  wykorzystuje  się  zjawiska  zachodzące 
w atmosferze  ziemskiej,  a dokładniej  — wielkie  pęki 
atmosferyczne,  czyli  rozległe  kaskady  cząstek  wtór- 
nych powstające  w gazie  atmosferycznym  pod  wpły- 
wem promieniowania  y.  Wtórne  cząstki  pęku,  poru- 
szające się  z prędkościami  większymi  od  prędkości 
rozchodzenia  się  światła  w atmosferze,  są  źródłem 
promieniowania  Czerenkowa.  Promieniowanie  to, 
przypadające  w dziedzinie  widzialnej,  może  być  reje- 
strowane przez  zwykłe  teleskopy  optyczne  wyposażo- 
ne w szybkie  kamery  fotograficzne  i umieszczone  na 
powierzchni  Ziemi  nawet  w znacznych  odległościach 
od  wlotu  pierwotnego  fotonu  y do  atmosfery.  Błyski 
promieniowania  Czerenkowa  mają  na  zdjęciach  wy- 
gląd kolistych  lub  wydłużonych  plamek  o rozmiarach 
kątowych  rzędu  jednego  stopnia  (il.  214,  tabl.  57). 
Chociaż  kształt  i orientacja  błysków  zależą  od  poło- 
żenia osi  pęku  w stosunku  do  obserwatora,  to  jednak 
punkt  największej  intensywności  błysku  leży  w przy- 
bliżeniu w tym  kierunku,  z którego  nadbiegł  pierwot- 
ny foton  y.  Długotrwałe  obserwacje  mogą  doprowa- 
dzić do  stwierdzenia  ewentualnego  grupowania  się 
błysków  Czerenkowa  w pewnych  obszarach  nieba, 
a tym  samym  do  wykrycia  i zlokalizowania  dyskret- 
nych źródeł  pozaziemskiego  promieniowania  y.  Me- 
tody tej  nie  można  by  jednak  użyć  do  obserwacji  pro- 
mieniowania y rozłożonego  izotropowo  na  niebie. 

1014  eV-1018  eV.  Wielkie  pęki  atmosferyczne  wy- 
tworzone przez  cząstki  lub  fotony  o energiach  powy- 
żej ok.  1014  eV  dobiegają  aż  do  powierzchni  Ziemi, 
gdzie  określenie  ich  składu  pozwala  jednoznacznie 
stwierdzić,  czy  źródłem  ich  był  nukleon  czy  foton. 
Dokładniej  mówiąc,  w pękach  pochodzenia  fotono- 
wego mniejsza  jest  zawartość  mionów,  a więcej  jest 
elektronów  i pozytonów.  Obserwacje  promieniowania 
y w tym  zakresie  prowadzi  się  więc  za  pomocą  układu 
detektorów  cząstek  pokrywającego  stosunkowo  duży 
obszar  na  powierzchni  Ziemi.  Kierunek  osi  pęku, 
pokrywający  się  w przybliżeniu  z kierunkiem  przylotu 
pierwotnego  fotonu,  można  wyznaczyć  na  podstawie 
opóźnień  czasowych  między  sygnałami  pochodzący- 
mi od  różnych  liczników.  Zazwyczaj,  jednocześnie 
z obserwacjami  strumieni  cząstek  wtórnych  prowadzi 
się  również  obserwacje  optycznych  błysków  promie- 
niowania Czerenkowa. 


Procesy  fizyczne  prowadzące  do 
emisji  promieniowania  X i y 


Spośród  wszystkich  możliwych  procesów  prowadzą- 
cych do  emisji  promieniowania  X i y wyliczymy  tylko 
te,  które  mogą  przebiegać  w źródłach  kosmicznych 
dających  się  bezpośrednio  obserwować. 


Termiczne  promieniowanie  ciała  doskonale 
czarnego 

Wszystkie  ciała  materialne  znajdujące  się  w warun- 
kach równowagi  termodynamicznej  w temperaturze 
T są  źródłami  promieniowania  termicznego.  Zgodnie 
z prawem  Plancka,  liczba  fotonów  dq  wysłana  w prze- 
dziale energii  de  jest  opisana  przez  wyrażenie 

dq~exp[(e/kT)-l]-lde. 


Wydajnym  źródłem  fotonów  X są  ciała  o tempera- 
turze lOMO8  K.  Ciało  będące  równie  wydajnym 
źródłem  fotonów  y musiałoby  mieć  temperaturę  więk- 
szą od  1010  K,  jest  jednak  mało  prawdopodobne,  by 
ciała  doskonale  czarne  o takich  temperaturach  wystę- 
powały we  Wszechświecie. 


Promieniowanie  synchrotronowe 

Każda  cząstka  obdarzona  ładunkiem  elektrycznym 
poruszająca  się  w poprzecznym  polu  magnetycznym 
doznaje  przyspieszenia,  a tym  samym  jest  źródłem 
promieniowania  elektromagnetycznego.  Promienio- 
wanie to  może  przypadać  w zakresie  X i y,  jeżeli 
prędkości  cząstek  są  bardzo  bliskie  prędkości  światła 
(cząstki  ultra-relatywistyczne).  Najwydajniejszym  źró- 
dłem promieniowania  synchrotronowego  są  elektro- 
ny. Jeżeli  widmo  energetyczne  elektronów  byłoby 
opisane  przez  wyrażenie  dNfdE  ~ E~*,  gdzie  dN  — 
liczba  elektronów  o energii  zawartej  w przedziale  dE , 
wówczas  energetyczne  widmo  fotonów  promienio- 
wania synchrotronowego  byłoby  postaci 


Odwrotny  efekt  Comptona 

W procesie  tym  kwant  promieniowania  o dużej  ener- 
gii powstaje  w wyniku  zderzenia  relatywistycznego 
elektronu  z kwantem  promieniowania  o małej 
energii.  Widmo  fotonów  promieniowania  X i y po- 
wstających w tym  procesie  jest  takie  samo  jak  promie- 
niowania synchrotronowego  (przy  takim  samym 
widmie  energetycznym  świecących  elektronów). 


Promieniowanie  hamowania 
(Bremsstrahlung) 

Promieniowanie  to  jest  wysyłane  przez  elektrony 
w rzadkiej  i gorącej  plazmie,  doznające  przyspieszeń 
w polach  elektrostatycznych  ciężkich  cząstek  obda- 
rzonych ładunkiem  dodatnim.  Mechanizm  ten  różni 
się  od  omówionych  poprzednio  pod  dwoma  ważnymi 
względami.  Po  pierwsze,  elektrony  wysyłające  pro- 
mieniowanie hamowania  w zakresie  X i y mogą  mieć 
energię  niewiele  przewyższającą  energię  wysyłanych 
fotonów,  innymi  słowy  mogą  być  nierelatywistyczne. 
Po  drugie,  mechanizm  ten  jest  niezwykle  wydajny, 
tzn.  nawet  stosunkowo  niewielkie  ilości  plazmy  mogą 
być  źródłem  intensywnego  promieniowania  hamo- 
wania. W przypadku  plazmy  znajdującej  się  w stanie 
równowagi  statystycznej,  której  elektrony  mają 
energie  opisane  przez  rozkład  Maxwel!a,  widmo 
energetyczne  emitowanych  fotonów  jest  postaci 

—■  — e-<’lkT>/e. 
de 


Procesy  jądrowe 

Emisja  promieniowania  y towarzyszy  praktycznie 
wszystkim  procesom  jądrowym  wywoływanym  przez 
oddziaływania  silne  i elektromagnetyczne.  Procesy, 
które  mogą  być  źródłami  kosmicznego  promienio- 
wania y,  to  przede  wszystkim  rozpad  mezonów  n°y 
anihilacja  par  cząstek  materii  i antymaterii,  deckscy- 
tacja  jąder  wzbudzonych  oraz  rozpad  jąder  ciężkich. 

Mezony  n°  są  cząstkami  nietrwałymi,  rozpadają-  rozpad 
cymi  się  na  dwa  fotony  y z połówkowym  czasem  mezonów 
rozpadu  2- 10“ 16  s.  W układzie  odniesienia  związa- 
nym z mezonem  oba  fotony  mają  energię  W0  — 67,5 
MeV.  W układzie  obserwatora,  w którym  mezony  n0 
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mogą  mieć  bardzo  duże  prędkości,  energie  fotonów  y 
mogą  zawierać  się  w przedziale  od  Wo]/(l  - p)/(  i+P) 
do  M^0]/(l  ł p)/(\  - P\  gdzie  stosunek  prędkości 
mezonu  do  prędkości  światła.  Ponieważ  mezony  pro- 
dukowane w źródłach  kosmicznych  mają  zapewne 
różne  prędkości,  widmo  fotonów  y pochodzących 
z ich  rozpadu  jest  rozmyte  i ma  maksimum  w pobliżu 
energii  W0.  Reakcjami,  w których  mogą  się  tworzyć 
mezony  n°  pochodzenia  kosmicznego,  są  przede 
wszystkim  zderzenia  bardzo  szybkich  protonów  z pro- 
tonami, cząstkami  a i fotonami  o małych  energiach, 
anihilacja  Zderzenie  elektronu  z pozytonem  prowadzi  do 
e anihilacji  obu  cząstek  z jednoczesną  emisją  dwóch 
fotonów  y.  W przypadku  anihilacji  w spoczynku  oba 
fotony  mają  energię  0,51  MeV.  W zderzeniach  o nie- 
zerowej  energii  jeden  z fotonów  unosi  niemal  całą 
energię  kinetyczną  cząstek,  podczas  gdy  drugi  foton 
unosi  tylko  energię  spoczynkową  0,51  MeV. 
anihalacja  pp  Anihilacja  proton-antyproton  prowadzi  do  pro- 
dukcji mezonów  7 r,  w tym  również  mezonów  n°> 
które  rozpadają  się  następnie  z emisją  fotonów  y . 
Średnio  jeden  proces  anihilacji  proton-antyproton 
jest  źródłem  3,5  fotonów  y. 


Emisyjne  linie  XI  y 

Oprócz  wymienionych  wyżej  mechanizmów  produkcji 
fotonów  X i y o ciągłym  rozkładzie  widmowym  istnie- 
ją również  procesy  prowadzące  do  powstania  fotonów 
o ściśle  określonych  energiach.  Źródłem  linii  widmo- 
wych przypadających  w rentgenowskim  zakresie 
widma  są  atomy  pierwiastków  ciężkich,  w których  — 
np.  wskutek  zderzeń  — zostały  wzbudzone  elektrony 
z najniższych  powłok  elektronowych,  tzw.  powłok  K. 
Przejściu  elektronu  z powłoki  wyższej  na  wolne 
miejsce  w powłoce  K towarzyszy  wysłanie  fotonu  X 
o ściśle  określonej  energii.  Każdy  pierwiastek  wysyła 
charakterystyczne  dla  siebie  linie. 

Reakcje  jądrowe  przebiegające  w źródłach  kosmicz- 
nych lub  pojedyncze  zderzenia  szybkich  cząstek  z ją- 
drami ciężkimi  mogą  prowadzić  do  powstania  jąder 
wzbudzonych.  Kwantowym  przejściom  jąder  ze 
stanów  wzbudzonych  do  stanów  podstawowych 
towarzyszy  emisja  fotonów  y o charakterystycznych 
dla  danego  jądra  energiach.  Źródłem  linii  y są  również 
rozpadające  się  jądra  pierwiastków  promieniotwór- 
czych. 


Obserwacje  pozaziemskich  źródeł 
promieniowania  X i y 


Słońce 

Słońce  jest  najsilniejszym  źródłem  promieniowania  X 
i miękkiego  promieniowania  y na  niebie.  Jego  obser- 
wacje w tych  zakresach  energii,  rozpoczęte  przed  ok. 
dwudziestu  laty,  dostarczyły  już  nam  bardzo  dużej 
ilości  informacji  o procesach  wielkich  energii  prze- 
biegających w obszarach  koronalnych.  Spokojne 
Słońce  jest  źródłem  miękkiego  promieniowania  X 
o widmie  ciągłym,  wysyłanego  przez  rozrzedzony  gaz 
korony  o temperaturze  ok.  1,5  min  stopni  (il.  213, 
tabl.  57).  W okresach  wzmożonej  aktywności  na  wid- 
mo to  nakłada  się  promieniowanie  obszarów  aktyw- 
nych zawierające  znacznie  twardsze  promieniowanie 
ciągłe  oraz  liczne  emisyjne  linie  widmowe  w dziedzinie 
X i y.  Widmo  liniowe  obszarów  aktywnych  jest  naj- 
prawdopodobniej promieniowaniem  hamowania  wy- 
syłanych przez  strumienie  szybkich  elektronów  poru- 
szających się  w plazmie  korony.  Liniowe  widmo  X po- 
chodzi z przejść  elektronowych  w powłokach  wielo- 
krotnie zjonizowanych  atomów  pierwiastków  cięż- 
kich. W liniowym  widmie  y zidentyfikowano  linię  0,5 


MeV  pochodzącą  z anihilacji  par  elektron-pozyton,  li- 
nię 2,2  MeV  pochodzącą  z reakcji  wychwytu  neutronu 
przez  jądro  wodoru:  it-{ p -*■  dĄ  y,  gdzie  d oznacza 
jądro  ciężkiego  wodoru  — deuteron,  oraz  linie  pow- 
stające podczas  deekscytacji  wzbudzonych  jąder 
C12  (4,4  MeV)  i O16  (6,1  MeV).  Przykłady  widm  roz- 
błysków słonecznych  są  przedstawione  na  rys.  6. 


b)  energia  (w  jednostkach  dowolnych) 

Rys.  6.  Widmo  promieniowania  obszaru  aktywnego  na  Słońcu: 
a)  w zakresie  miękkiego  promieniowania  X,  b)  w zakresie  mięk- 
kiego promieniowania  y 


Pierwsze  obserwacje  źródeł  pozasłonecznych 

Pierwszej  udanej  obserwacji  źródła  promieniowania 
X znajdującego  się  poza  Układem  Słonecznym  doko- 
nano 12  VI  1962  r.  podczas  trwającego  350  s lotu 
rakietowego.  Urządzenie  odbiorcze  (il.  216,  tabl.  58) 
stanowił  licznik  Geigera,  którego  wlot  był  przesłonięty 
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wykrycie  scyntylatorem  tworzącym  z licznikiem  układ  anty- 
źródła  koincydencyjny  i mającym  za  zadanie  eliminację 
Sco  X-1  zliczeń  pochodzących  od  cząstek  promieniowania 
kosmicznego.  Zależność  liczby  zliczeń  od  kąta  po- 
zycyjnego odbiornika  wskazywała  na  obecność  w 
gwiazdozbiorze  Scorpius  dość  silnego  źródła  miękkie- 
go promieniowania  X.  Mała  kątowa  zdolność  roz- 
dzielcza nie  pozwalała  dokładnie  umiejscowić  źródła, 
była  jednak  wystarczająca,  by  jako  źródła  odbierane- 
go promieniowania  można  było  wykluczyć  ciała 
układu  planetarnego.  Na  uwagę  zasługiwał  również 
fakt,  że  zliczenia  w żadnym  kierunku  nie  malały  do 
zera,  co  świadczyło  o istnieniu  ogólnego  tła  promie- 
niowania X.  Wkrótce  potem  na  podstawie  innych 
obserwacji  można  było  stwierdzić,  że  źródłem  pro- 
mieniowania X jest  również  okolica  nieba,  w której 
znajduje  się  pozostałość  po  wybuchu  supernowej  — 
Mgławica  Krab.  Obserwacje  wykonane  7 VII  1964  r. 
podczas  zaćmienia  tej  okolicy  nieba  przez  Księżyc 
pozwoliły  stwierdzić,  że  źródłem  promieniowania 
jest  zarówno  sama  mgławica,  jak  i obszar  o średnicy 
ok.  T położony  wewnątrz  niej.  Była  to  pierwsza 
optyczna  identyfikacja  kosmicznego  źródła  promie- 
niowania X.  Identyfikacji  źródła  w gwiazdozbiorze 
Scorpius  dokonano  w 1966  r.  Obiektem  optycznym 
okazała  się  niebieska  gwiazda  13m  mająca  w widmie 
emisyjne  linie  wodoru  i zjonizowanego  helu,  wykazu- 
jąca stosunkowo  szybkie  i nieregularne  zmiany  ja- 
sności. Źródło  to  nazwano  ScoX-l.  (Początkowo 
nazwa  źródła  składała  się  ze  skróconej  nazwy  gwiazdo- 
zbioru, w którego  kierunku  znajduje  się  źródło,  oraz 
kolejnego  numeru  odpowiadającego  kolejności  od- 
krycia, pokrywającej  się  zazwyczaj  z kolejnością 
według  natężenia  promieniowania;  litera  X wskazy- 
wała na  rentgenowski  charakter  źródła.  W miarę 
odkrywania  coraz  to  większej  liczby  źródeł  utarł  się 
nazwy  zwyczaj  tworzenia  nazwy  źródła  z symbolu  satelity, 
źródeł  który  źródło  to  obserwował,  oraz  liczb  podających 
przybliżone  współrzędne  równikowe,  np.  3U 161 7-60 
A 0620-00  itp.).  Optyczne  cechy  źródła  Sco  X-l, 
a zwłaszcza  fakt,  że  w dziedzinie  rentgenowskiej 
wysyła  ono  w przybliżeniu  tysiąc  razy  więcej  energii 
niż  w dziedzinie  widzialnej,  dowodziły,  że  odkryto 
obiekt  gwiazdowy,  którego  istnienia  nie  można  było 
przewidzieć  na  podstawie  dotychczasowych  danych 
o źródłach  optycznych  i radiowych.  Ten  pierwszy 
wielki  sukces  astronomii  rentgenowskiej  spowodował 
jej  dalszy  szybki  rozwój.  Przełomowym  momentem 
było  wysłanie  12X11  1970  r.  satelity  Uhuru,  który 
miał  wyłącznie  obserwować  promieniowanie  X.  Jego 


szukacz  szukacz 
gwiazd  Słońca  kolimator 
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zadaniem  było  dokonanie  przeglądu  całego  nieba  satelita 
w zakresie  energii  od  2 do  20  keV.  Schematyczny  Uhuru 
wygląd  takiego  satelity  jest  przedstawiony  na  rys.  7. 

Był  on  wyposażony  w dwa  niezależne  układy  odbior- 
cze, z których  każdy  składał  się  z licznika  proporcjo- 
nalnego przesłoniętego  oknem  berylowym  i kolima- 
torem  mechanicznym.  Jedno  urządzenie  odbiorcze 
miało  pole  widzenia  1/2°  x 5°  i rejestowało  fotony 
do  30  keV,  drugie  miało  pole  widzenia  5°x5°  i reje- 
strowało fotony  do  10  keV.  Każdy  detektor  był  wy- 
posażony w ośmiokanałowy  analizator  impulsów, 
dzięki  czemu  można  było  uzyskać  ośmiopunktowe 
widma  obserwowanego  promieniowania.  Czasowa 
zdolność  rozdzielcza  zliczeń  mogła  być  w ograniczo- 
nym zakresie  zmieniana  i wynosiła  0,096  s,  0,192  s 
lub  0,384  s.  Detektory  mogły  wykrywać  źródła  dające 
ok.  2-10-3  zliczeń  na  cm2  i sekundę,  co  odpowiada 
strumieniowi  energii  rzędu  10-15  J -cm"2  • s-1.  W ciągu 
ok.  2 lat  działania  aparatury  pomiarowej  satelita 
dokonał  przeglądu  całego  nieba,  a uzyskane  wyniki 
posłużyły  do  sporządzenia  katalogu  źródeł  promie- 
niowania X obejmującego  161  obiektów,  których 
położenia  q a niebie  są  określone  z dokładnością  rzędu 
jednej  dziesiątej  stopnia  kwadratowego. 

Ostateczny  katalog  źródeł  rentgenowskich  obser- 
wowanych przez  satelitę  Uhuru,  tzw.  katalog  3U.  jest 
podstawą  dalszych  prac  obserwacyjnych  i teoretycz- 
nych. 


Rozkład  źródeł  promieniowania  X na  niebie 

Rysunek  8 przedstawia  rozkład  źródeł  rentgeno- 
wskich we  współrzędnych  galaktycznych.  Już  na 
pierwszy  rzut  oka  sugeruje  on  istnienie  dwu  rodzajów 
źródeł.  Część  ich  wyraźnie  skupia  się  wokół  płaszczyz- 
ny Galaktyki,  co  pozwala  przypuszczać,  że  są  to 
źródła  galaktyczne  i że  tworzą  one  podsystem  płaski 
(7*  Galaktyki).  Pozostałe  źródła  są  rozmieszczone  na 
niebie  mniej  więcej  izotropowo  i najprawdopodobniej 
są  pochodzenia  pozagalaktycznego.  Przypuszczenia  te 
znajdują  potwierdzenie  zarówno  w statystycznych 
badaniach,  jak  i w istniejących  identyfikacjach  optycz- 
nych. Źródła  skupione  wokół  płaszczyzny  Galaktyki 
mają  średnio  większe  obserwowane  jasności  rentge- 
nowskie niż  źródła  o rozkładzie  izotropowym.  Wyzna- 
czenie ich  rentgenowskiej  jasności  absolutnej  wymaga 
znajomości  ich  odległości  od  nas.  Wówczas  gdy  od- 
ległość tę  możemy  ocenić  w sposób  pośredni  otrzy- 
mujemy jasność  absolutną  rzędu  1031  J-s”1,  co  jest 
zgodne  z wynikami  wyznaczeń  jasności  absolutnej 
źródeł  w Wielkim  Obłoku  Magellana,  którego  od- 
ległość jest  znana.  Oceniona  na  tej  podstawie  łączna 
jasność  rentgenowska  Galaktyki  jest  rzędu  2-1032  J • 
•s-1  (dla  porównania,  energetyczną  jasność  absolutną 
Galaktyki  we  wszystkich  zakresach  widmowych  oce- 
nia się  na  1037  J*s-1).  Podobną  absolutną  jasność 
rentgenowską  ma  również  galaktyka  M31  w gwiazdo- 
zbiorze Andromedy. 


Tło  promieniowania  X i y 

Rozmyte  i najprawdopodobniej  izotropowe  promie- 
niowanie X i y zostało  wykryte  już  w najwcześniejszych 
eksperymentach  i od  tej  chwili  było  przedmiotem 
wielu  obserwacji.  Na  rys.  9 zebrane  są  wyniki  róż- 
nych obserwacji  dotyczących  widma  tego  promienio- 
wania. Jak  dotychczas  nie  udało  się  jeszcze  wyjaśnić 
w sposób  zadowalający  pochodzenia  tego  promienio- 
wania. Może  ono  być  zarówno  pochodzenia  lokalne- 
go, tzn.  powstawać  w naszej  Galaktyce,  jak  i pocho- 
dzenia pozagalaktycznego,  tzn.  powstawać  albo 
w przestrzeni  międzygaiaktycznej,  albo  być  sumą 
wielu  nierozdzielonych  źródeł  pozagalaktycznych. 
Wydaje  się  jednak,  że  ta  ostatnia  możliwość  jest 
najmniej  prawdopodobna,  choć  nie  można  wyklu- 
czyć istnienia  pewnej  składowej  pozagalaktycznej. 


Rys.  8.  Rozkład  źródeł  katalogu  3U  we  współrzędnych  galaktycznych 


Rys.  9.  Widmo  tła  rentgenowskiego.  Różne  symbole  odpowia- 
dają różnym  eksperymentom 

nakładającej  się  na  tło  produkowane  w naszej  Galak- 
tyce. Jednoznaczne  rozwiązanie  problemu  pochodze- 
nia tła  rentgenowskiego  będzie  miało  duże  znaczenie 
dla  poznania  warunków  fizycznych  panujących  w od- 
ległych obszarach  przestrzeni  międzygalaktycznej 
i międzygwiazdowej. 


Źródła  podwójne 

Kilka  spośród  znanych  źródeł  wykazuje  periodyczne 
zmiany  jasności  rentgenowskiej.  Okresy  tych  zmian, 
od  4,8  h (Cyg  X-3)  do  8,95  d (VelaX-l)  świadczą 

0 tym,  że  obiekty  te  mogą  należeć  do  klasy  ciasnych 
układów  podwójnych  (— ► Ewolucja  gwiazd).  Przy- 
puszczenie to  znalazło  pełne  potwierdzenie  po  doko- 
naniu identyfikacji  dwu  spośród  tych  źródeł  (Cen  X-3 

1 HerX-l)  z układami  zaćmieniowymi  o okresach  zać- 
mień optycznych  równych  okresom  zaćmień  rentge- 
nowskich (2,067  d dla  CenX-3  i 1,7  d dla  Her  X-l). 
Oba  te  źródła  są  tym  bardziej  interesujące,  że  ich 
składniki  rentgenowskie  są  jednocześnie  pulsarami 
rentgenowskimi  (-*  Pulsary),  tzn.  wysyłają  promie- 
niowanie X w postaci  bardzo  krótkich  impulsów  po- 
wtarzających się  co  4,8  s (Cen  X-3)  i 1,24  s (Her  X-l). 
Liczne  i różnorodne  dane  obserwacyjne  — - zarów- 
no rentgenowskie,  jak  i optyczne  — pozwoliły  opra- 
cować dość  prawdopodobny  model  tych  źródeł: 
Układ  podwójny  złożony  jest  z normalnej  gwiazdy 

0 cechach  charakterystycznych  dla  gorącego  olbrzyma 

1 masie  kilku  lub  kilkunastu  mas  Słońca,  wokół  które- 
go po  ciasnej  orbicie  kołowej  krąży  obracająca  się 
szybko  gwiazda  neutronowa  o masie  rzędu  1 masy 
Słońca.  Rozrzedzony  strumień  materii  wypływ-ający 
z pierwszej  gwiazdy  (np.  w postaci  wiatru  gwiazdowe- 
go) jest  częściowo  wychwytywany  przez  gwiazdę 
neutronową  i wzdłuż  linii  sił  pola  magnetycznego 
spływa  w jej  obszary  biegunowe.  Ze  względu  na  małe 
rozmiary  gwiazdy  neutronowej  (rzędu  kilku  kilomet- 
rów) pole  grawitacyjne  w-  jej  pobliżu  ma  ogromne 
natężenie.  Cząstki  rozrzedzonego  strumienia  materii 
opadające  na  gwiazdę  neutronową  mogą  wyzwalać 
ogromne  ilości  energii  graw-itacyjnej,  która  ulega 
przemianie  w energię  cieplną,  a następnie  — za 
pośrednictwem  jednego  z mechanizmów  wspomnia- 
nych na  wstępie  — w energię  promieniowania  X. 
Szybki  obrót  gwiazdy  neutronowej  wokół  osi  nachy- 
lonej względem  osi  pola  magnetycznego  sprawia,  że 
promieniowanie  wysyłane  przez  obszary  biegunow-e 
dobiega  do  nas  w postaci  regularnych  impulsów. 

Innym  źródłem  niezmiernie  interesującym,  a zara- 
zem zagadkowym,  jest  Cyg  X-l.  Wykazuje  ono  bar- 
dzo skomplikowane  zmiany  jasności  rentgenowskiej. 


„niebo 

rentge- 

nowskie1' 


źródła 
CenX-3  i 
Her  X-1 


model: 
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źródło  optycznej  i radiowej.  Zostało  ono  zidentyfikowane  ze 
Cyg-X1  zmienną  spektroskopową  o okresie  5,6  d.  Okresowość 
ta  nie  występuje  jednak  w zmianach  jasności  optycz- 
nej i rentgenowskiej.  Promieniowanie  X dobiega  do 
nas  w postaci  ciągów  impulsów  trwających  od  1 ms 
do  100  ms,  które  jednak  nie  powtarzają  się  ściśle  perio- 
dycznie. Analiza  obserwacji  w dziedzinie  optycznej, 
wielkość  amplitudy  prędkości  radialnych  oraz  cechy 
widmowe  gwiazdy  widocznej  prowadzą  do  wniosku, 
że  jeżeli  jest  to  zwykły  układ  podwójny,  wówczas 
składnik  niewidoczny  musi  mieć  masę  co  najmniej 
kilku  mas  Słońca.  Jedynym  trwałym  obiektem  o bar- 
dzo małych  rozmiarach  i o takiej  masie  może  być 
tylko  czarna  dziura  (— ► Czarne  dziury  i zapadanie 
grawitacyjne).  Wprawdzie  interpretacja  ta  nie  jest  ko- 
nieczna (Cyg  X-1  może  być  np.  układem  potrójnym), 
mimo  to  obecnie  Cyg  X-1  jest  najbardziej  prawdo- 
podobnym układem  zawierającym  taki  obiekt. 


Pozostałości  supernowych 

Emisję  promieniowania  rentgenowskiego  obserwuje 
się  z kilkunastu  mgławic  będących  niewątpliwie  po- 
zostałościami po  wybuchach  supernowych  w naszej 
Galaktyce.  Najlepiej  poznanym  obiektem  tego  typu 
mgławica  Jest  mgławica  Krab  i znajdujący  się  wewnątrz  niej 
Krab  pulsar  (radiowy,  optyczny  i rentgenowski)  NP0531. 
Źródłem  emisji  X jest  obszar  mgławicy  mający  śred- 
nicę ok.  100"  (il.  215,  tabl.  58).  Ok.  15%  energii  zawar- 
te jest  w pulsach  o okresie  33  ms,  przy  czym  pulsy  rent- 
genowskie są  zgodne  w fazie  z pulsami  optycznymi 
i radiowymi.  Mgławica  Krab  jest  również  źródłem 
promieniowania  y o energii  większej  od  1011  eV 
(obserwowany  strumień  4 10~n  rotonów  cm“2-s-1). 
W przedziale  2-20  keV  od  mgławicy  Krab  dobiega 
do  nas  strumień  równy  2- 10" 15  J*cm“2*s“\  co  przy 
znanej  odległości  2 kps  daje  absolutną  jasność  rent- 
genowską 1,5- 1030  Js"1.  Stwierdzone  w dziedzinie 
radiowej  spowalnianie  obrotu  pulsara  wskazuje  na 
utratę  energii  rotacyjnej  rzędu  31031  J-s"1.  Wystar- 
cza to  do  podtrzymywania  jasności  samego  pulsara 
jak  i otaczającej  go  mgławicy.  Nawiasem  mówiąc, 
pulsar  NP0531,  odkryty  najpierw  jako  pulsar  ra- 
diowy a następnie  optyczny,  jest  przede  wszystkim 
pulsarem  rentgenowskim,  wysyłającym  w zakresie  X 
sto  razy  więcej  energii  niż  w dziedzinie  widzialnej 
i sto  tysięcy  razy  więcej  w dziedzinie  radiowej, 
mgławica  Równie  interesującym  obiektem  tego  typu  jest 
Vela  X mgławica  Vela  X,  zawierająca  pulsar  radiowy 
PSR0833-45.  Jest  ona  pozostałością  supernowej 
nieco  starszą  od  mgławicy  Krab.  Źródłem  promienio- 
wania X jest  zarówno  rozległa  mgławica,  jak  i pulsar 
(il.  217,  tabl.  58).  Część  energii  promieniowania  A' jest 
modulowana  z okresem  radiowym  pulsara.  Chociaż 
mgławica  Vela  X ma  wiele  cech  wspólnych  z mgławi- 
cą Krab,  to  jednak  ze  względu  na  swą  większą  roz- 
ległość w przestrzeni  i starszy  wiek  może  dostarczyć 
wielu  interesujących  informacji  na  temat  oddziały- 
wania rozszerzającej  się  powłoki  supernowej  z materią 
międzygwiazdową.  Efekty  te,  nie  dające  się  jeszcze 
zauważyć  u mgławicy  Krab,  są  już  dość  silnie  zazna- 
czone w promieniowaniu  mgławicy  VelaX. 


Chwilowe  źródła  promieniowania  X 
(nowe  rentgenowskie) 

Obserwacje  prowadzone  w latach  1971-75  doprowa- 
dziły do  wykrycia  pięciu  interesujących  źródeł  o wy- 
raźnie aperiodycznym  charakterze  zmian  jasności 
rentgenowskiej.  Wspólną  cechą  tych  źródeł  jest 
szybki  wzrost  jasności  o kilka  rzędów  wielkości  w cią- 
gu dnia  lub  kilku  dni,  a następnie  stosunkowo  po- 
wolny spadek  w skali  czasowej  rzędu  miesięcy.  Wzro- 
stowi jasności  towarzyszy  na  ogół  zmiana  widma. 
Najwięcej  obserwacji  zebrano  dla  źródła  A 0620-00, 
a ponadto  jego  położenie  zostało  określone  z tak  dużą 
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dokładnością,  że  udało  się  dokonać  jego  identyfikacji  nowa 
optycznej  z gwiazdą,  która  w okresie  wzrostu  jasności  Monocerotis 
rentgenowskiej  zwiększyła  swą  jasność  optyczną 
z 18™  do  llm.  Jednocześnie,  na  podstawie  archiwal- 
nych zdjęć  nieba  stwierdzono,  że  ta  sama  gwiazda 
zwiększyła  w podobny  sposób  swoją  jasność  opty- 
czną ok.  70  lat  temu.  Pozwoliło  to  zaliczyć  obiekt 
do  kategorii  gwiazd  nowych  powrotnych.  Nowa 
Monocerotis  (jak  nazwano  to  źródło)  różniła  się 
jednak  w istotny  sposób  od  innych  gwiazd  tej  grupy; 
po  pierwsze  — jej  widmo  optyczne  różniło  się  od 
widm  nowych  powrotnych;  a po  drugie,  w maksimum 
jasności  promieniowała  ona  ok.  tysiąca  razy  więcej 
energii  w dziedzinie  rentgenowskiej  niż  w dziedzinie 
optycznej,  czego  nie  obserwowano  u nowej  Cygni 
1975  (zresztą  jedynego  innego  obiektu,  dla  którego 
prowadzone  były  takie  obserwacje).  Mechanizm 
wybuchów  nowych  rentgenowskich  nie  iest  jeszcze 
znany.  Przypuszcza  się  tylko,  że  obiekty  te  są  ukła- 
dami podwójnymi  o dość  dużych  orbitach,  a poja- 
wienie się  emisji  rentgenowskiej  jest  wynikiem  akrecji 
materii  przez  jeden  ze  składników,  wzmożonej  w wy- 
niku np.  okresowej  aktywności  drugiego  składnika. 

Rozbłyskowe  źródła  promieniowania  X i y 

Istotny  wzrost  czasowej  zdolności  rozdzielczej  urzą- 
dzeń odbiorczych  oraz  coraz  większa  liczba  satelitów 
prowadzących  obserwacje  w zakresie  X i y dopro- 
wadziły do  odkrycia  w ciągu  ostatnich  kilku  lat 
kilkunastu  źródeł  wysyłających  promieniowanie  w po- 
staci impulsów  trwających  od  kilku  sekund  do  kilku- 
dziesięciu milisekund.  Impulsy  te  pojawiają  się  nie- 
periodycznie i różnią  się  między  sobą  całkowitą 
ilością  zawartej  w nich  energii.  W niektórych  wypad- 
kach stwierdza  się  istnienie  korelacji  między  energią 
zawartą  w impulsie  i czasem,  po  którym  pojawia  się 
następny  impuls:  im  większa  energia  impulsu,  tym 
później  pojawia  się  następny  impuls.  Pierwsze  identy- 
fikacje optyczne  tych  źródeł  wskazywały,  że  obser- 
wowane rozbłyski  pochodzą  z gromad  kulistych,  gromady 
Obecnie  znane  są  jednak  również  źródła  rozbłyskowe  kuliste 
nie  dające  powiązać  się  z tymi  obiektami.  Podobne 
rozbłyski  obserwowane  były  również  przez  urządze- 
nia odbierające  promieniowanie  y.  Ponieważ  obser- 
wacje w zakresie  y są  prowadzone  zazwyczaj  nieza- 
leżnie od  obserwacji  promieniowania  Xy  początkowo 
sądzono,  że  oba  rodzaje  rozbłysków  mają  różne 
pochodzenie.  Obecnie  przeważa  przypuszczenie,  że 
źródłami  obu  rodzajów  rozbłysków  są  te  same  obiekty. 

Pochodzenie  rozbłysków  nie  zostało  jeszcze  wyjaśnio- 
ne. Przypuszcza  się  tylko,  że  mogą  one  być  następ- 
stwem okresowego  opróżniania  się  „rezerwuarów’' 
plazmy  istniejących  w pobliżu  obiektów  masywnych 
o małych  rozmiarach  (np.  gwiazd  neutronowych  łub 
czarnych  dziur)  i prawdopodobnie  wchodzących 
w skład  układów  podwójnych. 

Źródła  pozagalaktyczne 

Pozagalaktyczne  źródła  promieniowania  X mają  nie- 
wielką obserwowaną  jasność  rentgenowską  i są  znacz- 
nie trudniejsze  do  wykrycia.  Trudniejsze  jest  również 
określenie  ich  pozycji  na  niebie  z taką  dokładnością, 
by  możliwe  było  dokonanie  ich  identyfikacji  optycz- 
nych. Spośród  60  źródeł  z katalogu  3 U leżących 
w dużych  szerokościach  galaktycznych  i będących 
prawdopodobnie  źródłami  pozagalaktycznymi  więk- 
szość nie  została  jeszcze  zidentyfikowana.  Źródłami 
promieniowania  X są  natomiast  z pewnością  najbliż- 
sze nas  galaktyki:  Wielki  i Mały  Obłok  Magellana 
(w  których  zidentyfikowano  również  źródła  punkto- 
we) oraz  M31.  Ich  absolutna  jasność  rentgenowska 
jest  niewielka  i zbliżona  do  jasności  rentgenowskiej 
naszej  Galaktyki;  jako  źródła  rentgenowskie  obser- 
wujemy je  tylko  ze  względu  na  małą  odległość.  Wśród 
obiektów  leżących  w znacznie  większych  odległoś- 


przepuszczalność 


ciach,  promieniowanie  rentgenowskie  stwierdzono 
u jednej  galaktyki  Seyferta(NGC  4151),  u kilku  galak- 
tyk aktywnych  (będących  jednocześnie  silnymi  radio- 
źródłami lub  wykazującymi  inne  oznaki  aktywności), 
u najjaśniejszego  kwazara  (3C  273)  oraz  u kilku- 
nastu gromad  galaktyk.  Obserwacje  gromad  galaktyk 
mogą  przynieść  szczególnie  interesujące  wyniki,  jeżeli 
tylko  uda  się  stwierdzić  pochodzenie  wysyłanego 
przez  nie  promieniowania  X . Jeżeli  jego  źródłem 


okaże  się  np.  rozproszona  materia  międzygalak tyczna  obserwacje 
w obrębie  gromady,  fakt  ten  będzie  miał  istotny  gromad 
wpływ  na  rozstrzygnięcie  problemu  dynamicznej  galaktyk 
stabilności  gromad  galaktyk. 
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Astronomia  w podczerwieni 

Marcin  KubiaK 


Nazwą  podczerwieni  obejmujemy  promieniowanie 
elektromagnetyczne  o długościach  fal  zawartych 
w przedziale  od  ok.  1 pm  (10  000  A)  do  ok.  1000  pm 
(1  mm).  Podczerwień  jest  przedłużeniem  widma  wi- 
dzialnego w kierunku  fal  dłuższych  i podlega  tym 
samym  prawom  optyki  geometrycznej;  do  skupiania 
promieniowania  podczerwonego  używa  się  zwykłe 
teleskopy  optyczne.  Możliwość  obserwowania  w pod- 
czerwieni z powierzchni  Ziemi  jest  ograniczona  przede 
wszystkim  przez  absorpcyjne  właściwości  jej  atmo- 
sfery. Poszczególne  składniki  atmosfery,  a zwłaszcza 
para  wodna  (H20),  dwutlenek  węgla  (CO^)  oraz 
ozon  (03),  mają  silne  pasma  absorpcyjne  w omawia- 
nym przedziale  widmowym.  Pomiędzy  tymi  pasmami 
istnieje  jednak  kilka  zakresów,  tzw.  okien,  w których 
atmosfera  ziemska  jest  niemal  zupełnie  przezroczysta. 
Zależność  przepuszczalności  atmosfery  ziemskiej  od 
długości  fali  promieniowania  podczerwonego,  odno- 
sząca się  do  średniej  atmosfery  (zawierającej  normalną 
ilość  pary  wodnej,  dwutlenku  węgla  i ozonu),  jest 
przedstawiona  na  rys.  1.  Chwilowe  zmiany  składu 
chemicznego  atmosfery,  a zwłaszcza  jej  wilgotności, 
powodują  zmiany  szerokości  oraz  przezroczystości 
poszczególnych  okien.  Innym  zjawiskiem  decydują- 
cym o wielkości  osłabienia  promieniowania  pod- 


również  w ciągu  dnia.  Przy  obserwacjach  spoza 
atmosfery  ziemskiej  lub  spoza  jej  najgęstszych  warstw 
(z  pokładów  wysoko  lecących  samolotów,  balonów 
stratosferycznych,  rakiet  i sztucznych  satelitów) 
dostępny  jest  oczywiście  cały  zakres  promieniowania 
podczerwonego. 

Rejestracja  promieniowania  podczerwonego  wy-  detektory 
maga  specjalnych  urządzeń  odbiorczych  (detektorów)  promienio- 
odznaczających  się  dużą  czułością  oraz  niskim  po-  wania 
ziomem  szumów  w interesującym  nas  zakresie  długo-  podczerwo- 
ści  fal.  Brak  takich  odbiorników  był  głównym  powo-  nego 
dem,  dla  którego  obserwacje  w podczerwieni  na  dużą 
skalę  zostały  podjęte  stosunkowo  niedawno.  Chociaż 
pierwsze  pomiary  promieniowania  podczerwonego 
Słońca,  Księżyca,  planet  i niektórych  najjaśniejszych 
gwiazd  zostały  wykonane  w latach  30-ych  XX  w.,  to 
jednak  za  datę  narodzin  astronomii  w podczerwieni 
należy  uznać  początek  lat  60-ych,  gdy  dzięki  rozwo- 
jowi techniki  półprzewodnikowej  oraz  techniki  otrzy- 
mywania niskich  temperatur  uzyskano  detektory 
o czułości  wystarczającej  do  rejestracji  promienio- 
wania nawet  słabych  źródeł  pozaziemskich.  Na  rys.  2 
przedstawiona  jest  czułość  widmowa  niektórych 
stosowanych  obecnie  fotokatod.  W zakresie  tzw. 
bliskiej  podczerwieni  (długość  fali  od  1 pm  do  ok. 


długość  fali 

Rys.  1.  Przepuszczalność  atmosfery  ziemskiej  w jednostkach 
umownych:  J oznacza  zupełną  przezroczystość,  natomiast  0 
całkowitą  absorpcję  promieniowania.  Literami  zaznaczone  jest 
przybliżone  położenie  poszczególnych  pasm  fotometrii  szeroko- 
pasmowej opisanych  dokładniej  w tabeli 


rozpraszanie 

promienio- 

wania 

podczerwo- 

nego 


czerwonego  w atmosferze  ziemskiej  jest  rozpraszanie 
na  cząstkach  materialnych  (mgła,  smog,  pył).  Wiel- 
kość tego  rozpraszania  zależy  od  rozmiarów  cząstek 
i ich  koncentracji,  natomiast  nie  zależy  prawie  od 
długości  fali.  Obserwacje  w podczerwieni  należy 
więc  prowadzić  przede  wszystkim  z miejsc  położo- 
nych wysoko  nad  poziomem  morza,  w okolicach 
bardzo  suchych  i wolnych  od  zanieczyszczeń  pyło- 
wych. Z obserwacyjnego  punktu  widzenia  zaletą 
promieniowania  podczerwonego  jest  fakt,  iż  nie  ulega 
ono  rozproszeniu  na  atomach  i cząsteczkach  gazów 
znajdujących  się  w atmosferze  (tzw.  rozpraszanie  Ray- 
leigha,  którego  wynikiem  jest  barwa  nieba  w dzień). 
W zakresie  podczerwonym  nie  ma  zatem  różnicy 
między  jasnością  nieba  nocnego  i dziennego,  co  spra- 
wia, że  obserwacje  w podczerwieni  można  prowadzić 


Rys.  2.  Widmowa  czułość  kilku  substancji  będących  detektorami 
promieniowania  podczerwonego.  Podane  są  również  tempera- 
tury, w których  detektory  te  pracują 


5 pm)  energia  niesiona  przez  fotony  promieniowania 
jest  wystarczająca  do  wywołania  zjawiska  foto- 
elektrycznego  w substancji  pokrywającej  fotokatodę 
(Pbs,  InSb).  Energia  niesiona  przez  fotony  o długości 
fali  większej  od  ok.  5 pm  (przeciętnie  kilkaset  razy  wewnętrzne 
mniejsza  od  energii  fotonów  promieniowania  wi-  zjawisko 
dzialnego)  jest  wystarczająca  do  spowodowania  tzw.  fotoelektry- 
wewnętrznego  zjawiska  fotoelektrycznego  . (zmiany  czne 
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przewodnictwa  kryształu  półprzewodnikowego  pod 
wpływem  promieniowania  podczerwonego)  w pół- 
przewodnikach, do  których  zostały  wprowadzone 
odpowiednie  domieszki  (Ge:Hg,  Ge:Cu,  Ge:Ga 
itp.).  Wszystkie  substancje  czułe  na  obecność  pro- 
mieniowania podczerwonego  są  detektorami  wydaj- 
nymi dopiero  w bardzo  niskich  temperaturach  (po- 
danych również  na  rys.  2).  Chłodzenie  detektorów 
ma  na  celu  odpowiednie  zmniejszenie  poziomu  szu- 
mów, czyli  chaotycznych  sygnałów  będących  następ- 
stwem termicznych  ruchów  cząstek  materii  samego 
detektora.  Obecnie  możliwości  detekcji  promienio- 
wania podczerwonego  sa  określone  wyłącznie  przez 
poziom  szumów  mierzonego  promieniowania, 
eliminacja  Podstawową  trudnością  przy  obserwacjach  w pod- 
promienio-  czerwieni  jest  wyodrębnienie  promieniowania  poza- 
wania  ziemskiego  spośród  promieniowania  wysyłanego 
otoczenia  przez  otoczenie  detektora.  Źródłem  promieniowania 
podczerwonego  jest  każde  ciało  o temperaturze 
wyższej  od  zera  bezwzględnego,  a zwłaszcza  ciała 
o temperaturze  kilkuset  stopni  K.  Niepożądane 
promieniowanie  podczerwone  wysyła  więc  zarówno 
atmosfera  ziemska  (promieniująca  jak  ciało  o tempe- 
raturze rzędu  0°C),  jak  i poszczególne  elementy 
teleskopu  znajdującego  się  w polu  widzenia  detektora 
(obiektyw,  zwierciadła  wtórne  itp.).  Wpływ  promie- 
niowania otoczenia  na  uzyskane  wyniki  można  wy- 
datnie zmniejszyć  lub  całkowicie  wyeliminować  przez 
staranne  i częste  wzorcowanie  urządzenia  obserwa- 
cyjnego lub  przez  zastosowanie  sygnału  modulowa- 
nego w zadany  sposób. 

Obserwacje  pozaatmosferyczne  nie  zostały  jeszcze 
podjęte  na  szerszą  skalę,  pomimo  szybkiego  rozwoju 
techniki  lotów  satelitarnych,  i ograniczają  się  na 
razie  do  krótkotrwałych  lotów  rakietowych,  które 
zresztą,  ze  względu  na  krótki  efektywny  czas  obser- 
wacji— rzędu  kilku  minut  — są  stosunkowo  kosz- 
towne. Główną  przeszkodą  w podjęciu  znacznie  eko- 
nomiczniejszych  pod  tym  względem  obserwacji 
z pokładów  sztucznych  satelitów  ziemi  jest  trudność 
utrzymania  odpowiednio  niskiej  temperatury  w wa- 
runkach długotrwałego  lotu  kosmicznego.  Obserwa- 
cje promieniowania  podczerwonego  z przestrzeni 
kosmicznej  wymagałyby  chłodzenia  nie  tylko  detekto- 
ra ale  również  całego  teleskopu,  co  pociągałoby  za 
sobą  konieczność  ciągłego  dostarczania  stosunkowo 
dużych  ilości  energii. 

Obecnie  astronomia  w podczerwieni  jest  jedną 
z najaktywniej  rozwijających  się  dziedzin  astronomii; 
jej  możliwości  nie  ustępują  w zasadzie  możliwościom 
obserwacyjnym  w klasycznej  dziedzinie  widzialnej. 


Fotometria  szerokopasmowa 

Pierwszym,  a zarazem  stosunkowo  najprostszym 
rodzajem  obserwacji  podjętych  w dziedzinie  podczer- 
wonej była  fotometria  szerokopasmowa.  Przepusz- 
czalność atmosfery  ziemskiej  w powiązaniu  z czułością 
detektorów  i właściwościami  istniejących  filtrów 
promieniowania  podczerwonego  określa  w sposób 
naturalny  zakres  długości  fal,  w których  możemy  od- 
bierać pozaziemskie  promieniowanie  podczerwone, 
system  Wynikający  stąd  system  fotometryczny  został  powią- 
fotometry-  zany  z tradycyjnym  systemem  fotometrii  trójbarwnej 
czny  UBV  ( U — nadfiolet,  B — przedział  fal  niebieskich, 
12-pasmowy  V — zakres  widzialny)  w dziedzinie  widzialnej  w jeden 
system  obejmujący  dwanaście  pasm.  Bliższa  charakte- 
rystyka poszczególnych  pasm  tego  systemu  jest 
podana  w tabeli.  Obserwacje  w tym  systemie  są  nie- 
kiedy uzupełniane  przez  obserwacje  w pasmach  po- 
średnich. W wypadku  pasm  niedostępnych  z po- 
wierzchni Ziemi,  obserwacje  w ich  zakresie  są  wyko- 
nywane z wysoko  lecących  samolotów,  z rakiet  lub 
balonów. 

Fotometria  szerokopasmowa  jest  najszybszą  meto- 
dą uzyskiwania  informacji  o rozkładzie  energii  w wid- 
mie ciągłym  w szerokim  zakresie  długości  fal. 
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Charakterystyka  wielobarwnego  systemu  fotometrii 
szerokopasmowej 


Pasmo 

Aet,  Jim 

j 

0 mag,  W-cm_2nm~l 

U 

0,36 

0,066 

4,35- 10-“ 

B 

0,44 

0,098 

7,20- 10-‘* 

V 

0,55 

0,087 

3,92- 10"“ 

R 

0,70 

0,21 

1.7610-1* 

I 

0,90 

0,23 

8,3510-ia 

J 

1,25 

0,30 

3,40- 10- 13 

H 

1,60 

0,30 

1,28- 10- 13 

K 

2,20 

0,58 

3,90- 10“ 

L 

3,40 

0,70 

8,10*10-“ 

M 

5,00 

1,13 

2,20- 10~“ 

N 

10,20 

4,33 

1,23*10-“ 

Q 

22,00 

7,5 

7,70*  I0-“ 

Aet  — efektywna  długość  fali,  — szerokość  pasma,  0 mag  — 
bezwględna  wartość  strumienia  energii  odpowiadającego  zerowej 
wielkości  gwiazdowej  w danym  paśmie. 


Spektrofotometria  (fotometria 
wąskopasmowa) 

Dzięki  opanowaniu  technologii  wytwarzania  filtrów 
interferencyjnych  o zmiennej  charakterystyce  widmo- 
wej, stały  się  możliwe  również  obserwacje  fotome- 
tryczne  w bardzo  wąskich  zakresach  długości  fal. 
Na  przykład  detektor  germanowy  (z  domieszką 
miedzi)  w połączeniu  z filtrem  interferencyjnym  pozwa- 
la uzyskać  spektrofotometr  mierzący  promieniowanie 
w zakresie  3-14  pm  z widmową  zdolnością  roz- 
dzielczą rzędu  0,1  pm.  Dokładność  takiego  urządze- 
nia jest  porównywalna  z dokładnością  spektrogra- 
fów, natomiast  zakres  jego  zastosowania  jest  znacz- 
nie szerszy. 


Spektroskopia 

W krótkofalowym  zakresie  promieniowania  podczer- 
wonego, będącego  naturalnym  przedłużeniem  zakresu 
widzialnego,  technika  obserwacji  spektroskopowych 
nie  różni  się  niczym  od  spektroskopii  światła  widzial- 
nego. Widma  podczerwone  w dużej  dyspresji  można 
uzyskać  za  pomocą  zwykłych  siatek  dyfrakcyjnych 
oraz  emulsji  fotograficznych  czułych  na  promienio- 
wanie podczerwone.  Obserwacje  tego  rodzaju  nie 
wykraczają  jednak  poza  długość  fali  ok.  1,2  pm 
(przy  rejestracji  fotograficznej)  lub  ok.  2,5  pm  (przy 
rejestracji  fotoelektrycznej,  zwłaszcza  w obserwacjach 
rakietowych).  W całym  zakresie  podczerwieni  duże 
zdolności  rozdzielcze  — rzędu  0,05  pm  lub  wyjątkowo 
nawet  0,01  pm  — można  uzyskać  przez  zastosowa- 
nie interferometrów  (np.  Fabry’ego-Perota  lub  Mi-  jnterfero- 
chelsona).  Technika  interferometryczna,  chociaż  metry 
stosunkowo  czasochłonna,  została  z powodzeniem 
zastosowana  w niemal  całym  zakresie  promienio- 
wania podczerwonego  dostępnego  z powierzchni 
Ziemi. 


Obserwacje  bolometryczne 

Urządzenie  odbierające  promieniowanie  z bardzo 
szerokiego  przedziału  widmowego,  a w idealnym 
wypadku  — całe  promieniowanie  padające — nazy- 
wamy bolometrem.  Celem  obserwacji  bolometrycz-  bolometry 
nych  jest  pomiar  całkowitego  strumienia  energii 
promienistej  dobiegającej  do  nas  od  danego  ciała 
niebieskiego.  Przy  znanej  odległości  tego  ciała,  łączna 
energia  dobiegająca  do  nas  w jednostce  czasu  jest 
bezpośrednią  miarą  jego  temperatury  efektywnej. 

W praktyce  wystarcza,  jeżeli  używany  przez  nas  bolo- 
metr  rejestruje  promieniowanie  w tym  zakresie  wid- 
mowym, w którym  przypada  większość  promienio- 
wania wysyłanego  przez  obserwowane  ciało  niebie- 
skie. Urządzeniem  czułym  w szerokim  zakresie  pro- 


mieniowania  podczerwonego  — od  ok.  2 pm,  do  ok. 
1000  jim  — jest  np.  bolometr  germanowy  chłodzony 
ciekłym  helem  do  temperatury  poniżej  2 K.  Odbiornik 
taki  może  spełniać  rolę  bolometru  przy  obserwacjach 
bolometr  źródeł  o temperaturach  efektywnych  zawartych  w 
germanowy  przedziale  od  kilkunastu  do  ponad  tysiąca  K.  Przy 
obserwacjach  z powierzchni  Ziemi  bolometr  germa- 
nowy lub  bolometr  indowo-antymonowy,  którego 
czułość  widmową  ilustruje  rys.  2,  może  być  wyko- 
rzystywany do  obserwacji  promieniowania  w tzw. 
podmilimetrowym  zakresie  fal  (obszar  przejściowy 
między  promieniowaniem  podczerwonym  i radio- 
wym), w którym  atmosfera  ziemska  staje  się  ponow- 
nie stosunkowo  przezroczysta. 

Jak  już  wspominaliśmy,  zależnie  od  temperatury 
ciała  maksimum  promieniowanej  przez  niego  energii 
przypada  w różnych  obszarach  widmowych.  W pod- 
czerwieni świecą  przede  wszystkim  ciała  o tempera- 
turach od  ok.  3500  K (maksimum  w pobliżu  1 pm) 
do  ok.  3 K (maksimum  w pobliżu  1000  pm).  Zatem 
obserwacje  w podczerwieni  umożliwiają  badanie 
obiektów,  które  w dziedzinie  widzialnej  są  bardzo 
słabo  albo  w ogóle  niewidoczne.  Ponadto,  z obser- 
wacji spektroskopowych  uzyskuje  się  informacje 

0 tych  atomach  i cząsteczkach,  które  występują 
w atmosferach  gwiazd  i planet  (zarówno  chłodnych, 
jak  i gorętszych),  ale  które  nie  mają  linii  widmowych 
w dziedzinie  widzialnej.  Należy  również  pamiętać, 
że  istnieją  obiekty  astronomiczne,  których  promie- 
niowanie nie  ma  charakteru  wyłącznie  termicznego, 

1 które  w związku  z tym,  obok  dużych  ilości  promie- 
niowania widzialnego,  mogą  wysyłać  również  silne 
promieniowanie  podczerwone. 

Chociaż  obserwacje  w podczerwieni  zostały  podjęte 
stosunkowo  niedawno,  to  jednak  przyniosły  one  już 
wiele  interesujących  wyników  i znacznie  rozszerzyły 
naszą  znajomość  zarówno  stanu  materii  we  Wszech- 
świecie,  jak  i procesów  fizycznych,  które  w niej  prze- 
biegają. Poniżej  podany  jest  krótki  przegląd  najważ- 
niejszych wyników  uzyskanych  dzięki  obserwacjom 
w podczerwieni. 


Absorpcja  międzygwiazdowa 

Z obserwacji  w dziedzinie  widzialnej  wiadomo,  że 
materia  rozproszona  (gaz  i pył)  w płaszczyźnie  Galak- 
tyki wywołuje  osłabienie  przechodzącego  przez  nią 
światła  gwiazd.  Osłabienie  to  zależy  od  długości  fali 
i jest  tym  mniejsze,  im  większa  jest  długość  fali  (stąd 
poczerwie-  też  nazwa  — poczerwienienie  międzygwiazdowe). 
nieme  Dzięki  obserwacjom  w podczerwieni  zależność 
międzygwia-  absorpcji  międzygwiazdowej  od  długości  fali  została 
zdowe  wyznaczona  w szerokim  zakresie  widmowym.  Wyzna- 
czono ją  przez  porównanie  przebiegu  widma  ciągłego 
poczerwienionych  i niepoczerwienionych  gwiazd 
takiego  samego  rodzaju.  W dziedzinie  widzialnej 
wykorzystuje  się  w tym  celu  przede  wszystkim  jasne 
gwiazdy  gorące,  a w dziedzinie  podczerwonej  — jasne 
gwiazdy  chłodne.  Dokładna  znajomość  krzywej 
absorpcji  międzygwiazdowej  jest  niezbędna  do  wielu 
pośrednich  metod  wyznaczania  odległości  ciał  nie- 
bieskich. Jednocześnie  na  jej  podstawie  można  uzy- 
skać wiele  cennych  informacji  na  temat  stanu  fizycz- 
nego i składu  chemicznego  materii,  która  tę  absorpcję 
wywołuje.  Obecnie  wiadomo,  że  osłabienie  światła 
gwiazd  powodują  drobne  ziarenka  materii  w stanie 
stałym  (pył)  o charakterystycznych  rozmiarach  1 pm. 
Skład  chemiczny  pyłu  nie  jest  jeszcze  dokładnie  znany, 
jest  jednak  bardzo  prawdopodobne,  że  zawiera  on 
takie  pierwiastki  i związki  chemiczne,  jak  tlenek 
krzemu,  żelazo,  lód,  glin,  magnez  i wapń.  Ocenia  się, 
że  łączna  masa  składowej  pyłowej  wynosi  ok.  1% 
masy  gazu  międzygwiazdowego.  Na  podstawie 
obserwacji  podczerwonego  promieniowania  gwiazd 
można  przypuszczać,  że  ziarna  pyłu  powstają  w atmo- 
sferach gwiazd  chłodnych,  skąd  przedostają  się  do 
przestrzeni  międzygwiazdowej. 


Obserwacje  gwiazd 

Pierwsze  obserwacje  gwiazd  polegały  przede  wszy- 
stkim na  wyznaczeniu  przebiegu  ich  widma  ciągłego 
za  pomocą  szerokopasmowej  fotometrii  wielobarwnej, 
oraz  na  poszukiwaniu  obiektów  promieniujących 
wyłącznie  w dziedzinie  podczerwonej.  Obserwacje 
obejmowały  zarówno  gwiazdy  gorące  (wystarczająco 
jasne,  by  można  było  spodziewać  się  również  mierzal- 
nego strumienia  promieniowania  podczerwonego), 
jak  i gwiazdy  chłodne.  Interesujące  było  stwierdzenie, 
że  stosunkowo  dużo  gwiazd  gorących,  zwłaszcza  gwiazdy 
gwiazd  z liniami  emisyjnymi,  św-iadczącymi  o istnie-  gorące 
niu  wokół  nich  rozległych  otoczek  gorącej  i prawdo- 
podobnie ekspandującej  materii,  wykazuje  nadwyżki 
(w  stosunku  do  termicznego  promieniowania  ciała 
doskonale  czarnego)  promieniowania  w zakresie  fal 
dłuższych  od  3,5  pm.  Biorąc  pod  uwagę,  że  gorące 
jasne  gwiazdy  są  na  ogół  gwiazdami  młodymi,  nad- 
wyżkę tę  można  wiązać  z promieniowaniem  cieplnym 
pyłu  otaczającego  gwiazdy  młode  i będącego  pozo- 
stałością po  pierwotnym  obłoku  materii  gazowo-pyło- 
wej,  z którego  gwiazdy  te  powstały.  Niezależnym 
potwierdzeniem  tego  wniosku  jest  fakt,  że  duże  nad- 
wyżki promieniowania  podczerwonego  zostały  rów- 
nież stwierdzone  przy  obserwacji  niektórych  rodzajów 
chłodniejszych  gwiazd  zmiennych  (np.  tzw.  gwiazd 
typu  TTauri  i R Monocerotis),  które  według  naszych 
dzisiejszych  poglądów  są  gwiazdami  znajdującymi  się 
w początkowych  fazach  ewolucyjnych.  Wyraźne 
nadwyżki  promieniowania  podczerwonego  zostały 
stwierdzone  również  dla  wielu  normalnych  gwiazd 
chłodnych  (np.  gwiazd  węglowych).  Ich  widma  (w  po- 
bliżu 10  pm  i 20  pm)  wykazują  pasma  absorpcyjne 
charakterystyczne  dla  tlenku  krzemu  i niektórych 
związków  węgla.  Przypuszcza  się,  że  górne  warstwy 
atmosfer  tych  gwiazd  są  miejscem  tworzenia  się 
ziaren  materii  w stanie  stałym. 

Spektroskopowe  obserwacje  gwiazd  chłodnych  gwiazdy 
w bliskiej  i średniej  podczerwieni  (do  ok.  10  pm)  do-  chłodne 
starczyły  interesujących  informacji  na  temat  zawarto- 
ści w ich  atmosferach  cząsteczek  takich  związków 
chemicznych,  jak  np.  CO  lub  H20.  Cząsteczki  te 
mają  w podczerwieni  wiele  linii  oscylacyjnych  i oscy- 
lacyjno-rotacyjnyćh,  które  w niskich  temperaturach 
powodują  nieprzezroczystość  atmosfer  gwiazdowych. 

Obserwacje  linii  rotacyjnych  cząsteczek  dostarczają 
ponadto  informacji  dotyczących  względnej  obfitości 
izotopów  niektórych  pierwiastków  (np.  węgla)  w ma- 
terii gwiazdowej. 


Obiekty  podczerwone 

Podczas  wstępnych  przeglądów  nieba  wykryto  wiele 
obiektów,  które  wysyłają  bardzo  silne  promieniowa- 
nie podczerwone,  natomiast  nie  mają  odpowiedników 
w dziedzinie  optycznej  lub  dają  się  zidentyfikować 
z obiektami  optycznymi  o bardzo  małej  jasności 
(rys.  3).  Podczerwone  widma  trzech  najsłynniejszych 
obiektów  tego  rodzaju  są  pokazane  na  rys.  4. 

NML  Cyg  jest  jednym  z najjaśniejszych  obiektów  W ML  Cyg 
podczerwonych  na  niebie.  Najprawdopodobniej  jest 
to  nadolbrzym  o cechach  promieniowania  charaktery- 
stycznych dla  gwiazdy  typu  widmowego  A/,  wokół 
którego  znajduje  się  gęsta  otoczka  gazowo-pyłowa 
będąca  źródłem  promieniowania  podczerwonego. 

Optycznym  odpowiednikiem  źródła  NML  Cyg  jest 
obiekt  18  wielkości  gwiazdowej;  niewielka  jasność 
optyczna  jest  spowodowana  silną  absorpcją  około- 
gwiazdową.  Przypuszcza  się,  że  NML  Cyg  jest  pro- 
togwiazdą,  w której  wnętrzu  nie  rozpoczęły  się  jeszcze 
przemiany  jądrowe  (czyli  nie  osiągnęła  ona  jeszcze 
ciągu  głównego). 

Obiekt  Beckiina  jest  to  jasny  obiekt  podczerwony  obiekt 
o bardzo  małych  rozmiarach  kątowych,  znajdujący  Beckiina 
się  prawdopodobnie  wewnątrz  rozciągłej  mgławicy 
podczerwonej  Kleinmanna-Lowa  stanowiącej  część 
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Rys.  3.  U góry  — zdjęcie  mgławicy  IC  1795  (W3)  wykonane 
w świetle  widzialnym  (o  długości  fali  odpowiadającej  linii  wo- 
doru Ha).  Obszar  wewnątrz  mniejszego  prostokąta  zawiera  liczne 
źródła  promieniowania  podczerwonego  i radiowego.  U dołu  — 
konturowe  mapy  tego  obszaru  wykonane  w promieniowaniu  pod- 
czerwonym (2,2  jim  i 20  jim)  i radiowym  (6  cm).  Zwróćmy 
uwagę,  że  obiekty  podczerwone  nie  mają  widocznych  odpowied- 
ników optycznych.  Źródła  promieniowania  podczerwonego  są 
oznaczone  symbolem  IRS’,  duże  litery  (^4-D)  oznaczają  obszary 
intensywnego  promieniowania  radiowego  (wg  L.N.  Mavridis 
(ed.),  vol.  2 Stars  and  the  Milky  Way  System,  Berlin  1974) 


gazowo-pyłowej  Mgławicy  Oriona.  Przypuszcza  się, 
że  obiekt  Becklina  jest  zwykłym  nadolbrzymem  typu 
widmowego  F (temperatura  ok.  7000  K),  którego 
światło  widzialne  ulega  ogromnej  absorpcji  ok.  80 
wielkości  gwiazdowych.  Pasma  absorpcyjne  w widmie 


długość  fali 


Rys.  4.  Względny  rozkład  natężeń  w podczerwonych  widmach 
NML  Cyg,  obiektu  Becklina  i podczerwonej  Mgławicy  KJein- 
manna-Lowa  (krzyżykami  zaznaczone  są  punkty  obserwacyjne) 

obiektu  Becklina  są  produkowane  przez  pył  znajdu- 
jący się  w mgławicy  Kleinmanna-Lowa. 

Poczerwona  Mgławica  Kleinmanna-Lowa  jest  Mgławica 
rozciągłym  źródłem  długofalowego  promieniowania  Kleinmanna- 
podczerwonego  o rozmiarach  kątowych  rzędu  30-40  Lowa 
sekund  łuku.  Mgławica  ta  nie  wysyła  dającego  się 
zmierzyć  promieniowania  w zakresie  fal  krótszych 
od  ok.  20  urn,  jest  natomiast  jeszcze  stosunkowo 
jasna  w zakresie  podmilimetrowym  (900  |im).  Obser- 
wowany rozkład  natężenia  w widmie  jest  w przybli- 
żeniu taki,  jak  oczekiwany  rozkład  promieniowania 
ziaren  pyłu  o temperaturze  50-70  K.  Mgławica  ta 
jest  prawdopodobnie  stosunkowo  dużym  i gęstym 
obłokiem  pyłu  międzygwiazdowego,  wewnątrz  któ- 
rego przebiegają  procesy  powstawania  gwiazd. 


Centrum  Galaktyki 

Dzięki  temu,  że  absorpcja  międzygwiazdowa  jest 
odwrotnie  proporcjonalna  do  długości  fali,  jądro 
Galaktyki,  całkowicie  przesłonięte  w dziedzinie 


rektascensja 

Rys.  5.  Konturowa  mapa  okolic  centrum  Galaktyki  wykonana 
w promieniowaniu  podczerwonym  o długości  fali  100  jim.  Liczby 
oznaczają  natężenie  w jednostkach  względnych.  Przerywaną  linią 
(prostą)  zaznaczony  jest  przebieg  płaszczyzny  symetrii  Galaktyki, 
(wg  V.  Manno  and  J.  Ring  (cd.)  Infrarcd  Techmąues  for  Space 
Research , Dordrecht  1972) 
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widzialnej,  staje  się  widoczne  w promieniowaniu 
podczerwonym.  Fotometryczne  obserwacje  okolic 
centrum  Galaktyki  (rys.  5)  ujawniły,  że  jądro  Galak- 
tyki w podczerwieni  jest  obiektem  rozciągłym  (o  roz- 
miarach rzędu  1°  dla  fal  z przedziału  75-125  pm 
i rzędu  30"  dla  fal  10  i 20  pm),  wysyłającym  stosun- 
kowo silne  promieniowanie.  Na  tle  promieniowania 
ciągłego  widoczne  jest  pasmo  absorpcyjne  SiO  (9,7 
pm)  (rys.  6).  Pochodzenie  tego  promieniowania  nie 
jest  jeszcze  wyjaśnione. 


długość  fali  Rys.  6.  Widmo  promieniowania  centrum  Galaktyki.  Kółka  — 
wyniki  obserwacji  w szerokich  pasmach,  linia  ciągła  — wyniki 
obserwacji  spektrofotometrycznych.  Natężenie  przedstawione 
jest  w skali  logarytmicznej,  w jednostkach  umownych 


Obiekty  pozagalaktyczne 

Źródłami  promieniowania  podczerwonego  są  nie- 
które galaktyki  oraz  kwazary.  Zwykłe  galaktyki 
oraz  galaktyki  Seyferta  mają  widmo  promieniowania 


Ewolucja  gwiazd 

Józef  Smak 

Termin  ewolucja  oznacza  w astronomii  rozwój  po- 
jedynczego obiektu  lub  grupy  obiektów,  a nie  odnosi 
się  do  zmian  określonych  cech  danego  typu  obiektów 
zachodzących  z pokolenia  na  pokolenie.  Ewolucja 
gwiazdy  obejmuje  zatem  proces  powstania  gwiazdy 
z materii  międzygwiazdowej,  następnie  zachodzące 
w jej  wnętrzu  procesy  termojądrowe  i związane  z nimi 
zmiany  parametrów  fizycznych  i składu  chemicznego 
materii  gwiezdnej,  kończące  się  wyczerpaniem  źródeł 
energii  i ewentualnym  zwrotem  części  materii  do 
ośrodka  międzygwiazdowego,  oraz  osiągnięcie  przez 
gwiazdę  końcowego  stadium  ewolucji. 

Ewolucję  gwiazdy  można  rozważać  w aspekcie 
źródeł  jej  energii.  Słońce,  które  może  być  uważane  za 
przeciętną  gwiazdę,  wypromieniowuje  w ciągu  se- 
kundy energię  równą  w przybliżeniu  3,86-  10**  J.  Masa 
Słońca  równa  jest  1,98- 1 030  kg.  Wynika  stąd,  że  tempo 
produkcji  energii  słonecznej  wynosi  średnio  ok. 
2-10“ 4 J/(kg-s).  Równocześnie  zaś  z danych  geo- 
logicznych, odnoszących  się  do  wieku  najstar- 
szych zbadanych  śladów  życia  organicznego  na  Ziemi, 
wynika,  że  Słońce  dostarczało  Ziemi  światła  i ciepła 
w tych  samych  — w przybliżeniu — jak  obecnie 
ilościach  przez  co  najmniej  ostatnie  kilkaset  milio- 
nów lat. 

energia  Pierwszej  próby  zidentyfikowania  źródeł  energii 
grawitacyjna  gwiazd  dokonali  w połowie  XIX  w.  H.  Helmholtz 
gwiazdy  i W.  Thomson  (Kelvin).  Zwrócili  oni  uwagę  na  za- 
soby energii  grawitacyjnej  gwiazdy:  w wypadku  sta- 
łego, powolnego  kurczenia  się  gwiazdy,  jej  energia 
potencjalna  przechodzi  w energię  cieplną,  pokrywając 
przy  tym  straty  powstające  przez  wypromieniowanie. 


podczerwonego  przypominające  typowe  widma  pod- 
czerwone gorących  i gęstych  obłoków  zjonizowanej 
materii  międzygwiazdowej  występujących  w naszej 
Galaktyce. 

Nasuwa  się  przypuszczenie,  że  mechanizm  powsta- 
wania emisji  jest  w obu  wypadkach  taki  sam  (termicz- 
ne promieniowanie  pyłu,  linie  emisyjne  niektórych 
pierwiastków  zjonizowanych  lub  promieniowanie  nie- 
termiczne).  Wyraźną  a ponadto  zmienną  w czasie 
nadwyżkę  promieniowania  podczerwonego  stwierdzi- 
ły również  obserwacje  najjaśniejszego  kwazara  3C  273. 


Słońce  i planety 

Dla  badania  Słońca  i Księżyca  (dwu  najsilniejszych 
źródeł  promieniowania  podczerwonego  na  niebie) 
obserwacje  w podczerwieni  odgrywają  przede  wszy- 
stkim rolę  uzupełniającą  w stosunku  do  obserwacji 
prowadzonych  w innych  dziedzinach  widma.  Są  one 
jednak  bardzo  ważne  dla  badania  planet,  które  ze 
względu  na  stosunkowo  niską  temperaturę,  główną 
część  swej  energii  wysyłają  w podczerwieni.  Istotną 
rolę  dla  określenia  bilansu  energetycznego  planet  bilans  ©ner- 
mają  obserwacje  bolometryczne ; szczególnie  intere-  getyczny 
sujące  jest  stwierdzenie,  że  Jowisz  wysyła  nieco  więcej  Jowisza 
energii  niż  jej  otrzymuje  od  Słońca:  dowodzi  to,  że  ma 
on  własne  źródło  energii.  Celem  spektroskopowych 
obserwacji  planet  jest  przede  wszystkim  wyznaczenie 
składu  chemicznego  ich  atmosfer,  a zwłaszcza  obfito- 
ści cząsteczek  (np.  C02,  NH3,  CH4)  mających  silne 
pasma  absorpcyjne  w podczerwieni  i występujących 
w atmosferach  planetarnych. 

P.  J.  Brancazio,  A.  G.  W.  Cameron  Infrared  Astronomy,  New 
York  1968;  H.  L.  HackForth  Infrared  Radiation , New  York  1960; 

V.  Manno,  J.  RrNG  (ed.)  Infrared  Detection  Techniąues  for  Space 
Research , Dordrecht  1972;  L.N.  Mavrjdis  (ed.),  vol.  2,  Stars  and 
the  Milky  Way  System,  Berlin  1974. 


Jeżeli  gwiazda  znajduje  się  w stanie  równowagi  me- 
chanicznej, wtedy  jej  energia  wewnętrzna  (cieplna)  £/, 
energia  potencjalna  Q oraz  energia  całkowita  E = 
= U+  Q spełniają  związki: 


gdzie  G — stała  grawitacji,  M — masa  gwiazdy,  R — 
promień  gwiazdy,  zaś  Cx  i C\  — stałe  rzędu  1 , zależ- 
ne — odpowiednio  — od  stanu  materii  i rozkładu  gę- 
stości we  wnętrzu  gwiazdy.  Korzystając  z powyż- 
szych zależności  można  oszacować,  jaka  była  całko- 
wita ilość  energii  wypromieniowanej  przez  kurczące 
się  pra -Słońce  przy  przejściu  od  konfiguracji  początko- 
wej, o nieskończenie  dużych  rozmiarach  (Q  = 0, 

E — 0),  do  stanu  obecnego.  Otrzymujemy  w przy- 
bliżeniu AE  = 5 1041  J.  Jeżeli  przyjmie  się,  że  w trak- 
cie procesu  kurczenia  się  Słońce  promieniowało  rów- 
nie intensywnie  jak  obecnie,  to  otrzymuje  się,  że  osza- 
cowane powyżej  zasoby  energii  grawitacyjnej  mogły 
wystarczyć  zaledwie  na  ok.  40  min  lat.  Zatem  mecha- 
nizm Helmholtza-Kelvina,  jakkolwiek  odgrywa  istot- 
ną rolę  na  pewnych  szczególnych  i krótkotrwałych 
etapach  ewolucji  gwiazd,  nie  może  być  głównym 
źródłem  ich  energii. 

Już  w latach  dwudziestych  obecnego  stulecia  po- 
dejrzewano (m.in.  J.  H.  Jeans),  że  głównym  źródłem 
energii  gwiezdnej  są  reakcje  jądrowe,  połączone  reakcje 
z wydzielaniem  znacznych  ilości  energii,  zgodnie  jądrowe 
z einsteinowską  zależnością  E = mc2.  Datą  przeło- 
mową był  jednak  dopiero  rok  1938,  kiedy  to  H.  A. 

Bethe  wykazał  możliwość  zamiany  wodoru  w hel 
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we  wnętrzach  gwiazd  w tzw.  cyklu  węglowo-azoio- 
wym.  Wreszcie  w 1952  r.  E.  E.  Salpeter  opisał  inny 
cykl  zamiany  wodoru  w hel  (tzw.  cykl  proton-proton) 
reakcja  3a  oraz  zwrócił  uwagę  na  tzw.  reakcję  3a,  polegającą  na 
zamianie  helu  w węgiel.  Wkrótce  potem  rozwinęły 
się  badania  reakcji  jądrowych  we  wnętrzach  gwiazd 
na  różnych  etapach  ich  ewolucji,  a równocześnie 
powstały  teoria  ewolucji  gwiazd  i teoria  powstawania 
pierwiastków  chemicznych  (— ► Powstawanie  pier- 
wiastków chemicznych). 

niedobór  Wydajność  energetyczną  reakcji  jądrowej  określa 
raasy  tzw.  niedobór  masy,  tj.  różnica  mas  jąder  atomowych 
stanowiących  elementy  wejściowe  i produkty  końcowe 
reakcji.  Na  przykład  wynikiem  cyklu  węglowo-azoto- 
wego  lub  cyklu  proton-proton  jest  zamiana  4 proto- 
nów v/  jądro  helu ; niedobór  masy  wynosi  tu : 4*  1,685  • 

- 10“27  — 6,694- 10" 27  = 4,6- 10“ 29  kg,  zaś  odpowiadają- 
ca mu  ilość  energii  jest  równa  w przybliżeniu  4- 10“ 12  J. 
Zamieniając  na  hel  1 gram  materii  wodorowej  otrzy- 
mujemy ok.  6,3*  1011  J.  Proces  zamiany  wodoru  w hel 
ma  zatem  wydajność  energetyczną  mogącą  zapewnić 
świecenie  Słońca  przez  czas  rzędu  3- 1018  s = 1011  lat 
(przy  założeniu,  że  zamianie  wodoru  w hel  ulegnie 
cała  masa  Słońca).  Wydajność  reakcji  z udziałem 
jąder  helu  i jąder  cięższych  jest  znacznie  niższa.  Na 
przykład,  w procesie  3a  wydajność  wynosi  ok. 
6*  IG10  J/g. 

Tempo  zachodzenia  określonej  reakcji  jądrowej  we 
wnętrzu  gwiazdy  zależy  od  lokalnych  wartości  para- 
metrów fizycznych,  głównie  temperatury  i gęstości, 
oraz  składu  chemicznego.  Reakcje  zachodzą  naj- 
szybciej, a energia  wydzielana  jest  najobficiej  w cen- 
tralnych częściach  gwiazdy,  tj.  tam,  gdzie  panuje 
najwyższa  temperatura. 

Sytuacja  przedstawia  się  jednak  odmiennie,  gdy 
wewnętrzne  obszary  gwiazdy  pozbawione  są  już  okre- 
ślonego paliwa  jądrowego:  wtedy  maksimum  zacho- 
dzenia reakcji  przypada  na  warstwę  pośrednią,  sta- 
nowiącą przejście  do  obszarów  zewnętrznych  gwiaz- 
dy, bogatych  w paliwo. 

Reakcje  jądrowe  zachodzące  we  wnętrzu  gwiazdy 
pokrywają  wydatek  energetyczny  gwiazdy  na  pro- 
mieniowanie, dzięki  czemu  zachowana  jest  równowaga 
termiczna.  Spadek  tempa  produkcji  energii,  wywo- 
łany np.  wyczerpywaniem  się  zapasów  paliwa,  wy- 
wołuje zachwianie  równowagi  termicznej,  kurczenie 
się  gwiazdy  prowadzące  do  podwyższenia  tempera- 
tury wewnętrznej  i wzrostu  tempa  produkcji  energii, 
aż  do  odzyskania  równowagi.  Po  całkowitym  wy- 
czerpaniu się  zapasów  paliwa  proces  kurczenia  się 
gwiazdy  może  się  stać  na  krótko  jedynym  znaczącym 
źródłem  energii  oraz  może  — a nawet  musi  — pro- 
wadzić do  wzrostu  temperatury  i gęstości  materii  aż 
do  wartości,  w których  mogą  zachodzić  reakcje 
jądrowe  z udziałem  następnego,  obfitego  paliwa. 
Taki  autoregulujący  mechanizm  umożliwia  gwieździe 
kontrolowanie  jej  zapasów  energetycznych  oraz 
przestawianie  się  z jednego  typu  paliwa  jądrowego  na 
następne. 

utrata  Ważnym  zjawiskiem  związanym  z zaawansowa- 
materii  przez  nymi  stadiami  ewolucji  jest  proces  utraty  materii 

gwiazdy  przez  gwiazdy,  zachodzący  bądź  przez  powolny 
wypływ,  bądź  też  jednorazowe  wyrzucenie  w prze- 
strzeń międzygwiazdową  znacznej  części  masy  całej 
gwiazdy,  jak  np.  w przypadku  gwiazd  supernowych. 
Utrata  materii  przez  gwiazdę  stanowi  zwrot  tej 
materii  do  ośrodka  międzygwiazdowego.  Ponieważ 
przynajmniej  część  wyrzuconej  przez  gwiazdę  ma- 
terii brała  uprzednio  udział  w procesach  jądrowych, 
zatem  skład  chemiczny  zwracanej  do  ośrodka  mię- 
ózygwiazdowego  materii  różni  się  od  pierwotnego 
składu  materii,  z której  powstała  gwiazda.  Oznacza 
to,  że  ubocznym  wynikiem  ewolucji  gwiazd  jest  stałe 
wzbogacanie  materii  międzygwiazdowej  w Galaktyce 
w produkty  wewnątrzgwiezdnych  reakcji  jądrowych. 
Jest  to  jeden  z najważniejszych  mechanizmów  pow- 
stawania pierwiastków  chemicznych  we  Wszechświe- 
cie. 
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Powstawanie  gwiazd 

Proces  powstawania  gwiazd  nie  jest  zjawiskiem  jedno- 
razowym, ale  zachodził  nieprzerwanie  w różnych, 
epokach  istnienia  — > Galaktyki  i zachodzi  obecnie. 

Dowodem  tego  jest  obecność  w Galaktyce  młodych 
gwiazd,  których  wiek  wynosi  ok.  10®  lat,  podczas 
gdy  wiek  Galaktyki  wynosi  ok.  (1—1 ,5)  - 1010  lat. 

Przykładem  młodych  gwiazd  są  tzw.  gwiazdy  typu  O, 
wyróżniające  się  bardzo  dużymi  jasnościami.  Gwiazda 
typu  O,  której  masa  jest  dwudziestokrotnie  większa 
od  masy  Słońca,  wypromieniowywuje  105  razy  więcej 
energii  niż  Słońce;  innymi  słowy,  tempo  zużywania 
zapasów  energii  (w  przeliczeniu  średnio  na  1 gram 
materii)  jest  tu  ok.  5000  razy  większe  niż  w przypadku 
Słońca.  Zatem  — nawet  gdyby  cała  masa  gwiazdy 
mogła  zostać  wykorzystana  jako  paliwo  jądrowe  — 
zapasów  tych  mogłoby  wystarczyć  zaledwie  na  kilka- 
dziesiąt milionów  lat;  z dokładniejszych  rozważań 
wynika,  że  wiek  tych  gwiazd  nie  może  być  większy 
od  podanego  wyżej,  tzn.  rzędu  106  lat.  Niezależnym 
potwierdzeniem  tej  oceny  jest  fakt,  że  gwiazdy  typu  O 
tworzą  w przestrzeni  luźne  zgrupowania — tzw. 
asocjacje  — które  są  niestabilne  dynamicznie:  po  asocjacjo 
upływie  czasu  rzędu  10*-107  lat  muszą  ulec  rozpa-  gwiazd 
dowi,  zaś  wchodzące  w ich  skład  gwiazdy  — ulec 
wymieszaniu  z innymi,  starszymi  gwiazdami  w Galak- 
tyce. Młodymi  gwiazdami  są  także  tzw.  gwiazdy  typu 
T Tauri,  występujące  również  w asocjacjach,  często 
z gwiazdami  typu  O,  a z reguły  — w obszarach  bo- 
gatych w materię  międzygwiazdową. 

Gwiazdy  powstają  z materii  międzygwiazdowej. 

Prawdziwość  tego  stwierdzenia  wynika  z jednej 
strony  z braku  jakichkolwiek  dowodów  na  istnienie 
jakiegoś  innego  „tworzywa  przedgwiazdowego”, 
z drugiej  zaś  — z wielu  faktów  obserwacyjnych.  Oto 
najważniejsze  z nich.  Młode  gwiazdy  występują 
wyłącznie  w obszarach  bogatych  w materię  między- 
gwiazdową (ii.  221,  tabl.  59).  Obserwuje  się  je  zarówno 
w dostępnych  do  obserwacji  częściach  naszej  Galak- 
tyki, jak  też  i w innych  galaktykach;  bogate  w materię 
międzygwiazdową  galaktyki  nieregularne  zawierają 
dużo  młodych  gwiazd,  a ubogie  w materię  między- 
gwiazdową galaktyki  eliptyczne  wyróżniają  się  rów- 
nocześnie brakiem  gwiazd  młodych. 

Materia  międzygwiazdową,  występująca  jako  gaz  materia 
i pył,  wypełnia  przestrzeń  międzygwiazdową  w sposób  m jędzy  - 
niejednorodny,  z wyraźną  tendencją  do  koncentracji  gwiazdowa 
w obłokach.  Masy  obłoków  zawarte  są  w bardzo 
szerokich  granicach,  od  ok.  1 masy  Słońca  (=  1,98  • 

• 1030  kg)  v/  przypadku  najmniejszych,  możliwych  do 
zaobserwowania  kondensacji  materii,  do  KF-104  mas 
Słońca,  w przypadku  największych  tego  typu  obiektów 
w Galaktyce.  Jeszcze  bardziej  zróżnicowane  są  para- 
metry opisujące  fizyczny  stan  materii  w obłokach. 

O ile  średnia  gęstość  materii  międzygwiazdowej 
w pobliżu  płaszczyzny  Galaktyki  (wliczając  w to 
obłoki  i rozrzedzony  ośrodek  między  obłokami) 
wynosi  ok.  10“ 23  g/cm3  (co  w przybliżeniu  odpowiada 
kilku  atomom  wodoru  na  cm3),  to  gęstość  w typowych 
obłokach  równa  jest  ok.  10“ 21  g/cm3,  zaś  w najgę- 
stszych obłokach,  z których  obserwuje  się  m.in. 
promieniowanie  radiowe  rodników  OH,  osiągać 
może  wartość  rzędu  10-14  g/cm3  (co  odpowiada  w przy- 
bliżeniu gęstości  1010  atomów  wodoru  na  cm3).  Śred- 
nia gęstość  materii  we  wnętrzu  przeciętnej  gwiazdy 
w początkowym  etapie  ewolucji  jest  rzędu  1 g/cm3,  co 
oznacza,  że  przejściu  od  średniej  gęstości  typowego 
obłoku  materii  międzygwiazdowej  do  gęstości  we- 
wnątrzgwiezdnej  musi  odpowiadać  zmiana  rozmia- 
rów liniowych  o czynnik  rzędu  10~7. 

Obłok  materii  międzygwiazdowej  może  kurczyć 
się  pod  wpływem  własnego  przyciągania  grawitacyj- 
nego tylko  wtedy,  gdy  jego  parametry  fizyczne  speł- 
niają tzw.  kryterium  Jeansa.  Z kryterium  tego  wynika,  kryterium 
że  masa  obłoku  nie  może  być  mniejsza  od:  Jeansa 

m «=  (K,/|/4^C  )V1/a, 
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gdzie  G — stała  grawitacji,  V8  — prędkość  dźwięku 
w obłoku,  q — gęstość.  Przy  typowych  wartościach 
parametrów  m0  jest  rzędu  setek  lub  nawet  tysięcy 
mas  Słońca;  oznacza  to,  że  tylko  najmasywniejsze 
obłoki  spełniają  kryterium  Jeansa  i tylko  one  mogą 
brać  udział  w procesie  tworzenia  się  gwiazd  oraz  że 
zjawiska  prowadzące  do  powstawania  masywnych 
obłoków  są  pierwszym  ogniwem  procesu  powstawa- 
nia gwiazd. 

Kurczenie  się  obłoku  materii  międzygwiazdowej 
jest  procesem  złożonym,  nie  dającym  się  opisać  za 
pomocą  prostego  modelu.  Wzrost  gęstości  i tempera- 
ratury  sprzyjają  tworzeniu  się  złożonych  rodników 
i cząsteczek;  z tą  fazą  procesu  identyfikuje  się  super- 
gęste  obłoki,  będące  źródłami  emisji  radiowej  rod- 
ników OH  i in.  Wzrost  gęstości  powoduje,  że  lokalne 
zagęszczenia  w obłoku  zaczynają  spełniać  kryterium 
Jeansa,  co  prowadzi  do  rozpadu  pierwotnego  obłoku 
na  wiele  kurczących  się  zgęszczeń,  których  masy  mogą 
już  być  porównywalne  z masami  gwiazd;  zagęszcze- 
nia takie  można  uważać  za  protogwiazdy.  W tym 
stadium  stan  fizyczny  materii  różni  się  znacznie  od  sta- 
nu początkowego,  tj.  takiego,  jaki  panuje  w prze- 
ciętnym obłoku  materii  międzygwiazdowej ; w wyniku 
zgęszczania  się  i ogrzewania  powstają  nie  tylko  czą- 
steczki, ale  także  i pył.  Gdy  na  dalszym  etapie  roz- 
woju jedna  (lub  więcej)  z protogwiazd  staje  się  gorącą 
gw  iazdą  typu  widmowego  O lub  B , ciśnienie  jej  pro- 
mieniowania spowoduje  „wydmuchanie”  pyłu  w prze- 
strzeń międzygwiazdową.  Naszkicowany  tu  mecha- 
nizm może  tłumaczyć  pochodzenie  pyłu  w materii 
międzygwiazdowej. 

Ważnym  czynnikiem  w procesie  powstawania 
gwiazd  jest  występowanie  momentu  obrotowego. 
Z prawa  zachowania  momentu  pędu  wynika,  że  w pro- 
cesie kurczenia  się  pierwotnego  obłoku,  gdy  jego 
rozmiary  zmieniają  się  o czynnik  rzędu  10“ 7 (por. 
wyżej),  nawet  chaotyczne  ruchy  materii  wewnątrz 
obłoku  z prędkościami  rzędu  kilku  cm/s  mogłyby  do- 
prowadzić do  powstania  szybkorotujących  gwiazd; 
istnienie  zaś  bardziej  systematycznego  (choć  nawet 
bardzo  powolnego)  ruchu  obrotowego  obłoku  wy- 
kluczałoby powstanie  jakiejkolwiek  stabilnej  kon- 
figuracji gw'iazdopodobnej,  ze  względu  na  nadmiar 
momentu  obrotowego.  Kurcząca  się  protogwiazda 
może  pozbyć  się  nadmiaru  momentu  obrotowego 
albo  przekazując  go  otaczającej  ją  materii,  albo  po- 
zbywając się  części  własnej  materii.  Pierwszy  z tych 
procesów  może  zachodzić,  gdy  protogwiazda  ma  pole 
magnetyczne,  którego  linie  sił  — „wmrożone”  w ota- 
czający ośrodek  — są  elementem  sprzęgającym  ha- 
mowaną protogwiazdę  i otaczającą  ją  materię. 
W drugim  wypadku,  wyrzucana  jest  ta  część  jej 
materii,  dla  której  siła  odśrodkowa  nie  może  już  być 
równoważona  siłami  grawitacji;  jeżeli  protogwiazda 
już  ma  wyraźną  symetrię  osiową,  to  wyrzucane  są 
najszybciej  obracające  się,  równikowe  części  konfigu- 
racji. W związku  z tym  uważa  się,  iż  „produktem 
ubocznym”  powstawania  gwiazd  są  układy  plane- 
tarne. 

Charakterystyczną  cechą  materii  protogwiazdy  jest 
duża  przezroczystość  dla  promieniowania  podczer- 
wonego (-►  Astronomia  w podczerwieni).  Wydzie- 
lona we  wnętrzu  konfiguracji  energia  jest  więc  niemal 
w całości  wypromieniowywana  na  zewnątrz,  co  spra- 
wia, że  kurczenie  się  konfiguracji  nie  powoduje 
znaczniejszego  wzrostu  temperatury  ani  ciśnienia 
gazu.  Kurczenie  się  ma  więc  charakter  swobodnego 
spadku,  który  może  zostać  zahamowany  dopiero 
przez  wzrost  ciśnienia.  Następuje  to  wtedy,  gdy  w 
ostatniej  fazie  swobodnego  spadku  temperatura  we 
wnętrzu  konfiguracji  osiąga  od  kilku  do  kilkunastu 
tys.  stopni,  rośnie  gwałtownie  stopień  jonizacji  ma- 
terii i jej  nieprzezroczystość,  wzrasta  też  ciśnienie 
osiągając  wartości  od  kilkudziesięciu  do  kilkuset 
barów.  Od  tego  momentu  dalsze  kurczenie  się  będzie 
zachodziło  przy  zachowaniu  równowagi  mechanicz- 
nej : ciśnienie  gazu  w danej  warstwie  musi  równoważyć 


ciężar  warstw  położonych  wyżej.  Można  przyjąć,  że 
w tym  momencie  dotychczasowa  protogwiazda  staje 
się  gwiazdą.  Rozpoczynający  się  w tym  momencie 
wstępny  etap  ewolucji  gwiazdy  nazywa  się  etapem 
kontrakcji  (kurczenia  się)  lub  fazą  przed  ciągiem 
głównym.  Na  początku  tego  etapu  w całej  gwieździe 
występuje  konwekcja,  czyli  mieszanie  się  materii; 
jest  ona  głównym  mechanizmem  transportującym 
energię  z coraz  gorętszego  wnętrza  gwiazdy  na  ze- 
wnątrz. Później  konwekcja  we  wnętrzu  gwiazdy  zani- 
ka i w gwieździe  można  rozróżnić : wnętrze  (w  równo- 
wadze promienistej),  w którym  energia  przenoszona 
jest  wyłącznie  przez  promieniowanie,  oraz  zewnętrzną 
otoczkę,  w której  nadal  panuje  konwekcja. 

Kurczenie  się  gwiazdy  ulega  chwilowemu  zaha- 
mowaniu, gdy  w jej  wnętrzu  osiągnięta  zostaje  tem- 
peratura wystarczająco  wysoka,  aby  mogły  zajść 
reakcje  jądrowe  z udziałem  tzw.  lekkich  pierwiast- 
ków: litu,  berylu  i boru,  a także  ciężkiego  izotopu 
wodoru  — deuteru.  Na  przykład  deuter  ulega  spa- 
laniu w reakcji : 

D2  + H1  - He3+y+5,49  MeV, 

co  następuje  już  w temperaturach  powyżej  0,5  min 
stopni.  Ponieważ  obfitości  tych  pierwiastków  są  zni- 
komo małe,  ich  wypalanie  trwa  krótko  i nie  wpływa 
na  dalszą  ewolucję  gwiazdy. 

Etap  kontrakcji  trwa  — w zależności  od  masy 
gwiazdy  — od  ok.  100  tys.  lat  (dla  gwiazd  najma- 
sywniejszych)  do  kilkudziesięciu  milionów  lat  (dla 
gwiazd  takich  jak  Słońce)  i tylko  dla  najmniej  ma- 
sywnych gwiazd  (rzędu  0,1  masy  Słońca)  może  być 
porównywalny  z wiekiem  Galaktyki  (ok.  (1-1,5)  1010 
lat). 


Stadium  spalania  wodoru  i helu 

Etap  kontrakcji  kończy  się,  gdy  w centralnych  czę- 
ściach gwiazdy  temperatura  osiąga  ok.  10  min  stopni. 
W tym  momencie  rozpoczynają  się  reakcje  jądrowe 
z udziałem  najobfitszego  i najwydatniejszego  paliwa, 
jakim  jest  wodór.  W gwiazdach  o masach  rzędu  1 ma- 
sy Słońca  spalanie  wodoru  zachodzi  w tzw.  cyklu 
protonowym : 

H^H1  - D2+^-rv+l,44  MeV, 

D2-f  H1  He3+ y-f  5,49  MeV, 

He3  4- He3  - He4  4- ^4-^4- 12,85  MeV. 

(W  temperaturach  powyżej  16  min  stopni  cykl  pro- 
tonowy kończy  się  innymi  reakcjami  niż  podana 
powyżej,  ale  i one  prowadzą  do  wyprodukowania 
He4  i wyzwolenia  energii).  W gwiazdach  masywnych, 

0 masach  rzędu  kilku,  lub  więcej,  mas  Słońca,  kon- 
trakcja ustaje  dopiero  w chwili  osiągnięcia  temperatur 
rzędu  20  min  stopni,  w których  wodór  spala  się  w tzw. 
cyklu  węglowo-azotowym : 

C12-f  H1  ->  N13+y -fl,95  MeV, 

N13  ->  C134-<?+  4- v 4- 2,22  MeV, 

C134-H1  ->  N14+y4  7,54  MeV, 

NK4-H1  — 0ls4-y-f  7,35  MeV, 

O15  ->  N154-e+  4- v 4- 2,71  MeV, 

N^-fH1  _ C12 4- He4  4-4,96  MeV. 

Ten  cykl  polega  więc  także  na  zamianie  4 protonów 
na  jądro  helu  oraz  wydzielaniu  energii. 

Moment  zakończenia  się  procesu  kurczenia  i roz- 
poczęcia we  wnętrzu  gwiazdy  reakcji  spalania  wodoru 
określany  jest  umownie  jako  wiek  zero.  Gwiazda 
wieku  zero  jest  jednorodna  chemicznie.  Ma  ona  jas- 
ność i rozmiary  określone  jednoznacznie  jej  masą 

1 składem  chemicznym.  Wyniki  obliczeń  teoretycz- 
nych dotyczących  ewolucji  gwiazd  przedstawia  się  na 
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wykres  H-R  wykresie  jasność  absolutna-temperatura  efektywna, 
którego  obserwacyjnym  odpowiednikiem  jest  wykres 
jasność  absolutna-barwa  (lub  typ  widmowy),  czyli 
tzw.  wykres  Hertzsprunga-Russella  (H-R).  Rysunek 
1 pokazuje  wyniki  obliczeń  ewolucyjnych  dla  gwiazd 
o różnych  masach,  od  0,25  do  15  mas  Słońca.  Punkty 
oznaczone  numerem  1 odpowiadają  gwiazdom  o wie- 
ku zero;  punkty  te  tworzą  tzw.  ciąg  główny  wieku 
zero  na  wykresie  H-R. 

etapy  Początkowe  etapy  ewolucji  prześledzimy  na  przy- 
początkowe  kładzie  gwiazdy  o masie  5 mas  Słońca  (rys.  1 i 2). 
ewolucji  Pierwszy,  najdłuższy  etap  ewolucji  polega  na  spalaniu 
się  wodoru  w centralnych  częściach  gwiazdy.  Z wy- 


Rys.  1.  Zmiany  ewolucyjne  gwiazd  o różnych  masach  przed- 
stawione na  tzw.  wykresie  Hertzsprunga-Russella.  L jest  jasnością 
absolutną  gwiazdy  w jednostkach  Słońca,  Te  temperaturą  po- 
wierzchni gwiazdy.  Numery  l-l  0 oznaczają  kolejne  stadia  ewo- 
lucji. Słońce  znajduje  się  obecnie  w punkcie  2 na  torze  ewolucyj- 
nym gwiazdy  o 1 masie  Słońca 


czas  wlO7  lat 

Rys.  2.  Zmiany  w czasie  struktury  gwiazdy  o masie  5 mas  Słońca. 
Na  osi  pionowej  — masa  w jednostkach  całej  gwiazdy ; Mr/M  = 1 
na  powierzchni  gwiazdy.  Grube,  poprzeczne  kreski  oznaczają 
obszary,  w których  zachodzą  reakcje  jądrowe;  cienkie,  zawiro- 
wane kreski  — obszary  konwekcji;  punkty  — obszary,  w których 
skład  chemiczny  jest  wynikiem  zachodzenia  reakcji  jądrowych 
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jątkiem  gwiazd  o małych  masach,  spalanie  odbywa 
się  w cyklu  węglowc-azotowym,  przy  czym  ilość 
wyzwalanej  energii  jest  tak  duża,  że  jedynym  dosta- 
tecznie wydajnym  sposobem  przekazywania  tej  energii 
na  zewnątrz  jest  gwałtowne  mieszanie  się  (konwekcja) 
materii  w centralnych  częściach  gwiazdy,  tworzących 
tzw.  jądro  konwektywne.  Spalanie  się  wodoru  oraz 
mieszanie  się  materii  sprawia,  że  w całym  obszarze 
jądra  obfitość  wodoru  maleje,  obfitość  zaś  helu 
rośnie.  Gdy  wyczerpują  się  zapasy  paliwa  w jądrze, 
gwiazda  gwałtownie  się  kurczy  (przejście  od  punktu 
2 do  3 na  rys.  I),  dopalają  się  resztki  wodoru  w jądrze 
i zaczyna  się  spalać  wodór  w warstwie  pośredniej,  na 
granicy  pomiędzy  pozbawionym  już  wodoru  jądrem 
a bogatymi  w wodór  warstwami  zewnętrznymi. 
Warstwa  ta  jest  początkowo  dość  gruba,  ale  wkrót- 
ce — wskutek  wypalania  się  wodoru  — jej  wewnętrz- 
ne części  dołączają  się  do  bezwodorowego  jądra. 
Wyprodukowanie  dostatecznych  ilości  energii  w cien- 
kiej warstwie  wymaga  odpowiednio  wysokiej  tempe- 
ratury; wzrost  temperatury  pochodzi  stąd,  że  we- 
wnętrzne części  gwiazdy  kurczą  się,  podczas  gdy 
równocześnie  warstwy  zewnętrzne  — rozszerzają  się. 
Przejściu  od  punktu  4 do  punktu  5 (na  rys.  1)  odpo- 
wiada przemiana  gwiazdy  ciągu  głównego  w czerwo- 
nego olbrzyma  — gwiazdę  o ok.  dziesięciokrotnie 
większych  rozmiarach  i 3-4-krotnie  niższej  tempera- 
turze efektywnej.  Na  tym  etapie  w zewnętrznych 
obszarach  gwiazdy  rozpoczyna  się  mieszanie  materii  — 
tworzy  się  rozległa  tzw.  zewnętrzna  warstwa  kon- 
wektywna.  Jest  ona  charakterystyczną  cechą  wszy- 
stkich chłodnych  gwiazd,  a zwłaszcza  olbrzymów 
i nadolbrzymów.  Ilekroć  gwiazda,  w trakcie  ewolucji, 
staje  się  olbrzymem,  w jej  zewnętrznych  warstwach 
pojawia  się  natychmiast  konwekcja.  W niektórych 
wypadkach  konwekcja  przenika  na  tyle  głęboko, 
że  może  spowodować  wydostanie  się  na  powierzchnię 
gwiazdy  produktów  reakcji  jądrowych.  W stadium 
czerwonego  olbrzyma  temperatura  centralnych  części 
gwiazdy  osiąga  wartość  rzędu  100  min  stopni.  Wtedy 
rozpoczyna  się  proces  spalania  helu  w węgiel  w re- 
Blccj'  3cc:  3He,  ^ c,2+7  3 MeV 

(Na  rys.  1 odpowiada  temu  punkt  6).  Od  tej  chwili 
w gwieździe  istnieją  dwa  źródła  energii:  centralne  — 
helowe,  i warstwowe  — wodorowe.  Spalanie  helu 
odbywa  się  podobnie  jak  spalanie  wodoru.  Początko- 
wo zachodzi  ono  w centralnym  jądrze  konwektywnym, 
w którym  maleje  obfitość  helu,  a wzrasta  obfitość 
węgla.  Wkrótce  (rys.  2)  tworzy  się  jądro  węglowe 
(pozbawione  zarówno  wodoru,  jak  i helu),  na  gra- 
nicy którego  hel  spala  się  w źródle  warstwowym. 
Tej  fazie  odpowiada  punkt  10  na  rys.  1.  Zmianom 
we  wnętrzu  gwiazdy  od  momentu  zapalenia  się  helu 
do  tworzenia  jądra  węglowego  towarzyszą  zmiany 
struktury  warstw  zewnętrznych.  Rozmiary  gwiazdy 
ulegają  najpierw  zmniejszeniu,  a potem  ponownemu 
zwiększeniu,  tak  że  na  wykresie  H-R  gwiazda  zatacza 
charakterystyczne  pętle  (rys.  1).  W tym  stadium 
gwiazda  przechodzi  kilkakrotnie  przez  pas  niesta- 
bilności pulsacyjnej  (->  Gwiazdy  zmienne  pulsujące) 
i staje  się  wtedy  gwiazdą  zmienną  — cefeidą. 

Dla  gwiazd  o różnych  masach  różne  jest  przede 
wszystkim  tempo  procesów  ewolucyjnych.  Wynika 
to  z prostych  rozważań  dotyczących  bilansu  energe- 
tycznego gwiazdy.  Tempo  wypromieniowywania 
energii,  czyli  jasność  absolutna  £,  jest  silnie  zależna 
od  masy  m gwiazdy;  w przybliżeniu  L = const-w”, 
gdzie  — przykładowo  — dla  mas  rzędu  5 mas  Słoń- 
ca n = 3.  Zapasy  paliwa  są  oczywiście  proporcjonalne 
do  masy  gwiazdy.  A zatem  tempo  zużywania  paliwa, 
czyli  tempo  ewolucji  jest  w przybliżeniu  dane  wyra- 
żeniem o postaci:  const-/nn~1,  tzn.  zależy  silnie  od 
masy  gwiazdy.  Poniższa  tabela  podaje  czasy  ewolucji 
pomiędzy  poszczególnymi  punktami  na  wykresie 
H-R  dla  kilku  wybranych  mas. 

Druga  ważna  różnica  między  przebiegiem  ewolucji 
gwiazd  o różnych  masach  wiąże  się  z występowaniem 
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konwek- 
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cefeidy 
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ewolucji 
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zwyrodnienie 

elektronów 


błysk 
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Tempo  ewolucji  gwiazd  o różnych  masach  (masy  gwiazd 
podane  są  w jednostkach  masy  Słońca,  czas  — w jednost- 
kach 107  lat) 


Punkty 

Masa 

9 

5 | 

j 2,25 

1,25 

1-2 

2,144 

6,547 

46,02 

280,3 

2-3 

0,060 

0,217 

1,647 

18,24 

3-4 

0,009 

0,137 

3,696 

104,5 

4-5 

0,015 

0,075 

1,310 

14,63 

5-6 

0,006 

0,049 

3,829 

40,0 

6-7 

0,049 

0,605 

7-8 

0,010 

0,102 

8-9 

0,328 

0,900 

9-10 

0,016 

0,093 

różnic  gęstości  materii  i wynikającą  stąd  odmienno- 
ścią równania  stanu.  We  wnętrzu  typowej  gwiazdy 
ciągu  głównego,  takiej  jak  np.  Słońce,  materia  spełnia 
równanie  stanu  gazów  doskonałych,  które  przestaje 
jednak  obowiązywać  w warunkach  dużej  gęstości 
materii  (przykładowo:  powyżej  100  g/cm2  przy  tem- 
peraturze ok.  10®  K,  powyżej  10®  g/cm*  przy  tempera- 
turze ok.  10*  K itd).  Powodem  tego  jest  tzw.  zwyrod- 
nienie elektronów  wchodzących  w skład  materii 
gwiezdnej.  Zgodnie  z zakazem  Pauliego,  zwyrodniałe 
elektrony  mają  (średnio)  większe  prędkości  niżby  to 
wynikało  z panującej  w materii  temperatury.  Ciśnie- 
nie elektronów  jest  znacznie  większe  od  ciśnienia 
jonów  i ono  określa  ciśnienie  gazu.  Równanie  stanu 
takiej  materii  wiąże  ze  sobą  tylko  gęstość  i ciśnienie, 
nie  zawiera  zaś  temperatury;  np.  gdy  gęstość  wynosi 
poniżej  107  g/cm*  mamy  p ~ g5/3,  gdy  zaś  powyżej  — 
p ~ qW.  W stadium  ciągu  głównego  efekty  zwyrod- 
nienia są  istotne  tylko  w wypadku  gwiazd  o skrajnie 
małych  masach,  poniżej  0,5  masy  Słońca.  W trakcie 
ewolucji,  gdy  wskutek  kurczenia  się  gwiazdy  rośnie 
w jej  wnętrzu  zarówno  gęstość,  jak  i temperatura, 
może  w pewnym  momencie  dojść  do  zwyrodnienia 
(elektronów).  W gwiazdach  o masach  mniejszych  od 
ok.  2 mas  Słońca  następuje  to  już  wkrótce  po  wypa- 
leniu się  wodoru  w centralnych  częściach  gwiazdy. 
Dalsze  kurczenie  się  bczwodorowego  jądra,  konieczne 
dla  uzyskania  odpowiednio  wysokiej  temperatury 
w warstwie  spalania  wodoru,  powoduje  dalszy  wzrost 
gęstości  i „pogłębianie”  się  zwyrodnienia.  Rośnie 
jednak  także  temperatura  tego  zwyrodniałego,  bez- 
wodorowego  jądra.  W pewnym  momencie  zostaje 
osiągnięta  temperatura  wystarczająca  do  zapalenia 
się  helu.  I tu  zjawisko  przebiega  zupełnie  inaczej  niż 
w gwiazdach  masywnych,  w których  wnętrzach 
elektrony  nie  są  zwyrodniałe.  Gdy  materia  spełnia 
równanie  stanu  gazów  doskonałych,  jej  ogrzanie 
wskutek  pojawienia  się  nowych  źródeł  energii  powo- 
duje wzrost  ciśnienia  i natychmiastowe  rozkurczenie 
się  konfiguracji,  a w konsekwencji  spadek  gęstości 
i temperatury.  Ustala  się  szybko  stan  równowagi  z 
uwzględnieniem  nowych  źródeł  energii.  Gdy  materia 
składa  się  m.in.  ze  zwyrodniałych  elektronów,  wzrost 
temperatury  nie  wywołuje  rozkurczenia  się  konfigu- 
racji, rosnąca  temperatura  powoduje  natomiast 
gwałtowny  wzrost  wydajności  reakcji  jądrowych 
i trwa  to  dopóty,  dopóki  temperatura  nie  osiągnie 
wartości,  przy  której  (przy  danej  gęstości)  elektrony 
przestają  być  zwyrodniałe;  wtedy  dopiero  włącza  się 
samoregulujący  mechanizm  opisany  powyżej  i dalszy 
przebieg  reakcji  jądrowych  ma  charakter  kontrolo- 
wany. Zapalenie  się  helu  w gwiazdach  o masach 
poniżej  ok.  2 mas  Słońca  ma  więc  przebieg  gwałtowny ; 
nosi  ono  nazwę  błysku  helowego. 


Późne  stadia  ewolucji 

Po  wypaleniu  się  helu  w centralnych  częściach 
gwiazdy,  jej  strukturę  można  opisać  następująco: 
We  wnętrzu  gwiazdy  istnieje  jądro  węglowe,  o stale 
rosnącej  masie;  w jądrze  tym,  wskutek  wcześniejszego 


zachodzenia  reakcji  jądrowych,  występuje  także  zna- 
czna obfitość  tlenu,  stąd  nazwa  — jądro  węglowo-tle- 
nowe.  Energia  produkowana  jest  w dwu  warstwach, 
w których  pali  się  wodór  i hel,  a które  w miarę  zuży- 
wania paliwa  przemieszczają  się  na  zewnątrz.  W tym 
stadium  jasność  gwiazdy  zależy  niemal  wyłącznie 
od  masy  zawartej  w węglowo-tlenowym  jądrze: 

UL © = 59250  (A/WA/®  -0,522), 

gdzie  L/L®  — jasność  w jednostkach  jasności  Słoń- 
ca, A/jądra/ A/®  — masa  jądra  w jednostkach  słonecz- 
nych. W gwiazdach  o masach  mniejszych  od  8 mas 
Słońca  z biegiem  czasu  (tj.  wskutek  wzrostu  gęstości) 
w węglowo-tlenowym  jądrze  następuje  zwyrodnienie 
elektronów,  tak  jak  w przypadku  helowych  jąder 
gwiazd  o małych  masach. 

Na  tym  etapie  ewolucji  gwiazda,  niezależnie  od 
jej  masy,  jest  chłodnym  olbrzymem  lub  nadolbrzy- 
mem.  Zarówno  dane  obserwacyjne,  jak  i rozważania 
teoretyczne  dotyczące  stabilności  takich  gwiazd 
wskazują,  że  na  tym  etapie  ważnym  czynnikiem 
jest  utrata  materii  przez  gwiazdę. 

Obserwacje  dostarczają  wielu  przykładów  utraty 
materii  przez  gwiazdy  znajdujące  się  na  zaawansowa- 
nych etapach  ewolucji.  Mgławice  planetarne  (tabl.  59, 
il.  222)  są  szczególnym  przykładem  tego  zjawiska, 
ponieważ  wyrzucona  przez  gwiazdę  otoczka  gazowa 
świeci  na  ogół  bardzo  silnie,  co  pozwala  na  szczegóło- 
we badanie  jej  struktury.  Gwiazdy  zmienne  długo- 
okresowe typu  Mira  tracą  materię  w tempie  10“*  mas 
Słońca  na  rok.  Tak  szybka  utrata  materii  jest  cha- 
rakterystyczna dla  wszystkich  olbrzymów  i nadolbrzy- 
mów  późnych  typów  widmowych. 

Dalszy  przebieg  ewolucji  gwiazdy  zależy  zatem 
od  rozmiarów  i parametrów  fizycznych  jądra  węglo- 
wo-tlenowego oraz  od  tempa  utraty  materii.  Jakkol- 
wiek szczegóły  opisu  pozostają  jeszcze  niepewne,  to 
wyodrębnić  można  trzy  typy  ewolucji,  w zależności 
od  początkowej  masy  gwiazdy. 

Gwiazdy  o masach  małych,  tj.  mniejszych  od  ok. 
1,4  masy  Słońca  , nigdy  nie  osiągają  stanu,  w którym 
temperatura  jądra  węglowo-tlenowego  byłaby  wy- 
starczająco duża  do  zachodzenia  reakcji  spalania 
węgla.  Końcowe  etapy  ewolucji  takich  obiektów 
polegają  więc  na  przesuwaniu  się  ku  powierzchni 
i stopniowym  wygasaniu  warstw  spalania  wodoru 
i helu.  Równocześnie  wskutek  niestabilności  dyna- 
micznej warstw  zewnętrznych  ulegają  one  wyrzuce- 
niu, najprawdopodobniej  w postaci  mgławicy  pla- 
netarnej. Gwiazda  kończy  ewolucję  jako  stygnący 
biały  karzeł.  Podobny  przebieg  ma  ewolucja  gwiazd 
o początkowych  masach  zawartych  w przedziale 
od  1,4  do  ok.  3 mas  Słońca,  w przypadku  których 
następuje  utrata  znacznej  części  masy  początkowej, 
tak  że  temperatura  jądra  węglowo-tlenowego  nie 
osiąga  wartości  krytycznej  „zapłonu”  węgla  oraz 
końcowa  masa  gwiazdy  jest  mniejsza  od  1,4  masy 
Słońca. 

Białe  karły,  będące  jednym  z możliwych  produktów 
końcowych  ewolucji  gwiazd,  mają  gęstości  materii 
w granicach  10*-10®  g/cm3.  W tych  gęstościach  na- 
stępuje zwyrodnienie  elektronów  i obowiązuje  rów- 
nanie stanu  zwyrodniałego  gazu  elektronowego 
(por.  wyżej).  Gwiazda  zbudowana  z takiej  materii 
może  tworzyć  konfigurację  stabilną  jedynie  wtedy, 
gdy  jej  masa  jest  mniejsza  od  pewnej  wartości  kry- 
tycznej, będącej  funkcją  składu  chemicznego.  Jeśli 
materia  jest  pozbawiona  wodoru,  to  wartość  krytycz- 
na nosi  nazwę  granicy  Chandrasekhara  i wynosi  ok. 
1,4  masy  Słońca.  Istnienie  tej  granicy  oznacza,  że 
gwiazda  mająca  zakończyć  swą  ewolucję  jako  biały 
karzeł  musi  — przynajmniej  w końcowym  stadium 
ewolucji  — mieć  masę  mniejszą  od  granicy  Chandra- 
sekhara. 

Gwiazdy  o masach  pośrednich,  tj.  zawartych  w gra- 
nicach od  ok.  1,4  do  ok.  8 mas  Słońca,  ewoluują  wg 
podobnego  schematu.  Początkowo  energia  produ- 
kowana jest  w dwu  warstwach  spalających  wodór 
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i hel,  przy  równoczesnym  powiększaniu  się  masy  ją- 
dra węglowo-tlenowego  (rys.  3).  W jądrze  tym  za- 
czynają się  pojawiać  neutrina  powstające  w proce- 
sach zachodzących  dzięki  istnieniu  uniwersalnych 
oddziaływań  Fermiego  (np.  tzw.  fotoneutrina  pow- 


warsiwa  spalania  wodoru 


spalania  helu 


Rys.  3.  Schemat  struktury  gwiazdy  o masie  mniejszej  od  ok.  8 mas 
Słońca,  przed  zapaleniem  się  węgla  w jądrze 


stające  w procesie:  y-he~  — ► e~+v-\-v).  Neutrina  te 
wynoszą  na  zewnątrz  energię  i powodują  chłodzenie 
się  jądra.  Wskutek  kurczenia  się  jądra,  w warstwie, 
w której  spala  się  hel,  utrzymuje  się  wysoka  tempera- 
tura i gęstość,  co  prowadzi  do  zwyrodnienia  elektro- 
nów. Gwiazdy  z przedziału  mas  od  ok.  3 do  ok.  8 mas 
Słońca  ewoluują  podobnie,  zmierzając  do  konfigu- 
racji, w której  jądro  węglowo-tlenowe  ma  masę  rów- 
ną ok.  1,4  masy  Słońca,  zaś  gęstość  i temperatura 
centralna  są  równe  — odpowiednio  — ok.  2 -10®  g/cm3 
i ok.  3 TO8  K.  W tych  warunkach  następuje  zapalenie 
się  węgla,  przy  czym  — ze  względu  na  zwyrodnienie 

— zjawisko  to  ma  charakter  gwałtowny,  jeszcze  gwał- 
towniejszy niż  w przypadku  błysku  helowego.  Proces 

błysk  zapalenia  się  węgla  prowadziłby  do  rozerwania  całej 
węglowy  gwiazdy,  gdyby  nie  działały  jakieś  dodatkowe  pro- 
cesy chłodzenia.  Ilość  wyzwalanej  energii  oraz  czę- 
stość zachodzenia  takich  zjawisk  w Galaktyce  są 
zgodne  z danymi  obserwacyjnymi  odnoszącymi  się 
do  gwiazd  supernowych.  Z drugiej  strony  wiadomo 
jednak,  że  pozostałościami  po  wybuchach  superno- 
wych są  gwiazdy  neutronowe,  co  nie  pozwala  na 
przyjęcie  modelu,  w którym  rozerwaniu  ulega  cała 
konfiguracja.  Równocześnie  wiadomo,  że  w cyklu 
reakcji  zapoczątkowywanych  zapaleniem  się  węgla 
produkowane  są  znaczne  ilości  żelaza;  gdyby  wszy- 
stkie gwiazdy  o masach  od  3 do  8 mas  Słońca  ulegały 

— na  tym  etapie  ewolucji  — całkowitemu  rozpyleniu 


Ry*.  4.  Schemat  struktury  gwiazdy  o masie  większej  od  ok.  8 mas 
Słońca  na  zaawansowanym  etapie  ewolucji 


w przestrzeń  międzygwiazdową,  to  obfitość  żelaza 
w materii  międzygwiazdowej  musiałaby  być  wielo- 
krotnie wyższa  od  obserwowanej.  Wyjście  z tego  dy- 


lematu musi  polegać  na  poszukiwaniu  odpowiedniego 
mechanizmu  chłodzenia,  łagodzącego  przebieg  błysku 
węglowego.  Sądzi  się,  że  chłodzenie  jest  konsekwencją 
tzw.  procesów  Urca,  polegających  na  tym,  że  w gazie 
zawierającym  zwyrodniałe  elektrony,  przy  określonej 
temperaturze  może  ustalić  się  równowaga  między 
dwoma  procesami : rozpadem  /?,  polegającym  na  prze- 
mianie jądra  o ładunku  Z w jądro  o ładunku  Z-f  1 
przy  równoczesnej  emisji  elektronu  i antyneutrina, 
oraz  odwrotnym  rozpadem  /?,  polegającym  na  wy- 
chwycie elektronu  przez  jądro  o ładunku  Z+l  i jego 
przemianie  w jądro  o ładunku  Z przy  równoczesnej 
emisji  neutrina.  Zatem  więc  produkowane  w takich 
procesach  neutrina  i antyneutrina,  unosząc  energię  na 
zewnątrz,  mogą  skutecznie  chłodzić  jądro  węglowo- 
tlenowe. 

Gdy  występuje  chłodzenie,  błysk  węglowy  nieko- 
niecznie powoduje  rozerwanie  całej  konfiguracji. 
Jeżeli  chłodzenie  jest  dostatecznie  wydajne,  to  gę- 
stość centralna  może  osiągnąć  wartość  rzędu  1010 
g/cm3,  przy  której  wewnętrzne  obszary  jądra  stają  się 
dynamicznie  niestabilne.  Wybuch  supernowej  może 
zatem  polegać  na  wyzwoleniu  znacznych  ilości  ener- 
gii i wyrzuceniu  w przestrzeń  warstw  zewnętrznych 
gwiazdy,  w tym  zewnętrznych  obszarów  jądra,  ale 
przy  równoczesnym  „zapadnięciu”  się  wewnętrznych 
obszarów  jądra.  Produktem  wybuchu  jest  więc  roz- 
szerzająca się  otoczka  gazowa  oraz  gwiazda  neutro- 
nowa (-►  Pulsary). 

Gwiazdy  masywne,  tj.  o masach  większych  od  ok.  8 
mas  Słońca,  odznaczają  się  na  tyle  wysokimi  tempera- 
turami centralnymi,  a równocześnie  względnie  ma- 
łymi gęstościami  centralnymi,  że  zapalenie  się  węgla 
— przy  braku  zwyrodnienia  — ma  przebieg  łagodny. 
Po  zapaleniu  się  i wypaleniu  węgla  następuje  zapala- 
nie się  i wypalanie  następnych  pierwiastków.  Ewolu- 
cja prowadzi  do  konfiguracji,  której  jądro  jest  złożone 
z żelaza,  zaś  kolejne  koncentryczne  warstwy  — z co- 
raz lżejszych  pierwiastków,  aż  do  bogatej  w wodór 
warstwy  powierzchniowej  (rys.  4).  Przebieg  ewolucji 
zależy  od  procesów  mieszania  materii  we  wnętrzu 
gwiazdy  oraz  procesów  utraty  materii  z warstw  zew- 
nętrznych. Jeżeli  chodzi  o ewolucję  żelaznego  jądra, 
to  oprócz  wzrostu  masy  jądra  zachodzi  także  wzrost 
jego  temperatury  centralnej  i gęstości.  Ten  etap  ewo- 
lucji kończy  się  w momencie  osiągnięcia  temperatury 
krytycznej,  w której  jądra  żelaza  ulegają  rozpadowi 
na  jądra  helu  i neutrony.  W tym  momencie  jądro 
gwiazdy  się  zapada  i przekształca  bądź  w gwiazdę 
neutronową,  bądź  w czarną  dziurę  (— ► Czarne  dziury 
i zapadanie  grawitacyjne).  Otoczka  gwiazdy  ulega 
wyrzuceniu  na  zewnątrz.  Ponieważ  jednak  większa 
część  materii  z warstw  zewnętrznych  uległa  wyrzu- 
ceniu już  wcześniej,  przeto  opisany  tu  proces  koń- 
cowy nie  może  być  utożsamiany  z wybuchem 
supernowej. 

Ewolucja  gwiazd  — składników  układów  podwój- 
nych przebiega  identycznie  jak  gwiazd  pojedynczych 
tylko  do  momentu,  w którym  rozpoczyna  się  wymiana 
materii  między  składnikami.  Przyczyna  tego  zjawiska 
jest  następująca.  Kształt  gwiazdy  spełniającej  waru- 
nek równowagi  hydrostatycznej  opisują  powierzchnie 
jednakowego  potencjału,  które  dla  gwiazdy  pojedyn- 
czej są  koncentrycznymi  sferami;  jedna  z nich  określa 
powierzchnię  gwiazdy.  Gdy  gwiazda  wchodzi  w skład 
układu  podwójnego,  powierzchnie  jednakowego  po- 
tencjału określane  są  siłami  przyciągania  grawitacyj- 
nego obydwu  składników  oraz  siłą  odśrodkową. 
Szczególne  znaczenie  ma  tzw.  granica  Roche’a,  która 
jest  największą,  nie  wspólną  dla  obydwu  gwiazd,  po- 
wierzchnią jednakowego  potencjału  (rys.  5a).  Gwia- 
zda, której  rozmiary  są  mniejsze  od  granicy  Rocheła, 
różni  się  nieznacznie  — pod  względem  budowy  i ewo- 
lucji— od  gwiazdy  pojedynczej.  Gdy  gwiazda  wypeł- 
ni granicę  Roche’a  (rys.  5b)  następuje  wypływ  materii 
przez  tzw.  wewnętrzny  punkt  Lagrange’a  L,  (rys.  5a) 
i jej  przepływ  do  drugiego  składnika.  Proces  ten  trwa 
od  104  do  10*  lat.  W tej  fazie  gwiazda  tracąca  materię 


procesy 

Urca 


gwiazdy 

neutronowe 


jądro 

żelazne 


czarne 

dziury 


układy 

podwójne 


granica 

Roche'a 


934 


1 


2 


a) 


Rys.  5.  Schemat  wczesnych 
stadiów  ewolucji  ciasnego  uk- 
ładu podwójnego  (a-c).  Linią 
przerywaną  zaznaczona  jest 
granica  Roche’a.  Strzałki  na 
rys.  b)  i c)  oznaczają  przepływ 
materii  z gwiazdy  1 do  gwiazdy 
2.  Rys.  d — ciasny  układ  po- 
dwójny typu  nowej.  Składnik 
2 jest  białym  karłem  i wokół 
niego  wiruje  gazowy  dysk. 
W przypadku  układów  będą- 
cych źródłami  promieniowa- 
nia rentgenowskiego  składnik 
2 jest  gwiazdą  neutronową 


przekazuje  drugiej  gwieździe  znaczną  część  swojej 
pierwotnej  masy.  Po  zakończeniu  tego  procesu  (rys. 
5c)  gwiazda  wypełniająca  powierzchnię  Roche’a  jest 
mniej  masywna  od  drugiej  gwiazdy  układu  oraz  różni 


się  od  jakiejkolwiek  gwiazdy  pojedynczej  na  dowol- 
nym etapie  ewolucji  zarówno  budową  wewnętrzną 
(występowanie  obszarów  o różnym  składzie  chemicz- 
nym) jak  i parametrami  zewnętrznymi  (jasność,  tem- 
peratura efektywna).  Ścisły,  modelowy  opis  przebiegu 
naszkicowanego  tu  procesu  pozwala  na  wyjaśnienie 
obserwowanych  własności  układów  podwójnych 
typu  Algola  oraz  pochodzenia  ewolucyjnego  tych 
układów. 

Dalsze  etapy  ewolucji  układów  podwójnych  nie 
zostały  dotąd  dokładnie  zbadane.  Rozważania  jako- 
ściowe dotyczące  przebiegu  ewolucji  obydwu  skład- 
ników oraz  związanych  z tym  procesów  wymiany 
i utraty  materii  oraz  momentu  pędu  przez  układ 
pozwalają  na  wytłumaczenie  pochodzenia  układów 
podwójnych,  w których  jeden  ze  składników  osiągnął 
końcowy  stan  ewolucji  i jest  białym  karłem  lub 
gwiazdą  neutronową.  Drugi  składnik  znajduje  się 
nadal  na  wcześniejszym  etapie  ewolucji,  wypełnia 
granicę  Rocheła  i przekazuje  materię  składnikowi 
pierwszemu.  Rozmiary  białego  karła  lub  gwiazdy 
neutronowej  są  bardzo  małe  w porównaniu  z roz- 
miarami układu,  wskutek  czego  struga  materii,  mają- 
ca znaczny  moment  pędu  względem  gwiazdy  docelo- 
wej, nie  spada  bezpośrednio  na  jej  powierzchnię,  ale 
musi  utworzyć  wokół  niej  wirujący  dysk  (rys.  5d). 
Tego  typu  gazowe  dyski  są  charakterystyczną  cechą 
układów  podwójnych  typu  nowych  oraz  układów  bę- 
dących źródłami  promieniowania  rentgenowskiego 
(-►  Astronomia  promieni  X i y). 

I.  Iben  Stcllar  evołution  within  and  off  the  mairt  sequence , Ann. 
Rev.  of  Astr.  and  Astrophys.  5,  571  (1967);  I.  Iben  Post  main 
sequence  evolution  of  single  stars,  Ann.  Rev.  of  Astr.  and  Astrophys. 
12,  125(1974);  B.  Paczyński  Późne  stadia  ewolucji  gwiazd.  Post. 
Astr.21,  9 (1973);  R.  J.TAYLER(ed.) artykuły  w tomie:  Late  Stages 
o/Stellar;  Evo!ution,l.  A.U.  Symposium.No.  66,  1974. 
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Galaktyki 

Michał  Różyczka 

Wyspy  Wszechświata 

Nazwa  „galaktyka”,  wywodząca  się  od  gr.  wyrazu 
gala  (mleko),  wprowadzona  została  w II  połowie 
modę?  XVIII  w.  przez  Wiliama  Herschela.  Z obserwacji 
galaktyki  Herschela  wynikało,  że  wszystkie  gwiazdy  (wśród 
Herschela  nich  i Słońce)  rozmieszczone  są  w skończonej  obję- 
tości i tworzą  w otaczającej  pustce  „wyspę”  materii. 
Oglądane  z Ziemi,  czyli  z wnętrza  wyspy,  skupiają 
się  na  sferze  niebieskiej  w świecącym  pasie  Drogi 
Mlecznej. 

W końcu  XVIII  w.  obserwacje  astronomiczne 
sprowadzały  się  na  ogół  do  pomiarów  pozycji  ciał 
należących  do  Układu  Słonecznego.  Szczególnie  chęt- 
nie obserwowano  komety,  które  początkujący  obser- 
mglawice  watorzy  często  mylili  z mgławicami,  obiektami  — jak 
komety  — rozmytymi,  ale  nie  zmieniającymi  poło- 
żenia wśród  gwiazd.  By  zmniejszyć  prawdopodo- 
bieństwo popełniania  takich  pomyłek,  sporządzono 
w 1784  r.  pierwszy  katalog  mgławic,  który  ma  obecnie 
znaczenie  wyłącznie  historyczne.  Wprowadzone  w 
nim  oznaczenia  są  jednak  powszechnie  używane  i tak 
np.  widoczna  gołym  okiem  w gwiazdozbiorze  Herku- 
lesa gromada  kulista  znana  jest  jako  M 13,  zaś  po- 
zostałość po  wybuchu  supernowej  w gwiazdozbiorze 
Byka  — jako  M 1 . 

Nawet  po  ukazaniu  się  katalogu  mgławice  nie  zys- 
kały popularności  wśród  astronomów,  zajęli  się  nimi 
natomiast  filozofowie.  Według  Kanta  wszystkie  mgła- 
wice były  Wyspami  Wszechświata  — tj.  niezwykle 
odległymi  zbiorowiskami  gwiazd  rozdzielonymi  pustą 
przestrzenią.  Wyprzedzając  Herschela  Kant  twierdził, 
iż  Słońce  jest  jedną  z gwiazd  Drogi  Mlecznej.  Każda 
mgławica  miała  według  niego  składać  się  z tylu 


gwiazd,  ile  jest  skupionych  w Drodze  Mlecznej  i każ- 
da powinna  dać  się  rozdzielić  na  gwiazdy  za  pomocą 
odpowiednio  dużego  teleskopu.  Hipoteza  Kanta  cze- 
kała na  pełną  weryfikację  obserwacyjną  prawie  150 
lat.  Tymczasem  W.  Herschel,  który  dysponował  naj- 
potężniejszym wówczas  teleskopem,  stwierdził,  iż  nie- 
które z mgławic  na  pewno  nie  są  zbiorowiskami 
gwiazd.  W innych,  które  udawało  mu  się  rozdzielać 
na  gwiazdy,  znajdował  tyle  zaledwie  świecących 
punktów,  ile  zawiera  drobna  cząstka  Drogi  Mlecznej. 
Przez  cały  XIX  w.  galaktyka  pozostała  jedyną  Wyspą 
Wszechświata,  której  istnienie  uznawano  za  dowie- 
dzione. 

Nowe  jakościowo  dane  o mgławicach  zebrano  do- 
piero kilkadziesiąt  lat  po  śmierci  Herschela.  W 1845  r. 
Wiliam  Parsons  (lord  Rossę)  zaobserwował  w paru 
mgławicach  strukturę  spiralną.  Czternaście  lat  później 
Wiliam  Huggins  rozpoczął  pierwsze  obserwacje  spek- 
troskopowe ciał  niebieskich.  Najciekawsze  wyniki 
otrzymano  z obserwacji  mgławic  nie  dających  się 
rozdzielić  na  gwiazdy.  Znaleziono  wśród  nich  obiekty 
o widmach  niemal  identycznych  z widmami  zwykłych 
gwiazd.  Zgodnie  z jedną  z postawionych  hipotez  — 
widmo  takiej  mgławicy  miało  powstawać  w wyniku 
nakładania  się  dużej  liczby  widm  bardzo  dalekich 
gwiazd.  Zdobyto  pierwszy  argument  przemawiający 
za  tym,  iż  niektóre  z wgławic  mogą  być  Wyspami 
Wszechświata.  Szczególną  uwagę  zwrócono  na  odkry- 
te przez  lorda  Rossę  wgławice  spiralne,  które  mając 
widma  podobne  do  widm  gwiazd  nie  dawały  się  roz- 
dzielać na  gwiazdy,  mimo  budowania  coraz  większych 
teleskopów. 

W końcu  lat  siedemdziesiątych  ubiegłego  wieku 
rozpowszechniły  się  obserwacje  fotograficzne.  Wyko- 
nano na  ich  podstawie  obszerne  katalogi  mgławic 
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(NGC,  TC),  a także  kontynuowano  badania  spektro- 
skopowe. Porównując  zdjęcia  wykonane  w dużych 
odstępach  czasu  opisano  ruchy  gwiazd  w galaktyce. 
Na  początku  XX  w.  rozpoczęto  badania  rozmieszcze- 
nia przestrzennego  gwiazd,  możliwe  do  przeprowa- 
dzenia dzięki  nowym  metodom  wyznaczania  odleg- 
łości. W miarę  napływu  informacji  zmieniały  się  wy- 
obrażenia o kształcie  i rozmiarach  galaktyki.  Stwier- 
dzono, że  nazywane  niegdyś  mgławicami  gromady 
kuliste  i otwarte,  które  rozdzielił  na  gwiazdy  już 
Hersche!,  znajdują  się  w odległościach  nie  większych 
niż  odległości  pojedynczych  gwiazd.  W 1918  r.  Har- 
modai  Iow  Shapley  przedstawił  kolejny  model  galaktyki, 
galaktyki  sporządzony  na  podstawie  badań  rozmieszczenia 
Shapleya  przestrzennego  gromad  kulistych.  Wyznaczona  przez 
Shapleya  wartość  średnicy  galaktyki  była  dziesięcio- 
krotnie większa  od  przyjmowanych  poprzednio, 
a Słońce,  które  we  wszystkich  dotychczasowych  mo- 
delach umieszczano  w centrum  galaktyki,  znalazło  się 
prawie  na  jej  skraju.  Próby  przeniesienia  wyobrażeń 
o galaktyce  na  mgławice  skończyły  się  niepowodze- 
niem. Kilka  lat  przed  ukazaniem  się  pracy  Shapleya 
wykonano  w jednym  z obserwatoriów  serię  zdjęć  paru 
mgławic  spiralnych.  Popełniając  wykryty  znacznie 
później  błąd  zmierzono  na  nich  zerowe  w rzeczy- 
wistości przesunięcia  kątowe  i wyznaczono  prędkości 
kątowe  obrotu  mgławic.  Po  przemnożeniu  ich  przez 
promień  galaktyki  Shapley  otrzymał  prędkości  linio- 
we obrotu  wielokrotnie  większe  od  prędkości  światła. 
Założenie,  że  mgławice  spiralne  są  Wyspami  Wszech- 
świata podobnymi  do  galaktyki,  prowadziło  zatem 
do  absurdu.  Shapley  musiał  je  odrzucić  i uznać 
galaktykę  za  twór  unikalny. 

Problem  mgławic  doczekał  się  ostatecznego  roz- 
wiązania dopiero  kilka  lat  później,  gdy  Edwin  Hubble, 
za  pomocą  2,5-metrowego  teleskopu  na  Mount  Wil- 
son, zdołał  rozdzielić  mgławicę  spiralną  M 31  na 
gwiazdy  i wyznaczyć  ich  odległości.  Okazało  się,  że 
M 31  (Mgławica  Andromedy)  leży  daleko  poza  gra- 
nicami naszej  Galaktyki.  Z następnych  prac  Hubble’a 
wynikało,  że  obiektami  pozagalaktycznymi  są  wszyst- 
kie mgławice,  które  dają  się  ułożyć  w pewien  ciąg 
typów  morfologicznych  i których  widma  podobne  są 
ciąg  do  widm  zwykłych  gwiazd.  Ciąg  ów  znany  jest  obec- 
Mubb!c'a  nie  jako  ciąg  Hubble’a,  natomiast  zaproponowana 
przez  niego  nazwa  mgławice  pozagalaktyczne  nie 
przyjęła  się.  Obiekty  te  nazywa  się  obecnie  po  prostu 
galaktykami.  Naszą  Galaktykę  wyróżnia  się  pisząc  ją 
wielką  literą  bądź  nazywając  Układem  Drogi  Mlecz- 
nej. Termin  „mgławice”  zachowany  został  do  ozna- 
czania gazowych  i pyłowych  obłoków  materii  między- 
gwiazdowej  znajdujących  się  w Galaktyce. 


Układ  Drogi  Mlecznej 


Najsilniej  świecąca  część  Układu  Drogi  Mlecznej 
przypomina  kształtem  silnie  spłaszczony  dysk.  Nie 
można  jednak  określić  granicy  układu:  Galaktyka 
przechodzi  w sposób  ciągły  w przestrzeń  międzyga- 
laktyczną.  Za  umowną  granicę  Galaktyki,  obejmującą 
wszystkie  podsystemy,  można  przyjąć  powierzchnię 
kuli  o średnicy  ok.  200  000  lat  świetlnych  (l.św.). 
Średnica  świecącego  dysku  nie  przekracza  90  000  l.św., 
a największa  grubość  — 10  000  l.św.  Znajduje  się 
w nim  ok.  1012  gwiazd,  a całkowitą  jego  masę  ocenia 
się  na  lO11-^12  mas  Słońca.  Przeważająca  część  masy 
emitującej  promieniowanie  skupiona  jest  w zagęsz- 
czeniu centralnym  — kulistym  tworze  (ii.  223  i 224, 
tabl.  60)  o średnicy  zaledwie  5000  l.św.  Tworzą  je  gwia- 
zdy populacji  II,  których  łączna  masa  stanowi  l/5  masy 
Galaktyki.  Gęstość  materii  w zagęszczeniu  central- 
nym jest  kilkaset  razy  większa  niż  w bezpośrednim 
otoczeniu  Słońca  i wynosi  ok.  20-30  mas  Słońca/l. św.3 

Rozkład  przestrzenny  gwiazd  w Galaktyce  ma  dwie 
symetrie:  zwierciadlaną  — względem  płaszczyzny  Ga- 
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laktyki,  i osiową  — względem  osi  Galaktyki  ustawio- 
nej do  płaszczyzny  Galaktyki  prostopadle  i prze- 
chodzącej przez  obszar  największej  gęstości.  Obszar  zagęszczenie 
ów  zwano  dawniej  jądrem,  obecnie  — coraz  powsze-  centralne 
chniej  używa  się  nazwy  zagęszczenie  centralne.  Pła- 
szczyzna Galaktyki  (także:  płaszczyzna  równikowa 
lub  równik)  przecina  sferę  niebieską  wzdłuż  pasa 
Drogi  Mlecznej.  Zagęszczenie  centralne  leży  w kie- 
runku wyznaczonym  przez  gwiazdozbiór  Strzelca. 

Z Ziemi  jest  niewidoczne  — zasłaniają  je  obłoki  ma- 
terii międzygwiazdowej  nieprzezroczyste  dla  promie- 
niowania widzialnego. 


Rozmieszczenie  i ruchy  gwiazd 

Powierzchnie  jednakowych  gęstości  przestrzennych 
gwiazd  (przez  gęstość  przestrzenną  gwiazd  należy 
rozumieć  liczbę  gwiazd  w jednostce  objętości)  są 
współosiowymi  elipsoidami  obrotowymi  o różnych 
stopniach  spłaszczenia  i różnych  rozmiarach  (rys.  1). 
W latach  czterdziestych  XX  w.  W.  Baade  zauważył, 
że  powierzchnie  jednakowej  gęstości  gwiazd  o danym 
typie  widmowym  tworzą  rodzinę  elipsoid  podobnych. 


1 l I I 

45  30  15  0 


tysiące  lat  świetlnych 

Rys.  I.  Przenikanie  się  podsystemów:  powierzchnie  stałych  gę- 
stości podsystemów  Układu  Drogi  Mlecznej  w modelu  Galak- 
tyki Oorta  (przekrój  płaszczyzną  prostopadłą  do  równika  Ga- 
laktyki i przechodzącą  przez  środek  Galaktyki  oraz  Słońce). 

Kółeczko  oznacza  położenie  Słońca.  Model  Oorta  składa  się 
z trzech  podsystemów:  płaskiego  (dwie  wewnętrzne  silnie  spłasz- 
czone elipsy),  pośredniego  (trzy  zewnętrzne  słabiej  spłaszczone 
elipsy)  i sferycznego  (dwie  wewnętrzne  najsłabiej  spłaszczone, 
zacieniowane  elipsy) 

tzn.  mających  jednakowe  stopnie  spłaszczenia,  i po-  podsystemy 
dzielił  Galaktykę  na  podsystemy  (populacje).  Wyróż-  gwiazd 
niamy  obecnie  pięć  podsystemów: 

1)  Skrajny  podsystem  płaski  — 3%  masy  Galak- 
tyki, ok.  2 mld  gwiazd  (skrajna  populacja  I):  błę- 
kitne nadolbrzymy,  gwiazdy  typu  T Tauri,  cefeidy, 
materia  międzygwiazdowa. 

2)  Podsystem  płaski.  — 8%  masy  Galaktyki,  ok.  5 
mld  gwiazd  (starsza  populacja  1):  gwiazdy  ciągu 
głównego  od  karłów  do  typu  widmowego  A włącznie. 

3)  Dysk  (populacja  II) : mgławice  planetarne,  gwia- 
zdy nowe,  zmienne  typu  RR  Lyrae  z okresami  zmian 
blasku  mniejszymi  od  dziesięciu  godzin,  zmienne  dłu- 
gookresowe z okresami  większymi  od  140  dni. 

4)  Podsystem  pośredni  — wraz  z dyskiem  zawiera 
ok.  50  mld  gwiazd,  czyli  67%  masy  Galaktyki  (po- 
średnia populacja  II):  zmienne  długookresowe  z okre- 
sami mniejszymi  od  140  dni. 

5)  Halo  — 22%  masy  Galaktyki,  ok.  16  mld  gwiazd 
(skrajna  populacja  II):  gwiazdy  typu  RR  Lyrae 
z okresami  większymi  od  dziesięciu  godzin,  gromady 
kuliste,  podkarły  zawierające  minimalne  ilości  pier- 
wiastków cięższych  od  helu. 

Im  silniej  spłaszczony  jest  podsystem,  tym  wyraź- 
niej jest  w nim  zaznaczona  płaszczyzna  Galaktyki. 


W podsystemach  słabo  spłaszczonych  (tzw.  podsys- 
temach sferycznych)  płaszczyzna  Galaktyki  nie  jest 
wyróżniona,  wyraźne  maksimum  gęstości  pojawia  się 
natomiast  w centrum. 

W podsystemach  płaskich  przeważają  gwiazdy  za- 
wierające dużo  pierwiastków  cięższych  od  helu  (na- 
zywanych powszechnie  metalami),  zaś  w podsyste- 
mach sferycznych  — gwiazdy  zawierające  bardzo 
mało  metali.  Metale  powstają  w reakcjach  syntezy 
jądrowej  zachodzących  we  wnętrzach  gwiazd.  Za- 
obserwowano, iż  gwiazdy  w trakcie  ewolucji  tracą 
część  swej  masy.  Wynika  stąd,  że  gwiazdy  podsystemu 
pośredniego  i halo  (populacja  II)  musiały  powstać 
we  wcześniejszych  etapach  ewolucji  Wszechświata, 
tj.  wtedy,  gdy  pierwiastków  ciężkich  było  mało.  Te 
z nich,  które  ewoluowały  szybciej,  zwróciły  przetwo- 
rzoną i wzbogaconą  w metale  materię  do  ośrodka 
mięćzygwiazdowego.  Materia  międzygwiazdowa  sku- 
piona jest  obecnie  w płaszczyźnie  równikowej  i tylko 
sporadycznie  występuje  w dużych  odległościach  od 
równika.  W okolicach  równika  powstają  gwiazdy 
młodszej  generacji  (populacja  I)  z bogatych  w metale 
obłoków.  Młoda  gwiazda  porusza  się  początkowo 
w płaszczyźnie  równikowej,  w której  działają  słabe 
siły  zakłócające.  W efekcie  ich  działania  po  dosta- 
tecznie długim  czasie  zaawansowana  już  ewolucyjnie 
gwiazda  przechodzi  do  podsystemu  mniej  spłaszczo- 
nego, rozpraszając  część  swej  masy  w płaszczyźnie 
Galaktyki. 

Podsystem  płaski  ma  strukturę  spiralną  zaznaczoną 
najwyraźniej  w płaszczyźnie  równikowej.  Tworzą  ją 
ramiona  trzy  ramiona  spiralne:  Perseusza,  Oriona  i Strzelca 
spiralne  (wg  ostatnich,  nie  potwierdzonych  jeszcze  obserwacji. 
Galaktyki  Galaktyka  ma  cztery  ramiona  spiralne).  W ramionach 
spiralnych  skupione  są  niemal  wszystkie  gwiazdy 
młode  i jasne  oraz  świecące  obłoki  gazowe  (tzw. 
mgławice  emisyjne).  Płynące  z obserwacji  innych 
galaktyk  wrażenie  dominowania  ramion  nad  pozo- 
stałymi częściami  podsystemu  płaskiego  jest  w znacz- 
nej mierze  wrażeniem  pozornym.  W rzeczywistości 
gęstość  materii  w ramionach  jest  zaledwie  trzykrotnie 
większa  od  średniej  gęstości  podsystemu  płaskiego. 
W zewnętrznej  części  ramienia  Oriona,  w odległości 
około  30  000  lat  świetlnych  od  środka  Galaktyki  i oko- 
ło 30  lat  świetlnych  nad  jej  płaszczyzną  równikową, 
znajduje  się  Układ  Słoneczny.  Słońce  należy  do  żółtych 
karłów  często  spotykanych  w Galaktyce  i niczym  się  nie 
wyróżnia  spośród  gwiazd  leżących  w jego  otoczeniu. 

Wszystkie  gwiazdy  obiegają  centrum  Galaktyki  po 
mniej  lub  bardziej  spłaszczonych  orbitach.  Na  po- 
ruchy  czątku  naszego  wieku  stwierdzono,  iż  średni  ruch 
gwiazd  gwiazd  należących  do  pewnych  grup  kinematycznych 
można  zinterpretować  jako  rotację  owych  grup. 
W końcu  lat  czterdziestych  grupy  kinematyczne 
utożsamiono  z podsystemami.  Najszybciej  rotują 


odległość  r 

Rys.  2.  Prędkość  liniowa  obrotu  Galaktyki  (v)  w funkcji  odleg- 
łości od  centrum  (#■).  Podobnie,  tzn.  w sposób  opisany  III  pra- 
wem Keplera,  obracają  się  pierścienie  Saturna.  Dla  r < 10  000 
l.św.  (linia  przerywana)  dane  obserwacyjne  nie  są  zbyt  pewne 

podsystemy  płaskie,  w których  orbity  gwiazd  są 
prawie  kołowe,  zaś  ruchy  własne  gwiazd  rozumiane 
jako  odchylenia  od  średniego  ruchu  całego  podsys- 


temu— niewielkie  (prędkości  ich  nie  przekraczają 
20-30  km/s).  W podsystemach  sferycznych  orbity 
gwiazd  są  silnie  wydłużonymi  elipsami,  dowolnie 
nachylonymi  do  równika  Galaktyki.  Ruch  obrotowy 
całości  jest  powolny,  natomiast  ruchy  własne  — szyb- 
kie (300-500  km/s)  i nieuporządkowane.  Podsystemy 
rotują  różniczkowo,  tzn.  z prędkością  kątową  zależną 
od  odległości  od  osi  obrotu  (w  podobny  sposób  obra- 
cają się  pierścienie  Saturna).  Nawet  w płaszczyźnie 
Galaktyki,  w której  opisywane  ruchy  są  najprostsze, 
zależność  owa  jest  dość  skomplikowana  (rys.  2). 

Kształt  funkcji  v(r)  zależy  od  rozkładu  przestrzennego 
masy.  W małych  odległościach  od  centrum  v jest 
proporcjonalne  do  r.  Oznacza  to,  iż  zagęszczenie 
centralne  jest  na  tyle  silnie  powiązane  siłami  grawi- 
tacji, że  obraca  się  jak  ciało  sztywne.  Kierunek  obrotu 
Galaktyki  można  określić  podając,  że  ramiona  „na- 
wijają się”  na  oś.  Wydaje  się  to  być  cechą  wspólną 
wszystkich  galaktyk  spiralnych. 

Natura  ramion  spiralnych,  a zwłaszcza  ich  stabil- 
ność (teoretycznie  powinny  one  wskutek  rotacji  róż- 
niczkowej i istnienia  ruchów  własnych,  rozpłynąć  się 
już  po  1-2  obrotach  Galaktyki)  nie  są  w pełni  wyja- 
śnione. Teoria  fal  gęstościowych  sformułowana  przez  teoria  fal 
B.  Lindblada,  a rozwinięta  przez  C.  Lina  i F.  Shu,  gęsfościo- 
zyskała  obecnie  największe  uznanie.  Zgodnie  z nią  wych 
ramię  spiralne  jest  wędrującym  przez  dysk  zaburze- 
niem (falą  gęstości).  Gwiazdy,  które  obecnie  należą 
do  ramion,  po  upływie  pewnego  czasu  znajdą  się 
w przestrzeni  między  ramionami,  by  jeszcze  później 
trafić  znowu  do  ramion,  lecz  już  w innych  miejscach. 

Stabilność  takich  fal  gęstościowych  została  wykazana 
w wielu  eksperymentach  numerycznych.  Sposób  po- 
wstawania fal  i czynniki  determinujące  ich  liczbę  są 
nadal  nieznane. 

Gwiazdy  należące  do  dysku  tworzą  często  małe  gromady 
skupienia,  zwane  asocjacjami,  gromadami  ruchomy-  gwiazd 
mi,  bądź  gromadami  otwartymi.  Składniki  takich 
skupień  są  ze  sobą  powiązane  genetycznie  (powstają 
z jednego  dużego  obłoku  materii  międzygwiazdowej), 
a wektory  ich  prędkości  są  do  siebie  równoległe. 

Najbogatsze  z wymienionych  skupień  zawierają  po 
kilka  tysięcy  gwiazd  należących  z reguły  do  populacji 
I.  O wiele  bogatsze  (do  105  gwiazd)  gromady  kuliste 
utworzone  są  z gwiazd  populacji  II.  Obszarem  maksy- 
malnej koncentracji  gromad  kulistych  jest  centrum 
Galaktyki. 


Materia  rozproszona 

Najważniejszym  źródłem  danych  o materii  rozpro- 
szonej są  obserwacje  radiowe.  Promieniowanie  radio- 
we Galaktyki  zostało  wykryte  w 1932  r.  przez  Karla 
Jansky’ego.  Początki  radioastronomii  przypadają 
jednak  dopiero  na  drugą  połowę  lat  czterdziestych 
naszego  wieku  (-►  Radioastronomia). 

Wygląd  „nieba  radiowego”  widzianego  z Ziemi 
przedstawia  rys.  3.  Większość  promieniowania  ra- 
diowego pochodzi  z obszarów  maksymalnej  koncen- 
tracji materii  rozproszonej,  czyli  z okolic  równika 
Galaktyki.  Maksimum  główne  natężenia  leży  w cen- 
trum Galaktyki.  Szereg  maksimów  pobocznych  obser- 
wuje się  w miejscach,  w których  promień  widzenia 
obserwatora  styczny  jest  do  jednego  z ramion  spiral- 
nych. Wyrastające  z płaszczyzny  równikowej  tzw. 
ostrogi  radiowe  (największa  z nich  ciągnie  się  wzdłuż 
południka  galaktycznego  30°)  najprawdopodobniej 
są  tworami  lokalnymi.  Wiąże  się  je  obecnie  z niejed- 
norodnościami ramienia  Oriona,  albo  z dawnymi 
wybuchami  bliskich  supernowych.  Tło  radiowe  Ga- 
laktyki jest  mieszaniną  promieniowania  synchrotro- 
nowego i termicznego.  Wykazano  niedawno,  że  skła- 
dowa termiczna  tła  powstaje  w wyniku  nałożenia  się 
słabych  obrazów  licznych  źródeł  dyskretnych.  Pas 
emisji  termicznej  jest  bardzo  wąski,  grubość  jego  na 
ogół  nie  przekracza  2-3°  (na  częstości  2,7  GHz). 
Nieco  szerszy  pas  emisji  synchrotronowej  ma  miejsca- 
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„niebo  mi  grubość  5°.  Cechą  charakterystyczną  promienio-  Według  niektórych  obserwatorów  podsystemy  płas- 
radiowe"  wania  tła  jest  szybkie  zwężanie  się  pasa  emisji  ze  kie  otoczone  są  rozciągłym  halo  radiowym  wysyłają- 
wzrostem  częstości  rejestrowanych  fal.  cym  promieniowanie  synchrotronowe.  Struktury  po- 


Rys.  3.  Mapa  radiowa  nieba  na  częstości  150  MHz.  „Poziomice’*  (izofoty)  odpowiadają  ustalonym  wartościom  natężenia  promienio- 
wania radiowego.  Punkt  (0°)  jest  środkiem  Galaktyki.  Wzdłuż  południka  30°  biegnie  największa  z ostróg  radiowych.  Na  przecięciu  się 
południków  90°  i 270°  z równikiem  widać  piki  emisji  pochodzące  z ramion  spiralnych 


źródła  Nazwą  źródła  dyskretne  obejmuje  się  obłoki  ma- 
dvskretn©  terii  międzygwiazdowej,  pulsary  i radiogwiazdy. 

Najbardziej  interesująca  grupa  silnych  źródeł  dys- 
kretnych leży  w centrum  Galaktyki  (rys.  4).  Termicz- 
no-synchrotronowe  źródło  Sagittarius  A (SGR  A) 
uważane  jest  za  właściwe  jądro  Galaktyki.  Pozostałe 
z widocznych  na  rys.  4 radioźródeł  są  obłokami  py- 
łowo-gazowymi i mają  widmo  czysto  termiczne. 


Rys.  4.  Mapa  radiowa  centrum  Galaktyki  na  częstości  8 GHz 
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dobne  do  halo  wykryto  także  w dwóch  sąsiednich 
galaktykach. 

Najdokładniejsze  informacje  dotyczące  rozmiesz- 
czenia i składu  materii  rozproszonej  pochodzą  z ob- 
serwacji radiowego  widma  liniowego.  Prócz  znanej 
od  dawna  linii  21  cm  wodom  neutralnego  H I,  obszar  H 8 
w ostatnich  latach  wykryto  wiele  linii  prostych  związ- 
ków chemicznych.  Ostre  maksimum  gęstości  wodom 
neutralnego  (10  atomów/cm3)  leży  w centrum  Galak- 
tyki. Już  w odległości  2000  l.św.  od  centrum  gęstość 
H I wynosi  zaledwie  0,2  atomów/cm3.  Rośnie  następ- 
nie powoli,  by  w odległości  15  000  l.św.  osiągnąć  0,6 
atomów/cm3.  Na  tym  poziomie  utrzymuje  się  przez 
dalsze  2000  l.św.,  po  czym  ponownie  opada.  Części 
centralne  Galaktyki  są  zatem  otoczone  wyraźnym 
pierścieniem  wodoru  neutralnego.  Całkowita  masa 
pierścienia  stanowi  ok.  10%  masy  Galaktyki.  Jego 
grubość  waha  się  od  450  do  600  l.św.  Począwszy  od 
odległości  30  000  !.św.t  płaszczyzna  pierścienia  zaczy- 
na się  odchylać  od  płaszczyzny  równikowej  Galaktyki 
w stronę  bieguna  północnego  Galaktyki  w przedziale 
długości  galaktycznych  20-140°  i w stronę  południo- 
wego w przedziale  200-240°.  Na  zewnętrznej  krawędzi 
pierścienia  odchylenie  to  osiąga  wartość  2000  l.św. 
Zniekształcenie  pierścienia  H I wywołane  jest  prawdo- 
podobnie przez  siły  grawitacyjne  pochodzące  od  naj- 
bliższych galaktyk  (Obłoków  Magellana). 

Ośrodek  międzygwiazdowy,  który  składa  się  głów- 
nie z wodoru,  jest  niejednorodny:  są  to  obłoki  o róż- 
nych rozmiarach.  Średnica  przeciętnego  obłoku  wy- 
nosi 30  l.św.,  gęstość  — ok.  25  atomów  /cm3,  tempe- 
ratura — ok.  100  K.  Średnia  gęstość  ośrodka  między 
obłokami  jest  stukrotnie  mniejsza.  Najgęstsze  ze  zna- 
nych obłoków,  tzw.  globule  (gęstość  do  10  000  ato-  globule 
mów/cm3)  uważane  są  przez  niektórych  badaczy  za 
gwiazdy  znajdujące  się  w fazie  kondensacji  przed 
zapaleniem  wodoru. 

Zaledwie  3%  masy  wodoru  międzygwiazdowego 
wysyła  promieniowanie  widzialne.  Są  to  tzw.  obszary  obszar  H SI 


H II  wodoru  zjonizowanego.  Z obłokami  H I i H II 
sąsiadują  często  obłoki  pyłowe  złożone  prawdopo- 
dobnie z ziaren  lodowo-grafitowych,  widoczne  nie- 
kiedy jako  ciemne  plamy  na  tle  jasnych  mgławic 
emisyjnych.  Pył  kosmiczny  jest  katalizatorem  umo- 
żliwiającym powstawanie  różnych  cząsteczek  che- 
micznych. Liczba  zidentyfikowanych  cząsteczek  i rod- 
ników sięga  obecnie  30;  do  występujących  najczęściej 
należą  OH,  H20,  CO  i H2CO.  Gęstą  chmurę  pyłowo- 
gazową  zawierającą  rodniki  OH  i cząsteczki  CHOH 
wykryto  niedawno  w centrum  Galaktyki,  w pobliżu 
źródła  SGR  A.  Niektóre  obłoki  dostatecznie  gęste 
i zawierające  odpowiednio  dużo  OH  lub  H20  emitują 
niezwykle  duże  ilości  energii  w postaci  promieniowa- 
nia odpowiadającego  liniom  widmowym  tych  czą- 
steczek powstającym  na  Ziemi  w zjawisku  masero- 
wym. Próby  wytłumaczenia  mechanizmu  pompowa- 
nia cząsteczek  obłoku  na  wyższe  poziomy  energe- 
tyczne nie  dały  dotychczas  rezultatu  i zasada  dzia- 
łania „masera  międzygwiazdowego”  pozostaje  nie- 
wyjaśniona. 

ruchy  Materia  rozproszona  bierze  udział  w ruchu  obroto- 
obłoków  wym  Galaktyki.  W odległościach  od  centrum  więk- 
szych niż  12  tys.  l.św.  obłoki  poruszają  się  po  dobrze 
określonych,  prawie  kołowych  orbitach.  Bliżej  cen- 
trum (5-6  tys.  l.św.)  prędkości  ruchów  radialnych  są 
porównywalne  z prędkościami  orbitalnymi  i pojęcie 
orbity  obłoku  traci  sens.  W obszarze  tym  kilkanaście 
obłoków  wodorowych,  o łącznej  masie  ok.  107  mas 
Słońca,  oddala  się  z dużymi  prędkościami  od  środka 
Galaktyki.  Wektory  ich  prędkości  leżą  w płaszczyźnie 

ramię  równikowej  lub  są  do  niej  nachylone  pod  niewielkimi 
ekspa-  tylko  kątami.  Największy  z obłoków  nazywany  bywa 
ndująca  ramieniem  ekspandującym.  W bezpośrednich  okoli- 
cach jądra  ruchy  radialne  zanikają.  Materia  między- 
gwiazdowa  tworzy  tu  wraz  z gwiazdami  populacji  II 
dwie  struktury:  zewnętrzny  pierścień  o promieniu 
2000  l.św.  i szerokości  1500  l.św.  oraz  wewnętrzny 
dysk  o promieniu  350  l.św.  Masa  pierścienia  i dysku 
oceniana  jest  na  1010  mas  Słońca,  z czego  na  materię 
międzygwiazdową  przypada  zaledwie  0,1%,  a więc 
o wiele  mniej  niż  w okolicach  Słońca. 

Analiza  zaburzeń  ruchu  obrotowego  materii  mię- 
dzygwiazdowej  prowadzi  do  przypuszczenia,  iż  przed 


Rys.  5.  Ilustracja  niepewności  wiedzy  o Galaktyce.  Takim  zmia- 
nom ulegały  w ciqgu  trzydziestu  lat  wyobrażenia  o kształcie 
funkcji  świecenia  gwiazd  w otoczeniu  Słońca  — czyli  w najlepiej 
zbadanym  obszarze  Galaktyki 


mniej  więcej  trzynastoma  milionami  lat  w jądrze 
Galaktyki  nastąpił  wybuch.  Uwolniła  się  przy  tym 
energia  równa  mocy  promieniowania  miliardów 
Słońc.  Materia  z okolic  jądra  została  wyrzucona  pod 
kątem  ok.  30°  do  płaszczyzny  równikowej  i częścio- 
wo ściągnięta  do  niej  na  powrót  przez  siły  grawita- 
cyjne Galaktyki  i pole  magnetyczne. 

Dokonane  różnymi  metodami  oceny  średniego  na-  po  Be 
tężenia  pola  magnetycznego  Galaktyki  dały  zgodne  magnetyczne 
wartości  3-5  10“ 10  T (lokalne  pole  może  być  nawet  Galaktyki 
dziesięciokrotnie  słabsze  lub  silniejsze  od  średniego). 

Dzięki  badaniom  polaryzacji  światła  gwiazd  wiado- 
mo, że  linie  sił  pola  układają  się  wzdłuż  ramion  spi- 
ralnych. Energia  zawarta  w polu  elektromagnetycz- 
nym jest  nikłym  ułamkiem  energii  grawitacyjnej 
Galaktyki,  lecz  nawet  tak  słabe  pole  wystarcza  w zu- 
pełności do  utrzymania  w Galaktyce  ->  Promienio- 
wania kosmicznego  — strumieni  cząstek  elementar- 
nych o dużych  energiach.  Źródłem  promieniowania 
kosmicznego  są  najprawdopodobniej  wybuchy  super- 
nowych i — być  może  — jakieś  nie  znane  jeszcze  pro- 
cesy zachodzące  w jądrze  Galaktyki. 

Nasza  wiedza  o Galaktyce  jest  jeszcze  bardzo  nie- 
pełna i obraz  Galaktyki  ulega  ciągłym  zmianom. 

Najlepszym  dowodem  tego  jest  rys.  5,  przedstawiający 
tzw.  funkcję  świecenia  gwiazd  tak  jak  się  przedstawia-  funkcja 
ła  w latach  1938,  1968  i 1972.  Mimo  że  do  wyznacza-  świecenia 
nia  funkcji  świecenia  używano  gwiazd  leżących  w bez- 
pośrednim otoczeniu  Słońca,  a więc  w najlepiej  po- 
znanym rejonie  Galaktyki,  różnice  są  olbrzymie. 


Ciąg  Hubble'a 


Klasyfikacja  morfologiczna  galaktyk,  wprowadzona 
przez  Edwina  Hubb!e’a,  jest  jeszcze  powszechnie 
stosowana,  choć  całkowicie  straciła  przypisywane  jej 
niegdyś  znaczenie  teoretyczne.  Ciąg  Hubble’a  jest 
uporządkowany  wg  rosnącej  symetrii  (ii.  225,  tabl.  61). 
Poniższe  zestawienie  obejmuje  nazwy  i skrótowe  ozna- 
czenia typów  hubble’owskich  oraz  ich  charaktery- 
styki morfologiczne. 

1)  Galaktyki  nieregularne  (l  1).  Brak  jakiejkolwiek 
symetrii.  Wyglądem  przypominają  jasne  obłoki  ma- 
terii międzygwiazdowej.  Typową  galaktyką  nie- 
regularna jest  Mały  Obłok  Magellana  (il.  225a,  tabl. 
61). 

2)  Galaktyki  spiralne  (5).  Niepełna  symetria  osiowa. 
Materia  świecąca  tworzy  cienki  dysk  i eliptyczne  za- 
gęszczenie centralne,  z którego  wybiegają  wtopione 
w dysk  ramiona.  W galaktykach  oglądanych  z boku 
widoczny  jest  ciemny  pas  materii  pyłowej  skupionej 
w płaszczyźnie  równikowej.  Zależnie  od  wielkości 
zagęszczenia  centralnego  i stopnia  rozwoju  ramion 
spiralnych,  galaktyki  S zalicza  się  do  jednego  z trzech 
podtypów:  Sc  (Mgławica  Trójkąta,  il.  225b,  tabl.  61), 
Sb  (Mgławica  Andromedy,  il.  225c,  tabl.  61)  oraz 
Sa  (M  104,  il.  225d,  tabl.  61).  Galaktyką  spiralną  ty- 
pu Sb  jest  także  Układ  Drogi  Mlecznej. 

3)  Galaktyki  spiralne  z poprzeczką  (SB).  Niepełna 
symetria  osiowa.  Ramiona  spiralne  zaczynają  się 
w pewnej  odległości  od  zagęszczenia  centralnego. 
Początki  ich  połączone  są  przechodzącym  przez  śro- 
dek galaktyki  pomostem  świecącej  materii  — tzw. 
poprzeczką.  Przyczyny  formowania  się  poprzeczek 
nie  są  jeszcze  znane.  Typ  SB  dzieli  się  na  trzy  pod- 
typy,  analogiczne  do  podtypów  S:  SBcy  SBb  i SBa 
(il.  225  e-g,  tabl.  61). 

4)  Galaktyki  soczewkowate  (50).  Pełna  symetria 
osiowa.  Zagęszczenie  centralne  otoczone  jest  niezbyt 
rozległym,  lecz  grubym  dyskiem.  Galaktyki  SB  nie 
mają  ramion  spiralnych.  W żadnej  z nich  nie  stwier- 
dzono obecności  materii  pyłowej  (il.  225h,  i,  tabl.  61). 

5)  Galaktyki  eliptyczne  ( E ).  Symetria  osiowa  prze- 
chodząca w sferyczną.  Brak  dysku.  Na  sferze  niebie- 
skiej widoczne  są  jako  elipsy  o różnych  stopniach 
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spłaszczenia.  Miarą  obserwowanego  spłaszczenia  jest 
stosunek  10  (a  — b)lay  gdzie  a i b — wielka  i mała 
półoś  elipsy.  Obserwowane  stopnie  spłaszczenia  za- 
wierają się  w przedziale  (0-7)  — stąd  podział  typu  £ 
na  osiem  podtypów:  od  El  do  E0.  Rzeczywiste  stop- 
nie spłaszczenia  można  wyznaczać  bądź  grupowo 
(metodami  statystycznymi),  bądź  indywidualnie  (me- 
todami fotometrycznymi).  Ostatnia  metoda  pozwala 
także  na  odróżnienie  galaktyk  E od  galaktyk  50, 
widzianych  od  strony  bieguna  (por.  il.  2251,  h,  tabl.  61) 
Z badań  częstości  występowania  obserwowanych 
stopni  spłaszczenia  wynika,  iż  istnieją  galaktyki  o sto- 
pniu spłaszczenia  równym  0,  czyli  o pełnej  symetrii 
sferycznej.  W galaktykach  £ bardzo  rzadko  obser- 
wuje się  materię  pyłową.  Do  przedstawicielek  typu  E 
należą  towarzyszki  Mgławicy  Andromedy  galaktyki 
M 32  ( E5y  il.  225j,  tabl.  61)  i NGC  185  (£2,  il.  225k, 
tabl.  61)  oraz  ogromna  galaktyka  sferyczna  M 87  (£0, 
il.  2251,  tabl.  61).  Pozostałe  0,5%  stanowią  galaktyki 
osobliwe  (pekuliame),  nie  należące  do  żadnego  z wy- 
mienionych typów.  Jest  o nich  mowa  w rozdziale 
Jądra  galaktyk. 


Typy  galaktyk 


częstość 

występowa-  T 

nia  różnych  yp 

Częstość 
występowa- 
nia, % 

typów 

EO-ł-El-f-  ...  +£7  + 50 

17 

Sa  4-  SBa 

19 

Sb  + SBb 

25 

Sc  + SBc 

36 

71 

2,5 

Kilkanaście  lat  po  ukazaniu  się  prac  Hubble’a  jego 
klasyfikację  uzupełniono  karłowatymi  galaktykami 
eliptycznymi  /2,  które  mają  cechy  strukturalne  ga- 
laktyk eliptycznych,  różnią  się  od  nich  nikłymi  roz- 
miarami i bardzo  małą  gęstością  gwiazd.  Wyjątkowo 
małe  jasności  powierzchniowe  utrudniają,  a przy  nie- 
znacznym pogorszeniu  warunków  atmosferycznych 
wręcz  uniewożliwiają,  obserwacje  galaktyk  72.  Od- 
kryto ich  zaledwie  kilka,  istnieją  jednak  podstawy 
by  przypuszczać,  że  typ  12  jest  w Kosmosie  repre- 
zentowany bardzo  licznie.  Typowi  przedstawiciele 
galaktyk  12  to  tzw.  systemy  Sekstans  i Fomax  (il.  225 
m,  n,  tabl.  61). 


Rozmieszczenie  przestrzenne 
galaktyk 

Niejednorodności  w rozkładzie  galaktyk  na  sferze 
niebieskiej  znane  były  już  Herschelowi,  jednak  do- 
kładnie zostały  zbadane  dopiero  przez  Hubble’a. 
Związane  z nimi  problemy  są  dziś  uważane  za  jeden 
z najważniejszych  w kosmologii  i teorii  ewolucji 
galaktyk. 

pas  Nie  obserwuje  się  zupełnie  galaktyk  leżących  w 
unikania  obrębie  tzw.  pasa  unikania,  ciągnącego  się  wzdłuż 
równika  Galaktyki:  ich  światło  jest  całkowicie  po- 
chłaniane przez  materię  międzygwiazdową.  Jest  to 
przykład  pozornej  niejednorodności  rozkładu,  wy- 
wołanej niedoskonałością  obserwacji.  Prawdziwy 
rozkład  galaktyk  na  sferze  niebieskiej,  otrzymany  po 
uwzględnieniu  zafałszowań  spowodowanych  absorp- 
cją, jest  nadal  niejednorodny.  Galaktyki  grupują  się 
na  sferze  w układach  zwanych  (zależnie  od  iiczeb- 
grupy  i ności)  grupami  bądź  gromadami.  Z badań  statystycz- 
gromady  nych  wynika,  że  widoczne  na  niebie  grupy  i gromady 
galaktyk  nie  powstają  w wyniku  przypadkowego  zlewania  się 
bliższych  galaktyk  z dalszymi,  lecz  są  odbiciem  rze- 
czywistych niejednorodności  rozkładu  przestrzennego. 
Na  realność  fizyczną  bogatych  gromad  wskazuje  ich 
regularna  budowa  (il.  229,  tabl.  63).  Ponadto  w nie- 
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których  mało  liczebnych  grupach  zaobserwowano  mo- 
sty świecącej  materii,  łączące  poszczególne  galaktyki. 

Większość  obserwatorów  zdaje  się  obecnie  skłaniać  ku 
stwierdzeniu,  iż  w ogóle  nie  istnieją  galaktyki  po- 
jedyncze, nie  należące  do  żadnej  gromady.  Nie  za- 
obserwowano natomiast,  aby  gromady  galaktyk  two- 
rzyły ugrupowania  wyższego  rzędu,  tj.  gromady  gro- 
mad. Oznacza  to,  że  dostępna  obserwacjom  część 
Kosmosu  jest  jednorodna  w skali  gromad. 

Niewiele  dotychczas  wiadomo  o przeciętnej  groma- 
dzie. Najlepiej  zbadane  są  gromady  liczące  po  kilka- 
set i więcej  galaktyk  (il.  229,  tabl.  63).  Są  to  zwykle 
układy  niezbyt  zwarte.  Gęstość  przestrzenna  galaktyk 
w gromadzie  rośnie  jednak  znacząco  w miarę  zbliżania 
się  do  centrum,  w którym  często  można  znaleźć  galak- 
tykę przewyższającą  znacznie  jasnością  i rozmiarami 
wszystkie  pozostałe  składniki  gromady.  Galaktyka 
centralna  jest  zazwyczaj  galaktyką  aktywną  (patrz  roz- 
dział Jądra  galaktyk).  Z centralnych  okolic  paru  gro- 
mad odebrano  promieniowanie  rentgenowskie  inter- 
pretowane jako  promieniowanie  termiczne  gazu  mię- 
dzygalaktycznego.  Jest  to  jedyny,  jak  dotąd,  dowód 
istnienia  materii  międzygalaktycznej. 

Zakładając,  że  gromada  jest  tworem  stabilnym, 
który  istnieje  w niezmienionej  postaci  od  paru  mi- 
liardów lat,  i mierząc  prędkości  radialne  jej  składni- 
ków można  (z  twierdzenia  o wiriale)  wyznaczyć  jej 
masę.  Otrzymane  wartości  przewyższają  dziesięcio- 
krotnie masy  ocenione  na  podstawie  zsumowania 
przybliżonych  mas  poszczególnych  galaktyk.  Zatem — 
albo  gromady  nie  są  stabilne  (czemu  jednak  przeczy 
sam  fakt  ich  obserwowania),  albo  błędne  są  wyobra- 
żenia na  temat  mas*  pojedynczych  galaktyk.  Według 
najbardziej  prawdopodobnej  hipotezy  „brakująca” 
w galaktykach  masa  skupiona  jest  w czerwonych 
karłach  ciągu  głównego,  należących  zarówno  do 
pierwszej,  jak  i do  drugiej  populacji  gwiazd.  Teoria 
ewolucji  gwiazd  przewiduje  ich  istnienie,  lecz  z po- 
wodu znikomych  jasności  są  one  niemożliwe  do  zaob- 
serwowania. 

Największą  w naszym  otoczeniu  Wszechświata  gro-  gromada 
madą  jest  gromada  Virgo  licząca  kilkaset  jasnych  Virgo 
i kilka  tysięcy  słabszych  galaktyk.  Środek  jej  leży 
w odległości  ok.  35  000  000  l.św.  od  Słońca.  W jego 
pobliżu  znajduje  się  dominująca  w gromadzie  galak- 
tyka M 87  typu  £0,  niezwykle  masywna  (ok.  1013  A/®) 
i otoczona  wyjątkowo  liczną  chmurą  gromad  kuli- 
stych. Niektórzy  obserwatorzy  zaliczają  do  gromady 
Virgo  Układ  Lokalny  Galaktyk,  zawierający  Układ 
Drogi  Mlecznej. 

Układ  Lokalny  (jak  i większość  dokładniej  zbada-  Układ 
nych  małych  grup  galaktyk)  jest  tworem  niestabil-  Lokalny 
nym:  jego  składniki  rozbiegają  się.  Do  Układu  Lokal-  Galaktyk 
nego  zalicza  się  wszystkie  galaktyki  położone  w odle- 
głości mniejszej  od  2 000  000  l.św.;  znamy  ich  dwa- 
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galaktyk 


prawo 

Hubble'a 


dzieścia  parę.  Nasza  Galaktyka,  której  towarzyszą 
dwie  galaktyki  satelitarne  (Obłoki  Magellana),  jest 
największa  w Układzie.  Dorównuje  jej  prawie  roz- 
miarami Mgławica  Andromedy,  także  mająca  dwie 
galaktyki  satelitarne.  Reszta  składników  Układu  to 
galaktyki  pojedyncze,  wielokrotnie  mniejsze  od  naszej. 
Badania  Układu  Lokalnego  Galaktyk  prowadzą  za- 
tem do  wniosku,  iż  najliczniej  reprezentowane  są  we 
Wszechświecie  galaktyki  o małych  masach,  a wśród 
nich  — karłowate  galaktyki  7 2.  Krótkie  charaktery- 
styki składników  Układu  Lokalnego  zawarte  są  w ta- 
beli, a ich  rozmieszczenie  przedstawia  rys.  6. 

Galaktyki  nie  objęte  zestawieniem  (w  1975  r.  było 
ich  4)  należą  do  klasy  72.  Zostały  one  odkryte  w ostat- 
nich latach  i brak  o nich  na  razie  dokładniejszych 
danych,  jedna  z nich,  odkryta  w połowie  1975  r., 
leży  w odległości  zaledwie  60  000  l.św.,  a więc  bliżej 
niż  Obłok  Magellana.  Numer  galaktyki  w tabeli  od- 
powiada oznaczeniom  na  rys.  6,  który  przedstawia 
Układ  Lokalny  w rzucie  na  płaszczyznę  Galaktyki. 
Ilustracja  230  (tabl.  63)  przedstawia  fotografię  ciasnej 
grupy  wzajemnie  oddziałujących  galaktyk  zw.  Kwin- 
tetem Stefana  — inny  przykład  niestabilnego  układu 
galaktyk.  Jego  składniki  rozbiegają  się  z dużymi  pręd- 
kościami. 


Układ  Lokalny  Galaktyk 


Nu- 

mer 

Nazwa 

Typ 

Odleg- 

łość 

tys.  l.św. 

Jasność 

widoma 

Wiel- 

kość 

gwiaz- 

dowa 

abso- 

lutna 

1 

Układ  Drogi  Mlecznej 

Sb 

0 



-19,8 

2 

Wielki  Obłok  Magellana 

71 

150 

2,8 

-17,4 

3 

Mały  Obłok  Magellana 

71 

150 

1,2 

-16,0 

4 

System  U Ma 

72 

220 

10,0 

-9,0 

5 

System  Sculptor 

72 

300 

8,8 

-12,1 

6 

System  Draco 

72 

330 

10,0 

-10,0 

7 

System  Leo  1 

72 

680 

12,0 

-9,7 

S 

System  Leo  2 

72 

680 

12,0 

-9,7 

9 

System  Fomax 

72 

910 

9,1 

-13,4 

10 

NGC6822 

71 

1100 

9,1 

-13,9 

11 

NGC147 

£3 

1250 

10,5 

-13,4 

12 

NGC185 

£ 1 

1250 

10,2 

-13,7 

13 

NGC  205 

£5 

1500 

8,9 

-15,0 

14 

NGC221  (M  32) 

£2 

1500 

9,1 

-14,8 

15 

Mgławica  Andromedy 

Sb 

1500 

4,3 

-19,8 

16 

IC 1613 

II 

1500 

10,0 

-13,5 

17 

Mgławica  Trójkąta 

Sc 

16C0 

6,0 

-17,6 

Galaktyki  wchodzące  w skład  Układu  Lokalnego 
porozrzucane  są  po  całej  sferze.  By  stwierdzić,  czy 
dana  galaktyka  należy  do  Układu  — trzeba  wyznaczyć 
jej  odległość.  Najdokładniejszą  z metod  wyznaczania 
odległości  galaktyk  jest  metoda  cefeid  zastosowana 
już  przez  Hubble’a.  Zaobserwowawszy  w galaktyce 
cefeidę  (il.  226,  tabl.  62),  którą  łatwo  jest  rozpoznać  po 
charakterystycznej  krzywej  zmian  blasku,  mierzy  się 
okres  owych  zmian,  związany  dość  jednoznacznie 
z jasnością  absolutną  gwiazdy.  Znając  jasność  wido- 
mą otrzymuje  się  już  łatwo  odległość.  Niestety,  metodą 
cefeid  można  wyznaczyć  tylko  odległości  niezbyt  duże, 
nie  większe  niż  7 min  l.św.  Galaktyki  z centralnych 
części  gromady  Virgo  leżą  już  poza  obszarem  jej  sto- 
sowalności. Inne  metody  pozwalają  sięgnąć  w Kosmos 
nieco  dalej,  dają  jednak  mniej  dokładne  wyniki.  Na- 
leżą do  nich  metoda  gwiazd  nowych,  wykorzystu- 
jąca założenie  o stałej  jasności  absolutnej  nowych 
w maksimum  blasku,  i metoda  obszarów  H II,  wyko- 
rzystująca założenie  o stałości  rozmiarów  liniowych 
mgławic  emisyjnych.  Obliczając  opisanymi  metodami 
odległości  bliskich  galaktyk  E.  Hubble  dokonał 
w 1929  r.  odkrycia,  które  pozwoliło  wyznaczyć  od- 
ległości nieporównywalnie  większe.  Stwierdził,  że 
prędkości  radialne  galaktyk  v,  wyznaczone  z przesu- 
nięć widm  galaktyk  ku  czerwieni,  rosną  proporcjo- 
nalnie do  odległości  od  obserwatora  r: 

v = H-r. 


Rys.  7.  Zależność  prędkości  oddalania  się  galaktyk  od  ich  od- 
ległości od  obserwatora  — oryginalny  diagram  Hubble’a  z 1929  r. 
Różne  symbole  odpowiadają  różnym  metodom  opracowania 
obserwacji.  Miarą  niedokładności  obserwacji  jest  rozbieżność 
między  prostą  ciągłą  i przerywaną 

Zależność  v(r ) otrzymana  przez  Hubble*a  na  podsta- 
wie obserwacji  bliskich  galaktyk  przedstawiona  jest 
na  rys.  7.  Zatem,  aby  zmierzyć  odległość  dzielącą  nas 
od  jakiejś  galaktyki,  wystarczy  uzyskać  jej  widmo. 
Najdalsza  z galaktyk,  dla  której  otrzymano  widma, 
leży  w odległości  kilku  miliardów  lat  świetlnych. 


Parametry  fizyczne  galaktyk 

Galaktyki  należące  do  różnych  typów  morfologicz- 
nych różnią  się  znacznie  parametrami  fizycznymi.  Za- 
leżności te  mają  oczywiście  charakter  statystyczny  i nie 
są  związkami  ścisłymi. 

Widma  galaktyk  podobne  są  na  ogół  do  widm  po- 
jedynczych gwiazd.  Typ  widmowy  zmienia  się  od  póź- 
nego F w typie  71  do  G5-G6  w typie  E.  Różnice  typów 
widmowych  spowodowane  są  różnymi  wkładami  po- 
szczególnych populacji.  W galaktykach  eliptycznych 
przeważają  późne  typy  widmowe  zaawansowanych 
ewolucyjnie  gwiazd  populacji  II,  zaś  w galaktykach 
nieregularnych  — młode  gwiazdy  populacji  I o wcze- 
snych typach  widmowych.  Jednak  we  wszystkich 
dokładniej  zbadanych  galaktykach  zaobserwowano 
gwiazdy  bardzo  stare. 

Średnia  w danym  typie  morfologicznym  masa  galak- 
tyki i średnia  jasność  rośnie  wyraźnie  z przejściem  od 
typu  / do  E.  Największe  z galaktyk  eliptycznych  ważą 
kilkanaście  razy  więcej  niż  Układ  Drogi  Mlecznej, 
zaś  karłowate  galaktyki  72  — do  10  000  razy  mniej. 
Podobnie  jest  z jasnościami.  Dwie  stosowane  obecnie 
metody  wyznaczania  mas  (z  obserwacji  radiowych 
i optycznych)  dają  rażąco  niezgodne  wyniki  (jes*  to 
tzw.  problem  „brakującej”  masy  — patrz  str.  940).  We 
wszystkich  typach  morfologicznych  większość  masy 
skupiona  jest  w gwiazdach.  Na  wodór  neutralny  H I 
(jedyną  składową  materii  rozproszonej  badaną  po- 
wszechnie w innych  galaktykach)  przypada  od  0,5% 
(typ  50)  do  20%  masy  (typ  71).  W galaktykach  71 
maksimum  gęstości  wodoru  neutralnego  pokrywa  się 
ze  środkiem  geometrycznym  układu.  Galaktyki  spi- 
ralne natomiast  otoczone  są  pierścieniem  wodorowym, 
tak  że  w środku  geometrycznym  wypada  u nich  mini- 
mum gęstości  H I.  Częstokroć  piei^cień  ten  jest  dużo 
wyraźniejszy  niż  w naszej  Galaktyce.  Przyczyny 
tworzenia  się  pierścieni  H I nie  są  znane.  W galakty- 
kach eliptycznych  nie  zaobserwowano  wodoru  neu- 
tralnego. Nie  znaczy  to  jednak,  że  nie  zawierają  one 
materii  rozproszonej  w innych  postaciach.  Znaczny 
ich  procent  emituje  promieniowanie  synchrotronowe, 
świadczące  o obecności  zjonizowanego  gazu,  skupio- 
nego w obszarach  centralnych.  W niektórych  widać 
ciemne  obłoki  pyłowe  (il.  225j,  k,  tabl.  61). 

Największe  prędkości  rotacji  obserwowano  w syste- 
mach spłaszczonych,  należących  do  typów  5Q-5c. 
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Równowaga  mechaniczna  jest  w nich  utrzymywana 
dzięki  równoważeniu  się  sił  grawitacyjnych  i odśrod- 
kowych. Galaktyki  EO  nie  obracają  się  w ogóle,  a rów- 
nowagę mechaniczną  utrzymują  dzięki  bezładnym 
ruchom  gwiazd  obiegających  centrum  po  silnie  spłasz- 
czonych orbitach.  Tak  więc  dość  jednoznaczną  funk- 
cją typu  morfologicznego  jest  rozkład  momentu  pędu 
(tzn.  funkcja,  która  podaje  procent  masy  galaktyki 
mający  dany  moment  pędu).  Galaktyki  £0-Sc  za- 
wierają duże  ilości  materii  z dużym  momentem  pędu 
(maksimum  rozkładu  — w obszarze  dużych  wartości), 
zaś  galaktyki  EO  zawierają  wyłącznie  materię  z ma- 
łym momentem  pędu  (maksimum  rozkładu  — w ob- 
szarze małych  wartości). 

Ostatnim  parametrem  związanym  z typem  morfo- 
logicznym jest  liczba  gromad  kulistych  towarzyszą- 
cych galaktyce.  Wybrawszy  z typów  Sc,  Sb,  Sa,  SO  i E 
galaktyki  o jednakowych  masach  można  łatwo  stwier- 
dzić, że  najwięcej  gromad  skupia  się  przy  galaktykach 
eliptycznych. 

Galaktyki  karłowate  są  jeszcze  na  tyle  słabo  zba- 
dane, że  nie  wiadomo,  czy  w ogóle  zawierają  materię 
rozproszoną.  Tylko  niektórym  z nich  towarzyszą 
nieliczne  i niewielkie  gromady  kuliste.  Większość  ga- 
laktyk 12  zbudowana  jest  prawie  wyłącznie  z gwiazd 
populacji  II,  jednak  np.  galaktyki  72,  leżące  w gwiaz- 
dozbiorze Sekstansu  składają  się  prawie  wyłącznie  z 
gwiazd  młodych,  należących  do  populacji  I. 


Jądra  galaktyk 

iądSro  a Jeszcze  kilkanaście  lat  temu  wyrazem  „jądro”  okreś- 
t^gęszczenie  lano  centralną,  najjaśniejszą  część  galaktyki.  Zgodnie 
centralne  z ówczesnymi  pojęciami  galaktyki  składały  się  wy- 
łącznie z gwiazd  i z materii  rozproszonej. 

Stopniowo  zrozumiano  jednak,  że  dwuskładnikowy 
model  galaktyki  jest  zbyt  prymitywny.  Na  trop  tego 
wniosku  naprowadziły  znane  od  czasów  Hubble’a 
galaktyki  osobliwe  (iL  227,  tabl.  62,  ii.  231,  232,  tabl. 
63),  wyłamujące  się  z ciągu  klas  morfologicznych. 
Wiele  z nich  nazy  wano  galaktykami  wybuchającymi. 
Proste  oszacowania  ilości  energii  potrzebnej  do  wpra- 
wienia w ruch  ogromnych  mas  wyrzucanych  z wybu- 
chających galaktyk  dawały  wartości  1050  J,  prze- 
kraczające wszystko,  z czym  się  dotychczas  we 
Wszechświede  spotkano.  Dość  oczywisty  wniosek,  iż 
energia  wyzwalana  jest  w obiektach  kosmicznych 
jeszcze  nauce  nie  znanych,  wyciągnięto  jednak  do- 
piero po  wprowadzeniu  nowych  metod  obserwacji 
w różnych  zakresach  fal  radiowych  i w podczerwieni. 
Obserwacje  pewnej  szczególnej  klasy  galaktyk  osobli- 
gaSaktykś  wych  (galaktyk  Seyferta)  pozwoliły  na  ocenę  rozmia- 
Sayferia  rów  obszaru,  w którym  wyzwalana  jest  energia.  Zna- 
jąc całkowitą  energię  wytwarzaną  przez  hipotetyczny 
obiekt  centralny  oszacowano  ilość  energii  wydzielanej 
w jednostce  objętości.  Ta  ostatnia  wartość  była  na 
tyie  duża,  że  nie  potrafiono  przez  długi  czas  podać  me- 
chanizmu produkcji  energii  ani  wyobrazić  sobie  wa- 
runków fizycznych  panujących  w źródle.  Własności 
nowych  obiektów  nie  dawały  się  pogodzić  z aktualnym 
stanem  wiedzy.  W ich  istnienie  uwierzono  ostatecznie 
dopiero  wtedy,  gdy  radioastronomowie  dokonali  nie- 
zależnych ocen  gęstości  produkcji  energii  i gdy  za- 
częto masowo  odkrywać  równie  dziwne  obiekty 
(->  Kwazary).  Znaczenie  nazwy  jądro  uległo  zmianie. 
Większość  autorów  oznacza  nią  obecnie  nowo  od- 
kryte obiekty  centralne  galaktyk  i w takim  też  zna- 
czeniu jest  używana  w niniejszym  rozdziale.  To,  co 
dawniej  nazywano  jądrem,  określa  się  dziś  jako  za- 
gęszczenie centralne. 

Na  naświetlanych  odpowiednio  krótko  zdjęciach 
centralnych  części  najbliższych  galaktyki  (il.  228,  tabl. 
62)  można  spostrzec  punktowe  lub  niemal  punkto- 
we obiekty,  różniące  się  od  zwykłych  gwiazd  włas- 
nościami fotometrycznymi.  Bezpośrednie  ich  obser- 
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wacje  są  niezmiernie  utrudnione  przez  gwiazdy  nale- 
żące do  zagęszczeń  centralnych.  Nie  udało  się  jeszcze 
uzyskać  takich  widm  tych  obiektów,  które  nie  byłyby 
zafałszowane  przez  widmo  otoczenia.  Mimo  to  uwa- 
żane są  one  za  jądra  galaktyk  znajdujące  się  w fazie 
spoczynku.  Najprawdopodobniej  wszystkie  galaktyki 
masywne  mają  co  najmniej  jedno  jądro,  natomiast  nie 
obserwuje  się  jąder  w galaktykach  karłowatych. 

Galaktyki,  których  jądra  znajdują  się  w fazie  aktyw- 
ności, nazywane  bywają  w skrócie  aktywnymi.  Ozna- 
kami aktywności  galaktyki  mogą  być  zmiany  blasku, 
obecność  linii  emisyjnych  w widmie,  silne  promienio- 
wanie ultrafioletowe  lub  podczerwone,  intensywna 
emisja  radiowa,  wreszcie  — wypływ  materii  (il.  227, 
tabl.  62,  il.  231,  232,  tabl.  63).  Różne  rodzaje  aktyw- 
ności galaktyk  mają  to  samo  źródło  — niestacjonarne 
procesy  zachodzące  w jądrach.  Fazy  aktywności  naj- 
prawdopodobniej powtarzają  się  okresowo.  Skala  ak- 
tywności ma  bardzo  dużą  rozpiętość,  i to  co  w jednych 
galaktykach  uznać  należałoby  za  fazę  aktywności  — 
w innych  byłoby  fazą  spoczynku. 

Typowym  przykładem  fazy  spoczynku  jest  obecny  jądr& 
stan  jądra  Mgławicy  Andromedy  (M  31).  Optyczne  mgławicy 
własności  okolic  jądra  nie  są  w żadnym  stopniu  ano-  Andromody 
malne.  Gęstość  przestrzenna  gwiazd  zasłaniających 
samo  jądro  (il.  228,  tabl.  62)  oceniana  jest  na  30  000/1. 
św.3  — przewyższa  zatem  wielokrotnie  gęstości  gro- 
mad kulistych,  najbardziej  zwartych  z dotychczas 
znanych  obiektów.  Wszystkie  te  gwiazdy  należą  do 
populacji  II,  są  zatem  stare.  W okolicach  jądra  nie 
zaobserwowano  gwiazd  młodych,  choć  znajdują  się 
tam  pewne  ilości  wodoru  neutralnego.  Nieznane  czyn- 
niki, prawdopodobnie  szybka  rotacja  i silne  pole  mag- 
netyczne, zapobiegają  kondensacji  materii  między- 
gwiazdowej  i uniemożliwiają  powstawanie  nowych 
gwiazd.  Jądro  Mgławicy  Andromedy  można  bezpo- 
średnio obserwować  dopiero  w ultrafiolecie  i na  falach 
radiowych.  Obszar  emisji  radiowej  jest  bardziej  roz- 
myty niż  centralne  źródło  naszej  Galaktyki,  zaś  emi- 
towane promieniowanie  — znacznie  słabsze. 

Jądro  Układu  Drogi  Mlecznej  znajduje  się  w fazie  jądro 
przejściowej  po  okresie  wzmożonej  aktywności,  przez  Układu 
który  przechodziło  kilkanaście  milionów  lat  temu.  Drogi 
Jest  ono  utożsamiane  z radioźródłem  SGR  A.  Parę  Mlecznej 
lat  temu  stwierdzono,  że  SGR  A jest  silnym  źródłem 
promieniowania  podczerwonego  (emituje  ok.  107  razy 
więcej  energii  niż  Słońce  we  wszystkich  długościach 
fal).  Rozmiary  obszaru  aktywnego  w podczerwieni 
wynoszą  zaledwie  3-4  lata  świetlne.  Z analiz  widma 
promieniowania  podczerwonego  wynika,  iż  źródło 
SGR  A otoczone  jest  chmurą  gwiazd  o gęstości  milion 
razy  większej  niż  gęstość  w okolicach  Słońca.  Pozo- 
stałością po  fazie  aktywności  jest  ramię  ekspandują- 
ce — ogromny  obłok  wyrzucony  z jądra  o masie  107 
mas  Słońca.  Wypływ  masy  z jądra  trwa  po  dziś  dzień. 

Dowodem  tego  jest  emitowane  przez  jądro  promienio- 
wanie synchrotronowe,  którego  podtrzymywanie  wy- 
maga nieustannego  dostarczania  szybkich  cząstek 
naładowanych.  W epoce  wybuchu  nasza  Galaktyka 
mogłaby  zapewne  być  sklasyfikowana  jako  jedna  ze 
wspomnianych  galaktyk  Seyferta.  Ich  bardzo  jasne 
jądra  przewyższają  wielokrotnie  swym  blaskiem  po- 
zostałe części  galaktyk.  W ledwo  widocznych  dyskach 
można  dostrzec  ślady  ramion  spiralnych.  Widmo 
optyczne  jądra  takiej  galaktyki  złożone  jest  z nieter- 
mścznej  składowej  ciągłej  i wielu  szerokich  linii  emi- 
syjnych wzbronionych.  Duże  ilości  energii  emitowane 
są  w ultrafioletowej  i podczerwonej  części  widma. 

Wiele  galaktyk  Seyferta  wysyła  także  promienio- 
wanie rentgenowskie  i gamma  (-*  Astronomia  pro- 
mieni X i y).  Ich  jasności  optyczne  zmieniają  się  nie- 
regularnie, w ciągu  kilku  miesięcy  mogą  wzrastać  lub 
maleć  nawet  kilkakrotnie.  Nie  jest  jeszcze  wyjaśnione, 
czy  zmiany  owe  są  wynikiem  redystrybucji  energii  do 
innych  obszarów  widma,  czy  odbiciem  zmian  wydaj- 
ności źródeł  energii.  Przypuszcza  się,  że  nietermiczne 
kontinuum  pochodzi  z obszarów  leżących  najbliżej 
jądra.  Nad  nimi,  tzn.  nieco  dalej  od  jądra,  znajduje 


się  prawdopodobnie  ośrodek  dużo  rzadszy,  produ- 
kujący zwykłe  linie  emisyjne.  Są  one  poszerzone  w wy- 
niku złożenia  się  przesunięć  dopplerowskich  wywoła- 
nych bardzo  szybkimi  ruchami  obłoków  gazu.  Jeszcze 
wyżej,  gdzie  gęstość  powinna  być  jeszcze  mniejsza, 
powstają  wąskie  linie  wzbronione.  Masa  całego  gazu 
emitującego  widmo  liniowe  nie  jest  zbyt  wielka : nie 
przekracza  104  mas  Słońca.  Natomiast  jądro,  utrzy- 
mujące gaz  siłami  ciążenia  mimo  jego  szybkich  ru- 
chów, musi  mieć  masę  ok.  10M08  mas  Słońca;  jego 
rozmiary  nie  przekraczają  przy  tym  5 lat  świetlnych. 

Prócz  galaktyk  Seyferta  istnieje  wiele  innych  typów 
galaktyk  aktywnych.  Należą  do  nich  galaktyki  będące 
galaktyki  N silnymi  radioźródłami,  galaktyki  typu  N,  które  różnią 
się  od  galaktyk  Seyferta  pewnymi  cechami  widmowy- 
mi i jeszcze  większym  stosunkiem  jasności  jądra  do 
lacerłydy  dysku,  wreszcie  — odkryte  kilka  lat  temu  lacertydy, 
nazywane  czasem  ogniwem  pośrednim  między  galak- 
tykami i kwazarami.  Na  zdjęciach  kilku  spośród  ok. 
30  znanych  obecnie  lacertyd  można  dostrzec  ślady 
otoczki  świecącej  niezwykle  słabo  w porównaniu 
z jądrem.  Pozostałe  obiekty  różnią  się  od  kwazarów 
tylko  własnościami  spektralnymi:  w dziedzinie  radio- 
wej wysyłają  o wiele  więcej  promieniowania  krótko- 
falowego, zaś  ich  widma  optyczne  są  całkowicie  poz- 
bawione charakterystycznych  dla  kwazarów  linii  emi- 
syjnych i absorpcyjnych.  Jasność  optyczna  lacertyd 
zmienia  się  nieregularnie  w dużym  zakresie;  w ciągu 
jednej  nocy  może  wzrosnąć  lub  zmaleć  nawet  o kilka- 
dziesiąt procent.  Na  tej  podstawie  przypuszcza  się,  iż 
jądro  lacertydy  jest  mniejsze  niż  jądro  kwazara,  a jego 
rozmiary  nie  przekraczają  paru  dni  świetlnych.  Fale 
elektromagnetyczne  wysyłane  przez  lacertydy  są  silnie 
spolaryzowane,  przy  czym  zarówno  stopień  jak  i 
i płaszczyzna  polaryzacji  zmieniają  się  w czasie.  Włas- 
ności widmowe  jąder  lacertyd  są  nadal  nieznane 
(brak  linii);  natomiast  uzyskane  niedawno  widma 
otoczek  okazały  się  niemal  takie  same  jak  widma  ga- 
laktyk. Fakt  ten  oraz  cechy  morfologiczne  otoczek 
przesądziły  o uznaniu  lacertyd  za  olbrzymie  galaktyki 
eliptyczne  z aktywnymi  jądrami.  Galaktykami  spiral- 
nymi o aktywnych  jądrach  są  natomiast  obiekty  kla- 
syfikowane jako  galaktyki  Seyferta,  galaktyki  N 
oraz  — prawdopodobnie  — kwazary. 
jądra  w fazie  Całkowitą  ilość  energii  wyzwolonej  w jądrach  w fa- 
aktywisości  zach  aktywności  ocenia  się  na  1019-1053  J.  Jest  to 
energia,  jakiej  mogłaby  dostarczyć  anihilacja  kilkuset 
tysięcy  Słońc.  W fazie  aktywności  jądro  musi  więc 
utracić  znaczną  część  masy.  Prowadzi  to  zapewne  do 
zaniku  aktywności. 

Wyjątkowo  gwałtowne  procesy  zdają  się  prowadzić 
do  rozpadu  jąder:  znane  są  galaktyki  o jądrach  pod- 
dwójnych.  Inne  (wśród  nich  najokazalsza  w gromadzie 
Virgo  M 87  — il.  227,  tabl.  62)  ukazują  obserwatorom 
wybiegające  z centrów  słupy  materii,  w których  tkwią 
bardzo  podobne  do  jąder  zagęszczenia.  Dobrym  przy- 
kładem aktywności  polegającej  na  rozpadzie  jąder  są 
radio-  radiogalaktyki  klasyczne.  Mają  one  po  kilka  zwartych 
galaktyki  centrów  emisji  radiowej  leżących  na  jednej  prostej. 

Należy  do  nich  m.in.  galaktyka  NGC  5128  (Centaurus 
A;  ii.  232,  tablica  63).  Moc  promieniowania  radioga- 
laktyk  jest  dziesiątki  i setki  milionów  razy  większa  niż 
moc  promieniowania  Słońca  we  wszystkich  zakresach. 
Centra  emisji  radiowej,  ułożone  na  jednej  prostej,  mo- 
gą oddalać  się  od  galaktyki  macierzystej  na  odległości 
wielokrotnie  przekraczające  jej  rozmiary,  zawsze 
jednak  jedno  z centrów  pokrywa  się  ze  środkiem  ga- 
laktyki. Jest  ono  prawdopodobnie  jądrem  pierwotnym, 
które  w fazie  aktywności  wyrzuciło  szereg  jąder  wtór- 
nych, obserwowanych  dziś  jako  pozostałe  centra  ra- 
diowe. Przy  znikomo  małych  rozmiarach  jąder  cał- 
kowitą tajemnicą  pozostaje  nadal  mechanizm  wyzwa- 
lania energii. 

Zgodnie  z hipotezami  roboczymi  jądra  galaktyk 
mogą  być  czarnymi  dziurami,  supermasywnymi  dys- 
kami bądź  supermasywnymi  gwiazdami  mającymi  sil- 
ne pola  magnetyczne  (-►  Czarne  dziury  i zapadanie 
grawitacyjne). 


Współczesne  poglądy  na  temat 
ewolucji  galaktyk 

Wszystkie  galaktyki  zawierają  gwiazdy  populacji 
II  powstałe  bardzo  dawno.  Nie  zaobserwowano  żad- 
nego obiektu,  który  można  by  uznać  za  galaktykę 
powstającą.  Oznacza  to,  iż  epoka  formowania  się  ga- 
laktyk już  się  skończyła  i że  wszystkie  galaktyki  mają 
mniej  więcej  ten  sam  wiek.  Miejsce  zajmowane  przez 
galaktykę  na  ciągu  Hubble’a  zależy  tylko  od  warun- 
ków panujących  w czasie  i miejscu  jej  powstania,  a nie 
od  czasu,  jaki  upłynął  od  chwili  powstania.  Jej  typ 
morfologiczny  zostaje  określony  przez  warunki  po- 
czątkowe i pozostaje  niezmieniony  w trakcie  ewolucji. 

Galaktyki  powstały  najprawdopodobniej  wskutek 
istnienia  niestabilności  w jednorodnym  pierwotnie 
ośrodku  kosmicznym.  Innej  możliwości  zapropono- 
wać obecnie  nie  można,  chociaż  żadna  z licznych  teorii 
kosmologicznych  nie  potrafiła  dotychczas  podać  me- 
chanizmu powstawania  takich  niejednorodności 
ośrodka,  których  masy  byłyby  równe  masom  galak- 
tyk. Najmniejsze  niejednorodności  otrzymywane  w 
różnych  modelach  Wszechświata  mają  masy  bogatych 
gromad  galaktyk.  Problem  powstawania  niejednorod- 
ności o odpowiednich  masach  (tzw.  protogalaktyk)  protogalak- 
jest  nadal  otwarty.  Pomijając  tę  zasadniczą  trudność  tykć 
dalszy  ciąg  ewolucji  można  opisać  dość  logicznie, 
choć  na  razie  tylko  jakościowo.  Protogalaktyka  jest 
opisana  takimi  parametrami  i funkcjami  jak:  masa, 
rozkłady  momentu  pędu,  gęstości  i temperatury,  pole 
magnetyczne  oraz  turbulencja  (czyli  mikroskopowe 
ruchy  wirowe,  powstające  samorzutnie  na  pewnym 
etapie  ewolucji  ośrodka  kosmicznego).  Niestabilności 
turbulentne  zabezpieczają  protogalaktyki  przed  nie- 
ograniczonym zapadaniem  się  grawitacyjnym,  mogą- 
cym doprowadzić  do  powstania  czarnej  dziury  i dają 
początek  wszechobecnemu  w galaktykach  ruchowi 
obrotowemu.  Im  większa  jest  masa  protogalaktyki, 
tym  szybsza  jest  kontrakcja  i tym  łatwiej  dochodzi  do 
rozpadu  protogalaktyki  na  mniejsze  obiekty,  dające 
być  może  początek  galaktykom  satelitarnym  i groma- 
dom kulistym.  Pole  magnetyczne  utrudnia  rozpad 
protogalaktyki,  zaś  wysoka  temperatura  i duża  tur- 
bulencja spowalniają  kontrakcję  Wyzwalająca  się 
podczas  kontrakcji  energia  grawitacyjna  jest  prze- 
kształcana w energię  termiczną  i promienistą.  Część 
jej  zostaje  zużyta  na  dysocjację  cząstek  i jonizację 
atomów.  Jednocześnie  trwa  proces  separacji  materii 
obdarzonej  różnymi  wartościami  momentu  pędu. 

W centralnych  częściach  protogalaktyki,  które  zapa- 
dają się  najszybciej,  grupuje  się  materia  o małej 
energii  i niewielkim  momencie  pędu.  Materia  o du- 
żych wartościach  momentu  pędu  (o  ile  w ogóle  znaj- 
duje się  w protogalaktyce)  tworzy  dysk  otaczający 
kuliste  centrum.  W całej  masie  protogalaktyki  lokalne 
niestabilności  grawitacyjne  prowadzą  do  powstania 
gwiazd  o bardzo  dużych  masach  i bardzo  krótkim 
czasie  życia.  Promieniowanie  ich  jest  dodatkowym 
czynnikiem  hamującym  kontrakcję  i źródłem  wtór- 
nych niestabilności,  które  zapoczątkowują  powstawa- 
nie nowych  gwiazd,  o znacznie  mniejszych  masach. 

Są  to  najstarsze  z obecnie  obserwowanych  gwiazd  II 
populacji. 

Okres  kontrakcji  protogalaktyki  i formowania  się  wiek 
gwiazd  II  populacji  jest  bardzo  krótki  w porównaniu  galaktyk 
z resztą  życia  galaktyki  i wynosi  zaledwie  100  min  lat. 

Po  tym  okresie  typ  morfologiczny  galaktyki  jest  już 
ustalony.  Wiek  galaktyk  ocenia  się  na  10—1 5 miliar- 
dów lat. 

Dobierając  różne  zestawy  parametrów  początko- 
wych można  otrzymać  modele  galaktyk  różniące  się 
kształtem,  zawartością  materii  międzygwiazdowej 
i składem  populacyjnym,  czyli  odtworzyć  wszystkie 
obserwowane  typy  morfologiczne.  Przedstawiony 
obraz  ewolucji  ma  jednak  zasadniczą  wadę:  nie  znaj- 
dują w nim  miejsca  jądra  galaktyk.  Okresy  aktyw- 
ności jąder  i wytwarzana  w nich  energia  nie  mogą  nie 
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zaważyć  na  przebiegu  ewolucji.  Dlatego  też  wszystko, 
co  się  obecnie  na  temat  ewolucji  galaktyk  mówi,  na- 
leży traktować  jako  pierwsze  przybliżenie,  z pewnością 
dalekie  jeszcze  od  rzeczywistości. 

T.A.  Agiekjan  Zwiezdy,  Galaktiki,  Metagalak tika,  Moskwa 
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Gwiazdy  zmienne  pulsujące 

Kazimierz  Stępień 


Prowadząc  systematyczne  obserwacje  gwiazd  astro- 
nomowie zauważyli,  że  jasność  wielu  z nich  zmienia 
się  w sposób  regularny.  W początkach  XIX  w.  znano 
już  kilkanaście  takich  gwiazd  i sądzono,  że  są  to 
układy  dwóch  gwiazd  krążących  wokół  siebie,  i okre- 
sowo zasłaniających  jedna  drugą.  Nazwano  je  gwiaz- 
dami podwójnymi  zaćmieniowymi.  W drugiej  połowie 
XIX  w.  podjęto  nowy  typ  obserwacji  — fotograficzne 
badania  widm  gwiazdowych.  Okazało  się  wówczas, 
że  linie  widmowe  niemal  wszystkich  badanych  gwiazd 
zmiennych  ulegają  okresowym  przesunięciom  wywo- 
^ lanym  efektem  Dopplera,  potwierdzając  hipotezę 
zaćmieniowości.  Obserwacje  jednej  gwiazdy  — 5 
;epnei  Cephei  — wykazywały  wprawdzie  również  okresowy 
efekt  Dopplera,  ale  nie  były  zgodne  z modelem 
gwiazdy  podwójnej.  W początkach  XX  w.,  gdy  umia- 
no już  określać  rozmiary  gwiazd,  okazało  się  z obli- 
czeń, że  hipotetyczna  orbita  S Cephei  musiałaby  być 
10  razy  mniejsza  od  jej  promienia.  Ta  sprzeczność 
ostatecznie  obaliła  hipotezę  o podwójności  ó Cephei. 
A więc  przesunięcie  linii  widmowych  oznaczało  okre- 
sowe rozszerzanie  się  i kurczenie  gwiazdy.  W ten  spo- 
sób odkryto  nową  klasę  gwiazd  zmiennych  — gwiazdy 
pulsujące.  Określimy  je  jako  gwiazdy,  które  zmieniają 
swoją  jasność  oraz  inne  parametry  fizyczne  w sposób 
regularny,  spowodowany  zmianami  swoich  rozmiarów 
lub  kształtu.  W późniejszych  latach  okazało  się,  że 
istnieje  wiele  typów  gwiazd  pulsujących  zasadniczo 
różniących  się  od  siebie.  Nazwę  cefeidy  z dodatkiem 


Dane  obserwacyjne 

Informacje  zawarte  w tym  paragrafie  pochodzą 
z obserwacji  fotometrycznych  i widmowych.  Obserwa- 
cje fotometryczne  polegają  na  pomiarach  w różnych 
barwach  strumienia  promieniowania  docierającego  do 
nas  od  gwiazdy  i jego  zmian  czasowych  (krzywa 
zmian  jasności).  Światło  gwiazdy  można  również 
rozszczepić  za  pomocą  pryzmatu  lub  siatki  dyfrakcyj- 
nej i zarejestrować  np.  na  kliszy  fotograficznej.  Otrzy- 
mując wiele  takich  widm  dla  gwiazdy  pulsującej  wy- 
znaczymy skład  chemiczny,  temperaturę  i krzywą 
zmian  prędkości  radialnej.  Przy  wykorzystaniu  mo- 
deli gwiazd  oba  rodzaje  obserwacji  umożliwiają  wy- 
znaczenie promieni,  mas  i jasności  absolutnych  (cał- 
kowitej ilości  energii  wypromieniowanej  przez  gwiaz- 
dę w ciągu  sekundy). 

Omówimy  teraz  poszczególne  typy  gwiazd  pulsu- 
jących. Ich  średnie  parametry  fizyczne  podaje  pierw- 
sza tabela.  Jasność  absolutna,  masa  i promień  podane 
są  w stosunku  do  jasności,  masy  i promienia  Słońca, 
traktowanych  jako  jednostki.  W drugiej  tabeli  podane 
są  typowe  amplitudy  zmian  parametrów  fizycznych 
gwiazd  pulsujących. 

Cefeidy  klasyczne.  Należą  do  najjaśniejszych  gwiazd  csfeidy 
nieba.  Są  nadolbrzymami  I populacji  (-►  Galaktyki),  klasyczne 
a więc  zawartość  pierwiastków  ciężkicn  w ich  atmo- 
sferach sięga  paru  procent.  Amplituda  zmian  blasku 
wynosi  najczęściej  czyli  gwiazda  jest  w maksi- 


Średnie  parametry  fizyczne  gwiazd  pulsujących  radialnie 


Wielkość 

Cefeidy  klasyczne 

Cefeidy  typu  W 
Wirginis 

RR  Lyrae 

Cefeidy  karłowate 

Gwiazdy  typu 
6 Scuti 

Okres  (dób) 

Jasność  absolutna  (L/L®) 
Masa  (i W/M®) 

Promień  (/?//?  ®) 
Temperatura  (K) 

1-50 

380-31000 

3,7-14 

14-200 

6900-5400 

1-50 

100-8000 
0,5-1 ,0 
14-200 
6500 

0,25-1 

40 

0,5-0, 7 
4-10 

7400-6400 

0,06-0,2 

2-6 

•» 

2-4 

7500 

0,06-0,2 

2-6 

1, 5-2,5 
2-4 
7500 

Ty  powe  amplitudy  zmian  par; 

a metrów  fizycznych  gwiazd  pulsujący 

ch  radialnie 

Amplituda 

Cefeidy  klasyczne 

Cefeidy  typu  W 
Wirginis 

RR  Lyrae 

Cefeidy  karłowate  ' 

I 

Gwiazdy  typu 
Ó Scuti 

Jasności  (wielkość  gwiazdowa) 
Prędkości  radialnej  (km/s) 
Temperatury  (K) 

Promienia  (%) 

1-1.5 

40 

1000 

10-15 

1-1,5 

60 

1000 

20 

0,5-1, 8 
20-60 
500-1500 
5-15 

0, 2-1,0 
20-40 
500 
5 

0,05-0,10 

10-20 

< 500 

< 5 

klasyczne  zachowano  dla  gwiazd  pulsujących  podob- 
nych do  S Cephei.  Ponadto  wprowadzono  nazwy: 
cefeidy  typu  W Wirginis,  gwiazdy  typu  RR  Lyrae, 
cefeidy  karłowate  i gwiazdy  typu  S Scuti.  Wszystkie  te 
gwiazdy  leżą  w tzw.  klasycznym  pasie  niestabilności 
(o  czym  powiemy  dalej),  pulsują  radialnie  i one  będą 
głównym  tematem  niniejszego  artykułu.  Oprócz  nich 
znamy  jeszcze  gwiazdy  typu  /S  Cephei,  których  pul- 
sacje  polegają  na  zmianie  kształtu  (pulsacje  niera- 
dialne),  a ich  mechanizm  jest  zupełnie  inny  niż 
u klasycznych  gwiazd  pulsujących.  Wspomnimy  jesz- 
cze krótko  o gwiazdach  typu  RV  Tauri  i typu  Mira 
Ceti,  które  też  zmieniają  swoje  rozmiary,  ale  zmiany 
ich  nie  są  regularne  i powodowane  mało  znanym  me- 
chanizmem. 
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mum  3-4  razy  jaśniejsza  niż  w minimum,  chociaż 
istnieją  też  cefeidy  o amplitudzie  zaledwie  kilku  set- 
nych wielkości  gwiazdowej  (np.  Gwiazda  Polarna). 
Druga  tabela  podaje  również  amplitudy  zmian  in- 
nych parametrów  fizycznych,  a rys.  1 przedstawia  te 
zmiany  w formie  graficznej. 

W 1912  r.  amer.  astronom  H.  S.  Leavitt  odkryła 
ważną  zależność  między  okresem  zmian  blasku 
i jasności  absolutnej  cefeid.  Zależność  ta  w swej  współ- 
czesnej postaci  jest  przedstawiona  na  rys.  2.  Jeżeli  więc 
kiedykolwiek  zaobserwujemy  cefeidę  i wyznaczymy 
dla  niej  okres  (co  można  zrobić  bez  trudu  z dużą  do- 
kładnością), to  z tej  zależności  możemy  od  razu  od- 
czytać, jaką  ma  ona  absolutną  wielkość  gwiazdową  M. 
Z drugiej  strony,  łatwo  możemy  wyznaczyć  widomą 


wielkość  gwiazdową  m.  Obie  te  wielkości  powiązane 
są  ze  sobą  prostą  zależnością: 

m = M-f  5 \gr—5+A (r). 

We  wzorze  tym  r jest  odległością  do  gwiazdy,  a A 
jest  wartością  ekstynkcji  międzygwiazdowej.  Ekstynk- 
cja ta  wywołana  jest  przez  materię  międzygwiazdową, 
która  pochłania  „po  drodze”  część  światła  wysyła- 
nego przez  gwiazdę.  Wielkość  A wyznacza  się  indy- 
widualnie dla  każdej  gwiazdy.  Dla  cefeid  istnieje 
prosta  i dokładna  metoda  wyznaczania  A z pomiarów 
jasności  gwiazdy  w określonych  obszarach  widmo- 
wych wycinanych  za  pomocą  filtrów  barwnych.  W ten 
sposób  znając  m,  M i A możemy  wyznaczyć  odległość 
do  badanej  cefeidy.  Ponieważ,  jak  wspominaliśmy, 
cefeidy  należą  do  najjaśniejszych  gwiazd  nieba,  wi- 
doczne są  z olbrzymich  odległości.  Wiele  z nich  obser- 
wujemy w sąsiednich  galaktykach  i dzięki  zależności 
okres-jasność  można  było  wyznaczyć  ich  odległości. 


Wszechświata.  Zatem  związek  między  jasnością  i okre- 
sem cefeid  jest  podstawą  wyznaczania  skali  odległości 
we  Wszechświecie.  W ciągu  ostatnich  kilkudziesięciu 
lat  związek  ten  był  wielokrotnie  rewidowany  i po- 
prawiany w miarę  napływu  coraz  dokładniejszych 
obserwacji,  a wraz  z nim  odpowiednio  „kurczyła  się” 
i „rozszerzała”  znana  nam  część  Wszechświata. 

Cefeidy  typu  W Wirginis.  Przez  długi  czas  cefeidy  cefeidy 
tego  typu  rozpatrywano  łącznie  z cefeidami  klasycz-  typu 
nymi.  Spowodowane  to  było  faktem,  że  obserwacyj-  W Wirginis 
nie  wyglądają  one  bardzo  podobnie.  Okresy  i ampli- 
tudy zmian  blasku  są  takie  same,  a kształt  krzywych 
blasku  zbliżony,  co  przy  fotograficznych  metodach 
wykrywania  cefeid  uniemożliwiało  rozróżnienie  oby- 
dwu typów  zmiennych.  Łączne  ich  traktowanie  spo- 
wodowało olbrzymi  rozrzut  na  diagramie  okres-jas- 
ność i wydawało  się,  że  tak  niedokładna  zależność 
będzie  bezużyteczna.  Dopiero  dokładniejsze  obser- 
wacje widmowe  wykazały,  że  między  cefeidami  kla- 
sycznymi i cefeidami  typu  W Wirginis  istnieją  duże 


Am 


Rys.  I.  Zmiany  jasności  Am  (w  wielkościach  gwiazdowych),  temperatury  7*(w  kelwinach)  i prędkości  radialnej  Vr(w  km/s)  orazoblicznnc 
na  ich  podstawie  zmiany  promienia  R gwiazdy  <5  Ccphei.  Punkty  odpowiadają  obserwacjom  w różnych  fazach  okresu  pulsacji.Faza  po- 
dana jest  w ułamkach  okresu 


Rys.  2.  Zależność  między  logarytmem  okresu  P i absolutną  wiel- 
kością gwiazdową  M dla  cefeid  i gwiazd  typu  RR  Lyrae.  Zakre- 
skowane  są  obszary,  w których  układają  się  punkty  obserwacyjne 


Obserwacje  tych  najbliższych  galaktyk  pozwoliły  na- 
stępnie znaleźć  zależności  między  prędkością  ucieczki 
galaktyki  mierzonej  z przesunięcia  prążków  w widmie 
gwiazdy  ku  czerwieni,  a odległością  do  niej.  Jest 
prawo  to  tzw.  prawo  Hubble’a.  Prawo  Hubble’a  stosuje 
Kubh!e’a  się  do  wyznaczania  odległości  dalszych  obiektów 


różnice.  Krzywe  prędkości  radialnych  tych  ostatnich 
wyglądają  zupełnie  inaczej,  gdyż  mają  nieciągłość 
spowodowaną  okresowym  rozszczepianiem  się  nie- 
których linii  widmowych  na  dwa  składniki  o różnych 
prędkościach.  Analiza  widmowa  oraz  analiza  rozkła- 
du tych  gwiazd  w Galaktyce  wykazały,  że  należą  one 
do  11  populacji  i są  bardzo  ubogie  w pierwiastki  cięż- 
kie, gdyż  ich  zawartość  w atmosferach  gwiazd  typu 
W Wirginis  jest  rzędu  0,1  %.  Po  rozróżnieniu  obu 
typów  na  diagramie  okres-jasność  okazało  się,  że 
dają  one  dwie  zależności  odległe  o ok.  1?*4  i że  we- 
wnątrz każdej  zależności  rozrzut  jest  już  niewielki 
(rys.  2). 

Gwiazdy  typu  RR  Lyrae.  Są  to  podolbrzymy  II  gwiazdy 
populacji.  Mają  znacznie  krótsze  okresy  od  cefeid  typu 
i rozróżniamy  wśród  nich  dwa  podstawowe  typy  RR  Lyraa 
określane  symbolami  ab  i c.  Symbol  ab  pochodzi  stąd, 
że  pierwotnie  rozróżniano  trzy  typy:  ay  b i c,  lecz  póź- 
niej okazało  się,  że  gwiazdy  typów  a i b nie  różnią  się 
między  sobą  fizycznie.  Zmienne  typu  c mają  okresy 
zawarte  pomiędzy  0?25  i 0?4  i niemal  sinusoidalne 
krzywe  blasku  o amplitudzie  około  0?5  (rys.  3). 

Zmienne  typu  ab  mają  okresy  między  0?3  i 1?0  i asy- 
metryczne krzywe  blasku  o amplitudach  od  0?7  do 
1?8  (rys.  4). 

Niektóre  z gwiazd  typu  ab  wykazują  długookresowe 
zmiany  kształtu  krzywej  blasku,  a nawet  okresu  pod- 
stawowego (tj.  okresu  pulsacji).  Przykładowo,  gwiaz- 
da RR  Lyrae  — prototyp  omawianej  grupy  zmien- 
nych — ma  podstawowy  okres  zmian  nieco  ponad  pół 
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Rys.  3.  Krzywa  zmian  jasności  i prędkości  radialnej  T Sextansis, 
gwiazdy  typu  RRc 


A m 


Rys.  4.  Krzywa  zmian  jasności  i prędkości  radialnej  SU  Draconis 
gwiazdy  typu  RRab 


doby,  lecz  długość  tego  okresu  oraz  kształt  i amplitu- 
da krzywych  blasku  i prędkości  radialnej  zmieniają 
się  z okresem  około  41<h  Przyczyny  tych  długookreso- 
wych zmian,  określanych  mianem  efektu  Błażko,  są 
dotychczas  zupełnie  nieznane. 

cefeidy  Ccfeidy  karłowate  albo  gwiazdy  typu  A!  Ve!orum. 
karłowate  Zmienne  te  mają  jeszcze  krótsze  okresy  niż  gwiazdy 
typu  RR  Lyrae.  Są  gwiazdami  populacji  pośredniej. 
Wykazują  silny  efekt  Błażko.  Niestety,  znamy  sto- 
sunkowo niewiele  gwiazd  należących  niewątpliwie  do 
tego  typu  i dlatego  nasza  wiedza  o parametrach  fizycz- 
nych tych  gwiazd  jest  dość  fragmentaryczna.  Najbar- 
dziej niepewne  są  wartości  ich  mas,  gdyż  zależą  one 
od  modeli  teoretycznych  i przyjętej  fazy  ewolucyjnej. 
Wielu  astronomów  uważa,  że  cefeidy  karłowate  są 
fizycznie  identyczne  z gwiazdami  typu  S Scuti  i podział 
na  typy  jest  sztuczny.  Inni  jednak  uważają,  że  są  one 
w różnych  fazach  ewolucyjnych  i mają  różne  masy. 
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Gdyby  tak  było,  masy  cefeid  karłowatych  wynosiłyby 
zaledwie  około  0,2A/®. 

Gwiazdy  typu  S Scuti.  Charakterystyki  obserwa-  gwiazdy 
cyjne  tych  gwiazd  są  bardzo  podobne  do  cefeid  karło-  typu 
watych  — różni  je  tylko  amplituda  zmian  blasku,  <5  Scuti 
która  jest  rzędu  kilku  procent,  choć  zdarzają  się  wy- 
jątki. Gwiazd  typu  ó Scuti  znamy  niewiele  i dlatego 
dane  o nich  są  dość  niepewne.  Co  do  ich  mas  panuje 
jednak  raczej  zgodna  opinia,  że  wynoszą  one  1,5- 
2,5  M®. 

Gwiazdy  typu  fi  Cephei  albo  fi  Canis  Majoris. 

Wszystkie  omówione  dotychczas  typy  gwiazd  pulsu- 
jących tworzą  jakby  jedną  wspólną  klasę  ze  względu 
na  identyczny  mechanizm  pulsacji,  natomiast  gwiazdy 
typu  fi  Cephei  należy  rozpatrywać  oddzielnie.  Wiemy, 
że  zachodzą  w nich  pulsacje  nieradialne  (polegające 
nie  na  kurczeniu  się  i rozszerzaniu,  lecz  na  okresowym 
odkształcaniu  się  gwiazd).  Niestety  wszelkie  próby 
wskazania  mechanizmu,  który  mógłby  takie  pulsacje 
podtrzymywać  kończyły  się  dotychczas  niepowo- 
dzeniem. Wiemy  jednak  na  pewno,  że  nie  może  to 
być  ten  sam  mechanizm,  co  we  wcześniej  omawianych 
gwiazdach. 

Gwiazdy  typu  fi  Cephei  mają  okresy  rzędu  kilku  gwiazdy 
godzin  (od  0?15-0?25)  i amplitudy  zmian  blasku  rzę-  typu 
du  kilku  procent.  Krzywe  blasku  zmieniają  się  fi  C&phei 
w dłuższej  skali  czasowej,  a zmiany  te  można  interpre- 
tować jako  nałożenie  się  dwu  bliskich  okresowości 
(np.  w przypadku  fi  Canis  Majoris  — o okresach 
6h  00-  i 6h02m).  Są  one  raczej  gorące,  gdyż  ich  tempe- 
ratury sięgają  25  000  K,  i jasne  — parę  tysięcy  jaś- 
niejsze od  Słońca.  Należą  do  I populacji  i mają  masy 
kilkanaście  razy  większe  od  Słońca.  Absolutna  wiel- 
kość gwiazdowa  gwiazdy  typu  fi  Cephei  rośnie  przy 
dłuższych  okresach,  podobnie  jak  w przypadku  cefeid. 

Gwiazdy  typu  RV  Tauri  i Mira  Ceti.  Jasności  gwiazdy 
gwiazd  należących  do  tych  typów  nie  zmieniają  się  re-  typu 
gularnie  i dlatego  nie  są  objęte  zakresem  tematycznym  RV  Tauri 
artykułu.  Ponieważ  jednak  zmienność  ich  wiąże  się  i JVlśra  Ceti 
zapewne  ze  zmianami  promienia,  przedstawimy  krót- 
ko ich  charakterystyki  obserwacyjne.  Są  to  chłodne 
olbrzymy  i nadoibrzymy  o temperaturach  2000-4000  K 
należące  do  populacji  pośredniej,  lub  nawet  II 
o kwaziokresach  rzędu  100  dni  (/?F  Tauri),  czy  rzędu 
roku  lub  więcej  (Mira  Ceti),  dużej  amplitudzie  zmian 
blasku  i masach  prawdopodobnie  ok.  1,5-2A/®. 


Teoria  pulsacji 

Postaramy  się  wyjaśnić  dlaczego  niektóre  gwiazdy 
zmieniają  okresowo  swoje  rozmiary,  a wraz  z nimi 
inne  parametry  fizyczne.  Rozpatrzmy  w tym  celu 
zewnętrzne  warstwy  typowej  gwiazdy.  Na  powierzchni 
jej  panuje  temperatura  kilku  tysięcy  stopni.  W tej 
temperaturze  praktycznie  cały  wodór  i hel  są  niezjo- 
nizowane.  Natomiast  w coraz  głębszych  warstwach 
temperatura  gazu  jest  coraz  większa.  Wraz  z tempera- 
turą rośnie  stopień  jonizacji  gazu,  aż  w temperaturze 
ok.  trzydziestu  tysięcy  stopni  cały  wodór  i hel  jest 
zjonizowany.  Przeszliśmy  więc  przez  warstwę  częścio- 
wej jonizacji  wodoru  i pierwszej  jonizacji  helu.  Prze- 
suwając się  dalej  w głąb  gwiazdy  natrafiamy  na  jeszcze 
wyższe  temperatury,  aż  w okolicy  50  000  K,  przecho- 
dzimy przez  warstwę  drugiej  jonizacji  helu.  Oczywiście 
przy  przesuwaniu  się  w głąb  rośnie  również,  i to  szyb- 
ko, gęstość.  Wskutek  tego  w warstwie  drugiej  joni- 
zacji helu  znajduje  się  znacznie  więcej  materii  niż 
w rzadkiej  warstwie  jonizacji  wodoru  i pierwszej  helu. 
W jeszcze  głębszych  warstwach  cały  wodór  i hel  są 
całkowicie  pozbawione  elektronów. 

Temperatura  każdej  kolejnej  warstwy  określona 
jest  przez  równowagę  między  energią  pochłoniętą  od 
dołu  i wysłaną  do  góry.  Odbywa  się  to  tak : we  wnętrzu 
gwiazdy  produkowana  jest  w reakcjach  jądrowych 
energia  w postaci  wysokoenergetycznych  kwantów 
promieniowania  elektromagnetycznego.  Warstwa  le- 
żąca bezpośrednio  nad  jądrem  jest  nieprzezroczysta 


dla  tego  promieniowania  i pochłania  je.  Aby  nie 
ogrzewać  się  w nieskończoność,  musi  dokładnie  tyle 
samo  energii  wypromieniować  ile  pochłonęła.  Pro- 
mieniuje zaś  zgodnie  z prawem  promieniowania  dla 
ciała  doskonale  czarnego,  przyjmując  taką  temperatu- 
rę, jaka  zapewnia  jej  równowagę  cieplną.  Następna 
warstwa  jest  też  nieprzezroczysta  i pochłania  pro- 
mieniowanie warstwy  spodniej  emitując  je  w nieco  in- 
nym zakresie  widmowym  (gdyż  jej  temperatura  jest 
nieco  niższa  niż  warstwy  leżącej  pod  nią).  Proces  po- 
chłaniania i reemisji  zachodzi  w ten  sposób  w kolej- 
nych warstwach  gwiazdy  mających  coraz  to  niższą 
temperaturę,  aż  wreszcie  ostatnia  warstwa  wysyła 
promieniowanie  w przestrzeń. 

przemiana  Zastanówmy  się,  co  będzie,  jeśli  część  gazu  gwiaz- 
termodyna*  dowego  znajdującego  się  w różnych  miejscach  gwiazdy 
miczna  gazu  poddamy  przemianie  termodynamicznej  polegającej 
zjonizowa-  na  ściśnięciu  i następnie  rozprężeniu.  Gorący  i zjoni- 
nego  zowany  gaz  leżący  głęboko  można  traktować  jak  gaz 
niemal  doskonały,  tak  że  ściśnięcie  i rozprężenie  go 
jest  przemianą  adiabatyczną.  Przy  takiej  przemianie 
nie  tracimy  ani  nie  zyskujemy  energii  mechanicznej. 
Zachowanie  się  gazu  z warstw  zewnętrznych  jest  inne. 
Z dokładnych  badań  wynika,  że  nieprzeźroczystość 
maleje  ze  wzrostem  temperatury,  a ponieważ  ściśnię- 
cie gazu  spowoduje  jego  ogrzanie,  tym  samym  będzie 
on  pochłaniał  mniej  energii  niż  poprzednio,  nato- 
miast emitować  będzie  więcej.  Stan  taki  nie  może 
trwać  długo  — gaz  ęmitując  ochłodzi  się,  ale  do  tem- 
peratury wyższej  niż  miał  przed  ściśnięciem,  i przejdzie 
w nowy  stan  równowagi  cieplnej,  w którym  tyle  emi- 
tuje, co  pochłania.  Jeżeli  teraz  pozwolimy  mu  się  roz- 
prężyć, odda  nam  mniej  energii  niż  włożyliśmy  w jego 
sprężenie.  Przy  wielokrotnym  ściskaniu  i rozprężaniu 
gaz  będzie  pochłaniał  energię  mechaniczną  zamienia- 
jąc ją  na  ciepło. 

przemiana  Rozpatrzmy  podobnie  gaz  znajdujący  się  w war- 
termodyna-  stwie  częściowej  jonizacij.  Gdy  ściśrJemy  go  adabia- 
miczna  gazu  tycznie,  temperatura  wzrośnie  o wiele  mniej  niż  w po- 
częścżowo  przednim  przykładzie.  Energia,  którą  włożyliśmy  ści- 
zjonizowa-  skając  gaz,  zostanie  w znacznej  części  zamieniona  na 
nego  energię  jonizacji  wielu  dodatkowych  atomów,  a tylko 
niewielka  jej  część  wywoła  wzrost  temperatury.  Na- 
wet gdyby  nieprzezroczystość  tej  warstwy  malała  wraz 
z temperaturą  w tym  samym  stopniu  co  dla  gazu  zjc- 
nizowanego,  to  przebieg  przemiany  termodynamicz- 
nej byłby  inny.  Tymczasem  zależność  ta  jest  odwrot- 
na — im  gaz  częściowo  zjonizowany  jest  gorętszy, 
tym  silniej  pochłania  promieniowanie.  Ściśnięty  gaz 
będzie  pochłaniał  coraz  więcej  promieniowania,  bę- 
dzie ogrzewał  się  (równocześnie  będzie  rósł  stopień  jo- 
nizacji), co  wywoła  jeszcze  silniejsze  pochłanianie  itd. 
W efekcie  energia  dostarczana  od  dołu  będzie  groma- 
dzona w warstwie  częściowej  jonizacji.  Proces  taki  nie 
może  przebiegać  nieskończenie  długo  — ograniczą  go 
różne  zjawiska  dodatkowe  (tzw.  efekty  nieliniowe), 
np.  fakt,  że  w pewnym  momencie  gaz  zjonizuje  się 
całkowicie.  Gdy  pozwolimy,  by  ściśnięty  gaz  rozprężył 
się  i wykonał  pracę,  jego  temperatura  w trakcie  roz- 
prężania będzie  niemal  stała,  a więc  i ciśnienie  będzie 
znacznie  większe  niż  w przypadku  gazu  spoza  strefy 
częściowej  jonizacji.  Dzięki  temu  otrzymamy  więcej 
pracy  mechanicznej  niż  jej  włożyliśmy.  Nadwyżka 
powstanie  wskutek  przemiany:  energia  promienista  — 
energia  jonizacji  — energia  wewnętrzna  — energia 
mechaniczna.  Wystarczy  więc,  by  warstwę  częściowej 
jonizacji  ścisnąć  dowolnie  mało,  a rozpręży  się  znacz- 
nie silniej.  W gwieździe,  jak  w każdym  układzie  fizycz- 
nym, wszystkie  wielkości  fizyczne  ulegają  stale  drob- 
nym wahaniom,  czyli  tzw.  fluktuacjom  — nietrudno 
zatem  o powstanie  „pierwszego  pchnięcia”.  Rozprę- 
żająca się  warstwa  częściowej  jonizacji  ciśnie  na 
warstwy  leżące  pod  nią  i unosi  w górę  warstwy 
wierzchnie  (też  zresztą  je  ściskając).  Obydwie  te  war- 
stwy pochłaniają  część  przekazanej  im  energii,  a jed- 
nocześnie rozprężając  się  cisną  ponownie  na  warstwę 
częściowej  jonizacji,  która  oddaje  im  energię  mecha- 
niczną z nadwyżką  powiększając  amplitudę  wahań. 


W ten  sposób  będą  stopniowo  narastać  pulsacje. 

Oczywiście  ich  amplituda  nie  będzie  wzrastać  nieskoń- 
czenie. Wystąpią  różne  efekty  nieliniowe  i w końcu 
ustali  się  taka  amplituda  pulsacji  warstw  zewnętrznych 
gwiazdy,  przy  której  energia  generowana  w warstwie 
częściowej  jonizacji  będzie  dokładnie  równa  energii 
pochłanianej  w innych  warstwach  biorących  udział 
w ruchu. 

W pulsacjach  radialnych  biorą  udział  tylko  war-  warstwy 
stwy  zewnętrzne  (rys.  5).  Amplituda  drgań  szybko  pulsujące 
maleje  przy  przechodzeniu  do  głębszych  warstw,  tak 
że  wnętrze  gwiazdy  nie  bierze  w ogóle  udziału  w ru- 
chu. We  wnętrzu  jest  skupiona  niemal  cała  masa 
gwiazdy,  a w warstwach  biorących  udział  w ruchu 
znajduje  się  zaledwie  0,1%  masy  całej  gwiazdy,  mimo 
iż  rozciągają  się  one  do  połowy  promienia  gwiazdy. 


Rys.  5.  Rozmieszczenie  warstw  biorących  udział  w pulsacjach 
gwiazdy  pulsującej 


Narzuca  się  pytanie,  dlaczego  nie  pulsują  wszystkie  warunki 
gwiazdy?  Przecież  wszystkie  mają  warstwy  częściowej  pulsowania 
drugiej  jonizacji  helu,  a większość  (takie,  które  nie  gwiazd 
są  zbyt  gorące  na  powierzchni)  warstwę  częściowej 
jonizacji  wodoru  i pierwszej  helu.  Jeżeli  warstwy  te  są 
niestabilne  pulsacyjnie,  to  powinny  pobudzić  do  pul- 
sacji każdą  gwiazdę.  Odpowiedź  na  to  pytanie  dają 
dokładne  obliczenia  modeli  gwiazd  pulsujących.  Wy- 
nika z nich,  że  decydująca  dla  niestabilności  pulsacyj- 
nej gwiazdy  jest  głębokość,  na  jakiej  występuje  war- 
stwa drugiej  jonizacji  helu.  W gwiazdach  gorących 
leży  ona  płytko  pod  powierzchnią  i obejmuje  niewielką 
ilość  masy,  dlatego  jej  pojemność  cieplna  (określona 
przede  wszystkim  energią  jonizacyjną  wszystkich  ato- 
mów tej  warstwy)  jest  zbyt  mała,  by  móc  wytworzyć 
dostateczną  ilość  energii  mechanicznej  zdolnej  do 
„rozhuśtania”  sporej  części  gwiazdy  i zrównoważenia 
strat  energii.  Im  gwiazda  jest  chłodniejsza,  tym  głębiej 
znajduje  się  jej  warstwa  jonizacyjna  i zdolność  gwiazdy 
do  wytwarzania  energii  mechanicznej  szybko  rośnie. 

Przy  pewnej  temperaturze  energia  ta  wystarcza  do 
wywołania  pulsacji  gwiazdy.  Przy  jeszcze  niższej  tem- 
peraturze gwiazdy  warstwa  jonizacyjna  znajduje  się 
jeszcze  głębiej,  ale  ilość  energii  mechanicznej  genero- 
wanej przez  nią  rośnie  znacznie  wolniej,  natomiast 
straty  energii  stają  się  wyraźnie  większe.  Warstwa  jo- 
nizacyjna znów  nie  jest  w stanie  wywołać  pulsacji 
gwiazdy.  A więc  pulsują  tylko  te  gwiazdy,  w których 
warstwa  częściowej  jonizacji  helu  znajduje  się  w ściśle 
określonym  zakresie  głębokości,  czyli  tylko  w ściśle 
określonym  zakresie  temperatur  gwiazd.  Zakres  ten 
różni  się  nieco  dla  różnych  wartości  jasności  absolut- 
nych, co  daje  na  tzw.  diagramie  Hertzsprunga-Rus- 
sella,  na  którego  osiach  mamy  jasność  i temperatury 
gwiazd,  skośnie  nachylony  pas  niestabilności  (rys.  6).  pas  raie- 
Gdy  w czasie  ewolucji  gwiazda  osiągnie  wartość  tern-  stabilności 
peratury  i jasności  z pasa  niestabilności,  zacznie  pul- 
sować. Wychodząc  z tego  pasa  stanie  się  znów  gwiaz- 
dą o stałym  blasku.  Należy  dodać,  że  warstwa  częścio- 
wej jonizacji  wodoru  i pierwszej  helu  znajduje  się 
zawsze  bardzo  płytko,  o ile  w ogóle  istnieje,  i dlatego 
jej  rola  w podtrzymywaniu  pulsacji  jest  niewielka. 

Być  może  w niektórych  typach  gwiazd  (typu  R KTauri, 
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Rys.  6.  Diagram  Hertzsprunga-RusscIJa  z zaznaczonymi  grani- 
cami pasa  niestabilności  oraz  położeniem  głównych  typów  gwiazd 
pulsujących 


czy  Mira  Ceti)  warstwa  ta  ma  decydujące  znaczenie 
dla  ich  zmienności,  ale  przypuszczenie  to  nie  jest  do- 
tychczas poparte  odpowiednimi  obliczeniami  modelo- 
wymi. 

okres  Zastanówmy  się  jeszcze,  od  czego  zależy  okres  pul- 
pulsacji  sacji.  Wiemy,  że  dla  struny  drgającej  okres  zależy  od 
jej  długości  i siły  naciągu.  Analogami  tych  wielkości 
fizycznych  dla  gwiazdy  jest  jej  promień  R i siła  graw- 
tacji  wywołana  jej  masą  M.  Z obliczeń  wynika,  że 
okres  zależy  od  stosunku  M//?3,  który  z dokładnością 
do  stałej  jest  równy  średniej  gęstości  gwiazdy 
Mamy  więc: 

P -!/?*>  . 

gdzie  P jest  okresem  pulsacji.  Wyznaczając  go  w 
dniach  i odnosząc  średnią  gęstość  gwiazdy  do  średniej 
gęstości  Słońca  dostajemy: 

p = qvji nr- 

stała  stała  proporcjonalności  Q wyrażona  jest  w dniach 
pulsacyjna  i nazwana  stałą  pulsacyjną.  Zależy  ona  do  wewnętrz- 
nej struktury  gwiazdy,  ale  zmienia  się  niewiele  od 
gwiazdy  do  gwiazdy. 

Patrząc  na  ten  wzór  łatwo  zrozumiemy,  dlaczego 
cefeidy  — silnie  rozdęte  nadolbrzymy  o małej  gęstości 
średniej  — mają  tak  długie  okresy  pulsacji,  a np. 
gwiazdy  typu  3 Scuti  o rozmiarach  kilkadziesiąt  razy 
mniejszych,  a więc  i odpowiednio  większej  gęstości 
średniej,  mają  okresy  zaledwie  rzędu  kilku  godzin. 
Gdybyśmy  do  ostatniego  wzoru  wprowadzili  średnią 
gęstość  białego  karła  — gwiazdy  o masie  porówny- 
walnej ze  Słońcem  i promieniu  porównywalnym 
z Ziemią  — to  okazałoby  się,  że  okres  jego  pulsacji 
należy  mierzyć  w sekundach. 

Przypomnijmy  sobie  jeszcze  jedną  własność  drgają- 
cej struny.  Może  ona  drgać  w tonie  podstawowym, 
gdy  na  strunie  mamy  dwa  węzły  w punktach  zamoco- 
wania i strzałkę  pośrodku,  oraz  w tonie  wyższym 
(tzw.  pierwszym  tonie  harmonicznym),  gdy  mamy 


Rys  7.  Struna  drgająca  w tonie  podstawowym  (góra)  i pierw- 
szym tonie  harmonicznym  (dół) 
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trzeci  węzeł  pośrodku  i dwie  strzałki  (rys.  7).  Okres 
drgań  będzie  wtedy  oczywiście  krótszy.  Gwiazdy 
również  mogą  pulsować  zarówno  w tonie  podstawo- 
wym, jak  i w pierwszym,  a nawet  wyższych  tonach 
harmonicznych.  Jeżeli  okres  podstawowy  wynosi  dla 
gwiazdy  P0,  to  okres  drgań  w pierwszym  tonie  harmo- 
nicznym wynosi  w przybliżeniu: 

P = 3/4Po. 

Który  ton  jest  najbardziej  niestabilny  (i  który  tym 
samym  „wybierze”  gwiazda),  zależy  od  jej  budowy 
wewnętrznej.  Gwiazdy  RR  Lyrae  typu  c pulsują  w 
pierwszym  tonie  harmonicznym,  podczas  gdy  typu  ab 
w tonie  podstawowym.  Oczywiście  amplitudy  wszyst- 
kich zmian  w gwiazdach  typu  c są  mniejsze  niż  w 
gwiazdach  typu  ab.  Podany  powyżej  związek  między 
okresem  pulsacji  i średnią  gęstością  jest  słuszny  dla 
pulsacji  w dowolnym  tonie  harmonicznym,  tylko 
stałą  Q należy  odpowiednio  przeskalować. 


Faza  ewolucyjna  gwiazd  pulsujących 

Drogę  ewolucyjną  gwiazdy  najlepiej  można  prześle- 
dzić na  diagramie  Hertzsprunga-Russella  (H-R). 

Na  osi  odciętych  tego  diagramu  mamy  temperaturę 
gwiazdy  (w  skali  logarytmicznej)  lub  inny  parametr 
związany  z logarytmem  temperatury  (np.  typ  widmo- 
wy). Na  drugiej  osi  mamy  jasność  absolutną  gwiazdy, 
również  w skali  logarytmicznej,  lub  absolutną  wiel- 
kość gwiazdową,  proporcjonalną  do  logarytmu  jas- 
ności gwiazdy.  Jasność  i temperatura  dobrze  opisują 
gwiazdę,  a równocześnie  najłatwiej  porównać  je 
z obserwacjami.  Gwiazda  o danej  jasności  i tempera- 
turze jest  przedstawiona  na  diagramie  H-R  przez 
punkt.  Gdy  w czasie  ewolucji  gwiazdy  parametry  te  tor 
zmieniają  się,  punkt  zatacza  krzywą  zwaną  torem  ewolucyjny 
ewolucyjnym. 

Typowa  gwiazda  „spędza”  większość  swego  życia 
w fazie,  w której  w jej  wnętrzu  zachodzi  przemiana 
wodoru  w hel.  W tej  fazie  jasność  i temperatura  nie- 
mal nie  zmieniają  się  i są  jednoznacznie  określone 
przez  masę  gwiazdy.  Punkty  odpowiadające  gwiaz- 
dom o różnych  masach  nie  są  chaotycznie  rozsypane 
po  całym  diagramie,  lecz  układają  się  w jedną  linię 
nazwaną  ciągiem  głównym  (rys.  8).  Czas  przebywania  ciąg 
gwiazdy  na  ciągu  głównym  zależy  od  jej  masy  i wynosi  główny 


np.  od  100  000  lat  dla  gwiazd  masywnych  (rzędu 
20 A/©)  do  10  miliardów  lat  dla  gwiazd  o masie  rzędu 
masy  Słońca. 

Gdy  we  wnętrzu  gwiazdy  wypali  się  wodór,  wcho- 
dzi ona  w burzliwy  okres  ewolucji,  w którym  kolejne 


obszar 

czerwonych 

olbrzymów 


ewolucja 
gwiazd  mało 
masywnych 
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fazy  trwają  znacznie  krócej  niż  czas  życia  na  ciągu 
głównym.  Losy  gwiazdy  zależą  teraz  bardzo  od  jej 
masy.  Gwiazdy  masywne  żyją  znacznie  krócej  niż 
gwiazdy  lżejsze,  zatem  gwiazdy  o masach  równych 
wielu  masom  Słońca,  które  powstały  wiele  miliardów 
lat  temu,  są  już  bardzo  stare  w sensie  ewolucyjnym 
i dawno  zakończyły  swą  drogę  rozwoju  stając  się  bia- 
łym karłem,  gwiazdą  neutronową  lub  czarną  dziurą 
(-*  Czarne  dziury  i zapadanie  grawitacyjne).  Jeżeli 
obecnie  obserwujemy  gwiazdy  masywne  (a  do  takich 
należą  np.  cefeidy  klasyczne),  to  na  pewno  są  to 
gwiazdy,  które  powstały  stosunkowo  niedawno  (ok. 
kilkudziesięciu  milionów  lat  temu).  Mimo  to  są  one 
znacznie  bardziej  zaawansowane  ewolucyjnie  niż  np. 
Słońce  mające  wiek  rzędu  5 miliardów  lat. 

Wszystkie  gwiazdy,  niezależnie  od  masy,  po  wypa- 
leniu wodoru  w centrum  „wędrują”  na  diagramie 
H-R  na  prawo  od  ciągu  głównego,  do  obszaru  czer- 
wonych olbrzymów.  W tym  czasie  następuje  przebu- 
dowa wnętrza  gwiazdy  — jądro  pozbawione  wodoru 
kurczy  się,  a warstwy  zewnętrzne  rozszerzają  się.  Spa- 
lanie wodoru  zachodzi  w tym  czasie  w warstwie  ota- 
czającej jądro.  Czas  przejścia  do  fazy  czerwonego 
olbrzyma  jest  bardzo  krótki  dla  gwiazdy  masywnej 
i dlatego  szansa  zaobserwowania  jej  w tej  fazie  jest 
znikoma.  Czas  ten  jest  znacznie  dłuższy  dla  gwiazd 
o masach  równych  1-2  masom  Słońca.  Zwróćmy 
uwagę,  że  w czasie  swej  wędrówki  ku  obszarowi  dia- 
gramu H-R,  zajmowanemu  przez  czerwone  olbrzy- 
my, gwiazdy  przecinają  pas  niestabilności,  czyli  po- 
winny przechodzić  przez  fazę  gwiazdy  pulsującej.  Nie 
udało  się  nam  dotychczas  zaobserwować  masywnych 
gwiazd  pulsujących  w tym  stadium  ewolucyjnym,  na- 
tomiast wszystkie  dane  obserwacyjne  i rachunki  mo- 
delowe wskazują  na  to,  że  gwiazdy  typu  Ó Scuti  są 
gwiazdami  odchodzącymi  od  ciągu  głównego  i spala- 
jącymi wodór  w grubej  warstwie  otaczającej  bezwo- 
dorowe  jądro.  Byłyby  to  więc  najmłodsze  ewolucyjnie 
gwiazdy  pu!-sujące. 

Przyjrzyjmy  się  teraz  dalszej  ewolucji  mało  masyw- 
nych gwiazd,  o masach  nie  przewyższających  jednej 
masy  Słońca.  Gdy  znajdą  się  w obszarze  czerwonych 
olbrzymów  powiększają  swe  rozmiary  dalej,  podczas 
gdy  jądro  kurczy  się,  aż  w centrum  powstanie  tempe- 
ratura dostatecznie  wysoka  do  zapoczątkowania 
reakcji  przemiany  helu  w węgiel.  W fazie  ewolucyjnej 
czerwonego  olbrzyma  siła  przyciągania  na  powierzch- 
ni gwiazdy  jest  bardzo  mała,  a obserwacje  wskazują 
na  silne  ruchy  chaotyczne  w atmosferze  i stąd  przy- 
puszcza się,  że  gwiazda  traci  w tej  fazie  sporo  masy 
„posiewając”  ją  ze  swej  powierzchni.  Nie  mamy 
wprawdzie  ścisłych  obliczeń,  które  powiedziałyby  nam 
dokładnie,  ile  masy  i w jakim  tempie  będzie  tracone, 
ale  sam  fakt  utraty  masy  nie  budzi  obecnie  wątpli- 
wości. 

W momencie  zapalenia  się  helu  (błysk  helowy) 
gwiazda  robi  nagły  zwrot  na  diagramie  H-R,  kurczy 
się  nieco  i trafia  na  tzw.  gałąź  horyzontalną  (rys.  9). 
Gałąź  horyzontalna  rozciąga  się  od  obszaru  czerwo- 
nych olbrzymów,  przecina  pas  niestabilności  i sięga 
daleko  na  lewo  od  tego  pasa.  Miejsce,  na  które  trafia 


Rys.  9.  Fragment  diagrarsu  H-R  z teoretyczną  gałęzią  horyzon- 
talną (linia  ciągła)  oraz  torami  (linie  przerywane)  pokazującymi 
dalszą  ewolucję  gwiazd.  Liczby  oznaczają  masy  gwiazd  (w  jed- 
nostkach masy  Słońca)  lądujących  w różnych  miejscach  gałęzi 
horyzontalnej 


gwiazda  zależy  od  wielu  czynników:  masy  jądra  helo- 
wego, cał-kowitej  masy  gwiazdy  i składu  chemicznego 
(a  szczególnie  zawartości  pierwiastków  ciężkich).  Gdy 
utworzymy  diagram  H-R  dla  gromady  kulistej  (gę- 
stego skupiska  setek  tysięcy  gwiazd,  które  powstały 
równocześnie  wiele  miliardów  lat  temu)  widzimy,  że 
część  gwiazd  rzeczywiście  układa  się  w gałąź  hory- 
zontalną (rys.  10).  Porównanie  obserwowanej  pozycji 
gwiazd  gałęzi  horyzontalnej  na  diagramie  H-R  z mo- 
delami teoretycznymi  wskazuje,  że  masy  tych  gwiazd 
wynoszą  0,6-0,7Atf®. 

Gwiazdy  znajdujące  się  na  gałęzi  horyzontalnej 
spalają  we  wnętrzu  jądra  hel,  a w warstwie  ota- 
czającej jądro  — wodór.  Ta  faza  ewolucyjna  jest 
względnie  spokojna  — gwiazda  przez  dłuższy  czas 
niemal  nie  zmienia  swej  jasności  i temperatury. 

Jeżeli  gwiazda  z gałęzi  horyzontalnej  znajdzie  się 
w pasie  niestabilności,  powinna  pulsować.  Istotnie 
obserwujemy  takie  gwiazdy.  Są  to  gwiazdy  typu  RR 
Lyrae.  Z rys.  10  wynika,  że  przejście  od  gwiazd 
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Rys.  10.  Diagram  Hertzsprunga-Russelta  dla  gromady  kulistej 
M 15.  Krzyżykami  zaznaczone  są  gwiazdy  typu  RR  Lyrae 

zmiennych  do  stałych  jest  ostro  zarysowane.  Stąd  dla 
wielu  gromad  kulistych  możemy  wyznaczyć  obserwa- 
cyjne granice  pasa  niestabilności.  Z danych  teoretycz- 
nych wynika,  że  lewa  granica  pasa  (wysokotempera- 
turowa) jest  na  danym  poziomie  jasności  absolutnej 
silnie  zależna  od  ilości  helu  znajdującego  się  w otoczce 
gwiazdy  pulsującej.  Porównując  dane  teoretyczne 
i obserwacyjne  można  wyznaczyć  zawartość  helu 
w gromadzie.  Otrzymany  wynik  obarczony  jest  dość 
dużym  błędem,  ale  nie  znamy  obecnie  lepszych  metod. 
Dla  wszystkich  zbadanych  gromad  otrzymano,  że 
zawartość  helu  wynosi  ok.  25%.  Przemawia  to  za 
powstaniem  helu  na  początku  istnienia  Wszechświata, 
a nie  za  stopniowym  zwiększaniem  się  jego  zawartości 
w miarę  ewolucji. 

Drugim  ważnym  osiągnięciem  teorii  pulsacji  jest 
opracowanie  metody  wyznaczania  z obserwacji  masy 
gwiazdy  zmiennej.  Daje  to  możliwość  sprawdzenia 
poprawności  teoretycznie  wyznaczonych  torów  ewo- 
lucyjnych na  diagramie  H-R  dla  gwiazd  o różnych 
masach.  Okazuje  się,  że  zgodność  jest  dobra,  chociaż 
miejsce  zajmowane  przez  gwiazdy  typu  RR  Lyrae 
powinny  zajmować  gwiazdy  o nieco  większej  masie 
niż  to  obserwujemy.  Może  to  być  potwierdzeniem 
faktu  utraty  masy  w fazie  czerwonego  olbrzyma. 

Gwiazda  z gałęzi  horyzontalnej  przesuwa  się  na 
diagramie  H-R  w trakcie  spalania  helu  w jądrze  ku 
górze,  a gdy  cały  hel  w środku  spali  się  i pali  się  tylko 
w warstwie  otaczającej  węglowe  jądro,  gwiazda  wraca 
do  obszaru  czerwonych  olbrzymów.  Wędruje  w tym 
czasie  wzdłuż  tzw.  gałęzi  asymptotycznej  znajdującej 
się  na  prawo  od  pasa  niestabilności.  Z dokładnych 
obliczeń  wynika,  że  w tej  fazie  ewolucyjnej  tempo 
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przemian  jądrowych  nie  jest  stałe,  lecz  podlega  okre- 
sowym niestabilnościom.  Jednak  obliczenia  są  ciągle 
jeszcze  niewystarczające,  ze  względu  na  ograniczone 
możliwości  maszyn  matematycznych,  ale  z już  istnie- 
jących wiemy,  że  mniej  więcej  co  kilkaset  tysięcy  lat 
puls  tempo  produkcji  energii  w warstwie  spalającej  hel 
helowy  gwałtownie  narasta  (tzw.  puls  helowy),  co  ma  silny 
wpływ  na  jasność  i temperaturę  gwiazdy.  Wskutek 
tego  gwiazda  zatacza  pętlę  na  diagramie  H-R  rozcią- 
gającą się  poza  pas  niestabilności  (rys.  li).  Powinniś- 
my więc  obserwować  gwiazdy  pulsujące  o niedużych 


Rys.  11.  Schemat  pętli  powstającej  na  diagramie  H-R  wskutek 
niestabilności  spalania  się  helu  w gwiazdach  z gałęzi  asympto- 
tycznej 


masach  leżące  w tym  obszarze  diagramu.  Gwiazdami 
takimi  są  cefeidy  typu  W Wirginis  i dlatego  przypusz- 
czamy, że  są  one  w trakcie  pulsu  helowego.  Byłyby 
więc  ewolucyjnie  starsze  od  gwiazd  typu  RR  Lyrae. 
W tym  miejscu  warto  podkreślić,  że  niestabilność 
modeli  spalających  wodór  i hel  w dwu  warstwach 
została  odkryta  zaledwie  ok.  10  lat  temu.  Do  tego 
czasu  faza  ewolucyjna,  w jakiej  gwiazda  staje  się  ce- 
feidą  typu  W Wirginis  była  jeszcze  bardziej  niejasna. 

Gwiazdy  przechodzące  do  obszaru  czerwonych 
olbrzymów  wzdłuż  gałęzi  asymptotycznej  tracą  za- 
pewne jeszcze  część  masy  i w końcu  przechodzą  do 
obszaru  białych  karłów.  Nie  jest  wykluczone,  że 
niektóre  gwiazdy  typu  W Wirginis  znajdują  się  w 
trakcie  tego  przejścia. 

Niektóre  mało  masywne  gwiazdy  mają  prostszą 
drogę  ewolucyjną.  Aby  w jądrze  nastąpiło  zapalenie 
się  helu,  musi  ono  mieć  minimalną  masę  rzędu  0,45 
M<p.  Jeżeli  gwiazda  wypali  w centrum  wodór  i przej- 
dzie do  obszaru  czerwonych  olbrzymów,  mając  masę 
jądra  wyraźnie  mniejszą  niż  ta  minimalna  wartość 
(np.  wskutek  małej  masy  początkowej  lub  silnej 
utraty  masy  w trakcie  ewolucji),  (o  hel  nie  zapala  się, 
a po  zakończeniu  kurczenia  się  jądra  gwiazda  ewo- 
luuje do  obszaru  białych  karłów  spalając  wodór  w 
cienkiej  warstwie  otaczającej  helowe  jądro.  W tym 
czasie  musi  ponownie  przeciąć  pas  niestabilności. 
Przypuszcza  się,  że  w tej  fazie  ewolucyjnej  znajdują 
się  cefeidy  karłowate.  Jak  już  wspominaliśmy,  wielu 
astronomów  uważa,  że  podział  na  gwiazdy  typu  <5 
Scuti  i cefeidy  karłowate  jest  niepotrzebny.  Jeżeli 
jednak  różnią  się  one,  to  w tym  obszarze  diagramu 
H-R  mogą  wystąpić  obok  gwiazd  typu  6 Scuti  tylko 
gwiazdy  o masach  około  O,2A*0  spalające  wodór 
w cienkiej  warstwie  i ewoluujące  do  stadium  białego 
karła. 

Pozostało  nam  jeszcze  wyjaśnienie  fazy  ewolucyj- 
nej masywnych  gwiazd  pulsujących.  Gwiazdy  o ma- 


sach równych  kilku  masom  Słońca  po  przejściu  do  ewolucja 
obszaru  czerwonych  olbrzymów  również  zapalają  hel  gwiazd 
w jądrze.  Jednak  sam  proces  spalania  helu  przebiega  masywnych 
nieco  inaczej.  Gwiazda  najpierw  spala  hel  będąc 


w obszarze  czerwonych  olbrzymów,  po  czym  zmienia 
swoją  budowę  wewnętrzną  wędrując  równocześnie 
w lewo  na  diagramie  H-R  i wchodzi  w drugą  „nie- 
bieską fazę  spalania  helu.  Rysunek  12  pokazuje  roz- 
kład tych  dwóch  głównych  faz  dla  określonego  składu 
chemicznego  odpowiadającego  gwiazdom  I populacji. 

Należy  dodać,  że  dokładna  lokalizacja  „niebieskiej" 
fazy  spalania  helu  zależy  od  wielu  założeń  przyjętych 
podczas  rachunków  i dlatego  nie  jest  jeszcze  zbyt  do- 
kładnie znana.  Będąc  w tej  fazie  (lub  w czasie  przejścia 
do  niej)  gwiazdy  mogą  się  znaleźć  w pasie  niestabil- 
ności. Stają  się  wtedy  cefeidami  klasycznymi. 

Jeżeli  chodzi  o stan  zaawansowania  ewolucyjnego 
innych  gwiazd,  o których  wspominaliśmy,  to  gwiazdy 
typu  ^ Cephei  są'  to  gwiazdy,  które  właśnie  kończą 
(albo  dopiero  co  skończyły)  spalanie  wodoru  w cen- 
trum i „szykują  się’'  do  wędrówki  do  obszaru  czer- 
wonych olbrzymów.  Są  więc  gwiazdami  bardzo  mło- 
dymi, również  ewolucyjnie.  Gwiazdy  typu  Mira  Ceti 
są  już  w końcowych  stadiach  ewolucji.  Wzdłuż  gałęzi 
asymptotycznej  zawędrowały  do  obszaru  czerwonych 
olbrzymów  i obecnie  spalają  wodór  i hel  w dwu  war- 
stwach, tracąc  jednocześnie  masę.  Czeka  je  jeszcze 
przejście  do  obszaru  białych  karłów. 

Najmniej  możemy  powiedzieć  na  temat  tego,  w ja- 
kiej fazie  ewolucyjnej  znajdują  się  gwiazdy  typu  RV 
Tauri. 

Sumując,  należy  podkreślić,  że  obserwacje  gwiazd  test 
pulsujących  były  od  początku  jednym  z najważniej-  dla  teorii 
szych  testów  dla  teorii  ewolucji.  Dzięki  swej  zmień-  ewolucji 
ności  pozwalały  na  dokładne  wyznaczenie  para- 
metrów fizycznych  i dopiero  w ostatnich  latach  zbu- 
dowano wystarczająco  dobre  modele  ewolucyjne 
pozwalające  śledzić  dzieje  gwiazdy  krok  po  kroku, 
od  narodzin  aż  do  końca  drogi  ewolucyjnej,  i z do- 
stateczną dokładnością  odtwarzające  obserwowane 
wielkości  gwiazd  pulsujących.  Jest  to  duży  triumf 
teorii  ewolucji.  Zgodność  tej  teorii  z obserwacjami 
w wypadkach,  w których  porównanie  jest  możliwe, 
utwierdza  nas  w przekonaniu,  że  opisuje  ona  również 
dobrze  sytuacje  trudniejsze  do  porównania  z obser- 
wacjami. 

W.  P.  Cesewicz  Zwiozdy  tipa  RR  Liry , Kijew  1966;  J.  S.  Glasby 
V ariabie  Stars,  Cambridge.  Massachussetts  1969;  B.  W.  Kukarkin 
(red.)  Pulsi rujuszczijc  zwiozdy , Moskwa  1970;  W.  Strohmeifr 
Variable  Stars,  Oxford  S972;  O.  Struve,  V.  Zebergs  Astronomia 
XX  wieku.  Warszawa  1967. 
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liwazary 

Marcin  Kubiak 

Odkrycie  kwazarów  było  jednym  z największych 
osiągnięć  współczesnej  astronomii  obserwacyjnej. 
W końcu  lat  pięćdziesiątych  w wielu  obserwatoriach 
radioastronomicznych  na  świecie  realizowane  były 
programy  obserwacyjne  mające  na  celu  sporządzenie 
możliwie  kompletnych  katalogów  pozaziemskich 
katalogi  źródeł  promieniowania  radiowego.  Powstały  wów- 
radśoźródef  czas  katalogi  oznaczane  symbolami:  MSH  — od 
nazwisk  australijskich  radioastronomów : B.  Y Millsa, 
O.  B.  Slee  i E.  Hilla,  którzy  zestawili  katalog  źródeł 
występujących  na  południowej  półkuli  nieba;  PKS  — 
katalog  radioźródeł  na  niebie  południowym  sporzą- 
dzony na  podstawie  obserwacji  za  pomocą  radiotele- 
skopu Parkesa;  seria  katalogów  1C,  2C,  3C,  4C 
i 5C  — sporządzonych  przez  grupę  radioastronomów 
z angielskiego  uniwersytetu  w Cambridge;  CTA 
i CTD  — katalogi  zestawione  przez  radioastrono- 
mów z California  Institute  of  Technology;  AO  — 
katalog  sporządzony  za  pomocą  radioteleskopu 
Arecibo  w Puerto  Rico,  NRAO  — katalog  sporzą- 
dzony w National  Radio  Astroriomy  Observatory, 
BI  — katalog  zestawiony  w Bolonii. 

W miarę  zwiększania  dokładności  określania  współ- 
rzędnych źródeł  radiowych  możliwe  stało  się  dokony- 
wanie ich  identyfikacji  z obiektami  optycznymi.  W du- 
żych szerokościach  galaktycznych,  tzn.  w dużych  od- 
ległościach kątowych  od  płaszczyzny  Galaktyki,  ra- 
dioźródła identyfikowano  zazwyczaj  z galaktykami. 
Jednak  w wielu  wypadkach  w miejscach  radioźródeł 
brak  było  galaktyk,  natomiast  w pobliżu  znajdowano 
słabe  obiekty  gwiazdowe.  Pierwszej  niewątpliwej  iden- 
tyfikacji źródła  promieniowania  radiowego  z obiek- 
tem gwiazdowym  dokonano  w 1960  r.  Źródłem  tym 
było  źródło  z katalogu  3C  oznaczone  symbolem 
3C  48,  a jego  odpowiednikiem  optycznym  był  obiekt 
podobny  do  gwiazdy  o jasności  16m.  Obserwacje 
spektroskopowe  wykazały,  że  obiekt  optyczny  wysyła 
widmo  ciągłe,  na  którego  tle  występują  szerokie  linie 
emisyjne  nie  dające  zidentyfikować  się  z żadnymi  linia- 
mi występującymi  zazwyczaj  w widmach  gwiazd. 
Wkrótce  potem  dokonano  identyfikacji  optycznej 
źródła  3C  273,  któremu  odpowiadał  obiekt  o jasności 
12™8  (najjaśniejszy  spośród  znanych  obiektów  tego 
rodzaju).  Odkryte  obiekty  nazwano  kwazarami  od 
angielskich  słów  quasi-stellar  radio  sources  (kwazi 
gwiazdowe  radioźródła). 

Zasadniczym  przełomem  w historii  kwazarów  było 
zidentyfikowanie  w 1963  r.  linii  emisyjnych  w widmie 
kwazara  3C  273.  Okazało  się,  że  są  to  linie  serii  Bal- 
mera  wodoru  oraz  linia  magnezu  o laboratoryjnej 
długości  fali  279,8  nm,  znacznie  przesunięte  ku  czer- 
przesunięcśe  wieni.  (Przesunięciem  ku  czerwieni  nazywamy  wiel- 
ku  czerwiem  kość  z = (A— A0)/Ao,  gdzie  A — długość  fali  mierzona 
w widmie,  a A0  — długość  fali  tej  samej  linii  mierzona 
w laboratorium  ziemskim).  Dla  kwazara  3C  273 
przesunięcie  ku  czerwieni  okazało  się  równe  0,158. 
Podobna  identyfikacja  linii  w widmie  kwazara  3C48 
dala  przesunięcie  ku  czerwieni  z = 0,368.  Od  tej 
chwili  liczba  kwazarów  o znanych  przesunięciach  ku 
czerwieni  zaczęła  szybko  rosnąć,  przy  czym  okazało 
się,  że  kwazary  mogą  mieć  przesunięcia  ku  czerwieni 
większe  niż  obserwowano  poprzednio  u innych  obiek- 
tów znanych  astronomii,  Kwazary  stały  się  też  przed- 
miotem intensywnych  i wszechstronnych  badań  za- 
równo obserwacyjnych,  jak  i teoretycznych. 


Obserwacyjne  cechy  kwazarów 

Ponieważ  nie  wiadomo  jeszcze,  czym  w istocie  są 
kwazary  (znamy  ich  obecnie  ok.  kilkuset),  nie  można 
podać  ich  ścisłej  definicji.  Tym  większe  znaczenie  ma 
wyodrębnienie  tych  cech  obserwacyjnych,  które  od- 


różniają kwazary  od  innych  obiektów  astronomicz-  cechy 
nych.  Obecnie  znamy  następujące  cechy  kwazarów:  kwazarów 

1)  są  to  obiekty,  których  obraz  optyczny  jest  taki 
jak  gwiazdy  i które  są  często  identyfikowane  z radio- 
źródłami ; 

2)  jasność  optyczna  jest  zmienna; 

3)  promieniowanie  ich  ma,  w porównaniu  z pro- 
mieniowaniem gwiazd,  znaczną  nadwyżkę  nadfiole- 
tową i podczerwoną; 

4)  w ich  widmach  występują  szerokie  linie  emisyjne 
oraz  niekiedy  linie  absorpcyjne; 

5)  linie  są  znacznie  przesunięte  ku  czerwieni. 

Początkowo  kwazary  były  wykrywane  jako  źródła  wykrywanie 
promieniowania  radiowego  odznaczające  się  stosun-  i identyfi- 
kowo  małymi  rozmiarami  kątowymi  i nie  dające  kacja 
zidentyfikować  się  ze  zwykłymi  radiogalaktykami.  kwazarów 
Istotną  rolę  w identyfikacji  optycznej  odgrywała  do- 
kładność, z jaką  możliwe  było  określenie  współrzęd- 
nych radiowych.  Fotoelektryczne  pomiary  promie- 
niowania widzialnego  zidentyfikowanych  kwazarów 
wykazały,  że  na  diagramie  dwu  wskaźnikowym  w sy- 
stemie UBV  (-*■  Astronomia  w podczerwieni)  zajmują 
one  obszar  leżący  powyżej  ciągu  normalnych  gwiazd 
Galaktyki  (rys.  1),  co  oznacza  istnienie  w ich  promie- 
niowaniu dużej  nadwyżki  promieniowania  nadfiole- 
towego. Wykorzystując  tę  właściwość  podjęto  próby 


Rys.  1.  Diagram  dwuwskaźnikowy  dla  kwazarów  (punkty).  Linią 
ciągłą  przedstawiona  Jest  standardowa  zależność  dla  gwiazd 
Galaktyki 

wykrycia  kwazarów  metodami  wyłącznie  optycznymi 
przez  poszukiwanie  na  dwubarwnych  zdjęciach  nieba 
słabych  obiektów  gwiazdowych  mających  dużą  nad- 
wyżkę nadfioletową.  Należy  jednak  dodać,  że  duże 
nadwyżki  nadfioletowe  mogą  mieć  niektóre  gwiazdy 
szczególnego  rodzaju,  takie  jak  białe  karły,  stare 
gwiazdy  nowe  lub  inne  gwiazdy  będące  w późnych 
stadiach  ewolucji.  Ostateczne  potwierdzenie,  czy  dany 
obiekt  jest  kwazarem,  mogą  przynieść  tylko  obserwa- 
cje spektroskopowe,  ujawniające  ewentualną  obec- 
ność linii  o dużym  przesunięciu  ku  czerwieni.  Mimo 
to,  pierwsze  próby  ograniczone  do  niewielkich  obsza- 
rów nieba  doprowadziły  do  odkrycia  kwazarów  meto- 
dami wyłącznie  optycznymi,  przy  czym  okazało  się, 
że  niektóre  spośród  nich  nie  dają  się  zidentyfikować 
ze  znanym  źródłem  promieniowania  radiowego,  kwazary 
Obiekty  te  nazwano  kwazarami  spokojnymi  radiowo,  spokojne 
Oczywiście  brak  promieniowania  radiowego  może  radiowo 
być  tylko  wynikiem  ograniczonej  czułości  stosowa- 
nych obecnie  odbiorników;  niektóre  spośród  kwaza- 
rów spokojnych  radiowo  zostały  z czasem  zidentyfi- 
kowane z bardzo  słabymi  źródłami  promieniowania 
radiowego.  Jeżeli  wyniki  te  są  reprezentatywne  dla 
całej  populacji  kwazarów,  to  można  oczekiwać,  że 
kwazarów  spokojnych  radiowo  jest  ok.  100  razy  więcej 
niż  kwazarów  radiowych.  Możliwość  dalszego  udo- 
skonalenia tej  metody  wynika  z faktu,  że  kwazary 
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oprócz  nadwyżki  fioletowej  mają  również  znaczną 
nadwyżkę  promieniowania  podczerwonego.  Metoda 
trójbarwna,  polegająca  na  wykrywaniu  obiektów 
o dużych  nadwyżkach  nadfioletowych  i podczerwo- 
nych, zmniejszy  znacznie  prawdopodobieństwo  fał- 
szywych identyfikacji,  a jednocześnie  pozwoli  na 
ewentualne  wykrycie  kwazarów  pozbawionych  nad- 
wyżki fioletowej  wskutek  dużego  przesunięcia  ku 
czerwieni.  (Nadwyżka  ta  w wyniku  efektu  Dopplera 
przejawi  się  w promieniowaniu  odbieranym  jako  nad- 
wyżka promieniowania  widzialnego  lub  nawet  pod- 
czerwonego). Metoda  ta  nie  przyniosła  jeszcze  oczeki- 
wanych wyników. 

W tym  miejscu  należy  jeszcze  dodać,  że  w katalo- 
gach istnieje  dość  dużo  radioźródeł,  których  nie  udało 
się  dotychczas  zidentyfikować  z jakimikolwiek  obiek- 
tami optycznymi.  Przebieg  zależności  Ig  N-]gS 
(paragraf:  Interpretacja  teoretyczna)  dla  tych  źródeł 
sugeruje  ich  podobieństwo  do  kwazarów  wysyłają- 
cych promieniowanie  radiowe. 

optyczne  Optyczne  obrazy  kwazarów  są  w zasadzie  punktowe 
obrazy  i nie  dają  odróżnić  się  od  obrazów  słabych  gwiazd, 
kwazarów  Wprawdzie  istnieją  powody,  by  przypuszczać,  że 
liniowe  rozmiary  kwazarów  są  niewielkie,  to  jednak 
trudno  jest  obecnie  powiedzieć,  w jakim  stopniu  brak 
jakiejkolwiek  struktury  obrazu  optycznego  jest  rze- 
czywistą cechą  kwazarów,  a w jakim  — jest  wynikiem 
dużej  odległości.  Na  przykład  w obrazie  optycznym 
kwazara  3C  48  (rys.  2)  można  wyróżnić  niewielką 


otoczkę  mgławicową,  a kwazar  3C273  ma  w swej 
w . _ » budowie  wyraźną  strugę  (rys.  3).  Z drugiej  strony, 

galaktyko  tzw.  galaktyki  typu  N (—  Galaktyki),  będące  źródła- 
typu  /V  mi  promieniowania  radiowego  i wykazujące  w wid- 
mach linie  emisyjne  przesunięte  ku  czerwieni  (choć 

0 mniejszą  wartość  niż  kwazary)  są  zbudowane 
z małego  i jasnego  jądra  otoczonego  bardzo  słabą 
otoczką  gwiazd  i materii  rozrzedzonej.  Nie  jest  wy- 
kluczone, że  galaktyki  typu  N oglądane  z dużej  od- 
ległości, z której  widoczne  byłoby  tylko  jasne  jądro, 
wyglądałyby  podobnie  jak  kwazary.  Właściwości 
jąder  galaktyk  typu  N są  pod  wieloma  względami 
pośrednie  między  właściwościami  zwykłych  galaktyk 

1 kwazarów. 

ratióowe  Obrazy  radiowe  kwazarów  są  natomiast  znacznie 
obrazy  bardziej  złożone.  Obserwacje  interferometryczne, 
kwazarów  pozwalające  osiągnąć  kątową  zdolność  rozdzielczą 
rzędu  sekundy  łuku,  wykazały,  że  obrazy  radiowe 
mogą  zawierać  następujące  elementy:  dwa  dobrze 
rozdzielone  obszary  emitujące  promieniowanie  radio- 
we położone  symetrycznie  po  obu  stronach  obiektu 
optycznego;  dwa  obszary  radiowe,  z których  jeden 
pokrywa  się  z obiektem  optycznym;  kilka  obszarów 
radiowych.  Pod  tym  względem  kwazary  nie  różnią  się 
zasadniczo  od  radioźródeł  innych  rodzajów.  Ostatnio 
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Rys.  3.  Optyczny  (u  góry)  i radiowy  (u  dołu)  obraz  kwazara 
3C273.  Zdjęcie  jest  przeeksponowane  w celu  uwidocznienia 
słabej  strugi.  A i B oznaczają  źródła  radiowe.  Obserwacje  inter- 
ferometryczne wykazały,  że  radioźródło  B ma  składową  o roz- 
miarach mniejszych  od  10~a  sekundy  łuku  (wg  F.  D.  Kahn  and 
H.  Palmer,  Quasars , Manchester  1967) 


udało  się  również  wykryć  istnienie  interesującej 
struktury  subtelnej  w obszarach  emisji  radiowej  oraz 
wykryć  różnice  w widmach  radiowych  wysyłanych 
przez  elementy  radioźródeł  zidentyfikowanych  z kwa- 
zarami. 

Promieniowanie  ciągłe  kwazarów  we  wszystkich 
zakresach  długości  fal,  w których  obserwacje  były 
wykonywane,  można  opisać  w przybliżeniu  prawem 
potęgowym  F(v)  ~ v-«,  gdzie  F — strumień  promie- 
niowania, v — częstość.  W dziedzinie  radiowej  a 
jest  równe  średnio  0,7  i słabo  zależy  od  częstości. 
Widma  poszczególnych  kwazarów  mogą  jednak  róż- 
nić się  znacznie  między  sobą.  Niektóre  kwazary  wy- 
kazują szybki  spadek  natężenia  w widmie  w obszarze 
fal  dłuższych  (tzw.  obcięcie  długofalowe,  interpreto- 
wane jako  wynik  samoabsorpcj  i promieniowania 
synchrotronowego)  lub  mają  widma  złożone,  nie  da- 
jące opisać  się  prostym  prawem  potęgowym.  Jak  wi- 
dać na  rys.  4,  widma  kwazarów  nie  różnią  się  od  widm 
radiowych  zwykłych  galaktyk.  Widma  niektórych 
kwazarów  zmieniają  się  w czasie,  podobnie  jak  to 
obserwuje  się  u innych  radioźródeł.  Odróżnienie 
kwazara  od  radiogalaktyki  na  podstawie  tylko  obser- 
wowanych cech  promieniowania  radiowego  jest  więc 
niemożliwe. 

W dziedzinie  widzialnej  i w bliskiej  podczerwieni 
wykładnik  a jest  średnio  równy  ok.  1,  co  wyraźnie 
odróżnia  kwazary  (oraz  jądra  niektórych  galaktyk 
zwartych,  w tym  również  galaktyk  typu  N)  od  gwiazd 
i wyraźnie  wskazuje  na  nietermiczny  rodzaj  promie- 
niowania. Przebieg  widma  w podczerwieni  nie  jest 
jeszcze  dokładnie  znany,  wiadomo  tylko,  że  natężenie 
widma  ciągłego  w tym  zakresie  silnie  wzrasta. 

Widmo  rentgenowskie  jest  znane  tylko  dla  najjaś- 
niejszego kwazara  3C  273.  W przedziale  od  1 do 
1 5 keV  wykładnik  a ma  wartość  0,89.  Po  stronie  ma- 
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Rys.  4.  Przykłady  radiowych  widm  kwazarów  i galaktyk:  a)  ty- 
powe widma,  b)  widma  z obcięciem  długofalowym  (samoabsorp- 
cja?),  c)  widma  złożone 


łych  energii  obserwuje  się  obcięcie  widma,  będące 
najprawdopodobniej  wynikiem  absorpcji  promienio- 
wania X w materii  rozproszonej  znajdującej  się  na 
drodze  między  Ziemią  i kwazarem. 
linie  Charakterystyczną  cechą  kwazarów  jest  występo- 
emisyjne  wanie  w ich  widmach  optycznych  silnych  linii  emisyj- 
nych, których  szerokości  zawierają  się  w przedziale 
od  0,1  nm  do  ponad  10  nm,  ze  średnią  wartością  ok. 
5 nm.  Wśród  linii  emisyjnych  obserwuje  się  linie  wo- 
doru, jednokrotnie  zjonizowanego  magnezu  (Mg  II) 
oraz  wzbronione  linie  tlenu  (O  II  i O 111)  i neonu 
(Ne  III  i Ne  IV).  Wszystkie  linie  emisyjne  są  przesu- 
nięte ku  czerwieni  o taką  samą  wartość  z. 
linie  Niezwykle  interesującą  cechą  kwazarów  jest  wystę- 
absorpeyjne  powanie  niekiedy  w ich  widmach  stosunkowo  wąs- 
kich i słabych  linii  absorpcyjnych.  Liczba  linii  absorp- 
cyjnych jest  na  ogół  tym  większa,  im  większe  jest 
przesunięcie  ku  czerwieni  (wyznaczone  z linii  emisyj- 
nych). Przesunięcie  ku  czerwieni  wyznaczone  z linii 
absorpcyjnych  jest  zwykle  mniejsze  od  przesunięcia 
ku  czerwieni  wyznaczonego  z linii  emisyjnych. 
W widmach  wielu  kwazarów  o dużym  z linie  absorp- 
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cyjne  mają  kilka  składowych,  które  mają  różne 
przesunięcia  ku  czerwieni.  Kwazar  4C  05.34,  mający 
największe  znane  obecnie  przesunięcie  ku  czerwieni 
z = 2,877,  ma  w widmie  ok.  100  linii  absorpcyjnych 
rozpadających  się  na  co  najmniej  pięć  układów  o róż- 
nych z*bs,  z których  największe  jest  równe  2,785, 
a najmniejsze  2,473.  Wśród  kwazarów  mających  kilka 
układów  linii  znanych  jest  kilka  obiektów,  dla  któ- 
rych obok  układów  o za t>s  < zem  występuje  również 
układ  o Zabs  > Zem-  Przypuszcza  się,  że  linie  absorp- 
cyjne powstają  w warstwach  chłodnej  i rzadkiej  ma- 
terii wyrzucanych  z kwazarów  z dużymi  prędkościami. 
Istnienie  wielu  układów  linii  absorpcyjnych  wskazy- 
wałoby na  możliwość  wielokrotnego  wyrzucania 
materii  przez  kwazary.  Niektóre  układy  linii  absorp- 
cyjnych powstają  zapewne  w obłokach  materii  mię- 
dzygalaktycznej  nie  związanej  bezpośrednio  z kwaza- 
rami ; w ten  sposób  można  wyjaśnić  istnienie  przypad- 
ków Zabs  > Zem- 

Charakterystyczną  cechą  kwazarów  jest  zmienność 
ich  jasności  zarówno  w dziedzinie  optycznej,  jak  i ra- 
diowej. Określenie  najkrótszego  czasu  f,  w którym 
zmiany  te  mogą  zachodzić,  pozwala  ocenić  górną 
granicę  rozmiarów  R obszaru,  z którego  wysyłane 
jest  promieniowanie.  Pomijając  pewne  szczególne 
przypadki,  możemy  oczekiwać,  że  R <:  cty  gdzie  c 
jest  prędkością  światła.  (Nawet  nagła  zmiana  jasności 
rozległego  źródła  będzie  przez  nas  obserwowana  jako 
zmiana  powolna,  zachodząca  w czasie,  w ciągu 
którego  światło  zdąży  dobiec  do  nas  od  wszystkich 
punktów  źródła).  Ponieważ  w dziedzinie  widzialnej  t 
jest  rzędu  tygodni  lub  dni,  górna  granica  rozmiarów 
obszarów  wysyłających  promieniowanie  widzialne 
jest  rzędu  dziesiątych,  a nawet  setnych  części  parseka. 
Zmiany  jasności  radiowej  są  powolniejsze  i następują 
z okresem  charakterystycznym  rzędu  lat.  Obszary 
wysyłające  promieniowanie  radiowe  mogą  mieć  roz- 
miary rzędu  parseków.  Na  rys.  5 przedstawione  są 
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Rys.  5.  Optyczne  i radiowe  zmiany  kwazara  3C  345  w latach 
1962-1970 


wyniki  jednoczesnych  obserwacji  kwazara  3C  345 
w dziedzinie  widzialnej  (w  barwie  niebieskiej  B) 
oraz  w różnych  długościach  fal  radiowych.  Podobne 
zmiany  jasności  wykazują  również  inne  radiogalak- 
tyki,  w tym  galaktyki  typu  N. 


interpretacja  teoretyczna 

Najbardziej  charakterystyczną  cechą  kwazarów  są 
ich  duże  przesunięcia  ku  czerwieni.  W zasadzie  ist- 
nieją dwie  następujące  możliwości  wyjaśnienia  tych 
przesunięć: 

1.  Są  one  przesunięciami  dopplerowskimi,  tzn. 
odpowiadają  dużym  prędkościom  vr  oddalania  się 
kwazarów  od  obserwatora  zgodnie  z zależnością 

*+ 1 = j/(vr4c)/(tv— c) . (Dla  małych  przesunięć  ku 
czerwieni,  czyli  dla  prędkości  radialnych  dużo  mniej- 
szych od  c spełniona  jest  przybliżona  zależność 
klasyczna  z = v/c). 

2.  Są  one  pochodzenia  grawitacyjnego,  tzn.  że 
obserwowane  przez  nas  światło  zostało  wysłane  przez 
ciała  o bardzo  dużej  masie,  a opuszczając  ich  silne 
pola  grawitacyjne  doznało  dużego  przesunięcia  ku 
czerwieni,  które  zgodnie  z ogólną  teorią  względności 
jest  określone  wzorem  zg+\  = ]/l  - 2(GA///?c2), 
gdzie  G — stała  grawitacji,  M — masa,  R — promień 
ciała  wysyłającego  kwanty. 

Obecnie  istnieje  wiele  argumentów  za  tym,  że 
przesunięcia  ku  czerwieni  w widmach  kwazarów  są 
przesunięciami  dopplerowskimi.  Zakładając,  że  jest 
tak  naprawdę,  stajemy  wobec  dwu  możliwości: 

1.  Duża  prędkość  ucieczki  jest  wynikiem  ogólnej 
ekspansji  Wszechświata.  Zgodnie  z prawem  Hubb!e’a, 
prędkość  ucieczki  v jest  wprost  proporcjonalna  do 
odległości,  co  zapisujemy  jako  v = Hry  gdzie  r — 
odległość,  H — stała  Hubble’a,  równa  według  ostat- 
nich wyznaczeń  ok.  50  km/s-Mps.  Innymi  słowy, 

954 


kwazary  są  obiektami  kosmologicznymi,  tzn.  znaj- 
dują się  w ogromnych  odległościach  rzędu  tysięcy 
Mps  (hipoteza  kosmologiczna). 

2.  Duże  prędkości  oddalania  się  kwazarów  wyni-  hipoteza 
kają  z wielkich  prędkości  własnych  kwazarów  w sto-  lokalna 
sunku  do  ich  najbliższego  otoczenia.  Duże  prędkości 
mogą  oznaczać,  że  kwazary  zostały  wyrzucone  w wy- 
niku potężnej  eksplozji,  która  nastąpiła  w naszym 
pobliżu  (hipoteza  lokalna).  Ponieważ  nie  obserwuje 
się  wśród  kwazarów  przesunięć  ku  fioletowi  (choć 
kwazary  takie  byłyby  łatwiejsze  do  wykrycia  niż  kwa- 
zary z przesunięciem  ku  czerwieni),  hipoteza  ta  w spo- 
sób niemożliwy  do  przyjęcia  wyróżnia  naszą  Ga- 
laktykę lub  jej  najbliższe  otoczenie.  Hipotezę  kos- 
mologiczną wzmocniło  jeszcze  odkrycie  kwazara 
PKS  225 -MI  leżącego  w kierunku  jednej  z gromad 
galaktyk  i mającego  takie  samo  przesunięcie  ku 
czerwieni,  jakie  ma  jedna  z galaktyk  gromady. 

Przekonanie,  że  kwazary  są  obiektami  kosmolo- 
gicznymi, jest  przyczyną  szczególnego  zainteresowa- 
nia nimi  współczesnej  atronomii.  Biorąc  pod  uwagę, 
że  rekordowa  wartość  przesunięcia  ku  czerwieni  wśród 
radiogałaktyk  jest  równa  0,46,  łatwo  można  zrozu- 
mieć, że  kwazary  o przesunięciach  ku  czerwieni 
większych  od  2 dostarczają  nieoczekiwanej  możli- 
wości sięgnięcia  do  odległości  ponad  dwukrotnie 
większych  z jednoczesnym  „cofnięciem  się”  w czasie 
o kilka  miliardów  lat  (tyle  czasu  biegnie  bowiem 
światło  od  najodleglejszych  kwazarów).  W związku 
z tym  z badaniami  kwazarów  wiązano  duże  nadzieje 
na  rozstrzygnięcie  wielu  zasadniczych  problemów 
kosmologicznych.  Niestety  nadzieje  te  zawiodły  po 
stwierdzeniu,  że  kwazary  wykazują  bardzo  duży  roz- 
rzut jasności  absolutnych  i to  zarówno  optycznych, 
jak  i radiowych.  Wykres  zależności  jasności  obserwo- 
wanych od  przesunięcia  ku  czerwieni,  będący  odbi- 
ciem tych  różnic,  jest  przedstawiony  na  rys.  6. 


Rys.  6.  Zależność  przesunięcia  ku  czerwieni  od  jasności  obser- 
wowanej mv  dla  136  kwazarów  (punkty).  Linia  prosta  przed- 
stawia tę  samą  zależność  dla  najjaśniejszych  galaktyk  w groma- 
dach 


Mimo  to,  obserwacje  kwazarów  przyczyniły  się  do  wnioski 
wysunięcia  pewnych  interesujących  wniosków  na  na  temat 
temat  ewolucji  Wszechświata.  Istotną  roię  odegrała  ewolucji 
tu  zależność  lg«V  Ig 5,  czyli  wykres  przedstawiający  Wszech- 
liczbę  źródeł  o jasnościach  większych  od  danej  jas-  świata 
ności  5 w funkcji  S.  W przypadku  źródeł  rozłożonych 
w przestrzeni  w sposób  jednorodny  (nawet  przy 
uwzględnieniu  ekspansji  Wszechświata)  nachylenie 
zależności  Ig  iV—  Ig  S powinno  być  bliskie  —1,5. 

(Wartość  — 1,5  odpowiada  jednorodnemu  rozkładowi 
źródeł  statycznych).  Nachylenie  takie  stwierdzono 
dla  zidentyfikowanych  radiogałaktyk,  których  prze- 
sunięcia ku  czerwieni  są  na  ogół  niewielkie.  Taki  sam 
wykres  dla  kwazarów  zidentyfikowanych  optycznie 
ma  nachylenie  wyraźnie  większe,  ok.  1,8.  Z drugiej 
strony,  znając  przesunięcia  ku  czerwieni  kwazarów 
oraz  przyjmując  któryś  z modeli  kosmologicznych 
(przy  czym  wybór  konkretnego  modelu  nie  ma  za- 


sadniczego  znaczenia),  możemy  określić  ich  odleg- 
łości, a następnie  ocenić  przestrzenną  gęstość  kwaza- 
rów  w funkcji  odległości  (przesunięcia  ku  czerwieni). 
Z rozważań  takich  wynika,  że  istnieje  nadmiar  kwaza- 
rów  o dużych  przesunięciach  ku  czerwieni  w stosun- 
ku do  tego,  czego  powinniśmy  oczekiwać  dla  rozkładu 
jednorodnego.  Wielkość  i kierunek  tej  rozbieżności 
jest  zgodny  z zależnością  Ig  N-  Ig  S.  Ich  gęstość 
przestrzenna  w odległości  odpowiadającej  z — 1 jest 
ok.  100  razy  większa  niż  w naszym  najbliższym  oto- 
czeniu. Wniosek  ten  przemawia  silnie  za  stałą 
ewolucją  we  Wszcchświecie. 

Niezależnie  od  znaczenia  jakie  kwazary  mogłyby 
mieć  dla  kosmologii,  są  one  obiektami  interesującymi 
również  z innych  powodów.  Jeżeli  znajdują  się  one 
rzeczywiście  w odległościach  kosmologicznych,  tj. 
zgodnych  z prawem  Hubbleła,  wówczas  ich  jasność 
absolutna  musi  być  ok.  100  lub  więcej  razy  większa 
od  jasności  absolutnej  najjaśniejszych  spośród  zna- 
nych galaktyk.  Biorąc  zaś  pod  uwagę  niewielkie  roz- 
miary liniowe  obszarów  wysyłających  te  ilości  energii, 
stajemy  wobec  pasjonującego  problemu  wyjaśnienia 


procesów  fizycznych,  które  mogą  być  jej  źródłem. 
Nie  ulega  wątpliwości,  że  promieniowanie  kw-azarów 
ma  charakter  nietermiczny;  jest  ono  najprawdopo- 
dobniej promieniowaniem  synchrotronowym  z do- 
mieszką promieniowania  powstającego  w tzw.  od- 
wrotnym efekcie  Comptona  ( ► Astronomia  promieni 
X i y).  W obu  wypadkach  źródłem  kwantów  promie- 
niowania są  bardzo  szybkie,  relatywistyczne  elek- 
trony. Pochodzenie  szybkich  strumieni  elektronów 
u kwazarów  nie  zostało  jeszcze  wyjaśnione.  Do  bar- 
dziej interesujących  hipotez  należy  zaliczyć  hipotezę 
anihilacji  materii  i antymaterii  oraz  hipotezę  wybu- 
chów supernowych,  będących  następstwem  „zlepia- 
nia” się  gwiazd  w obszarach,  w których  przestrzenna 
gęstość  gwiazd  jest  rzędu  1010  na  ps3.  Kwazary  nie 
wniosły  więc  istotnego  wkładu  do  rozwiązania  pro- 
blemów kosmologicznych,  ale  okazały  się  obiektami 
niezwykle  interesującymi  z punktu  widzenia  procesów 
fizycznych,  które  mogą  w nich  przebiegać. 
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G.  Burbidge  and  M.  Burbidge  Quasi-SteUar  Objects,  San 
Francisco  1976;  D.  EvANS(ed.)  External  Galaxies  and  Quasi-Ste!Iar 
Objects , Dordrccht  1972. 


Polsary 

Marek  Demiański 

Latem  1967  r.  grupa  radioastronomów  pod  kierun- 
kiem Anthony  Hewisha,  prowadziła  obserwacje  da- 
lekich -*•  Kwazarów.  Ich  celem  było  zbadanie  szyb- 
kich zmian  sygnałów  fal  radiowych,  emitowanych 
przez  te  źródła.  Spójne  fale  radiowe  przechodzące 
przez  chmury  plazmy  ulegają  zniekształceniom  wywo- 
łującym charakterystyczne,  szybkie  i nieregularne 
fluktuacje  w ich  natężeniu.  To  „migotanie”  obserwuje 
się  tylko  w wypadkach  zwartych  źródeł  promienio- 
wania, których  rozmiary  kątowe  są  mniejsze  od  jed- 
nej sekundy.  Zwykłe  radiogalaktyki  są  znacznie  więk- 
sze, natomiast  kwazary  mają  małe  rozmiary  kątowe. 
Migotanie  było  więc  pierwszym  testem  na  to,  czy  dane 
radioźródło  może  być  kwazarem.  Podobnie  jak  jono- 
sfera,  obszary  wypełnione  plazmą  uginają  bardziej 
fale  długie  niż  krótkie.  Zatem  migotanie  jest  wyraź- 
niejsze dla  fal  o metrowej  długości  niż  dla  fal  centy- 
metrowych. Do  tych  badań  używano  radioteleskopu, 
który  pracował  na  długości  fali  3,7  metra  (rys.  1). 


Analiza  danych  obserwacyjnych  wskazywała  na 
istnienie  bardzo  dziwnego  obiektu.  Pojawiał  się  on 
wówczas,  kiedy  migotanie  innych  źródeł  było  małe 
a natężenie  promieniowania  bardzo  nieregularne. 
Paralaksa  tego  źródła  była  zbyt  mała,  aby  ją  zmierzyć, 
co  oznaczało,  że  znajduje  się  ono  daleko  poza  grani- 
cami Układu  Słonecznego.  Najwłaściwsze  wydawało 
się  przypuszczenie,  że  jest  to  wybuchająca  gwiazda. 
Zaczęto  więc  badać,  czy  sygnały  pochodzące  od  tego 
źródła  są  podobne  do  sygnałów,  jakie  wysyła  Słońce 
w okresie  wzmożonej  aktywności  radiowej.  Najważ- 
niejsze było  zatem  zbadanie  zmienności  sygnału. 
Tymczasem  aktywność  źródła  znacznie  zmalała  i trze- 
ba było  czekać  dwa  miesiące,  aby  pojawiło  się  znowu. 
28  IX  1967  r.  przeprowadzono  najważniejsze  obser- 
wacje. Okazało  się,  że  źródło  wysyła  sygnały  w postaci 
krótkich,  powtarzających  się  co  1,3  s impulsów,  jakich 
dotychczas  nie  obserwowano. 

Na  podstawie  zmienności  sygnału  można  ocenić 
rozmiary  źródła.  Jeżeli  okres  zmienności  sygnału 
wynosi  /,  wówczas  rozmiary  źródła  nie  mogą  być 
mniejsze  od  cl , gdzie  c — prędkość  światła.  Źródłem 
zaobserwowanych  impulsów  mógł  być  zatem  bardzo 
mały  obiekt,  raczej  planeta  niż  gwiazda.  Wówczas 
powstała  fantastyczna  hipoteza,  że  sygnały  te  są 
wysyłane  przez  pozaziemską  cywilizację.  Jednak 
hipotezę  tę  odrzucono,  gdy  okazało  się,  że  sygnały  nie 
zawierają  żadnej  informacji  — nie  doszukano  się  bo- 
wiem jakiejkolwiek  korelacji  między  sygnałami  ani 
prawidłowości  w ich  przebiegu  prócz  niezwykłej  ich 
periodyczności.  W tym  czasie  odkryto  również  inne 
źródła  tego  typu  i w ten  sposób  przekonano  się,  że 
są  to  obiekty  astronomiczne  zupełnie  nowego  rodzaju. 


Dane  obserwacyjne 

Obecnie  znamy  ok.  trzystu  dwudziestu  pulsarów.  Naj- 
bardziej charakterystyczną  cechą  ich  promieniowania 
jest  zmienność  impulsów  przy  zachowaniu  niezwykle 
stabilnej  periodyczności.  Amplituda  oraz  kształt 
impulsu,  jak  to  widać  na  rys.  2,  ulegają  zmianom, 
zarówno  w ciągu  krótkich  odstępów  czasu,  a więc 
nawet  od  impulsu  do  impulsu,  jak  też  w ciągu  dłuż- 
szych okresów  czasu.  Dużą  stabilnością  cechuje  się 
natomiast  średni  odstęp  pomiędzy  impulsami,  który 
nazywa  się  okresem  pulsara.  Poszczególne  impulsy  okres  pulsara 
mają  złożoną  strukturę  i bardzo  często  składają  się 
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struktura  z dwóch  a nawet  kilku  podimpulsów.  Ze  względu  na  niego  impulsu  At  jest  w prosty  sposób  związany  z okre- 
impulsów  strukturę  impulsu  pulsary  można  podzielić  na  dwie  sem  pulsara  P.  Empirycznie  po  uśrednieniu  otrzymuje 
grupy:  takie,  u których  zmiany  impulsu  są  przypad-  się  przybliżoną  zależność  At  = 0,04 P.  Dla  różnych 
kowe,  i takie,  gdzie  zmiany  te  są  mniej  lub  bardziej  pulsarów  stosunek  At  do  P zawiera  się  w granicach 
wyraźnie  periodyczne.  od  0,01  do  0,12.  Przy  interpretacji  tych  wyników 
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Rys.  2.  Pierwsze  obserwacje  impulsów  pulsarów.  U góry  — fragment  sygnału  wysyłanego  przez  pulsara  CP  1919.  W każdym  dwudzie- 
stosekundowym  odstępie  można  wyróżnić  15  impulsów.  U dołu  — zmiany  amplitudy  pulsara  CP  0950 


kształty  Analiza  wielu  (kilkuset)  impulsów  prowadzi  do 
impulsów  wniosku,  że  każdy  pulsar  ma  charakterystyczny  średni 
kształt  impulsu.  Niektóre  z nich  przedstawiono  na 
rys.  3.  Podobnie  jak  pojedynczy  impuls  — średni 
impuls  może  mieć  jedno  lub  kilka  maksimów.  Z da- 
nych obserwacyjnych  wynika,  że  czas  trwania  śred- 
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Rys.  3.  Średnie  kształty  impulsów  niektórych  pulsarów.  Z boku 
podano  numery  pulsarów 


Rys.  4.  Kształt  im- 
pulsu niektórych  pul- 
sarów ulega  perio- 
dycznym zmianom. 
Dotyczy  to  głównie 
pulsarów  o złożonym 
kształcie  impulsu. 
Prócz  podstawowego 
okresu  pulsara  P moż- 
na wyróżnić  okresy 
Pz  i Pa.  Pa  jest  to  naj- 
mniejszy odstęp  cza- 
su. po  którym  impuls 
przyjmuje  pierwotny 
kształt.  Odstęp  czasu 
pomiędzy  podimpul- 
sami  oznaczono  przez 
Pb 


trzeba  pamiętać,  że  At  zależy  od  częstości,  na  jakiej 
prowadzone  są  obserwacje. 

F.D.  Drakę  i H.D.  Craft  zauważyli  periodyczne 
zmiany  kształtu  impulsu.  Śledzili  oni  dokładnie  mo- 
ment pojawienia  się  podimpulsu  w pulsarze  CP  1919 
(początkowo  pulsary  oznaczano  podając  miejsce  od- 
krycia oraz  rektascensję  pulsara,  np.:  CP  1919  to 
pulsar  odkryty  w Cambridge,  o rektascensji  19  h 
i 19  min,  MP0034  to  pulsar  odkryty  w Mullard 
w Australii,  o rektascensji  34  min;  obecnie  powszech- 
nie stosuje  się  oznaczenie  PSR  1919,  co  oznacza  pul- 
sar o rektascencji  19  h i 19  min)  i stwierdzili,  że  okres 
tych  zmian  jest  bardzo  krótki,  rzędu  10  ms  (rys.  4). 
Ponadto  doszli  do  wniosku,  że  szybkie  oscylacje  są 
niezależne  od  głównego  sygnału  i występują  jak  gdyby 
na  tle  głównego  impulsu,  co  sugeruje,  że  zachodzą 
w sposób  ciągły.  Stąd  wynika,  że  mechanizm  odpo- 
wiedzialny za  powstawanie  szybkich  zmian  jest  różny 
od  tego,  który  wywołuje  podstawową  okresowość  pul- 
sara. Okres  szybkich  zmian  nie  jest  stały,  a zatem  co 
pewien  czas  sytuacja  może  się  powtarzać.  Istotnie 
periodyczność  taka  występuje  i okres  tych  zmian 
waha  się  od  kilku  do  kilkunastu  sekund. 

Podstawowy  okres  pulsara  jest  bardzo  stabilny. 
Dla  większości  znanych  pulsarów  wyznaczono  dP/dt , 
przy  czym  wielkość  ta  jest  mniejsza  od  4,2  1 0-13, 
a na  ogół  jest  rzędu  10_IB.  W ciągu  ostatnich  lat  okres 
pulsarów  zmienił  się  co  najwyżej  o 10_e  swej  pier- 
wotnej wartości.  Są  one  zatem  bardzo  dobrymi  ze- 
garami. Prócz  powolnych  zmian  okresu  zauważono 
kilka  szybkich  zmian,  w czasie  których  okres  gwał- 
townie malał.  Nie  udało  się  jednak  dokładnie  prześle- 
dzić tych  zmian,  ale  przypuszcza  się,  że  zachodzą  one 
w ciągu  kilku  godzin. 

Sygnały  wysyłane  przez  pulsary  były  obserwowane 
w szerokim  zakresie  fal  od  40  MHz  do  8,1  GHz, 
a pulsary  występujące  w mgławicach  Krab  i Żagiel 
prócz  sygnałów  radiowych  wysyłają  również  sygnały 
w obszarze  widzialnym,  rentgenowskim  i w obszarze 
promieni  y. 

Zauważono  trzy  główne  efekty,  które  zależą  od 
częstości,  mianowicie : dyspersję  impulsów,  rozmywa- 
nie impulsów  i zmiany  natężenia  impulsów.  Pierwsze 
dwa  efekty  są  związane  z tym,  że  sygnał  na  swej 
drodze  napotyka  na  materię  międzygwiezdną,  a trzeci 
efekt  jest  zapewne  właściwością  samego  źródła. 

Dyspersja  impulsów,  tzn.  zależność  prędkości  roz- 
przestrzeniania się  sygnałów  od  częstości,  wywołana 
przejściem  impulsów  przez  obszary  plazmy  między- 
gwiezdnej, umożliwia  oszacowanie  odległości  od 
pulsarów.  Znajdują  się  one  daleko  poza  granicami 
Układu  Słonecznego  i większość  pulsarów  jest  w od- 
ległości kilkuset  parseków.  Plazma  międzygwiezdna 
może  wywoływać  zmianę  natężenia  impulsów.  Trud- 
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no  sobie  jednak  wyobrazić,  aby  plazma  międzygwiezd- 
na powodowała  zmiany  amplitudy  kolejnych  sygna- 
łów. Muszą  one  być  wywoływane  przez  procesy  fizycz- 
ne zachodzące  w źródle. 

widmo  Widma  energii  pulsarów  są  różne,  mają  jednak 
energii  wspólną  cechę.  Wydaje  się,  że  dla  wszystkich  pulsa- 
pulsarów  rów  energia  wypromieniowywana  gwałtownie  maleje 
zarówno  dla  bardzo  dużych,  jak  też  i dla  małych  czę- 
stości (rys.  5). 


PSR  0328 


Rys.  5.  Widmo  energii 
niektórych  pulsarów. 
Energia  wypromieniowa- 
na  maleje  zarówno  dla 
małych  jak  i dla  dużych 
częstości 


Wiele  danych  o mechanizmie  promieniowania  pul- 
sarów można  otrzymać  badając  polaryzację  sygnałów. 
Stopień  polaryzacji  jest  duży  i dochodzi  do  95%. 
Niektóre  impulsy  są  spolaryzowane  kołowo.  W wielu 
wypadkach  stopień  polaryzacji  zmienia  się  w czasie 
trwania  impulsu.  Własności  polaryzacyjne  sygnałów 
bardzo  nieznacznie  lub  w ogóle  nie  zależą  od  częstości. 
Zmiany  polaryzacji  impulsów  puisara  PSR  0833 
przedstawia  rys.  6. 

Najdokładniej  zbadany  jest  pulsar  PSR  0532 
w Mgławicy  Krab  (rys.  7),  która  powstała  w wyniku 
wybuchu  supernowej  w 1054  r.  Pulsar  ten  wysyła 
sygnały  w zakresie  fal  radiowych,  w widzialnej  części 
widma  (rys.  8)  oraz  w obszarze  rentgenowskim. 
Stwierdzono,  że  kształty  impulsów  rentgenowskie 
i optyczne  pokrywają  się  z dokładnością  do  jednej 
milisekundy.  Impulsy  występują  też  w obszarze  pro- 
mieni y. 

Jak  dotychczas  nie  stwierdzono  impulsów  w obsza- 
rze y o energii  większej  od  50  MeV.  Bardzo  dokładne 
obserwacje  nie  doprowadziły  do  odkrycia  żadnych 
linii  ani  pasm  w widmie  pulsarów.  Próby  odkrycia 
krótkotrwałych  periodycznych  zmian  impulsów  w ob- 
szarze widzialnym  też  zawiodły. 

Pulsar  w Mgławicy  Krab  jest  jedynym  jak  do  tej 
pory  pulsarem,  dla  którego  stwierdzono  sporadyczne 
(raz  na  ok.  104  impulsów)  krótkotrwałe  wzrosty 
energii  impulsu  o mniej  więcej  1000  razy  w porów- 
naniu ze  średnią  energią  impulsów.  Impulsy  są  spo- 
laryzowane. W obszarze  widzialnym  stopień  polary- 
zacji liniowej  zmienia  się  od  20  do  30%,  a stopień 
polaryzacji  kołowej  jest  mniejszy  od  10%.  Płaszczyz- 
na polaryzacji  szybko  się  obraca,  stale  w tym  samym 
kierunku.  Okres  puisara  PSR  0532  zmierzono  bardzo 
dokładnie;  jego  zmiany  można  opisać  wzorem  em- 
pirycznym : 

P = ńo+^/4-  bzt\  (1) 

gdzie  b0,  bx  i b2  są  stałymi.  Za  początek  liczenia  czasu 
wybrano  północ  17  III  1969  r.  (czas  / mierzony  jest 
w tygodniach).  Dane  obserwacyjne  prowadzą  do 

P = [33095563, 9268 +(3652256+0, 00050)/- 


Rys.  6.  Zmiany  polaryzacji  impulsów:  a)  zmiana  polaryzacji 
impulsu  puisara  PSR  0833,  b)  zmiana  kąta  polaryzacji  puisara 
PSR  0833 


- (0,55  ± 0, 1 3)  1 0- 4/ 2]  ± 0,037  ns.  (2) 
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Rys.  8.  Puisar  w Mgławicy  Krab  periodycznie  „mruga”  i w wi- 
dzialnej części  widma.  Na  zdjęciu  wykonanym  w momencie 
maksimum  amplitudy  jest  widoczny  (a),  natomiast  nie  pojawia 
się  na  zdjęciu  wykonanym  o pół  okresu  później  (b) 


Proszę  zwrócić  uwagę  na  niezwykłą  dokładność, 
z jaką  znamy  okres  tego  pulsara.  Przyjmuje  się,  że 
zmiany  prędkości  kątowej  co  pulsarów  są  opisywane 
zależnością: 

du> 

nr  = (3> 

gdzie  K i n — stałe;  dla  pulsara  w Mgławicy  Krab 
n = 2,515±  0,005. 

straty  Wydłużenie  się  okresu  oznacza,  że  puisar  PSR  0532 
energii  traci  część  swojej  energii  rotacyjnej.  Przyjmując,  że 
moment  bezwładności  / nie  ulega  zmianie,  szybkość 
strat  energii  można  zapisać  w postaci : 


dEroi 

~dT 


= 4ti2 


I dP_ 
P*  dt  ' 


(4) 


Oszacowanie  strat  energii  wymaga  znajomości  mo- 
mentu bezwładności  pulsara.  Do  tych  rozważań 
wrócimy,  gdy  będziemy  rozpatrywali  modele  pulsa- 
rów. 

Dla  kilku  pulsarów  zauważono  gwałtowną  zmianę 
okresu  P,  po  czym  dP/dt  znowu  przyjmowało  stałą 
wartość,  choć  nieco  różną  od  wartości  przed  skokiem. 


Zjawisko  to  obserwowano  wielokrotnie.  Na  przykład 
zmiany  takie  wystąpiły  u pulsara  PSR  0833  (przed- 
stawiono je  na  rys.  9). 


Rys.  9.  Gwałtowna  zmiana  okresu  pulsara  PSR  0833.  Między 
24  II  a 3 III  1969  r.  okres  zmniejszył  się  o 200  ns 


Dotychczas  tylko  dla  pulsarów  w mgławicach  Krab 
i Żagiel  i pulsara  rentgenowskiego  Her  X-1  zareje- 
strowano impulsy  w obszarze  widzialnym.  Poszuki- 
wania pulsarów  w obszarze  rentgenowskim  też  za- 
kończyły się  powodzeniem.  Znaleziono  kilka  takich 
obiektów.  Prócz  PSR  0532  impulsy  w obszarze  rent- 
genowskim wysyłają  między  innymi  Her  X-1  i Cen 
X-3.  Rentgenowski  puisar  Her  X-1  ma  okres  1,24  s 
i jest  najszybciej  zmiennym  pulsarem  rentgenowskim. 
Okres  pulsara  Cen  X-3  wynosi  4,8  s i 90%  energii 
wypromieniowuje  w postaci  impulsów.  Oba  te  pulsary 
wchodzą  w skład  układów  podwójnych  (-*  Ewolucja 
gwiazd)  o okresach  zmienności  odpowiednio  dla 
Her  X-1  1,7  dnia  i dla  Cen  X-3  2,08  dnia. 

Obecnie  znamy  ok.  320  pulsarów.  Można  już  więc 
próbować  przeprowadzić  statystyczną  analizę  ich 
własności,  niektóre  z nich  zestawiono  w tabeli.  Okresy 
pulsarów  radiowych  zawierają  się  w zakresie  od 
0,033  s do  4,3  s,  przy  czym  najwięcej  pulsarów  ma 
okresy  od  0,5-1 ,0  s.  Odległości  pulsarów  od  Ziemi 
wynoszą  najczęściej  kilkaset  parseków  i zawierają  się 
w granicach  60-1 1 000  ps.  Interesujące  jest  zestawienie 
odległości  pulsarów  od  płaszczyzny  Galaktyki 
(rys.  10),  z którego  wynika,  że  grupują  się  one  w jej 
płaszczyźnie.  Przestrzenny  rozkład  pulsarów  w Galak- 
tyce. który  przedstawia  rys.  11,  jest  podobny  do  roz- 
kładu gwiazd  pierwszej  populacji  (->  Galaktyka) 
i supernowych  drugiego  rodzaju. 

Wiosną  1974  r.  grupa  radioastronomów  korzysta- 
jąc z największego  obecnie  na  świecie  radioteleskopu 
w Arecibo  (Porto  Rico)  odkryła  kilkadziesiąt  nowych 
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Rys.  10.  Rozkład  pulsarów  w zależności  od  ich  odległości  od 
płaszczyzny  Galaktyki 


ten  wchodzi  w skład  układu  podwójnego.  Jest  to 
pierwszy  pulsar  radiowy  występujący  w układzie 
podwójnym.  Jego  odkrycie  ma  duże  znaczenie.  Być 
może  korzystając  z dokładniejszych  danych  obser- 
wacyjnych na  temat  tego  układu  będzie  można  wyz- 
naczyć masę  gwiazdy  neutronowej.  Byłaby  to  pierw- 
sza bezpośrednia  obserwacyjna  informacja  o pod- 
stawowych parametrach  charakteryzujących  gwiazdy 
neutronowe.  Układ  ten  można  również  stosować  do 
sprawdzenia  różnych  efektów  szczególnej  i ogólnej 
teorii  względności. 

Dane  obserwacyjne  pozwalają  na  podanie  wielu 
ograniczeń  na  modele  pulsarów.  Krótki  czas  trwania 
impulsów  oznacza  * że  źródło  promieniowania  jest 
małych  rozmiarów.  Niezwykła  stabilność  okresu  pul- 
sarów wskazuje  na  to,  że  proces  odpowiedzialny  za 
periodyczność  powinien  być  związany  z mechanicz- 
nymi własnościami  układu. 

Początkowo  przypuszczano,  że  pulsary  są  pulsują- 
cymi białymi  karłami,  stąd  zresztą  myląca  nieco  ich 
nazwa.  Jednak  z dokładnej  analizy  wynika,  że  białe 
karły  nie  mogą  pulsować  z tak  krótkim  okresem. 
Obrót  białego  karła,  jako  mechanizm  zapewniający 
periodyczność,  należało  też  odrzucić,  gdyż  wymagana 
prędkość  kątowa  obrotu  dla  krótkookresowych  pul- 
sarów byłaby  za  duża  i siły  grawitacyjne  nie  mogłyby 
równoważyć  sił  odśrodkowych. 


pulsar 
radiowy  w 
układzie 
podwójnym 
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Rys.  1 1 . Przestrzenny  rozkład  pulsarów.  Mają  one  wyraźną 
tendencję  do  skupiania  się  w płaszczyźnie  Galaktyki ; b szerokość 
galaktyczna 


pulsarów.  Okres  jednego  z nich  (pulsar  PSR  1923, 
odkryty  przez  J.  H.  Taylora  i R.  A.  Hulse’a)  zmieniał 
się  periodycznie  co  0,3230  dnia  pomiędzy  0,058967 
a 0,059045  s (rys.  12).  Z danych  tych  wynika,  że  pulsar 


oznacza,  że  wchodzi  on  w skład  układu  podwójnego 


Gwiazdy  neutronowe 

Bardzo  szybko  po  odkryciu  pulsarów  zdano  sobie 
sprawę  z tego,  że  jedynie  gwiazda  neutronowa  może 
być  podstawą  wszelkich  modeli  mechanizmu  zapew- 
niającego periodyczność  pulsarów.  Jedynego  konku- 
rencyjnego kandydata  — białego  karła  — trzeba  było 
odrzucić.  Białe  karły  nie  mogą  ani  pulsować,  ani  ob- 
racać się  z tak  krótkimi  okresami.  Obecnie  nie  ulega 
już  wątpliwości,  że  pulsar  to  obracająca  się  gwiazda 
neutronowa.  Nie  można  wprawdzie  podać  bezpo- 
średniego dowodu,  ale  inne  modele  musiałyby  być 
znacznie  bardziej  skomplikowane. 

Hipotezę  o istnieniu  gwiazd  neutronowych  zapro-  hipoteza 
ponował  w latach  trzydziestych  L.  L.  Landau,  a nie-  gwiazd 
zależnie  od  niego  W.  Baade  i F.  Zwicky.  Baade  neutrono- 
i Zwicky  przeprowadzali  systematyczne  obserwacje  wych 
wybuchów  supernowych.  Obliczając  energię,  która 
zostaje  wydzielona  w czasie  wybuchu,  doszli  do  wnios- 
ku, że  stanowi  ona  tylko  pewien  procent  całkowitej 
energii  i po  wybuchu  powinna  jeszcze  pozostawać 
centralna,  bardzo  gęsta  część  tworząca  gwiazdę  neu- 
tronową. Zainteresowanie  gwiazdami  neutronowymi 
wzrosło,  gdy  zaczęto  badać  ostatnie  etapy  ewolucji 
gwiazd.  Okazało  się  wówczas,  że  zależnie  od  masy 
mogą  istnieć  dwie  różne  stabilne  konfiguracje  (rys.  13). 


Rys.  13.  Zależność  masy  gwiazdy  od  promienia  dla  gwiazd  o du- 
żej gęstości  centralnej.  Występują  dwie  stabilne  konfiguracje; 
białe  karły  i gwiazdy  neutronowe 
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Gwiazda,  która  wyczerpała  już  swój  zapas  paliwa 
jądrowego  i kurcząc  się  powoli  osiyga,  stanie  się 
w końcu  białym  karłem,  jeżeli  jej  masa  nie  przekracza 
krytycznej  wartości  1,4j Vf®.  Gwiazdy  bardziej  masyw- 
ne przechodzą  przez  stadium  wybuchu  supernowej 
i z ich  centralnych  części  w wyniku  dalszego  kurcze- 
nia może  powstać  gwiazda  neutronowa.  W białych 
karłach  siła  grawitacyjnego  przyciągania  jest  równo- 
ważona przez  ciśnienie  gazu  elektronowego.  W gwiaz- 
dach neutronowych  siły  grawitacyjne  są  równoważone 
ciśnienia  przez  ciśnienie  gazu  neutronowego.  Należy  podkreś- 
gazu  raeu-  lić,  że  ciśnienie  zarówno  w gazie  elektronowym  jak 
tronowogo  i neutronowym  jest  wywołane  nie  przez  zderzenia, 
jak  w przypadku  zwykłego  gazu,  lecz  przez  efekty 
kwantowe.  Elektrony  i neutrony  są  fermionami  i dla 
nich  obowiązuje  zakaz  Pauliego.  Dwa  elektrony  lub 
dwa  neutrony  nie  mogą  znajdować  się  w takim  samym 
stanie  kwantowym. 

Gdy  gęstość  materii  przekracza  5-1011  g/cm3  na- 
stępuje gwałtowna  zmiana  składu  chemicznego  ma- 
terii ; jądra  rozpadają  się  i jako  składniki  materii  po- 
zostają protony,  neutrony  i elektrony.  Przy  mniejszych 
gęstościach  charakterystyczny  czas  tego  procesu  zale- 
ży od  temperatury.  Temperatura  w obszarach  cen- 
tralnych gwiazdy  neutronowej,  powstałej  w procesie 
wybuchu  supernowej,  jest  bardzo  wysoka,  często  wyż- 
sza od  1010  K.  Reakcje  jądrowe  sprowadzające  układ 
do  stanu  równowagi  przebiegają  wówczas  bardzo 
szybko.  Gdy  gwiazda  neutronowa  ostygnie,  jej  skład 
chemiczny  nie  ulega  już  zmianie,  reakcje  jądrowe  prze- 
biegają bowiem  tak  wolno,  że  można  je  pominąć. 
Skład  chemiczny  materii  w gwieździe  neutronowej  w 
różnych  jej  obszarach  powinien  zatem  odpowiadać 
stanowi  równowagowemu. 

Dzięki  znacznym  różnicom  gęstości  pomiędzy  cen- 
trum JO15  g/cm3  a powierzchnią,  gwiazda  neutronowa 
obszary  powinna  być  podzielona  na  obszary  wyraźnie  rozgra- 
w gwieźdzśa  niczone  i różniące  się  własnościami  fizycznymi.  Moż- 
neutronowej  na  wyróżnić  trzy  takie  obszary  (rys.  14). 


Rys.  14.  Przekrój  przez  gwiazdę  neutronową.  Centralne  jądro 
hipernowe  jest  otoczone  cieczą  neutronową.  Dalej  na  zewnątrz 
znajduje  się  krystaliczna  powłoka,  a nad  nią  bardzo  cienka  war- 
stwa gęstej  atmosfery 


a)  Powłoka.  Jej  grubość  zależy  od  całkowitej  masy 
gwiazdy  i zmienia  się  od  ok.  100  m dla  gwiazd  o du- 
żej masie  do  ok.  10  km  dla  lekkich  gwiazd.  W pow- 
łoce gęstość  stopniowo  wzrasta  i na  wewnętrznej 
granicy  osiąga  wartość  4,3*1 011  g/cm3.  Poza  tym 
powłoka  jest  złożona  z elektronów  i jąder  tworzą- 
cych strukturę  krystaliczną.  W głębszych  warstwach, 
gdzie  gęstość  jest  większa  od  10*  g/cm3,  najbardziej 
stabilne  są  jądra  żelaza,  na  dolnej  zaś  granicy  jądra 
cyrkonu  Z = 40,  A = 127.  W normalnych  warun- 
kach jądra  te  były  niestabilne  ze  względu  na  rozpad  /?. 

M Ciecz  neutronowa.  W głębszych  warstwach 
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w miarę  zbliżania  się  do  centrum,  wzrasta  gęstość 
materii.  Z energetycznego  punktu  widzenia  korzystna 
jest  w tych  warunkach  reakcja  odwrotna  do  rozpadu  j? 
swobodnego  neutronu : 

p+e  -*  n+v9 

prowadząca  do  jąder  o coraz  to  większej  zawartości 
neutronów.  W końcu  przy  gęstości  1012  g/cm3  jądra 
rozpadają  się  i przy  większych  gęstościach  występuje 
już  tylko  mieszanina  neutronów,  protonów  i elektro- 
nów. W stanie  równowagi  stosunek  ilości  neutronów 
do  protonów  i do  elektronów  wynosi  8:1:1.  Warunki 
fizyczne  panujące  w tym  obszarze,  a więc  zakres 
gęstości  i temperatur,  jest  taki,  że  neutrony  stanowią 
ciecz  neutronową  w stanie  nadciekłym. 

c)  Hiperonowe  jądro.  Gdy  masa  gwiazdy  neutrono- 
wej przewyższa  0,5 M®,  to  gęstości  w centralnych 
częściach  mogą  przewyższać  KP*  g/cm3.  Wtedy  prócz 
neutronów,  protonów  i elektronów  mogą  występo- 
wać w równowadze  hiperony.  W takich  warunkach 
fizycznych  konfiguracją  o najniższej  energii  jest  układ 
krystaliczny.  Należy  zauważyć,  że  rozważania  doty- 
czące własności  tego  obszaru  są  dość  spekulatywne. 

Nie  mamy  bowiem  pewności,  czy  równanie  stanu, 
za  pomocą  którego  opisujemy  własności  materii  przy 
tak  dużych  gęstościach,  znamy  dostatecznie  dokład- 
nie. 

Zależnie  od  postaci  równania  stanu,  a więc  od  tego,  własności 
jakie  procesy  fizyczne  uwzględnia  się  przy  bardzo  ©waazd 
dużych  gęstościach,  otrzymuje  się  różne  wartości  noutrono- 
parametrów  charakteryzujących  gwiazdę  neutronową,  wyoh 
Na  ogół  przyjmuje  się,  że  masy  gwiazd  neutronowych 
wynoszą  0,1 -2M®,  a ich  promienie  mogą  być  zawarte 
pomiędzy  10  a 1000  km.  Pole  grawitacyjne  na  po- 
wierzchni gwiazdy  neutronowej  jest  bardzo  silne 
i konstruując  modele  takich  gwiazd  stosuje  się  rów- 
nania ogólnej  teorii  względności.  Poprawki  relaty- 
wistyczne mogą  stanowić  aż  kilkanaście  procent.  Pod- 
stawowe parametry  gwiazd  neutronowych  zestawiono 
w tabeli  (masa  gwiazdy  neutronowej  nie  jest  sumą  mas 
wszystkich  cząstek.  Sumę  mas  wszystkich  cząstek 
wchodzących  w skład  gwiazdy  neutronowej  nazywa- 
my jej  masą  właściwą). 

Gwiazdy  neutronowe  mogą  wykonywać  radialne 
drgania  i początkowo  przypuszczano,  że  właśnie  one 
będą  odpowiednim  mechanizmem  zapewniającym 
periodyczność  pulsarów.  Przypuszczenie  to  jednak 
odrzucono.  Okazało  się  bowiem,  że  typowy  okres 
pulsacji  gwiazd  neutronowych  jest  bardzo  krótki 
i wynosi  kilka  milisekund. 

Maksymalna  wartość  prędkości  kątowej,  z jaką 
może  się  obracać  gwiazda  neutronowa  o)kr  = 

= ]/ Gq  ~ 3000  rad/s,  gdzie  q — gęstość  materii 
jądrowej  równej  2*  1014  g/cm3.  Wartość  ta  jest  znacz- 
nie większa  od  prędkości  kątowej  najszybszych  pul- 
sarów; na  przykład  dla  PSR  0532  wynosi  ona  190 
rad/s. 


Podstawowe  parametry  modeli  gwiazd  neutronowych 


Ig  gęstości 
centralnej 

Masa 
103*  kg 

Masa 

właściwa 

1030kg 

Promień 

km 

Energia 
wiązania 
1030  kg 

15,6 

3,45 

4,69 

8,74 

1,24 

15,5 

3,44 

4,56 

9,13 

1,12 

15,4 

3,35 

4,31 

9,54 

0,96 

15,3 

3,17 

3,95 

9,92 

0,78 

15,2 

2,88 

3,46 

10,2 

0,58 

15,1 

2,48 

2,87 

10,5 

0,40 

15,0 

2,01 

2,25 

10,6 

0,25 

14,9 

1,53 

1,68 

10,7 

0,14 

14,8 

1,09 

1,!6 

10,7 

0,07 

14.7 

0,73 

0,77 

11,0 

0,03 

14,6 

0,52 

0,54 

11,6 

0,02 

14,5 

0,37 

0,38 

12,5 

0,01 

14,4 

0,25 

0,25 

15,1 

0,004 

14,3 

0,14 

0,14 

47,9 

0,001 

14,2 

0,37 

0,45 

341 

0,03 

14,1 

0,95 

1,03 

401 

0,03 

14,0 

1,10 

1,17 

349 

0,02 

Gwiazdy  neutronowe  mogą  mieć  silne  pola  magne- 
tyczne. Oszacowanie  natężeń  tych  pól  można  prze- 
prowadzić stosując  zasadę  zachowania  strumienia. 
Pole  magnetyczne  B na  powierzchni  typowej  gwiazdy 
wynosi  kilka  mikrotesli,  zatem  korzystając  z zasady 
zachowania  strumienia  BR 2 — const  można  przy- 
puszczać, że  pole  magnetyczne  na  powierzchni  gwiaz- 
dy neutronowej  będzie  bardzo  silne,  rzędu  10®  T. 


Model  mephanizmu  zegarowego 

Zmierzono  dokładnie  prędkość  wydłużenia  się  okresu 
wielu  pulsarów.  Stosując  wzór  (4)  można  oszacować 
straty  energii  rotacyjnej  w czasie  najdokładniej  zba- 
danego pulsara  w Mgławicy  Krab.  Moment  bezwład- 
ności / gwiazd  neutronowych  o masach  zbliżonych  do 
masy  Słońca  szacuje  się  na  1044  g/cm2.  Podstawiając 
dane  dla  pulsara  PSR  0532  otrzymujemy  dErotldt  = 
= 5-1030  J/s  = 2 * 104  £®,  gdzie  L®  jest  jasnością 
Słońca.  Stąd  wynika,  że  energia  kinetyczna  ruchu 
obrotowego  może  być  źródłem  energii  pulsarów. 
Problem  polega  teraz  na  tym,  aby  energię  mechanicz- 
ną rotacji  zamienić  na  energię  promieniowania  pola 
elektromagnetycznego. 

W jednej  z pierwszych  prac  teoretycznych,  jakie 
Golda  się  pojawiły  na  temat  pulsarów,  T.  Gold  zapropono- 
model  wał  prosty  model  takiego  mechanizmu.  Według  Golda 
pulsara  pulsar  to  obracająca  się  gwiazda  neutronowa  mająca 
dipolowe  pole  magnetyczne.  Oś  obrotu  gwiazdy  two- 
rzy pewien  kąt  z kierunkiem  dipola  magnetycznego, 
dzięki  czemu  pole  magnetyczne  zmienia  się  periodycz- 
nie w czasie  (rys.  15).  Energię  pola  magnetycznego 
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jąca  się  \ ^ rowns>  Prędkości  światła  // 

plazma  X stożek,  w którym  skupione  jest.// 
\ promieniowanie  cząstki 


Rys.  15.  Model  pulsara  zaproponowany  przez  T.  Golda.  Kie- 
runek dipolowego  pola  magnetycznego  nie  pokrywa  się  z kie- 
runkiem osi  obrotu.  Obrót  pola  magnetycznego  powoduje  obrót 
plazmy  otaczającej  gwiazdę  neutronową.  Im  dalej  od  osi  obrotu 
z tym  większymi  prędkościami  liniowymi  poruszają  się  nałado- 
wane cząstki.  Gdy  prędkości  ich  są  bliskie  prędkości  światła,  pro- 
mieniują one  bardzo  silnie.  Promieniowanie  to  jest  skupione 
wokół  kierunku  prędkości,  co  przy  obrocie  układu  powoduje 
efekt  impulsu 


wypromieniowaną  w jednostce  czasu  można  oszaco- 
wać w prosty  sposób.  Powinna  ona  mieć  wymiar 
J/s;  najprostszą  wielkością  o tym  wymiarze,  jaką 
można  zbudować  z momentu  magnetycznego  dt 
prędkości  kątowej  a>  i prędkości  światła  w próżni  c 
jest  d2oj*/c 3.  Dokładne  obliczenia  prowadza  do  wzoru: 

dE  2 rfW 

dt  3 c®  W 

Podstawiając  tutaj  dane  dla  typowej  gwiazdy  neutro- 

nowej, a więc  średnie  natężenie  pola  magnetycznego 
B — 108  T,  promień  gwiazdy  R = 10*  cm  i co  = 
= 200  s_1  oraz  pamiętając  o tym,  że  możemy  przy- 
jąć d = BR 3,  otrzymamy: 

dE/dt  = 2- 1031  J/s  = 105L®.  (6) 
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Wartość  ta  jest  zgodna  z obserwowanym  strumieniem 
energii  wysyłanym  przez  pulsar  z Mgławicy  Krab, 
która  promieniuje  4-1030  J/s  w obszarze  rentgenow- 
skim i 2 1029  J/s  w widzialnej  części  widma.  War- 
tość ta  zgadza  się  też  dobrze  z oszacowanymi  stra- 
tami energii  rotacyjnej.  Różnicy  o czynnik  5 nie  na- 
leży się  dziwić,  dokonywaliśmy  bowiem  jedynie 
grubszych  oszacowań. 

Model  obracającej  się,  namagnesowanej  gwiazdy 
neutronowej  zapewnia  periodyczność  oraz  wyjaśnia 
pochodzenie  energii  promieniowania  pulsarów.  Istnie- 
je duże  prawdopodobieństwo,  że  przestrzeń  wokół 
obracającej  się  namagnesowanej  gwiazdy  neutronowej 
jest  wypełniona  plazmą.  W pobliżu  gwiazdy  pole  mag- 
netyczne będzie  dostatecznie  silne  i plazma  będzie 
się  obracała  wraz  z gwiazdą.  Jednak  w pewnej  odle- 
głości od  powierzchni  gwiazdy  wpływ  sił  zewnętrznych 
zacznie  dominować  i plazma  nie  będzie  już  obracać 
się  z gwiazdą.  Dla  szybko  obracającej  się  gwiazdy 
neutronowej  z silnym  polem  magnetycznym  obszar, 
w którym  plazma  obracać  się  będzie  wraz  z gwiazdą, 
rozciągać  się  może  niemal  do  promienia,  na  którym 
liniowa  prędkość  cząstek  osiąga  prędkość  światła. 
Promieniowanie  takiej  relatywistycznej  plazmy  ma 
być  według  Golda  źródłem  sygnałów.  Model  ten  na- 
zwano modelem  latarni  morskiej.  Wyjaśnia  on  w ogól- 
nych zarysach  ideę  mechanizmu  promieniowania,  nie 
prowadząc  do  żadnych  szczegółowych  przewidywań. 
Teraz  należy  jeszcze  udowodnić,  że  namagnesowana, 
szybko  rotująca  gwiazda  neutronowa  może  być  oto- 
czona plazmą. 

Jeżeli  pominąć  rotację  gwiazdy  neutronowej  i jej 
pole  magnetyczne,  to  gęstość  atmosfery  gwiazdy  opi- 
suje znany  wzór  barometryczny : 

q(ż ) = Q0ermgztkT.  (7) 

Wysokość  atmosfery  H można  określić  jako  wyso- 
kość, na  której  gęstość  jest  e-krotnie  mniejsza,  niż 
przy  powierzchni  (wykładnik  potęgowy  równy  1). 
Mamy  zatem: 

H — kT/mg,  (8) 

gdzie  k — stała  Boltzmanna,  m — masa  cząsteczek 
atmosfery,  a g — przyspieszenie  grawitacyjne.  Pod- 
stawiając dane  dla  gwiazdy  neutronowej  T = 106  K, 
m = 3 10~24  g oraz  g = GM/R 2 » 3 TO13  cm/s2  do 
wzoru  (8)  otrzymujemy  H = 1 cm.  Żadna  gwiazda 
neutronowa  nie  powinna  mieć  atmosfery,  sądzono 
więc,  że  jest  po  prostu  otoczona  próżnią.  P.  Goldreich 
i W.  Julian  wykazali,  że  tak  nie  jest.  Rozpatrzyli  oni 
prosty  model  obracającej  się  gwiazdy  neutronowej 
z polem  magnetycznym  o dipolu  ustawionym  równo- 
legle do  osi  obrotu.  Założyli  przy  tym,  że  zarówno  ma- 
teria wewnątrz  gwiazdy  jak  i atmosfera  są  doskona- 
łymi przewodnikami.  Analizując  własności  pola  elek- 
tromagnetycznego w otoczeniu  gwiazdy  neutronowej, 
a szczególnie  warunki,  jakie  muszą  być  spełnione  na 
granicy  między  atmosferą  a pustą  przestrzenią  na 
zewnątrz,  zauważyli,  że  gwiazda  neutronowa  nie  może 
być  otoczona  przez  próżnię.  Pomimo,  że  w pobliżu 
powierzchni  istnieje  silne  pole  grawitacyjne,  gwiazda 
neutronowa  musi  być  otoczona  przez  obłoki  zjoni- 
zowanego  gazu,  tworząc  tzw.  magnetosferę.  Gaz 
tworzący  magnetosferę  jest  zjonizowany.  Zatem  struk- 
tura magnetosfery  zależy  od  własności  pola  grawita- 
cyjnego i pola  magnetycznego  wytwarzanego  przez 
gwiazdę  neutronową. 


Jak  powstają  impulsy? 

Na  to  pytanie  do  dziś  nie  ma  zadowalającej  odpo- 
wiedzi. Istnieje  wiele  konkurencyjnych  teorii,  ale  każ- 
da z nich  ma  jeszcze  słabe  strony.  Prawdopodobnie 
mechanizm  powstawania  impulsów  jest  złożony  i wiele 
procesów  fizycznych  jest  odpowiedzialnych  za  ich 
powstawanie.  Zaproponowane  modele,  wyjaśniające 
powstawanie  impulsów,  wykorzystują  następujące 
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procesy  fizyczne:  a)  promieniowanie  relatywistycznych 
naładowanych  cząstek,  b)  efekty  kwantowe  wystę- 
pujące w silnych  polach  magnetycznych,  c)  laserowe 
promieniowanie  plazmy.  Można  je  zatem  podzielić  na 
trzy  grupy.  Promieniowanie  relatywistycznych  nała- 
dowanych cząstek  jako  źródło  sygnałów  wykorzystał 
T.  Gold  w swoim  modelu  latarni  morskiej.  Przyjął  on, 
że  pole  magnetyczne  obracające  się  wraz  z gwiazdą 
neutronową  unosi  ze  sobą  naładowane  cząstki. 
W obszarze,  gdzie  prędkości  liniowe  cząstek  są  po- 
równywalne z prędkością  światła,  a więc  w odległości 
R od  pulsara,  takiej  że  c = a>R  (na  powierzchni  tak 
rwanego  cylindra  świetlnego),  wysyłają  one  silne  pro- 
mieniowanie elektromagnetyczne  skoncentrowane 
wzdłuż  kierunku  ruchu  cząstki.  Promieniowanie  to 
charakteryzuje  duży  stopień  polaryzacji  (rys.  16). 
Trudności  w dopasowaniu  tego  modelu  do  faktów 
obserwacyjnych  są  dwojakiego  rodzaju.  Po  pierwsze, 
nie  wiadomo,  w jaki  sposób  byłaby  zapewniona  do- 
statecznie duża  koncentracja  cząstek  w pobliżu  cylin- 
dra świetlnego,  a tym  samym  uzyskane  odpowiednie 
natężenie  promieniowania.  Po  drugie,  model  ten  nie 
tłumaczy  złożonej  struktury  sygnałów  pulsarów. 


elektron 


linie  siły  pola  magnetycznego 


Rys.  16.  Mechanizm  promieniowania  relatywistycznych  nałado- 
wanych cząstek.  Elektron  poruszający  się  z bardzo  dużą  pręd- 
kością w polu  magnetycznym  zakreśla  linię  śrubową  wzdłuż  linii 
sił  pola  magnetycznego.  Emitowane  fale  radiowe,  przedstawione 
liniami  falistymi,  są  spolaryzowane  w płaszczyźnie  prostopadłe 
do  linii  sił  pola  magnetycznego 
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Analizując  zachowanie  się  plazmy  w silnych  polach 
magnetycznych  H.  Chi  u i V.  Canuto  zauważyli,  że 
promień  linii  śrubowej,  po  której  zwykle  porusza  się 
naładowana  cząstka  w polu  magnetycznym,  nie  może 
być  dowolny,  lecz  jest  skwantowany,  to  znaczy  może 
przyjmować  tytko  określone  wartości.  Uważają  oni, 
że  promieniowanie  pulsarów  powstaje  w pobliżu 
powierzchni  gwiazdy  neutronowej  w okolicach  jej 
biegunów  magne.ycznych.  W tych  obszarach  mogłyby 
powstawać  silne  impulsy  promieniowania  przy  jedno- 
czesnym przeskoku  elektronów  lub  protonów  z jed- 
nej dopuszczalnej  linii  śrubowej  na  inną  o mniejszym 
promieniu.  Ze  względu  na  trudności  z pogodzeniem 
przewidywań  tego  modelu  z danymi  obserwacyjnymi 
był  on  wielokrotnie  ulepszony,  ale  nadal  nie  wyjaśnia 
wielu  ważnych  obserwowanych  własności  pulsarów. 
Zgodnie  z przewidywaniami  tego  modelu  sygnały 
powstają  w pobliżu  powierzchni  gwiazdy,  ale  gęsta 
plazma  otaczająca  gwiazdę  neutronową  może  silnie 
zaburzyć  sygnały. 

Aby  zrozumieć  nadzieje,  jakie  wiązano  z możliwoś- 
cią laserowego  promieniowania  plazmy,  przypomnij- 
my równanie  opisujące  transport  promieniowania 
elektromagnetycznego  w ośrodku  materialnym.  Jeżeli 
przez  I oznaczamy  natężenie  promieniowania,  wów- 
czas: 

dl/dx  = (9) 


gdzie  x — odległość  mierzona  wzdłuż  kierunku  roz- 
chodzenia się  fali,  A i B — współczynniki  spontanicz- 
nej i wymuszonej  emisji,  //  — współczynnik  pochła- 
niania. Gdy  przyjmujemy,  że  wszystkie  te  wielkości 
są  stałe,  to  rozwiązanie  tego  równania  można  zapisać 
w postaci : 

/ = — ^r-[l— e<B_“)z]+/0e<fl"'‘>3!,  (10) 

fl  — tf 


gdzie  / = I(x  = 0).  Zauważmy,  że  jeżeli  B ^ 0,  co 
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odpowiada  absorpcji,  to  natężenie  będzie  asympto- 
tycznie malało  do  wartości  Al(fi-B).  Jeżeli  natomiast 
B > //,  występuje  efekt  laserowy,  i natężenie  wzrasta 
wykładniczo.  Gdyby  zatem  istniały  takie  warunki 
fizyczne,  które  zapewniałyby,  że  B > /*,  wówczas 
można  by  wyjaśnić  wiele  własności  promieniowania 
pulsarów.  Takie  warunki  można  zapewnić  jednak 
co  najwyżej  w pobliżu  powierzchni  gwiazdy  i wobec 
tego  napotykamy  tutaj  takie  same  trudności  jak  po- 
przednio. 

Ostatnio  dużą  popularnością  cieszy  się  model  za- 
proponowany przez  M.  Rudermana  i P.  Sutherlanda. 
Zbadali  oni  własności  magnetosfer  pulsarów  i zauwa- 
.żyli,  że  w pobliżu  biegunów  magnetycznych  wzdłuż 
linii  sił  pola  magnetycznego  powstaje  różnica  po- 
tencjałów uwożliwiająca  kreację  par  elektron-pozy- 
ton. Elektrony  i pozytony  są  przyspieszane  do  rela- 
tywistycznych prędkości,  a następnie  ulegają  grupo- 
waniu dzięki  niestabilnościom  plazmy.  Takie  grupy 
ładunków,  poruszające  się  po  zakrzywionych  liniach 
sił  pola  magnetycznego,  emitują  fale  radiowe. 

Jak  dotychczas  nikomu  nie  udało  się  podać  pełnego 
i zadowalającego  modelu  promieniowania  pulsarów 
i zapewne  nie  nastąpi  to  szybko.  Nie  są  też  jeszcze 
dokładnie  zbadane  właściwości  magnetosfery  ota- 
czającej gwiazdę  neutronową.  Poznanie  ich  jest  pierw- 
szym krokiem  na  długiej  drodze  do  zrozumienia  me- 
chanizmu promieniowania  pulsarów. 

Omawiając  dane  obserwacyjne  wspomnieliśmy 

0 dziwnym  zjawisku  zaobserwowanym  u kilku  pulsa- 
rów, a mianowicie  — o raptownej  zmianie  okresu. 
U niektórych  pulsarów  nastąpiło  to  już  kilkakrotnie, 
przy  czym  okres  pulsara  zawsze  uległ  skróceniu. 
Stosując  model  obracającej  się  gwiazdy  neutronowej 
F.  Dyson  podał  bardzo  przekonujące  wyjaśnienie. 
Przypomnijmy,  że  w gwieździe  neutronowej  można 
wyróżnić  trzy  obszary  — powłokę,  ciekły  obszar 
pośredni  i krystaliczne  jądro.  Choć  ciecz  wypełniająca 
obszar  pośredni  znajduje  się  w stanie  nadciekłym,  to 
jednak  warstwa  cieczy  granicząca  z powłoką  obraca 
się  z taką  samą  prędkością  kątową  co  i powłoka. 
Kiedy  w wyniku  straty  energii  rotacyjnej  gwiazda 
zaczyna  się  obracać  wolniej,  maleje  też  wartość  siły 
odśrodkowej  i powierzchnia  swobodna  cieczy  przyj- 
muje nowy,  bardziej  sferyczny  kształt.  W płaszczyźnie 
równikowej  pomiędzy  powłoką  a powierzchnią  swo- 
bodną cieczy  wytwarza  się  próżnia.  Narastają  również 
naprężenia  w powłoce.  W końcu  struktura  krystalicz- 
na powłoki  nie  może  zrównoważyć  naprężeń,  pęka 

1 przyjmuje  nowy  kształt,  pokrywający  się  z powierz- 
chnią swobodną  cieczy.  W czasie  tego  procesu  maleje 
moment  bezwładności.  Zgodnie  jednak  z zasadą  za- 
chowania momentu  pędu  iloczyn  momentu  bezwład- 
ności i prędkości  kątowej  powinien  być  stały,  a więc 
prędkość  kątowa  wzrasta,  co  odpowiadałoby  gwał- 
townemu skróceniu  okresu  impulsu.  Korzystając 
z tego  modelu  można  przewidzieć,  kiedy  nastąpi  ko- 
lejny taki  wstrząs.  Przewidywania  są  w zasadzie  zgod- 
ne z obserwacjami. 


Pulsary  rentgenowskie 

Bardzo  interesującą  grupą  pulsarów  są  pulsary  rent- 
genowskie. Satelita  UHURU,  który  okrążał  Ziemię 
(-►  Astronomia  promieni  X i y),  dostarczył  wiele  in- 
formacji o źródłach  promieniowania  rentgenowskiego. 
Niektóre  z nich  okazały  się  źródłami  pulsującymi. 
Ich  natężenie  zmienia  się  o czynnik  dwa  lub  więcej 
z okresem  krótszym  od  kilku  sekund.  Widmo  energii 
jest  płaskie  i występują  obcięcia  od  strony  niskich 
energii.  Kilka  z tych  źródeł  udało  się  zindetyfikować 
z układami  gwiazd  podwójnych. 

Najdokładniej  zbadanymi  pulsującymi  źródłami 
rentgenowskimi  są  Cyg  X-2,  Cen  X-3  i Her  X-l.  Ener- 
gia wypromieniowywana  w jednostce  czasu  przez  te 
źródła  jest  zawarta  pomiędzy  1Q29-1031  J/s,  czyli 
pomiędzy  102-105L®  i jest  tak  duża,  że  trudno  przy- 
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puszczać,  aby  ich  źródłem  mogły  być  reakcje  jądrowe. 
Słońce  na  przykład  wysyła  mniej  niż  10*  całkowitej 
wypromieniowywanej  energii  w rentgenowskim  ob- 
model  szarze  widma. 

pulsara  Dane  obserwacyjne  wskazują  na  to,  że  pulsary 
rentgenów-  rentgenowskie  są  układami  gwiazd  podwójnych, 
skiego  M°del  takiego  pulsara  powinien  wyjaśniać,  skąd  się 
biorą  znaczne  ilości  energii  wy  promieniowy  wane  przez 
te  obiekty.  Obecnie  powszechnie  przyjęty  jest  nastę- 
pujący model  takiego  pulsara.  Gwiazda  neutronowa 
łub  czarna  dziura  wchodzi  w skład  układu  podwój- 
nego ze  zwykłą  gwiazdą  ciągu  głównego  lub  czerwo- 
nym olbrzymem  (rys.  17).  Część  materii  ze  zwykłej 
gwiazdy  przepływa  i zostaje  wychwytywana  przez 


/ 


gwiazda  gwiazda  neutronowa 


i 


Rys.  17.  Gwiazda  neutronowa  w układzie  podwójnym.  Materia 
przepływa  od  zwykłej  gwiazdy  ku  gwieżdzie  neutronowej.  W sil- 
nym polu  grawitacyjnym  gwiazdy  neutronowej  cząstki  są  przy- 
spieszane do  bardzo  dużych  prędkości.  W wyniku  zderzeń  ule- 
gają jonizacji  i gdy  osiągają  prędkości  zbliżone  do  prędkości 
światła  wysyłają  promieniowanie  rentgenowskie 


gwiazdę  neutronową  lub  czarną  dziurę.  Ten  proces 
wychwytu  nazwano  akrecją.  Przyspieszona  do  znacz- 
nych prędkości  materia  przyciągana  przez  gwiazdę 
neutronową  lub  czarną  dziurę  wypromieniowuje 
znaczne  ilości  energii.  Natężenie  promieniowania 
będzie  takie  jak  obserwowane,  jeżeli  strumień  masy 
spadającej  na  gwiazdę  neutronową  w ciągu  roku 
wynosi  ok.  10~u  masy  Słońca.  Strumień  ten  może  być 
jeszcze  mniejszy  w przypadku  czarnej  dziury.  Przewi- 
dywania tego  modelu  jak  dotychczas  są  zgodne  z da- 
nymi obserwacyjnymi. 


Astrofizyczne  znaczenie  puisarów 

Odkrycie  puisarów  miało  ogromne  znaczenie  przede 
wszystkim  jako  ostateczny  argument  świadczący 
o istnieniu  gwiazd  neutronowych.  Teoria  ostatnich 
faz  ewolucji  gwiazd  uzyskała  pierwsze  obserwacyjne 
potwierdzenie.  Rozważania  dotyczące  procesów  pro- 
wadzących do  powstania  gwiazd  neutronowych  są 
dzięki  temu  jednym  z głównych  zagadnień  astrofizyki. 


Bardzo  ważne  są  badania  struktury  gwiazd  neutrono- 
wych i procesów  fizycznych  w pobliżu  ich  powierzchni, 
choć  nadal  fascynującym  jest  problem  mechanizmu 
promieniowania  puisarów',  który  nie  znalazł  dotych- 
czas zadowalającego  rozwiązania.  Dzięki  odkryciu 
puisarów  zaczęto  badać  własności  plazmy  w silnych 
polach  magnetycznych,  własności  pola  magnetycz- 
nego wokół  rotującej  namagnesowanej  gwiazdy  neu- 
tronowej i procesy  fizyczne  zachodzące  w pobliżu 
cylindra  świetlnego. 

Za  pomocą  puisarów  można  dokonywać  nowych 
obserwacji  dostarczających  informacji  o stanie  i włas- 
nościach materii  międzygwiezdnej.  Porównując  kształt 
impulsu  dla  różnych  częstości  można  otrzymać  infor- 
macje o rozkładzie  elektronów  wzdłuż  promienia 
widzenia.  W ten  sposób  oceniono  rozmiary  obszarów 
turbulentnych  w kilku  obłokach  gazu  międzygwiezd- 
nego. Wysuwane  są  propozycje  pomiaru  koncentracji 
cząsteczek  i rodników,  takich  jak  H*,  SH,  OH  i CH, 
występujących  w materii  międzygwiezdnej,  przez  po- 
wiązanie jej  z czasem  przybycia  tego  samego  sygnału 
na  różnych  częstościach,  czyli  z dyspersją.  Mierząc 
różnicę  czasów  przybycia  sygnału  na  różnych 
częstościach  można  obliczyć  średnią  ilość  elektronów, 
jaką  napotkał  on  na  swej  drodze.  Z pomiarów  radio- 
wych można  też  wyznaczyć  koncentrację  wodoru 
w tych  samych  obszarach.  Znając  te  dwie  wielkości 
łatwo  już  wyznaczyć  stopień  jonizacji,  a tym  samym 
temperaturę  gazu  międzygwiezdnego.  Zawiera  się  ona 
pomiędzy  103a  104  K. 

Wkrótce  po  odkryciu  puisarów  stwierdzono,  że 
mierząc  kąt  polaryzacji  sygnału  na  różnych  częstoś- 
ciach można  wyznaczyć  średnią  wartość  pola  mag- 
netycznego wzdłuż  promienia  widzenia.  Okazało  się, 
że  w przestrzeni  międzygwiezdnej  istnieje  niemal  jed- 
norodne pole  magnetyczne  o natężeniu  3 10-10  T. 

Pulsary  mogą  być  również  źródłem  promieniowania 
kosmicznego.  Obecnie  trudno  jeszcze  mierzyć  anizo- 
tropię tego  promieniowania.  Promieniowanie  kos- 
miczne jest  bowiem  bardzo  silnie  zaburzone  przez  pole 
magnetyczne  Ziemi.  Na  dokładne  dane  obserwacyjne 
trzeba  będzie  zatem  jeszcze  poczekać,  a tymczasem 
pulsary  można  traktować  jako  gigantyczne  akcelera- 
tory zapełniające  przestrzeń  międzygwiezdną  wyso- 
koenergetycznymi cząstkami  promieniowania  ko- 
smicznego. 

Odkryte  niedawno  pulsary,  wchodzące  w skład 
układów  podwójnych,  mogą  dostarczyć  wielu  infor- 
macji o ewolucji  takich  układów.  Za  ich  pomocą 
można  też  będzie  sprawdzić  przewidywania  ogólnej 
teorii  względności. 
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Czarne  dziury  i zapadanie 
grawitacyjne 

Marek  Demiański 


Ciała,  które  nas  otaczają,  zawdzięczają  swoje  wła- 
sności oddziaływaniom  elektrycznym  między  ele- 
mentarnymi składnikami  — elektronami,  jądrami,  a- 
tomami  i cząsteczkami.  Siły  grawitacyjne,  które  zgod- 
nie z prawem  powszechnego  ciążenia  są  siłami  przy- 
ciągającymi, można  w odniesieniu  do  ciał  o małej 
masie  całkowicie  pominąć.  Dają  one  o sobie  znać  do- 
piero wówczas,  gdy  masy  ciał  są  odpowiednio  duże. 
Sił  grawitacyjnych  nie  można  pominąć,  jeżeli  chce  się 
wyjaśnić  strukturę  ciał  niebieskich.  Ziemia,  planety, 
Słońce  i pozostałe  gwiazdy  mają  kształt  zbliżony 


do  kuli  dzięki  równowadze  pomiędzy  siłami  grawita- 
cyjnymi starającymi  się  ścisnąć  te  ciała  i siłami 
ciśnienia  wewnętrznego  przeciwdziałającymi  ściska- 
niu. Ciśnienie  wewnętrzne  może  być  wywołane  naprę- 
żeniami w ciele  stałym,  może  to  być  ciśnienie  cieczy, 
jak  w przypadku  Ziemi  i innych  planet,  lub  ciśnienie 
plazmy  — w przypadku  gwiazd.  Temperatury  i gęstoś- 
ci panujące  we  wnętrzach  gwiazd  są  bowiem  tak  duże, 
że  atomy  są  częściowo  lub  całkowicie  zjonizowane 
i tworzą  plazmę  — mieszaninę  dodatnio  i ujemnie 
naładowanych  cząstek.  W niektórych  typach  gwiazd 
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Ostatnie  fazy  ewolucji  gwiazd 

Kolejne  stadia  ewolucji  gwiazdy  zależą  od  jej  masy. 
Dla  gwiazd  o masach  mniejszych  od  1,4  masy  Słoń- 
ca gęstość  w centrum  wzrasta  na  tyle,  że  elektrony 
zostają  oderwane  od  atomów  i tworzą  gaz  elektro- 
nowy. Siła  grawitacyjna  jest  wówczas  równoważona 
przez  ciśnienie  gazu  elektronowego.  Ciśnienie  to 
nie  jest  wynikiem  zderzeń  między  cząsteczkami,  ale 
tzw.  zakazu  Pauliego,  według  którego  dwa  elektrony 
nie  mogą  się  znajdować  w takim  samym  stanie  kwan- 
towym. W miarę  ściskania  ciśnienie  gazu  elektrono- 
wego rośnie  znacznie  szybciej  niż  ciśnienie  plazmy, 
natomiast  temperatura  gazu  prawie  nie  ulega  zmia- 
tał® nie.  Gwiazda  w takim  stadium,  zwana  białym  kar- 
kasy łem,  stygnąc  nie  kurczy  się,  gdyż  wraz  z obniżeniem 
się  temperatury  nie  zmniejsza  się  ciśnienie. 

Dla  gwiazd  o masach  większych  od  1 ,4  masy  Słoń- 
ca ciśnienie  gazu  elektronowego  nie  wystarcza,  aby 
zahamować  proces  kurczenia.  Możliwe  są  tu  trzy 
warianty  ewolucji,  które  zależą  od  masy  gwiazdy  i jej 
układu  chemicznego:  a)  gwiazda  zostaje  całkowicie 
rozerwana  przez  potężny  wybuch  wywołany  gwałtow- 
nym wydzieleniem  energii  przy  spalaniu  cięższych 
pierwiastków  np.  tlenu,  b)  gwiazda  przechodzi  przez 
stadium  supernowej  (rys.  1).  Zewnętrzne  części  wraz 
z otoczką  zostają  odrzucone,  a bardzo  gęste  i gorące 
jądro  podlega  dalszej  ewolucji,  c)  gwiazda  katastro- 
ficznie się  kurczy,  gęstość  materii  w centrum  wzrasta 
na  tyle,  że  do  dalszego  opisu  procesu  kurczenia  trzeba 
stosować  relatywistyczną  teorię  grawitacji.  W dal- 
szym ciągu  zajmiemy  się  przypadkami  b)  i c). 

Jeżeli  masa  gorącego  i bardzo  gęstego  jądra  po- 
zostającego po  wybuchu  supernowej  nie  przekracza 
krytycznej  wartości,  która  zawiera  się  w granicach 
od  1,6  do  3 mas  Słońca,  to  proces  dalszego  kurczenia 
się  zostaje  zatrzymany  przez  ciśnienie  gazu  neutro- 
nowego (cieczy  neutronowej).  Należy  dokładniej 
wyjaśnić,  w jaki  sposób  we  wnętrzu  gwiazdy  powstają 
swobodne  neutrony.  Proces  syntezy  termojądrowej 
prowadzi  do  powstania  ciężkich  jąder  o liczbach 
atomowych  zbliżonych  do  żelaza.  Przy  dalszym  ści- 
skaniu takiego  układu  z energetycznego  punktu  wi- 
dzenia korzystny  jest  wychwyt  jednego  elektronu  przez 
jądro  i utworzenie  neutronu  z elektronu  i protonu. 
Powstające  w ten  sposób  jądra  są  w normalnych  wa- 
runkach nietrwałe  ze  względu  na  rozpad  fi,  jednak 
przy  bardzo  dużych  gęstościach  (10®  g/cm3)  nie  roz- 
padają się,  gdyż  poziomy  energetyczne,  które  mogłyby 
zająć  elektrony  emitowane  przy  rozpadzie  fi,  są  już 
zajęte.  Przy  jeszcze  większych  gęstościach  (3  -1011 


Rys.  1.  Wybuch  supernowej.  Początkowo  gwiazda  rozbłyskuje 
(rys.  a).  Po  kilku  dniach  na  zdjęciach  o krótkim  czasie  naświe- 
tlania nie  jest  już  widoczna  (rys.  b),  natomiast  na  zdjęciach  o dłu- 
gim czasie  naświetlania  pojawia  się  rozszerzająca  się  otoczka 
(rys.  c) 

i coraz  mniejszej  energii  wiązania,  a w końcu  jądra 
rozpadają  się  na  swobodne  protony  i neutrony.  W re- 
zultacie materia  w centralnych  częściach  gwiazdy 
składa  się  z elektronów,  protonów  i neutronów,  przy 
czym  główny  wkład  do  ciśnienia  pochodzi  od  neutro- 
nów. Takie  gwiazdy  nazwano  gwiazdami  neutrono-  gwiazdy 
wymi.  Podobnie  jak  białe  karły  gwiazdy  neutronowe  neutronowe 
mogą  stygnąć  nie  ulegając  już  dalszemu  kurczeniu  się. 

Jeżeli  masa  jądra  gwiazdy  po  wybuchu  supernowej 
przekracza  3 masy  Słońca  lub  gdy  masywna  gwiazda 
kurczy  się  katastroficznie,  to  gęstości  w centrum 
wzrastają  na  tyle,  że  do  opisu  dalszego  procesu  kurcze- 
nia należy  stosować  ogólną  teorię  względności.  Aby 
wyjaśnić,  jakich  efektów  można  wówczas  oczekiwać, 
porównamy  warunki  równowagi  sferycznych  gwiazd 
wg  teorii  grawitacji  Newtona  i ogólnej  teorii  względ- 
ności. 

Według  Newtona  sferyczna  gwiazda  pozostaje  warunki 
w równowadze,  jeżeli  w każdym  punkcie  wewnątrz  równowagi 
gwiazdy  siła  grawitacyjna  jest  równoważona  przez  gwiazdy 
siły  ciśnienia,  czyli  spełnione  jest  równanie 

dpi  dr  = - [Gm(r)/r2]o, 

r 

gdzie  m (r)  = 4jt  / g(r)r2dr.  Relatywistyczne  równanie 

o 

równowagi,  które  ma  postać 

dp  _ G[Aw(r)+4jr(p/c2)r3](p+/>/c2) 

dr  ~ r,|»1  2 Gm(r)  j 


istotną  rolę  odgrywa  też  ciśnienie  promieniowania 
wywołane  strumieniami  termicznych  fotonów  prze- 
nikających z centralnych  części  gwiazdy  ku  po- 
wierzchni. Planety  nie  mają  wewnętrznych  źródeł 
energii  i ich  struktura  nie  ulega  zmianie  od  chwili 
ich  uformowania.  Gwiazdy  natomiast  promieniują 
w otaczającą  przestrzeń  ogromne  ilości  energii  i trwa- 
ją przez  bardzo  długi  czas  w nie  zmienionym  stanie 
dzięki  temu,  że  w ich  centralnych  częściach  prze- 
biegają termojądrowe  reakcje  spalania  wodoru  i helu, 
które  uzupełniają  wy  promieniowaną  energię  (-►  Ewo- 
lucja gwiazd).  Co  się  dzieje  z gwiazdą,  która  wyczer- 
gwiazde  po  pała  cały  zapas  wodoru  i helu?  Zachwiany  jest  wów- 
wypaleniu  czas  jej  bilans  energii:  energia  wypromieniowana 
H i H®  z powierzchni  nie  jest  uzupełniana  i gwiazda  zaczyna 
stygnąć.  Temperatura,  a więc  i ciśnienie  we  wnętrzu 
gwiazdy  zmniejsza  się,  co  powoduje  jej  kurczenie 
się  wywołujące  z kolei  wzrost  temperatury,  ciśnienia 
i gęstości  w centrum.  Tak  więc  gwiazda  kurcząc  się  za- 
mienia grawitacyjną  energię  potencjalną  na  energię 
cieplną.  Ciśnienie  plazmy  nie  narasta  wystarczająco 
szybko  na  to,  aby  przeciwdziałać  kurczeniu  się. 
Powolne  kurczenie  się  może  zostać  powstrzymane 
przez  odpowiednio  szybki  przyrost  ciśnienia  w cen- 
trum gwiazdy  w wyniku  jakiegoś  innego  procesu. 


g/cm3)  energia  wiązania  kolejnego  neutronu  maleje  do 
zera  i zostaje  on  oderwany  od  jądra.  Powstają  w ten 
sposób  jądra  o coraz  mniejszej  zawartości  neutronów 
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zawiera  poprawki  związane  ze  zmianą  własności  geo- 
metrycznych przestrzeni  w obszarach,  w których  gęs- 
tość materii  jest  bardzo  duża,  oraz  z wkładem  do 
gęstości  energii  pochodzącym  od  energii  wzajemnego 
oddziaływania  między  elementarnymi  składnikami 
materii  (jeśli  przyjmiemy,  że  c — *■  oo,  to  relatywistycz- 
ne równanie  równowagi  przechodzi  w równanie 
nierelatywistyczne).  Porównując  te  dwa  równania  wi- 
dzimy, że  w równaniu  relatywistycznym  ciśnienie  wy- 
stępuje również  po  prawej  stronie,  a w mianowniku 
pojawił  się  dodatkowy  czynnik  1 — (2 Gm{r )/c2r).  Z re- 
latywistycznego równania  równowagi  wynika,  że 
ciśnienie  odpowiadające  stanowi  równowagi  gęstej 
gwiazdy  jest  w każdym  punkcie  wyższe  niż  powinno 
być  wg  teorii  Newtona.  Efekt  ten  nazywa  się  sarno- 
wzmacnianiem  się  ciśnienia,  bowiem  im  większe  jest 
ciśnienie,  tym  większy  powinien  być  gradient  ciśnienia 
(dpldr)y  aby  utrzymać  gwiazdę  w równowadze. 

Na  to,  aby  znaleźć  strukturę  gwiazdy  w równo- 
wadze posługując  się  czy  to  teorią  względności,  czy 
teorią  Newtona,  należy  znać  równanie  stanu  (rys.  2). 
Dla  gęstości  mniejszych  od  gęstości  materii  jądrowej 
(2,45  1014  g/cm3)  równanie  stanu  znane  jest  dość  do- 
kładnie, natomiast  przy  wyższych  gęstościach  stosuje 
się  różne  przybliżenia,  wynikające  z konieczności  o- 
pisania  słabo  jeszcze  zbadanych  oddziaływań  między 
hadronami,  tak  że  zależnie  od  stosowanej  metody  przy- 
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Rys.  2.  Równanie  stanu  (zależność  ciśnienia  od  gęstości)  gęstej 
materii  zaproponowane  przez  Harrisona  i J.  Wheclera 
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Rys.  3.  Zależność  między  masą  układu  M mierzoną  w jednostkach 
masy  Słońca  M ® a gęstością  centralną  pe  dla  gęstej,  chłodnej  ma- 
terii spełniającej  równanie  stanu  Harrisona-Wheelera.  Pierwsza 
część  krzywej  poczynając  od  początku  układu  współrzędnych  aż 
do  punktu  a opisuje  stabilne  gwiazdy  — białe  karły  i planety. 
Punkt  a odpowiada  maksymalnej  masie  białych  karłów  l,4Af®. 
Część  krzywej  między  punktami  a i b opisuje  niestabilne  konfigu- 
racje. Między  punktami  b i c położone  są  stabilne  gwiazdy  neu- 
tronowe. Punkt  c odpowiada  maksymalnej  masie  gwiazdy  neu- 
tronowej zbudowanej  z materii  spełniającej  równanie  stanu  Har- 
risona-Wheelera. Powyżej  punktu  c nie  ma  już  stabilnych  kon- 
figuracji 


nia  w centrum.  Proces  katastroficznego  kurczenia  się 
pod  wpływem  niezrównoważonych  sił  grawitacyjnych 
. nazywamy  grawitacyjnym  zapadaniem. 


-V 


2 GM 


bliżeń  otrzymuje  się  różne  wyniki.  Badając  konfigura- 
cje gęstej  materii  trzeba  się  zatem  ograniczyć  do 
pewnych  prostych  równań  stanu  opisujących  własnoś- 
ci układów  cząstek  poruszających  się  z prędkościami 
zbliżonymi  do  prędkości  światła.  Pomocne  są  tu  o- 
graniczenia  nakładane  przez  teorię  względności;  gę- 
stość masy  powinna  być  dodatnia,  a prędkość  dźwięku 
nie  może  być  większa  od  prędkości  światła.  Przyjmu- 
jąc zależność  między  ciśnieniem  i gęstością  postaci : 

p = (y-l)i?c2 

o y należy  założyć,  iż  1 < y < 2.  Dla  układu  nie- 
oddziałujących  cząstek  poruszających  się  z prędkością 
światła  y — 4/3. 

Korzystając  z tej  ogólnej  postaci  równania  stanu 
otrzymano  wiele  istotnych  wniosków  dotyczących  sta- 
bilności bardzo  gęstych  konfiguracji.  Okazało  się, 
niezależnie  od  wartości  y,  że  jeżeli  gęstość  masy 
w centrum  gwiazdy  przewyższa  1017  g/cm3,  to  układ  nie 
może  się  znajdować  w stanie  stabilnej  równowagi 
(rys.  3).  Taka  gwiazda  kurczy  się  nieograniczenie 
pod  wpływem  sił  grawitacyjnych  i tego  procesu  nie 
może  zahamować  nawet  bardzo  szybki  wzrost  ciśnie- 
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Czarne  dziury 

Stosując  prawa  grawitacji  Newtona  i pamiętając 
o tym,  że  prędkość  światła  jest  maksymalną  pręd- 
kością, z jaką  może  się  poruszać  cząstka,  łatwo 
można  przewidzieć,  że  z nieograniczenie  kurczącą  się 
gwiazdą  dzieją  się  dziwne  rzeczy.  Z zasady  zachowania 
energii  wynika,  że  aby  cząstkę  oderwać  od  powierc- 
chni  ciała  o masie  M i promieniu  R i oddalić  do  nie- 
skończoności, trzeba  jej  nadać  prędkość  nie  mniejszą 
niż 


prędkość 

ucieczki 


zwaną  prędkością  ucieczki.  Jeżeli  nie  zmieniając  masy 
ciała  będziemy  je  ściskali  zmniejszając  jego  promień, 
to  wówczas  gdy  osiągnie  on  wartość 


prędkość  ucieczki  staje  się  równa  prędkości  światła. 
Z powierzchni  sferycznego  ciała,  którego  masa  i pro- 
mień spełniają  ten  związek,  nie  można  wysłać  do 
nieskończoności  żadnej  cząstki.  Charakterystyczny 
promień  rg  nazywamy  promieniem  Schwarzschilda  lub 
promieniem  grawitacyjnym  ciała.  Dla  zwykłych  ciał, 
cząstek  elementarnych,  planet  i gwiazd  ich  promie- 
nie są  znacznie  większe  od  promienia  Schwarzschilda 
i tak  np.  promień  grawitacyjny  Ziemi  wynosi  1 cm. 
Słońca  2,95  km,  natomiast  promień  Schwarzschilda 
naszej  Galaktyki  — ok.  5 *10™  km,  czyli  jest  zaledwie 
350  razy  większy  od  średniej  odległości  Ziemi  od 
Słońca. 

W ogólnej  teorii  względności  na  promień  Schwarz- 
schilda otrzymujemy  taki  sam  wzór.  W tym  wypadku 
jednak  proces  kurczenia  się  gwiazdy  z punktu  widze- 
nia dalekiego  spoczywającego  obserwatora,  którego 
dalej  będziemy  nazywać  obserwatorem  w nieskończo- 
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obserwator  ności,  wygląda  inaczej  niż  w teorii  Newtona.  Aby  wy- 
w nieskoń-  jaśnić  te  różnice,  wyobraźmy  sobie  następujący  ekspe- 
czoności  ryment : z bardzo  daleka  wysyłamy  radialnie  w kierun- 
ku gwiazdy  cząstkę  próbną.  Z jego  punktu  widzenia 
w ciągu  czasu  At  cząstka  przemieści  się  o Ar.  Inny 
spoczywający  obserwator,  którego  cząstka  właśnie 
mija  powie,  że  na  jego  zegarze  odstępowi  czasu  At 
odpowiada  okres  czasu  ]/l -rgfrAt  (co  wynika  z wła- 
sności sferycznie  symetrycznego  pola  grawitacyjnego 
w ogólnej  teorii  względności)  i w tym  czasie  cząstka 
przebywa  odległość  Arf  j/ 1 —rgJr.  W obu  tych  wzorach 
f*  to  promień  grawitacyjny  gwiazdy.  Zatem  spoczywa- 
jący obserwator,  którego  cząstka  właśnie  mija,  przy- 
pisze jej  prędkość 


vr  — 


obserwator 

na 

powierzchni 


-rgfr 


c , 


r0}rQ  * 

Cząstka  spadająca  radialnie  na  zwykłą  gwiazdę  zosta- 
nie przyspieszona  do  bardzo  dużych  prędkości,  ale 
mniejszych  od  prędkości  światła,  gdyż  otrzymany  wy- 
żej związek  obowiązuje  tylko  dla  r > R (R  — po- 
wierzchnia gwiazdy),  przy  tym  R > rg.  Natomiast  gdy 
gwiazda  kurczy  się  i jej  powierzchnia  zbliża  się  do 
powierzchni  Schwarzschilda,  to  w granicy  dla  cząs- 
tki znajdującej  się  na  powierzchni  r -*  rg , vT  -+  c. 

Daleki  obserwator  przypisze  tej  samej  cząstce 
prędkość  v<x>  równą 

= (1  ~rtfr)vr  = (1  -r,lr)  l/ 1 - -L~r*/r 

r 1 -'»/'•« 

a więc  z jego  punktu  widzenia  prędkość  cząstki  zbli- 
żającej się  do  powierzchni  Schwarzschilda  maleje 
1 ,gdy  [ r° » to  v r Co  w*Wit  jeżeli  dokładnie 

zbadać  ruch  cząstki  z punktu  widzenia  obserwatora 
w nieskończoności,  to  okazuje  się,  że  cząstka  zbliży 
się  do  powierzchni  Schwarzschilda  dopiero  po  nie- 
skończonym czasie.  Efekt  ten  jest  związany  ze  zwol- 
nieniem tempa  biegu  zegarów  w polu  grawitacyjnym. 

Jak  przebiega  sferyczne  zapadanie  gwiazdy  z punktu 
widzenia  obserwatora  znajdującego  się  na  jej  po- 
wierzchni? Moment  przenikania  przez  powierzchnię 
Schwarzschilda  nie  jest  dla  niego  niczym  wyróżniony 
(rys.  4).  Po  przekroczeniu  powierzchni  Schwarzschil- 
da gwiazda  nadal  się  kurczy,  aż  do  chwili,  kiedy  skur- 
czy się  do  punktu,  przy  tym  gęstość  materii  rośnie  do 
nieskończoności.  Taki  punkt  nazywamy  osobliwością. 

Wspominaliśmy  już  o tym,  że  dla  gwiazd,  planet 
i innych  ciał  niebieskich  promień  Schwarzschilda  jest 
bardzo  mały  i gdyby  je  skurczyć  do  rozmiarów  po- 
równywalnych z ich  promieniem  Schwarzschilda,  to 
gęstość  materii  wzrosłaby  znacznie  powyżej  gęstości 
materii  jądrowej  (~  1014  g/cm3).  Istotnie,  gdyby 
Ziemię  skurczyć  do  rozmiarów  promienia  Schwarz- 
schilda, to  średnia  gęstość  wynosiłaby  ok.  1028  g/cm3, 
a dla  Słońca  byłaby  równa  1 022  g/cm3.  Własności  ma- 
terii o takiej  dużej  gęstości  nie  są  znane.  Nie  jest  to 
jednak  ogólna  prawidłowość.  Ciała  o bardzo  dużej 
masie  mogą  osiągać  rozmiary  porównywalne  z pro- 
mieniem Schwarzschilda,  przy  średniej  gęstości  bardzo 
małej,  np.  dla  naszej  Galaktyki  wynosi  ona  zaledwie 
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10  4 g/cm3,  czyli  jest  mniejsza  od  gęstości  powietrza. 
Z oszacowań  tych  wynika,  że  ciała  o rozmiarach 
zbliżonych  do  swego  promienia  Schwarzschilda  mogą 
być  zbudowane  z materii,  której  własności  znamy 
bardzo  dobrze. 


1 -r,/r  °°’ 

gdzie  vOD  — - prędkość  cząstki  mierzona  przez  obser- 
watora w nieskończoności.  Prędkość  vr  można  wyzna- 
czyć z zasady  zachowania  energii,  która  dla  radial- 
nego ruchu  cząstki  w sferycznym  polu  grawitacyjnym 
przyjmuje  postać 

F_  mc%  , 

-v*/c*  vl~~r*lr  = const- 

Jeżeli  w chwili  początkowej  cząstka  spoczywa  w od- 
ległości rQ  od  centrum,  to 

\/l-re!r  /j/l-rj/c’  = j/l -r„/r„  . 

skąd  ostatecznie  mamy 

1— pE 


Rys.  4.  Grawitacyjne  zapadanie  sferycznie  symetrycznej  gwiazdy. 
Liniev  = const  są  liniami , po  których  poruszają  się  sygnały  świetlne 
skierowane  ku  centrum.  Sygnał  wysłany  z powierzchni  gwiazdy 
po  niedługim  czasie  dotrze  do  obserwatora  znajdującego  się  w ra- 
kiecie poruszającej  się  ku  centrum,  ale  dopiero  po  bardzo  długim 
czasie  dotrze  do  obserwatora  znajdującego  się  w rakiecie  w stałej 
odległości  od  centrum.  Im  bliżej  powierzchni  Schwarzschilda  zo- 
stanie wysłany  sygnał,  tym  dłużej  będzie  on  biegł  do  obserwatora 
znajdującego  się  w stałej  odległości  od  centrum.  W obszarze  r<rg 
stożki  świetlne  są  nachylone  tak,  że  żaden  sygnał  nie  może  się  wy- 
dostać z tego  obszaru  do  dalekiego  obserwatora 

Czy  można  zatrzymać  proces  grawitacyjnego  zapa- 
dania? Okazuje  się,  że  jeśli  gwiazda  przeniknie  poza 
swój  promień  grawitacyjny,  to  procesu  katastroficz- 
nego kurczenia  zatrzymać  już  nie  można.  Ilustruje 
to  rys.  5,  na  którym  przedstawiono  zapadającą  się 
gwiazdę.  Od  momentu  gdy  powierzchnia  gwiazdy 
przekroczy  powierzchnię  Schwarzschilda,  wszystkie 
sygnały,  nawet  sygnały  świetlne  wysyłane  radialnie  na 
zewnątrz,  są  przyciągane  przez  silne  pola  grawitacyj- 
ne i zamiast  oddalać  się  do  nieskończoności,  zbiegają 
ku  centrum.  Powierzchnia  Schwarzschilda  odgrywa 
teraz  rolę  półprzepuszczającej  membrany,  przez  którą 
cząstki  i sygnały  niosące  informację  mogą  przenikać 
do  środka,  ale  nie  mogą  wydostawać  się  przez  nią  na 
zewnątrz.  Taką  powierzchnię  nazywamy  horyzontem. 
Pole  grawitacyjne  pod  horyzontem  nie  jest  polem 
statycznym.  W tym  obszarze  żaden  obserwator  nie 
może  spoczywać  i niezależnie  od  tego  czy  porusza  się 
swobodnie,  czy  też  znajduje  się  w rakiecie  zaopatrzo- 


powierzchnia 

horyzontu 


horyzont  r*rg 


Rys.  5.  Czasoprzestrzen- 
ny obraz  grawitacyjne- 
go zapadania  gwiazdy. 
Sygnały  świetlne  roz- 
chodzą się  po  prostych 
nachyloftych  pod  kątem 
45°  do  osi  czasu.  Linią 
falistą  zaznaczono  syg- 
nały świetlne  wysyłane 
z powierzchni  gwiazdy 
radialnie  na  zewnątrz. 
Gdy  promień  gwiazdy 
jest  większy  od  r9f  syg- 
nały świetlne  wysyłane 
z jej  powierzchni  docie- 
rają do  dalekiego  ob- 
serwatora, natomiast 
gdy  promień  gwiazdy 
jest  mniejszy  od  ra, 
wszystkie  sygnały  zbie- 
gają do  centralnej  osob- 
liwości 


czarna  nej  w potężne  silniki,  po  skończonym  czasie  zosta- 
dziura  nie  przyciągnięty  ku  centrum,  ku  osobliwości.  Taki 
niezwykły  obiekt  ograniczony  zamkniętym,  regular- 
nym horyzontem  nazywamy  czarną  dziurą. 

Obraz,  jaki  przedstawiliśmy  wyżej,  dotyczył  obiek- 
tu sferycznie  symetrycznego.  Obserwowane  gwiazdy 
nie  są  dokładnie  sferycznie  symetryczne,  przeważnie 
obracają  się  i mają,  czasem  nawet  silne  pola  magne- 
tyczne. Jak  te  dodatkowe  czynniki  wpływają  na  proces 
zapadania?  Dokładnie  można  zbadać  tylko  sytuację, 
gdy  odchylenia  od  sferycznej  symetrii  nie  są  duże 
(rys.  6).  Wtedy,  jak  to  pierwsi  pokazali  J.  Zeldowicz, 
I.  Nowikow  i A.  Doroszkiewicz,  małe  początkowe 
zaburzenia  narastają  w czasie  zapadania,  ale  są 
jeszcze  skończone  w momencie  przekraczania  po- 
wierzchni Schwarzschilda.  Dla  dalekiego  obserwato- 


powinny  przebiegać  w następujący  sposób:  gwiaz- 
da, która  wyczerpała  zapas  paliwa  jądrowego,  za- 
czyna kurczyć  się,  co  powoduje  ściskanie  w jej 
centrum  elektronów  i fotonów.  Przy  dużych  gęstoś- 
ciach elektrony  i fotony  zaczynają  intensywnie  od- 
działywać z jądrami  powodując  ich  rozpad.  Maleje 
przy  tym  liczba  elektronów  i fotonów,  które  są 
głównym  źródłem  ciśnienia,  co  prowadzi  do  powsta- 
nia niestabilności.  W ciągu  ułamka  sekundy  rozpoczy- 
na się  proces  gwałtownego  zapadania.  Centralne 
części  gwiazdy  zapadają  się  pociągając  za  sobą  zew- 
nętrzne warstwy.  Z punktu  widzenia  dalekiego  ob- 
serwatora powierzchnia  gwiazdy  zbliża  się  do  po- 
wierzchni Schwarzschilda,  przy  czym  w miarę  przy- 
bliżania się  do  niej  prędkość  zapadania  maleje  i gwiaz- 
da jak  gdyby  zastyga,  gdy  osiągnie  rozmiary  swego 
promienia  grawitacyjnego.  Współporuszający  się 
obserwator  powie  natomiast,  że  zapadająca  się  gwiaz- 
da przenika  przez  powierzchnię  Schwarzschilda  i na- 
stępnie bardzo  szybko  powstaje  osobliwość  — obszar, 
w którym  gęstość  materii  i siły  grawitacyjne  są  nie- 
skończenie wielkie.  Proces  zapadania  można  podzielić 
na  cztery  etapy:  powstanie  niestabilności,  zapadanie 
się,  powstanie  horyzontu  i powstanie  osobliwości, 
której  jednak  nie  może  widzieć  daleki  obserwator. 

Zapadanie  grawitacyjne  jest  końcowym  etapem 
ewolucji  gwiazd  o masach  większych  od  kilku  mas 
Słońca.  Sądzi  się,  że  pewne  etapy  ewolucji  galaktyk 
zachodzą  też  przez  grawitacyjne  zapadanie. 

Czy  można  obserwować  proces  grawitacyjnego  za-  możliwość 
padania?  Aby  odpowiedzieć  na  to  pytanie,  trzeba  zna-  obserwacji 
leźć  asymptotyczne  wyrażenie  na  zależność  promie-  zapadania 
nia  oraz  całkowitej  jasności  gwiazdy  od  czasu  ob- 
serwacji t0.  Różnica  między  czasem  obserwacji  t0 
a czasem  wysłania  sygnału  t będzie  równa  czasowi 
potrzebnemu  na  przebycie  sygnału  świetlnego  od 
punktu  emisji  r(t)  (powierzchnia  gwiazdy)  do  punktu 
obserwacji.  Biorąc  to  pod  uwagę  otrzymujemy 


/ 


ra  asymetryczne  składowe  poła  grawitacyjnego  wy- 
twarzanego przez  zapadające  się  ciało  znikają  w cza- 
sie i pole  grawitacyjne  asymptotycznie  nie  zależy  od 
czasu.  Stwierdzono  też,  że  gwiazda  obracająca  się 
niezbyt  szybko,  wytwarzająca  słabe  pole  magnetycz- 
ne, też  może  ulegać  procesowi  zapadania. 

Interesujące  jest  pytanie,  czy  każdy  proces  gra- 
witacyjnego zapadania  prowadzi  do  powstania  hory- 
zontu, a więc  czy  z każdej  zapadającej  się  gwiazdy 
powstanie  czarna  dziura.  Niestety,  nie  ma  na  nie 
zadowalającej  odpowiedzi.  Wszystkie  dotychczasowe 
próby  podania  przykładu  takiej  realistycznej  sytu- 
acji, w której  w procesie  zapadania  nie  powstaje 
horyzont,  skończyły  się  niepowodzeniem.  Na  tej  pod- 
hiooteza  stawie  R.  Penrose  wprowadził  „hipotezę  kosmicznego 
kosmicznego  cenzora”,  według  której  każdy  realistyczny  proces 
cenzora"  zapadania  prowadzi  do  powstania  horyzontu. 

Ostatnie  etapy  ewolucji  gwiazd  o dostatecznie  dużej 
masie  (przypuszczalnie  większej  od  1,4  masy  Słońca) 


r(t0)  = rg 4- (r ! — #>)  er  *$*-**)}** g , 

gdzie  r1  = r(t'0),  a /'-.-czas  odpowiadający  momen- 
towi rozpoczęcia  się  procesu  zapadania.  Związek  ten 
można  uważać  za  równanie  ruchu  powierzchni  gwiaz- 
dy widzialnej  przez  dalekiego  obserwatora.  Wynika 
z niego,  że  powierzchnia  gwiazdy  z punktu  widzenia 
dalekiego  obserwatora  dopiero  po  nieskończonym 
czasie  /„  -►  oo  osiągnie  powierzchnię  Schwarzschilda 
i powstanie  wówczas  horyzont.  Czas,  po  jakim  odleg- 
łość r zmniejszy  się  o e « 2,7,  równy  odwrotności 
współczynnika  przy  2r*/c,  jest  bardzo  krótki  i rozmia- 
ry gwiazdy  stają  się  porównywalne  z jej  promieniem 
grawitacyjnym  już  po  upływie  setnych  części  sekundy 
od  momentu  rozpoczęcia  procesu  zapadania.  Równie 
szybko  zanika  całkowita  jasność  gwiazdy,  spełniona 
jest  bowiem  zależność 

L(/0)  = 

Charakterystyczny  czas  zaniku  jasności  dla  gwiazd 

0 masach  zbliżonych  do  masy  Słońca  wynosi  10“4  s. 
Wydawać  by  się  mogło,  że  bardzo  łatwo  jest  stwier- 
dzić, czy  jakaś  wybrana  gwiazda  uległa  grawitacyjne- 
mu zapadaniu  czy  nie.  Należałoby  w tym  celu  co 
pewien  czas  fotografować  te  same  fragmenty  nieba 

1 sprawdzać,  czy  przypadkiem  z pola  widzenia  nie 
zniknęła  wybrana  gwiazda.  Tak  jednak  nie  jest.  Za- 
padająca się  gwiazda  jest  otoczona  świecącą  atmos- 
ferą, której  jasność  może  jeszcze  przez  długi  czas  nie 
ulegać  zmianie.  Zanik  jasności,  o którym  mowa  wyżej, 
dotyczy  tylko  jasności  powierzchniowej  tej  części 
gwiazdy,  która  się  zapada. 


Pol©  grawitacyjne  czarnych  dziur 

Z definicji  czarnej  dziury  wynika,  że  powierzchnia 
horyzontu  jest  powierzchnią  zerową,  tzn.  że  jest 
ona  „utkana”  z granicznych  promieni  świetlnych, 
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które  nie  zbiegają  się  do  centrum.  Wynika  stąd  ważny 
wniosek,  mianowicie  że  pole  powierzchni  horyzontu 
może  rosnąć,  ale  nigdy  nie  maleje.  Wykazano  też, 
że  czarne  dziury  mogą  łączyć  się  ze  sobą,  natomiast 
nie  mogą  się  rozpadać. 

Z analizy  zaburzeń  sferycznych  czarnych  dziur 
wynika,  że  z punktu  widzenia  dalekiego  obserwatora 
zaburzenia  bardzo  szybko  gasną  i czarna  dziura  asym- 
ptotycznie dąży  do  stanu  niezależnego  od  czasu,  czyli 
do  stanu  stacjonarnego. 

Początkowo  przypuszczano,  że  podobnie  jak  dla 
zwykłych  gwiazd  pole  grawitacyjne  wytwarzane  przez 
obracającą  się  (stacjonarną)  czarną  dziurę  będzie 
bardzo  złożone  i aby  go  opisać,  trzeba  podać  wiele 
parametrów,  takich  jak  masa,  moment  pędu  i wszyst- 
kie momenty  charakteryzujące  rozkład  masy  i mo- 
mentu pędu.  Okazało  się,  że  pole  grawitacyjne  obra- 
cającej się  czarnej  dziury  jest  bardzo  proste  i zależy 
tylko  od  dwóch  parametrów:  od  masy  czarnej  dziury 
i jej  momentu  pędu.  Jeżeli  moment  pędu  czarnej  dziu- 
ry jest  równy  zeru,  to  jest  ona  sferycznie  symetryczna 
i wytwarza  sferycznie  symetryczne  pole  grawitacyjne. 
W ogólnej  teorii  względności  takie  pole  zostało  po 
raz  pierwszy  opisane  przez  Schwarzschilda.  Natomiast 
pole  grawitacyjne  obracającej  się  czarnej  dziury  jest 
opisywane  za  pomocą  podanego  przez  Kerra  rozwią- 
zania równań  ogólnej  teorii  względności.  Promień 
powierzchni  horyzontu  obracającej  się  czarnej  dziury 
o masie  m i momencie  pędu  na  jednostkę  masy 
a = J/mc  wynosi 

r = Gm/c*+}/(Gmlc*)*-a\ 

z czego  wynika,  że  czarna  dziura  nie  może  obracać 
się  zbyt  szybko,  gdyż  wówczas  wyrażenie  pod  pier- 
wiastkiem mogłoby  być  ujemne. 

Bardzo  ważnym  zagadnieniem  jest  zbadanie  zacho- 
wania się  małych  zaburzeń  sferycznie  symetrycznej 
(statycznej)  i obracającej  się  (stacjonarnej)  czar- 
nej dziury.  Jeżeli  zaburzenia  te  nie  narastają  z bie- 
giem czasu,  to  czarne  dziury  są  stabilne.  Tylko  wów- 
czas można  przypuszczać,  że  czarne  dziury  wystę- 
pują w przyrodzie.  Stabilność  sferycznie  symetrycz- 
ny pola  grawitacyjnego  zbadano  już  niemal  dwa- 
dzieścia lat  temu.  Analizując  zaburzenia  w liniowym 
przybliżeniu  wykazano,  że  te  zaburzenia,  które  opi- 
sują rozchodzące  się  fale  grawitacyjne,  gasną  bar- 
dzo szybko  w czasie,  a spośród  zaburzeń  stacjonar- 
nych jedynie  zaburzenia  związane  z obrotem  spełnia- 
ją warunki  regularności  w nieskończoności  i w oto- 
czeniu horyzontu.  Sferycznie  symetryczne  czarne 
dziury  są  zatem  stabilne  ze  względu  na  małe  zabu- 
rzenia. 

Znacznie  trudniej  było  zbadać  problem  stabilności 
obracających  się  czarnych  dziur.  Z powodu  złożo- 
ności równań  opisujących  małe  zaburzenia  trzeba  się 
było  ograniczyć  do  analizy  numerycznej,  którą  prze- 
prowadzono już  dla  bardzo  szerokiej  klasy  zaburzeń. 
Dotychczasowe  wyniki  świadczą  o tym,  że  obracające 
się  czarne  dziury  są  stabilne. 

Wszystko  wskazuje  na  to,  że  czarne  dziury  powin- 
ny istnieć  w przyrodzie,  ale  oczywiście  w pełni  prze- 
konywającego argumentu  mogą  dostarczyć  tylko 
obserwacje.  Zanim  odwołamy  się  do  danych  obserwa- 
cyjnych zajmijmy  się  ogólnymi  własnościami  czarnych 
dziur. 


nośnikiem  ładunku  elektrycznego  i ładunku  magne- 
tycznego, gdyby  się  okazało,  że  taki  istnieje.  Linie 
sił  pola  elektrycznego  i pola  magnetycznego  wokół 
takiej  czarnej  dziury  przedstawione  są  na  rys.  7. 
Zatem  masa,  moment  pędu  oraz  ładunek  elektryczny 
i magnetyczny  są  to  jedyne  parametry  charakteryzu- 
jące czarną  dziurę.  John  Wheeler  powiada  lapidarnie, 
że  czarna  dziura  nie  ma  włosów  (rys.  8). 


Obracające  się  czarne  dziury 

Początkowo  przypuszczano,  że  pole  grawitacyjne 
wokół  czarnej  dziury  jest  podobne  do  pola  grawita- 
cyjnego na  zewnątrz  zwykłej  gęstej  obracającej  się 
gwiazdy.  Okazało  się  jednak,  że  pole  grawitacyjne 
na  zewnątrz  czarnej  dziury  ma  bardzo  specyficzne 
własności.  Jest  ono  całkowicie  scharakteryzowane 
przez  dwa  parametry:  masę  i moment  pędu.  Z ogól- 
niejszych rozważań  wynika,  że  czarna  dziura  może  być 
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pole  magnetyczne 


pole  elektryczne 


Rys.  7.  Linie  sił  pola  magnetycznego  i elektrycznego  wokół  czar- 
nej dziury  z ładunkiem  elektrycznym  i magnetycznym 


dziwność 

ładunek  II  bariony 

momennjędu  ^ J[  /f  leptony 

masa 


masa 
ładunek 
moment  pędu 

Rys.  8.  Wyidealizowany  obraz  czarnej  dziury.  Stacjonarną  czarną 
dzjurę  charakteryzują  jedynie  trzy  parametry:  masa,  ładunek 
elektryczny  i moment  pędu.  Innych  parametrów  opisujących  ma- 
terię,  z której  powstała  czarna  dziura,  nie  jesteśmy  w stanie  wy- 
znaczyć 


Omówimy  teraz  ogólne  własności  stacjonarnej  czar- 
nej dziury.  Jak  już  stwierdziliśmy  promień  horyzon- 
tu jest  dany  równaniem  r = Gm/c 2 + j /(Gm/c3)2 — a2, 
a więc  przy  takiej  samej  masie  m promień  powierzchni 
horyzontu  obracającej  się  czarnej  dziury  jest  mniej- 
szy od  promienia  horyzontu  czarnej  dziury  Schwarz- 
schilda. Nasza  intuicja  tutaj  zawodzi,  wydawać  by  się 
mogło,  że  obrót  spowoduje  spłaszczenie  czarnej  dziury 
i powiększenie  promienia  horyzontu. 

Wokół  obracającej  się  czarnej  dziury  istnieje  obszar 
o promieniu  rE  = Gm/c2+\/(Gmfc2y-a2 cos20,  w któ- 
rym żadna  cząstka  ani  żaden  obserwator  nie  może 
spoczywać. 

Obszar  między  powierzchnią  horyzontu  a powierz- 
chnią r = rE  (0)  nazwano  ergosferą.  Zauważmy,  że 
ergosfera  w dwóch  punktach  wzdłuż  osi  obrotu  jest 
styczna  do  powierzchni  horyzontu  (rys.  9).  Istnienie 
ergosfery  odgrywa  ważną  rolę  w procesach  zachodzą- 
cych w otoczeniu  czarnej  dziury.  Na  przykład  dzięki 


fale  elektro- 
magnetyczne 


ergosfera 


Rys.  9.  Ergosfera 
czarnej  dziury  Ker- 
ra,  to  obszar  po- 
między powierzch- 
nią horyzontu  a po- 
wierzchnią r = te(9) 


horyzont 
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ergosferze  można  wykorzystywać  energię  rotacyjną 
obracającej  się  czarnej  dziury.  Metoda  polega  na  tym, 
że  daleki  obserwator  wyrzuca  w kierunku  czarnej  dziu- 
ry cząstkę  złożoną  z dwóch  części  A i J9,  która  po  prze- 
niknięciu do  ergosfery  rozpada  się  (rys.  10).  Cząstka 
A wraca  do  obserwatora,  natomiast  cząstka  B , mająca 
z punktu  widzenia  dalekiego  obserwatora  energię 
ujemną,  wpada  pod  horyzont.  Okazuje  przy  tym, 
że  energia  cząstki  A jest  większa  od  energii  cząstki 
złożonej.  Oczywiście,  nie  ma  tu  żadnej  sprzeczności 
i zasada  zachowania  energii  i momentu  pędu  jest 
spełniona.  Cząstka  B wpadając  do  czarnej  dziury 
zmniejsza  jej  moment  pędu  i jej  energię  ruchu  obro- 
towego. Tego  procesu  nie  można  powtarzać  nieskoń- 
czenie wiele  razy,  kiedy  bowiem  czarna  dziura  prze- 
staje się  obracać,  nie  można  już  z niej  czerpać  energii, 
własności  Badając  własności  czarnych  dziur  sformułowano 
czarnych  ogólne  prawa  dynamiki  tych  obiektów.  Po  pierwsze 
dziur  okazuje  się,  że  siła  grawitacyjna  działająca  na  ciało 
znajdujące  się  na  horyzoncie  jest  taka  sama  w każ- 
dym punkcie  horyzontu.  Po  drugie  pole  powierzchni 
horyzontu  nie  może  maleć.  Po  trzecie  przy  zaburze- 


niach czarnej  dziury  jej  zmiany  energii  będą  takie  sa- 
me, jak  dla  zwykłej  obracającej  się  gwiazdy,  inaczej 
mówiąc  zmiana  całkowitej  energii  czarnej  dziury  = 
= zmiana  energii  powierzchniowej -f  zmiana  energii 
wewnętrznej  -f  zmiana  energii  rotacyjnej. 

Omówimy  wnioski  wynikające  z praw  dynamiki 
stacjonarnych  czarnych  dziur.  Powierzchnia  horyzon- 
tu obracającej  się  czarnej  dziury  wynosi: 

A = 8n[«;m/c2)2  + }/  (G/n/c2)1  — (G.//C3)2]. 

Korzystając  z tego  wzoru  wprowadzono  pojęcie  niere- 
dukowalnej  masy  czarnej  dziury  mn,  czyli  masy  jaką 
miałaby  nie  obracająca  się  czarna  dziura  o takiej 
samej  powierzchni  horyzontu,  zatem 


Procesy,  w których  może  brać  udział  czarna  dziura, 
można  podzielić  na  dwie  klasy:  procesy  odwracalne 
i nieodwracalne.  W procesie  odwracalnym  może  ule- 
gać zmianie  masa  i moment  pędu  czarnej  dziury,  ale 
tylko  w taki  sposób,  aby  masa  nieredukowalna  pozo- 
stała nie  zmieniona.  Według  praw  dynamiki  czarnych 
dziur  ich  masa  nieredukowalna  nie  może  maleć.  Pro- 
cesy, w których  masa  nieredukowalna  wzrasta,  nazy- 
wamy procesami  nieodwracalnymi.  Część  energii 
która  została  zużyta  na  zmianę  wartości  masy  nie- 
redukowalnej,  jest  energią  straconą  i nie  można  jej 
odzyskać.  Warto  tu  zauważyć,  że  w przypadku  sta- 
tycznej, nie  obracającej  się  czarnej  dziury  wszystkie 
procesy,  które  przeprowadzają  ją  znowu  w inny  stan 
statyczny,  są  procesami  niodwracalnymi. 

Kiedy  istnieje  więcej  niż  jedna  czarna  dziura 
można  by  z takiego  układu  czerpać  nie  tylko  energię 
rotacyjną,  ale  również  energię  grawitacyjną.  Roz- 
patrzmy dwie  czarne  dziury  odpowiednio  o masach  mx 
i m2  oraz  o momentach  pędu  Ą i J2.  Przypuśćmy,  że 
następuje  zderzenie  pomiędzy  nimi  i w efekcie  po- 
wstaje czarna  dziura  o masie  m3  i momencie  pędu  Ą. 
W czasie  zderzenia  część  energii  grawitacyjnej,  a mia- 
nowicie m2— m3)c2,  zostanie  wypromieniowa- 
na  w postaci  fal  grawitacyjnych.  Pole  powierzchni 
powstałej  czarnej  dziury  nie  może  być  mniejsze  od 
sumy  pól  powierzchni  zderzających  się  czarnych 
dziur,  więc  stosunek  energii  wypromieniowanej  do 
energii  grawitacyjnej  przed  zderzeniem  E = (/nj-f 
+ ^2 — w3)/(/7?,  -T  w2)  nie  może  być  większy  od  1/2f 
czyli  w trakcie  zderzenia  można  uzyskać  co  najwyżej 
50%  energii  grawitacyjnej.  Jeżeli  zderzają  się  nie  obra- 
cające się  czarne  dziury,  to  stosunek  ten  jest  mniejszy 
i wynosi  1— 2"1/2.  Wtedy  wyzwala  się  jedynie  29% 
energii.  Są  to  jednak  tylko  maksymalne  wartości 
i w realnym  procesie  zderzenia  uzyskane  energie 
będą  mniejsze. 

Stacjonarna  czarna  dziura  jest  obiektem  bardzo 
trudnym  do  wykrycia.  Daleko  od  niej  pole  grawita- 
cyjne jest  takie  samo  jak  pole  grawitacyjne  zwykłej 
gwiazdy  o tej  samej  masie.  Różnice  występują  w po- 
bliżu horyzontu.  Na  przykład,  na  cząstkę  poruszają- 
cą się  w pobliżu  obracającej  się  czarnej  dziury  działa 
dodatkowo  odśrodkowa  siła  bezwładności,  którą 
można  opisać  podając  prędkość  kątową  obrotu, 
wynosi  ona 

_ 2 Gmar/c2 


(rz+azy-a2]r2 — r+a2jsin20 

Z taką  prędkością  kątową  obraca  się  względem  dale- 
kiego obserwatora  oś  spadającego  swobodnie  girosko- 
pu.  Dla  zwykłych  gwiazd  efekt  ten  jest  pomijałnie 
mały. 
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Z własności  symetrii  pola  grawitacyjnego  wytwa- 
rzanego przez  obracającą  się  czarną  dziurę  wynika, 
że  energia  cząstki  próbnej  oraz  rzut  momentu  pędu 
na  oś  obrotu  są  zachowane.  Zupełnie  niespodziewanie 
okazało  się,  że  zachowana  jest  też  wielkość  mająca 
pewne  własności  całkowitego  momentu  pędu,  dzięki 
czemu  udaje  się  rozwiązać  równania  ruchu  cząstek 
próbnych  w polu  grawitacyjnym  obracaącej  się  czar- 
nej dziury. 


Czarne  dziury  jako  obiekty  astronomiczne 

W jaki  sposób  można  zaobserwować  czarną  dziurę? 
Na  pozór  wydaje  się,  że  jest  to  w ogóle  niemożliwe. 
Czarna  dziura  nie  promieniuje  w pustej  przestrzeni, 
a jej  pole  grawitacyjne  dla  dalekiego  obserwatora 
nie  różni  się  od  pola  grawitacyjnego  zwykłej  gwiaz- 
dy. Obserwacyjnie  czarna  dziura  może  się  ujawnić 
tylko  wówczas,  gdy  jest  otoczona  przez  materię.  Na- 
wet jednak  w takich  sytuacjach,  kiedy  mamy  czarną 
sferyczna  dzjurę  zanurzoną  w obłoku  pyłu  i następuje  sferyczny 
akrecja  proces  akrecji  — spadania  materii  na  czarną  dziurę  — 
wydzielona  energia  nie  jest  zbyt  wielka.  Nie  wiado- 
mo też  dokładnie,  jakie  jest  widmo  powstającego  wów- 
czas promieniowania.  Wielkość  wyzwolonej  energii 
niewiele  się  zmieni,  jeżeli  czarna  dziura  porusza  się 
względem  obłoku  materii. 

Inną  sytuację  mamy  wówczas,  gdy  cząstki  materii 
spadają  na  czarną  dziurę  z różnym  od  zera  momentem 
pędu.  Wtedy  cząstki  spadają  tylko  do  odległości, 
na  której  siła  odśrodkowa  jest  równoważona  przez 
siły  grawitacyjne.  Ze  względu  na  osiową  symetrię 
pola  grawitacyjnego  spadająca  materia  tworzy  dysk 
dysk  wokół  czarnej  dziury.  Dzięki  lepkości  cząstki  tra- 
materii  Cą  moment  pędu  i promienie  ich  orbit  powoli  maleją. 

Zatem  lepkość  odgrywa  podwójną  rolę;  wpływa  na 
zmniejszenie  momentu  pędu  i powoduje  ogrzanie  się 
dysku.  Cząstka  spadając  powoli  w kierunku  czarnej 
dziury  ma  teraz  wystarczająco  dużo  czasu,  aby  prze- 
kazać otoczeniu  znaczną  część  swojej  energii.  Dzięki 
temu  energia  wydzielona  w dysku  jest  znacznie  większa 
niż  przy  sferycznej  akrecji.  Obliczając  ilość  wydzielo- 
nej energii  w dysku  można  oszacować  jasność  obiektu. 
Dla  szybko  obracającej  się  czarnej  dziury,  gdy 
JcjGmr  = 0,998,  efektywność  zamiany  energii  masy 
spoczynkowej  na  energię  cieplną  dochodzi  do  35%. 
Znaczna  część  tej  energii  jest  wy  promieniowana 
w rentgenowskim  obszarze  widma  elektromagnetycz- 
nego. Należy  podkreślić,  że  promieniowanie  jest  emi- 
towane nie  przez  czarną  dziurę,  a przez  gorący  gaz, 
który  ją  otacza. 

Dyski  materii  powstają  wokół  czarnej  dziury  wów- 
czas, gdy  istnieje  źródło  zapewniające  ciągły  do- 
pływ materii.  Występuje  to  wtedy,  gdy  czarna  dziura 
wchodzi  w skład  układu  podwójnego  gwiazd  i dzięki 
obecności  towarzysza  ma  zapewniony  stały  dopływ  ma- 
terii (rys.  11).  Układ  taki  powinien  być  silnym  perio- 
dycznie zmiennym  źródłem  promieniowania  X (-* 
Astronomia  promieni  X i y). 

Kiedy  słynny  już  satelita  Uhuru  zaczął  przekazy- 
wać dane  o źródłach  promieniowania  X , największe 


zainteresowanie  wzbudziło  źródło  Cyg  X-1  znajdujące 
się  w konstelacji  Łabędzia.  Jest  to  silne  źródło  pro- 
mieniowania X , którego  jasność  jest  ok.  10  tys.  razy 
większa  od  jasności  Słońca.  Dochodzące  do  nas 
z Cyg  X-1  sygnały  fluktuują  z okresem  mniejszym  od 
0,1  s,  co  oznacza,  że  rozmiary  źródła  są  małe  i nie 
przekraczają  3 10*  km.  Udało  się  dokonać  identyfi- 
kacji Cyg  X-1  ze  źródłem  promieniowania  widzial- 
nego i okazało  się,  że  istotnie  jest  to  układ  podwójny, 
przy  czym  okres  obiegu  wynosi  5,6  dnia  (rys.  12). 
Zmiany  jasności  tego  układu  pozwalają  oszacować 


Rys.  1 2.  Zależność  prędkości  radialnej  Vr  od  czasu  t dla  układu 
podwójnego  Cyg  X-l 


masę  nie  świecącego  składnika  — powinna  ona  być 
większa  od  czterech  mas  Słońca.  Ponieważ  nie  może 
to  być  gwiazda  neutronowa  ze  względu  na  zbyt  dużą 
masę  wielu  astronomów  sądzi,  że  jest  to  właśnie 
czarna  dziura. 

Jeżeli  czarne  dziury  istnieją,  to  powinny  mieć  jeszcze 
jedną  ciekawą  własność.  Podstawowe  prawo  dyna- 
miki czarnych  dziur  powiada,  że  pole  powierzchni 
horyzontu  nie  może  maleć.  Inną  wielkością  fizycz- 
ną, która  nie  może  maleć,  jest  entropia.  Biorąc  pod 
uwagę  tę  bardzo  luźną  analogię  pomiędzy  polem  po- 
wierzchni czarnej  dziury  a entropią  wywnioskowano, 
że  powinna  istnieć  wielkość,  którą  można  interpre- 
tować jako  temperaturę.  Jeżeli  jednak  czarnej  dziu- 
rze można  przypisać  temperaturę,  to  powinna  ona 
promieniować,  tak  jak  każde  inne  nagrzane  ciało.  Do 
tego  samego  wniosku  doprowadziła  analiza  rozprasza- 
nia fal  grawitacyjnych  i fal  elektromagnetycznych 
na  obracającej  się  czarnej  dziurze.  Obliczono,  że  przy 
pewnych  częstościach  rozpraszane  fale  unoszą  więcej 


Rys.  13.  Fale  elektromagnetyczne  rozpraszane  na  obracającej 
się  naładowanej  czarnej  dziurze  mogą  unosić  więcej  energii  niż 
energia  jaką  miała  fala  padająca.  Ta  nadwyżka  cr.crgii  jest  uzys- 
skiwana  kosztem  energii  ruchu  obrotowego  czarnej  dziury 


gwiazda  czarna  dziura 

Rys.  II.  Czarna  dziura  w układzie  podwójnym.  Materia  z gwiazdy 
towarzyszącej  powoli  spada  do  czarnej  dziury  wydzielając  znacz- 
ne ilości  energii 

970 


energii  niż  miała  jej  fala  padająca  (rys.  13).  Stąd  już 
tylko  krok  do  przypuszczenia,  że  czarna  dziura 
może  spontanicznie  emitować  cząstki.  Przy  czym  im 
większa  jest  masa  czarnej  dziury,  tym  mniejsza  jest 
jej  temperatura  i tym  mniejsze  prawdopodobieństwo 
emisji.  W miarę  jak  masa  promieniującej  czarnej 
dziury  maleje,  jej  temperatura  rośnie,  więc  emituje 
ona  coraz  więcej  energii.  Proces  ten  jest  coraz  to 
szybszy  i w końcu,  po  wypromieniowaniu  całej  sw'ojej 
energii  czarna  dziura  przestaje  istnieć.  Proces  ten  nie 
jest  sprzeczny  z twierdzeniem  o niezmniejszaniu  się 
pola  powierzchni  horyzontu.  Przy  wyprowadzeniu 
tego  twierdzenia  pominięto  bowiem  efekty  kwanto- 
we, które  w procesie  emisj?  czarnej  dziury  odgrywają 
istotną  rolę. 


źródło 
Cyg  X-1 


promienio- 

wanie 

czarnej 

dziury 


Tempo  emisji  zależy  od  masy  czarnej  dziury  i proces 
emisji  nie  odgrywa  żadnej  roli  w ewolucji  czarnych 
dziur  o masach  zbliżonych  i większych  od  masy 
Słońca. 

Czarne  dziury  powinny  też  odgrywać  pewną  rolę 
w procesach  ewolucji  galaktyk,  kwazarów  i innych  gęs- 
tych układów  gwiezdnych.  Teoria  ewolucji  takich 


układów  jest  jednak  bardzo  daleka  od  doskonałości 
i wiele  punktów  jest  w niej  jeszcze  niejasnych 
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Fale  grawitacyjne 

Marek  Demiański 


Zaburzenia  pola  elektromagnetycznego  — fale  ele- 
ktromagnetyczne — rozchodzące  się  z prędkością 
zwaną  prędkością  światła  są  nam  dobrze  znane  z co- 
dziennego życia.  Radio,  telewizja,  światło  — to  tylko 
kilka  przykładów  praktycznego  wykorzystania  tych 
fal.  Fale  elektromagnetyczne  mogą  się  rozchodzić  w 
próżni,  ponieważ  ich  propagacja  nie  wymaga  istnie- 
nia ośrodka  materialnego.  Falować  może  samo  pole 
elektromagnetyczne,  a w każdym  ustalonym  punkcie 
będzie  ulegać  zmianom  wektor  natężenia  pola  elek- 
trycznego i magnetycznego. 

Podstawowym  warunkiem  występowania  ruchu  fa- 
lowego jest  skończona  prędkość  rozchodzenia  się  syg- 
nałów. Wyjaśnijmy  to  dokładniej.  Z równań  opisują- 
prędkość  cych  własności  pola  elektromagnetycznego  wynika 
rozchodzenia  np.,  że  jeżeli  raptownie  zmienimy  położenie  ładunku 
się  sygnałów  w punkcie  A,  to  informacja  o tej  zmianie  stanu  pola 
dotrze  do  obserwatora  oddalonego  od  punktu  A o r 
po  upływie  czasu  t = r/c,  gdzie  c jest  prędkością 
światła.  Powiadamy,  że  oddziaływania  elektromagne- 
tyczne w próżni  rozchodzą  się  ze  skończoną  prędkoś- 
cią, równą  prędkości  światła. 

Według  teorii  grawitacji  Newtona,  która  tak  dobrze 
opisuje  ruchy  pod  wpływem  siły  grawitacyjnej  na 
powierzchni  Ziemi  i w Układzie  Słonecznym,  informa- 
cje o zmianie  stanu  pola  rozchodzą  się  z nieskoń- 
czoną prędkością.  Przemieszczanie  jakiejś  masy  po- 
woduje natychmiastową  zmianę  pola  grawitacyjnego 
w całej  przestrzeni.  Fakt  ten  jest  oczywiście  sprzecz- 
ny z postulatami  szczególnej  teorii  względności, 
według  której  prędkość  światła  jest  maksymalną 
możliwą  prędkością  przekazywania  informacji.  W 
1916  r.  A.  Einstein  sformułował  relatywistyczną 
teorię  grawitacji  — ogólną  teorię  względności.  Wiąże 
ona  rozkład  materii  z geometrycznymi  własnościami 
przestrzeni.  Można  powiedzieć,  że  im  większą  ilość 
energii  zawiera  pewna  objętość,  tym  bardziej  jest  za- 
krzywiona przestrzeń  w tym  obszarze  (rys.  1).  Na- 


Rys.  ł.  Kulka  ugina  ela- 
styczną membranę.  W teorii 
grawitacji  Einsteina  masy 
powodują  zakrzywienie 
przestrzeni 


tężenie  pola  grawitacyjnego  zależy  od  krzywizny 
przestrzeni.  Wiadomo,  że  lokalnie,  w małych  obsza- 
rach przestrzeni,  nie  można  za  pomocą  doświadczeń 
mechanicznych  odróżnić  siły  grawitacyjnej  od  sił 
bezwładności  działających  w nieinercjalnych  układach 
odniesienia.  W geometrycznym  języku  ogólnej  teorii 
względności  oznacza  to,  że  w małych  obszarach  prze- 
strzeni można  wprowadzić  prostokątny  kartezjański 
układ  współrzędnych. 


Własności  fa!  grawitacyjnych 

Według  ogólnej  teorii  względności  informacje  o zmia- 
nach stanu  pola  grawitacyjnego  rozchodzą  się  ze 
skończoną  prędkością.  Zatem  powinny  istnieć  po- 


la grawitacyjne  o właściwościach  podobnych  do  fal 
elektromagnetycznych.  A.  Einstein  wykazał,  że  jeżeli 
pole  jest  bardzo  słabe,  to  istnieją  rozwiązania  rów- 
nań pola  w ogólnej  teorii  względności.  Tym  samym 
wykazał,  że  można  mówić  o falach  grawitacyjnych, 
jeżeli  pola  są  słabe.  Nie  oznacza  to  jednak,  że  do- 
wolne pole  grawitacyjne  dopuszcza  możliwość  wy- 
stępowania fal  grawitacyjnych.  Wyjaśnienie,  czy  tak 
jest  istotnie,  nie  jest  proste.  Jedną  z trudności  jest  nie- 
liniowość równań  opisujących  własności  pola  grawi- 
tacyjnego. Jeżeli  np.  mamy  dwa  źródła,  A i B wytwa- 
rzające pola  grawitacyjne,  to  pole  wytworzone  jedno- 
cześnie przez  oba  źródła  nie  jest  po  prostu  sumą  pól 
wytwarzanych  przez  źródła  A i B z osobna.  Powia- 
damy, że  relatywistyczne  pole  grawitacyjne  nie  speł- 
nia zasady  superpozycji.  Równania  opisujące  pole 
elektromagnetyczne  są  liniowe,  a pole  spełnia  zasadę 
superpozycji.  Zatem  fale  grawitacyjne  nie  będą 
miały  wszystkich  własności  fal  elektromagnetycznych. 
Jakie  więc  pola  grawitacyjne  można  nazywać  falami 
grawitacyjnymi?  Przy  rozstrzyganiu  tej  kwestii 
skorzystajmy  z analogii  do  własności  fal  elektroma- 
gnetycznych. Okazało  się,  że  pole  grawitacyjne  wy- 
twarzane przez  ograniczony  układ  ciał  daleko  od  tego 
obszaru  też  można  przybliżyć  przez  falę  kulistą  o am- 
plitudzie malejącej  odwrotnie  proporcjonalnie  do 
odległości  (rys.  2).  Układ  taki  promieniuje  fale  gra- 
witacyjne. Jeszcze  raz  skorzystajmy  z analogii  doty- 
czącej własności  fal  elektromagnetycznych.  Podobnie 
jak  układ  ładunków  promieniujący  fale  elektromagne- 
tyczne traci  energię,  a jej  straty  są  równe  energii  uno- 
szonej przez  fale,  tak  i ograniczony  układ  ciał  od- 
działujących grawitacyjnie  traci  energię,  jeżeli  pro- 
mieniuje fale  grawitacyjne. 

Z analogii  tych  wynika,  że  o tym,  czy  dane  pole 
grawitacyjne  można  nazwać  falą  grawitacyjną  czy  nie, 
decydują  własności  pola  bardzo  daleko  od  źródeł. 
Jest  to  istotne  ograniczenie,  dotyczy  bowiem  tylko 
takich  sytuacji,  w których  materia  występuje  w obsza- 
rach o skończonych  rozmiarach.  O falach  grawitacyj- 
nych można  mówić  i w ogólniejszym  wypadku.  Jak 
już  wspominaliśmy,  zakrzywienie  przestrzeni  w jakimś 
obszarze  zależy  od  ilości  zawartej  w nim  energii. 


warunki 
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wania fal 
grawitacyj- 
nych 
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gnetycznymi 


drgający 
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sferyczna  fala 
elektromagnetyczna 


Rys.  2.  Promieniowanie  ograniczonego  układu  ładunków 
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Zakrzywienie  przestrzeni,  podobnie  jak  zakrzywienie 
dwuwymiarowych  powierzchni,  można  opisywać  za 
pomocą  wielkości  zwanej  krzywizną.  Skalarną  wiel- 
kością określającą  zakrzywienie  przestrzeni  jest  pro- 
mień krzywizny.  Rozpatrzmy  obszar  przestrzeni, 
w którym  promień  krzywizny  jest  nie  mniejszy  od 
R.  Zaburzenia  pola  grawitacyjnego  w obszarach 
znacznie  mniejszych  od  R można  traktować  jako  fale 
grawitacyjne  rozchodzące  się  w krzywej  przestrzeni. 
Ten  drugi  punkt  widzenia  umożliwia  rozważanie  wy- 
stępowania i analizowanie  fal  grawitacyjnych  w prze- 
strzeniach z nieograniczonym  rozkładem  materii, 
które  są  wykorzystywane  jako  proste  modele  Wszech- 
świata. 

Za  pomocą  tych  dwóch  sposobów  opisu  fal  grawi- 
tacyjnych można  klasyfikować  pola  grawitacyjne  na 
pola  stacjonarne  (bez  promieniowania)  i pola  pro- 
mieniste. Ścisłe  rozwiązania  równań  ogólnej  teorii 
względności  opisujące  pola  promieniste  znane  są  w 
najprostszych  wypadkach,  opisują  one  płaską  falę 
grawitacyjną  i rozchodzącą  się  falę  kulistą.  W elektro- 
dynamice każde  pole  promieniowania  można  dzięki 
liniowości  równań  — rozłożyć  na  sumę  fal  płaskich 
lub  kulistych,  przy  czym  różne  składniki  tej  sumy  nie 
oddziałują  ze  sobą.  Inaczej  jest  w ogólnej  teorii 
względności:  jeżeli  się  nawet  rozłoży  grawitacyjne 
pole  promieniowania  na  sumę  fal  płaskich  lub  kuli- 
stych, to  różne  składniki  tej  sumy  oddziałują  ze 
sobą.  Innymi  słowy,  współczynniki  rozkładu  pola 
promieniowania  grawitacyjnego,  np.  na  fale  kuliste, 
zależą  od  czasu.  Aby  opisać  pole  promieniowania  gra- 
witacyjnego, trzeba  podać,  w jaki  sposób  te  współ- 
czynniki zależą  od  czasu.  Jest  to  problem  bardzo 
trudny  i do  tej  pory  nikomu  się  nie  udało  znaleźć 
ścisłych  rozwiązań  opisujących  pole  promieniowania 
nawet  bardzo  prostych  układów  fizycznych,  np. 
gwiazd  podwójnych. 

Z elektrodynamiki  wiadomo,  że  układ  ładunków 
promieniuje  wówczas,  gdy  moment  dipolowy  zmienia 
się  w czasie  (jeżeli  tylko  stosunek  e/m  dla  różnych  ła- 
dunków jest  różny).  Średnia  moc  promieniowania 
w najprostszym  wypadku  (kiedy  moment  dipolowy 
d zmienia  się  periodycznie  z częstością  kołową  a>, 
a więc  gdy  d = d0  sin  cot)  jest  dana  wzorem: 

dE  _ 2 /dzd\  _ 1 et>4 

~dT  “ ~ ~~3~crd°y 

gdzie  < > oznacza  wartość  średnią  w ciągu  okresu 
T = 2nJ(o.  Jak  widać,  moc  promieniowania  zależy 
od  drugiej  pochodnej  po  czasie  momentu  dipolowego. 
Promieniowanie  dipolowe  jest  dominującym  rodza- 
jem promieniowania  układu  ładunków.  Inaczej  jest 
w wypadku  układu  mas.  Rozpatrzmy  prosty  układ 
dwóch  mas,  M i m,  połączonych  sprężyną  (rys.  3), 


M 

vvvvyvvvvvvwvvvv 

^ Xm 

Rys.  3.  Oscylator  z dipolowym  rozkładem  mas 


który  może  drgać  tylko  wzdłuż  jednej  osi.  Z zasady 

zachowania  pędu  wynika,  że  M ~ = 

dt  d dt 

= const,  zatem  druga  pochodna  po  czasie  momentu 
dipolowego  jest  równa  zeru.  Wniosek  ten  jest  bardzo 
ważny,  oznacza  bowiem,  że  grawitacyjne  promienio- 
wanie dipolowe  nie  występuje.  Moc  promieniowania 
grawitacyjnego  układu  ciał  zależy  od  trzech  pochod- 
nych po  czasie  kolejnego  wyższego  momentu  multi- 
polowego.  Kolejny  moment  multipolowy  jest  ma- 
cierzą, której  składowymi  są  sumy  iloczynów  mas 
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przez  iloczyny  dwóch  współrzędnych  określających  moc 
ich  położenie,  np.  QXy  — £ Nazywamy  go  P^omienio- 

momentem  kwadrupolowym.  Układ  ciał  promieniuje  ^awftacyi- 
grawitacyjnie  wówczas,  gdy  moment  kwadrupolowy  nec0  ™ 
zmienia  się  w czasie.  Średnia  moc  promieniowania 
takiego  układu,  którego  moment  kwadrupolowy  zmie- 
nia się  w czasie  z częstością  kołową  co,  wynosi 

dE  Ga>< 
dt  “ 45c5  Q * 

gdzie  G — stała  grawitacyjna,  c — prędkość  światła, 

Q — średni  w czasie  moment  kwadrupolowy.  Czyn- 
nik G/c 5 ma  wartość  2,75- 10_6°,  zatem  w ogólnym 
wypadku  moc  promieniowania  grawitacyjnego  bę- 
dzie bardzo  mała. 


Źródła  fal  grawitacyjnych 


Fale  grawitacyjne  może  emitować  nie  tylko  układ  ciał, 
ale  i pojedyncze  ciało,  nawet  traktowane  jako  ciało 
punktowe,  jeżeli  się  porusza  z bardzo  dużym  przy- 
spieszeniem. Wyobraźmy  sobie,  że  chcemy  zbudować 
generator  fal  grawitacyjnych.  W tym  celu  należy  |aborat  . 
zmieniać  w czasie  moment  kwadrupolowy  układu  qeneratorv 
mas.  Można  to  osiągnąć  np.  obracając  jakieś  ciało  qrawi- 
względem  osi,  która  nie  jest  jego  osią  symetrii.  tacvinvoh 
Przypuśćmy,  że  mamy  do  dyspozycji  stalowy  walec  /J  v 

0 promieniu  1 m i długości  20  m,  ważący  ok.  500  t. 

Obracajmy  go  wokół  osi  prostopadłej  do  osi  walca 

1 dzielącej  ją  na  połowę  (rys.  4).  Maksymalną  pręd- 


Rys.  4.  Laboratoryjny  generator  fal  grawitacyjnych  — na  przy- 
kład stalowy  walec  obracający  się  ze  stałą  prędkością  kątową 
względem  osi  prostopadłej  do  osi  symetrii  walca 


kość  obrotu  wyznaczamy  z warunku  równości  od- 
środkowej siły  bezwładności  i siły  sprężystej.  Stąd 
otrzymujemy,  że  maksymalna  prędkość  kątowa 
obrotu  wynosi  28  s-1.  Obracający  się  z maksymalną 
możliwą  prędkością  kątową  walec  emituje  fale 
grawitacyjne  o mocy  dE/dt  = 2- 10“ 29  J/s.  Jest  to  więc 
bardzo  słabe  źródło.  Żaden  inny  laboratoryjny  gene- 
rator nie  jest  bardziej  efektywny. 

Oczywiste  jest  zatem,  że  silnymi  źródłami  promie-  astrofizyczne 
niowania  grawitacyjnego  mogą  być  tylko  obiekty  źródła  fal 
astronomiczne,  które  się  poruszają  z bardzo  dużą  grawitacyj- 
prędkością  i mają  bardzo  silne  pola  grawitacyjne,  nych 
Obiektami  takimi  mogą  np.  być  białe  karły,  gwiazdy 
neutronowe  i czarne  dziury. 

Każda  wybuchająca  gwiazda  supernowa  czy  też 
gwiazda  zapadająca  się  grawitacyjnie  powinna  być 
silnym  źródłem  fal  grawitacyjnych.  Ostatnie  fazy  gra- 
witacyjnego zapadania  różnych  gwiazd  powinny 
przebiegać  podobnie.  Można  więc  przypuszczać,  że 
zapadająca  się  gwiazda  emituje  fale  grawitacyjne 
o kształcie  charakterystycznym  dla  tego  procesu. 

Niestety  nie  znamy  dokładnie  dynamiki  procesu  za- 
padania gwiazd  i trudno  jest  ocenić  moc  promienio- 
wania, a tym  bardziej  kształt  wysyłanych  impulsów. 

Innym  silnym  źródłem  fal  grawitacyjnych  są  ukła- 


podwójny 

układ 

gwiazd 


pufisar 
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dy  podwójne  gwiazd  (rys.  5).  W miarę  jak  układ  pod- 
dwójny  traci  energię,  gwiazdy  zbliżają  się  do  siebie. 
Energia  układu  gwiazd  poruszających  się  po  orbitach 


T 


Rys.  5.  Układ  gwiazd  po- 
dwójnych. O oznacza  śro- 
dek masy 


kołowych  o promieniu  a wynosi  E — — IGm^Ja, 
natomiast  straty  energii  wynoszą 

dE  32  G 22/  , \ _6 

dt  j c 9 

zatem  odległość  między  gwiazdami  ciągle  się  zmniej- 
sza zgodnie  z wzorem 

a = a0(l— //t0)1/4, 
gdzie  a0  = a(0)y  a 

5 c&tfo 

T°  256  G2m1m2(m1+mJ  * 


Jeżeli  tylko  siły  niegrawitacyjne  nie  zaburzą  ruchu 
układu,  to  po  czasie  / = r0  gwiazdy  spadną  na  siebie. 
Czas  t0  typowych  układów  podwójnych  jest  porów- 
nywalny z wiekiem  Wszechświata  i wynosi  ok.  (1- 
-1,5)1010  lat.  Moc  promieniowania  takich  układów 
wynosi  1023  J/s,  co  daje  strumień  na  powierzchni 
Ziemi  ok.  10_2°  J/cm2  s. 

Innym  źródłem  fal  grawitacyjnych  może  być  obra- 
cająca się  gwiazda  neutronowa  — pulsar.  Strumień 
promieniowania  zależy  od  momentu  kwadrupolo- 
wego,  który  w wypadku  pulsarów  można  ocenić  tylko 
co  do  rzędu  wielkości.  Prócz  fal  grawitacyjnych,  wy- 
syłanych z częstością  równą  okresowi  obrotu,  obser- 
wowane nagłe  zmiany  okresu  obrotu  pulsara,  zwią- 
zane ze  zmianą  kształtu  powierzchni,  mogą  też  powo- 
dować powstanie  silnych  impulsów  promieniowania 
grawitacyjnego.  Oszacowanie  lości  wy  promień  i owy- 
wanej  energii  jest  bardzo  trudne  ze  względu  na  frag- 
mentaryczne wiadomości  o budowie  gwiazd  neutro- 
nowych. 

Pole  grawitacyjne  w pobliżu  czarnej  dziury  jest 
bardzo  silne  i rośnie  nieograniczenie  w miarę  zbli- 
żania się  do  horyzontu  (->  Czarne  dziury  i zapadanie 
grawitacyjne).  Każda  cząstka,  która  zostanie  złapana 
przez  czarną  dziurę,  będzie  — zanim  przeniknie  przez 


/ 

/ 
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Rys.  6.  Schematyczny  dwuwymiarowy  obraz  zmian  krzywizny 
przestrzeni  wywołany  przez  cząstkę  wpadającą  do  czarnej  dziury. 
Zakrzywienie  przestrzeni  w otoczeniu  czarnej  dziury  można  wy- 
obrażać sobie  jako  rodzaj  lejka,  który  rozszerza  się  i staje  się 
płaski  bardzo  daleko  cd  czarnej  dziury.  Tor  cząstki  zaznaczono 
linią  przerywaną,  linie  faliste  reprezentują  rozchodzącą  się  falę 
grawitacyjną 


horyzont  — przyspieszona  do  bardzo  dużych  pręd- 
kości i w momencie  przenikania  przez  horyzont  osiąg- 
nie prędkość  światła.  Taka  cząstka  wyśle  silny  impuls 
fal  grawitacyjnych.  Szacuje  się,  że  mały  obiekt  o ma- 
sie m,  wpadając  do  czarnej  dziury  (rys.  6)  o masie 
A/,  wypromieniujeok.  0,01  mc2  (m/M)  energii  w po- 
staci impulsu  fal  grawitacyjnych  w czasie  t~10~4 
(mfM)s. 

Cząstka  poruszająca  się  po  zamkniętej  orbicie 
kołowej  bardzo  blisko  czarnej  dziury  też  doznaje 
dużych  przyspieszeń.  Wysyła  ona  grawitacyjne  pro- 
mieniowanie synchrotronowe.  Aby  się  cząstka  mogła 
po  takiej  orbicie  poruszać,  musi  mieć  bardzo  dużą 
energię  kinetyczną,  porównywalną  z energią  spoczyn- 
kową mc2.  Nie  znamy  jednak  naturalnych  procesów, 
które  by  mogły  dostarczyć  cząstkom  takich  dużych 
energii. 

Spośród  wszystkich  rozpatrywanych  dotychczas  zdarzenie 
hipotetycznych  źródeł  fal  grawitacyjnych  najbardziej  dwóch 
interesujące  jest  zderzenie  dwóch  czarnych  dziur,  czarnych 
Z oszacowań  wynika,  że  jeżeli  się  zderzają  dwie  nie  dziur 
obracające  się  czarne  dziury  o jednakowych  masach 
A/,  to  energia  wypromieniowana  w postaci  fal  gra- 
witacyjnych może  sięgać  (l/zMc2t  a jeśli  się  te  czarne 
dziury  obracają  — aż  V2 mc2. 

Nagłe  wybuchy,  które  obserwujemy  w innych  galak- 
tykach, oraz  procesy  zderzeń  w centrum  naszej  Galak- 
tyki są  zapewne  źródłami  fal  grawitacyjnych.  Natura 
tych  źródeł  jest  prawie  nieznana.  Niektóre  własności 
astrofizycznych  źródeł  fal  grawitacyjnych  zebrano 
w tabeli. 


Astrofizyczne  źródła  promieniowania  grawitacyjnego 


Źródło 

Widmo 

Stru-  i 
mień 
J/m*  * s 

Ampli- 

tuda 

Gwiazdy  podwójne  w Galakty- 
ce są  monochromatycznym 
źródłem  promieniowania  gra- 
witacyjnego 

Nasilniejsze  źródło  (i  Boo) 

p w i h 

io-»* 

10“*° 

Strumień  od  wszystkich  gwiazd 
podwójnych 

Pmtix  ~ 8 h 

,0-io 

io-*° 

Pulsar  w Krabie  (PSR  0532) 
Promieniowanie  ciągłe 

v = 60  Hz 

3 10“ 

io-*7 

Gwałtowne  zmiany  prędkości 

w w 103  Hz 

lO"3 

io-*» 

obrotu 

Supernowa  i zapadanie 

w Galaktyce  raz  na  100  lat 

ir  w 103- 

107 

io-*7 

wybuchy  trwające  od  10~3  do 
! s 

we  wszystkich  galaktykach 
leżących  bliżej  niż  gromada 
galaktyki  Virgo 

-10*  Hz 

10 

,0-«o 

Szybko  obracająca  się  gwiazda 
neutronowa 

v » 10*  Hz 

10-* 

io-** 

Wybuchy  w jądrach  galaktyk 
i kwazarów 

P * 100  d 

10-lł 

io-*» 

Czarna  dziura 
o masie  w cen- 

trum Galaktyki,  do  której 
wpada  gwiazda  o masie  lAf© 
Krótki  impuls 

10-10*  s 

10-® 

io-*ł 

Ostatnio  rozważa  się  inną  możliwość  generacji  fal 
grawitacyjnych,  a mianowicie  wytwarzanie  fa!  gra- 
witacyjnych przez  szybkozmienne  i bardzo  silne 
pola  elektromagnetyczne.  W tym  celu  należałoby 
zbudować  potężny  kondensator  o polu  powierzchni 
płytki  ok.  100  m2  i między  okładkami  wytwarzać 
szybkozmienne  pole  o natężeniu  ok.  105  V/m.  Nie- 
stety w warunkach  laboratoryjnych  nie  umiemy  jesz- 
cze otrzymywać  pól  o takich  natężeniach. 


Wykrywanie  fal  grawitacyjnych 

Oddziaływanie  grawitacyjne  jest  bardzo  słabe  i z za- 
sady zachowania  pędu  wynika,  że  nie  występuje  pro- 
mieniowanie dipolowe.  Generowanie  i detekcja  fal 
grawitacyjnych  związana  jest  więc  ze  zmianami  mo- 
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mentu  kwadrupolowego.  Zatem  generacja  fai  grawita- 
cyjnych o mierzalnym  natężeniu  nie  jest  w laborato- 
ryjnych warunkach  praktycznie  możliwa.  Aby  reje- 
strować fale  grawitacyjne,  trzeba  by  umieć  mierzyć 
bardzo  małe  zmiany  momentu  kwadrupolowego  an- 
teny. Równanie  opisujące  zmiany  w czasie  momentu 
kwadrupolowego  anteny  przypomina  równanie  oscy- 
latora tłumionego,  na  który  działa  siła  wymuszająca, 
przy  czym  człon  z siłą  wymuszającą  zawiera  infor- 
macje o zmianach  krzywizny  przestrzeni. 

Joseph  Weber  nie  zraził  się  wspomnianymi  trud- 
nościami i od  kilkunastu  lat  prowadzi  badania  w celu 
wykrycia  fal  grawitacyjnych.  Aby  rejestrować  fale 
grawitacyjne  i wyznaczać  ich  natężenie,  trzeba  umieć 
mierzyć  bardzo  słabe  zmiany  krzywizny  przestrzeni. 
Mierzymy  krzywiznę,  np.  śledząc  zmiany  odległości 
dwóch  położonych  blisko  siebie  i spadających  swo- 
bodnie cząstek.  Oczywiście  taka  metoda  jest  mało 
efektywna  i nikt  jej  w praktyce  nie  stosuje, 
antena  j.  Weber  zaproponował,  aby  jako  antenę  wykorzy- 
Webera  stać  walec  aluminiowy  długości  1,5  m,  o średnicy 
0,6  m i całkowitej  masie  1400  kg.  Walec  zawieszono 
za  pomocą  lin  stalowych  na  metalowej  ramie  odpo- 
wiednio izolowanej  od  wszelkich  zewnętrznych 
wstrząsów  (rys.  7).  Środkowa  część  walca  została 


Rys.  7.  Walec  alumi- 
niowy używany  przez 
J.  Webera  jako  antena 
fal  grawitacyjnych. 
Strzałka  wskazuje  pie- 
zoelektryczne krysz- 
tały 


oblepiona  piezoelektrycznymi  kryształami.  Kiedy 
prostopadle  do  osi  walca  pada  na  niego  fala  grawita- 
cyjna, zmienia  się  moment  kwadrupolowy,  co  wywo- 
łuje drgania  mechaniczne. 

Drgania  mechaniczne  są  za  pomocą  kryształów 
piezoelektrycznych  przetwarzane  na  drgania  elek- 
tryczne, które  się  następnie  bardzo  wzmacnia  i w koń- 
cu rejestruje.  Podstawowa  częstość  tego  detektora  wy- 
nosi 1660  Hz.  Dzięki  temu  pomysłowemu  urządzeniu 
Weber  mógł  mierzyć  względne  naprężenia  rzędu  10"1*, 
czemu  odpowiada  przesunięcie  końców  walca  o 2* 
•10~ 14  cm,  a więc  mniej  niż  o Vio  klasycznego 
promienia  elektronu.  To  jest  fantastyczna  dokład- 
ność! 

Stosując  dwa  takie  detektory,  odległe  od  siebie 
o 1000  km,  Weber  badał  koincydencje  pomiędzy 
sygnałami  dochodzącymi  z obu  anten.  Sygnały  z jed- 
nej anteny,  umieszczonej  w pobliżu  Chicago,  były 
przekazywane  za  pomocą  linii  telefonicznej  do  Ma- 
ryland, gdzie  pracowała  druga  antena.  Sygnały,  które 
dochodziły  jednocześnie  z dokładnością  do  0,4  s, 
były  liczone  jako  koincydencyjne.  Weber  twierdzi,  że 
od  1969  r.  obserwuje  dziennie  ok.  4 koincydencji. 
Zapis  sygnałów  pochodzących  z obu  anten  przedstawia 
rys.  8.  Odnosząc  swoje  dane  do  czasu  gwiazdowego 
Weber  w 1970  r.  stwierdził,  że  obserwuje  więcej  syg- 
nałów w koincydencji,  gdy  anteny  skierowane  są 
ku  centrum  Galaktyki.  Jeśliby  się  przypuściło,  że 
źródło  promieniowania  znajduje  się  w centrum  Galak- 
tyki, to  obserwowaną  iiczbę  koincydencji  mogłoby 
dawać  źródło  przetwarzające  na  fale  grawitacyjne 
energię  masy  spoczynkowej  ok.  1000 A/®  w ciągu  roku. 

Liczba  ta  wydawała  się  astronomom  zbyt  duża. 
Przeprowadzili  oni  oszacowania  energii,  która  może 
być  wypromieniowana  z centrum  Galaktyki  nie  po- 
wodując zauważalnych  ruchów  gwiazd.  Na  górną 
wartość  tej  energii  otrzymano  70Af®  w ciągu  roku, 
a więc  wynik  Webera  jest  o czynnik  czternaście  za 
duży. 

Od  1970  r.  pracuje  kilka  innych  anten.  Zbudowali 
je,  wzorując  się  na  modelu  Webera,  R.  Drever 
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w Glasgow,  J.  A.  Tyson  w Holmdel,  W.  Braginski 
w Moskwie  i in.  (il.  219,  tabl.  58).  Choć  wszystkie  uk- 
łady działały  na  bardzo  podobnej  zasadzie  jak  antena 
Webera,  żadnej  innej  grupie  nie  udało  się  potwierdzić 
obserwacji  Webera.  Trzeba  przyznać,  że  nikt  nie  zbu- 
dował dokładnie  takiej  samej  pary  anten,  ale  sądzi  się 
powszechnie,  że  anteny  Webera  są  wzbudzane  przez 
jakieś  inne  czynniki,  nie  przez  fale  grawitacyjne. 

W tym  czasie  powstały  nowe  projekty  anten  grawi- 
tacyjnych. W.  Fairbank  buduje  antenę,  która  będzie 
pracowała  w bardzo  niskiej  temperaturze,  ok.  2 • 

• 10"3  K.  Już  samo  obniżenie  temperatury  pozwoli  na 
zwiększenie  czułości  anteny  o dwa  rzędy  wielkości. 

Znacznemu  zmniejszeniu  ulegną  bowiem  szumy  ante- 
ny związane  z termicznym  ruchem  atomów.  Fairbank 
chce  też  zastosować  nową  metodę  przetwarzania  drgań 
mechanicznych  cylindra  na  drgania  elektryczne,  wy- 
korzystując obwody  nadprzewodzące;  przypuszcza, 
że  w ten  sposób  podniesie  czułość  anteny  o dalszy  rząd 
wielkości.  Jego  antena  powinna  zacząć  działać  w koń- 
cu lat  osiemdziesiątych.  Fairbank  ma  nadzieję,  że  za 
pomocą  swojej  anteny  będzie  mógł  obserwować  wy- 
buchy supernowych  w otaczających  nas  bliskich  galak- 
tykach. 

Już  w 1960  r.  Weber  wystąpił  z projektem  użycia  metody 
Ziemi  jako  detektora  fal  grawitacyjnych.  W tym  celu  detekcji 
należałoby  dokładnie  mierzyć  zmiany  natężenia  pola  fał  grawi- 
grawitacyjnego  w kilku  punktach  na  powierzchni  facyjnych 
Ziemi.  Pomiary  takie  są  bardzo  trudne,  gdyż  po- 
ziom szumów  sejsmicznych  jest  na  Ziemi  niezwykle 
wysoki.  Postanowiono  więc  potraktować  Księżyc 
jako  detektor.  Załoga  statku  Apollo  17  umieściła 
na  Księżycu  grawimetr  (niestedy  układ  nie  działa). 

Od  pewnego  czasu  trwają  też  dokładne  pomia- 
ry odległości  pomiędzy  Ziemią  i Księżycem.  Mogą 
one  być  wykorzystane  do  wykrywania  fal  grawi- 
tacyjnych o bardzo  dużej  długości  fali. 

Rozważa  się  też  kilka  innych  wariantów  anten 
grawitacyjnych,  w których  by  się  wykorzystywało 
interferencje  dwóch  strumieni  laserowych  do  bada- 
nia zmian  odległości  między  dwoma  zwierciadłami. 

Braginski  zamierza  zbudować  antenę,  w której  pod- 
stawowym elementem  będzie  olbrzymi,  ważący  ok. 

5 kg  sztuczny  diament. 

Bardzo  trudno  jest  przewidzieć,  które  z tych  ekspe- 
rymentów zakończą  się  powodzeniem.  Być  może 
jesteśmy  na  progu  nowych  możliwości  i za  kilka  lat 
dysponować  będziemy  nowymi  danymi  obserwacyj- 
nymi o otaczającym  nas  Wszechś wiecie.  Może  isę 


promienio- 
wanie 
kosmiczne 
pierwotne 
i wtórne 


składowe 

promienio- 

wania 

kosmicznego 


jednak  okazać,  że  podniesienie  czułości  anten  — 
nawet  o cztery  rzędy  wielkości  — jeszcze  nie  wystarczy 
a wówczas  trzeba  będzie  czekać  na  kolejną  rewolucję 
technologiczną,  aby  eksperymentalnie  potwierdzić 
istnienie  fal  grawitacyjnych. 

Pośrednio  na  istnienie  fal  grawitacyjnych  wskazują 
obserwacje  pulsara  PSR  1913  + 16.  Jest  to  pulsar  ra- 
diowy wchodzący  w skład  układu  podwójnego,  przy 
czym  drugim  składnikiem  jest  najprawdopodobniej 
też  gwiazda  neutronowa.  Obserwowane  zmiany  okre- 


su orbitalnego  tego  układu  dobrze  zgadzają  się  z przy- 
puszczeniem, że  wywołuje  je  emisja  fal  grawitacyj- 
nych. 

W.  B.  BraG  IŃSKU,  A.  B.  Manukin  Izmierienije  małych  sił  wfi- 
ziczeskich  ekspicrimientach,  Moskwa  1975;  M.  Demiański  Astro- 
fizyka relatywistyczna , Warszawa  1978;  M.  Rees,  R.  Ruffini, 
J.  A.  Wheeler  Black  Holes , Gravitational  Wcves  and  Cosmology , 
New  York  1974;  J.  Weber  General  Relativity  and  Gravitational 
Waves , New  York  1961 ; W.  D.  Zacharów  Grawitacjonnyje  wolny 
w tieorii  tiagoiienija  Einsztejna,  Moskwa  1972;  J.  B.  Zeldowicz, 
I.  D.  Nowikow  Tieorija  tiagoiienija  i ewolucyja  zwiozd,  Moskwa. 
1971. 


Promieniowanie  kosmiczne 


Marcin  Kubiak 

Promieniowaniem  kosmicznym  nazywamy  strumień 
cząstek  o bardzo  dużych  energiach,  107-1020  eV, 
dobiegający  do  Układu  Słonecznego  z przestrzeni 
międzygwiazdowej.  Cząstki  promieniowania  kosmicz- 
nego wbiegające  w atmosferę  ziemską  z prędkością 
bliską  prędkości  światła  są  źródłem  cząstek  wtórnych, 
których  rodzaj  i energia  zależą  od  wysokości  w atmo- 
sferze. Promieniowanie  kosmiczne  nie  dociera  do 
powierzchni  Ziemi  i w swej  pierwotnej  postaci  może 
być  obserwowane  tylko  na  dużych  wysokościach 
(w  idealnym  wypadku  — poza  Ziemią,  a nawet  poza 
granicami  Układu  Słonecznego).  Aby  podkreślić, 

0 który  rodzaj  cząstek  chodzi,  używa  się  niekiedy 
pojęć:  pierwotne  i wtórne  promieniowanie  kosmiczne. 

Wynikiem  oddziaływania  promieniowania  kos- 
micznego z atmosferą  jest  wzrost  jej  przewodnictwa 
elektrycznego;  w nieobecności  jakichkolwiek  czyn- 
ników jonizujących  gaz  tworzący  atmosferę  powinien 
mieć  właściwości  dielektryka.  Fakt,  że  atmosfera 
ziemska  jest  ośrodkiem  przewodzącym,  znany  był  od 
1900  r.,  jednak  dopiero  w 1912  r.  V.  F.  Hess  wykazał 
obserwacyjnie,  że  przewodnictwo  atmosfery  wzrasta 
z wysokością  i wysunął  potwierdzoną  później  hipo- 
tezę, że  zjawisko  to  jest  następstwem  jonizacji  wy- 
wołanej przez  przenikliwe  promieniowanie  pocho- 
dzenia pozaziemskiego.  Korpuskulamy  charakter 
tego  promieniowania  stwierdzono  w 1929  r.  Dalsze 
obserwacje  wykazały,  że  promieniowanie  kosmiczne 
zawiera  trzy  wyraźnie  różne  składowe:  stały  w czasie 

1 niezależny  od  kierunku  strumień  cząstek  pochodzący 
spoza  Układu  Słonecznego,  zmienny  w czasie  stru- 
mień cząstek  pochodzący  ze  Słońca,  wykazujący 
wyraźny  związek  z rozbłyskami  na  jego  powierzchni, 
oraz  mniej  intensywny  strumień  fotonów  y pocho- 
dzenia pozasłonecznego.  Do  czasu  wprowadzenia 
laboratoryjnych  akceleratorów  cząstek,  promienio- 
wanie kosmiczne  było  dla  fizyków  jądrowych  natu- 
ralnym źródłem  cząstek  i kwantów  y o bardzo  dużych 
energiach.  W ostatnich  latach  promieniowanie  kos- 
miczne stało  się  przedmiotem  szczególnego  zaintere- 
sowania astrofizyków  zajmujących  się  proęesami 
wielkich  energii.  Jednocześnie  pojęcie  promieniowania 
kosmicznego  uległo  zawężeniu;  promieniowanie  kor- 
puskularne,  którego  źródłem  są  rozbłyski  słoneczne, 
stało  się  przedmiotem  zainteresowania  heliofizyki, 
natomiast  obserwacje  kwantów  y rozwinęły  się  w 
nową  gałąź  dzisiejszej  astrofizyki  obserwacyjnej 
(— ► Astronomia  promieni  X i y).  Całkowicie  nowe 
możliwości  obserwacji  promieniowania  kosmicznego 
pojawiły  się  wraz  z rozwojem  techniki  rakietowej  i sa- 
telitarnej. 


Metody  obserwacji  promieniowania 
kosmicznego 

Najważniejsze  sposoby  obserwacji  cząstek  promie- 
niowania kosmicznego  w różnych  zakresach  ich  ener- 
gii kinetycznej  podane  są  w poniższej  tabeli.  Celem 
tych  obserwacji  jest  dokonanie  jednoznacznej  iden- 


tyfikacji cząstek,  określenie  ich  widma  energetycz- 
nego (tzn.  względnej  liczby  cząstek  danego  rodzaju, 
o energii  zawartej  w jednostkowym  przedziale  wokół 
danej  energii  E)  oraz  kierunku  przylotu. 


Metody  obserwacji  promieniowania  kosmicznego  w różnych 
zakresach  energii 


Zakres  energii 


Metoda  obserwacji 


2 - 107-3-  !0a  eV 


2- 10*-5-  10ł0  eV 
10l#-1014  eV 


10‘«-!018  eV 
10l,-10*°  eV 


detektory  umieszczone  na  pokładach 
sztucznych  satelitów  o orbitach  ekscen- 
trycznych, wybiegających  poza  magneto- 
sferę 

bloki  emulsji  i liczniki  Czerenkowa  wy- 
noszone przez  balony  stratosferyczne 
spektrometry  jonizacyjne  i bloki  emulsji 
rejestrujące  reakcje  jądrowe,  umieszczone 
na  pokładach  satelitów  i balonów  strato- 
sferycznych 

podziemne  pomiary  strumienia  mionów 
obserwacje  wielkich  pęków  atmosferycz- 
nych 


Jednoznaczna  identyfikacja  cząstki  wymaga  okre-  identyfikacja 
ślenia  jej  ładunku  elektrycznego  oraz  masy.  Wszy-  cząstek 
stkie  cząstki  promieniowania  kosmicznego  są  jądra- 
mi atomowymi  pozbawionymi  całkowicie  powłok 
elektronowych;  określenie  ładunku  jest  więc  równo- 
znaczne z określeniem  liczby  atomowej  jądra  (czyli 
liczby  znajdujących  się  w nim  ładunków  dodatnich). 

Określenie  znaku  ładunku  pozwala  na  odróżnienie 
materii  od  antymaterii.  Do  identyfikacji  cząstek 
można  wykorzystać  pewne  właściwości  ich  oddziały- 
wania z materią.  Cząstka  promieniowania  kosmicz- 
nego przechodząca  przez  gęsty  ośrodek  traci  część 
swej  energii  na  jonizację  lub  wzbudzenie  tworzących 
go  atomów.  Straty  te  nazywamy  stratami  jonizacyjny-  straty 
mi.  W ogólnym  wypadku  zależą  one  od  ładunku  oraz  jonizacyjne 
prędkości  cząstki;  tak  więc  oprócz  określenia  strat 
jonizacyjnych  (czyli  ubytku  energii  na  jednostkowej 
drodze)  do  identyfikacji  cząstki  potrzebne  są  również 
niezależne  informacje  o jej  prędkości.  W przypadku 
cząstek  relatywistycznych  (poruszających  się  z pręd- 
kością bliską  prędkości  światła)  straty  jonizacyjne 
zależą  praktycznie  tylko  od  ładunku. 

Innej  możliwości  identyfikacji  cząstek  dostarcza  promienio- 
analiza  tzw.  promieniowania  Czerenkowa.  Promie-  wanie 
niowanie  to  pojawia  się  zawsze,  gdy  prędkość  cząstki  Czerenkowa 
obdarzonej  ładunkiem  elektrycznym,  poruszającej 
się  w przezroczystym  ośrodku  o współczynniku  zała- 
mania «,  przekracza  wartość  c/n,  czyli  jest  większa 
od  prędkości  światła  w tym  ośrodku  (pozostając  jed- 
nak mniejsza  od  prędkości  światła  w próżni).  Natę- 
żenie oraz  barwa  promieniowania  Czerenkowa  emi- 
towanego na  jednostkowej  drodze  zależy  od  ładunku 
cząstki  i od  jej  prędkości.  Gdy  cząstki  poruszają  się 
z prędkością  dużo  większą  od  prędkości  granicznej 
c//i,  właściwości  promieniowania  Czerenkowa  zależą 
-tylko  od  ładunku  cząstki. 

Wymienione  wyżej  zjawiska,  tzn.  straty  jonizacyjne 
oraz  promieniowanie  Czerenkowa,  są  — w takiej 
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czy  innej  odmianie  — zasadą  działania  wszystkich 
urządzeń  stosowanych  do  obserwacji  promieniowania 
kosmicznego. 

pomiar  W zakresie  energii  mniejszych  od  około  3 108  eV 
energii  straty  jonizacyjne  mogą  doprowadzić  do  całkowite- 
cząstek  go  zatrzymania  cząstki  zanim  oddziaływania  jądrowe 
zanuenią  ją  w cząstkę  lub  cząstki  innego  rodzaju. 
Całkowita  energia  cząstki  może  być  wówczas  okre- 
ślona np.  na  podstawie  analizy  jej  śladu  w bloku  emul- 
sji jądrowej  (rys.  1).  Innym  rodzajem  analizatora 
energii  jest  urządzenie  składające  się  z dwóch  scyn- 
tylatorów, którego  zasada  działania  jest  wyjaśniona 
na  rys.  2. 

Do  określenia  energii  cząstek  o większych  ener- 
giach wykorzystuje  się  następujące  urządzenia,  me- 
tody oraz  zjawiska. 

Liczniki  Czerenkowa  — zależnie  od  współczynnika 
załamania  użytej  substancji  rejestrują  tylko  cząstki 
(^energiach  większych  od  określonej  energii  progo- 

Spektrometry  magnetyczne  — urządzenia,  w któ- 
rych wykorzystuje  się  fakt,  że  cząstka  o pędzie  p 
i ładunku  Z,  poruszająca  się  w poprzecznym  polu 
magnetycznym  o natężeniu  B,  zakreśla  koło  o pro- 
mieniu r = pjZB.  Urządzenia  tego  rodzaju  są  za- 
zwyczaj używane  w połączeniu  z układami  komór 
iskrowych  lub  z blokami  emulsji,  pozwalającymi 
doKładnie  określić  tory  cząstek. 

Spektrometry  jonizacyjne  — urządzenia,  w których 
pierwotna  cząstka  traci  swą  energię  w grubej  war- 
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stwie  absorbującej  wskutek  oddziaływań  jądrowych, 
prowadzących  do  powstania  kaskad  mezonowych! 
Ostatecznie,  niemal  cała  energia  kinetyczna  cząstki 
zamienia  się  w energię  kaskady  elektronów  i może 
być  zmierzona. 


miemowaHja  kosmicznego,  będącego  zarazem  analiza- 
SSLfy'?"-  Rejestrowane  są  tylko  cząstki,  które  przejdą  prawie 
jednocześnie  przez  scyntylator  A i By  cząstki  przechodzące  przez 
wszystkie  trzy  scyntylatory  nie  są  rejestrowane.  W układzie  ta- 
kim  są  więc  rejestrowane  tylko  takie  cząstki,  których  energia  jest 
powicie  tracona  w scyntylatorze  B.  Jednocześnie  stosunki 
geometryczne  układu  określają  „pole  widzenia”  teleskopu,  za- 
znaczone na  rysunku  niebieską  linią  przerywaną 
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Wielkie  pęki  atmosferyczne  są  wykorzystywane  do 
obserwacji  cząstek  o energiach  większych  od  ok. 
10  eV;  cząstek  o takich  energiach  nie  potrafimy 
jeszcze  rejestrować  w sposób  bezpośredni.  Wielkie 
pęki  atmosferyczne  powstają  wskutek  zderzeń  czą- 
stek promieniowania  kosmicznego  o dużych  ener- 
giach z jądrami  atomów  tworzących  atmosferę  ziem- 
ską. Cząstki  wtórne  produkowane  w pęku  dobiegają 
do  powierzchni  Ziemi,  a nawet  wnikają  pod  jej  po- 
wierzchnię. Układy  detektorów,  takich  jak  liczniki 
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fe’1,  .^*dy  cząstek  promieniowania  kosmicznego  w emuls 
Composition  of  Cosmic  Radiation , London  1975) 
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Rys.  3.  Schemat  wiel- 
kiego pęku  atmosfe- 
rycznego zapoczątko- 
wanego przez  szybki 
proton  (rys.  3 i 5 wg 
O.  C.  Alłkofer,  Jntro- 
duction  to  Cosmic 
Radiation , Miinchen 
1975) 


liczba  i 
rodzaj 
cząstek 
pierwotnych 


scyntylacyjne  lub  liczniki  Geigera-Miillera,  rozmiesz- 
czone na  powierzchni  od  kilkuset  metrów  do  kilku- 
nastu kilometrów  kwadratowych  (pod  ziemią,  na 
poziomie  morza  lub  na  szczytach  gór)  pozwalają 
określić  zarówno  rodzaj  cząstek  pierwotnych,  jak 
i ich  energię  i kierunek  przylotu  (rys.  3 i 4).  Rozwojo- 
wi wielkiego  pęku  atmosferycznego  towarzyszy  krót- 
kotrwały błysk  promieniowania  Czerenkowa  w dzie- 
dzinie widzialnej,  który  może  być  zarejestrowany  przez 
fotomnożnik,  kliszę  fotograficzną  lub  inny  element 
światłoczuły  umieszczony  w ognisku  niewielkiego 
nawet  teleskopu.  Analiza  błysków  Czerenkowa  poz- 
wala na  określenie  energii  cząstki  pierwotnej  oraz  jej 
kierunku,  nie  daje  jednak  informacji  na  temat  rodzaju 


cząstki  będącej  źródłem  pęku  (wyjątek  stanowią  tylko 
błyski  pochodzące  od  pęków  zapoczątkowanych  przez 
kwanty  y;  można  je  stosunkowo  łatwo  odróżnić  od 
błysków  pochodzących  od  pęków  zapoczątkowanych 
przez  cząstki ; -*  Astronomia  promieni  X i y).  Za- 
stosowanie układów  teleskopów  optycznych  reje- 
strujących atmosferyczne  promieniowanie  Czeren- 
kowa rokuje  nadzieje  na  podniesienie  dokładności 
pomiarów  strumienia  cząstek  o dużych  energiach. 


Oddziaływanie  promieniowania  kosmicznego 
z magnetosferą  i materią  międzyplanetarną 

Pole  magnetyczne,  a dokładniej  jego  składowa  po- 
przeczna, wywiera  istotny  wpływ  na  ruch  cząstek 
obdarzonych  ładunkiem  elektrycznym.  Tory  cząstek 
promieniowania  kosmicznego  są  więc  określone  za- 
równo przez  rozkład  pola  magnetycznego  w Galakty- 
ce (natężenie  pola  rzędu  10" 10  T),  jak  i przez  znacznie 
silniejsze  pole  magnetyczne  otaczające  Ziemię  w po- 
staci tzw.  magnetosfery  lub  geokorony  (->  Fizyka 
przestrzeni  okołoziemskiej).  Gdy  obserwacje  wykony- 
wane są  w pobliżu  Ziemi  kierunek  przylotu  cząstki 
promieniowania  kosmicznego  o energii  mniejszej 
od  ok.  1012  eV  nie  daje  żadnych  informacji  na  temat 
kierunku,  z którego  dana  cząstka  wbiegła  do  układu 
planetarnego.  Chwilowy  wzrost  natężenia  pola  mag- 
netycznego otaczającego  Ziemię  może  spowodować, 
że  promieniowanie  kosmiczne  o energii  mniejszej  od 
pewnej  energii  granicznej  w ogóle  nie  dobiegnie  do 
efekt  Ziemi.  Od  1937  r.  znany  jest  tzw.  efekt  Forbusha, 
Forbusha  polegający  na  tym,  że  ogólny  strumień  promienio- 
wania kosmicznego  ulega  znacznemu  zmniejszeniu 
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w okresach  burz  geomagnetycznych.  Efekt  Forbusha 
tłumaczy  się  działaniem  tzw.  butelki  magnetycznej 
(rys.  5):  obszar,  w którym  pole  magnetyczne  jest 
wzmocnione,  odbija  dobiegające  z zewnątrz  cząstki 
promieniowania  kosmicznego.  Efekt  Forbusha  jest 


kierunek  obrotu 
> Słońca 


obszar  aktywny 


Ziemia 


Rys.  5.  Model  , .butelki  magnetycznej’'  wy- 
jaśniający osłabienie  strumienia  promienio- 
wania kosmicznego  (o  stosunkowo  małych 
energiach)  w okresie  wzmożonej  aktywności 
słonecznej 


pola 
magnetycz- 


nego 


galaktyczne 

promieniowani* 

kosmiczne 


jednym  z przejawów  znacznie  ogólniejszego  zjawiska 
modulacji  promieniowania  kosmicznego  w 11 -letnim 
cyklu  aktywności  słonecznej.  Modulacja  ta  polega  na 
okresowych  zmianach  natężenia  promieniowania 
kosmicznego,  przy  czym  wielkość  tych  zmian  zależy 
od  energii  promieniowania  kosmicznego.  Zjawisko 
modulacji  słonecznej  jest  wynikiem  oddziaływania 
cząstek  promieniowania  kosmicznego  z materią 
i polem  magnetycznym,  unoszonymi  ze  Słońca  w po- 
staci tzw.  wiatru  słonecznego.  Cząstki  promieniowania 
kosmicznego,  dyfundujące  poprzez  nieregularności 
pola  magnetycznego  w wietrze  słonecznym,  są  wyno- 
szone wraz  z tymi  nieregularnościami  z układu  pla- 
netarnego. Istniejące  teorie  tego  zjawiska  pozwalają 
przewidzieć  w sposób  ilościowy  osłabienie  strumienia 
promieniowania  kosmicznego  (zależnie  od  energii) 
oraz  zmianę  widma  energetycznego  cząstek  w wyniku 
oddziaływania  z wiatrem  słonecznym. 


Skład  i widmo  energii  promieniowania 
kosmicznego 

Promieniowanie  kosmiczne  w pobliżu  Ziemi  (ponad 
atmosferą)  składa  się  w 86%  z protonów,  w 13% 
z cząstek  alfa  (jąder  helu);  około  1%  stanowią  elek- 
trony i jądra  pierwiastków  cięższych  (o  liczbie  ato- 
mowej Z ^ 3). 

Na  rys.  6 porównano  skład  promieniowania  kos- 
micznego ze  składem  chemicznym  materii  w Układzie 
Słonecznym.  Wodór  i hel  występują  w promienio- 
waniu kosmicznym  mniej  obficie,  natomiast  pier- 
wiastki o liczbie  atomowej  18  < Z < 24  znacznie 
obficiej  niż  w materii  Układu  Słonecznego.  Najbar- 
dziej uderzający  jest  jednak  fakt,  że  pierwiastki  lit, 
beryl  i bor  mają  w promieniowaniu  kosmicznym  roz- 
powszechnienie pięć  rzędów  wielkości  większe.  Przy- 
puszcza się,  że  nadobfitość  tych  jąder  jest  wynikiem 
reakcji  jądrowych  zachodzących  między  szybkimi 
cząstkami  promieniowania  kosmicznego  i materią 
międzygwiazdową;  w wyniku  tych  reakcji  jądra 
ciężkie  ulegają  rozbiciu  na  jądra  lżejsze. 

Jak  dotychczas  nie  udało  się  wykryć  jąder  anty- 
materii w promieniowaniu  kosmicznym.  Istniejące 
dane  obserwacyjne  pozwalają  na  określenie  górnej 
grasicy  rozpowszechnienia  antyjąder  na  10-3-10"4, 
zależnie  od  zakresu  energii.  Pozytony  (antyelektrony 
obserwowane  w promieniowaniu  kosmicznym  są 
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Rys.  6.  Porównanie  rozpowszechnienia  Ar  pierwiastków  w Ukła- 
dzie Słonecznym  zc  składem  promieniowania  kosmicznego  w po- 
bliżu Ziemi  (rys.  6 i 10  wg  F.  B.  McDonald  and  C.  E.  Fichtel(ed.) 
High  Energy  Particles  and  Quanta  in  Astrophysics,  Cambridge 


cząstkami  wtórnymi,  powstającymi  w wyniku  reakcji 
jądrowych  promieniowania  kosmicznego  z materią 
międzygwiazdową. 

protony  Protony  są  w zasadzie  jedynymi  cząstkami  w pro- 
mieniowaniu kosmicznym  niosącymi  pojedynczy  ła- 
dunek elementarny.  W liczbach  bezwzględnych,  cał- 
kowity strumień  protonów  o energiach  większych 
od  10«  eV  jest  równy  ok.  2500  cząstek  na  m2  steradian 
i sekundę.  Obok  protonów  obserwuje  się  również 
trwały  izotop  wodoru  — deuter.  Drugi  izotop  wodo- 
ru — tryt  — najprawdopodobniej  nie  występuje 
w promieniowaniu  kosmicznym.  Tryt  jest  izotopem 
nietrwałym  i ulega  przemianie  w He3  z okresem  poło- 
wicznego zaniku  12,5  lat.  W pobliżu  Ziemi  można 
by  więc  zaobserwować  tylko  te  jądra  trytu,  które 
powstały  nie  dawniej  niż  kilka  razy  12,5  lat.  Ekspery- 
mentalna górna  granica  stosunku  trytu  do  protonów 
jest  rzędu  10-3.  Różniczkowe  widmo  energetyczne 
protonów  i deutronów  w promieniowaniu  kosmicz- 
nym jest  przedstawione  na  rys.  7.  Protony  o energiach 
mniejszych  od  50  MeV  (1  MeV  = 106  eV)  były  ob- 
serwowane z satelitów  i sond  kosmicznych  wybiega- 
jących poza  magnetosferę  Ziemi.  Obecnie  uważa  się 
że  protony  te  nie  są  pochodzenia  galaktycznego  lecz 
słonecznego,  albo  też  są  w jakiś  sposób  przyspieszane 
w pobliżu  Słońca. 

hel  Widmo  energetyczne  jąder  He4  i He3  występujących 
w promieniowaniu  kosmicznym  jest  przedstawione  na 
rys.  8.  Widmo  He3  jest  określone  tylko  dla  energii 
mniejszych  od  300  MeV ; jak  dotychczas  nie  potrafi- 
my jeszcze  rozdzielać  izotopów  o energiach  większych 
od  ok.  300  MeV  na  nukleon. 

Strumień  jąder  pierwiastków  ciężkich  jest  średnio 
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Rys.  7.  Energetyczne  widmo  protonów  i deuteronów.  Linią  ciągłą 
przedstawiony  jest  przebieg  widma  teoretycznego,  uzyskanego  po 
uwzględnieniu  efektów  modulacji  słonecznej 


Rys.  8.  Energetyczne  widmo  jąder  He‘  i He3.  Linią  ciągłą  przed- 
stawiony jest  przebieg  widma  teoretycznego,  uzyskanego  po 
uwzględnieniu  efektów  modulacji  słonecznej 


kilka  lub  kilkanaście  tysięcy  razy  mniejszy  od  stru-  pierwiastki 
mienia  protonów.  Na  rys.  9 przedstawione  jest  ciężkie 
widmo  energetyczne  jąder  boru  i berylu.  Widma  takie 
są  typowe  dla  widm  wszystkich  jąder  cięższych  od 
helu.  Szczególnie  interesująca  byłaby  ewentualna 
obecność  w promieniowaniu  jąder  pierwiastków 
transuranowych. 

Widmo  energetyczne  elektronów  i pozytonów  w po-  elektrony 
bliżu  Ziemi  jest  przedstawione  na  rys.  10.  Uwagę  \ pozytony 
zwraca  wzrost  strumienia  elektronów  o energiach  7 7 

mniejszych  od  ok.  20  MeV.  Nie  zostało  jeszcze  wyja- 
śnione, czy  elektrony  o tych  energiach  są  pochodzenia 
kosmicznego  czy  słonecznego.  Badania  czasowych 
zmian  strumienia  elektronów  sugerują  jednak,  że 
elektrony  te  są  pochodzenia  galaktycznego.  Pocho- 


liczba  cząstek/m2-s  sr-106  eV 


energia  kinetyczna  na  cząstkę 

Rys.  9.  Energetyczne  widma  berylu  i boru 


energia  kinetyczna  na  cząstkę 

Rys.  10.  Obserwowane  widmo  energetyczne  elektronów  i pozy- 
tonów w pobliżu  Ziemi 


dzenie  pozytonów  wydaje  się  obecnie  dobrze  znane: 
pozytony  o energiach  powyżej  kilku  MeV  powstają 
z rozpadu  mezonów  produkowanych  w reakcjach 
jądrowych  zachodzących  między  promieniowaniem 
kosmicznym  i jądrami  materii  międzygwiazdowej. 
Pozytony  o energiach  mniejszych  od  1 MeV  mogą 
być  pochodzenia  zarówno  kosmicznego,  jak  i słonecz- 
nego. Badanie  widma  pozytonów  w tym  zakresie  ener- 
gii może  dostarczyć  ciekawych  informacji  na  temat 
innych  (niż  rozpad  mezonów)  źródeł  pozytonów. 


Pochodzenie  promieniowania  kosmicznego 

Każda  teoria  mająca  na  celu  wjaśnienie  pochodzenia 
promieniowania  kosmicznego  musi  uwzględniać 
trzy  podstawowe  fakty:  1)  Gęstość  energii  promienio- 
wania kosmicznego  jest  rzędu  10" 19  Jcm“3,  czyli 
jest  tego  samego  rzędu  co  inne  postacie  energii  wy- 
stępujące w przestrzeni  międzygwiazdowej,  takie  jak 
energia  związana  z promieniowaniem  reliktowym, 
energia  pola  magnetycznego,  czy  energia  kinetyczna 
obłoków  materii  międzygwiazdowej.  2)  Widmo  ener- 
getyczne promieniowania  kosmicznego  można  przy- 
bliżyć wyrażeniem  gdzie  E oznacza  energię,  a wy- 
kładnik y jest  równy  około  2,5.  3)  Średni  czas  życia 
cząstek  promieniowania  kosmicznego  jest  rzędu  108 
lat,  po  upływie  tego  czasu  cząstki  tracą  znaczną  część 
swej  energii  wskutek  oddziaływań  z rozproszoną  ma- 
terią, polem  magnetycznym  i rozrzedzonym  promie- 
niowaniem, występującymi  w przestrzeniach  między- 
gwiazdowych,  a być  może  również  — międzygalak- 
tycznych  (-*  Radioastronomia).  Tempo  utraty  ener- 
gii jest  tym  większe,  im  większa  jest  energia  cząstki. 
Jeżeli  źródłem  promieniowania  kosmicznego  są  pro- 
cesy przebiegające  w obrębie  Galaktyki,  wówczas 
należy  jeszcze  uwzględnić  straty  cząstek  o bardzo 
dużych  energiach  wynikające  z ich  „wyciekania” 
z obszaru  Galaktyki. 

Obserwowane  obecnie  promieniowanie  kosmiczne 
należy  więc  uważać  za  wynik  ustalenia  się  stanu  sta- 
cjonarnego między  procesami  tworzenia  nowych 
cząstek  o dużych  energiach  i procesami,  które  pro- 
wadzą do  zmniejszenia  ich  energii;  jeżeli  promienio- 
wanie kosmiczne  nie  jest  zjawiskiem  chwilowym,  to 
jego  źródła  muszą  istnieć  również  obecnie.  Podsta- 
wowy problem,  czy  źródłami  tymi  są  obiekty  galak- 
tyczne czy  pozagalaktyczne,  nie  został  jeszcze  osta- 
tecznie rozwiązany.  Za  galaktycznym  pochodzeniem 
promieniowania  kosmicznego  przemawia  fakt,  że 
energia  konieczna  do  podtrzymania  obserwowanego 
strumienia  promieniowania  kosmicznego  może  być 
dostarczona  przez  znane  nam  obecnie  obiekty  galak- 
tyczne, w których  przebiegają  procesy  gwałtownego 
wydzielania  ogromnych  ilości  energii.  Biorąc  pod 
uwagę  podaną  wyżej  gęstość  energii  promieniowania 
kosmicznego,  jego  średni  czas  życia,  oraz  objętość 
Galaktyki  łącznie  z halo  galaktycznym  (1088  cm3), 
możemy  ocenić  energię  konieczną  do  zachowania 
strumienia  promieniowania  kosmicznego  na  jego 
obecnym  poziomie.  Jest  on  rzędu  10“19*  1 0^/3 • 1 01*  = 
= 3-1033  J-s”1.  Energia  ta  może  być  wyzwalana 
podczas  wybuchów  supernowych  (jeden  wybuch  super- 
nowej może  prowadzić  do  wydzielenia  energii  rzędu 
1043  J,  przy  czym  wybuchy  następują  średnio  co  50 
lat)  oraz  może  być  dostarczana  w sposób  ciągły  kosz- 
tem energii  rotacyjnej  ->  Pulsarów  (energie  rotacji 
pulsarów  ocenia  się  na  1046  J. 

Z drugiej  jednak  strony  wiadomo,  że  niektóre 
obiekty  pozagalaktyczne  (np.  radiogalaktyki  lub 
kwazary)  emitują  ogromne  ilości  energii,  której  część 
może  mieć  postać  promieniowania  kosmicznego. 
Izotropowość  strumienia  cząstek  o energiach  więk- 
szych od  1017  eV  sugeruje,  że  cząstki  te,  a przynaj- 
mniej ich  część,  mogą  być  pochodzenia  pozagalaktycz- 
nego.  Strumień  takich  cząstek  w przestrzeni  między- 
galaktycznej  nie  może  być  jednak  zbyt  duży,  ponieważ 
ich  oddziaływanie  z protonami  materii  międzygalak- 
tycznej,  nawet  przy  bardzo  małej  jej  gęstości,  byłoby 
źródłem*  silniejszego  niż  się  obserwuje  izotropowego 
strumienia  kwantów  gamma  o energiach  większych 
od  108  eV.  Ponadto,  droga  wysokoenergetycznych 
cząstek  w przestrzeni  międzygalaktycznej  nie  może 
być  zbyt  długa,  ze  względu  na  straty  energii  wynika- 
jące z oddziaływania  z fotonami  promieniowania 
reliktowego.  Obecnie  uważa  się  za  bardziej  prawdo- 
podobne, że  promieniowanie  kosmiczne  jest  pocho- 
dzenia galaktycznego. 

O.  C.  Allkofer  Introduction  to  Cos  mi  c Radiation , MOnchen 
1975;  K.  M.  V.  Apparao  Composition  of  Cosmic  Radiation , Lon- 
don 1975;  A.  M.  Hillas  Cosmic  Rays>  New  York  1972. 
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Rozpowszechnienie  pierwiastków 
chemicznych  i molekuł  we  Wszechświecie 

Bronisław  Kuchowicz 


W połowie  ubiegłego  stulecia  twórca  filozofii  pozy- 
tywnej A.  Comte  głosił,  iż  nauki  powinny  ograniczyć 
się  do  badania  zjawisk  bezpośrednio  dostępnych 
obserwacji,  a zatem  skład  chemiczny  gwiazd  pozostać 
musi  poza  zasięgiem  ludzkiego  poznania.  W kilka 
lat  po  tym  stwierdzeniu  powstała  analiza  widmowa 
(R.  W.  Bunsen  i G.  R.  KirchhofT  — 1859  r.),  która 
jest  podstawą  wyznaczania  składu  chemicznego  atmo- 
sfer gwiezdnych.  W 1868  r.,  podczas  całkowitego 
zaćmienia  Słońca,  J.  Janssen  i N.  Lockyer  zaobser- 
wowali w widmie  protuberancji  słonecznych  jasną 
odkrycie  linię  żółtopomarańczową,  niepodobną  do  żadnej 
helu  linii  znanej  z laboratorium.  Tak  odkryto  hel;  pier- 
wiastek ten  dopiero  po  dwudziestu  kilku  latach  wykry- 
to w laboratorium  ziemskim. 

Rozwój  analizy  widmowej  spowodował,  że  obecnie 
znacznie  dokładniej  znamy  skład  chemiczny  atmosfer 
gwiazd  oddalonych  o milion  lat  świetlnych  niż  skład 
chemiczny  wnętrza  Ziemi.  Metodami  radioastronomii 
rozszyfrowano  w ostatnim  dziesięcioleciu  skład  che- 
miczny obłoków  gazowo-pyłowych  w przestrzeni 
kosmicznej  (-►  Radioastronomia).  Pojęcie  składu 
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Rys.  1.  Powiązanie  badań  kosmochemicznych  z zagadnieniami 
wytwarzania  energii  w gwiazdach  i nukleosyntczy  pierwiastków. 
W kółkach  umieszczono  skróty  nazw  dyscyplin  naukowych: 
FPK  Fizyka  promieniowania  kosmicznego,  MHD  magnetohy- 
drodynamika,  KRT  kontrolowane  reakcje  termojądrowe  (ra- 
czej krąg  zagadnień,  z którego  może  rozwinąć  się  odpowiednia 
dyscyplina  techniczna),  FP  fizyka  plazmy.  Fi  fizyka  jądrowa, 
AJ  astrofizyka  jądrowa,  K kosmologia,  OTW  ogólna  teoria 
względności,  APG  astrofizyka  powłok  gwiezdnych,  FA  fizyka 
atomowa,  SM  spektroskopia  molekularna,  RA  radioastronomia, 
KM  kosmochemia  molekularna,  ChR  chemia  radiacyjna,  ChO 
chemia  organiczna,  ECh  ewolucja  chemiczna  (kompleks  zagad- 
nień z pogranicza  chemii,  biochemii  i biologii),  S sclenochemia 
(oraz  chemia  innych  planet,  do  których  docierają  ludzie  lub 
próbniki,  np.  chemia  Marsa  itp.),  G geochemia,  M meteorytyka, 
ChA  chemia  analityczna.  Z lewej  strony  wymieniono  niektóre 
nowoczesne  urządzenia  doświadczalne  i metody  badań,  związane 
z przedstawioną  tematyką 


chemicznego  nie  jest  jednoznaczne,  można  mieć 
bowiem  na  myśli  zarówno  skład  pierwiastkowy  jak 
i skład  molekularny.  W związku  z tym  w kosmochemii 
można  wyróżnić:  kosmochemię  molekularną  oraz 
kosmochemię  pierwiastków  i związaną  z nią  kosmo- 
chemię ich  izotopów.  Skład  molekularny  materii 
ziemskiej,  meteorytowej,  księżycowej  wyznacza  się 
stosując  różne  metody  laboratoryjne  chemii,  nato- 
miast obecność  połączeń  chemicznych  w atmosfe- 
rach gwiazd  — wykorzystując  widma  molekularne 
znane  z laboratoriów  ziemskich.  Identyfikację  połą- 
czeń chemicznych  obecnych  w obłokach  materii 
kosmicznej  prowadzi  się  na  podstawie  detekcji  ich 
linii  widmowych  w zakresie  radiowym  i mikrofalo- 
wym. Podkreślmy  w tym  miejscu,  że  kosmochemia 
molekularna  zajmuje  się  kosmicznym  rozpowszech- 
nieniem wszelkich  połączeń  chemicznych,  nie  tylko 
molekuł,  ale  także  rodników  i jonów  molekularnych. 

Przy  znikomych  gęstościach  materii  w przestrzeni 
kosmicznej  (obłoki  gazowo-pyłowe  uważane  są  za  bar- 
dzo gęste,  jeśli  w objętości  1 cm3  znajduje  się  105- 
-I07  atomów !)  rodniki  i jony  nie  różnią  się  w zasadzie 
trwałością  od  normalnych  molekuł. 

Kosmochemia  zawiera  także  istotny  element  histo-  rozpowsza- 
ryczny:  opis  procesów  powstawania  zasadniczch  chnienie 
struktur  chemicznych  we  Wszechświecie.  Procesy  a powsta- 
powstawania  pierwiastków  chemicznych  (ściślej  zaś:  wania 
procesy  powstawania  rozmaitych  odmian  jąder  pierwia- 
atomowych)  wyjaśnia  się  dziś  reakcjami  jądrowymi  stków 
przebiegającymi  w sposób  naturalny  we  Wszech- 
świecie (czy  to  w rozszerzającym  się  Wszechświecie 
w pierwszych  fazach  jego  rozwoju,  czy  też  w gwiaz- 
dach). Analogicznie  odwołujemy  się  do  różnych  reak- 
cji chemicznych  (w  znacznej  części  do  tych,  którymi 
zajmuje  się  w laboratoriach  chemia  radiacyjna)  w celu 
wyjaśnienia  sposobu  powstawania  połączeń  chemicz- 
nych obserwowanych  w Układzie  Słonecznym,  w at- 
mosferach gwiazd  i obłokach  gazowo-pyłowych. 

Powiązania  między  problematyką  rozpowszech- 
nienia pierwiastków  chemicznych  i ich  połączeń 
a powstaniem  ich  we  Wszechświecie  oraz  różnymi 
kierunkami  badań  laboratoryjnych  ukazuje  rysunek  I. 


Najogólniejsze  dane  o pierwiastkach 
chemicznych  i ich  izotopach 

Zestawienie  liczby  znanych  pierwiastków  i ich  izo- 
topów wskazuje  na  znaczenie  mechanizmów  jądro- 
wych w powstawaniu  pierwiastków  chemicznych  (ta- 
bela 1).  Pierwiastek  nazywa  się  trwałym,  gdy  przynaj- 
mniej jeden  z jego  izotopów  jest  trwały;  w przeciw- 
nym razie  pierwiastek  nazywamy  promieniotwórczym. 

Trwałymi  są  kolejne  pierwiastki  w układzie  okreso- 
wym od  wodoru  do  bizmutu,  z wyjątkiem  technetu 
i prometu.  Istnieje  81  pierwiastków  trwałych,  na  które 
przypadają  272  trwałe  nuklidy  (->  Jądra  atomowe 
i ich  wzbudzenia).  Każdy  pierwiastek  trwały  ma  więc 
średnio  po  3,36  trwałych  izotopów.  Jeśli  podzielimy 
pierwiastki  na  nieparzyste  (tzn.  mające  nieparzystą  pierwiastki 
liczbę  porządkową  Z)  i parzyste,  natychmiast  uwi-  parzyste 
doczni  się  charakterystyczne  uprzywilejowanie  pier-  i nieparzyste 
wiastków  parzystych.  Jest  ich  41,  mają  zaś  łącznie 
216  izotopów,  tak  więc  na  każdy  pierwiastek  parzysty 
przypada  średnio  po  5,27  trwałych  izotopów.  Jedy- 
nie trzy  pierwiastki  parzyste  mają  mniej  niż  po  trzy 
izotopy  trwałe.  Grupa  40  pierwiastków  nieparzystych 
składa  się  z 24  pierwiastków  mających  tylko  jeden 
izotop  trwały  i z 16  pierwiastków  mających  po  dwa 
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Tabela  1.  Znane  pierwiastki  i ich  izotopy 


Liczba 

pier- 

wiast- 

ków 

nukli- 

dów 

Trwałe  (od  Z ~ 1 do  83,  bez  43  i 61) 
Promieniotwórcze  występujące  na  Ziemi 

81 

272 

a)  Z < 83  i A < 206 

b)  Z > 83  i A $5  206  (od  Z — 84  (Po) 

— 

13* 

do  Z = 92  (U)  i Z = 94  (Pu)) 
Promieniotwórcze  obserwowane  poza  Ziemią 

10 

46 

(Z  = 43  (Tc),  61  (Pm),  95  (Am)  i 96  (Cm)) 
Łącznie  występujące  w przyrodzie  (trwałe 

4 

4*« 

i promieniotwórcze) 

Sztuczne  wytworzone  (wyłącznie  promienio- 

95 

335 

twórcze) — nuklidy  wg  zestawienia  z 1968  r. 

12 

1192 

Ogółem 

107 

1527 

* Należą  tu  nuklidy  długożyjące,  które  do  dziś  przetrwały 
w skorupie  ziemskiej,  np.  lJgNd  o okresie  połowicznego  zaniku 
ok.  2,1  10*4  lat,  jak  również  krótkożyiący  tryt  JH  (Txti  — 12,346 
łat)  i radiowęgiel  *iC  (TUJ.  = 5730  lat),  wytwarzane  stale  w gór- 
nych warstwach  atmosfery  przez  promieniowanie  kosmiczne. 

**  Podajemy  minimalną  liczbę  nuklidów,  ponieważ  nie  jest  do- 
kładnie znany  skład  izotopowy  czterech  wymienionych  pierwia- 
stków w warunkach  pozaziemskich. 


izotopy  trwałe.  Żaden  pierwiastek  nieparzysty  nie  ma 
większej  liczby  trwałych  izotopów;  średnia  w tej 
grupie  wynosi  1,40  trwałego  izotopu  na  pierwia- 
stek. 

uprzywilejo-  Uprzywilejowanie  liczb  parzystych  staje  się  jeszcze 
wanie  liczb  bardziej  widoczne,  jeśli  grupę  272  trwałych  nuklidów 
parzy stych  podzielimy  na  cztery  podgrupy  zależnie  od  kom- 
binacji parzystej  lub  nieparzystej  liczby  protonów  Z 
z parzystą  lub  nieparzystą  liczbą  neutronów  N.  Jest 
aż  161  nuklidów  parzysto-parzystych  (tj.  o parzystych 
liczbach  Z i N),  55  parzysto-nieparzystych,  50  nie- 
parzysto-parzystych  i zaledwie  6 nieparzysto-nie- 
parzystych.  Znaczną  przewagę  nuklidów  parzysto- 
parzystych  (praw  ie  60%)  powiązać  można  ze  znanym 
z fizyki  jądrowej  faktem:  nąjtrwalej  związane  są 
jądra  o parzystej  liczbie  protonów  i parzystej  liczbie 
neutronów,  słabiej  — jądra,  w których  tylko  jedna 
z tych  liczb  jest  parzysta,  najmniejszą  wreszcie  trwa- 
łością odznaczają  się  jądra  nieparzysto-nieparzyste. 


Skład  pierwiastkowy  i izotopowy 
obiektów  weWszechświecie 

Najstarszym  działem  kosmochemii  jest  geochemia; 
obecnie  znamy  dokładnie  średni  skład  chemiczny 
warstw  powierzchniowych  Ziemi.  Analiza  widmowa 
dostarczyła  danych  o obecności  różnych  pierwiastków 
chemicznych  w atmosferach  gwiazd  i galaktyk.  De- 
tektory promieniowania  jonizującego  umieszczane 
na  pokładach  rakiet  i sztucznych  satelitów  umożliwiają 
badanie  składu  chemicznego  i izotopowego  pierwot- 
nego promieniowania  kosmicznego  i wiatru  słonecz- 
nego. 

Z astrofizyki  obserwacyjnej  wiadomo,  że  wszędzie, 
gdzie  materia  występuje  w postaci  atomów,  są  to 
atomy  pierwiastków,  które  znamy  z laboratorium  na 
Ziemi.  (Zastrzeżenie  „w  postaci  atomów”  jest  ko- 
nieczne z uwagi  na  możliwość  występowania  tak  nie- 
zwykłych form  materii,  jak  materia  nad  gęsta  (ją- 
drowa) w gwiazdach  neutronowych  (->  Czarne  dziury 
i zapadanie  grawitacyjne,  a także  czarne  dziury 
— produkt  końcowy  zapadania  grawitacyjnego). 
Wszechświat  jest  właściwie  jednolity,  a zarazem  nie- 
zwykle różnorodny.  Nie  ma  dwóch  gwiazd  o identycz- 
nych widmach.  Przy  wszystkich  jednak  różnicach 
prawidło-  składu  chemicznego  między  indywidualnymi  ciałami 
wości  niebieskimi  udało  się  znaleźć  pewne  wspólne  dla  nich 
rozpowsze-  prawidłowości  rozpowszechnienia  pierwiastków.  Są 
chniema  one  widoczne  dopiero  po  nagromadzeniu  dużego 
pierwiastków  materiału  obserwacyjnego  oraz  po  zrozumieniu  me- 


chanizmów fizycznych  związanych  z powstaniem 
widm  liniowych  w atmosferach  gwiazd.  Występowanie 
linii  (kształt  i natężenie)  widmowych  określonych 
pierwiastków  w obserwowanym  przez  nas  widmie 
gwiazdy  wywołane  jest  w pierwszym  rzędzie  takimi 
czynnikami  jak  temperatura  i ciśnienie  w obszarze, 
z którego  promieniowanie  to  pochodzi.  Stwierdzenie 
linii  widmowych  określonego  pierwiastka  nie  wy- 
starcza do  oceny  ilości  jego  atomów  w atmosferze 
gwiazdy,  ze  stosunku  zaś  natężeń  linii  w widmach 
dwóch  gwiazd  o odmiennych  temperaturach  czy  też 
różniących  się  ciśnieniem  na  ich  powierzchni  (np. 
biały  karzeł  i olbrzym)  nie  można  bezpośrednio  wnios- 
kować o stosunku  rozpowszechnienia  tegoż  pierwia- 
stka w obu  rozpatrywanych  atmosferach. 

Najlepiej  znamy  skład  pierwiastkowy  Układu  Sło-  skład  ^ 
necznego : dotyczy  to  zwłaszcza  pierwiastków  o małym  pierwiast- 
rozpowszechnieniu,  których  linii  w odległych  gwiaz-  kowy 
dach  nie  da  się  zauważyć.  Skład  pierwiastkowy  ma-  Układu 
terii  Układu  Słonecznego  zwykło  się  uważać  za  ty-  Słonecznego 
powy  dla  materii  kosmicznej  z tej  części  Wszechświa- 
ta, która  dostępna  jest  obserwacjom.  Nasza  obecna 
wiedza  kosmochemiczna  o składzie  izotopowym  pier- 
wiastków chemicznych  w przeważającej  części  jest 
oparta  na  wyznaczeniu  składu  izotopowego  tychże 
pierwiastków  w materii  ziemskiej  — metodami  spek- 
troskopii masowej.  Skład  izotopowy  próbek  materii 
meteorytowej,  księżycowej,  a w przyszłości  chyba 
i próbek  pobranych  z różnych  planet  Układu  Sło- 
necznego nieznacznie  tylko  różni  się  od  składu  izoto- 
powego próbek  ziemskich.  Wreszcie  skład  izotopowy 
pierwiastków  chemicznych  na  Ziemi  nie  różni  się 
w sposób  istotny  od  składu  tychże  pierwiastków 
w atmosferach  Słońca  i większości  gwiazd,  a także 
w obłokach  gazowo-pyłowych  — przynajmniej 
w tych  nielicznych  wypadkach,  w których  analiza 
widmowa  w optycznym,  a nawet  radiowym  zakre- 
sie długości  fal,  pozwala  na  oznaczenie  takiego 
składu. 

Analiza  widm  atomowych  jedynie  w nielicznych 
wypadkach,  np.  dla  pierwiastków  najlżejszych,  ma- 
jących po  dwa  izotopy  trwałe  znacznie  różniące  się 
masą  (wodór  lub  hel),  pozwala  ustalić  skład  izoto- 
powy. Przesunięcie  izotopowe  odpowiednich  linii 
widmowych  cięższej  odmiany  takiego  pierwiastka 
w stosunku  do  lżejszej  można  jednak  zaobserwować 
w widmie  gwiazdy  tylko  wtedy,  gdy  zawartości  obu 
odmian  w atmosferze  gwiazdy  niewiele  się  różnią. 

Weźmy  np.  hel;  jeśli  skład  izotopowy  tego  pierwia- 
stka w gwiazdach  nie  odbiega  znacznie  od  składu 
jego  na  Ziemi,  tzn.  na  milion  atomów  4He  przypada 
mniej  więcej  jeden  atom  3He,  nie  ma  praktycznie 
możliwości  wykrycia  tak  znikomych  ilości  lekkiego 
izotopu  helu  3He  w gwiazdach.  Tak  też  jest  istotnie  / 
dla  większości  gwiazd.  Możliwość  obserwacji  3He 
istnieje  natomiast  dla  pewnych  gwiazd  z anomaliami 
składu,  jak  gwiazda  magnetyczna  21  Aąuilae,  którą 
charakteryzuje  względny  nadmiar  (w  porównaniu 
z helem  ziemskim  i słonecznym)  lekkiego  izotopu 
helu  3He. 

Oprócz  pierwiastków  najlżejszych,  mierzalne  war- 
tości przesunięć  izotopowych  w widmach  atomowych 
wykazują  także  pierwiastki  ciężkie,  poczynając  od 
lantanowców.  W środkowej  natomiast  części  układu 
okresowego,  dla  pierwiastków  między  wapniem  a lan- 
tanowcami  (20  < Z 56),  całkowite  przesunięcie 
izotopowe  (stanowiące  wypadkową  zwykłego  i szcze- 
gólnego efektu  masowego  oraz  efektu  objętościo- 
wego, dających  wkłady  o różnych  znakach)  praktycz- 
nie równe  jest  zeru.  Składu  izotopowego  powyższych 
pierwiastków  nie  dałoby  się  więc  wyznaczyć  na  grun- 
cie analizy  widmowej  nawet  wtedy,  gdyby  izotopy 
jakiegoś  pierwiastka  odznaczały  się  zbliżonymi  war- 
tościami rozpowszechnienia. 

Nie  ma  powodu  aby  przypuszczać,  iż  materia  ziem- 
ska odznacza  się  jakimś  specyficznym  składem  izoto- 
powym. Przyjęcie,  że  Ziemia  nie  znajduje  się  w cen-  zasada 
tralnej,  specjalnie  wyróżnionej  pozycji,  nazywa  się  Kopernika 
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w kosmologii  zasadą  Kopernika.  Tylko  mały  krok 
dzieli  tę  powszechnie  zaakceptowaną  zasadę  od  stwier- 
dzenia, że  pozycja  i skład  chemiczny  Układu  Sio- 
necznego  są  typowe.  Skład  izotopowy  niektórych 
pierwiastków  w skorupie  ziemskiej  z umieszczonej 
niżej  tabeli  2 uważać  więc  można,  zgodnie  z ową 
zasadą,  za  typowy  dla  pierwiastków  w materii  kos- 
micznej. 


Tabela  2.  Skład  izotopowy  niektórych  pierwiastków 
w skorupie  ziemskiej 


Pierwiastek 

T Zawartość  poszczególnych  izotopów  (w%) 

Pierwiastki  lekkie 
Wodór  ,H 

jH.-jH  = 99,985:0,015 

Hel  ,Hc 

He:4He  - 0,00013:99,99987 

Węgiel  6C 

’6’C:”C  = 98,893:1,107 

Krzem  14Si 

”Si:£Si:^Si  = 92,21:4,70:3,09 

Siarka  J#S 

”S:;jS:;jS:SS  = 95,0:0.76:4,22:0,014 

Pierwiastki  ciężkie 
Tellur  „Te 

1 *2^c : ^Te : l|*Te  :”*Tc : ł^Te  :ł££Te : 

: 1?Te  = 0,089:2,46:0,87:4,61 :6,99:18,71 : 
:31, 79:34, 48 

Antymon  6,Sb 

MSb:ł£Sb  - 57,25:42,75 

Dysproz  MDy 

^Dy  :^Dy  :ł"Dy  :««Dy  :’«Dy  :’«Dy  : 

- 0,052:0,090:2,29:18,88:25,53: 
:24,97,:28,18 

eoHg 

"oH8^jHg:-Hg:2-Hg:*j;Hg:2;jHg: 
:HoHg  = 0,146:10,02:16,84:23,13:13,22: 

29,80:6,85 

skład 
izotopowy 
C,  O,  S,  H w 
materii 
międzygwia- 
zdowej 


Istnieją  pewne  grupy  obiektów  kosmicznych, 
w których  skład  pierwiastkowy  i skład  izotopowy 
pierwiastków  różnią  się  istotnie  od  odpowiednich 
wartości  dla  materii  ziemskiej;  różnice  te  można  wy- 
jaśnić na  gruncie  teorii  ewolucji  gwiazd  i związanych 
z nią  procesów  nukleosyntezy  pierwiastków  chemicz- 
nych. Nie  wnikając  głębiej  w to  zagadnienie  podajmy 
dla  przykładu  dane  odnoszące  się  do  składu  izotopo- 
wego rtęci  w dwu  gwiazdach  osobliwych  typu  A. 
Z analizy  widma  gwiazdy  o numerze  katalogowym 
HR  5883  wynika,  że  obecne  są  w niej  tylko  dwa  naj- 
cięższe izotopy  rtęci:  202Hg  (3%)  i 20«Hg  (97%).  Pięć 
lżejszych  izotopów  rtęci,  stanowiących  ilościowo 
prawie  2/s  rtęci  ziemskiej  (patrz  najniższy  wiersz  w ta- 
beli 2),  w gwieździe  owej  praktycznie  całkiem  nie 
ma.  A oto  oceniony  przez  G.W.  Prestona  (1971  r.) 
skład  izotopowy  rtęci  w innej  gwieździe  osobliwej 

o numerze  katalogowym  HR  4072:  200Hg  i 201Hg 

łącznie  ok.  4%,  202Hg  — 37%,  2°<Hg  — 59%.  I tu 
praktycznie  nie  ma  wcale  trzech  najlżejszych  izoto- 
pów rtęci. 

W ostatnim  dziesięcioleciu  wyznaczono  metodami 
radioastronomii  skład  izotopowy  wielu  pierwiastków 
dość  rozpowszechnionych  i wchodzących  w skład  ob- 
serwowanych molekuł.  Przesunięcie  izotopowe  w wid- 
mach molekularnych  (w  zakresie  radiowym  i mikro- 
falowym) jest  czasami  znacznie  łatwiej  stwierdzić  niż 
w widmach  atomowych.  Szczególnie  dobrze  nadają 
się  do  tego  celu  proste  molekuły  dwuatomowe  i rod- 
niki (jak  OH,  CO,  CS).  Tą  drogą  udało  się  oznaczyć 
skład  izotopowy  węgla,  tlenu,  siarki  i wodoru  w obło- 
kach  materii  międzygwiazdowej;  skład  ten  niewiele 
różni  się  od  składu  ziemskiego.  W analogiczny  spo- 
sób wykorzystuje  się  pasma  molekularne  w widmach 
chłodniejszych  gwiazd  (typy  widmowe  G8  i później- 
sze), w których  oznaczać  można  skład  izotopowy 
węgla  lub  tlenu. 

Skład  izotopowy  poszczególnych  pierwiastków  w 
materii  ziemskiej  niewiele  różni  się  od  składu  materii 
Układu  Słonecznego,  natomiast  nie  można  tego  po- 
wiedzieć o składzie  pierwiastkowym.  Rozkład  tem- 
peratur i ciśnień  w obłoku  gazowo-pyłowym,  z które- 
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go  powstały  (drogą  kondensacji,  nukleacji  i wzrostu 
przez  akrecję)  ciała  Układu  Słonecznego  nie  był  rów- 
nomierny. Spadek  temperatur  i ciśnień  w miarę  od- 
dalenia się  od  ciała  centralnego  wywołał  zróżnicowa- 
nie materii  mgławicy  pierwotnej,  spowodowane  różną 
lotnością  pierwiastków,  co  szczególnie  wpłynęło  na 
lokalne  przebiegi  procesu  kondensacji.  W wyniku 
działania  tych  czynników  planety  bliższe  Słońca 
(planety  grupy  ziemskiej)  — Merkury,  Wenus,  Zie- 
mia i Mars  --  są  ubogie  w pierwiastki  najbardziej 
lotne  — - wodór  i hel,  które  dominują  w materii  Jo- 
wisza, bardziej  oddalonego  od  Słońca.  Nierównomier- 
nosć  rozpowszechnienia  pierwiastków  w Układzie 
Słonecznym  odnosi  się  nie  tylko  do  pierwiastków 

0 rożnej  lotności,  ale  i frakcjonowania  metali  i krze- 
mianów, które  m.in.  doprowadziło  do  utworzenia 
jąder  metalicznych  planet  grupy  ziemskiej. 

Uniwersalne  krzywe  rozpowszechnienia 

1 pewne  ogólne  prawidłowości 

Od  kilkudziesięciu  lat  trwają  próby  uogólnienia  da- 
nych o rozpowszechnieniu  pierwiastków  i ich  izoto- 
pów w materii  ziemskiej,  meteorytowej,  słonecznej 
atmosferach  gwiazd  i promieniowaniu  kosmicznym. 

Informacje  uzyskane  z różnych  źródeł  okazały  się 
dość  zbliżone  i pozwoliły  na  ustalenie  średniego  roz- 
powszechnienia pierwiastków  (i  ich  izotopów)  w ma- 
terii naszej  Galaktyki.  Największa  liczba  najdokład- 
niejszych danych  odnosi  się  do  materii  Układu  Sło- 
necznego, stąd  też  otrzymane  krzywe  średniego  roz- 
powszechnienia: pierwiastków  (rys.  2)  i izobarów 
(rys.  3)  nazywa  się  niekiedy  krzywymi  rozpowszech- 
nienia dla  Układu  Słonecznego,  choć  stosowana  jest 
i ogólna  nazwa  uniwersalnych  krzywych  rozpowszech- 
nienia. Tę  drugą  nazwę  będziemy  dalej  stosować  w ce- 
lu podkreślenia  zasadniczej  różnicy  między  tymi 
uśrednionymi  krzywymi  a konkretną  krzywą  roz- 
powszechnienia odnoszącą  się  do  określonego  ciała 
niebieskiego. 

Obie  krzywe  empiryczne  przedstawione  są  przy  rozpowsze- 
użyciu  skali  logarytmicznej  dla  osi  rzędnych,  różnica  chnienie  N(X) 
bowiem  między  najwyższą  i najniższą  wartością  roz-  pierwiastka 
powszechnienia  sięga  niemal  dwunastu  rzędów  wiel- 
kości. Rozpowszechnieniem  N(X)  jakiegoś  pier- 
wiastka X nazywa  się  liczbę  atomów  tego  pierwiastka 
przypadającą  na  milion  atomów  krzemu  w danym 
ośrodku.  Tak  więc  u podstaw  skali  rozpowszechnienia 


o 10  20  30 

liczba  porządkowa  Z 

Rys.  2.  Krzywa  rozpowszechnienia  pierwiastków  chemicznych 
wg  Camerona  (1973);  w górze  na  prawo  — schematyczny  kontur 
krzywej  z zaznaczeniem  lokalnych  maksimów  i minimum  Li-Be-B 
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tkwi  umowne  przyjęcie  W (Si)  =10*;  dogodność  wy- 
boru takiej  podstawy  skali  uzasadnia  fakt,  że  roz- 
powszechnienie większości  pierwiastków  ciężkich 
wyraża  się  liczbami  rzędu  jedności. 

Podsumujmy  kilka  charakterystycznych  prawidło- 
wości rozpowszechnienia  pierwiastków  chemicznych. 
Pierwsze  trzy  spośród  nich  odczytać  można  łatwo 

Z 7)S  Pierwiastkiem  najbardziej  rozpowszechnionym 
jest  wodór  (mniej  więcej  90%  wszystkich  atomów). 
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6)  Wśród  jąder  lekkich  szczególnie  dużym  roz-  jądra 
powszechnieniem  odznaczają  się  te  jądra,  których  o A : 4 
liczba  masowa  A jest  wielokrotnością  czwórki  (np. 

*He,  12C,  xeO,  20Ne,  24Mg,  28Si,  32S).  Ostatnia  grupa 
prawidłowości  empirycznych  jest  związana  ze  składem 
izotopowym  pierwiastków  mających  więcej  niż  jeden 
izotop  trwały.  Wymienimy  tu  jedynie  dwie  najważ- 
niejsze prawidłowości. 

7)  Wśród  pierwiastków  lekkich  (pierwiastki  o Z < pierwiastki 
< 30,  tj.  od  wodoru  do  cynku  włącznie)  najbardziej  o Z ^ 30 
rozpowszechnione  są  izotopy  lżejsze;  wyjątkami  są 

tu  hel  He  (Z  = 2),  lit  Li  (Z  = 3),  bor  B (Z  = 5), 
argon  Ar  (Z  = 18)  i wanad  V (Z  = 23). 

8)  Pierwiastki  ciężkie  (o  liczbie  atomowej  Z > 30,  pierwiastki 
tj.  2/3  układu  okresowego,  nie  licząc  odległych  o Z > 30 
transuranowców,  w przyrodzie  nie  obserwowanych) 
charakteryzuje  przewaga  izotopów  cięższych,  przy 

czym  przewaga  ta  jest  tym  wyraźniejsza,  im  więcej 
trwałych  izotopów  ma  dany  pierwiastek.  Dla  pier- 
wiastków o dwóch  izotopach  trwałych  możliwe  są 
niewielkie  odstępstwa  od  tej  reguły  (patrz  np.  anty- 
mon Sb  w tabeli  2). 

Skład  izotopowy  przykładowo  wybranych  pier- 
wiastków w tabeli  2 ilustruje  dość  dobrze  dwie  ostatnie 
prawidłowości.  Można  jeszcze  wymienić  jedną  pra- 
widłowość empiryczną,  mniej  wyraziście  uwypukloną 
(istnieje  bowiem  aż  6 wyjątków). 

9)  Najlżejszy  izotop  parzystych  pierwiastków  cięż- 
kich jest  z reguły  izotopem  o najniższym  rozpowszech- 
nieniu, a zawartość  jego  w składzie  danego  pierw  iastka 
jest  zwykle  rzędu  0,1%,  niekiedy  tylko  dochodzi  do 
ok.  2%.  Wyjątkami  są  tu:  german  Ge  (Z  = 32),  cyr- 
kon Zr  (Z  = 40),  molibden  Mo  (Z  = 42),  ruten  Ru 
(Z  = 44),  neodym  Nd  (Z  = 60)  i samar  Sm  (Z  = 62). 


liczba  masowa  A 

Rys.  3.  Krzywa  rozpowszechnienia  izobarów  wg  Camerona  (1973) 

Hol  i Drugie  miejsce  zajmuje  hel  (o  rząd  mniej  niż  wodoru), 
wodór  Reszta  pierwiastków  stanowi  łącznie  mniej  niż  1% 
całkowitej  liczby  atomów,  a prawie  90%  tej  reszty,  to 
atomy  czterech  lekkich  pierwiastków:  węgla  C (Z  = 
= 6),  tlenu  O (Z  = 8),  azotu  N (Z  = 7)  i neonu  Ne 
(Z  = 10). 

pierwiastki  2)  Począwszy  od  węgla,  pierwiastki  parzyste  mają 
parzyste  na  ogół  większe  rozpowszechnienie  niż  sąsiadujące 
z nimi  pierwiastki  nieparzyste.  Różnica  ta  stopniowo 
maleje  ze  wzrostem  liczby  atomowej  Z. 

3)  Rozpowszechnienie  pierwiastków  (jeśli  pominąć 
wspomniany  przed  chwilą  efekt  parzystości  Z)  maleje 
na  ogół  regularnie  ze  wzrostem  liczby  atomowej  Z. 

4)  Lokalne  nieregularności  na  krzywej  rozpowszech- 
nienia pojawiają  się  w kilku  miejscach:  a)  Charakte- 
rystyczna nieciągłość  występuje  przy  gwałtownym 
spadku  rozpowszechnienia  (o  ok.  7 rzędów  wielkości) 
dla  trzech  pierwiastków  lekkich:  litu,  berylu  i boru. 
Po  przejściu  przez  tę  nieciągłość  krzywa  rozpowszech- 
nienia biegnie  tak,  jak  gdyby  była  przedłużeniem 
odcinka  łączącego  wartości  rozpowszechnienia  dla 
wodoru  i helu.  b)  Dalej  na  opadającej  krzywej  roz- 

maksima  powszechnienia  pojawiają  się  maksima  lokalne: 
krzywej  pewne  pierwiastki  czy  też  ich  grupy  odznaczają  się 
rozpow-  rozpowszechnieniem  znacznie  większym  niż  sąsiednie, 
szechniertia  Pierwsze  z tych  maksimów  oznaczone  symbolem  Fe 
związane  jest  z grupą  żelazowców.  Występowan  ie  jego 
w iąże  się  ze  znanym  z fizyki  jądrowej  faktem,  iż  jądra 
pierwiastków  z otoczenia  żelaza  mają  największą 
wartość  energii  wiązania  przypadającą  na  pojedynczy 
nukleon,  są  więc  najtrwalsze.  Dalsze  maksima  lokal- 
ne wiążą  się  z magicznymi  liczbami  neutronów  i od- 
czytać je  można  wyraźniej  z krzywej  rozpowszechnie- 
nia izobarów,  która  zawiera  więcej  szczegółów  niż 
krzywa  rozpowszechniania  pierwiastków, 
izobary  o Dalsze  prawidłowości  empiryczne  odczytać  można 
parzystym  A z krzywej  rozpowszechnienia  izobarów. 

5)  Izobary  o parzystym  A są  na  ogół  bardziej  roz- 
powszechnione niż  sąsiednie  izobary  o nieparzystym 
A (analogicznie  jak  w punkcie  2). 


Prawidłowości  rozpowszechnienia 
nuklidów  a fizyka  jądrowa 

Informacje  podane  w poprzednim  punkcie  oraz  brak  brak 
jakiejkolwiek  okresowości  w uniwersalnej  krzywej  okresowych 
rozpowszechnienia  z rys.  2 (a  więc  brak  związku  mię-  prawidło- 
dzy  rozpowszechnieniem  pierwiastków  chemicznych  wości 
we  Wszechświecie  a ich  właściwościami  chemicznymi) 
wskazują,  że  rozpowszechnienia  pierwiastków  niepo- 
dobna powiązać  w sposób  przyczynowy  z chemią.  Już 
od  czasów  Mendelejewa  usiłowano  bezskutecznie 
znaleźć  okresowe  prawidłowości  w rozpowszechnie- 
niu pierwiastków  chemicznych.  Pierwiastki  o tak  po- 
dobnych właściwościach  chemicznych  jak  metale  alka- 
liczne różnią  się  dość  istotnie  rozpowszechnieniem 
(stosunek  rozpowszechnienia  w skorupie  ziemskiej 
jest:  Li : Na : K : Rb : Cs  = 470:125  000:67  100:137  : 

:3,8),  natomiast  pierwiastki  o odmiennych  właści- 
wościach chemicznych  mają  zbliżone  wartości  roz- 
powszechnienia (np.  litu  jest  mniej  więcej  tyle  co 
chloru).  Nie  dziwmy  się,  że  tak  jest.  Wszak  chemia  nie 
opisuje  powstania  pierwiastków  chemicznych,  jej 
przedmiotem  badań  są  właściwości  tych  pierwiastków 
oraz  powstawanie  i właściwości  ich  związków.  Po- 
wstanie pierwiastków  — to  już  właściwie  metache- 
mia. 

Natomiast  fizyka  jądrowa,  dziedzina  zajmująca 
się  przemianami  promieniotwórczymi  jednych  pier- 
wiastków w inne  oraz  reakcjami  jądrowymi  prowadzą- 
cymi do  przekształcania  się  jąder  atomowych,  wska- 
zuje nam  od  ponad  pół  wieku  na  mechanizm  tworze- 
nia się  pierwiastków  chemicznych.  To,  co  realizujemy 
dziś  w laboratoriach  jądrowych,  co  jest  produktem 
ubocznym  pracy  reaktora  jądrowego  i eksplozji  bomb 
atomowych  i wodorowych,  może  równie  dobrze  prze- 
biegać w warunkach  naturalnych,  w przyrodzie. 

Reakcje  jądrowe  zachodzą  bowiem  we  wnętrzach 
gwiazd,  dostarczając  im  nieustannie  energii,  a jedno- 
cześnie zmienia  się  skład  chemiczny  materii  we  wnę- 
trzu gwiazdy,  tworzą  się  nowe  pierwiastki. 

Krzywe  z rys.  2 i 3 są  pewnym  średnim  wzorcem, 
z którym  porównywać  można  rozpowszechnienie 
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pierwiastków  i izobarów  w poszczególnych  obiektach. 
Występujące  indywidualne  odchylenia  można  wytłu- 
maczyć odwołując  się  do  przebiegających  w danych 
obiektach  procesów  jądrowych  i do  ewolucji  tych 
obiektów.  Uniwersalne  krzywe  rozpowszechnienia 

nazywać  można  bowiem  krzywymi  historycznymi 

w tym  znaczeniu,  że  zapisany  jest  w nich  wynik  pro- 
cesów ewolucji  materii  w naszej  Galaktyce.  Można 
sobie  wyobrazić,  iż  analogiczne  krzywe  dla  materii 
z jakiegoś  odległego,  na  razie  bezpośrednio  naszemu 
wglądowi  niedostępnego  zakątka  Wszechświata  prze- 
biegać będą  nieco  odmiennie.  Jeśli  jednak  przyjąć,  że 
wszędzie  obowiązują  te  same  prawa  fizyki  jądrowej 
(co  chyba  me  budzi  większych  wątpliwości),  to  różnice 
przebiegu  mogą  być  tylko  niewielkie  (szybszy  lub 
wolniejszy  spadek,  wyższe  lub  niższe  maksima), 
a maksima  i minima  lokalne  wystąpić  musza  w tych 
samych  miejscach. 


Kosmochemia  molekularna 

Do  niedawna  niewiele  wiedziano  o występowaniu 
połączeń  chemicznych  w kosmosie.  Badania  labora- 
toryjne nad  składem  molekularnym  obejmowały  me- 
teoryty jako  jedyne  próbki  materii  pochodzenia  poza- 
ziemskiego. W atmosferach  chłodniejszych  gwiazd 
stwierdzono  obecność  prostych  cząsteczek  i rodników 
kilkoatomowych,  zdolnych  oprzeć  się  rozerwaniu 
w wysokiej  temperaturze;  były  to  tlenki  metali  oraz 
połączenia  zawierające  tak  rozpowszechnione  pier- 
wiastki  jak  wodór  czy  węgiel  (np.  C2,  CN,  CH,  A1H 
itp.).  Na  podstawie  widm  optycznych  gwiazd  stwier- 
dzono juz  przed  kilkudziesięciu  laty,  że  w przestrzeni 
Wstępują  połączenia  CH,  CH+ 
i CN.  W 1963  r.  wykryto  obecność  rocfrika  hydroksy- 
lowego OH  w przestrzeni  międzygwiazdowej.  Wielka 
seria  odkryć,  które  doprowadziły  do  gruntownego 
przekształcenia  naszych  wyobrażeń  o chemii  prze- 
strzeni międzygwiazdowej,  zaczęła  się  w 1968  r od- 
kryciem amoniaku  i wody  w obłokach  materii  ga- 
zowo-pyłowej.  Odtąd,  głównie  dzięki  wykorzystaniu 
radioteleskopów  do  obserwacji  widmowych  linii  emi- 
syjnych  i absorpcyjnych  pochodzących  od  molekuł, 
rodników  i jonów,  nieustannie  wzrasta  liczba  odkry- 
wanych  połączeń.  Krótkie  ich  zestawienie  z początku 
J977  r.  zawiera  rys.  4.  Łatwo  dostrzec,  iż  większość 
połączeń  na  mm  występujących  zaliczyć  można  do 
połączeń  organicznych.  Nie  ma  w tvm  nic  dziwnego 


jesh  spojrzeć  na  krzywe  rozpowszechnienia  z rys  2 
Obfitość  występowania  w przestrzeni  kosmicznej  za- 
sadniczych substratów  potrzebnych  do  tworzenia 
złożonych  molekuł  nie  może  się  przecież  różnić  w spo- 
sób istotny  od  wartości  rozpowszechnień  z krzywej 
uniwersalnej.  Najbardziej  rozpowszechnionymi  pier- 
wiastkami są  kolejno:  wodór,  hel,  tlen  i węgiel  (nie- 
ktorzy  zmieniają  kolejność  tych  dwóch  pierwiast- 
ków), azot  i neon.  Wszystkie  wymienione  pierwiastki, 
z wyjątkiem  gazów  szlachetnych,  występują  w odkry- 
tych molekułach.  W dalszej  kolejności  według  roz- 
powszechnienia wymienić  należy:  magnez,  krzem, 
zelazo,  siarkę,  glin  i wapń.  Wśród  połączeń  chemicz- 
nych, odkrytych  w przestrzeni  międzygwiazdowej, 
występują  proste  molekuły  zawierające  w swym  skła- 
dzie atom  krzemu  lub  siarki.  Nieobecność  połączeń 
zawierających  atomy  metali  (magnezu,  żelaza,  glinu 
1 'yaPnia).  Wdaje  się  tylko  pozorna,  spowodowana 
wchodzeniem  tych  pierwiastków  do  składowej  pyło- 
wej ośrodka  międzygwiazdowego,  do  której  badania 
metody  radioastronomii  niewiele  się  przydają. 
Wszystkie  natomiast  zaobserwowane  w przestrzeni 
międzygwiazdowej  połączenia  chemiczne  wchodzą  do 
składowej  gazowej. 

Obecnie  znamy  już  dwie  molekuły  dziewięcioato- 
mowe.  Przypuszcza  się,  że  jest  tylko  kwestią  czasu 
i konstrukcji  odpowiednio  czułej  aparatury,  by  zaob- 
serwować linie  radiowe  tak  złożonych  połączeń  orga- 
nicznych, jak  np.  aminokwasy.  Przemawiają  za  tym 
wypadki  znalezienia  przeróżnych  aminokwasów 
w materii  meteorytowej.  Do  niedawna  podejrzewano, 
ze  próbki  meteorytowe  były  zanieczyszczone  sub- 
stancjami organicznymi  pochodzenia  ziemskiego. 
Zastrzeżenia  te  rozwiało  chromatograficzne  rozdzie- 
lenie form  lewo-  i prawoskrętnych  poszczególnych 
aminokwasów.  Okazało  się,  że  stosunek  ich  zbliżony 
jest  do  jedności,  co  przemawia  na  rzecz  syntezy  a bio- 
gennej (me  przebiegającej  w organizmach  żywych). 
Powstawanie  złożonych  substancji  w ośrodku  między- 
gwiazdowym  wyjaśnić  można  w sposób  naturalny 
jako  rezultat  reakcji  chemicznych  typu  jon-molekuła 
między  produktami  oddziaływania  wysokoenerge- 
tycznego promieniowania  kosmicznego  z materią 
międzygwiazdową,  mającą  skład  pierwiastkowy  zgod- 
ny z krzywą  uniwersalną.  W lokalnych  zagęszczeniach 
owej  materii,  zawierających  masy  rzędu  kilku  do  kil- 
kuset mas  słonecznych,  przebiega  ciąg  reakcji  znanych 
z chemii  radiacyjnej;  nieustannie  tworzą  się  i ulegają 
zniszczeniu  złożone  molekuły  i rodniki.  Przez  dzie- 
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wodór  molekularny  H2 
jon  NgH+amoniak  NHs 


metylidyna  CH 
jon  metylidynowy  CH* 
etynai  CCH 
acetylen  Q?Hj? 
metyloacetyfen  HsCCCH 


cyjan  CN 

cyjanowodór  HCN 
izocyjanowcdór  HNC 
cyjanamid  H-ŃCN' 
metyloamina  H3CNH2 
metylenoimina  H2CNH 


aceionitryl  H3CCN 
akrylonitryl  H2CCHCN 
cyjanoacetylen  HCCCN 
cyjanodwuacetylen  HCCnCN 
metylocyjanoacetylen  H3CCCCN 


kwas  izocyjanowy  KNCO 
formamid  NH2CHO 


tfenek  węgla  CO 
formy!  HCO 
jon  formylowy  HCO* 
aldehyd  mrówkowy  H2CO 
kwas  mrówkowy  HCOOH 
alkohol  metylowy  CH3OH 


aldehyd  octowy  CHICHO 
alkohol  etylowy  CgHsOH 
mrówczan  metylu  HCOOCH3 
eter  dwumetylowy  (CH^O 
karbom  etylen  H2CCO 


siarczek  węgla  ĆS 
tioaldehyd  mrówkowy  H2CS 
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połączenia 

organiczne 


połączenia 

9-atomowe 


sięciołecia  panowało  przekonanie  o niemożności  ut- 
worzenia się  złożonych  molekuł  w przestrzeni  ko- 
smicznej. Ledwo  molekuła  taka  zdążyłaby  powstać, 
już  jej  dalszemu  bytowi  miałoby  zagrażać  wszechobec- 
ne promieniowanie  ultrafioletowe.  Gdy  obecnie  od- 
krycia wielu  molekuł  zadały  kłam  temu  przekonaniu, 
sądzi  się,  iż  istotną  rolę  odgrywa  osłanianie  wew- 
nętrznej części  gęstego  obłoku  przez  warstwę  po- 
wierzchniową, pochłaniającą  promieniowanie  ultra- 
fioletowe. Jedynie  wysokoenergetyczne  promienio- 
wanie kosmiczne  wnikać  może  do  środka.  Dominu- 
jąca część  wodoru  w centralnych  obszarach  gęstych 
obłoków  występuje  zatem  jako  wodór  molekularny 
H2,  a nie  atomowy,  i dzięki  temu  wiele  reakcji  w fazie 
gazowej  staje  się  możliwymi.  Obłoki  gazowo-pyłowe 
uważane  są  za  gęste,  gdy  I cm3  zawiera  od  I04  do  107 
atomów.  Kilka  przybliżonych  stężeń  obserwowanych 
molekuł  w różnych  obłokach  zawiera  tabela  3. 

Obserwacje  radioastronomiczne  pozwalają  na 
otrzymanie  informacji  o składzie  molekularnym  ma- 
terii obłoków  gazowo-pyłowych  także  innych  galak- 
tyk. Łatwa  obserwowalność  przesunięć  izotopowych 
w zakresie  radiowym  umożliwia  wyznaczenie  sto- 
sunków izotopowych.  Tak  więc  np.  dla  węgla,  któ- 
ry ma  dwa  izotopy  trwałe,  stosunek  ich  rozpo- 
wszechnienia w materii  ziemskiej  wynosi : ,3C/l2C  = 

= 7m*  Górna  granica  tego  stosunku  dla  kilku  ra- 
dioźródeł wynosi : centrum  galaktyczne  ob- 
szar £ Oph  — Yso,  obłok  w Orionie  — 7»*  Podane 
wartości  nie  muszą  wskazywać  na  sprzeczność  z da- 
nymi ziemskimi;  są  to  przecież  tylko  górne  granice. 


Tabela  3.  Ocena  stężenia  niektórych  molekuł  w Galaktyce 


Molekuła  lub  rodnik 

Obszar 

Gęstość 
liczba 
molekuł 
w cm1 

Wodór  H, 

f obłoki 
J gęste 

10* 

| obłoki  bar- 
(dzo  gęste 

10* 

Hydroksyl: 

odmiana  pospolita  ,ftOH 

Sgr  A 

10* 

odmiana  rzadsza  ,8Oh 

Sgr  A 

10* 

Amoniak  NH, 

Sgr  A 

I0-* 

Tlenek  węgla  CO 

Sgr  A 

io-‘ 

Alkohol  metylowy  CH,OH 

Orion 

0,25 

które  dzięki  dalszym  pomiarom  mogą  ulec  obniżeniu, 
zbliżając  się  do  wartości  znanej  na  Ziemi. 

Zwróćmy  tu  uwagę  na  aspekt  biologiczny  odkryć 
radioastronomicznych.  W przestrzeni  kosmicznej 
powstają  samorzutnie  w dużych  ilościach  złożone 
substancje  chemiczne,  w tym  przynajmniej  niektóre 
spośród  związków  chemicznych  podstawowych  dla 
życia  organicznego.  Stanowi  to  poparcie  hipotezy 
powstawania  życia  w samorzutny  sposób  w różnych 
miejscach  Wszechświata. 

B.  Kuchowicz  Kosmochemia , Warszawa  1979;  B.  Kuchowicz 
Problemy  i osiągnięcia  astrofizyki  jądrowej . Część  /.  Rozpowszech- 
nienie nuklidów  i ich  kosmiczna  synteza , Post.  Fiz.  22,  495  (1971); 
A.  K.  Ławruchina,  G.  M.  Kolesow  Powstawanie  pierwiastków 
chemicznych  we  Wszechświecie,  Warszawa  1965;  Paul  W.  Mer- 
rill Chemia  Kosmosu  y Warszawa  1966. 


Reakcje  jądrowe  w gwiazdach 

Bronisław  Kuchowicz 


aspekt  Reakcje  jądrowe  w gwiazdach  mają  dwa  aspekty: 
astrofizyczny  astrofizyczny  i kosmochemiczny.  Wytwarzanie  energii 
i kosmoche-  w gwiazdach,  czego  przejawem  jest  ich  świecenie,  ma 
miczny  aspekt  astrofizyczny,  natomiast  przekształcanie  jed- 
nych pierwiastków  w drugie,  nukleosynteza,  ma 
aspekt  kosmochemiczny.  Powyższe  aspekty  są  od 
siebie  nieodłączne,  albowiem  reakcje  jądrowe  wy- 
twarzające energię  prowadzą  do  nieustannej  zmiany 
składu  chemicznego  materii  wnętrza  gwiazd;  w wy- 
niku tego  w wytwarzaniu  energii  odgrywają  rolę  coraz 
to  inne  reakcje  jądrowe,  zmienia  się  przy  tym  szyb- 
kość wytwarzania  energii,  zatem  i jasność  gwiazd. 
A więc  ewolucja  gwiazdy  jest  jednocześnie  ewolucją 
energetyczną  i ewolucją  składu  chemicznego  i jest 
uwarunkowana  reakcjami  jądrowymi  (-*■  Ewolucja 
gwiazd.  Reakcje  jądrowe.  Rozpady  jąder  atomo- 
wych). 


Warunki  realizacji 

reakcji  jądrowych  w gwiazdach 


Zależność  średniej  energii  wiązania  nukleonu  w ją- 
drze od  liczby  masowej  jądra  wykazuje  maksimum 
w otoczeniu  A — 6 0 (w  otoczeniu  jądra  żelaza). 
Możliwe  są  zatem  dwa  kierunki  przemian  jądrowych 
prowadzących  od  jąder  słabiej  do  jąder  silniej  zwią- 
zanych — reakcje  termojądrowe  (strzałka  A na  rys. 
1)  oraz  reakcje  rozszczepienia  jąder  ciężkich  (strzałka 
5).  Oba  rodzaje  przemian  jądrowych  zachodzą  z wy- 
reakcje  dzieleniem  energii  (reakcje  egzoenergetyczne),  oba 
termo-  udaje  się  realizować  w’  warunkach  ziemskich  (— ► Ener- 
jądrowe  gia  termojądrowa.  Energia  jądrowa).  Natomiast 
— źródło  w warunkach,  które  panują  w gwiazdach,  występować 
energii  mogą  tylko  reakcje  termojądrowe  i one  właśnie  są 
gwiazd  źródłem  energii  gwiazd. 


Najprostszym  i najważniejszym  rodzajem  reakcji 
jądrowych  są  reakcje  dwuciałowe,  czyli  takie,  w któ- 
rych dzięki  wzajemnemu  oddziaływaniu  dwóch  ją- 
der-substratów  powstają  jądra-produkty,  np.: 

iX+*',Y  -+łx+l'Y.  (1) 

* z z z' 

Obowiązują  przy  tym  zasady  zachowania  ładunku 
elektrycznego  (Z+Z'  = Z-fŹ')»  liczby  barionów 
(A+A'  = A A- A')  oraz  energii  i pędu.  W reakcjach 
egzoenergetycznych  suma  mas  spoczynkowych  sub- 
stratów (jąder  X i Y)  jest  większa  niż  produktów 
(jąder  X i Y).  Reakcje  takie  mogą  zatem  zachodzić 
przy  dowolnie  małej  energii  kinetycznej  cząstki  bom- 
bardującej (reakcje  nie  mają  progu  energetycznego). 
Mimo  to  — gdy  reagującymi  cząstkami  są  cząstki 
naładowane  (protony,  jądra),  wydajność  reakcji  przy 
bardzo  małej  energii  może  być  znikomo  mała  i zależy 
bardzo  wyraźnie  od  energii  cząstki  bombardującej, 
a to  z powodu  występowania  kulombowskiej  bariery 
potencjału,  utrudniającej  zbliżenie  się  cząstek  do 
siebie.  W fizyce  klasycznej  bariera  kulombowska  zu- 
pełnie nie  przepuszcza  cząstek  o energii  kinetycznej 
mniejszej  niż  wysokość  tej  bariery.  Natomiast  me* 


Rys.  1.  Schematyczny  przebieg  zależności  średniej  energii  wią- 
zania nukleonu  w jądrze  £"od  liczby  masowej  A.  Strzałki  wskazują 
dopuszczalne  kierunki  reakcji  egzoenergetycznych 


reakcje 

dwuciałowe 


985 


chanika  kwantowa  (tkwiąca  u podstaw  współczesnej 
fizyki  jądrowej)  przewiduje  zjawisko  tunelowe  — 
możliwość  przeniknięcia  cząstki  przez  barierę  po- 
kolumbow-  tencjału  nawet  wtedy,  gdy  energia  cząstki  jest  znacznie 
ska  bariera  niższa  od  wysokości  bariery.  Prawdopodobieństwo 
potencjału  pojedynczego  aktu  przeniknięcia  cząstki  przez  ba- 
rierę silnie  maleje  ze  wzrostem  ładunku  oraz  ze  spad- 
kiem energii  kinetycznej  lub  prędkości  tej  cząstki. 
Przy  prędkości  bliskiej  zera  przenikalność  bariery 
też  spada  do  zera. 

Choć  prawdopodobieństwo  przeniknięcia  przez 
barierę  — gdy  energia  cząstki  padającej  jest  znacznie 
mniejsza  niż  wysokość  bariery — jest  znikome,  nie 
jest  ono  nigdy  dokładnie  równe  zeru.  Jest  to  istotne 
dla  procesów  jądrowych  odbywających  się  wewnątrz 
gwiazd.  Wpływ  występowania  bariery  kulombowskiej 
na  czas  trwania  ewolucji  gwiazd  zilustrujemy  nastę- 
pującym przykładem.  Przeciętna  gwiazda  zawiera  co 
najmniej  1050  jąder  atomowych.  Jeśli  przyjąć  ostroż- 
nie, że  w obszarze  centralnym,  w których  zachodzi 
wydzielanie  energii,  znajduje  się  zaledwie  0,1%  masy 
gwiazdy,  a prawdopodobieństwo  zajścia  reakcji 
między  dwoma  jądrami  wynosi  zaledwie  10-ł0  na 
rok,  to  w ciągu  roku  zachodzi  1037  reakcji.  Przy  takim 
tempie  „spalania”  paliwo  jądrowe  może  wystarczyć 
na  miliardy  lat! 

Oczywiście  dla  cząstek  pozbawionych  ładunku,  jak 
neutrony  czy  kwanty  y,  bariera  potencjału  nie  wystę- 
puje. Neutrony  mogą  się  przedostawać  do  jądra 
atomowego  przy  dowolnie  małej  energii  prawie  z ta- 
kim samym  prawdopodobieństwem  jak  neutrony 
o wielkiej  energii.  Dlatego  wydajność  reakcji  wywoły- 
wanych przez  neutrony  przewyższa  o kilka  rzędów 
wielkości  wydajność  reakcji  wywoływanych  przez 
protony  lub  cząstki  a o tej  samej  małej  energii,  nie 
mówiąc  już  o reakcjach  powodowanych  przez  jądra 
cięższe,  które  mają  wyższą  barierę  kulombowską. 

Bariera  potencjału  jest  barierą  dwustronną,  działa 
nie  tylko  na  cząstki  wnikające  do  jądra,  ale  i na  te, 
które  usiłują  się  z niego  wydostać  (np.  w przemianie 
a).  Jądro  powstające  w wyniku  przyłączenia  neutronu 
do  jądra  początkowego  z większym  prawdopodobień- 
stwem pozbędzie  się  nadmiaru  energii  (równego 
energii  wiązania  owego  neutronu)  przez  wysłanie 
kwantu  y niż  cząstki  naładowanej.  A zatem  spośród 
reakcji  wywoływanych  przez  neutrony  największą 
rolę  w gwiazdach  odgrywają  reakcje  ( n , y).  Reakcje 
jądrowe  mogą  przebiegać  także  pod  działaniem  kwan- 
tów y o energii  dostatecznie  dużej  na  to,  by  z jądra 
atomowego  wybić  jeden  lub  kilka  składników.  Dwu- 
stronność  bariery  kulombowskiej  sprawia,  że  jeżeli 
energia  kwantu  y jest  mniejsza  od  wysokości  bariery, 
to  z największą  wydajnością  przebiega  reakcja  foto- 
jądrowa  typu  (y,  n ). 

przekroje  Przekroje  czynne  na  różne  reakcje  jądrowe  zależą 
czynne  od  rodzaju  i energii  cząstek  oddziałujących;  w reak- 
cjach endoenergetycznych  równe  są  zawsze  zeru, 
gdy  energia  jest  mniejsza  od  progowej.  Przekroje 


Rys.  2.  Schematyczny  przebieg  przekroju  czynnego  przy  małych 
energiach  dła  reakcji  egzoenergetycznych  wywołanych  przez  czą- 
stki naładowane 
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czynne  na  reakcje  bombardowania  jąder  atomowych 
cząstkami  naładowanymi,  nawet  o energii  kinetycznej 
większej  niż  wysokość  bariei^  kulombowskiej,  wyno- 
szą zazwyczaj  najwyżej  dziesiętne  części  barna  (1  b = 

= 10-28  m2).  Natomiast  największymi  przekrojami 
czynnymi,  niekiedy  o wartościach  rzędu  kilkunastu 
i więcej  barnów,  odznaczają  się  reakcje  wychwytu 
radiacyjnego  neutronów  powolnych  (w,  y).  Podczas 
gdy  przekroje  czynne  na  reakcje  między  cząstkami 
naładowanymi  rosną  zazwyczaj  wyraźnie  z energią, 
przekroje  czynne  na  egzoenergetyczne  reakcje  (n,  y) 
na  ogół  maleją  ze  wzrostem  energii  (rys.  2).  Neutron 
szybszy  przebywa  bowiem  krócej  w sąsiedztwie 
jądra  niż  neutron  powolny,  stąd  mniejsze  są  szanse 
na  jego  wychwyt  w wyniku  działania  sił  jądrowych. 

Przekrój  czynny  na  reakcję  (1)  może  wzrosnąć  o je- 
den rząd  wielkości,  a nawet  i więcej  (rezonans — występo- 
rys.  2),  jeśli  energia  cząstek  oddziałujących  jest  tak  do-  wania 
brana,  że  w etapie  pośrednim  może  powstać  jądro  rezonansu 
złożone  V w jednym  ze  swoich  stanów  wzbudzonych: 

azx+Zy^£$v.  (2) 

W przebiegającym  w gwiazdach  procesie  spalania  helu 
na  węgiel  właśnie  występowanie  rezonansu  przy  ener- 
gii 7,65  MeV  jest  przyczyną  wydajnego  tworzenia  się 
węgla  (-*►  Powstawanie  pierwiastków  chemicznych). 

Zwiększenie  energii  wiązania  w jądrze  o magicznej 
liczbie  neutronów  N przejawia  się  zmniejszeniem 
przekroju  czynnego  na  wychwyt  neutronu.  Przekrój 
czynny  jąder  o N = 50,  82,  1 26  na  wychwyt  neutronu 
o energii  rzędu  1 MeV  jest  10-100  razy  mniejszy  niż 
jąder  sąsiednich.  Natomiast  jądra  o liczbie  neutronów 
większej  o jedność  od  liczby  magicznej  mają  szczegól- 
nie duży  przekrój  czynny  na  reakcję  fotojądrową 
(y,  n). 


Reakcje  jądrowe  między 
cząstkami  naładowanymi 

Pod  względem  wytwarzania  energii  najważniejszą  rolę 
odgrywają  w gwiazdach  reakcje  dwuciałowe,  typu 
reakcji  (1),  między  cząstkami  naładowanymi  — jądra- 
mi atomowymi.  Liczba  aktów  reakcji  zachodzących 
w jednostce  objętości  na  jednostkę  czasu  jest  tym 
większa,  im  większe  są  stężenia  oddziałujących  ze 
sobą  jąder  oraz  im  wyższa  jest  temperatura.  Wyższa 
temperatura  oznacza  bowiem  większą  wartość  śred- 
niej energii  kinetycznej  oddziałujących  jąder,  a zatem 
większe  prawdopodobieństwo  przeniknięcia  przez 
barierę  kulombowską. 

Uśrednione  prawdopodobieństwo  (cr,  v ) reakcji  prawdopo- 
(1),  odniesione  do  jednej  pary  cząstek  reagujących  na  dobieństwo 
jednostkę  czasu  w zakresie  energii,  w którym  nie  reakcji 
występują  rezonanse,  można  z dobrym  przybliżeniem 
przedstawić  w postaci  całki  iloczynu  dwóch  funkcji: 

<«t,  t)>  = C,  T-*l3  J e-^EalE  t~E,kTdE.  (3) 

0 

Funkcja  e~ElkT  przedstawia  (z  dokładnością  do  współ- 
czynnika) rozkład  maxwełIowski  energii  (prędkości) 

względnej,  funkcja  zaś  e“*  Kc^K  — prawdopodobień- 
stwo przeniknięcia  przez  barierę  potencjału  cząstki 
o energii  E . Wartość  energii  Eg  jest  tzw.  energią  Ga-  energia 
mowa;  określa  ją  wzór  Gamowa 

Eg  = 2M(KZZ'e2/h)\  (4) 

gdzie  /i  — masa  zredukowana  oddziałujących  jąder 

x i y, 

M = Mx-My/(Mx  + MY).  (5) 

(W  powyższych  wzorach  C\  — współczynnik  nieza- 
leżny od  temperatury,  T — temperatura  bezwzględna, 
k — stała  Boltzmanna,  e — ładunek  elementarny. 


fi  — stała  Plancka  podzielona  przez  2it).  Przebieg 
obu  czynników  występujących  pod  znakiem  całki 
przedstawiony  jest  na  rys.  3.  Iloczyn  ich  obu,  tzn. 
funkcja  podcałkowa,  osiąga  maksymalną  wartość 
przy  energii  E0  — QUkT\/ Eg)2^9  która  zazwyczaj 
przewyższa  znacznie  średnią  energię  kinetyczną 
s/2  kT.  Obszar  zacieniowany  na  rysunku  przedstawia 
iloczyn  obu  czynników  pod  znakiem  całki  (3).  Widać 
że  najwięcej  jest  cząstek  o takich  energiach,  przy 
których  przenikalność  bariery  kulombowskiej  jest 


Rys.  3.  Schematyczny  przebieg  zależności  od  energii  dwóch 
czynników  pod  znakiem  całki  we  wzorze  (3)  w wypadku, 
gdy  w istotnym  dla  przebiegu  reakcji  termojądrowych  zakresie 
energii  nie  ma  żadnego  rezonansu.  Obszar  zacieniowany  odpo- 
wiada iloczynowi  obu  funkcji  pod  znakiem  całki  we  wzorze  (3) 

niemal  równa  zeru.  Liczba  cząstek  spada  natomiast 
do  zera,  gdy  wzrasta  ich  zdolność  przechodzenia 
przez  ową  barierę.  Podstawowy  wkład  do  całki  we 
wzorze  (3)  wnosi  stosunkowo  wąski  przedział  energii 
w pobliżu  energii  E0;  obszar  ten  nazywa  się  pikiem 
pik  Gamowa.  Gdy  pik  jest  dość  wąski,  wtedy  słuszne  jest 
Gamowa  w przybliżeniu  wyrażenie  postaci 

<>,*>  = C.r-^e-c.r-1'’  (6) 

(stałe  Ct  i C3  nie  zależą  od  temperatury).  Największy 
wkład  do  uśrednionego  prawdopodobieństwa  reakcji 
termojądrowej  pochodzi  od  zderzeń  przy  energiach 
znacznie  mniejszych  od  wysokości  bariery,  a jedno- 
cześnie znacznie  większych  od  energii  średniej  ( E0  > 
>kT).  Wynika  to  stąd,  że  bariera  ma  przenikalność 
różną  od  zera  już  przy  stosunkowo  małych  energiach. 
Przybliżone  wyrażenie  (6)  wskazuje  na  dość  dużą  za- 
leżność szybkości  reakcji  termojądrowych  od  tem- 
peratury. Dokładne  obliczenie  szybkości  reakcji  wy- 


Rys.  4.  Analogiczna  zależność  jak  na  rys.  3 w wypadku,  gdy 
w obszarze  bardzo  małych  energii  występuje  niewielki  rezonans. 
Obszary  zacieniowane  wskazują  na  wartość  iloczynu  dwóch 
funkcji  podcałkowych  {\^EF{E) — związanej  z rozkładem  pręd- 
kości i energii,  oraz  <r( E) — przekroju  czynnego)  we  wzorze  sta- 
nowiącym uogólnienie  wyrażenia  (3).  (Wzoru  (3)  nie  stosujemy 
bezpośrednio  w przypadku  rezonansu).  Wkład  pochodzący  od 
niskoenergetycznego  rezonansu  większy  jest  od  wkładu  z oto- 
czenia energii  E0 


maga  całkowania  numerycznego  z uwzględnieniem 
rezonansów  możliwych  w danej  reakcji. 

Jeśli  w przekroju  czynnym  przy  małych  energiach 
w obszarze  podbarierowym  występuje  rezonans  (je- 
den lub  kilka),  to  wkład  do  szybkości  reakcji  termo- 
nuklearnej  z obszaru  energii  wokół  tego  rezonansu 
może  się  okazać  większy  od  wkładu  piku  Gamowa. 

Sytuację  taką  przedstawia  rys.  4. 

Między  reakcjami  jądrowymi  w laboratorium  a 
reakcjami  termojądrowymi  w gwiazdach  występuje 
pewna  istotna  różnica.  W gwiazdach  oprócz  jąder 
atomowych  jest  gęsty  gaz  elektronowy.  Jeśli  nawet 
atomy  są  całkowicie  zjonizowane,  to  obecność  gazu 
elektronowego  obniża  w pewnym  stopniu  wzajemne 
odpychanie  kulombowskie  jąder  i przekroczenie 
bariery  kulombowskiej  jest  łatwiejsze. 

Wstępna  faza  ewolucji  gwiazdy,  zwana  fazą  kontr-  faza 
akcji  grawitacyjnej,  kończy  się  z chwilą,  gdy  w cen-  kontrakcji 
trum  gwiazdy  osiągnięta  zostaje  temperatura  wy-  grawitacyjnej 
starczająca  na  to,  by  możliwe  stały  się  reakcje  jądrowe 
z udziałem  najobfitszego  paliwa  — wodoru,  odzna- 
czającego się  zarazem  (dzięki  posiadaniu  minimalne- 
go — w porównaniu  z innymi  pierwiastkami  — ła- 
dunku elektrycznego)  największą  łatwością  przenika- 
nia przez  barierę  kulombowską.  Wodór  może  się 
więc  spalać  w takiej  temperaturze  (i  energii  średniej 
jąder!),  w jakiej  reakcje  między  jądrami  innych  pier- 
wiastków są  jeszcze  niemożliwe. 

Dwa  zasadniczo  różne  sposoby  spalania  wodoru  spalanie 
to:  cykl  p-p  oraz  cykl  katalityczny  CNO,  zwany  wodoru 
cyklem  węglowo-azotowym  albo  cyklem  Bethego- 
Weizsackera.  W każdym  z nich  można  rozróżnić  tzw. 
gałąź  główną  i dwie  gałęzie  boczne  (tabela  1).  Względ- 
na częstość  występowania  poszczególnych  cykli  i ga- 
łęzi zależy  od  warunków  fizycznych  wewnątrz  gwiaz- 
dy. Tak  więc  np.  w gwiazdach  pierwszego  pokolenia, 
które  się  składały  wyłącznie  z helu  i wodoru,  bez  do- 
mieszki węgla  czy  azotu,  możliwy  był  jedynie  cyk)  p-p. 

Obecnie  w gwiazdach  o niewielkiej  masie  (np.  w Słoń- 
cu) za  wydzielanie  energii  odpowiada  wyłącznie  cykl 
p-p,  w gwiazdach  zaś  bardzo  masywnych,  o masie 
rzędu  kilkudziesięciu  mas  słonecznych,  wodór  wypala 
się  wyłącznie  w cyklu  CNO.  Przyczyna  tego  jest  pro- 
sta. W gwiazdach  o większej  masie,  dysponujących 
większym  zapasem  energii  grawitacyjnej,  wstępna 
kontrakcja  grawitacyjna  może  doprowadzić  do  znacz- 
nie silniejszego  ogrzania  wnętrza  gwiazdy.  W wyższej 
zaś  temperaturze  jądra  wodoru  przenikają  skuteczniej 
przez  bariery  kulombowskie  wokół  jąder  węgla  i azo- 
tu, a procesy  (10,  12,  13  i 15)  z tabeli  1 przebiegają 
znacznie  szybciej  od  pierwszej  reakcji  cyklu  /?-/>,  choć 
bariera  kulombowską  jest  w niej  nieporównywalnie 
niższa.  Reakcja  (1)  jest  bowiem  jedyną  (oprócz  prze- 
mian i wychwytów  elektronu)  reakcją  jądrową 
z tabeli  1 , wy  woły  waną  oddziaływaniami  słabymi.  Stąd 
też  przekrój  czynny  na  tę  reakcję  jest  mniejszy  o kil- 
kanaście rzędów  wielkości  od  przekrojów  czynnych  na 
inne  reakcje  jądrowe,  wywoływane  oddziaływaniami 
silnymi.  Wartość  jego  przy  tych  energiach  protonów, 
przy  jakich  one  ze  sobą  w gwieździe  reagują  (tj.  poniżej 
1 MeV),  wynosi  ok.  10-2S  b,  podczas  gdy  przekroje  na 
inne  reakcje  (przy  porównywalnych  energiach)  są 
zazwyczaj  rzędu  mikrobarnów  do  milibarnów. 

Aby  scharakteryzować  efekty  wność  gałęzi  głównych 
obu  cykli  spalania  wodoru,  podajemy  w tabeli  1 czasy 
życia  jąder  ze  względu  na  daną  reakcję,  oszacowane 
przy  założeniu  następujących  warunków  fizycznych 
w obszarze,  w którym  reakcje  te  zachodzą:  gęstość 
wodoru  równa  100  g/cm3,  temperatura  — ok.  1,3- 107 
K.  Wypadkową  szybkość  przebiegu  cyklu  określa 
najdłuższy  czas  życia.  Na  rys.  5 przedstawiono  zależ- 
ność szybkości  wyzwalania  energii  od  temperatury 
przy  ustalonym  składzie  chemicznym.  Widać  stąd,  że 
cykl  CNO  dominuje  w gwiazdach  o dużej  jasności, 
masie  i temperaturze  (znajdujących  się  po  lewej  górnej 
stronie  ciągu  głównego  gwiazd). 

Podobnie  jak  przewaga  określonego  cyklu  spalania 
wodoru,  tak  też  przewaga  różnych  gałęzi  danego  cy- 
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Tabela  1.  Reakcje  spalania  wodoru 


reakcje 
jądrowe 
w Słońcu 


Cykl  | Gałąź 

Reakcja  (w  nawiasie  czas  życia) 

Uwagi 

P-P 

Główna 

i ,H  + 1H~>fH  + e+  + Ve(l,4-1010  1)  (1) 

i aH  + 1H->3Hc  + y(5,7s)  (2) 

•He  + nie-^He  + Z^dOM)  (3) 

konkuruje  reakcja : 

*H  -t-  aH  + e~  — ► *H  + Vt  (la) 

Boczna  I 

Najpierw  (1)  i (2),  potem: 

sHe  + 4He  —> 7Be  + y (4) 

7Be  + e~  — ► 7Li  4-  v«  (5) 

,Li  + ,H  — ► 24He  (6) 

Boczna  II 

Najpierw  (1),  (2)  i (4),  potem: 

7Be+  *H  8B+  y (7) 

8B— > 8Be*  + e++v«  (8) 

8 Be  -*•  24He  (9) 

lub  8B  + e-  — * 8Be  + ve  (8a) 

CNO 

Główna 

łaC  + aH  — ► ,3N+ y(l,3  *107  1)  (10) 

l*H  — ► ,3C + e+  + v*(7m)  (li) 

iaC  + łH  ,4N  + y(2,7  -10*  1)  (12) 

I4N  + aH  — > lsO  + y(<  3,2-lC8  1)  (13) 

łsO  — ► ł4N  + e+  + v*  (82s)  (14) 

,8N  + łH  — ► lłC+ 4He  (1,1  *10s  1)  (15) 

lub  ,3N  + e--»13C  + v«  (1  la) 

lub  ł50  + e~  ->  ,8N-ł-ve  (14a) 

Boczna  I 

,5N  + ,H->*eO  + y (16) 

,eO+1H-+ł7F + y (17) 

*7F->  170+e+  + v«  (18) 

,70  + łH  — ► 14N  + 4He  (19) 

teraz  powrót  do  gałęzi  głównej  (reakcja  (13)) 

lub  ,7F  + e~  — ► 170  + v#  (18a) 

Boczna  II 

,7Ó  + >H-+18F  + y (20) 

l8F  — > ,80  + e+  + v*  (21) 

,80  + *H  — > ł6N-f  4He  (22) 

teraz  powrót  do  gałęzi  głównej  (reakcja  (15)) 

lub  ł8F  + e-  ->  180 + ve  (21  a) 

Rys.  5.  Szybkość  wyzwalania  energii  c cykli  p-p  i CNO  w zależ- 
ności od  temperatury  T przy  gęstości  100  g/cm3  i zawartości 
wagowej:  wodoru  H — 80%,  węgla  C i azotu  N (łącznie)  — 


klu  zależy  od  warunków  fizycznych  wewnątrz  gwiaz- 
dy. Tak  więc  np.  w najniższych  temperaturach  (oczy- 
wiście powyżej  temperatury  „zapalania  się”  wodoru) 
przebiegają  wyłącznie  te  reakcje  cyklu  p-p , które 
wchodzą  w skład  jego  gałęzi  głównej.  Ze  wzrostem 
temperatury  włączają  się  kolejno  obie  gałęzie  boczne. 
Taką  sytuację  ilustruje  rys.  6. 

Oto  kilka  danych  orientacyjnych  dotyczących  Słoń- 
ca. Wkład  cyklu  CNO  do  produkcji  energii  jest  rzędu 
paru  procent  najwyżej.  W cyklu  p-p  podstawową  rolę 
odgrywa  gałąź  główna  (względna  częstość  występo- 
wania ok.  91%).  następnie  gałąź  boczna  I (względna 
częstość  ok.  9%).  Temperatura  centralna  jest  zbyt 
niska,  by  większą  rolę  mogła  odgrywać  gałąź  boczna 
II  (względna  częstość  poniżej  0,01%).  Dodajmy,  że 
choć  energia  wydzielona  podczas  przemiany  wodoru 
w hel  jest  na  każdej  drodze  taka  sama,  rozkłada  się 
ona  w rozmaity  sposób  między  neutrina  i promienio- 


wanie elektromagnetyczne;  fakt  ten  tkwi  u podstaw 
astronomii  neutrinowej,  dzięki  której  można  jedno- 
cześnie wyznaczać  temperaturę  wnętrza  gwiazdy 
i sprawdzać,  czy  i jakie  reakcje  jądrowe  tam  zachodzą. 
Wszystkie  reakcje  spalania  wodoru  prowadzą  zatem 
do  jednego  tylko  produktu  końcowego:  helu  4He; 
zapisać  je  można  schematy cznie : 

4łH  *He+2e++2ve+2y.  (7) 

Gdy  spalanie  jest  stacjonarne,  wszystkie  pozostałe 
jądra,  występujące  w kolejnych  reakcjach  (z  wyjąt- 
kiem takich  jąder  katalizatorów  jak  np.  12C),  mają 
stężenie  niewielkie.  Tak  więc  procesy  z tabeli  1 prawie 
nie  zwiększają  rozpowszechnienia  litu,  berylu  czy  boni 
w materii  przechodzącej  przez  fazę  spalania  wodoru. 

Gwiazdy  większą  część  swego  życia  spędzają  w fazie 
spalania  wodoru.  Zarówno  z tego  względu,  jak  i dla- 
tego, że  jest  to  proces  największej  wydajności  energe- 
tycznej (największej  wartości  wydzielonej  energii 
przypadającej  na  jednostkę  masy  paliwa),  spalanie 
wodoru  należy  do  najważniejszych  reakcji  jądrowych 
w przyrodzie. 

Następnymi  reakcjami  jądrowymi  — i pod  wzglę- 
dem ważności,  i kolejności  występowania  w ewolucji 


Rys.  6.  Wytwarzanie  helu  4He  w warunkach  stacjonarnych  przy 
założeniu  X~Y  ( X — zawartość  wagowa  wodoru,  Y — za- 
wartość wagowa  heiu)  w gałęzi  głównej  (G)  i gałęziach  bocznych 
(I  i II)  cyklu  p-p  w zależności  od  temperatury  centralnej  T.  Po- 
dobne wykresy  można  przedstawić  dla  innych  wartości  stosunku 
XiY  (wg  Parker,  Bahcall  i Fowler,  1964) 


produkt 
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spalanie  helu  gwiazdy  — są  reakcje  spalania  helu.  Gdy  w central- 
nych obszarach  gwiazdy  spalającej  wodór  zostanie 
on  zupełnie  zużyty,  wtedy  zmaleje  udział  ciśnienia 
promieniowania  (bo  mniej  promieniowania  powsta- 
je) w łącznym  ciśnieniu  przeciwstawiającym  się  kur- 
czeniu grawitacyjnemu.  Następuje  grawitacyjna  kontr- 
akcja wnętrza  gwiazdy,  przy  czym  wzrasta  gęstość 
(do  ok.  105  g/cm3)  oraz  — wskutek  wydzielania  się 
energii  grawitacyjnej  — temperatura  (do  ok.  108  K). 
W takich  warunkach  możliwe  staje  się  zapalenie  na- 
stępnego paliwa  — helu.  Wydawałoby  się,  że  powin- 
na teraz  nastąpić  reakcja: 

jHeH  jHe  ->  jBe.  (8) 

Możliwość  przebiegu  tej  reakcji  można  by  zakwestio- 
nować w związku  z tym,  że  jest  to  reakcja  endoenerge- 
tyczna,  o energii  progowej  rzędu  96  keV.  Nie  to  jest 
jednak  zasadniczą  przeszkodą,  gdyż  w temperaturze 
108  K spora  część  jąder  helu  4Hc  ma  energię  wyższą 
od  tej  wartości  progowej.  Natomiast  z danych  do- 
świadczalnych wiadomo,  że  jądro  8Be  z okresem  poło- 
wicznego zaniku  rzędu  2,6*1 0-16  s rozpada  się  z po- 
wrotem na  dwa  jądra  4He.  Czy  wobec  tego  reakcja 
(8)  może  odgrywać  jakąkolwiek  rolę? 

Okazuje  się,  że  tak,  bo  jedynie  w warunkach  ziem- 
skich jądro  8Be  ma  tylko  jedną  możliwość  zaniku : 
rozpad  na  dwie  cząstki  a.  W warunkach  zaś  bardzo 
gęstej  materii  wnętrza  gwiazdy  oraz  w wysokiej  tem- 
peraturze zachodzi  tyle  zderzeń  między  jądrami  helu, 
że  się  w końcu  ustala  pewna  równowaga  między  pro- 
cesami powstawania  i rozpadu  berylu,  a więc  i rów- 
nowaga między  stężeniami  helu  i berylu.  Równowaga 
ta  zależy  od  gęstości  i temperatury.  Przy  gęstości 
105  g/cm3  i w temperaturze  108  K przypada  jedno  jądro 
8Be  na  miliard  jąder  4He,  co  umożliwia  wychwyt  helu 
przez  beryl  (zanim  ten  ostatni  zdąży  się  rozpaść): 

8Be+4He  - 12C+y.  (9) 

Innymi  słowy  — w warunkach  tak  ogromnego  stęże- 
nia cząstek  a,  jakie  istnieje  wewnątrz  gwiazdy,  zanik 
nietrwałego  jądra  8Be  może  następować  również 
przez  wychwyt  cząstki  a,  co  prowadzi  do  powstania 
trwałego  jądra  węgla  ,2C.  Nic  więc  dziwnego,  że  węgiel 
jest  czwartym  pod  względem  rozpowszechnienia  pier- 
wiastkiem (po  wodorze  helu  i tlenie). 

Dwuetapowy  proces  złożony  z reakcji  (8)  i (9)  za- 
pisać można  krótko: 

3oc  - 12C+y,  (10) 

proces  3a  co  uzasadnia  jego  nazwę:  proces  3a.  Należy  pod- 
kreślić, że  reakcja  (9)  jest  reakcją  rezonansową  w tym 
przedziale  wartości  energii,  jakimi  dysponują  jądra 
4He  wewnątrz  gwiazd  spalających  hel.  Przekrój  czyn- 
ny na  tę  reakcję  jest  więc  tak  duży,  że  jądra  węgla  po- 
wstają z dużą  wydajnością  — mimo  niewielkiego 
stężenia  jąder  berylu.  Jednocześnie  możliwe  jest  przy- 
łączanie dalszych  cząstek  a do  wytworzonych  już 
jąder  węgla;  powstaje  przy  tym  tlen: 

"C+jHe  - “O-f  y.  (11) 

Gdy  w centrum  gwiazdy  hel  jest  już  całkowicie  zu- 
żyty, sytuacja  wygląda  podobnie  jak  po  wypaleniu 
wodoru.  Raz  jeszcze  nastąpić  musi  kontrakcja  grawi- 
tacyjna i zapalenie  się  kolejnego  paliwa,  będącego 
jednocześnie  „popiołem”  jądrowym  z poprzedniej 
fazy  spalania.  Przykłady  reakcji  jądrowych  spalania 
węgla  i tlenu  zawiera  tabela  2. 

Wszystkie  reakcje  jądrowe  wytwarzające  energię 
w gwieździe  (z  wyjątkiem  lekko  endoenergetycznej 
reakcji  8)  są  to  dość  podobne  do  siebie  reakcje  egzo- 
energetyczne  między  cząstkami  naładowanymi. 
W każdej  z nich  z jąder  słabiej  związanych  tworzą 
się  jądra  o większej  energii  wiązania,  a jednocześnie 
wydziela  się  energia.  Produkcji  energii  w gwieździe 
towarzyszą  zmiany  składu  chemicznego  jej  wnętrza, 
popioły  poprzedniej  fazy  spalania  stają  się  paliwem 
w następnej.  Prowadzi  to  do  jąder  pierwiastków  co- 
raz cięższych,  aż  do  jąder  żelazowców,  które  mają 


Tabela  2.  Niektóre  reakcje  jądrowe  zachodzące  po  wypa- 

leniu  helu 

1.  Spalanie  węgla: 

>+;h 

llC+1lC~* 

”Mg+y 

“Mg+n 

‘‘O+ZjHe 

(23) 

11.  Spalanie  tlenu: 

“Si+,‘He 

,Jo+,jo->  ■ 

::s+" 

3» +r 

”Mg  + 2*He 

(24) 

III.  Spalanie  krzemu: 

SSi+;He-“S+y 

(25) 

«Si  + «Si-“Ni  + y 

“ UIai+Jh 

(praktycznie  nie  zacho- 
dzi, ze  względu  na 
wysoką  barierę 
kulombowską) 

(26) 

(27) 

największą  energię  wiązania  na  jeden  nukleon.  Dal-  powstawanie 
sze  reakcje  nukleosyntezy  między  jądrami  żelazowców  jąder 
(i  ewentualnie  pierwiastków  cięższych)  musiałyby  być  żelazowców 
reakcjami  endcrenergetycznymi  i nie  mogłyby  stano- 
wić źródła  energii  gwiazdy  (rys.  7).  Ponadto  z uwagi 
na  coraz  wyższą  barierę  kulombowską  między  od- 
działującymi ze  sobą  jądrami  konieczny  byłby  coraz 
większy  wzrost  energii  kinetycznej  oddziałujących 
z sobą  jąder,  a temu  musiałby  towarzyszyć  prawie 
nieograniczony  wzrost  temperatury  centralnej.  Spra- 
wia to,  że  powstania  jąder  atomowych  o liczbach  ma- 
sowych A ^65  nie  da  się  powiązać  z reakcjami  ter- 
mojądrowymi między  cząstkami  naładowanymi.  Wy- 
stępowanie w przyrodzie  takich  jąder  (pierwiastki  od 
cynku  do  uranu)  wskazuje  jednak  na  to,  że  pro- 
cesy ich  powstawania  odbywały  się,  a podstawową 
w nich  rolę  odgrywały  reakcje  z udziałem  neutronów. 


Rys.  7.  Ewolucja  jądrowa  gwiazdy.  Odcinki  poziome  krzywej 
przedstawiają  fazy  kontrakcji  grawitacyjnej,  w których  tempera- 
tura centralna  rośnie,  a skład  chemiczny  gwiazdy  nie  ulega  zmia- 
nie; przy  każdym  z nich  podano  symbol  pierwiastka,  którego 
jądra  ulegną  „zapłonowi”  po  zakończeniu  fazy  kontrakcji.  Pro- 
cesy spalania  kolejnych  paliw  jądrowych  przedstawiają  odcinki 
niemal  pionowe  (spalanie  izoterm  iczne).  Krzywe  C-O-Mg 
i O-Mg-S  odpowiadają  dwom  przypadkom  skrajnym;  gdy  jądro 
gwiazdy  po  wypaleniu  helu  składa  się  wyłącznie  z węgla  i gdy 
składa  się  wyłącznie  z tlenu.  Ej  jest  to  całkowita  energia  jądrowa 
jaka  została  wydobyta  z gwiazdy  od  chwili  jej  powstania,  przy- 
padająca na  jeden  jej  nukleon.  Gdy  w jądrze  gwiazdy  pozostają 
jądra  żelaza,  niemożliwe  jest  dalsze  wydobywanie  energii  jądro- 
wej. Możliwe  jest  wtedy  przejście  fazowe  Fe  — ► He;  energii  po- 
trzebnej do  tego  dostarcza  kontrakcja  grawitacyjna 
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Reakcje  wytwarzania 
i wychwytu  neutronów 

Neutrony  mogą  się  pojawiać  jako  jeden  z produktów 
końcowych  w różnych  reakcjach  termojądrowych 
podczas  ewolucji  gwiazdy.  W tabeli  2 podaliśmy  przy- 
kładowo procesy  powstawania  neutronów  podczas 
spalania  węgla  lub  tlenu.  Przedstawimy  jeszcze  kilka 
przykładów. 

Kiedy  we  wnętrzu  masywnej  gwiazdy,  w której 
przebiegał  cyk!  CNO,  wypalił  się  wodór,  wtedy  obok 
jąder  4He  pozostaje  pewna  domieszka  jąder  13C  — 
pozostałości  katalizatora  z tego  cyklu.  W fazie  kontr- 
akcji grawitacyjnej  wnętrza  gwiazdy  jądra  helu  wstę- 
pują w reakcję 

“C+jHe-^O +«,  (12) 

która  jest  znacznie  bardziej  prawdopodobna  od  dwu- 
etapowego procesu  3a. 

Niezależnie  od  tego,  jaka  była  proporcja  wzajemna 
różnych  odmian  węgla  i azotu  przed  rozpoczęciem 
spalania  wodoru  w cyklu  CNO,  w czasie  jego  trwa- 
nia ustala  się  następujący  stosunek  ilościowy  jąder- 
katalizatorów: 

(1JN):(1JC):(,JQ  = 95:4:1.  (13) 

Widać  stąd,  że  najobfitszą  pozostałością  ciężką  po 
zakończeniu  cyklu  CNO  jest  azot.  Jądra  jego  wy- 
chwytują znaczną  część  neutronów  powstających 
w reakcji  (12),  co  obniża  wydajność  innych  reakcji 
z neutronami.  Ale  już  po  zapaleniu  Się  helu,  w wyż- 
szej temperaturze,  możliwa  jest  reakcja  wychwytu 
cząstki  a przez  jądro  14N,  w której  się  tworzy  jądro 
lsO,  zdolne  do  kolejnego  wychwytu  cząstki  a.  Oto 


ciąg  dopuszczalnych  procesów  : 

“N+jHe  - łjF+y,  (14) 

18F  i80+<?++^,  (15) 

10O  + 4He  -*  22Ne+y,  (16) 

w których  się  tworzą  dwa  jądra  (10O  i 22Ne),  niezbęd- 
ne do  dalszego  wytwarzania  neutronów.  Obie  reakcje 
produkcji  neutronów: 

“O+jHe-^N  e+/i,  (17) 

IJNe+^He  -*>  JjMg+«t  (18) 


są  endoenergetyczne.  Progi  ich  są  jednak  tak  niskie 
(0,705  MeV  reakcji  17  i 0,48  MeV  reakcji  18),  że  mogą 
one  przebiegać  wydajnie  w temperaturze,  jaka  panuje 
w jądrze  gwiazdy  pod  koniec  fazy  spalania  helu. 

Powyższe  procesy  wytwarzania  neutronów  związa- 
ne są  z fazą  spalania  helu.  Można  by  jeszcze  wymienić 
inne  procesy  produkcji  neutronów,  np.  spalanie  krze- 
mu, siarki,  ale  ograniczymy  się  do  stwierdzenia,  że 
neutrony  pojawiają  się  wewnątrz  gwiazdy  w wyniku 
kilku  stosunkowo  rzadkich  reakcji.  Stanowi  to  kon- 
sekwencję albo  niewielkiego  rozpowszechnienia  w ma- 
terii gwiazdowej  tych  jąder-substratów,  które  są 
źródłem  neutronów  (czyli  jąder  13C,  10O  i 22Ne),  albo 
też  niewielkiej  stosunkowo  częstości  występowania 
kanałów  neutronowych  wśród  kanałów  wyjściowych 
zachodzących  reakcji.  Neutrony  pojawiają  się  w nie- 
wielkich stosunkowo  ilościach,  ale  w ciągu  dość  dłu- 
giego przedziału  czasu.  Można  w zasadzie  stwierdzić, 
że  począwszy  od  fazy  spalania  helu  istnieją  w gwieź- 
dzie  pewne  stacjonarne  źródła  neutronów.  Wytwarza- 
nie neutronów  odbywa  się  w skali  czasu  rzędu  milio- 
nów do  setek  milionów  lat  (w  zależności  od  masy 
gwiazdy,  a więc  i od  tempa  jej  ewolucji). 

„Losy”  powstałych  neutronów  zależą  od  obec- 
ności w materii  gwiezdnej  jąder,  które  mogą  je  pochła- 
niać. Tak  więc  wspomniane  już  kilkakrotnie  jądro 
,4N  w reakcji 

łjN+#i  l\C+p  (19) 


pochłania  neutrony  powstające  w procesach  (a, «), 
np.  w reakcji  (12)  i (17).  Tworzące  się  w reakcji  (19) 
nietrwałe  jądro  izotopu  węgla  ,4C  ulega  przemianie 
0“  (z  okresem  połowicznego  zaniku  /1/2  ok.  5,5  tys.  lat) 
i odtwarza  „truciznę  neutronową”  MN. 

Do  znacznie  ciekawszych  konsekwencji  prowadzić 
może  obecność  jąder  mających  duże  przekroje  czynne 
na  reakcje  (rty  y).  Jądrami  takimi  są  jądra  żelazowców 
i pierwiastków  cięższych.  Na  przykład  jądro  najbar- 
dziej rozpowszechnionego  izotopu  żelaza,  “Fe,  po 
wychwycie  pierwszego  neutronu  przekształca  się 
w trwałe  jądro  ”Fe,  po  wychwycie  drugiego  — rów- 
nież w trwałe  jądro  “Fe,  dopiero  następny  wychwyt 
neutronu  tworzy  nietrwałe  jądro  “Fe,  rozpadające 
się  przez  przemianę  (/1/2  = 45  dni): 

»Fe  - £Co+«-+ (20) 

Istotne  jest  to,  że  trzy  kolejne  wychwyty  neutronu 
wraz  z następującą  po  nich  przemianą  £ doprowadzają 
do  przemiany  jądra  żelaza  w jądro  następnego  po 
nim  w układzie  okresowym  pierwiastka.  Wychwyt 
kolejnego  neutronu  przez  jądro  “Co  tworzy  nie- 
trwałe jądro  “Co,  z którego  w wyniku  przemiany  /?” 
powstaje  trwałe  jądro  dalszego  pierwiastka  — niklu 
*®Ni.  Tak  oto  poprzez  kolejne  wychwyty  neutronów 
tworzyć  się  mogą  pierwiastki  o coraz  większych  licz- 
bach atomowych  (-*  Powstawanie  pierwiastków  che- 
micznych). 

Zwróćmy  jeszcze  uwagę  na  to,  że  poza  mechaniz- 
mem powolnego  wychwytu  neutronów,  który  się 
wiąże  ze  stacjonarnymi  źródłami  neutronów  w gwieź- 
dzie,  istnieje  jeszcze  inny  sposób  powstawania  pier- 
wiastków ciężkich:  szybki  wychwyt  neutronów  wy- 
stępujący przy  pojawieniu  się  dużego  strumienia 
neutronów  w ciągu  krótkiego  czasu.  Właśnie  taki 
strumień  pojawia  się  w końcowej  fazie  ewolucji  gwiazd 
o dużej  masie,  gdy  eksplodują  jako  supernowe.  W cen- 
trum takiej  gwiazdy  ciąg  kolejnych  reakcji  egzoener- 
getycznych  doprowadza  prawdopodobnie  do  powsta- 
nia jąder  najsilniej  związanych  — jąder  żelazowców. 
Dalsza  produkcja  energii  w reakcjach  termonuklear- 
nych  nie  jest  już  możliwa,  następuje  kontrakcja  grawi- 
tacyjna jądra  gwiazdy,  podwyższenie  gęstości  i tem- 
peratury. W efekcie  możliwa  się  staje  endoenerge- 
tyczna  przemiana  jąder  żelazowców  w hel  i neutrony: 

£Fe->  13jHe  + 4 *,  (21) 

a wraz  z dalszym  zagęszczaniem  się  jądra  gwiazdy 
możliwy  jest  i rozpad  helu.  W rezultacie  powstają 
ogromne  ilości  neutronów,  z których  przynajmniej 
część  opuszcza  centralny  obszar  gwiazdy.  Neutrony 
te  napromieniają  materię  wyrzuconą  z obszarów  bar- 
dziej zewnętrznych,  o niższej  gęstości  i temperaturze, 
zawierającą  jądra  żelazowców  (i  jądra  cięższe),  zdolne 
do  wychwytu  neutronów  pochodzących  z centrum 
gwiazdy.  W tych  warunkach  w czasie  rzędu  minuty 
przypada  od  kilkudziesięciu  do  kilkuset  neutronów  na 
jedno  jądro,  które  je  może  wychwycić. 


Astrofizyka  neutrinowa 
i śledzenie  reakcji 
jądrowych  w gwiazdach 

Hipoteza  jądrowych  źródeł  energii  gwiazd  wydaje  się 
obecnie  najbardziej  przekonująca.  Przemawia  za  nią 
zgodność  wyprowadzonych  na  jej  podstawie  wnios- 
ków z obserwacją.  Reakcje  jądrowe  przebiegają  jed- 
nak w niewielkiej,  całkowicie  ukrytej  przed  obserwa- 
torem, centralnej  części  gwiazdy  i nikt  ich  bezpośred- 
nio nie  obserwował. 

Weźmy  np.  pod  uwagę  najbliższą  gwiazdę  — 
Słońce.  Obserwowane  promieniowanie  dostarcza 
bezpośredniej  informacji  tylko  o atmosferze  Słońca 
mającej  temperaturę  ok.  6 tys.  stopni,  podczas  gdy 
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promienie-  temperatura  w jego  jądrze  wynosi  kilkanaście  min 
wanie  stopni.  Wiemy  poza  tym,  że  Słońce  wypromieniowuje 
Słońca  0k.  3,86*  1 02*  J/s,  ale  obserwacje  promieniowania  elek- 
tromagnetycznego, wydobywającego  się  z jego  po- 
wierzchni, nie  mówią  nic  o reakcjach  jądrowych 
w centrum  Słońca,  umożliwiających  wypromieniowy- 
wanie  takiej  energii.  O tych  reakcjach  wnosić  możemy 
jedynie  pośrednio,  na  podstawie  teoretycznego  mo- 
delu wnętrza  Słońca.  Poprawny  model  musi  uwzględ- 
niać to,  że  wkład  każdej  reakcji  termojądrowej  do 
łącznej  produkcji  energii  zależy  od  temperatury,  gę- 
stości w centrum,  składu  chemicznego  itp. 

Udział  poszczególnych  gałęzi  cykli  p-p  i CNO  we 
wnętrzu  Słońca  można  dopasować  do  jego  jasności 
powierzchniowej,  typu  widmowego  i innych  znanych 
własności,  pozostanie  jednak  pewna  wątpliwość,  nad 
którą  przyrodnikowi  nigdy  nie  wolno  przejść  do  po- 
rządku dziennego:  A może  u podstaw  teorii  ewolucji 
gwiazd  tkwi  jakaś  fałszywa  przesłanka  dotycząca 
procesów  zachodzących  w ich  wnętrzu?  Dylemat  ten 
można  by  rozstrzygnąć,  gdyby  się  udało  uzyskać  bez- 
pośrednią informację  o procesach  wewnątrz  gwiazd. 
Źródłem  takiej  informacji  mogą  być  neutrina,  które 
powstają  jako  „produkt  uboczny”  w różnych  reak- 
cjach spalania  wodoru  (tabela  1).  Bez  przeszkód 
opuszczają  Słońce  i poruszając  się  z prędkością  świa- 
tła, docierają  do  Ziemi  w ciągu  mniej  więcej  8 minut  od 
chwili,  gdy  w jądrze  słonecznym  zostały  wytworzone. 
Mają  przy  tym  niemal  tę  samą  energię  i kierunek 
lotu  co  w chwili  powstania.  Wynika  to  z niezwykle 
słabego  oddziaływania  neutrin  z materią  (-*  Oddzia- 
ływania słabe). 

średnia  Średnia  droga  swobodna  neutrin  o energiach  do 
droga  kilku  MeV  w materii  o normalnej  gęstości  (rzędu 
swobodna  j g/cm3)  sięga  milionów  miliardów  kilometrów.  Na- 
neutrin  tomiast  średnia  droga  swobodna  kwantu  y pocho- 
dzącego z wnętrza  Słońca  jest  miliardy  razy  mniejsza 
od  rozmiarów  Słońca.  Zatem  obserwowane  widmo 
promieniowania  elektromagnetycznego  Słońca  nie 
odzwierciedla  widma  kwantów  y powstających  w re- 
akcjach jądrowych  w obszarach  centralnych.  Oddzia- 
ływania elektromagnetyczne  fotonów,  przedzierają- 
cych się  z wnętrza  Słońca  ku  jego  powierzchni,  opóź- 
niają o tysiące  lat  ostateczne  wypromieniowanie  przez 
Słońce  energii  wytworzonej  w jego  wnętrzu.  Ponadto 
ewentualne  oscylacje  w wytwarzaniu  energii  w cen- 
trum Słońca  ulegają  znacznemu  rozmyciu  w czasie 
i mogą  się  w ogóle  nie  odbijać  na  jasności  fotonowej 
Słońca.  Natomiast  obserwacje  neutrin  umożliwiłyby 
w zasadzie  wyznaczenie  udziału  różnych  procesów 


jądrowych  w produkcji  energii  wewnątrz  Słońca  oraz 
śledzenie  zmian  tego  udziału  z upływem  czasu. 

Neutrina  z różnych  reakcji  w Słońcu  charaktery- 
zują się  różnym  widmem  energetycznym.  Na  przy- 
kład reakcja  (1)  z tabeli  1 jest  wywoływana  oddziały- 
waniem słabym,  zbliżona  jest  więc  swym  charakterem 
do  przemiany  p.  Widmo  neutrin  z tej  reakcji  jest  ciąg- 
łe, podobnie  jak  widmo  neutrin  z przemiany  P+. 

Sięga  ono  od  granicy  dolnej,  równej  zeru,  do  energii 
maksymalnej,  równej  0,42  MeV.  Reakcja  (1)  wystę- 
puje we  wszystkich  gałęziach  cyklu  p-p,  pochodzą 
z niej  neutrina  o stosunkowo  małej  energii.  Z reakcją  widmo 
(1)  konkuruje  proces  (la),  analogiczny  do  procesu  energetyczne 
wychwytu  elektronu.  Prawdopodobieństwo  procesu  neutrin 
(la)  jest  mniej  więcej  400  razy  mniejsze  od  prawdo- 
podobieństwa reakcji  (1).  Proces  (la)  dostarcza 
neutrin  monoenergetycznych,  o energii  1,44  MeV. 

W porównaniu  z liczbą  neutrin  otrzymywanych  z reak- 
cji (1)  jest  ich  jednak  bardzo  mało. 

W tabeli  3 zestawione  są  dane  o procesach  powsta- 
wania neutrin  wewnątrz  Słońca.  Łatwo  dostrzec,  że 
gdyby  głównym  źródłem  energii  była  II  gałąź  boczna 
cyklu  p-p,  to  neutrina  ze  Słońca  miałyby  najwyższą 
możliwą  wartość  energii  średniej  — połowę  neutrin 
stanowiłyby  bowiem  neutrina  borowe,  pochodzące 
z procesu  (8),  o energii  maksymalnej  14,06  MeV. 

Neutrina  takie  najłatwiej  byłoby  wykryć,  gdyż  prze- 
krój czynny  na  oddziaływanie  (słabe!)  neutrin  z ma- 
terią szybko  rośnie  ze  wzrostem  energii  neutrin.  Co  do 
neutrin  pochodzących  z I gałęzi  bocznej  cyklu  p-p , 
to  energia  jednego  z neutrin  (z  reakcji  1)  nie  przekra- 
cza 0,42  MeV ; drugie  neutrino,  pochodzące  z wychwy- 
tu elektronu  (5),  może  mieć  energię  0,861  MeV  albo 
0,383  MeV  — zależnie  od  tego,  czy  jądro  7 Li  tworzy 
się  w stanie  podstawowym  czy  też  wzbudzonym. 

Oddziaływanie  neutrin  litowych  z materią  słabsze  jest 
średnio  od  oddziaływania  neutrin  borowych,  silniej- 
sze natomiast  od  neutrin  pp  lub  pep. 

Bruno  Pontecorvo,  uczeń  E.  Fermiego  i jeden  z naj- 
wybitniejszych znawców  problematyki  neutrinowej, 
zaproponował  ponad  30  lat  temu  wykorzystanie 
reakcji  odwrotnej  przemiany  P do  radiochemicznej 
detekcji  neutrin  docierających  ze  Słońca  do  Ziemi,  detekcja 
W reakcjach  tych  wykrywane  byłyby  neutrina  wywo-  neutrin 
łujące  przemianę  neutronu  w proton  w jakimś  trwa- 
łym jądrze  atomowym.  Zestawienie  proponowanych 
reakcji  zawiera  tabela  4.  Wszystkie  reakcje  odwrotne 
przemiany  p są  reakcjami  progowymi,  tj.  wymagają 
pewnej  minimalnej  energii  neutrina.  Podaliśmy  je 
w kolejności  odpowiadającej  zwiększaniu  progu 


Tabela  3.  Energia  unoszona  przez  neutrina  pochodzące  z reakcji  termojądrowych 


Cykl 

Reakcje  (z  tab.  1),  w których  powstają 
neutrina 

Nazwa  grupy  neutrin 
i rodzaj  widma  energe- 
tycznego 

Energia  neutrin 
MeV 

Energia  (MeV)  uno- 
szona średnio  w 1 cy- 
lu  przez 

Ułamek 
energii  cał- 
kowitej 
unoszony 
przez  neu- 
trina 

promie- 

niowanie 

elektro- 

magne- 

tyczne 

neutrina 

P-P* 

gałąź  główru 

0) 

(la)  — nieznaczny  udział  w produkcji 
energii  i neutrin 

neutrina  pp  (widmo  ciąg- 
łe) 

neutrina  pep  (widmo  li- 
niowe) 

0 do  0,42 
1,44 

26,22 

0,51 

2% 

P-P* 
gałąź 
boczna  1 

(1)  i (la)  — nieznaczny  udział  (jw.) 

(5) 

neutrina  pp  i pep 
neutrina  berylowe  (wid- 
mo liniowe) 

0-0,42;  1,44 
(0,861  (90%) 
(i  0,383(10%) 

25,67 

1,06 

4% 

P-P . 
gałąź 
boczna  11 

(1)  i (ta)  — nieznaczny  udział  (jw.) 
(8) 

(8a)  — nieznaczny  udział  (jw.) 

neutrina  pp  i pep 
neutrina  borowe  (widmo 
ciągłe) 

(widmo  liniowe) 

0-0,42;  1,44 
Odo  14,06 

15,08 

19,1 

7,63 

28% 

CNO, 

gałąź  główni 

OD 

(H) 

(lla)  ifl4a)  — nieznaczny  udział 
w produkcji  energii 

neutrina  azotowe  (wid- 
mo ciągłe) 

neutrina  tlenowe  (wid- 
mo ciągłe) 

(widmo  liniowe) 

Odo  1,20 
Odo  1,74 
2,22  i 2,76 

24,97 

1,76 

6% 

991 


strumień  neutrin 


Tabela  4.  Reakcje  odwrotnej  przemiany  p zaproponowane  do  detekcji  neutrin  słonecznych 


Reakcje 

R upow- 
szechnianie 
wyjściowego 
nuklidu  w % 
(w  stosunku 
do  danego 
pierwiastka) 

Energia  pro- 
gowa reakcji 

MeV 

Rodzaj  rozpadu  i okres  połowicz- 
nego zaniku  powstającego  w danej 
reakcji  nuklidu  promieniotwórcze- 
go 

Rząd  wiel- 
kości masy 
pierwiastka 
(nie  nukli- 
du), w któ- 
rej zachodzi 
1 wychwyt 
neutrina  ze 
Słońca  na 

dobę 

£Rb  + *-*«mSr  + e-  (28) 

27,85 

0,115 

wychwyt  elektronu,  y,  2,8  h 

10 1 

”Mn  + ^-!jFe  + r (29) 

100 

0,231 

wychwyt  elektronu,  2,6  lat 

300  t 

l[Gz  + ve-+llGc  + e-  (30) 

39,6 

0,233 

wychwyt  elektronu,  11  d 

10  t 

;ŻV  + v,->'lCr  + e-  (31) 

99,76 

0,752 

wychwyt  elektronu  y,  27,8  d 

300  t 

^C1  + v*  — > ig  Ar  + e~  (32) 

24,47 

0,816 

wychwyt  elektronu,  35,1  d 

450  t 

jLi  + v,  -*•  jBc  + e-  (33) 

92,58 

0,862 

wychwyt  elektronu,  y,  53,4  d 

4 t 

*Be  + v«  (34) 

100 

0,884 

trwałe  produkty  końcowe:  p + 2a 

7 

energetycznego.  Tylko  pierwsze  trzy  reakcje  z tabeli  4 
pozwalają  na  wykrycie  neutrin  pp\  reakcja  (34)  i dal- 
sze (których  nie  podajemy)  mają  zbyt  wysoką  energię 
progową,  by  się  nadawały  do  wykrycia  nawet  neutrin 
berylowych.  Jeśli  więc  energia  wytwarzana  jest  niemal 
tylko  w cyklu  p-p , to  reakcja  (34)  i inne  odbywać  się 
mogą  jedynie  pod  działaniem  neutrin  borowych  (i  nie- 
wielkiej liczby  neutrin  pep). 

Znając  wartość  energii  wypromieniowywanej  przez 
Słońce,  możemy  oszacować  produkcję  neutrin:  po- 
strumień  wstaje  ich  ok.  1038  w ciągu  sekundy.  Ich  widmo  ener- 
neutrin  getyczne  po  dotarciu  do  powierzchni  Ziemi  przed- 
stawia rysunek  8.  Całkowity  strumień  neutrin  pada- 
jących na  powierzchnię  Ziemi  wynosi  ok.  7 1010  na 
1 cm2  w ciągu  sekundy.  Wobec  niezwykłej  słabości 
oddziaływania  neutrin  z materią  trzeba  by  użyć 
ogromnych  ilości  substancji  do  detekcji  neutrin  przez 
odwrotną  przemianę  fi. 


Rys.  8.  Przewidywane  (na  podstawie  standardowych  modeli 
Słońca)  widmo  neutrin  słonecznych  po  dotarciu  ich  do  po- 
wierzchni Ziemi.  Linie  ciągłe  — neutrina  z cyklu  p-pt  linie  przer- 
wane — niewielka  domieszka  neutrin  z cyklu  CNO,  odgrywają- 
cego podrzędną  rolę  w Słońcu.  Strumienie  neutrin  podane  są 
w l/(cm*-s-Mcy)  dla  widma  ciągłego  i w l/(cm2*s)  dla  widma 
liniowego  (neutrina  monoenergetyczne  z procesów  (la)  i (5)  z ta- 
beli 3) 

Aby  zobrazować,  jak  niezmiernie  trudne  jest  do- 
świadczalne wykrycie  neutrin  słonecznych,  przedsta- 
doświadcze-  wimy  w zarysie  doświadczenie  Davisa,  trwające  już 
nie  Davisa  od  kilkunastu  lat.  Raymond  Davis,  wybitny  radio- 
chemik  z Brookhaven,  wykorzystuje  do  detekcji 
neutrin  reakcję  (32).  Detektor  Davisa  to  ogromny 
zbiornik  zawierający  ok.  610  t (380  tys.  1)  czterochlo- 
roetylenu  C2C14.  Aby  eliminować  w maksymalnym 


stopniu  wpływ  promieniowania  kosmicznego,  Davis 
umieścił  ten  zbiornik  na  głębokości  ponad  1,5  km 
w szybie  kopalni  złota  w Południowej  Dakocie. 
Czterochloroetylen  został  przedtem  oczyszczony  z 
ewentualnych,  najmniejszych  nawet  domieszek  argo- 
nu i innych  zanieczyszczeń,  zbadano  również  ekspe- 
rymentalnie możliwości  wydzielania  się  argonu  ze 
ścianek  zbiornika.  Montaż  zbiornika  (z  części  tran- 
sportowanych do  szybu  dźwigiem  kopalnianym), 
sprawdzanie  jego  szczelności  i inne  prace  przygoto- 
wawcze trwały  ponad  rok  (rys.  9 oraz  ii.  220,  tabi.  59). 

Idea  doświadczenia  jest  prosta.  Neutrina  słoneczne  przemiany 
przenikają  bez  trudu  warstwę  ziemi  nad  detektorem  służące 
(a  w nocy  — warstwę  pod  nim,  bo  dochodzą  wtedy  detekcji 
z drugiej  strony  — od  dołu)  i wywołują  przemianę  neutrin 
chloru  37Ci  w argon  promieniotwórczy  37 Ar  (/1/2  = 

= 35,1  dni).  Rozpad  argonu  to  reakcja  (32)  biegnąca 
od  strony  prawej  ku  lewej.  Po  wychwycie  elektronu 
przez  jądro  37 Ar  następuje  emisja  elektronu  przez 
atom  (zjawisko  Augera);  takie  właśnie  elektrony 
augerowskie  służą  w warunkach  laboratoryjnych  do 
rejestracji  rozpadów  argonu. 

Co  100-140  dni  odbywa  się  przedmuchiwanie  zbior- 
nika helem,  który  unosi  ze  sobą  argon  (oba  pierwiast- 
ki są  gazami  szlachetnymi  o podobnych  właściwoś- 
ciach chemicznych).  Do  helu  dodany  jest  trwały  izo- 
top argonu  36Ar,  co  ułatwia  ocenę  stopnia  usunięcia 
argonu  ze  zbiornika  (a  przy  tym  — ze  względu  na  nie- 
wielką ilość  powstającego  i nietrwałego  argonu 
37Ar  — izotop  trwały  stanowi  dla  niego  nośnik).  Na- 
stępnie argon  gazowy  oddziela  się  od  helu  kondensu- 
jącego  się  na  węglu  drzewnym  chłodzonym  ciekłym 
azotem.  Hel  przepuszcza  się  przez  zbiornik  wielokrot- 
nie, aż  się  odzyska  co  najmniej  90%  wprowadzonego 
niepromieniotwórczego  argonu  36Ar.  Argon  mierzy  się 
licznikiem  wewnętrznego  napełnienia,  połączonym 
z analizatorem  energii  impulsów  (w  celu  eliminowa- 
nia impulsów  o pochodzeniu  innym  niż  od  elektronów 
Augera). 

Liczba  atomów  argonu  wytworzonych  w zbiorniku 
przez  neutrina  ze  Słońca  w ciągu  100-140  dni  ekspo- 
zycji jest  od  lat  liczbą  najwyżej  dwucyfrową  (!). 

Podkreślamy,  że  wartości  otrzymywane  przez  Davisa 
okazują  się  wciąż  niższe  i to  aż  kilkakrotnie,  od  ocen 
teoretycznych,  wynikających  ze  standardowych  mo- 
deli wnętrza  Słońca.  A przecież  wartości  doświadczal- 
ne mogłyby  być  większe  od  teoretycznych  uzyskanych 
przy  założeniu,  że  argon  37 Ar  tworzy  się  wyłącznie 
w oddziaływaniach  neutrin  słonecznych  z chlorem 
S7C1.  Łatwiej  byłoby  przystać  na  istnienie  dodatko- 
wych mechanizmów  wytwarzania  jąder  37Ar  w zbior- 
niku Davisa  niż  na  nieskuteczność  normalnych  Spo- 
sobów jego  powstawania,  związanych  z wielokrotnie 
już  sprawdzonymi  (w  innych  sytuacjach)  mechaniz- 
mami oddziaływań  jąder  atomowych  i cząstek  elemen- 
tarnych. 

Wielokrotnie  sprawdzano  różne  etapy  doświadcze- 
nia, m.in.  badano  wydajność  metody  wydobywania 
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argonu  ze  zbiornika  oraz  badano  niezależnie  reakcje 
jądrowe  związane  choćby  pośrednio  z procesami  pro- 
dukcji neutrin  w Słońcu  albo  z procesem  (32).  Nic 
jednak  nie  wskazuje  na  to,  aby  w tym  tkwiła  przy- 
czyna niezgodności  między  przewidywaniami  teore- 
tycznymi a wynikami  doświadczenia  Davisa.  Raczej 
może  za  mało  jeszcze  wiadomo  o wnętrzu  Słońca 
i może  w standardowych  modelach  Słońca  przyjmuje 
się  zbyt  wysoką  temperaturę  centralną.  Znaczyłoby 
to,  że  wnętrze  Słońca  jest  zbyt  chłodne,  by  protony 
mogły  choć  w niewielkim  stopniu  przechodzić  przez 
wysoką  barierę  potencjału  jądra  berylu  7Be  w reakcji 
(7,  tabela  1).  W takim  razie  po  prostu  nie  istniałyby 
wysokoenergetyczne  neutrina  borowe  z procesu  (8, 
tabela  1),  które  stanowią  wprawdzie  nieznaczną  część 
strumienia  neutrin  słonecznych,  ale  które  się  powinny 
najbardziej  przyczyniać  do  produkcji  argonu  (ok. 
90%)  w reakcji  (32).  Wszystkie  jednak  proponowane 
dotychczas  modele  Słońca  z niższą  temperaturą  w 
centrum  wydają  się  sprzeczne  z nagromadzoną  do- 
tychczas informacją  o Słońcu  i z wyobrażeniami 
o ewolucji  gwiazd. 

Najważniejsze  wnioski  z doświadczenia  Davisa  są 
następujące:  1)  Cykl  CNO  nie  może  być  podstawo- 
wym cyklem  energetycznym  Słońca.  Gdyby  bowiem 
tak  było,  to  szybkość  powstawania  argonu  w zbiorni- 
ku Davisa  musiałaby  o rząd  wielkości  przewyższać 
szybkość  obserwowaną.  2)  Temperatura  centralna  nie 
może  przekraczać  ok.  15  min  stopni.  Gdyby  była 
wyższa,  wtedy  znacznie  większą  rolę  odgrywałaby  II 
gałąź  boczna  cyklu  p-p  i znacznie  więcej  powstawa- 
łoby wysokoenergetycznych  neutrin  borowych,  które 
w zbiorniku  Davisa  produkowałyby  dodatkowe  jądra 
argonu  37  Ar. 

Obecnie  rozważa  się  i próbuje  konstruować  detek- 
tory neutrin  słonecznych  wykorzystujące  inne  reakcje 
z tabeli  4. 

iffina  Detektor  galowy  np.  miałby  pewną  przewagę  nad 
detektory  detektorem  chlorowym,  gdyż  reakcja  (30)  ma  stosun- 
neutrin  kowo  niski  próg  energetyczny,  tak  że  neutrina  pp , 
tj.  z reakcji  (1,  tabela  1),  które  nie  wytwarzają  argo- 
nu w detektorze  Davisa,  produkowałyby  w detekto- 
rze galowym  prawie  2/s  łącznej  ilości  tworzącego 
się  germanu.  Neutrina  pp  muszą  powstawać  w Słońcu, 
niezależnie  od  temperatury  jego  wnętrza,  jeśli  tylko 
hipoteza  jądrowych  źródeł  energii  jest  słuszna.  Tak 
^ więc  detektor  galowy  (albo  rubidowy  czy  mangano- 

il  wy)  o wiele  bardziej  niż  obecnie  stosowany  chlorowy 
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nadawałby  się  do  wykazania,  że  reakcje  jądrowe  rze- 
czywiście muszą  przebiegać  wewnątrz  Słońca.  Nato- 
miast znacznie  trudniejszy  niż  w detektorze  Davisa 
byłby  problem  wydzielenia  niewielkiej  spodziewanej 
liczby  atomów  germanu  71Ge  z kilku  czy  kilkunastu 
ton  preparatu  galowego  (wydzielenie  argonu  — gazu 
szlachetnego  nie  tworzącego  związków — jest  niepo- 
równanie łatwiejsze). 

Astrofizyka  neutrinowa  Słońca  stawia  dopiero 
pierwsze  kroki.  W sferze  projektów  jest  astrofizyka 
neutrinowa  innych  gwiazd.  Móywi  się  np.  o możliwości 
wykrywania  olbrzymich  strumieni  neutrin  tworzących 
się  w końcowych  fazach  ewolucji  gwiazd,  tuż  przed 
ich  eksplozją  jako  supernowych.  Przewiduje  się,  że 
detektory,  czy  może  raczej  absorbenty  owych  neutrin 
będą  miały  rozmiary  o rzędy  wielkości  przewyższa- 
jące niemały  przecież  zbiornik  Davisa. 

Jak  można  jeszcze  inaczej  przekonać  się  bezpośred- 
nio lub  prawie  bezpośrednio,  czy  we  wnętrzach  gwiazd 
przebiegają  reakcje  jądrowe?  Obserwując  nietrwałe 
produkty  tych  reakcji  trafiające  na  powierzchnię 
gwiazdy.  Przykładem  jest  odkrycie  w widmach  gwiazd 
typu  S linii  widmowych  nietrwałego  pierwiastka  tech- 
netu wśród  pasm  ZrO  i linii  wielu  pierwiastków'  cięż- 
kich. Gwiazdy  typu  S zalicza  się  do  czerwonych 
olbrzymów,  w których  wnętrzach  przypuszczalnie 
zachodzi  proces  powolnego  wychwytu  neutronów, 
prowadzący  do  stopniowego  powstawania  atomów 
pierwiastków  coraz  cięższych.  W ten  sposób  tworzyć 
się  może  znaczna  liczba  trwałych  jąder  molibdenu 
Z® Mo,  które  po  wychwycie  neutronu  przekształcają 
się  w cięższy  izotop  molibdenu,  ”Mo  (/,j2  ok.  67  h). 
W przemianie  tworzy  się  z niego  technet  "Tc: 

“Mo  -*  ™Tc-re-+ve>  (22) 

którego  tl{2  wynosi  210  tys.  lat.  Jest  to  wartość  nie- 
wielka w porównaniu  ze  skalą  życia  gwiazdy.  Przy- 
jęcie hipotezy,  że  technet  powstaje  gdzieś  we  wnętrzu 
gwiazd-olbrzymów  i wyniesiony  zostaje  na  powierzch- 
nię, jest  jedynym  wyjaśnieniem,  skąd  się  on  bierze 
w atmosferach  tych  gwiazd.  Przypuszczalnie  duże 
rozpowszechnienie  różnych  pierwiastków  ze  środka 
układu  okresowego  (jak  Sr,  Y,  Zr,  Ba,  La,  Ce,  Pr) 
w atmosferach  gwiazd  typu  S jest  wynikiem  takiego 
samego  procesu. 

W 1972  r.  stwierdzono  występowanie  dwóch  trans- 
uranowców,  ameryku  i kiuru,  w gwieździe  osobliwej 
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ameryk  i ksur  oznaczonej  numerem  katalogowym  HD  25354.  Naj- 
w gwiaździe,  dłużej  żyjące  izotopy  obu  tych  pierwiastków  znane  są 
MD  25354  z laboratoriów  ziemskich.  Oto  one: 

“‘Am  — /1/2  = 7950  lat,  ‘^Cm  — tlj2  « 16,4  min  lat. 
Te  transuranowce  mogły  powstać  jedynie  w procesie 
szybkiego  wychwytu  neutronów,  który  się  zazwyczaj 
wiąże  ze  stadium  supernowej.  Wątpliwe,  by  powstały 
one  w tej  gwieździe,  w której  widmie  obserwuje  się  ich 
linie.  Mogły  jednak  np.  opaść  na  jej  powierzchnię 
wraz  z innymi  produktami  nukleosyntezy,  wyrzuco- 
nymi w przestrzeń  kosmiczną  przez  eksplodującą  w 
pobliżu  gwiazdę  supernową.  Obecność  stosunkowo 
krótkożyjącego  ameryku  wskazuje  na  to,  że  proces 
szybkiego  wychwytu  neutronów  musiał  się  odbywać 
niezbyt  dawno. 

Zagadkę  stanowi  pochodzenie  bardzo  nietrwałego 
promet  prometu  w atmosferze  gwiazdy  osobliwej  HR  465. 
w gwieździe  Najdłużej  żyjącymi  izotopami  prometu  są  “‘Pm 
HR  4S3  (/.y2  = 17,7  lat)  i “!Pm  (/^2  = 5,5  lat).  Skąd  się  bierze 
promet  w takich  ilościach,  że  spośród  153  znanych  linii 
pojedynczo  zjonizowanego  prometu  zaobserwowano 
w widmie  tej  gwiazdy  aż  110?  Albo  jądra  prometu 
tworzą  się  w gwieździe  (i  to  na  powierzchni  lub  niezbyt 
głęboko  pod  nią)  w rezultacie  reakcji  jądrowych  wy- 
wołanych neutronami,  np. 

'”Sm+n  - x:;Pm+/7,  (23) 

lub  protonami: 


-Nd+p^-Pm+«,  (24) 

albo  też  stanowią  one  produkt  rozszczepienia  jąder 
pierwiastków  poza  uranowych.  Oba  wyjaśnienia  wy- 
wołują dalsze  pytania,  np.  skąd  się  biorą  neutrony, 
protony  o odpowiednio  wysokiej  energii,  by  się  mogły 
wbić  do  jąder  pierwiastka  o Z — 60,  oraz  pierwiastki 
pozauranowe.  Jeden  wniosek  jest  niewątpliwy:  obec- 
ność krótkożyjącego  prometu  w atmosferze  gwiazdy 
można  by  wytłumaczyć  tylko  tym,  że  procesy  jądrowe, 
w których  promet  powstaje,  wciąż  jeszcze  trwają. 

Bezpośrednie  dowody  na  to,  że  różne  ważne  re- 
akcje jądrowe  dziś  jeszcze  przebiegają  w gwiazdach, 
nie  są  może  kompletne.  Istnieją  jednak  istotne  argu- 
menty teoretyczne  związane  ze  strukturą  i ewolucją 
gwiazd.  Na  ich  poparcie  można  przedstawić  dowód  „skamieliny'* 
rzeczowy:  „skamieliny”  pozostałe  do  dziś  po  owych 
reakcjach,  czyli  produkty  reakcji  jądrowych  — różne 
jądra  atomowe.  Z dzisiejszego  rozpowszechnienia 
pierwiastków  i ich  izotopów  odczytać  można  historię 
materii,  a historię  tę  w znacznym  stopniu  tworzyły 
procesy  jądrowe  przebiegające  w gwiazdach. 
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Powstawanie  pierwiastków 
chemicznych 

Bronisław  Kuchowicz 


Do  połowy  lat  czterdziestych  sądzono,  że  pierwiastki 
chemiczne  powstały  w pewnej  określonej  chwili  przed 
^utworzeniem  się  gwiazd.  Usiłowano  więc  wyjaśnić  ich 
powstanie  za  pomocą  jednego,  uniwersalnego  mecha- 
nizmu. Większość  owych  teorii  uniwersalnej,  kosmicz- 
nej syntezy  pierwiastków  (czy  raczej  nukleosyntezy  — 
w odróżnieniu  od  syntezy  chemicznej)  może  już  dziś 
zainteresować  jedynie  historyków  nauki.  Przypuszcze- 
nia związane  z różnymi  hipotetycznymi  mechanizma- 
mi powstania  pierwiastków  nie  zgadzały  się  z wynika- 
teoria  mi  obserwacji.  Próbę  czasu  przetrwała  tylko  teoria 
a&fe-feetć*-  alfa-beta-gamma,  wysunięta  przez  R.  A.  Alphera, 
gamma  H.  Bethego  i G.  A.  Gamowa  w 1948  r.  Twórcy  jej 
próbowali  wyjaśnić  przebieg  uniwersalnej  krzywej 
rozpowszechnienia  (rys.  2 i 3 z artykułu  ->  Rozpo- 
wszechnienie pierwiastków  chemicznch  i molekuł  we 
Wszechświecie)  zachodzeniem  reakcji  jądrowych  we 
wczesnych  fazach  ewolucji  Wszechświata.  Obecnie, 
teoria  ta  pozwala  zrozumieć,  na  gruncie  kosmologii 
oraz  fizyki  jądra  atomowego  i cząstek  elementar- 
nych, jak  utworzyły  się  we  Wszechświecie  pierwsze 
jądra  atomowe.  Były  to  jądra  najlżejsze  — tylko  wo- 
dór i hel,  z których,  w kolejnych  pokoleniach  gwiazd, 
powstały  i do  dziś  powstają  dalsze  pierwiastki.  Procesy 
nukleosyntezy  wciąż  jeszcze  trwają  w przyrodzie, 
i wiążą  się  ściśle  z reakcjami  jądrowymi  przebiegają- 
cymi w gwiazdach  (-*  Reakcje  jądrowe  w gwiazdach); 
(powołując  się  na  wzory  lub  rysunki  z tego  artykułu 
podawać  będziemy  ich  kolejny  numer  wraz  z literą  R). 

Kosmiczna  synteza  pierwiastków 

Dwa  podstawowe  fakty  obserwacyjne  (rozszerzanie 
się  Wszechświata  i wypełnienie  przestrzeni  kosmicz- 
nej promieniowaniem  tła),  w powiązaniu  z ekstrapo- 
lacją znanych  praw  fizycznych  na  minione  epoki, 
wskazują  na  ogromne  zagęszczenie  materii  w pierw- 
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szych  fazach  ewolucji  Wszechświata.  Wówczas  nie 
mogły  istnieć  ani  atomy,  ani  oddzielne  jądra  atomo- 
we. Nie  było  oczywiście  i tych  struktur  astronomicz- 
nych (gwiazd,  galaktyk),  które  są  tak  istotnymi 
składnikami  obecnego  Wszechświata.  Aktualny  stan 
fizyki  cząstek  elementarnych,  teorii  grawitacji,  kos- 
mologii i termodynamiki  pozwala  nam  na  cofnięcie 
w czasie  do  chwili,  gdy  gęstość  materii  sięgała  nie- 
wyobrażalnej wartości  rzędu  1028  g/cm3.  (Nie  znamy 
praw  opisujących  materię  wcześniejszą,  o jeszcze 
większej  gęstości).  Była  to  gęstość  o dziesięć  rzędów 
wielkości  przekraczająca  gęstość  materii  jądrowej 
w centralnych  obszarach  pulsarów  i w jądrach  atomo- 
wych. Skład  owej  pierwotnej  materii  nadgęstej  był  nadgęsta 
znacznie  bogatszy  niż  skład  materii  w jądrach  pulsa-  pramateria 
rów;  występowały  w niej  różne  nietrwałe  cząstki  ele- 
mentarne i w równowadze  z nimi  cząstki  o zerowej 
masie  spoczynkowej : fotony  i neutrina  czyli,  jak  bę- 
dziemy mówić,  promieniowanie  wysokoenergetyczne. 

W miarę  jak  Wszechświat  się  rozszerzał,  obniżała  się 
gęstość  materii  i temperatura,  zmieniał  się  też  skład 
materii  nadgęstej.  Rozpadały  się  krótkożyjące  hipe- 
rony i mezony,  zwiększał  się  udział  nukleonów. 

W temperaturze  ok.  10łl  K (i  przy  gęstości  ok. 

10* 0 g/cm3)  dominującym  składnikiem  ylemu  (jak 
ową  materię  nadgęstą  nazwał  Gamow)  były  neutrony, 
gdy  zaś  temperatura  opadła  dc  10®  K,  protonów  było 
już  prawie  siedmiokrotnie  więcej  niż  neutronów. 

Nic  w tym  dziwnego,  wraz  z rozszerzaniem  się 
Wszechświata  trwał  bowiem  nieustanny  rozpad 
neutronów  (o  których  wiadomo,  że  w warunkach 
laboratoryjnych  mają  okres  połowicznego  zaniku 
ok.  10,8  min)  na  protony,  elektrony  i antyneutrina 
elektronowe: 

n ->p+e~+ve.  (1) 

Jednocześnie  protony  wychwytywały  neutrony,  two- 
rząc pierwsze  jądra  złożone  — deuterony : 


nĄ-p  ->  jD-f  y.  (2) 

Dopóki  średnia  energia  fotonów  znajdujących  się 
w równowadze  z innymi  składnikami  materii  była 
większa  od  energii  wiązania  deuteronu  (2,2  McV),  od- 
działywanie z fotonami  niszczyło  powstające  deute- 
rony.  Dopiero  w temperaturze  109  K i niższej  reakcja 
(2)  prowadzi  do  szybkiego  utworzenia  deuteronów  — 
kosztem  szybko  wyczerpujących  się  neutronów.  Po- 
witanie deuteronów  umożliwia  dalsze  reakcje  tzw. 
syntezy  pierwotnej,  odbywające  się  w ciągu  pierwszej 
godziny  ekspansji  kosmicznej: 

synteza  [D+p  ->  3He+y,  jD  + n — 3H-fy, 

pierwotna 

|D+3D  - 42H e+y,  jD  + *He  ->  (3) 

+ - JH+ji,  *He  + 4He  - 74Be+y. 

W miarę  ekspansji  Wszechświata  rozpadają  się  neu- 
trony; już  po  upływie  godziny  zostaje  zaledwie  V«* 
część  ich  początkowej  ilości  (faktycznie  jest  ich  jeszcze 
mniej,  bo  ulegają  wychwytom  w reakcjach  2 i 3). 
Przeszkodę  w powstawaniu  kolejnych  jąder  przez 
wychwyt  neutronów  i protonów  stanowi  nieistnienie 
jakiegokolwiek,  choćby  krótkożyjącego,  jądra  o licz- 
bie masowej  A — 5;  następną  przeszkodą  jest  nie- 
zwykła nietrwałość  jąder  o liczbie  masowej  A = 8. 
Gdyby  kolejne  pierw-iastki  miały  się  tworzyć  w reak- 
cjach między  jądrami  złożonymi,  w rodzaju  czterech 
ostatnich  reakcji  z grupy  (3),  wtedy  w kolejnych  reak- 
cjach musiałaby  być  pokonywana  coraz  to  wyższa 
bariera  kulombowska.  Tymczasem  z upływem  czasu 
Wszechśw-iat  stygnie,  energia  kinetyczna  cząstek 
stale  się  obniża,  tak  że  ciągu  reakcji  (3)  nie  da  się  już 
kontynuować. 

Choć  przy  obliczaniu  wydajności  syntezy  pierwot- 
nej w rozszerzającym  się  Wszechświecie  wzięto  pod 
uwagę  wszystkie  możliwe  reakcje  jądrowe  między 
kilkudziesięcioma  lekkimi  jądrami,  okazało  się,  że  w 
syntezie  tej  nie  powstają  właściwie  jądra  o liczbie 
masowej  większej  niż  7.  Oto  typowe  wyniki  pierwotnej 
syntezy  kosmicznej  podane  w procentach  wagowych 
składu  otrzymanej  materii:  3He — ok.  0,00004%, 
4He  — ok.  30%,  7Li  — ok.  0,00004%,  jądra  o liczbie 
masowej  A ^ 12  — ok.  0,000006%,  reszta  — wodór 
1H.  Wyniki  liczbowe  różnią  się  nieco,  zależnie  od 
szczegółów  rozważanej  wersji  modelu  rozszerzającego 
się  Wszechświata  (np.  ułamek  wagowy  wytworzonego 
helu  4He  może  się  wahać  od  0,25  do  0,4Ó),  ale  zasad- 
nicze znaczenie  ma  to,  że  w syntezie  pierwotnej  mogły 
powstać  jedynie  wodór  i hel  oraz  lit  (ten  ostatni  głów- 
nie z przemiany  wytworzonego  berylu  7Be).  Więk- 
sza część  obserwowanego  dziś  w gwiazdach  helu  — to 
nie  hel  powstały  w ich  wnętrzach,  lecz  produkt  pro- 
powstan;?  cesów  jeszcze  dawniejszych,  gdy  gwiazdy  nie  istniały, 
jąder  Trzy  najlżejsze  pierwiastki  chemiczne  — to  „skamie- 
najlżejszych  liny’’  pochodzące  z ery  radiacyjnej  ewolucji  Wszech- 
świata (-*  Kosmologia). 


Powstawanie  pierwiastków  chemicznych 
jako  produkt  uboczny  wytwarzania 
energii  w gwiazdach 

Gwiazda  czerpie  energię  z egzoenergetycznych  reakcji 
termojądrowych,  z wyjątkiem  krótkotrwałych  faz 
kontrakcji  grawitacyjnej  (następujących  po  wypaleniu 
określonego  rodzaju  paliwa  jądrowego  w centrum). 

Gwiazdy  pierwszego  pokolenia  powstały  z materii 
zawierającej  produkty  kosmicznej  syntezy  pierwot- 
spalanie  nej.  Najdłużej  trwający  etap  ich  ewolucji  — to  spalanie 
wodoru  wodoru  w cyklu  pp  (materia  nie  zawierała  w swoim 
składzie  jąder-katalizatorów  cyklu  CNO).  Zależnie 
od  masy  gwiazdy  (-*  Ewolucja  gwiazd),  po  wypaleniu 
w'odoru,  mógł  przebiegać  dłuższy  lub  krótszy  ciąg 
procesów  termojądrowych,  w których  z jąder  lżej- 
szych tworzyły  się  jądra  coraz  to  cięższe.  Ale  nawet 
w gwiazdach  o największej  masie  nie  mogły  powstać 


tym  sposobem  jądra  atomowa  o liczbach  masowych 
większych  niż  60.  W egzoenergetycznych  reakcjach 
termonuklearnych  jądra  słabiej  związane  nie  mogą 
się  tworzyć  z jąder  silniej  związanych. 

Spalanie  w'odoru  w gwieździe  zwiększa  zawartość  sPa'anfi0 
helu.  Następny  pod  względem  ważności  proces  ter- 
monuklearny  to  spalanie  helu,  podczas  którego  gwiaz- 
da opuszcza  ciąg  główny  i zatacza  charakterystyczne 
pętle  na  wykresie  Hertzsprunga-Russella  w obszarze 
olbrzymów  (->  Ewolucja  gwiazd,  rys.  2),  przechodząc 
przez  fazy  niestabilności  pulsacyjnej.  Jest  wtedy  na- 
wet możliwa  powolna  utrata  materii  przez  gwiazdę. 

W procesie  spalania  helu  tworzy  się  nie  tylko  naj- 
pospolitszy izotop  węgla  ,2C  w reakcjach  (R-8) 
i (R-9),  ale  i najpospolitsze  izotopy  tlenu  i neonu. 

Jądra  lftO  powstają  przez  przyłączenie  dalszej  cząstki 
a w reakcji  (R-l  1)  do  już  wytworzonego  jądra  węgla 
12C;  analogicznie,  z tlenu  ltO  tworzy  się  neon  20Ne. 

Powyższe  procesy  nukleosyntezy  odbywają  się  w sta- 
dium olbrzymów,  przez  które  przechodzi  znaczna 
część  gwiazd.  Fakt  ten  tłumaczy  większe  rozpowszech- 
nienie jąder  „altowych”  12C,  160  i 20Ne  niż  jąder  z ni- 
mi sąsiadujących.  Jest  też  zrozumiałe,  dlaczego  tlen, 
węgiel  i neon  zajmują  trzecie,  czwarte  i szóste  miejsce 
w kolejności  rozpowszechnienia  (str.  982  rys.  2). 

Poza  tym  widać,  dlaczego  na  uniwersalnej  krzywej 
rozpowszechnienia  występują  charakterystyczne  mi- 
nima lokalne  dla  trzech  lekkich  pierwiastków:  litu, 
berylu  i boru.  Nie  mogą  one  powstać  z helu,  który 
spala  się  od  razu  na  węgiel  i dalsze  pierwiastki  (pa- 
rzyste!). Nie  mogą  też  powstać  w większych  ilościach 
podczas  spalania  wodoru,  mimo  że  powstają  np.  w ga- 
łęziach bocznych  cyklu  pp , mają  jednak  duże  prze- 
kroje czynne  dla  różnych  procesów  z tego  cyklu  i po- 
wstają jedynie  przejściowo  podczas  przemiany  wo- 
doru w hel. 

Produkty  spalania  helu  w centrum  gwiazdy  mogą 
same  „wstąpić”  w reakcje  jądrowe  postaci  (R-23  — 
tabela  2)  i (R-24  — tabela  2),  jeśli  tylko  masa  gwiazdy 
jest  wystarczająco  duża,  by  pod  wpływem  sił  grawita- 
cyjnych mogło  nastąpić  kolejne  zagęszczenie  i pod- 
grzanie jądra  gwiazdy.  Analogiczna  sytuacja  może  się 
powtarzać  jeszcze  kilkakrotnie,  po  zużyciu  kolejnego 
paliwa  w jądrze  gwiazdy.  Do  zapłonu  następnego 
paliwa  dochodzi  tym  łatwiej,  im  większa  jest  masa 
gwiazdy,  przy  czym  stale  rośnie  temperatura  i gęstość 
w centrum.  W reakcjach  między  dwoma  jądrami  mogą 
powstawać  coraz  to  bardziej  różnorodne  produkty 
końcowe.  W reakcjach  spalania  węgla  (R-23  — ta- 
bela 2)  mieliśmy  aż  pięć  końcowych  możliwości; 
zwróćmy  uwagę  na  pojawienie  się  swobodnych  neutro- 
nów i fotonów.  W dalszych  fazach  spalania  termo- 
nuklearnego  powstaje  i oddziałuje  z sobą  coraz  to 
większa  liczba  różnych  rodzajów  jąder,  a także  swo- 
bodne neutrony,  protony  i kwanty  y,  w-reszcie  zbliża- 
my się  do  równowagi  między  nimi,  i w składzie  mie- 
szaniny jąder  zaczynają  przeważać  te,  które  są  naj- 
trwalsze. Takimi  najtrwalszymi  jądrami  są  jądra  że- 
lazowców.  Zespół  procesów,  przebiegających  w wa- 
runkach równowagi,  nazwano  procesem  e (z  ang.  proces  e 
eąuilibrium  — równowaga).  Wydaje  się,  że  proces  ten 
jest  końcową  fazą  aktywnego  okresu  ewolucji  gwiaz- 
dy. Faza  ta  przebiega  bardzo  szybko  i kończy  się 
wybuchem  rozrzucającym  w przestrzeń  dużą  część 
produktów  tego  procesu,  a także  procesów  poprzed- 
nich, których  produkty  zawarte  są  w bardziej  ze- 
wnętrznych warstwach  gwiazdy  (rys.  1).  Dziś  nazwa 
procesu  e obejmuje  nie  jakiś  hipotetyczny,  odrębny 
od  innych  procesów  jądrowych  w gwieździe  mecha- 
nizm powstawania  jąder  żelazowców,  lecz  jest  raczej 
skrótem,  pod  który  podstawiamy  wiele  już  poznanych 
i zlokalizowanych  w różnych  obiektach  procesów 
spalania  pierwiastków  o liczbach  atomowych  Z ^ 14 
(a  więc  krzemu,  siarki,  wapnia  itd.),  w których  po- 
wstają jądra  coraz  to  cięższe  aż  do  żelazowców. 

Maksimum  rozpowszechnienia  żelazowców  (str. 

983,  rys.  3)  jest  lokalne,  a nie  bezwzględne.  Stąd  wy- 
nika, że  tylko  niewielka  część  materii  we  Wszech- 
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świecie  przeszła  przez  proces  e.  Mimo  że  skład  che- 
miczny materii  zmienia  się  w określonym  kierunku, 
oraz  że  stale  wzrasta  udział  pierwiastków  cięższych 
od  wodoru  i helu,  to  niepodona  sobie  wyobrazić,  by 
nawet  za  sto  miliardów  lat  rozpowszechnienie  żela- 
zowców  było  największe  ze  wszystkich  pierwiastków. 

przed  wybuchem  po  wybuchu 


Rys.  1.  Struktura  i skład  chemiczny  masywnej  gwiazdy  (10  M@  ^ 
^ Af  60  A/0)  tuż  przed  wybuchem  (po  lewej)  oraz  skład  che- 
miczny materii  po  wybuchu  (po  prawej).  Dla  stanu  przed  wybu- 
chem podano  (po  lewej  stronic):  u góry  — reakcje  stacjonarnego 
spalania  przebiegające  w kolejnych  warstwach;  pośrodku  — 
gęstość  średnią  i temperaturę  każdej  z tych  warstw;  u dołu  — 
skład  chemiczny  warstwy.  Dla  stanu  po  wybuchu  podano  (z  pra- 
wej strony):  u góry  — procent  masy  gwiazdy,  zawarty  w danej 
warstwie  (wyrzucany  w przestrzeń),  a także  ważniejsze  nuklidy, 
które  przeżyły  wybuch ; u dołu  — nuklidy  wytworzone  w danej 
warstwie  podczas  wybuchu  oraz  odbywające  się  podczas  niego 
procesy. 

Obszar  ciemnoniebieski  w środku  oznacza  ewentualną  pozo- 
stałość po  gwieździe  (puJsar,  czarna  dziura).  Litery  p i r wskazują 
na  odpowiednie  procesy  nukleosyntczy,  litera  s na  obecność  pro- 
duktów procesu  s 

ewolucja  Naszkicowany  schemat  powstawania  pierwiastków 
gwiazd  w trakcie  ewolucji  gwiazd  i pokolenia  można  prze- 
f i pokolenia  nie?ć  ~ z Pewn4  modyfikacją  — na  dalsze  pokolenia 
gwiazd,  uwzględniając  przede  wszystkim  zmianę  skła- 
du chemicznego  materii  międzygwiazdowej,  o której 
przyjmuje  się,  że  powstają  z niej  kolejne  pokolenia 
gwiazd.  Różnego  typu  niestabilności  w późnych  sta- 
diach ewolucji  gwiazd  prowadzą  do  powolnej  lub 
gwałtownej  utraty  masy  (np.  wybuch  gwiazdy  super- 
nowej), zatem  ośrodek  międzygwiazdowy  wzbogaca 
się  stopniowo  w pierwiastki  coraz  cięższe.  Gwiazdy 
drugiego  pokolenia  mogą  już  zawierać  pierwiastki 
chemiczne  aż  do  żelazowców  włącznie.  Jeśli  gwiazda 
drugiego  pokolenia  ma  dość  dużą  masę,  to  w jej  wnę- 
trzu zawierającym  jądra  węgla,  wodór  będzie  się 
spalał  w cyklu  CNO.  Stosunek  ilościowy  jąder-kata- 
lizatorów  ustala  się  wtedy  zgodnie  z wyrażeniem 
(R-13),  czyli  95%  początkowej  liczby  jąder  węgla  ,2C 
przechodzi  w jądra  azotu  l4N,  1%  tej  liczby  — w jądra 
rzadszego  izotopu  węgla  nC.  Duże  rozpowszechnienie 
azotu  we  Wszechświecie  (piąte  miejsce)  jest  wynikiem 
procesów  spalania  wodoru  w gwiazdach  II  i następ- 
nych pokoleń. 

Istotną  cechą  jąder  żelazowców  są  duże  przekroje 
czynne  na  reakcje  typu  (/i,  y).  Zatem  w gwieździe  II 
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pokolenia  neutrony  powstające  w reakcjach  (R-23- 
24  — tabela  2)  i innych  mogą  wytwarzać  z jąder  że- 
lazowców jądra  jeszcze  cięższe. 


Powstawanie  pierwiastków  ciężkich 
w reakcjach  wychwytu  neutronów 

Rozważanie  procesów  wychwytu  neutronów  ułatwia  tablica 
tablica  nuklidów  — graficzne  zestawienie  wszystkich  nuklidów 
znanych  trwałych  i nietrwałych  odmian  jąder  atomo- 
wych. iablicętaką  w zmniejszeniu  przedstawia  rys.  2. 

Czarne  kwadraciki  oznaczają  jądra  trwałe  i długo- 
żyjące,  linia  łamana  otacza  obszar,  w którym  znaj- 
dują się  znane  jądra  promieniotwórcze.  Dwie  linie 
grube  odpowiadają  jądrom,  w których  energia  wiąza- 
nia ostatniego  neutronu  bądź  ostatniego  protonu  jest 
równa  zeru  (i?»  = 0 lub  Bp  — 0);  obejmują  one  ob- 
szar, wewnątrz  którego  mogą  istnieć  jądra  atomowe. 

Czarne  kwadraciki  łączą  się  z ścieżką  trwałości  (— ► Ją- 
dra atomowe  i ich  wzbudzenia),  która  dzieli  obszar 
istnienia  jąder  atomowych  na  dwie  części.  W części 
górnej  (między  linią  Bp  ^ Oa  ścieżką  trwałości)  jądra 
promieniotwórcze  mają  na  ogół  za  dużo  protonów. 

Przemiana  /?+  albo  wychwyt  elektronu  sprowadzają 
jądra  takie  bliżej  ścieżki.  W części  dolnej  (między 
linią  Bn  "0  a ścieżką  trwałości)  jądra  promienio- 
twórcze zawierają  za  dużo  neutronów.  Przemiana  /?-, 
w której  wyniku  jeden  z neutronów  w jądrze  za- 
mienia się  w proton,  przesuwa  takie  jądro  skośnie 
w lewo  ku  górze,  zbliżając  je  ku  ścieżce  trwałości  od 
dołu. 

Począwszy  od  liczby  masowej  A = 50  trwałe  jądra 
atomowe  mają  zazwyczaj  duże  przekroje  czynne  (rzę- 
du barna  i większe)  na  wychwyt  neutronu  (//,  y).  Wy- 
jątkowo małe  przekroje  charakteryzują  jedynie  nie- 
które jądra  magiczne.  Strzałka  na  rys.  2 wskazuje  na 


Rys.  2.  Tablica  nuklidów  w schematycznym  ujęciu.  Z liczba  pro- 
tonów, .V  liczba  neutronów 


trwałe  jądra  żelazowców  — końcowe  produkty  łań- 
cucha reakcji  termojądrowych,  stanowiące  zarazem 
punkt  wyjściowy  dla  dalszej  nukleosyntezy.  Ponieważ 
procesy  wychwytu  neutronów  zaczynają  się  od  ją- 
der — zarodzi  z grupy  żelazowców,  wystarczy  w dal- 
szych rozważaniach  ograniczyć  się  do  tej  części  ta- 
blicy nuklidów,  która  zawiera  jądra  o liczbie  proto- 
nów Z ^ 25  i liczbie  neutronów  N ^ 30  (rys.  3).  Wy- 
chwyt neutronów,  zaczynający  się  od  trwałych  ją- 
der-zarodzi,  prowadzi  zawsze  na  prawo  od  ścieżki 
trwałości,  tj.  w obszar  jąder  promieniotwórczych  ma- 
jących za  dużo  neutronów.  Nawet  jeśli  po  kilku 
pierwszych  wychwytach  neutronów  jądro  wychwytu- 
jące pozostanie  trwałe,  to  i tak,  w rezultacie  któregoś 
z kolei  wychwytu,  powstanie  jądro  wykazujące  pro- 
mieniotwórczość /? 


powolny  W poprzednim  artykule  rozważaliśmy  sytuację, 
a szybki  w której  z trwałego  jądra-zarodzi  **Fe  dopiero  po 
wychwyt  wychwycie  trzeciego  neutronu  utworzyło  się  nietrwałe 
neutronów  jądro  ”Fe.  W przemianie  p-  (R-20)  powstało  z niego 
trwałe  jądro  kobaltu  ?,!Co,  zdolne  do  wychwytu 
czwartego  neutronu.  Zwróćmy  uwagę  na  wartość 
liczbowa  okresu  połowicznego  zaniku  nietrwałego 
jądra  ™Fe:  45  dni.  Fakt,  że  jądro  to  zdążyło  się  roz- 
paść, i że  dopiero  trwały  produkt  jego  przemiany p 
wychwycił  czwarty  neutron,  dowodzi  powolności 
procesu  wychwytu.  Inaczej  mówiąc,  średni  odstęp 
czasu  tn  między  kolejnymi  wychwytami  neutronu 
przez  to  samo  jądro  jest  dosyć  duży.  Oczywiście  od- 
stęp ten  musi  być  większy  niż  okres  połowicznego  za- 
niku jądra  ™Fe  ze  względu  na  przemianę  p~.  Ale  w 
innych  przypadkach  czas  tn  może  wcale  nie  być  więk- 
szy od  tp  — okresu  połowicznego  zaniku  ze  względu 
na  rozpad  p~  powstających  w tych  procesach  jąder. 
Ze  względu  na  relacje  między  tn  i tp  przebiegający  ze- 
spół reakcji  i rozpadów  stanowi  łącznie  albo  proces 
jr  (z  ang.  s/ow  — powolny),  albo  proces  r (z  ang.  rapid 
— szybki): 

1)  Gdy  tn  > tp,  to  wychwyt  kolejnych  neutronów 
odbywa  się  stosunkowo  powoli.  Neutrony  są  wychwy- 
tywane przez  jądro  trwałe,  gdyż  jeśli  powstanie  jądro 
nietrwałe,  to  i tak  zdąży  się  rozpaść  przed  wychwytem 
następnego  neutronu.  Jest  to  proces  s.  Jego  ilustracją 
jest  omówiony  wyżej  przykład. 

2)  Gdy  tn  < tp,  wtedy  wychwyt  odbywa  się  szybko. 
Odstęp  czasu  między  kolejnymi  aktami  wychwytu 
neutronów  przez  to  samo  jądro  jest  tak  krótki,  że 
jądro  nie  zdąży  się  rozpaść,  dopóki  trwa  wychwyt. 
Sytuacja  ta  odpowiada  procesowi  r. 

Każdy  z tych  procesów  przebiega  w charakterystycz- 
nych dla  siebie  warunkach  w odpowiedniej  fazie  ewo- 
lucji gwiazdy. 

proces  s Nukleosynteza  pierwiastków  ciężkich  w procesie 
5 — to  jak  gdyby  powolne  wdrapywanie  się  jąder-za- 
rodzi  z lewego  dolnego  rogu  na  rys.  3 wzdłuż  ścieżki 
trwałości  w górę  na  prawo,  ku  coraz  wyższym  war- 
tościom liczby  masowej  A i liczby  porządkowej  Z. 
Podczas  trwania  tego  procesu  jądra  atomowe  nie  od- 
dalają się  od  ścieżki  trwałości  o więcej  niż  jedną  lub 


liczba  masowa  A 

Rys.  3.  Schemat  ogólny  przebiegu  procesów  s i r 

dwie  wartości  liczby  neutronów  N.  Gdy  tylko  się  od 
niej  oddalą,  przemiana  P~  sprowadza  je  na  nią  z po- 
wrotem. Proces  ten,  schematycznie  przedstawiony 
linią  łamaną  „s”  na  rys.  3,  ilustrujemy  powiększonym 
fragmentem  tablicy  nuklidów,  zawierającym  odcinek 
ścieżki  trwałości  między  liczbami  masowymi  151 
i 161.  Najlżejszym  nuklidem  na  rysunku  jest  samar 
15®Sm.  W rezultacie  wychwytu  neutronu  tworzy  się 
z niego  nietrwały  '“Sm,  który  może  przed  swym  roz" 
padem  wychwycić  następny  neutron,  przechodząc 


Rys.  4.  Fragment  tablicy  nuklidów  ze  ścieżką  procesu  j(=»oraz 
zaznaczeniem  procesów  r (strzałki  ukośne)  i p (strzałki  pionowe 
i poziome  - ->  i w**-).  Liczba  neutronów  wzrasta  od  strony  lewej 
ku  prawej,  Siczba  protonów  — ku  górze.  Dla  nuklidów  trwałych 
podano  rozpowszechnienie  (zawartość  procentowa  poszczegól- 
nych izotopów  danego  pierwiastka),  dla  nietrwałych  — okresy 
połowicznego  zaniku  w stanie  podstawowym 

w trwały  łJ*Sm.  Jeśli  natomiast  jądro  l*x Sm  zdąży  się 
rozpaść  przed  wychwytem  neutronu,  to  dalszy  neu- 
tron zostanie  wychwycony  już  przez  trwały  europ 
™jEu.  Dla  jądra  ^Sm  należy  uwzględnić  dwa  możliwe 
procesy  — przemianę  p~  i reakcję  ( n , y)  — gdyż  dla 
niego  nie  jest  spełniony  warunek  tn  tp  (natomiast 
oba  charakterystyczne  czasy  są  wielkościami  niemal 
tego  samego  rzędu);  w miejscu  tym  szlak  procesu  s 
rozgałęzia  się.  Na  rys.  4 widać  jeszcze  jedno  rozgałę- 
zienie procesu  s. 

Rozgałęzienia  nie  zmieniają  w istotny  sposób  prze- 
biegu procesu  5.  Jego  cechą  charakterystyczną  jest 
pojawianie  się  przez  dłuższy  czas  (setki  tysięcy  a na- 
wet miliony  lat)  niewielkiej  liczby  neutronów,  tak  że 
średnio  na  jedno  jądro-zarodź  przypada  wychwyt 
neutronu  raz  na  kilka  miesięcy  albo  kilka  do  kilku- 
dziesięciu czy  nawet  kilkuset  lat.  Proces  s nie  wy- 
twarza jednak  wszystkich  izotopów  pierwiastków  cięż- 
kich. Trwałe  izotopy  pierwiastków  parzystych,  które 
znajdują  się  najdalej  na  prawo  na  rys.  4,  nie  mogą 
w nim  powstać.  Tak  więc,  np.  najcięższy  izotop  gado- 
linu, x®°Gd,  nie  może  się  wytworzyć  z lżejszego  izotopu 
gadolinu  przez  wychwyt  neutronu,  gdyż  “jGd  jest 
jądrem  o niezwykle  krótkim  okresie  połowicznego 
zaniku  i po  powstaniu  w procesie  s przechodzi  przez 
przemianę  P~  w trwały  izotop  terbu  O^Tb).  Z terbu 

Tb  po  wychwycie  neutronu  i przemianie  p~  tworzy 
się  dysproz  XJJD y,  nie  może  natomiast  powstać  ga- 
dolin x™Gd.  Szlak  procesu  5 nie  przebiega  także  przez 
najlżejsze  izotopy  pierwiastków  parzystych,  w rodzaju 
gadolinu  ł“Gd  czy  łJjDy  z rys.  4. 

Jak  wynika  z tego  rysunku  w procesie  s nie  mogą 
powstać  ani  najcięższe,  ani  też  najlżejsze  izotopy  nie- 
których pierwiastków  parzystych.  Również  nie  mogą 
powstać  nietrwałe  pierwiastki  ciężkie,  tworzą  się  je- 
dynie pierwiastki  trwałe  (tj.  takie,  które  mają  przy- 
najmniej jeden  trwały  izotop).  Ostatnim  pierwiastkiem 
trwałym  w układzie  okresowym  jest  bizmut,  który  ma 
tylko  jeden  trwały  izotop  2™Bi.  Obszar  niezwykle  krót- 
kożyjących.  pierwiastków  między  bizmutem  a torem 
nie  pozwala  na  przedłużenie  szlaku  procesu  s do  nie- 
trwałych wprawdzie,  ale  długożyjących  izotopów 
uranu  i toru,  tworzących  tak  zwaną  pierwszą  wyspę  pierwsza 
trwałości  (oczywiście  względnej),  leżącą  na  przedłu-  wyspa 
żeniu  ścieżki  trwałości.  Przyczyną  tego  jest  przemiana  trwałości 
a — dominujący  sposób  rozpadu  jąder  nietrwałych 
cięższych  od  bizmutu.  W wyniku  tej  przemiany 
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następuje  „zawracanie”  powstających  jąder  ciężkich 
w obszar  jąder  lżejszych,  wytworzenie  zamkniętej 
pętli,  kończącej  proces  5.  Spójrzmy  na  rys.  5.  Jeśli 
trwałe  jądro  2^Bi  wychwyci  neutron,  wtedy  powstaje 
w jednym  z dwóch  możliwych  stanów  izome- 
rycznych. Ze  stanu  o okresie  połowicznego  zaniku 
ok.  5 dni  jądro  to  przechodzi  przez  przemianę  p~ 
w znany  emiter  cząstek  a,  polon  2“Po  (r1/2  « 138  dni). 
W przemianie  a tworzy  się  z niego  ołów  2^Pb.  Jeśli 
'‘®Bi  powstanie  w stanie  długożyjącym  (/1/2  = 2,6  min 
łat),  wtedy  jeszcze  przed  rozpadem  zdąży  wychwycić 
następny  neutron.  W ten  sposób  powstałe  jądro  211Bi 


■** (skośnie  w lewo)  przemiana/?" 

(skośnie  w prawo)  wychwyt  eiektronu 

(skośnie  w dół)  rozpad  a 

Rys.  5.  Przebieg  końcowej  części  procesu  s 

Ui Iz  -■  2,15  min  przez  przemianę  a przechodzi  w tal 
TiTl,  to  zaś  jądro  przez  przemianę  p~  przechodzi 
w ołów  2 a’ Pb.  Przyłączanie  neutronów  przez  bizmut 
tworzy  aż  dwie  pętle  obiegu  zamkniętego  pod  koniec 
szlaku  procesu  Choćby  proces  ten  trwał  miliony 
lat,  w rezultacie  powolnego  dołączania  neutronów  do 
jąder  o liczbie  masowej  A ^ 210  można  z jąder  tych 
otrzymać  na  koniec  co  najwyżej  jądra  ołowiu  i biz- 
mutu, nigdy  jednak  nie  uda  się  „przepompować” 
ich  do  obszaru  poza  bizmutowego. 

„Przepompowanie”  takie  jest  natomiast  możliwe 
proces  r w Procesie  r.  W rezultacie  neutronizacji  zagęszczają- 
cego się  wnętrza  gwiazdy  przez  reakcje  typu  (R-21) 
powstają  ogromne  ilości  swobodnych  neutronów,  stę- 
żenie ich  sięga  wartości  1025  neutr.  r-^w  w 1 cm3 
i większych.  Część  tych  neutronów,  . hodząca  na 
zewnątrz,  napromieniowuje  jądra-zarodzie  z wyrzu- 
canych w przestrzeń  warstw  zewnętrznych.  Na  jedno 
takie  jądro  może  nawet  przypadać  kilkaset  neutro- 
nów. Jeśli  znów  wystartujemy  z lewego  dolnego  naroż- 
nika rys.  3,  gdzie  znajdują  się  trwałe  jądra  żelazow- 
ców,  to  w ciągu  pierwszych  paru  sekund  jądro-zarodź 
wychwyci  kolejno  tyle  neutronów,  że  przesunie  się  aż 
pod  granicę  obszaru,  w którym  mogą  jeszcze  istnieć 
jądra,  a więc  energia  wiązania  ostatniego  neutronu 
w tym  jądrze  będzie  wielkością  rzędu  1-2  MeV.  Poło- 
żenie jądra  odpowiadać  będzie  miejscu  tuż  przy  krzy- 
wej Bn  = 0 z rys.  2.  Dopóki  jądro  się  tak  bardzo  nie 
przesunęło  w prawo,  wciąż  spełniony  był  warunek 
in  < tf).  Jednak  w owym  skrajnym  położeniu  (które 
odpowiada  miejscu  oznaczonemu  literą  M na  rys.  3) 
okres  połowicznego  zaniku  przemiany  p-  dla  owego 
jądra  staje  się  wielkością  porównywalną  z odstępem 
czasu  między  kolejnymi  wychwytami  neutronu,  a obie 
te  wartości  nie  przekraczają  ułamków  sekundy.  Do 
jądra  w'  tym  miejscu  nie  da  się  już  dołączyć  dalszego 
neutronu,  zanim  nie  nastąpi  przemiana  Produkt  tej 
przemiany  znów  będzie  mógł  przyłączyć  jeden  lub  parę 
neutronów  w czasie  rzędu  ułamków  sekundy,  zanim 
stanie  się  tak  krótkożyjący,  że  zdąży  doznać  następ- 

998 


nej  przemiany  p~  przed  wychwytem  kolejnego  neutro- 
nu. Sytuacja  przypomina  w rezultacie  przebieg  pro- 
cesu s-  z pewną  istotną  różnicą.  Szlak  procesu  r od- 
dala się  najpierw  od  ścieżki  trwałości  i przybliża  do 
hipotetycznej  linii  Bn  = 0,  by  biec  następnie  wzdłuż 
tej  ostatniej,  mniej  więcej  równolegle  do  szlaku  pro- 
cesu s.  Na  uwagę  zasługuje  stromy  kształt  przebiegu 
szlaku  procesu  r przy  liczbach  magicznych  neutronów 
N = 50,  82  i 126.  Wiąże  się  to  z trudnością  dołączania 
w tych  miejscach  kolejnego  neutronu  do  zamkniętej 
powłoki. 

Podczas  gdy  szlak  procesu  ^ biegnie  na  przemian 
przez  jądra  trwałe  i /^--promieniotwórcze,  szlak  pro- 
cesu r prowadzi  przez  jądra  wyłącznie  nietrwałe,  o zni- 
komych okresach  połowicznego  zaniku.  Gdy  proces  r 
się  skończy  (a  trwa  on  zapewne  nie  więcej  niż  kilka 
minut  poczas  eksplozji  gwiazdy),  wszystkie  jego  pro- 
dukty są  nietrwałe  i dopiero  po  pewnej  liczbie  kolej- 
nych przemian  p~  mogą  się  stać  jądrami  trwałymi. 

Ową  stabilizację  produktów  procesu  r zaznaczyliśmy 
na  rysunku  3 linią  przerywaną  dla  jednego  jądra;  nie 
sposób  zrobić  to  dla  wszystkich  produktów  procesu  r , 
gdyż  wtedy  rysunku  stałby  się  bardzo  nieczytelny. 

Jeśli  tylko  strumień  neutronów  w procesie  r był 
dostatecznie  duży,  wtedy  mogły  powstać  jądra  o du- 
żych wartościach  liczby  masowej,  być  może  nawet 
A « 300.  Z badań  laboratoryjnych  nad  pierwiastkami 
transuranowymi  wiemy,  że  im  cięższe  jest  jądro,  tym 
łatwiej  ulega  samorzutnemu  rozszczepieniu,  jak  i roz- 
szczepieniu pod  działaniem  neutronów.  Oba  te  zja- 
wiska nie  pozwalają  na  przedłużanie  szlaku  procesu  r 
ku  dowolnie  dużym  wartościom  liczb  masowych. 
Ekstrapolacja  danych  laboratoryjnych  pozwala  przy- 
puszczać, że  w wyniku  rozszczepienia  (samorzutnego 
i wywołanego  przez  neutrony)  proces  r kończy  się 
gdzieś  w pobliżu  liczby  masowej  A ^ 300.  Na  skutek 
rozszczepienia  tworzą  się  jądra  lżejsze  — fragmenty 
rozszczepienia ; to  zawracanie  fragmentów  rozszcze- 
pienia w środkowe  rejony  tablicy  nuklidów  (zazna- 
czone strzałkami  na  rys.  3)  stanowi  odpowiednik  pętli 
kończącej  proces  s. 

W wyniku  procesu  r i następujących  po  nim  prze- 
mianach P~  można  dotrzeć  w pobliże  pierwszej  wyspy 
trwałości.  Tak  też  mogły  powstać  pierwiastki  trans- 
uranowe,  znacznie  krócej  żyjące  niż  uran  i tor.  Nie 
dotrwały  one  na  Ziemi  do  dziś,  mogą  jednak  wystę- 
pować w promieniowaniu  kosmicznym  (powstającym 
w eksplozjach  gwiazd  supernowych,  podczas  których 
tworzą  się  produkty  procesu  r),  a może  i gdzie  indziej 
w kosmosie,  gdzie  proces  r nie  tak  dawno  się  odbył. 

Proces  r może  doprowadzić  do  powstania  pewnej  druga 
grupy  jąder  z tzw.  drugiej  wyspy  trwałości,  w pobliżu  wyspa 
hipotetycznego  jądra  podwójnie  magicznego  o Z = trwałości 
= 114  i N = 184.  Istnienie  takiej  wyspy  przewidują 
od  lat  teoretycy  (-►  Jądra  w stanie  ekstremalnym). 

Hipotetyczne  pierwiastki  superciężkie  z tej  wyspy 
byłyby  oczywiście  nietrwałe,  mogłyby  jednak  być  na 
tyle  długożyjące,  że  warto  ich  poszukiwać,  jeśli  nie 
w materii  ziemskiej,  to  wśród  produktów  reakcji  ją- 
drowych w laboratorium,  także  w pierwotnym  pro- 
mieniowaniu kosmicznym  pochodzącym  z eksplozji 
odległych  gwiazd. 

Produkty  procesu  r po  jego  zakończeniu  zbliżają 
się  do  ścieżki  trwałości  na  rys.  3 skośnie  w górę  na 
lewo.  Kierunki  kilku  końcowych  przemian  p są  także 
zaznaczone  na  rys.  4.  Łatwo  zauważyć,  że  w procesie  r 
tworzą  się  najcięższe  izotopy  pierwiastków  parzystych, 
które  jak  ^Sm,  i “°Gd  z rys.  4 nie  mogą  powstać 
w procesie  ś.  Produktami  procesu  r jest  też  znaczna 
część  tych  jąder  trwałych,  przez  które  przebiega  szlak 
procesu  Ale  niektóre  jądra  powstające  w procesie  j, 
jak  np.  ^‘Gd  czy  l““Dy  z rys.  4,  nie  mogą  być  produk- 
tami procesu  r.  Są  one  przed  procesem  r „osłaniane” 
przez  swoje  izobary  o niższym  ładunku,  a więc  od- 
powiednio przez  1^Sm  i ^Gd.  Wreszcie  najlżejsze  izo- 
topy pierwiastków  parzystych,  które  nie  mogą  po- 
wstać w'  procesie  j,  tym  bardziej  nie  będą  tworzyć  się 
w procesie  r. 


proces  p 


proces 


Procesy  nukleosyntezy  trzeciego 
rzędu 

Pozostały  jeszcze  dwie  nieliczne  grupy  jąder  o nie- 
wielkim stosunkowo  rozpowszechnieniu,  których  po- 
wstanie nie  wiąże  się  ani  z procesami  pierwszego  rzę- 
du — cgzoenergetycznymi  reakcjami  termonuklear- 
nymi,  ani  też  z procesami  drugiego  rzędu  — wychwy- 
tem neutronów.  Pierwszą  grupę  tworzą  tzw.  jądra  po- 
minięte — najlżejsze  izotopy  niektórych  parzystych 
pierwiastków  ciężkich.  Rozpowszechnienie  każdego 
z nich  jest  małe  (patrz  np.  wartości  liczbow-e  dla  ł^Gd, 
1&flDy  i x**Dy  na  rys.  4),  co  wskazuje  na  powstanie 
ich  w jakimś  procesie  o niezbyt  wysokim  prawdopo- 
dobieństwie. Proces  ten  nazwano  kiedyś  procesem  p, 
przypuszczano  bowiem,  iż  w wyniku  jednej  lub  dwóch 
reakcji  przyłączenia  protonu,  tj.  reakcji  ( p , y),  jądra 
te  mogą  powstać  np.  z produktów  procesu  5 (niekiedy 
nawet  i z produktów  procesu  r).  Proces  p byłby  więc 
procesem  trzeciego  rzędu.  Zasadniczą  trudnością  w 
analizie  tego  procesu  jest  wyjaśnienie,  skąd  biorą  się 
w gwieździe  protony  o tak  wielkiej  energii,  że  mogą 
przejść  przez  wysoką  barierę  kulombowską  wokół 
jąder  ciężkich. 

Powstanie  jąder  pominiętych  znacznie  łatwiej  wy- 
jaśnić, odwołując  się  do  reakcji  fotojądrowych,  które 
mogłyby  przebiegać  w końcowych  fazach  ewolucji 
niektórych  gwiazd  po  osiągnięciu  wysokiej  temperatu- 
ry rzędu  kilku  milionów  stopni.  W warunkach  tych 
pojawiłaby  się  ogromna  ilość  kwantów'  y,  zdolnych 
do  wywołania  całego  ciągu  reakcji  (y,  «),  (y,  p) 
i (y,  a)  w obecnych  w materii  gwiazdnej  produktach 
wychwytu  neutronów.  Na  rys.  4 podano  jako  przy- 
kład, w jaki  sposób  w wyniku  dwóch  kolejnych  reakcji 
(y,  n)  jądro  *™Dy  przechodzi  w jądro  pominięte  ł“Dy. 
Chociaż  obecnie  przeważa  pogląd,  że  jądra  pominięte 
powstają  raczej  w reakcjach  fotojądrowych  niż  przez 
wychwyt  protonów,  to  nadal  utrzymuje  się  nazwa 
procesu  p\  odzwierciedla  ona  to,  że  proces  p prowadzi 
do  wytworzenia  jąder  ciężkich,  o możliwie  najwięk- 
szym udziale  protonów. 

Następna  grupa  jąder  o niewielkim  rozpowszech- 
nieniu, która  nie  twarzy  się  ani  w reakcjach  termo- 
jądrowych, ani  poprzez  wychwyt  neutronów  — to 
jądra  trzech  pierwiastków  lekkich:  litu,  berylu  i boru. 
Do  grupy  tej  zalicza  się  niekiedy  dwa  rzadkie  izotopy 
dwu  najlżejszych  pierwiastków:  *D  i ^He.  Wszystkie 
jądra  z tej  grupy  są  bardzo  nietrwałe  ze  względu  na 
reakcje  termonuklearne.  Choć  np.  deuter,  lekki  izotop 
helu  3He  i lit  mogły  już  powstać  w niew-ielkich  ilościach 
podczas  kosmicznej  syntezy  pierwotnej,  w zasadzie 
ulegają  one  całkowitemu  wypaleniu  we  wnętrzu  gwiaz- 
dy jeszcze  przed  rozpoczęciem  spalania  wodoru.  Pod- 
czas spalania  wodoru  jądra  z tej  grupy  odgrywają 
tylko  rolę  produktów  pośrednich,  stąd  na  krzywej 
rozpowszechnienia  pierwiastków  mamy  wyraźne 
minimum  lokalne  dla  litu,  berylu  i boru,  a na  krzywej 
rozpowszechnienia  izobarów  dołączają  się  minima 
dla  A = 2 i A = 3.  Występuje  natomiast  charaktery- 
styczne podwyższenie  zawartości  owych  pierwiast- 
ków w pierwotnym  promieniowaniu  kosmicznym 
w takim  stopniu,  że  wspomniane  minimum  w pro- 
mieniowaniu tym  praktycznie  nie  występuje. 

Tworzenie  się  jąder  wspomnianej  grupy  nazwrano 
/ krótko  procesem  / (z  ang.  light  — lekki).  Jest  to  jedyny 
proces  nukleosyntezy,  którego  miejscem  jest  przede 
wszystkim  przestrzeń  kosmiczna.  Produkty  nukleo- 
syntezy wyrzucane  podczas  eksplozji  gwiazd  w prze- 
strzeń ulegają  zderzeniom  z jądrami  najbardziej  roz- 
powszechnionego pierwiastka,  wodoru.  Są  to  zde- 
rzenia przy  niezwykle  wielkich  energiach,  jeśli  więc 
już  nastąpią,  jądra  cięższe  ulegną  pokruszeniu  na 
fragmenty  lżejsze.  Gdy  symulowano  takie  zderzenia 
w laboratoriach,  stosując  wysokoenergetyczne  pro- 
tony z akceleratorów  do  rozbijania  jąder  tlenu,  węgla, 
neonu  i azotu  (pierwiastków  od  trzeciego  do  szóstego 
w kolejności  rozpowszechnienia),  obfitymi  produkta- 
mi kruszenia  okazały  się  jądra  2D,  sHe  oraz  izotopy 


litu,  berylu  i boru.  Wszystkim  tym  jądrom  nie  „grozi” 
w przestrzeni  kosmicznej  wypalenie  w procesach  ter- 
mojądrowych, stąd  też  stężenie  ich  w materii  między- 
gwiazdowej  może  być  większe  niż  w gw-iazdach.  Do- 
dajmy, że  analogiczne  procesy  kruszenia  przebiegać 
mogą  w warstwach  powierzchniowych  niektórych 
gwiazd,  gdzie  kruszenie  mogą  powodować  np.  proto- 
ny rozpędzone  w zmiennym  polu  magnetycznym  albo 
fala  uderzeniowa. 

Za  ostatni  proces  nukleosyntezy  trzeciego  rzędu, 
modyfikujący  skład  chemiczny  materii  otrzymanej 
z innych  procesów,  można  uważać  naturalne  przemia- 
ny promieniotwórcze.  W ich  wyniku  w skorupie 
ziemskiej  wciąż  powstają  krótkożyjące  pierwiastki 
pozabizmutowe  (np.  astat  lub  frans  czy  bardziej  znany 
rad)  z długożyjącego  uranu  i toru.  Może  dzięki  sa- 
morzutnemu rozszczepieniu  transuranowców  na  po- 
wierzchni gwiazdy  osobliwej  HR  465  w'ciąż  na  nowo 
tworzą  się  nader  krótkożyjące  jądra  prometu? 


natura?  n© 
przemiany 
promienio- 
twórcze 


dalsze 

pierwiastki  lekkie 
(Mg.  Si.  S,  Ca.  itd) 


pierwotna  synteza  kosmiczna 

— — $5 ► procesy  spalania 
wodoru  i helu 

procesy  spalania 
jąder  cięższych 
przemiana  « 

i samorzutne  rozszczepienie 


pierwiastki 
z grupy  żelaza 
(Fe.  Cr.  Ni) 


(184Os  do  Pm) 

pierwiastki 

pierwiastki 

poza 

ciężkie 

bizmutowe 

("Tc  do  Bi) 

(,92Os) 
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Rys.  6.  Schemat  nukleosyntezy  pierwiastków  chemicznych  we 
wczesnej  fazie  ewolucji  rozszerzającego  się  Wszechświata  oraz 
w gwiazdach  i przestrzeni  kosmicznej.  W kilku  miejscach  umiesz- 
czono typowe  produkty  zaznaczonych  na  rysunku  procesów, 
spotykane  w przyrodzie.  Trzy  typy  procesów  w gwiazdach  za- 
znaczone są  odmiennymi  typami  linii:  a)  procesy  pierwszego 
rzędu  — reakcje  egzoenergetycznc  prowadzące  do  wytwarzania 
energii  (strzałki  pionowe),  b)  procesy  wychwytu  neutronów 
(strzałki  poziome),  c)  procesy  trzeciego  rzędu  (strzałki  biegnące 
ukośnie) 


Rysunek  6 stanowi  zaktualizowaną  wersję  schematu 
nukleosyntezy,  wysuniętego  w 1957  r.  przez  twórców 
współczesnej  astrofizyki  jądrowej:  małżonków  E.  M. 
i G.  Burbidge’ów,  F.  Hoyleła  i W.  A.  Fowlera. 

R.  J.  Tayler  The  Origin  of  the  Chemical  Element s,  London 
1972  (ros.  Moskwa  1975);  B.  Kuchowicz  Problemy  i osiągnięcia 
astrofizyki  jądrowe}.  Część  III.  Powolny  wychwyt  neutronów  w 
gwiazdach , oraz  Część  IV.  Szybki  wychwyt  neutronów  i procesy 
trzeciorzędowe  nukleosyntezy , Post.  Fiz.  24,  669  (1973)  i 25,475 
(1974);  B.  Kuchowicz,  Kosmochemia,  Warszawa  1980. 
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Skorowidz 


A 

absorpcja  antyprotonu  J 07 

— dwufononowa  555 

— dźwięku  relaksacyjna  649 

— fotonu  531 

— hadronu  107 

— hiperonu  107 

— jądrowa  1 07 

— jednofoRonowa  555 

— międzygwiazdowa  927 
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fotony  67,  68,  73,  88.  84,  144,  350,  531 

— antystokesowskie  372 

— stokesowskie  372 

— wirtualne  79,  98,  144,  145 
fotoogniwo  620 
fotoopornik  609.  620 
fotoplastyczność  463 
fotoprzewodnictwo  532,  609 
fotosynteza  710,  870 
friedmanizacja  świata  906 
front  atmosferyczny  833 

— udarowy  648 
funkcja  autokorelacji  195 
— Briilouina  581 

— falowa  39,  75,  250,  252 

atomu  wodoru  252 

kątowa  251 

molekularna  315 

radialna  251 

— gaussowska  278 

— korelacji  134,  212 

— próbna  255 

— przenoszenia  układu  optycznego  390 

— radiacyjna  (radiacja)  873 

— rozdziału  704 

— rozmycia  układu  optycznego  390 

— świecenia  gwiazd  939 
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funkcja  własna  250 
fuzja  jąder  atomowych  197 

G 

gul,  Gal  891 

Galaktyka  916,  928,  936.  939,  942 
galaktyki  935.  940.  941 . 943 

— eliptyczne  939-94! 

— nieregularne  939 
— Seyferta  925,  942 

— soczcwkowatc  939 

— spiralne  939,  943 

— typu  N 943.  952,  954 
G.  G.  Galileusz  27 

gulwanometr  z nadprzewodnikowa  cew- 
ką 432 

gałąź  akustyczna  drgań  547 

— asymptotyczna  949 

— horyzontalna  949 

— optyczna  drgań  547 
gałąź  P 3 1 1 

gałąź  R 3 1 1 
gamma,  y 893 
gaz  doskonały  56 

— elektronów’  walencyjnych  506 

— elektronowy  505,  508,  525 
— Fermiego  176,  177,  195 

— fononowy  550,  668 

— fotonów  904 

— kwantowy  56 

— wzbudzeń  elementarnych  401 
gen  struktury  71 1 

generacja  parametryczna  światła  369 
generator  Van  dc  Graaffa  podwójny  121 
— Gunna  632,  634 
— Hartmanna  652 

— laboratoryjny  fal  grawitacyjnych  972 
geoelektryka  poszukiwawcza  894 
geofizyka  jądrowa  896 

— otworow-a  897 

— poszukiwawcza  891 

— wiertnicza  897 
geoida  815 

gęstość  elektronowa  260,  270,  272,  477 

— ładunków  magnetycznych  587 

— ładunku  jądra  163 

— materii  jądrowej  163 

— optyczna  303 

— poziomów  jądra  169 

— prawdopodobieństwa  53,  250 

— prądu  dyfuzyjnego  elektronów  610 

dziur  610 

krytyczna  408 

— stanów'  elektronowych  406 
energetycznych  534 

jądrowych  195 

giętkość  łańcuchów  polimerów  696 
glikoliza  710,  81 1 
globina  734 
globule  938 
glukoza  710 
gluony  96,  102 
głośniki  646 

— elekt retowe  525 
głośność  689 
Gondwana  826 

goniometry  rentgenowskie  467 
K.  Godeł  37,  904 
gradiometr  433 
granica  Chandrasekhara  933 

— jonowa  1 1 3 

— Rocheki  934 

grawimetria  poszukiwawcza  891 
grawimetry  891 

grawitacyjne  zapadanie  963,  965,  967 
grawitony  905 
grej.  Gy  793 
gromada  Virgo  940 
gromady  galaktyk  925,  940 

— gwiazd  924,  937 
grupa  Galileusza  43 

— koloru  96 

— Lorentza  73 

— Poincarego  43,  73 
grupy  antysymetrii  503 

— dyfrakcyjne  469 

— graniczne  448 

— przestrzenne  45 1 

homologii  501 

symetrii  magnetycznej  504 

— punktowe  447 

— symetrii  92 

— szubnikowskic  504 
grzanie  elektronów  stochastyczne  234 

— plazmy  233,  235 
guanina  284 
gwiazdy  930,  937 

— chłodne  927 

— gorące  927 

— neutronowe  934,  959,  960,  964 

— rozbłyskowe  915 

— supernowe  930 

— typu  <5  Scuti  946 


gwiazdy  typu  fi  Cephci  946 

PR  Lyrae  946 

Mira  Ccti  946 

R V Tauri  946 

— zmienne  pulsujące  944 
gyraza  754 


H 

hadroatomy  125 

hadrony  80",  84,  88.  100,  124,  154 
hałas  689,  693 
hamiltonian  250 

— elektronowy  262,  278 

— oddziaływania  78 
harmonia  500 

hel  I i 11  396.  398 

— odkrycie  980 
heliks  699,  726.  748 

— Watsona-Cricka  747 
hem  734 

hemoglobina  489,  734 
hemoliza  715 
heteroładunek  523 
hcterozłącza  620 
hiperdźwięki  652 
hiperfragment  216 
hiperhc!  216 
hiperjądro  215-217 
hiperładunck  89 
hipernuklid  216 
hiperon  89 

hipcrplaszczyzny  równoczesności  35 
hipertryt  216 
hipoteza  atomowa  23 

— atomowo-molekularna  29 

— demokracji  cząstek  83 

— kosmicznego  cenzora  967 

— kwarków  uwięzionych  80,  83,  95 

— rozsuwania  się  den  oceanicznych  853 

— skalowania  63 

— du  Toit  852 
histony  748 

hodograf  fali  sejsmicznej  895 
hodowanie  monokryształów  459 
hodowla  kwarcu  455 

— magnetytu  455 

— soli  kuchennej  454 

— tytanianu  baru  455 
holografia  380 

— akustyczna  666 

— w medycynie  801 
hologram  382,  383,  387,  666 
homcostat  785 
homologia  500,  501 
homoładunek  523 
hormony  744 
hybrydyzacja  280 
hydroakustyka  880 
hydroekstruzja  576 
hydrolazy  736 

hydroliza  ATP  759,  763 
hydrolokacja  885 


i 

immunochemiczne  badania  765 
immunoglobulina  745 
implantacja  jonów  208 
impulsy  św-iatła  gigantyczne  375 

pikosekundowe  377 

7 ultrakrótkie  374 

indukcja  nasycenia  589 
7-  szczątkowa  589 

informacja  genetyczna  komórki  752,  755 
7-  optyczna  386,  389 
informacji  kodowanie  782 

— odczyt  599 

— przesyłanie  359 

— selekcja  782 

— szyfrowanie  386,  387 

— wpisywanie  598 

— zapis  599 
informosomy  756 
infradźwięki  657 
inhibicja  zwrotna  711 
inhibitory  kompetytywne  736 
iniektory  Halla  234  ’ 

— indukcyjne  234 

— współosiowe  234 
interferencja  347 
interferometr  913 

— kwantowy  nadprzewodnikowy  424, 
432 

— Michelsona  362 

— pierścieniowy  Sagnaca  361 
interferometria  384 

— dwuekspozycyjna  385 

— holograficzna  384 

— natężeniowa  350 

— w czasie  rzeczywistym  385 
inwersja  43,  47 

— pola  geomagnetycznego  851 
inżynieria  genetyczna  757 


izobary  163 
izodozy  797 
izokliny  807 
izolator  516,  528,  541 
izolator  (wentyl)  596 
izomerazy  736 

izomeria  geometryczna  polimerów-  698 
7-  hiperjądrowa  219 
izomery  geometryczne  696 

— jądrowe  181,  186,  188,  242 

— kształtu  198  , 202 

— makrocząsteczek  697 

— rotacyjne  696 
izoparzystość  90 
izopory  849 
izospin  46.  89,  170 
izoterma  51 

— van  der  Waałsa  51 
izotony  163 
izotopy  163,  997,  998 

J 

jama  jodowa  224 
jasność  galaktyk  941 

jądra  atomowe  dalekie  od  ścieżki  trwa- 
łości 206 

kuliste  177 

magiczne  165,  168 

neutronodeficytowe  206 

neutrononadmiarowe  206,  207 

nietrwałe  181,  182 

promieniotwórcze  181,  182 

superciężkie  182,  207 

supergęste  206 

trwałe  182,  184 

zdeformowane  165,  168,  178,  179 

złożone  194 

zwierciadlane  163,  171 

— atomowego  kształty  165 

rozmiar  163 

jądro  galaktyki  942 

— komórki  708 

7-  konwektywne  gwiazdy  932 
jednostka  centralna  komputera  636 
jednostki  atomowe  255 

— energii  cząsteczki  301 
język  symboliczny  636 

— wewnętrzny  komputera  636 
języki  algorytmiczne  636 

jon  Hj"  267,  269 
jonizacja  792 
jonosfera  829 

jony  ciężkie  196-198,  202,  204 
JRM  — >■  rezonans  magnetyczny  jądrowy 

K 

kabel  nadprzewodnikowy  430 
kalibrator  laserowy  362 
kamera  AGA  802 

— optyczno-elektroniczna  377 

— proporcjonalna  wieloniciowa  470 

— Sokołowa  668 

— termowizyjna  802 
kamery  rentgenowskie  464 
H.  Kamcrlingh-Onnes  404 
kanaliki  T 764 

kanał  dźwiękowy  881 

— informacji  356,  357 

— optyczny  617 

— reakcji  jądrowej  188 
kaon  84 

karboksypeptydazy  A 488 
karcinotrony  632 
karotaż  897 

kaskady  enzymatyczne  743 

— wewnątrzjądrowe  125 
kataliza  enzymatyczna  739 
katodoluminesccncja  półprzewodników 

617 

kawitacja  656 

kąty  fazowe  czynników  struktury  479 

— wiązań  279 
kelwin,  K 50 
J.  Kepler  436 
a-keratyna  732 

kierunek  dopasowania  fazowego  366 

— łatwego  magnesowania  586,  603 
kinaza  713 

kinezjologia  767 
klasa  homologii  501 
klasy  dyfrakcyjne  465 

— Lauego  465 

— symetrii  447 
klimatu  ewolucja  837 

— modelowanie  837 

— stabilność  837 
klistron  refleksowy  630,  632 
kłębek  statystyczny  697 
koagulator  laserowy  364,  80! 
koalescencja  835 

kod  genetyczny  756,  813 
koczyt  576 


koenzymy  740 
kolagen  732 

kolektor  kosinusowy  877 
— Lamberta  877 

— tranzystora  532,  613,  627 
kolor  96 

— gluonów  102 

— kwarków  101 

— leptonowy  97 
komora  drutowa  1 15 

— dryfowa  1 15 

— iskrowa  1 14 

— mgłowa  1 12 

— pęcherzykowa  113 

— proporcjonalna  1 1 5 

— strimerowa  1 15 
— Wilsona  112 

komórka  (biologiczna)  708,  713,  746 
— Crove’a  434 

— elektroluminescencyjna  618 

— elementarna  436,  437 
Bravais’go  438 

— 7-  prymitywna  437 

— informacyjna  pola  świetlnego  394 
— Kerra  optyczna  379 

— mięśniowa  706 

— organizmów  wyższych  708 

— prymitywna  Wignera-Seitza  438,  439 

— roślinna  714 

— zw-ierzęca  714 
komórki  aparat  ruchowy  730 

— procesy  życiowe  707 
kompleks  międzycząsteczkowy  313 

— wieloenzymowy  742 

— z przeniesieniem  ładunku  314 
komputery  635 

— optyczne  393 
kondensacji  mechanizm  836 
konfiguracja  elektronowa  257,  259,  270 

271 , 696 
— Faradaya  591 

— stanów  jądra  167 

— stanu  podstawowego  258 
— Voigta  591 

— wzbudzona  262 
konformacja  283  , 696 

— biopolimerów  702 
konformery  697 
koniugacja  713 
konstrukcja  Maxw-clla  51,  62 
kontaktorcceptory  768 
kontrakcja  grawitacyjna  987 

— gwiazdy  931 

konwersja  wew-nętrzna  181,  186,210 
kopolimer  746 
M.  Kopernik  27 

korelacja  elektronów-  261 , 405,  409 
korelator  optyczny  Van  der  Lugta  394 
kosmochemia  molekularna  9S4 
kości  768 

kowadło  Bridgmanna  572 

kowalność  metali  507 

krawędź  plazmowa  595 

kreacja  pary  elektron-pozyton  146-149 

kriotron  434 

krotność  stanu  254 

kryptosymetria  505 

krystalit  436 

krystalizacja  białek  486 

— hydrotermalna  455 
krystalizator  Holdena  454 
krystalografia  białek  485 

— matematyczna  505 

— rentgenowska  463 
kryształki  prostujące  613 
kryształy  435,  450,  46 4,  475,  551 

— bezdyslokacyjne  462 

— idealne  450 

— kwantowe  560 

— półprzewodnikowe  435 

— rzeczywiste  450 

kryterium  elementamości  wzbudzeń  562 

— Jeansa  930 

— Landaua  401 

— Lawsona  230 
krzywe  dyspersji  547,  548 

— energii  potencjalnej  263,  265 

— izofoniczne  690 

— jednakowej  hałaśliwości  689 

— namagnesowania  589 
krzywizna  czasoprzestrzeni  38 
kwantowanie  drgań  sieci  549 

— oscylatora  harmonicznego  549 

— pola  77 

— strumienia  magnetycznego  408 
kwanty  73 

— strumienia  wirowości  402 
kw-antyzacja  Landaua  513 
kwarki  80,  83,  95,  99,  101 , 147 

— walencyjne  96 

kwas  adenozynodwufosforowy  759 

— adenozynotrójfosforowy  7i0,  759 

— dezoksyrybonukleinowy  746-748,752 

— nukleinowy  283,  746,  752 
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kwas  rybonukleinowy  746.  749 

informacyjny  749.  750 

rybosomalny  749.  750 

transportujący  749 

kwazary  925,  929.  951 , 952,  955 
kwaziantycząstki  560 
kwazicząstki  401 , 406,  550,  560,  66S 
kwazihydrostatyczna  aparatura  572 
kwazineutralność  plazmy  231 
kwazipęd  elektronu  527.  538,  559 

— fononu  550,  671 
kwazisymetria  505 

L 

laccrtydy  943 
lagrangian  74 
łamcie  498 

lampki  sygnalizacyjne  622 
laser  argonowy  357 

— azotowy  357 

— barwnikowy  355,  357,  379 

— chemiczny  356 

— C02  357 

— GaAs  357 

— gazowy  354,  357 
-He-Ne  351,  354.  357 

— heterozłączowy  619 

— homozłączowy  619 

— jonowy  355,  357 

— molekularny  355 

— neodymowy  354.  357 

— o pracy  ciągłej  354 

— pierścieniowy  361 

— półprzewodnikowy  357 

— ramanowski  372 

— rubinowy  354,  357 

— z kryształem  YAG  357 

— złączowy  618,  622 
lasera  przestrajanie  356 
laserowe  układy  logiczne  623 
śledzące  363 

lasery  sprzężone  optycznie  623 
— zastosowanie  w holografii  384 
— , — technologiczne  360 
— ,—  w geodezji  362 
— , — w biologii  363 
— , — w medycynie  363,  800 
— , — w metrologii  362 
lauegram  465 
Laurazja  826 
lecytyna  717 

G.  W.  Leibniz  35 

leki  działające  na  układ  nerwowy  499 
lepkość  helu  II  396 

— nematyków  495 

— powietrza  831 
leptonv  84,  88 
liazy  736 

liczba  atomowa  jądra  1 63 

— barionowa  46.  88,  99 

— elektronowa  88 

— kwantowa  addytywna  89 
główna  285 

magnetyczna  578 

multiplikatywna  89 

oscylacyjna  307 

rotacyjna  263,  304 

— leptonow-a  46,  88,  158 

— Macha  683 

— masowa  163 

— mionowa  88 

— 69 1 

— obsadzenia  549,  550 

— porządkowa  163 

— stanów  57 

— stopni  swobody  51 

— Strouhala  692 

— taonow-a  88 

liczby  kwantowa  88,  25! , 584 
-magiczne  165,  177,  178,  199,  200 
liczebność  (krotność)  pozycji  451 
licznik  całego  ciała  800 

— Czerenkowa  1 1 5 

— Gcigcra-Mu  llera  243 

— proporcjonalny  115,  243,  918 

— scyntylacyjny  798, 919 
!igan*dv  729 

ligaza  736,  758 
limfocyty  745 

linia  antystokesowska  313.  556 

— lambda  396 

— przesyłowa  nadprzewodnikowa  430 

— ruchu  fali  uderzeniowej  683 

— stokesowska  313,  556 

— widmowa  290,  298 , 340 

— „yrast”  169 

linie  emisyjne  y i X 921 

— słów  598 

lipidy  498,  715,  717 
liposomy  499,  719 
lizosomy  709 

H.  A.  Lorentz  30 
luka  507 


luka  kwantowa  560 


Ł 

ładunek  elektryczny  45,  91 , 143.  146 

cząstek  147 

jako  osobliwość  pola  72 

kwarków  99 

przestrzenny  567,  61  I 

łańcuch  oddechowy  711 
łącze  optyczne  356 
łożyska  beztarciowc  431 
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macierz  S 78,  135.  136 

— transformacji  73 
E.  Mach  35 
magnes  pływający  4 1 2 
magnetometr  432,  433,  893 
magnetometria  poszukiwawcza  893 

— wiertnicza  898 
magneton  Bohra  578 

— jądrowy  165 
magnetoopór  535,  602 

— ujemny  536 

— samoistny  ferromagnetyków  536 
magnetooptyka  590 
magnetopauza  842 
magnctoplan  429 
magnetosfera  840 
magnetyczne  właściwości  skał  850 
magnetycznie  miękkie  materiały  590 

— twarde  materiały  590 
magnetyzm  atomowy  578 

— jądra  atomowego  578 

— ziemski  845 
magnituda  822 
magnony  584 

makrocząsteczka  696,  698,  701 , 746 
mapa  Fouriera  487 

— gęstości  elektronowej  477,  487 

— grawimetryczna  892 

— kon  formacyjna  700 

— strukturalna  896 
masa  bezwładna  36 

— ciężka  36 

— efektywna  528 , 543 , 595 

krzywiznowa  543 

pędowa  544 

ujemna  528 , 543 

— elektronu  527 

— fotonu  144 

— jądra  atomowego  164 

— nierelatywistyczna  41 , 42 

— połowa  87 

— relatywistyczna  42 
masy  cząstek  elementarnych  84,  87 

— pomiar  19 
maszyny  matematyczne  analogowe  635, 

804 

cyfrowe  635 

elektroniczne  635 

hybrydowe  635 

materia  międzygwiazdow'a  930 

— organiczna  i tlen  w morzu  879 

— materia  rozproszona  937 

— ylem  994 

materii  i antymaterii  rozdzielanie  911 

— jednolitość  17 
matryce  świecące  624 
J.  C.  Mazwell  29,  66 

mechanika  kwantowa  31,  38,  75,  250 
mechanizm  Higgsa  81 

— samoorganizacji  703 

— scyntylacji  1 10 
mechanogram  775 

mechanoreceptory  wdechu  i wydechu  784 
medycyna  nuklearna  797,  798 
metabolizm  energetyczny  710 

— organizmów  723 
metale  505,508,  541 

— indukowane  ciśnieniem  575 
meteorologia  827 
meteorologiczne  stacje  839 
metoda  Andrade'a  453 

— AVE  279 

— anomalnego  rozpraszania  437 

— Bridgmana-Stockbargera  455 

— ciała  naładowanego  895 

— cienia  661 

— CNDO/2  279,  700 

— CNDO/S  CI  279 

— czarnej  skrzynki  779,  780 

— Czochralskiego  456 

— Dcbye^a-Scherrera-Hulla  470 

— drgań  własnych  661 

— echa  660;  662 

— elektrooporowa  894 

— figur  proszkowych  589 

— Fizeau  362 

— gradientu  pionowego  893 

— Hartrce’cgo-Focka  181 

— HEED  472 


metoda  Hiickla  (HMO)  278 

— impedancji  661 

— impulsowa  663 

— IN  DO  279 

— iteracyjna  258 

— izomorficznego  podstawienia  486 

— de  Jonga-Boumana  467 

— koincydencji  21 1 

— Laucgo  465 

— LEED  472 

— magnctotclluryczna  895 

— M I N DO/2  279 

— Monte  Carlo  636,  805 

— naukowa  18 

— obracanego  kryształu  465 

— oddziaływania  konfiguracji  (Cl)  262 

— Parisera-Parra-Poplc’a  (PPP)  278,282. 
283 

— PCILO  700 

— PGG  896 

— PNG  897 

— PNN  897 

— polaryzacji  wzbudzonej  895 

— pompowania  optycznego  291 

— potencjałów  własnych  895 

— półmpiryczna  SCF  LCAO  MO  278 

— precesyjna  468 

— przecinania  poziomów  295 

— rezonansowa  661 

— Ritza  256 

— SCF  MO  278 

— syntezy  apertury  913 

— telluryczna  895 

— transportu  chemicznego  459 

— Verneui!a  457 

— w-ariacyjna  263 

— Weissenbcrga  467 
metody  chemii  kwantowej  277 

— diagnostyczne  ultradźwiękowe  661 

— dopplerowskie  662 

— goniometryczne  467 

— magnetooptyczne  589 

— numeryczne  636 

— proszkowe  470 

— radioizotopowe  797 

— symulacyjne  638 
mezoatomy  126 
mezonow-e  nonety  101 
mezony  80,  84,  88,  124,  920,  921 

— pseudoskalarne  100 

— wektorowe  100 
mezopauza  829 
mezosfera  829 
mgławice  933,  935 
miecie  498 

mieszaniny  termicznie  czułe  497 
mięsień  sercowy  769,  772 
mięśnie  706,  758,  769-778 

— brzucha  771 

— gładkie  769,  772 

— izolowane  772 

— szkieletowe  769-772 
migawka  ultradźwiękowa  674 

— ultraszybka  379 

mikrodefektoskopia  ultradźwiękowa  660 
mikroelektronika  608,  625 
mikrofale  632,  802 
mikrofalowe  generatory  633 
mikrofon  646 

— elektretowy  525 
mikromostek  Dayema  426 
mikroprocesory  625 
mikropunkcja  364 
mikrosynteza  jądrowa  380 
mikrotubule  730 
minerały  magnetyczne  850 
minikomputery  635 

H.  Minkowski  36 

miocyty  772 

miofibryle  760,  770,  772 

miofilamenty  772 

mioglobina  734 

mion  84,  89 

miozyna  759,  761 

mitochondria  708 

model  Bohra  atomu  22,  31,  104 

— Brockerhoflfa  498 

— continuum  491 

— cybernetyczny  mięśnia  776 

— cząstek  niezależnych  175 
silnie  skorelowanych  175 

— DanielIiego-Davsona  718 

— Debve'a  518,  552 

— domenowy  491 , 495 

— dominacji  wektorowej  154 

— Drudcgo  508,  509 

— dwupłynowy  398 

— Einsteina  551 , 903 

— Einstcina-de  Sit  tera  ( E-S ) 903 

— galaktyki  Herschela  935 
Shapleya  936 

— generacji  impulsu  nerwowego  812 

— geometryczny  681 

— Godła  904 


model  Golda  pulsara  961 

— hodowli  ciągłej  809 

— Huxicya  i Browna  762 

— Isinga  58,  64,  704 

— jądra  helu  24 

kolektywny  176,  179 

kroplowy  175-177,  179 

kwarkowy  142 

optyczny  193 

powłokowy  176-178 

rotacyjny  179.  180 

statystyczny  195 

uogólniony  179,  180 

wibracyjny  179 

— latarni  morskiej  961 

— Lemailre'a  903 

— Li Iliego  803 

— mechaniczny  25 

— mechanizmu  zegarowego  961 

— mozaikowy  718 

— optyczny  sali  682 

— percepcji  słuchowej  789 
wzrokowej  788 

— powstawania  gatunków  813 

— pracy  serca  van  der  Pola  804 

— różnicowania  tkanek  813 

— Rudermana  i Sutherlanda  962 

— de  Sittera  903 

— uczeniasię  odruchu  warunkowego  787 

— układu  oddechowego  780 

— Volterry  810 

— Weinberga-Salama  81 

— wielkiego  mieszania  907 

— worka  143 

— Wszechświata  Kanta  935 

niejednorodny  904 

modele  AEHD  889 

— analogowe  681,  804 

— asymptotyczne  903 

— dynamiczne  806 

— fizyczne  803 

— cyfrowe  68 1 

— Friedmana  902,  907 

— Friedmana-Lemaitre’a  903 

— kosmologiczne  902,  904,  907 

— matematyczne  26,  804,  806,  813 

— niepunktowe  809 

— odwrotne  890 

— oscylacyjne  810 

— procesów  biologicznych  782 

— przełączenia  812 

— punktowe  806 

— statyczne  804 

— statystyczne  805 

— techniczne  782 

— wielkiego  wybuchu  904 
modelowanie  636 

— deterministyczne  869 

— filtracji  890 

— holograficzne  388 

— hydrodynamiczne  869 

— matematyczne  803,  806,  869 

— obiektów'  akustycznych  68 1 

— procesów  układu  nerwowego  786 

— stochastyczne  869 

— układu  ruchowego  789 

— uszkodzeń  radiacyjnych  208 

— zjawisk  biologicznych  782 
modelowe  badania  osłon  i przegród  682 
moderator  222,  226 

modulacja  fali  ciągłej  357 

— impulsowo-kodowa  358 

— PCM-TM  358 

— PCM-PM  358 

— polaryzacji  357 

— PPM  358 

— fi  393 

modulacyjnc  efekty  295 
modulator  596 

— elektrooptyczny  358 
modulatory  światła  675 
mody  drgań  fasera  679 

lasera  (promieniowania)  353,  375 

— pracy  klistronu  632 
modyfikacja  DNA  713 

— struktur  krystalicznych  573 
molekuły  we  Wszechświecie  980 
moment  dipolowy  cząsteczki  273,  304, 

307, 518 
jądra  1 65 

— elektryczny  jądra  l'65,  172,  290 

— magnetyczny  atomu  578,  579 

elektronu  69,  154,  578 

jądra  165 

metalu  510 

molekuły  579 

orbitalny  578 

powłoki  walencyjnej  289 

, równania  ruchu  334 

spontaniczny  59 

— obrotowy  gwiazdy  931 

— pędu  atomu  578 
orbitalny  44 

pola  elektromagnetycznego  67 
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moment  pędu  powłoki  elektronowej 
286 

monochromator  nieliniowy  368 
monokryształ  436,  453,  456 
morza  fizyka  860 
mostki  akustyczne  693 

— miozynowe  762 
motyw  struktury  452 
multienzym  741 
multiplet  288 

— izospinowy  89 
multipletowość  stanu  254 

— przejścia  i konwersji  wewnętrznej  186 
mutacja  genetyczna  713,  754 

mutanty  695 
mydła  498 

m 

naczynie  De  wara  48 
nadpłynność  396,  403 
nadprzewodnictwo  63,  404,  414,  575 

— słabe  426 

— warstwy  powierzchniowej  416 
nadprzewodniki  411, 4(5.  602 

— indukowane  ciśnieniem  575 
nadprzewodzące  materiały  409 
najgęstsze  ułożenie  (upakowanie)  439 
namagnesowanie  579,  584,  595,  603,  604 

— nadprzewodnika  413 

— spontaniczne  580-582 
napięcie  bioelektryczne  802 

— kontaktowe  656 
nasycenie  namagnesowania  580 
natężenie  powściągające  589 

natywna  konformacja  biopolimeru  702 

— struktura  biopolimeru  746 
neurocybernctyka  786 
neuron  786,  787 
neurotransmitery  744 
neutrino  84,  1 55-1 58 , 99 1 . 992 
neutronografia  magnetyczna  474 

— strukturalna  473 
neutronowa  aktywacja  243 
neutronów  pochłanianie  221 , 990 
neutrony  85,  89,  124,  219,  224 

— natychmiastowe  187 

— opóźnione  187,  221 

— termiczne  222 
I.  Newton  28 

nieciągłość  Gutenberga  821 

— Mohorowićicia  821 
niedobór  masy  930 

nieodwracalność  procesów  makroskopo- 
wych 43 

niestabilności  magnetohydrodynamiczne 
230 

niestabilność  plazmy  230,  232 
niewola  podczerwona  80 
niezmienniczość  izospinowa  141 
Nimbostratus  835 
nośnik  informacji  600,  782 

genetycznej  752 

nośniki  722 

nośniki  nadmiarowe  ładunku  608,  611 

prądu  532 

nowe  rentgenowskie  924 
noysy  689 

nuklcotydy  746,  747 
nukleosomy  749 
nukleosynteza  999 
nuklidy  242 

— móssbauerowskie  343 

O 

obiekty  podczerwone  927 

— pozaga  lak  tyczne  929 
objętość  krytyczna  62 
obraz  dyfrakcyjny  466 

— fazowy  modelu  807 

— Hcisenberga  77 

— holograficzny  382,  383 

— oddziaływania  78 

— Schródingera  77 

— Yukawy  80 
obserw-able  76 
obserwacja  18 

obserwacje  bolomctryczne  926 

— pojedynczych  mikroczastek  30 
obszar  Akhiesera  673 

— HI  i H!I  938 

— cpicentralny  818 

— Landaua-Rumera  673 

— lepkości  fononowej  673 

— niskich  energii  125,  126 

— spójności  347 

— średnich  energii  126 

— tcrmoelastyczny  673 

— wysokich  energii  126 
obszary  Weissa  586 
odbicia  w czasie  43 

odbicie  braggowskie  neutronów  554 

— Macha  688 


odbicie  magnetoplazmowe  595 
odczytniki  ciekłokrystaliczne  496 
oddziaływanie  anharmoniczne  552 

— cząstek  elementarnych  83 
nietrwałych  125 

— długozasięgowe  86 

— elektromagnetyczne  86,  143-145 
hadronów  150 

kwantów  y 1 1 1 

— elementarne  144 

* — fonon-elektron  406,  575,  669 

— fonon-fonon  67 1 

— foton-fonon  673 
• — fonon-spin  678 

— grawitacyjne  86 

— heterot  ropowe  735 

— homotropowe  735 

— hydrofobowe  702 

— jądrowe  171 , 172 

— kolektywne  w plazmie  232 

— kooperatywne  697 

— krótkozasięgowe  86,  171 

— nuklcon-nukleon  170,  171 

— podsłabe  91 

— przez  wymianę  86 

— resztkowe  181 . 194 

— silne  86,  124,  170 

— słabe  86,  124,  155 
mionów-  160 

— spin-orbita  178 

— wymienne  581 

— Yukawy  74 
odległość  korelacji  409 

— międzypłaszczyznowa  441 
odmiany  strukturalne  448 
odporność  745 

odskok  888 

odwzorowanie  optyczne  380 
ognisko  nietrwałe  809 

— trwałe  809 

— trzęsienia  Ziemi  818,819 
ogniskowanie  cząstek  1 24 
Ogra  235,  238 
ograniczenie  Froissarta  138 
okluzja  833 

okres  połowicznego  rozpadu  (zaniku) 
182,  183,  385,  242 

— pulsacji  gwiazd  948 

— pulsara  955 
oksydoreduktazy  736 
oktet  barionowy  93 

— mezonowy  93 

opady  atmosferyczne  834,  835 
opalescencja  krytyczna  64 
operator  250,  712 

— d’AIemberta  74 

— anihilacji  77 

— Hamiltona  44 

— Hartree’ego-Focka  258 

— kreacji  77 

— zaburzeniowy  255 
operon  712 

opływ  klina  687 
opór  akustyczny  645 

— elektryczny  406 

antyferromagnetyków  536 

metali  602 

resztkowy  406 

nadprzewodnika  404,  430 

plazmy  232 

— — półprzewodników  magnetycznych 

ujemny  421 , 633 

właściwy  półprzewodników  526 

optoelektronika  617 
optosonika  674 
optrony  622 

optyczne  właściwości  metalu  515 

morza  872,  873 

optyka  fourierowska  389 

— kwantowa  346 

— morza  870,  878 

— nieliniowa  364 

— zintegrowana  (scalona)  624 
orbitale  315 

— antywiążące  268 

— atomowe  257,  258 

— — HF  258,262 

— jednocentrowe  258 

— molekularne  257 

— 7t,  <x  269 

— poła  samouzgodnionego  (SCF)  258 

— SCF  LCAO-NO  258 

— Slatera  258 

— walencyjne  271 

— wiążące  268 

— wiclocentrowe  258 

— wodojopodobne  258 

— zhybrydyzowane  279,  280 
organelle*  695,  708 
oscylacje  cząsteczek  263,  301 

— kwantowe  namagnesowania  514 
przewodności  elektrycznej  514 

— w gazach  310 


oscylator  Gunna  633 

— harmoniczny  264,  307,  549 
osie  krystalograficzne  437 
osobliwość  początkowa  906 
ostrogi  radiowe  938 

oś  homologii  501 

— in  wersyjna  444,  501 

— symetrii  442,  500 

— translacji  444 

ośrodki  antagonistyczne  783 
oświetlenie  odgórne  877 

— w morzu  871 
ozonosfera  829 

P 

paczka  falowa  191,  192 
paleomagnetyczne  badania  826 

— pomiary  596 
paleomagnetyzm  850 
paliwa  termojądrowe  226,  229 
paliwo  reaktora  223,  245 
pamięć  cyfrowa  597 

— elektromechaniczna  598 

— ferrytowa  598 

— holograficzna  387 

— masowa  636 

— magnetyczna  596 

— operacyjna  598 

— optyczna  393 

— termomagnctooptyczna  599 

— wewnętrzna  598,  636 

— zewnętrzna  599,  636 

panel  elektroluminescencyjny  618 
Pangea  826 
Panthalassa  826 
parabola  mas  164 
paradoks  Gibbsa  55 
paramagnetyki  580,  677 
paramagnetyzm  579 
parametr  rozszczepialności  187 

— uporządkowania  ciekłego  kryształu 
492 

ferroelektryka  521 

— zderzenia  203,  204 
parametry  ekstensywne  47 

— intensywne  52 

— siłowe  mięśnia  777 

— struktury  pasmowej  542 

— wariacyjne  256 

pary  Coopera  405,  406,  421 

— dziura-clektron  608 
parzystość  44,  89,  163 

— czasowa  89 

— kombinowana  45,  91 

— ładunkowa  45,  90 

— stanu  163 

pas  niestabilności  947,  949,  950 

— unikania  940 
pasaty  832 

pasma  ekscytonowe  562 

— energetyczne  509,  514,  527,  539,  542 

— paraboliczne  543 

— sferyczńe  543 
pasmo  domieszkowe  542 

— oscylacyjne  311 

— oscylacyjno-rotacyjne  311,312 

— promieni  resztkowych  555 

— przewodnictwa  510,  511, 528,  541 

— rotacyjne  165,  168 

— walencyjne  528,  541 
pasy  Van  Allena  842 
pasywacja  615 

period  identyczności  437,  466 
peroksysomy  709 
persistor  434 
pestycydy  737 
pęd  cząstki  40 

— krystaliczny  527 

— pola  elektromagnetycznego  67 

— układu  40 

pęki  atmosferyczne  wielkie  918,  920, 
975-977 

pętla  hamująca  781 

— histerezy  589 

— pamięciowa  600 

— sprzężenia  zwrotnego  781 , 783 
pierścień  nadprzewodzący  408 
pierwiastki  chemiczne  ciężkie  207,  978 
nieparzyste  980 

parzyste  980,  983 

superciężkie  199,  200,  207 

— — we  Wszechświccie  980,  982 
pierwiastków  chemicznych  powstawanie 

994 

piezoelektryczne  półprzewodniki  669 

piezoelektryki  520 

piękno  90 

pik  Gamowa  987 

pinch  liniowy  237,  238 

— toroidalny  238 
pion  84 

piroelektryki  520 

piszczałka  Pohlmana-Jankowskicgo  652 


plastyczna  deformacja  metalu  507 
plazma  228, 231 , 232,  236 

— gorąca  232 

— wc  Wszechświecie  228 
plazmoidy  234 
plazmony  561 , 562 
plazmopauza  842 
plazmosfera  842 
plazmowe  działo  prętowe  234 
plutonu  produkcja  224 
płaszczyzna  fazowa  785,  807 

— harmonii  500 

— homologii  501 

— sieciowa  437 

— symetrii  442,  500 
płaszczyzny  poślizgu  446,  447 

— równoczcsności  37 

— sieciowe  439 
płyty  tektoniczne  825 
pływy  863 

— księżycowe  864 

— słoneczne  864 
pochodne  cząstkowe  71 

pociągi  unoszone  magnetycznie  429 
podatność  dielektryczna  518 

— magnetyczna  404,  508,  579,  581 
diamagnetyka  579 

metali  508,  510 

paramagnetyka  580 

podsystemy  gwiazd  936 
pogody  modyfikacja  836,  838 

— prognozy  836 
polaron  517,  562,  563 
polaronowy  ekscyton  563 
polarytony  ekscytonowe  564 

— fonowe  563 

— magnonowe  564 
polaryzacja  cząstek  1 90 

— dielektryczna  518 

atomowa  518,  519 

deformacyjna  518,  519 

dipolowa  518 

elektronowa  518,  519 

orientacyjna  5 1 8 

spontaniczna  520,  521 

— dielektryka  364,  520 

— ośrodka  364,  367,  515 

— oświetlonego  złącza  p-n  613 

— światła  591 

— zaporowa  612 
polaryzowalność  518 

— cząsteczki  313 

pola  magnetyczne  silne  602 
pole  akustyczne  667 
w morzu  880 

— cechowania  75 

— dipolowe  846 

— elektromagnetyczne  65,  72, 143 
skutki  biologiczne  802 

— elektryczne  konwekcji  843 
korotacji  843 

lokalne  518 

Lorentza  5 1 8 

— geomagnetyczne  845,  857 

— grawitacyjne  901 , 967,  972 

— Higgsa  81 

— jako  obiekt  fizyczny  72 

— koercji  589 

— magnetyczne  68,  292,  411 

Galaktyki  939 

krytyczne  412 

wewnętrzne  535 

Ziemi  845 

— molekularne  581, 585 

— pofoidalne  856 

— sił  71 

— światła  874,  879 

— temperatury  70,  71 

— toroidalne  856 

— Weissa  585 
polielektrolity  702 
polimer  696,  746 
polimeraza  DNA  752 
polimezomorfizm  491 
polinukleotydowy  łańcuch  746 
polipeptydowy  łańcuch  725 
polisom  757 

połączenia  chemiczne  w kosmosie  9$4 
pomiar  masy  19 

— prędkości  światła  363 

— średnic  gwiazd  349 
pomiary  grawimetryczne  891 
pompowanie  jądrowe  296 

— nadsubtelne  295 

— optyczne  352,  380 

par  atomowych  291, 293 

populacje  gwiazd  936 
pospieszność  127 
postacie  krystalograficzne  448, 450 
potencjał  41 

— akustyczny  880 

— Donnana  722 

— dyfuzyjny  722 

— Gibbsa  50,  63 
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potencjał  Hclmholtza  50 

— jonizacyjny  261 

— krystaliczny  538 

— membranowy  722 

— Nilssona  178,  179 

— oddziaływania  108,  145 

— samozgodny  181 

— termodynamiczny  50,  62 

— Woodsa-Saxona  177.  178 

— Yukawy  145,  173,  174 

— zdeformowany  178 
powab  90.  99 

powielanie  dyslokacji  461 

— paliwa  224 

powierzchnia  ciał  stałych  497 

— czysta  565 

— energetyczna  198,  199 

— energii  potencjalnej  układu  275,  277 

— Fermiego  510-513 

— graniczna  252,  253 

— horyzontu  966-968 

— ostatniego  oddziaływania  906 

— rzeczywista  565 

— Schwarzschilda  966 

— stałej  częstości  547 

poziom  Fermiego  406,  420,  571 

— głośności  690,  691 

— hałasu  691 

poziomomierz  izotopowy  247 
poziomy  akceptorowe  541 

— domieszkowe  541 

— donorowe  541 

— energetyczne  264,  301 , 530,  542 
jądrowe  1 67 

metali  509 

oscylacyjne  308 

— jednocząstkowe  167 

— Landaua  513.531. 594 

— podwójnie  zdegencrowanc  269 
pozostałość  magnetvczna  589 
skał  850,  851 

pozyton  146.  978 
pozytontum  148 
półprzewodniki  525,  615 

— antyferromagnetyczne  535 

— ferromagnetyczne  535 

— magnetyczne  533 

— półmagnetyczne  537 

— samoistne  541 

— z wąską  przerwą  energetyczną  531 
półprzewodnikowe  materiały  533 
praca  w czasie  rzeczywistym  635 

— wyjścia  elektronu  420,  569,  570 
pramatena  nadgęsta  994 

praw  fizyki  powszechności  17 
prawa  zachowania  90,  91,  153,  861 
prawdopodobieństwo  przejścia  76 
prawo  absorpcji  352 

— Arrhemusa  517 

— Beera  303 

— Blocha  585 

— Boltzmanna  352 

— Bowditcha  77 1 

— Coulomba  66 

— Curie  580 

— Curie- Weissa  521, 581 

— Ficka  72! 

— Gaussa  68 

— Hooke‘a  641 

— Hubblc’a  900,941,954 

— Lamberta  352 

— Newtona  1,  II,  III  35,  36 

— Ohma  508.  526 
— Plancka  920 

— wzrostu  entropii  48 

— zachowania  energii  861 

parzystości  92 

pędu  861 

prąd  ekranujący  410 
— Josephsona  stały  422 

— krytyczny  418 
— Meissnera  410 

— nasycenia  418.  612 

— strumieniowy  833 

— tclluryczny  859 

— zaporowy  614 

— zorzowy  844 

prądy  morskie  866-863 
- pierścteniowe  844 

— pływowe  864 

— wirowe  844 

prążki  anizotropowe  760 

— izotropowa  760 
precesja  Lamora  677 
prekursor  RNA  756 
prędkość  dryfowa  508 

— dżwaęku  w morzu  88 1 

— elektronu  527,  542 

— fal  elektromagnetycznych  66 

— fali  uderzeniowej  682 

— Fermiego  510 

— filtracji  889 

— kosmiczna  842 

— krytyczna  399,  888 


prędkość  światła  30,  363 

— ucieczki  965 

— unoszenia  511,  526 
pnokarionty  707 
procesy  3 a 9S9 

— akustyczne  molekularne  648,  650 

— binarne  126 

— biologiczne,  dynamiczne  781 

— cykliczne  49 

— cztcrofononowe  671 

— cztcrofotonowe  372 

— dw  u fononowe  555 

— <*  995 

— cgzoencrgetyczne  181 

— elastyczne  130 

— jednofononowe  555 

— jądrowe  920 

— kwazibinarne  126 

— / 999 

— magnesowania  589 

— makroskopowe  43 

— metaboliczne  709 

— procesy  nieelastyczne  213 

— nieodwracalne  49,  52,  969 

— normalne  552 

— odwracalne  49,  969 

— p 999 

— Penrose’a  969 

— przerzutu  ( Umklapn ) 552 

— r 199,  998 

— relaksacji  293. 658 

— s 997 

— samorzutne  48 

— skrzyżowane  138 

— Urca  934 

— wielocząstkowe  126 

— wielofotonowe  367 

— wirtualne  80 

— z wymianą  ładunku  130 
profilowanie  elekt rooporowc  895.  897 

— */  896 

— geofizyczne  897 
programowanie  636 
programy  standardowe  635 
prolina  728 

promienie  jonizujące  792 
promieniowanie  Czerenkowa  920,  975 

— dipolowe  185 

— elektromagnetyczne  302,  972 

— grawitacyjne  972 

— hamowania  111.  149,  920 

— kosmiczne  910,  919,  975 

— kwadrupolowe  185 

— laserowe  800 

— multipolowe  185 

— neutrinowe  909 

— nicjonizującc  800 

— oktupolowe  185 

— plazmy  232 

— podczerwone  801 

— radiowe  Galaktyki  916 

gwiazd  914,  915 

Księżyca  916 

planet  916 

Słońca  915 

— rekombinacyjnc  609 

— reliktowe  901 , 979 

— słoneczne  829,  99 1 

— synchrotronowe  913, 920,  955 

— termiczne  914,  920 

— warstwy  granicznej  910 

— Ziemi  829 

promień  grawitacyjny  965, 966 

— hydrauliczny  przekroju  886 

— ładunkowy  163 

— krytyczny  1 13 

— krzywizny  przestrzeni  972 

— potencjałowy  164 

— Schwarzschilda  965,  966 

— Wszechświata  902 
promotor  712 
propriorccepcja  768 
prosta  sieciowa  437,  439 

— szczególna  500 
protofibryla  732 
protogałaktyki  943 
proton  85,89,  978 
protonosfera  842 
próg  bólu  644 

— fotocmisji  570 

— rozszczepienia  220 

— słyszalności  644  , 690 
przebicie  lawinowe  612 

— magnetyczne  603 
przeciwciało  745 
przedziały  czasopodobne  899 

— przestrzennopodobne  859 
przejścia  dipolowe  elektryczne  316 

— ekscytonowc  563 

— elektronowe  320,  322 

— (przemiany)  fazowe  47,  60 
magnetyczne  63 

strukturalne  w kryształach  63 

w gazie  rzeczywistym  61 


przejścia  konformacyjne  704.  706,  751 

— monot  ropowe  490 

— nadprzewodzące  576 
przekrój  czynny  130,  !S8,  189.  98ó 
przekształcenie  antysymctryczne  503 

— cechowania  91 

— (transformacja)  Fouriera  386,389 

— homologiczne  kuli  501 

— Lorentza  37 

— odwrócenia  czasu  92 
przelewanie  częstości  395 
przemiana  y 242 

— diament-grafit  576 

— fazowa  ferroelektryczna  522 

— lambda  396.  404 

— polimorficzna  573.  574 
przcnikalność  elektryczna  515-518,  593 
przenikanie  cząstek  420.  721 , 722 
przepływ  689,  886 

— geostroficzny  867 

— krytyczny  888 

— nieustalony  886 

— rwący  888 

— spokojny  888 

— ustalony  886 

— wód  podziemnych  889 
przcpolaryzowanie  520 

przerwa  energetyczna  407,  421 , 509, 
516,528,  541,  574 
przerywacz  nadprzewodnikowy  432 
przestrzenie  równoczcsności  901 
przestrzeń  euklidesowu  35 

— izospinowa  46 

— okołoziemska  840 

— pędu  512 

— prędkości  509,  51  I 

— swobodna  jako  filtr  optyczny  391 

— wektora  falowego  539 
przesunięcie  elektryczne  516 

— fazowe  136.  192,  193 

— izotopowe  linii  widmowej  298 

— ku  czerwieni  951 . 954 

— Lamba  68,  287,  297,  299 

— Stokesa  325 

— w’  czasie  42 
przeouwnik  fazy  596 

przetworniki  cienkowarstwowe  655, 665 

— elektro-akustyczne  525 

— magnetostrykcyjnc  653 

— mechaniczne  653 

— piezoelektryczne  653 

— powierzchniowe  665 

— ultradźwiękowe  652 

— z warstwą  zaporową  655 
przewodmctw'o  cieplne  helu  II  396 
metali  508 

— dziurowc  530 

— elektronowe  529.  530 

— elektryczne  574 

metali  508,  511 

nematyków  494 

półprzewodników  525 

powierzchniowe  567,  568 

samoistne  528 

smektyków  494 

— hoppingowc  517 

— jonowe  517 

przewodność  elektryczna  517,  526,  532 
przybliżenie  adiabatyczne  262,  545 

— biegunowe  125 

— Borna-Oppenhcimera  (BO)  262 

— harmoniczne  545 

— jcdnoelektronowc  257,  538 

— n-elektronowe  278 
przypowierzchniowy  obszar  ładunku 

przestrzennego  567 
przyrządy  funkcjonalne  607 

— pomiarowe  19 
pseudopęd  671 
pseudopospieszność  127 
pseudoskalary  73 
pseudowektory  73 

pszczoły  - układ  cybernetyczny  779 
puls  helowy  950 
pulsacja  przepływu  689 
pulsar  PSR  0532,  957 

— radiow-y  959 
pulsary  917,  955,  957 

— rentgenowskie  923,  958,  962 
pulsowanie  gwiazd  947 
pułapki  elektronowe  530 

— magnetyczne  238-240 

typu  Joflego  239 

— karo  239 

- kwadrupola  toroidalnego  240 

Levitron  240 

„min:mum-B”  239 

otwartego  238 

stellarator  240 

tokamak  240 

— toroidalnego  240 

— - - zamkniętego  239 

- zwierciadlane  238 
punkt  amfidromiczny  864 


punkt  krytyczny  układu  60 

— Lagru nge‘a  934 

— materialny  70 

— Neela  475 

— osobliwy  807 

— potrójny  51 

— równowagi  785 
punkty  szczególne  500 

— wiekowe  846 

R 

rachunek  zaburzeń  78,  254 
radioastronomia  912 
radiodiagnostyka  793 
radioelektrety  523 
radiogalaktyki  943,  951 
radioizotopy  242,  243,  245,  797,  798 
radiologia  793 

radiometria  poszukiwawcza  896 

— wiertnicza  897 
radioteleskopy  912 
radioterapia  792,  793 
radioźródła  917.951 
ramię  ekspandujące  939 
ramiona  spiralne  galaktyki  937 
rdzeń  500 

reakcje  3a  930 

— dwuciałowe  985 

— jądrowe  188,  190,  193.  204,  205 

bezpośrednie  194,  196,  204 

kruszenia  205 

w gwiazdach  929  , 930  , 985 

w Słońcu  988 

wychwytu  (pick-up)  194 

— przekazu  nukleonów  170 

— rozpraszania  nieelastycznego  170 

— rozszczepienia  220 

— syntezy  termojądrowej  229 

— termojądrowe  230,  231,  980,985,  991 

— wytwarzania  neutronów  990 

— z ciężkimi  jonami  203 

— zdarcia  (stripping)  194,  196 
reaktor  badawczy  226 

— EWA  227 

— energetyczny  227 

— grafitowy  228 

— MARIA  227 

— napędowy  227 

— prędki  225 

— termiczny  225 

— termojądrowy  241 

— w odny  226,  227 
reaktywność  reaktora  223 
receptory  744 
redukcja  Bougucra  892 
refleksy  465,  466.  473 

— magnetyczne  474 
refrakcja  fal  dźwiękowych  881 
reguła  faz  Gibbsa  51 

--  Hunda  257 

— Le  Chatelicra  572 
reguły  wyboru  186,  287,  316 
rejestry  adresowe  636 

— modyfikacyjne  636 

— pamięciowe  636 
rekombinacja  713 

— nośników  ładunku  609 
prądu  532 

— powierzchniowa  567,  569,  609 
- promienista  609 

relacja  (prawo)  dyspersji  546 

— dyspersji  fononów  554 
relaksacja  spm-sieć  678 

— strukturalna  649 

— termiczna  649 
rem  793 

renaturacja  białek  751 
renormalizacja  79 
rentgenodiagnostyka  794 
rentgenograficznc  wzorce  471 
rentgenogramy  465 

— mięśnia  763 
rentgenotelewizja  794 
replikacja  DNA  752,  754 
represja  azotowa  712 

— glukozowa  712 

— katabolityczna  712 
represor  712 

reprezentacja  pędowa  136 
restrykcja  713 
restryktazy  ^58 
retrorefllcktor  363 
reststrahlen  band  555 
retigraf  467 
ret  igram  468 

rezonans  cyklotronowy  234,  594 
jonowy  234 

— ferromagnetyczny  333,  339 

— gigantyczny  167,  170 

— izobaryczny  analogowy  1 70 

— jądrowy  192 

— jednocząstkowy  192 

— magnetyczny  jądrowy  677 
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rezonans  paramagnetyczny  elektronowy 
333.677 

— pod  wójny  294 

— spinowy  333 
rezonanse  129,  132 

— hiperjądrowe  218 
rezonator  bezstratny  375 
— Hclmholtza  645 

— lasera  353 

— optyczny  618 

— otwarty  375 

— wnękowy  655 

RFM  — > rezonans  ferromagnetyczny 
RNA  — v kwas  rybonukleinowy 
rodziny  promieniotwórcze  245 
rotacja  cząsteczek  263,  301, 306.  310 

— wektora  namagnesowania  589 
rotator  596 

— niesztywny  305 

— sztywny  304 
rotony  400 

rozbłyski  radiowe  916 
rozkład  energetyczny  cząstek  1 89 
— Fermiego  163 
— Ferm  iego-Di  raca  510 

— kątowy  cząstek  189,  196 

— ładunku  jądra  163 
rozkłady  inkluzywne  127 
rozpad  fil  8 1-1 87 

— hiper jądra  2J6 

— neutronu  156 

— promieniotwórczy  181,  182 
rozpad  jąder  atomowych  155-157,  181 

— elektromagnetyczny  hadronów  154 
rozpraszanie  cząstek  Comptona  149 
naładowanych  145,  148 

— dźwięku  671 . 883 

— elektronów  150,  151.  511 

— fali  ultradźwiękowej  672 

— fotonów  na  hadronach  1 54 

— jąder  atomowych  193.  204,  205,  213 
rutherfordowskie  204 

— neutrin  155 

— neutronu  219,  553 

— światła  Brillouina  373,  556 
krytyczne  64 

Mandelsztama-Brillouina  673 

molekularne  875 

na  fali  akustycznej  373 

na  ciekłych  kryształach  495 

Ramana  313,  371.  556 

Rayleigha  371, 875,  925 

rozszczepienie  jądra  atomowego  181.  186 

— poziomów  energetycznych  542 

— spektroskopowe  579 

— 235U  220 

— w materiale  paliwowym  244 

— zeemanowskic  289.  292 
równania  Maxwe!la  29,  66 

— pola  grawitacyjnego  901 

— pól  swobodnych  74 

— ruchu  73,  643 

atomu  klasyczne  545 

--  Wuifa-Bragga  467 

równanie  Adamsa-Williamsona  816 

— Arrheniusa  659 

— Bernouiliego  886,  887 

— ciągłości  643 

— Einsteina  38 

— elektronowe  262,  263 

— falowe  25,  644,  646 

— Friedmana  902 

— Hartree'ego-Focka  (HF)  257,  258 

— Hartree’ego  Focka-Roothaana 
HFR  258 

— Kortewcga-dc  Vriesa  82 

— Newtona  65,  71 

— pola  71 

— przenoszenia  energii  875 

— sinusowe  Gordona  S2 

— Schródingera  39,  75,  250,  254,  262 

— stanu  van  der  Waalsa  51,  62 
wirialne  647 

— udziałów  777 
równoczesność  zdarzeń  36 
równość  figur  500 
równowaga  geostroficzna  831 

— hydrostatyczna  861 

— termodynamiczna  47,  48 

— układów  wielofazowych  51 
równo w-ażność  masy  i energii  219 
ruch  dyslokacji  508 

— falow-y  640,  862 

— laminarny  862,  8S7 

— mas  wodnych  861 , 862,  879 

— turbulcntny  862,  877 
ruchliwość  elektronu  526 

— nośników  prądu  531 
ruchowe  komórki  769 
ruchu  analiza  767 

— układ  768 
ruchy  gwiazd  937 
rurki  Crooksa  1 19 
ryboza  746 


rzut  tomograficzny  795 

s 

samooddziaływanic  cząstek  85 
samoogniskowanie  cząstek  121.  123,  124 

— impulsu  światła  379 

— światła  370 
sarkolemma  764 
sarkomer  760,  774 
sarkoplazma  772 
satelita  Uhuru  922,  970 

— meteorologiczny  839 
E.  Schródingcr  31,  39 
scyntygraf  799 

scyntygrafia  radioizotopowa  246,  799 
scyntykamera  800 
scyntylator  I 1 1 
sejsmiczne  fale  819,  820 

— gran  icc  895 

— mapy  822 

— strefy  822 

sejsmika  poszukiwawcza  895 
sejsmograf  821 
sejsmogram  820 
sejsmologia  815,  818.821 
sejsmometria  wiertnicza  898 
sejszc  864 

sekwencja  aminokwasowa  724 

— biopolimeru  746 
serie  widmowe  286 
scriografy  794 
serycyna  732 

siateczka  cndoplazmatyczna  709 

— sarkoplazmatyczn;«  764 

— śródplazmatyczna  730 
siatka  domen  magnetycznych  601 

— fluksoidów  417 
sieci  abonenckie  638 

sieć  krystaliczna  436,  437,  544,  550 

Bravais'go  437 

centrowana  437 

heksagonalna  437 

jednoskośna  437 

odwrotna  467,  539 

prymitywna  437 

przestrzenna  436,  544 

regularna  437 

romboedryczna  437 

tetragonalna  437 

translacyjna  437 

trójskośna  437 

wpływ  ciśnienia  574 

— neuronowa  786 

silnik  liniowy  synchroniczny  430 
siła  Bartletta  172 

— ciężkości  860 

— Coriolisa  861 

— Heisenberga  172 

— koercji  589 

— Lorentza  65 

— Majorany  172 

— pływotwórcza  860 

— rozwijana  przez  mięsień  773 

— Wignera  172 

siły  jądrowe,  niezależność  ładunkowa  171 

, rdzeń  odpychający  171 

, spin-orbita  172-174 

, symetria  ładunkowa  171 

tensorowe  172,  174 

trójciałowc  174 

wiclociałowc  174 

wymienne  171,  172,  174 

, wysycanie  171 

, zasięg  171 , 173 

— niepotencjalne  41 

skala  geochronologiczna  852 

— logarytmiczna  (decybelowa)  644 

— temperatury  bezwzględna,  Kelvina  50 

— zjawisk  atmosferycznych  827 
skalary  73 

skale  integracji  układów  scalonych  625 

— magnitud  822 
skrętność  neutrina  158,  159 
skrzynka  Richardsa  48S 
skurcz  mięśnia  706,  758.  761,  773 

— włókna  mięśniowego  773 
Słońce  spokojne  915 
soczewka  skupiająca  391 
solienody  nadprzewodnikowe  427 
solitony  82 
SONAR  885 
sonda  geofizyczna  897 

— optyczna  871 

— scyntylacyjna  798 
sondowanie  elektrooporowe  894 

— jądra  108 

— magnctotelluryczne  859 
sonoluminescencja  656 
spadek  hydrauliczny  887 
spalanie  helu  989 

— wodoru  229.  987,  988 
spektrograf  nieliniowy  368 
spektrometr  1 16,  210 


spektrometr  mionów'  dwuramienny  115 

— neutronowy  554 
spektroskopia  285,  926 

— atomowa  285.  296,  297 

— elektronów'  209 

— fotonapięcia  powierzchniowego  570 

— hiper  jądrowa  218 

— jądrowa  209 

— molekularna  262,  300 

— móssbaucrowska  339 

— nasyceniowa  297 

— rezonansowa  promieniowania  y 339 

— ultradźwiękowa  650,  658 

— wiązka-tarcza  298 
spiętrzenia  dryfowe  863 
spin  44 

— elektronu  254,  286 

— fotonu  144 

— hiperjąder  217 

— izotopowy  170 

— (kręt)  jądra  163-165,  290 

— kwarków  99 
spirala  Ekmana  866 
spływy  dryfowe  863 
spowalnianie  neutronów  222 
spójne  promieniowanie  351 , 367 
spójność  stanów  kwantowych  294 

— światła  346-349 
sprzężenie  cząstka-antvcząstka  90 

— UJ}  288 

— ładunkowe  146 

— PCT  92  __ 

— Russcla-Saundcrsa  (LÓ)  288 

— temperaturowe  223 

— zwrotne  740,  78! , 785,  786 
stała  Boltzmanna  50 

— Faradaya  29 

— gazowa  50.  62 

— grawitacyjna  28 

— Hubble'a  954 

— kosmologiczna  901 

— pulsacyjna  948 

— rozpadu  promieniotwórczego  182 

— Rydberga  286,  300 

— sedymentacji  749 

— sieciow-a  437 

— siłowa  307,  308,  546 

— spektroskopowa  273 

— sprężysto-optyczna  675 

— sprzężenia  86.  98,  147 

— Yerdeta  592 
stan  dubletowy  254 
stan  jądra  163 

ekstremalny  198,  199 

izomeryczny  181 

kwazizwiązany  166 

rezonansowy-  166 

wzbudzony  163, 181 

związany  166 

— macierzysty  170 

— mieszany  417 

— mikroskopowy  53 

— niestabilny  781 

— odwrócenia  obsadzeń  352 

— oscylacyjny  263 

— podstawowy  406,  581 

atomu  helu  256 

cząsteczki  301 

jądra  163,  181 

— pośredni  413 

— rotacyjny  263 

— równowagi  termodynamicznej  47 

— singlctowy  174,  254 

— trypletowy  174,  254 

— układu  kw-antowego  250 

— walencyjny  atomu  279 

— wejściowy  194 

stanu  skupienia  zmiany  61 
stany  elektronowe  540 
cząsteczki  263,  315 

— energetyczne  cząsteczki  264 

— metatrwałc  242,  288 

— odpow-iadające  sobie  62 

— o wysokim  spinie  169,  207 

— powicrzchniow-c  akceptorowe  565 
donorowe  565 

fononowe  571 

powolne  567 

Shockleya  566 

szybkie  567 

Tarnina  564,  566 

— rezonansowe  126 

— wzbudzone  253.  295,  557 
hiperjąder  2J8 

— zdelokalizowane  541 

— zlokalizowane  541,  542 

— związane  cząstek  148 
starter  754 

statystyka  Bosego-Einsteina  57 

— Fermiego-Diraca  57 

— fotonów  350 

— MaxwelIa-Boltzmanna  57 
stcllarator  240,  241 , 242 
sterowanie  reaktorem  224 


sterowanie  robotami  790 
stiszow-it  576 
stopnie  swobody  70 
stopy  metali  506 

— półprzewodników  z magnetykami  537 
stosunek  giromagnetyczny  165 

— R 153 

stożek  Debye‘a  470 

— dyfrakcyjny  466 

— przeszłości  900 

— przyszłości  900 

— świetlny  zdarzenia  37,  899 
stratność  materiału  660 
Stratocumulus  835 
stratopauza  829 
stratosfera  829 

Stratus  835 

straty  dielektryczne  517 

— jonizacyjne  975 

strefa  Brillouina  512,  539,  547,  552 

— eufotyczna  879 

— zorzowa  845 
struktura  afiniczna  35 

— atomowa  26 

— / i 700.  727,  729 

— cząstek  elementarnych  97 

— domenowa  586,  589 
Kittela  587 

Landaua-Lifszyca  587 

paskowa  587 

zamknięta  587 

— elektronowa  528,  538,  566 

— germanu  529 

— hierarchiczno-równoległa  783 

— komórkowa  fali  uderzeniowej  688 

— krystaliczna  biologiczna  453 
metali  506 

— kryształu  346,  440,  475 

— kwarkowa  hadronów  98 

— kwasów  nukleinowych  746 

— leptonów'  98 

— magnetyczna  475 

— metryczna  35 

— MIS  565 

— nadsubtelna  linii  widmowych  290 

— oscylacyjna  widm  elektronowych  316 

— pasmowa  dielektryka  517 
półprzewodnika  542 

— powłokowa  jądra  1 76 

— półprzewodnikowa  610,  614 

— RNA  749 

— rotacyjna  pasma  oscylacyjnego  311 
widma  elektronowego  317 

— subtelna  linii  widmowych  287 
substancje  amfifilowe  498 

— hydrofilow-e  497 

— hydrofobow-e  497 

— znaczone  246 
suma  stanów  56 
superheliks  748 
supernowych  pozostałości  924 
superpozycja  stanów  kwantowych  294 
swedberg,  S 749 

symbole  grup  przestrzennych  451 

— kwarków  99,  102 

— Millera  440 

— refleksów  467 

— sieci  krystalicznej  437 
symetria  afiniczna  505 

— barwna  505 

— cechowania  74 

— czasoprzestrzeni  43 

— izotopowa  100 

— konformacyjna  505 

— kryształów-  441 , 442,  499 

— krzywoliniowa  501 

— ładunkowa  171 

— podobieństwa  502 

— pozorna  500 

— SU  92,  94,  96,  100 

— teorii  fizycznych  42 

— unitarna  100 

— zwierciadlana  43,  158,  159 
symetrie  a prawa  zachowania  91 

— przybliżone  hadronów-  100 
symulowanie  zachowania  się  układu  636 
synchrocyklotron  122 

synchrotron  123 
syntetaza  glutaminy  712 
synteza  Fouriera  477 

— Pattersona  478 
system  interakcyjny  638 
szereg  perturbacyjny  78 
szerokość  energetyczna  stanu  166 

— linii  widmowych  290,  340 

— przerwy  energetycznej  407 
szumy  własne  880 

ś 

ścianka  izolująca  4S 
ścianki  diatermiczne  48 
ściany  domenowe  586,  587,  589 
ścieżka  trwałości  jąder  atomowych  164 
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ściśliwość  izotcrmiczna  51 

— kryształów  575 
średnia  równowagowa  54 

— w zespole  statystycznym  53 
środek  symetrii  442 
środowisko  akustyczne  693 
światła  natura  kwantowa  351 

— własności  statystyczne  350 
światło  kwazi termiczne  351 

— laserowe  349.  351 

— termiczne  348 
światłowody  359 
światy  promieniste  904 

T 

taon  84 

tautomeria  284 
technologia  planarna  625 
tekstura  Grandjeana  492 

— homcot  ropowa  492.  494 

— konfokalna  492 

— krystaliczna  471 

— molekularna  492 

— planarna  492.  494 

— skręconego  nematyka  492 
tektonika  płyt  826,  855 
telekomunikacja  optyczna  356,  623 
telereccptory  768 

telewizja  holograficzna  388 
temperatura  Curie  581 . 850 

— czarnej  dziury  970 

— elektronowa  232 

— jonowa  232 

— krytyczna  62 

— plazmy  232 

— Neela  582,  850 

— przejścia  nadprzewodzącego  576 
temperatury  rozkład  w jeziorze  890 
tensory  kartezjańskie  73 

— lorentzowskie  73 

teoria  Abbcgo  mikroskopu  3S0,  392 

— BCS  405 

— elektronowa  Lorentza  30 

— fizyczna  21 

— Flory'cgo  698 

— GLAG  415 

— Glaubera  213 

— grawitacji  36 

— Huxleya  761 

— Huckla  rozszerzona  278 

— informacji  782 

— katastrof  Thoma  805 

— kinetyczna  gazów  29 

— Lamba  342 

— Landaua  i Lifszyca  586 

— Londonów  410 

— Maxwella-van  der  Waalsa  51 

— mezonowa  sił  jądrowych  172-174 

— nadpłynności  400.  403 

— nadprzewodnictwa  405 

— ośrodków  ciągłych  639 

— pogłosowa  Sabine'a  694 

— pola  70 

— ruchu  kontynentów  825 

— samowzbudnego  dynamo  856 

— Wegcnera  825 

— względności  3!,  36,  38.  42 
teorie  ab  initio  278 

— geodynamicznc  823 

— półempiryczne  278 

— transportu  neutronów  224 
terapia  promieniami  y i X 796 
termika  wód  890 
termodynamiczna  granica  55 
termodynamika  fenomenologiczna  47 

— statystyczna  52 

nierównowagowa  59 

termoelektrety  523 
termoemisja  420 
termograf  801 , 802 
termografia  497,  791 , 802 
termometr  20 

— szumowy  434 
termometria  wiertnicza  897 
termosfera  829,  830 
termoskop  20 
termostatyka  52 
tłumienie  dźwięku  649,  883 

— hałasu  693 
tokamak  240-242 

— tomograf  794,  795 
tomografia  794,  795 
topienie  strefowe  457 
tor  optyczny  390 
transdukcja  713 

transfer  (przekaz)  nukleonów  207 
transferazy  736 
transformacja  713 

— cechowania  45 , 74 

— Fouriera  386,  389 

— odwrócenia  czasu  89 
transformacje  Galileusza  43 

— Lorentza  43 


transkrypcja  71 1, 755 
translacja  756 

— cząsteczki  300 
translator  636 
transmisja  210 

— nieliniowa  376 

— radiacji  875 

— światła  875 
transoptory  622 
transport  elektryczny  517 

— przez  błony  7 1 5 
transpozony  714 
tranzystor  532.  607,  608 

— bipolarny  614 

— boczny  (laterainy)  627 

— impulsowy  616 

— MOS  615,  616 

— n-p-n  613,  626 

— over!ay  616 
tranzystor  p-n-p  614 

— podłożowy  (wertykalny)  627 

— połowy  615 

— tyratronowy  615 
trening  siłowy  777 

— szybkościowy  777 
tropopauza  829 

t ropom iozyna  765 
troponina  765 
troposfera  828 
trucizny  jądrowe  223 
trypartycja  186 

trzecia  harmoniczna  światła  368 
trzęsienie  ziemi  818-823 
tubulina  730 

tunelowanie  elektronów  420 

— par  Coopera  421 
turbulencja  943 
twardość  akustyczna  895 
twierdzenie  Blocha  538 

— crgodyczne  54 

— Gaussa-Ostrcgradskicgo  38 

— Noether  42.  91 

— optyczne  136 

U 

układ  adaptacyjny  781 

— Andronikaszwiliego  398 

— ATC  235 

— autonomiczny  806 

— Baseball  235 

— DCX  235 

— dwufazowy  60 

— dynamiczny  806 

— heksagonalny  447 

— homeostazy  784 

— inercjalny  35 

— izolow-any  48 

— jednoskośny  447 

— krytyczny  222 

— kwantowy  250 

dwupoziomowy  352 

— logiczny  laserowy  623 

— Lokalny  Galaktyk  940,  941 

— nadkrytyczny  222 

— NASA  363 

— osłonięty  adiabatycznie  48 

— podkrytyczny  222 

— optoelektroniczny  617 

— optyczny  386,  389,  391 

— otw-arty  48,  813 

— regulacji  782 

— regularny  447 

— rombowy  447 

— scalony  625-629 

— słoneczny,  skład  pierwiastkowy  98! 

— sterowania  mięśniami  789 
oddechem  784 

— śledzący  363,  781 

— T 764 

— tctragonalny  447 

— termodynamiczny  47 

— uczący  się  rozpoznawania  obrazów 
790 

— wegetatywny  783 

— wybierający  1 1 6 

— względnie  odosobniony  779 

— zamknięty  48 

układy  cyrkulacyjne  wód  867 

— krystalograficzne  437,  447,  448 

— pamięciowe  624 

— podwójne  gwiazd  923,  934,  935 

— w-ieloatomowe  275,  279 

— wielofazowe  5 1 

— związane  kwarków'  99 
ultradźwięki  652,  656,  658 
unifikacja  fizyki  30 
unitarność  136 

uporządkowanie  antyferromagnetyczne 
581 

— ferrimagnctyczne  581 

— ferromagnetyczne  580 

— stopów  63 
urządzenie  TPC  116 


urzęd/cnie  wiclokowadłowe  Halla  572 
uzwojenia  nadprzewodnikowe  427 

W 

waga  wejścia  787 
wakans  (wakansje)  450,  507 
wakuole  709 
waraktor  612 
warstwa  Ekmana  866 

— epitaksjalna  460,  615.  627 

— pełzająca  399 

— planetarna  graniczna  829 

— /.aporowa  612 

warstw ice  uęstości  elektronowych  260, 
270.  212 

warstwy  cienkie  471 

— lipidowe  497,  717 
wartości  własne  250 
wartość  mierzona  średnia  76 
warunek  Bohra  302 

— dualności  141 

— Morrisona-Gribowa  131 

— stabilności  mechanicznej  62 

— wykrywalności  radioizotopu  243 
warunki  Borna-Karmdna  57,  538,  540, 

548.  559 

w'ektor  Burgersa  460 

— falowy  527,  539,  549,  582 
Debyc’a  552 

— sieci  odwrotnej  539 
wektory  (kartezjańskie)  73 
wrentyl  596 

w-ędrówka  (dryf)  kontynentów  824,  852 
węzeł  nietrwały  807 

— sieciowy  436,  437 

— trwały  807 
wiatr  akustyczny  646 

— geostroficzny  831 

— słoneczny  17,  843,  977 

— w atmosferze  841 
wiązanie  chemiczne  271 , 282 

— dwuelektronowe  269 

— jonowe  273 

— metaliczne  506 

— peptydowe  725 

— k 271 , 280 

— podwójne,  układ  sprzężony  320 

— 268,  280 

— trójelektronowc  269 

— wiszące  46q 

— wodorowe  284,  314,  702,  727 
wiązek  świetlnych  mieszanie  367 
wiązki  elektronowe  471 

— przeciwbieżne  125 
widma  absorpcyjne  303,  319 

— atomów  285-287 

— elektronowe  cząsteczki  315,  319 

— emisyjne  303 

— galaktyk  94! 

— hiperjąder  219 

— kwazarów  952 

— oscylacyjne  307,  308 

— oscylacyjno-rotacyjnc  310-312 

— Ramana  312,  556 

— rentgenow-skie  105 

— rotacyjne  304.  305 
widmo  cząstek  189 

— częstości  drgań  550 

— elektronów  konwersji  210 

— energetyczne  helu  II  401 
neutrin  991 

— energii  pulsarów  957 

— liniowe  285 

— móssbauerowskie  344 

— parowania  cząstek  195 

— promieniowania  y 21 1 
Słońca  9 1 5 

— rozpadu  /i  157,  210 

— wodoru  286 
wiek  galaktyk  943 

— Wszechświata  907 

— zero  gwiazdy  931 
wiekowe  zmiany  849 
wielkości  ekstensywne  55 

— fizyczne  18 

— intensywne  55 

— komplementarne  75 

— pochodne  20 

— podstawowe  20 

— zachowywane  bezwzględnie  90 
wir  makroskopowy  402 

wirusy  707 

wiry  kwantowane  401 

— prądowe  416 
w łos  733 

włókna  mięśniowe  76C,  764,  770 

— strumienia  magnetycznego  415 
wodór  metaliczny  419,  515,  577 
wody  powierzchniowe  886 

— śródlądowe  886 
woltomierz  nadprzewodnikowy  433 
wór  skórno-mięśniowy  770 
wrzeciona  mięśniowe  771 


wskaźniki  alfanumeryczne  622 

— Millera  440 

współczynnik  absorpcji  molowy  303 

— Coriolisa  887 

— ekstynkcji  303 

— konwersji  wewnętrznej  186.  210 

— kooperatywności  704 

— mnożenia  neutronów  222 

— osłabiania  światła  877 

— rozpraszania  światła  876 

— rozszczepienia  spektroskopowego  579 

— Saint-Yenanta  887 

— skali  682 

— tłumienia  dźwięku  648. 649 

fal  sprężystych  670 

relaksacyjnego  649 

— transmisji  193 

— wzmocnienia  gazowego  115 

— zaniku  5 1 8 

współczynniki  Einsteina  316,  325 

— fenomenologiczne  720 

— lepkości  Mięsowicza  495 
współrzędne  Eulera  642 

— kolektywne  167 

— Lagrange’a  642 

— normalne  546 

Wszechświat  przed  wielkim  wybuchem 
911 

— stacjonarny  904 
Wszechświata  historia  904 

— wiek  907 

wybuchy  radiowe  na  Słońcu  915 
wychwyt  atomowy  104 

— elektronu  184,  185 

— neutronu  220,  990,  997 
wyciąganie  monokryształu  456 
wykładniki  krytyczne  63 
wykres  Arganda  136 

— Chew-Frautschiego  139 

— fazowy  51 

— H-R  932 

— stanu  helu  195,  396 

nadprzewodnika  413 

wypychanie  pola  magnetycznego  przez 

nadprzewodnik  410 
wyspa  jąder  superciężkich  182 

— trwałości  izotopów'  997,  998 
wyspy  Wszechświata  935 
wzbudzenia  dobrze  określone  558, 559 

— dwuelektronowe  299 

— elementarne  559 

— jąder  atomowych  163 

— jednocząstkowe  167,  196 

— kolektywne  167,  196,  562 

— kulombowskie  196,  202,  204 

— powierzchniowe  564 

— termiczne  406 

— wieloełektronowe  299 
wzbudzenie  wiązka-laser  300 
wzmocnienie  dryfowe  679 

— fali  sprężystej  670 
wzorce  sekundy  295 
wzorcowanie  detektora  19 
wzorzec  jednostki  napięcia  434 
wzór  Boltzmanna  579 

— de  Broglie*a  144 

— Breita-Wignera  129 

— dyspersyjny  649 

— Gell-Manna-Nishijimy  89,  90.  99 

— GclI-Manna-Okubo  142 

— Graya  784 

— Stirlinga  57 

— Strouhala  692 

— Weizsackera  164 

— Wróblewskiego  134 
wzrost  kryształów  462 

Y 

ylem  materia  944 
ypsylon  85 
yrast  linia  169 

7 

zagadnienie  krotności  cząstek  134 

— pracy  maksymalnej  50 
zakaz  alternatywny  313 

zakaz  Pauliego  77,  100,  167,  526 
zależność  Maxwella  520 

— okres-jasność  945 

załamanie  podwójne  światła  492,  593 
zanikanie  polaryzacji  520 
zapachy  kwarków  101 
zapis  akustyczny  666 

— binarny  (dwójkowy)  636 

— informacji  599,  636 

— obrazu  597 

— sygnałów  akustycznych  597,  666 
zarodż  kryształu  454 

zasada  Curie  720 

— Francka-Condona  318,  319 

— Ffeisenberga  191, 549 

— Huygensa  645 
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zasada  Kopernika  981 

— korespondencji  Bohra  76 

— kosmologiczna  900,  904 

— krzyżowania  157 

— najmniejszego  działania  74 

— nieokreśloności  191 , 549 

czasu  i energii  97,  144 

pędu  i położenia  98,  145 

— Onsagera  720 

— Pauliego  286 

— symetrii  materii  i antymaterii  908 

— wariacyjna  255 

— względności  Galileusza  36 

— zachowania  energii  41 , 42,  671 
izospinu  46 

liczby  barionowej  46 

leptonowej  46 

ładunku  elektrycznego  45.  91 

masy  nierelatywistycznej  41 

momentu  pędu  40,  44 

pędu  40-42,  671 

zasady  termodynamiki  29,  48-51,  56 
zasady  zachowania  40,  42 

lokalne  42 

w rozpadzie  (i  1 56 

— — - w zderzeniach  fononów  671 
zasięg  efektywny  cząstek  137 

— korelacji  409 

— oddziaływań  elektromagnetycznych 
145 

— widzenia  w wodzie  879 
zdarzenia  elementarne  24,  36 

— nieobserwowalne  899 

— przyczynowo  nic  powiązane  24 

— obserwowalne  899 
zderzenia  wymienne  296 

— z ciężkimi  jonami  204 
zespół  kanoniczny  56 

— makrokanoniczny  56 

— mikrokanoniczny  54 

— statyczny  52-54 
zgęstki  134 
Ziemi  budowa  815 

— jądro  821 

— kształt  815 

— płaszcz  821 

— pole  magnetyczne  845 

— sejsmiczność  822 

— skorupa  82! 

— wnętrze  816,  821 , 856 
Ziemia,  rozkład  temperatury  817 
zjawiska  akustomagnetyczne  676 

— akustyczne  kwantowe  66S 
liniowe  644 

nieliniowe  646 

w hydrosferze  880 

— atmosferyczne  827,  838 

— giromagnetyczne  676 

— magnetooptyczne  590 

— optyczne  nieliniowe  365 

— tunelowe  w nadprzewodnikach  419, 
420 

zjawisko  Barnetta  676 


zjawisko  Comptona  67,  111 , 920,  955 

— Cottona-Moutona  593 

— Czerenkowa  1 1 1 

— Einsteina-de  Hassa-Richarda  676 

— Faradaya  590-594,  599 

— fontannowe  397 

— fotoelektryczne  67,  350 
wewnętrzne  925 

— — zewnętrzne  570 

— fotosprężystości  673 

— fotowoltaiczne  złączowe  613 

— de  Haasa-yon  Alphena  513 

— Halla  529 

— Josephsona  421 , 425,  427 

— magnetostrykcji  665,  676 

— mechanckaloryczne  398 

— mechanostrykcji  676 

— Meissnera  410 

— naskórkowości  anomalne  43 1 

— piezoelektryczne  569,  664,  669 

— Szubnikowa-de  Haasa  513 

— termodyfuzji  721 

— termomechaniczne  398 

— tranzystorowe  613 

— tworzenia  par  112 

— Voigta  593,  594 

— Zeemana  288,  289,  590,  593,  594 

— Zenera  614 
złącza  słabe  426 

złącze  Josephsona  422,  425,  426 

— p-n  530,610,  612,  614 

— tunelowe  Giacvera  425 
zmienne  j,  t,  u 126,  127 
znaczniki  797 

zorze  polarne  844,  858 
zrozumiałość  mowy  692 
związek  dyspersyjny  1 38 
związki  przcmienności  77 

— przyczynowe  24 
zwierciadło  molekularne  374 


Ż 

źródła  dyskretne  938 

— energii  na  Ziemi  229 

— fal  grawitacyjnych  972 

— galaktyczne  917 

— infradźwięków'  657 

— podwójne  923 

— promieniowania  otwarte  794,  800 
zamknięte  794 

X chwilowe  924 

X pozagalaktyczne  924 

X i y rozbłyskowe  924 

— światła  elektroluminescencyjne  617 

katodoluminescencyjnc  617 

źródło  Cyg  X-1  970 


ż 

żyroskop  laserowy  362 
— nadprzewodnikow-y  431 


1.  Kryształy  granatów  otrzymane  metodą  Czochralskiego:  b),  d)  i f)  prawidłowe  kształty  kryształów, 
aj  i c)  widoczny  wpływ  zmiany  temperatury  tygla  w czasie  i asymetrii  jej  rozkładu 


2.  Pierścienie  barwne  obserwowane  w wyniku  wymuszonego  rozpraszania  Ramana  w benzenie  (otrzymane 
przez  R.  W.  Terhune'a) 


3.  Kryształ  kwarcu  otrzymany  metodą  hydrotermiczną  (oświe- 
tlenie światłem  niebieskim) 


4.  Kolejne  fazy  powstawania  plazmy  w iniektorze  prętowym 
fotografowane  ultraszybką  kamerą  (500  tys./s)  wzdłuż  osi 
iniektora  i z boku 


5.  Wnętrze  tablicy  z DEL  do  wyświetlania  cyfr  przez 
w-łączenie  do  obwodu  odpowiednich  diod.  Świecące 
diody  tworzą  tu  cyfrę  5 (pow.  20  x ) 


6.  Diody  elektroluminescencyjne  (DEL)  CQVP 
i CQYP  21  (pow.  ok.  2 x ; opracowane  w ITE) 


7.  Termistor  NTC  230  (pow.  ok.  2x  ; opracowany  w ITE) 


, 1 cm 


a) 


I 


9.  Mikrofotografia  struktury  układu  scalonego  mikroprocesora  8080  firmy  Intel 
(słowo  8-bitowe,  cykl  rozkazowy  2 ps,  78  rozkazów).  Pow.  ok.  40  razy 


10.  Zegarek  elektroniczny  firmy  Unitra 
zbudowany  na  układzie  scalonym 
MC  X 1201  i układach  optoelektro- 
nicznych opracowanych  w Instytucie 
Technologii  Elektronowej 

11.  Minikalkulator  firmy  Unitra  zbu- 
dowany na  układzie  scalonym  MC 
74007  i układach  optoelektronicznych 
opracowanych  w Instytucie  Techno- 
logii Elektronowej 


l«i,LaS^r  ba™mk°wV  zbudowany  w Zakładzie  Optyki  IFD  Uniwersytetu  Warszawskiego  pompowany  laserem  azotowym.  Zdjęcie  wykonano  techniką  wieloekspozycyiną,  by 
S SmS;  £7eSir|jln  S barv^n,kowego.  Laser  azotowy:  moc  2 MW,  czas  błysku  ok.  12  ns,  częstość  powtarzania  30/s.  Laser  barwnikowy:  rodamina  6G,  moc  500  kW 

długość  fali  od  560  do  640  nm.  Zestaw  używany  jest  do  badań  spektroskopowych 


13.  Powstanie  akcji  ląserowej  w silnie  wzmacniającym  barwniku 
organicznym  (rodamina  B)  po  wzbudzeniu  silnym  impulsem  (w  za- 
kresie nadfioletu)  z lasera  azotowego.  Akcja  laserowa  rozwija  się 
mimo  małej  dobroci  rezonatora,  który  stanowią  równoległe  płytki 
kwarcowe  — ścianki  kuwety.  (Górna  plamka  na  ekranie  powstała 
przez  dodatkowe  odbicie) 


18.  Związek  pomiędzy  zabarwieniem  substancji  i jej 
widmem.  Widmo  promieniowania  elektromagnetyczne- 
go z wąskiego  obszaru  promieniowania  widzialnego 
(światła)  ilustruje  rys.  a.  Jeżeli  do  oka  trafia  całe  pro- 
mieniowanie z zakresu  od  ok.  360  do  ok.  700  nm,  to  tę 
mieszaninę  barw  oko  rejestruje  jako  barwę  białą  (świa- 
tło białe).  Widmo  absorpcyjne  (elektronowe)  substancji 
bezbarwnej,  tzn.  przepuszczającej  całe  promieniowanie 
z zakresu  widzialnego,  wygląda  tak  jak  na  rys.  b.  Jeżeli 
próbka  absorbuje  promieniowanie  z pewnej  części 
obszaru  widzialnego,  to  promieniowanie  to  nie  dociera 
do  oka  i próbka  wykazuje  zabarwienie  zależne  od  tego, 
z jakiego  obszaru  promieniowanie  zostało  zaabsorbo- 
wane, tak  jak  to  ilustrują  rys.  c,  d i e 


n 

^ 

21.  Przekrój  przez  atmosferę 
Ziemi  do  wysokości  900  km, 
Trzy  główne  obszary  atmosfe- 
ry — troposfera,  stratosfera 
i termosfera  — zaznaczone  są 
różnymi  odcieniami.  Intensy- 
wność żółtego  koloru  pro- 
porcjonalna jest  do  gęstości 
ozonu,  a intensywność  koloru 
niebieskiego  do  koncentracji 
elektronów.  W prawej  kolum- 
nie różnymi  kolorami  za- 
znaczone są  różne  składniki 
atmosfery.  Lewa  kolumna:  N 
koncentracja  elektronów,  Q 
gęstość  gazu,  2o3  gęstość 
ozonu,  T temperatura,  h wy- 
sokość. Prawa  kolumna:  z le- 
wej strony  — nazwy  różnych 
warstw  jonosferycznych,  po- 
środku — główne  składniki 
chemiczne,  po  prawej  stronie 
— nazwy  obszarów  w atmos- 
ferze. 

1 okno  astronomiczne, 

2 okno  radioastronomiczne, 

3 słoneczne  promieniowanie 
rentgenowskie, 

4 linia  helu  (He  II)  Słońca 
(strzałki  oznaczają  miejsca 
lub  obszary  w atmosferze, 
gdzie  promieniowanie  o da- 
nej długości  fali  jest  pochła- 
niane), 

5 linia  wodoru  ( La ) Słońca, 

6 promieniowanie  ultrafiole- 
towe, 

7 promieniowanie  widzialne 
(400-750  nm), 

8 promieniowanie  podczer- 
wone, 

9 szumy  kosmiczne  i sło- 
neczne, 

10  szumy  kosmiczne  i sło- 
neczne odbite  od  jono- 
sfery, 

11  maksimum  koncentracji 
elektronów, 

12  odbicie  krótkich  fal  radio- 
wych od  jonosfery, 

13  wielostopniowe  rakiety, 

14  warstwa  £1, 

15  sondowanie  jonosfery, 

1 6 zorze  polarne, 

1 7 jednostopniowe  rakiety, 

1 8 warstwy  D i £, 

19  świecące  obłoki, 

20  odbicie  fal  krótkich  od 
dolnej  jonosfery  (warstwa 
£ tylko  w dzień:  w nocy 
od  warstwy  £* ** ***) 

21  meteory, 

22  wielkie  pęki  promieniowa- 
nia kosmicznego, 

23  chmury  perłowe, 

24  balony  stratosferyczne, 

25  maksimum  gęstości  ozonu, 

26  Mount  Everest, 

27  chmury  cirrusy, 

28  Rów  Mariański, 

29  antena  paraboliczna  do 
łączności  z satelitami  (tu- 
taj Sputnik  I), 

30  samoloty, 

31  zorze  polarne  wzbudzone 
cząstkami  słonecznymi, 

* tylko  w dzień,  latem,  na 
średnich  szerokościach 
geograficznych, 

**  warstwa  £ tylko  w dzień, 

***  warstwa  D tylko  w dzień 


20.  Zorza  polarna 


24  Termogram  powierzchni  dłoni  wykonany  przy  użyciu  cholestero- 
lowych ciekłych  kryształów 


25.  Nowoczesny  aparat  do  rentgenodiagnostyki.  Zastosowanie 
wzmacniacza  obrazu  pozwala  na  zmniejszenie  napromieniowania 
pacjenta  i oddzielenie  stanowiska  lekarza  do  pacjenta 


22.  Obraz  przekroju  jamy  brzusznej  człowieka  otrzymany  za  pomocą  tomografu  komputerowego.  Podana 
ska!a  barw  odpowiada  kolejnym  przedziałom  wartości  współczynnika  pochłaniania  promieni  rentgenow- 
skich (kolor  biały  odpowiada  wartości  największej,  czarny  — najmniejszej).  Biały  obszar  w środku  zdie- 
cia  to  kręgosłup,  duży  jasny  obszar  po  prawej  stronie  — wątroba,  a biała  plama  na  tym  obszarze  — pę- 
cherzyk żółciowy,  dwa  okrągłe  jaśniejsze  miejsca  po  obu  stronach  kręgosłupa  to  nerki 


23.  Pola  magnetyczne  o indukcji  powyżej  100  T wytwarza  się  metodami  eksplozyjnymi.  Zdjęcie  przedsta- 
wia moment  rozerwania  cewki  (Pracownia  Impulsowych  Pól  Magnetycznych,  Instytut  Fizyki  PAN. 


26.  Hydrofon  w toni  morskiej  (firmy  Bruel  i Kjaer) 


mm 


27.  Pierwszy  zarejestrowany  przypadek  rozpaau  hiperonu  Z 


28.  Przykłady  rejestracji  oddziaływań  w komorach  a)  wodorowej,  b)  propanowej 
i c)  ksenonowej 


29.  Kaskada  elektronowo-fotonowa  zare 
jestrowana  w komorze  ksenonowej 


30  Siady  torów  zarejestrowane  w spektrometrze  iskrowym 


31.  Proces  powstania  i 
rozpadu  hiperonu  A° 
zarejestrowany  w wodo- 
rowej komorze  pęche- 
rzykowej 


32  Elektron  comptonow 
ski  zarejestrowany  w ko 
morze  freonowej 


33.  Szklana  komora  pę- 
cherzykowa wypełniona 
izopentanem  o tempera 
turze  130  C 


34.  Pierwszy  akcelerator  elektrostatyczny  wy- 
korzystujący generator  Van  de  Graaffa.  Akcele- 
rator przyspieszał  protony  i deuterony  do  ener 
gii  0.6  MeV 


Wl 


35.  Wielka  Europejska  Komora  Pęcherzykowa  wraz  z zewnętrznym  urządzeniem  do 
identyfikacji  cząstek 


36  Licznik  Czerenkowa 


37  Spektrometr  dwuramienny 


38.  Spektrometr  Q 


39  Akcelerator  elektrostatyczny  z generatorem  typu 
Cockrofta  i Waltona  przyspieszający  protony  do  energii 
10  MeV.  Uzyskiwana  wiązka  protonów  jest  wprowa 
dzana  do  synchrotronu  celem  dalszego  przyspieszania 


I 


40  Widok  ogólny  synchrotronu  protonów  Narodowego 
Laboratorium  Akceleratorowego  im  H.  Fermiego  w Ba 
tavii  (St.  Zjednoczone' 


41.  Pierwszy  reakior  jądrowy  uruchomiony  pod  kierunkiem  E.  Fermiego 
w Chicago 


42.  Widok  ogólny  reaktora  MARIA  w Instytucie  Badań  Jądrowych  w Świerku  pod 
Warszawą 


43.  Zawieszenie  napędów  prętów  regulacyjnych  reak- 
tora MARIA 


44.  Zestaw  krytyczny  pracujący  w Instytucie  Badań 
Jądrowych  w Świerku  pod  Warszawą 


45.  Reaktor  EWA  w Instytucie  Badań  Jądrowych  w 
Świerku  pod  Warszawą 
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46.  Urządzenie  DCX  (zbudowane  w St.  Zjednoczonych),  w którym  osiągnięto  re- 
kordowe temperatury  rzędu  6 mld  K.  Obłok  gorącej  plazmy  wytworzony  był  w pułapce 
magnetycznej  (/)  przez  wiązkę  o energii  600  keV,  otrzymywaną  ze  specjalnego 
akceleratora  (2) 


47.  Columbus  II  — jedno  z pierwszych  urządzeń  amerykańskich  opartych  na  zjawisku 
pinchu  liniowego.  Na  pierwszym  planie  widać  dużą  baterię  wysokonapięciowych 
kondensatorów,  które  służą  do  zasilania  wyładowania.  Cylindryczna  komora  ekspe- 
rymentalna o osi  skierowanej  pionowo  umieszczona  jest  w środku  układu  (widać 
tylko  zakończenia  jednej  z elektrod) 
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48.  Urugan  — największy  obecnie  stellarator  (Charków, 
ZSRR)  Na  zdjęciu  widać  komorę  w kształcie  toru  wyści- 
gowego wraz  z uzwojeniami  służącymi  do  wytwarzania 
poła  ograniczającego  plazmę  U góry  widoczna  jest  część 
rdzenia  potężnego  transformatora  wykorzystywanego  do 
wytwarzania  i grzania  plazmy 


50.  Ogra  II  — pułapka  zwiercia- 
dlana zbudowana  w Instytucie 
Energii  Atomowej  w Moskwie. 
Na  zdjęciu  widać  cylindryczną 
obudowę  komory  eksperymental- 
nej oraz  umieszczonych  wokół 
niej  prętów  stabilizacyjnych.  Wi- 
doczne są  również  zgrubienia,  w 
których  umieszczono  uzwojenia 
wytwarzające  pole  zwierciadlane. 
Na  pierwszym  planie  widać  kanał 
i urządzenia  pomocnicze  służące 
do  iniekcji  wiązek  wysokoenerge- 
tycznych cząstek  neutralnych 


49.  Tokamak-ST.  Powstał  drogą  przebudowy  największego 
amerykańskiego  stellaratora  (Stellarator- Model  C)  w Insty- 
tucie Plazmy  w Princeton.  Na  zdjęciu  widoczny  jest  frag- 
ment toroidalnej  komory  próżniowej  otoczonej  uzwojenia- 
mi wytwarzającymi  stabilizujące  pole  magnetyczne.  W gór 
nej  części  zdjęcia  jest  widoczny  również  rdzeń  wielkiego 
transformatora,  który  służy  do  indukowania  w tej  komorze 
prądów  wyładowania 


51.  Rozkład  linii  sił  pola  magnetycznego  (?)  w pułapce 
typu  SM  opracowanej  i zbudowanej  w Instytucie  Badań 
Jądrowych  w świerku.  Widoczne  są  elektromagnesy  (2). 
Dla  pokazania  wnętrza  pułapki  uwidoczniono  tylko  3 płasz 
czyzny  symetrii  (wybrane  spośród  15-tu).  Wokół  środka 
układu  zaznaczono  granice  (3)  obszaru  efektywnego  ogra- 
niczenia plazmy 


52.  Gammatron  — urządzenie  do  naświetla 
nia  promieniami  y (firmy  Siemens) 


56.  Praca  przy  komorze  gorącej  {z  radio- 
izotopami o większych  aktywnościach) 


60.  Elektromagnes  hybrydowy  wytwarzający  pole  magnetyczne  25  T (Instytut 
Energii  Atomowej,  Moskwa) 

61.  Trzycewkowy  elektromagnes  bezrdzeniowy  typu  8ittera  chłodzony  wodą- 
wytwarza  pole  magnetyczne  20  T przy  mocy  zasilania  5,7  MW.  (Międzynarodowe 
Laboratorium  Silnych  Pól  Magnetycznych  i Niskich  Temperatur,  Wrocław).  Na 
elekromagnesie  ustawiony  jest  kriostat  pomiarowy 


62.  Magnetoplan 


58.  Laboratoryjny  elektromagnes 
nadprzewodnikowy 


57  Wysokociśnieniowa  komora  optycz- 
na IF-024  skonstruowana  w OBR  Wy- 
sokich Ciśnień  PAN  „Unipress"  (rze- 
czywista długość  10  cm) 


59.  Kompresor  helowy  IF-012A  skon- 
struowany w OBR  Wysokich  Ciśnień 
PAN  ..Unipress" 


63.  Symetria  w przyrodzie  — irys  i widok  makówki  z góry 


64.  Wirusy  mozaiki  tytoniu  ułożone  w sieć  przestrzenną 
(obraz  otrzymany  w mikroskopie  elektronowym) 


65.  Antysymetria  w 
i noc" 


sztuce  — M.C. 


Escher  „Dzień 


66.  Symetria  podobieństwa  — muszla  amonitu  i słonecznik 


a 


67.  Rentgenogram  NaCI  wykonany  metodą  Debyea-Scherrera-Hulla:  a)  na  płaskiej  błonie  foto- 
graficznej, b)  na  błonie  fotograficznej  zwiniętej  w walec;  promieniowanie  CuKi 


b /V  V 

68.  Lauegramy:  a)  widoczna  płaszczyzna  symetrii  (pionowo),  symetria 
m ; b)  widoczna  dwukrotna  oś  symetrii,  symetria  2 


69.  Dyfraktogram  Weissenberga;  kryształ  Zn(N03)2  * 4C0(NHa)2. 

• 2H20  — układ  jednoskośny,  oś  obrotu  [001],  warstwica  zerowa; 
promieniowanie  CuK<x 


' I V 
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70.  Rentgenogram  wykonany  metodą  obracanego  kryształu  (dyfraktogram  warstwicowy);  kryształ  ZnB2* 
• 2CO(NH2)j,  oś  obrotu  [100],  promieniowanie  CuK® 
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71.  Rentgenogramy  polimerów  wykonane  metodą  Debye'a- 
-Scherrera-Hulla:  a)polimetylen  nierozciągnięty,  b)polimetylen 
rozciągnięty  do  500%  w temperaturze  96°C,  c)  rentgenogram 
tekstury  soli  sodowej  kwasu  dezoksyrybonukleinowego 
(Na-DNA) 


72.  Retigram  kryształu  CuS04  • 3CO(NH)?,  układ  rombowy,  oś  obrotu  (010);  warstwica  pierwsza 
brak  wygaszeń  systematycznych.  W jednej  ćwiartce  pokazano  sposób  wskaźnikowania  refleksów 
promieniowanie  CuK* 


77.  Ogólny  widok  dyfraktometru  rentgenowskiego  (firmy  Philips); 
na  stole  dyfraktometru  są  ustawione  dwa  goniometry  (urządzenia 
zmieniające  położenie  preparatu  i licznika),  z lewej  — poziomy, 
z prawej  — pionowy;  z prawej  strony  stołu  — „szafa"  z układami 
elektronicznymi  i rejestratorem 


76.  Kamera  Weissenberga 


78.  Czterokołowy  dyfraktometr  automatyczny  do  monokryształów  (firmy  Rigaku) 


79.  Jamki  trawienia  ujawniające  dyslokacje  na 
granicy  ziaren  w germanie 


81.  Elektronogramy:  a)  cienkiej  folii  HgTe 
(monokryształ);  b)  drobnopolikrystalicznej 
folii  Au  (tekstura);  c)  próbki  polikrystalicznej 
NaCI 


80.  Pętle  dyslokacyjne  w ZnTe  generowane  przez  wydzielenie  Ag2Te 


82.  Granica  małokątowa  w ZnTe  (pow.  32000  x ) 


a 


83.  Dyfraktometr  neutronów  typu  DN-520  przy  reaktorze  EWA  w Świerku 


C 


84.  Dwie  siatki  — molibdenowa  i miedziana  — na  próbce  krzemu  pokrytej  w połówie  glinem;  obraz  uzyskany  w skaningowym  mikroanalizatorze  elektronowym  typu  JXA-50A 
(pow.  80  x):  a)  w świetle  elektronów  odbitych  (obszar  pokryty  glinem  jest  ciemniejszy),  b)  w świetle  charakterystycznego  promieniowania  rentgenowskiego  — linia  CuK* 
(widoczna  siatka  miedziana);  c)  w świetle  charakterystycznego  promieniowania  rentgenowskiego  — linia  MoL*  (widoczna  siatka  molibdenowa) 


85.  Przekrój  poprzeczny  diody  z GaAs;  obraz  uzyskany  w skaningowym  mikroskopie  elektronowym  typu  JXA-50A  (pow.  80  <):  a)  w świetle  elektronów  odbitych,  b)  obraz 
z kontrastem  pochodzącym  od  siły  elektromotorycznej  — widoczne  defekty  struktury  złącza  p-n,  c)  obraz  katodoluminescencji  w bliskiej  podczerwieni  (800-1200  pm)  w 
obszarze  złącza 


86.  Powierzchnia  krzemu  ze  złączem  p-n;  obraz  uzyska- 
ny w zwierciadlanym  mikroskopie  elektronowym 
(pow.  100  x);  w części  ciemniejszej  obszar  typu  p 


87.  Dyslokacja  helikoidalna  w ZnTe;  Ag  zawierającym 
drobne  wydzielenia  Ag2Te;  obraz  uzyskany  w transmi- 
syjnym mikroskopie  elektronowym  typu  JEM-200A 
(jasne  pole,  napięcie  200  kV) 


88.  Transmisyjny  mikroskop  elektronowy  o dużej  roz- 
dzielczości (typ  JEM-200C) 


89.  Struktura  domenowa  cienkich  warstw  granatu  Y1.„Gdo.,Bt0.,Fe3.BGa1.JO,2.  Zdjęcia  uzyskane  metodą  Faradaya:  a)  struktura  przy  H - 0:  b),  c)  i d)  struktura  odpowiednio 
przy  H ■ 2170  A/m.  2900  A/m.  3790  A/m  (pole  skierowane  prostopadle  do  warstwy) 


93.  Struktury  domenowe  ferroelektryków:  a)  tytanianu  baru,  obraz 
otrzymany  metodą  optyczną  (w  mikroskopie  polaryzacyjnym); 
b)  siarczanu  trójglicyny,  obraz  otrzymany  metodą  proszkową;  c)  siar- 
czanu trójglicyny,  obraz  otrzymany  metodą  trawienia;  d)  siarczanu 
trójglicyny,  obraz  otrzymany  za  pomocą  elektronowego  mikroskopu 
skaningowego;  e)  siarczanu  trójglicyny,  obraz  otrzymany  za  pomo- 
cą mikroskopu  elektronowego  z zastosowaniem  metody  dekoracji 


c 


d 


50  Jim 


90.  Struktura  domenowa  ferrytu  barowego  BaFeł2019.  Zdjęcia  uzyskane:  a)  metodą  proszkową, 
b)  metodą  Faradaya 


91.  Siatka  domen  cylindrycznych  w granacie 
Y 2,5 Gq,5  Fe4Ga012 


92.  Struktura  domenowa  cienkich  warstw  amorficz 
nych  (stop  Gd* Co) 


e 


94.  Figury  proszkowe  na  powierzchni  nadprzewodnika 
w stanie  pośrednim  (Faber,  1958  r.) 
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95.  Figury  proszkowe  na  powierzchni  nadprzewodnika 
typu  II  w stanie  mieszanym,  powierzchnia  zdjęcia  jest 
prostopadła  do  linii  sił  pola  (Essman  i Trauble.  1967  r.) 


96.  Fragment  struktury  układu  scalonego  otrzymanego 
metodą  dyfuzji  i fotolitografii.  Widoczne  są  paski  alu- 
minium stanowiące  połączenia  elektryczne  między 
elementami  układu 


98.  Moduł  pamięci  na  domenach  cylindrycznych.  U dołu  — powiększenia  fragmentów  części 
układu  oznaczonych  1-5.  Domeny  widoczne  na  dolnej  fotografii  (jasne  plamki)  mają  średnicę 
ok.  6 pm 


99.  Kryształy  monokryształów  krzemu  i germanu  z widoczną 
symetrią  trójkątną  w kierunku  {111) 


100.  Układ  scalony  kalkulatorowy  (4  działania)  MCX  74204  J. 
Ukazany  jest  sposób  połączenia  struktury  układu  scalonego  z 
nóżkami  (opracowany  w ITE) 


102.  Rejestr  2x  100  bitów  — MCY  7506  L — pierwszy  całko- 
wicie polski  unipolarny  układ  scalony  wielkiej  skali  integracji. 
Stosowany  jako  cyfrowa  linia  opóźniająca  lub  pamięć  szerego- 
wa. a)  Mikrofotografia  struktury  układu,  b)  wygląd  zewnętrzny, 
c)  z odsłoniętym  układem  scalonym;  (opracowany  w ITE) 


104.  Widok  sali  z zainstalowanym  komputerem  Cyber  73*16;  1 konsola  opera- 
torska z monitorem  ekranowym,  2 stacje  taśm  magnetycznych,  3 podręczny  stojak 
z taśmami,  4 ploteks,  5 stacje  dysków  magnetycznych  (IBJ.  Świerk) 


105.  Konsola  operatorska  automatu  pomiarowego  Polly.  Prawy  monitor  ukazuje  obraz, 
lewy  natomiast  służy  do  wprowadzania  informacji  przez  operatora  na  żądanie  układu 


106.  Porównanie  wyniku  modelowania  (a)  z obserwowaną  galaktyką  WGC-175 
(b) 


108.  Interakcyjny  tryb  pracy:  użytkownik  wprowadza  dane  za  pomocą  pióra  świetlne- 
go ; obok  obraz  wyników  na  monitorze  ekranowym 


107.  Porównanie  wyniku  modelowania 
M- 101  (b) 


(a)  z obserwowaną  galaktyką  spiralną 
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109.  Przenikanie  się  warstw  w grubej  próbce  ciekłego  kryształu  cholesterolowego. 
Fotografia  wykonana  przy  użyciu  mikroskopu  polaryzacyjnego  (pow.  300  x ) 


111.  Uwarstwienie  kropelek  ciekłych  kryształów  cholesterolowych  (mikroskop  po- 
laryzacyjny. pow.  300  >: ) 


110.  Upakowanie  warstw  cholesterolowych  w cienkiej  próbce  (mikroskop  polaryza 
cyjny,  pow.  300  x) 


112.  Modelowanie  tworów  mielinowych  za  pomocą  ciekłego  kryształu  cholestero 
lowego  (mikroskop  polaryzacyjny,  pow.  300  x ) 


113.  Obraz  chromatyny  otrzymany  w mikroskopie  elektronowym 


114.  Mikrotubula  — wewnętrzny  białkowy  element  strukturalny  komórki:  a)  przekrój  poprzeczny  mikrotubuli  poje- 
dynczej i podwójnej;  b)  model  mikrotubuli  pojedynczej,  skonstruowanej  na  podstawie  badań  krystalograficznych  i za 
pomocą  mikroskopu  elektronowego.  Ściana  mikrotubuli  zbudowana  jest  z helikalnie  ułożonych  cząsteczek  tubuliny 
i białka  dimerycznego  (podjednostki  « i //) 


115.  Obraz  czerwonych  komórek  krwi  ludzkiej  otrzymany  w 
skaningowym  mikroskopie  elektronowym  (T.  Hayes) 


a 


116.  Rzęski  w nabłonku  tchawicy  (a) 
oraz  przekroje  przez  rzęski  (b-d) 
wskazujące,  jak  jedna  połowa  pod- 
wójnej mikrotubuli  przesuwa  się 
wzdłuż  drugiej  w czasie  ruchu  rzęski 


d 


117.  Makrocząsteczka  DNA:  a)  Model  heliksu  DNA  zbudowany 
z kulkowych  modeli  atomów,  b)  Model  heliksu  DNA  wykonany 
z drucikowych  modeli  atomów.  Płaszczyzny  zasad  są  prosto 
padłe  do  osi  heliksu  i dlatego  widoczne  są  jako  odcinki  linii 
prostej.  Skala  ta  sama  jak  a),  c)  Obraz  wycinka  makrocząsteczki 
DNA  bakteriofaga  ).  otrzymany  w mikroskopie  elektronowym 
powiększającym  82100x.  d)  Obraz  wycinka  makrocząsteczki 
DNA  bakteriofaga  widoczne  miejsce,  w którym  dwie  nici 
DNA  zostały  rozdzielone 


a 

b 

c 


118.  Rentgenogram  włókien  DNA.  Ciemne  plamy  układające  się 
w kształt  krzyża  świadczą  o spiralnej  strukturze  cząsteczki  DNA, 
a ich  umiejscowienie  związane  jest  z parametrami  spirali.  Dwa 
łukowe  zaciemnienia  (u  góry  i u dołu)  świadczą  o wzajemnym 
równoległym  ułożeniu  zasad  oraz  o ich  prostopadłości  do  osi 
heliksu  (R.  Franklin,  1953) 


119.  DNA  z oocytów  żaby  (obraz  otrzymany  w mikroskopie 
elektronowym,  pow.  26000  X ) w trakcie  procesu  transkrypcji 
rybosomalnego  RNA(rRNA).  Wzdłuż  tej  samej  cząsteczki  widać 
fragmenty  DNA,  które  nie  są  transkrybowane.  Na  aktywnym 
odcinku  DNA  zachodzi  jednoczesna  transkrypcja  wielu  cząste 
czek  rRNA  (poprzeczne  niteczki  tworzące  ..choinkę”),  początek 
transkrypcji  przypada  na  czubku  „choinki”,  u podstawy  „choin- 
ki” transkrypcja  się  kończy  i rRNA  odłącza  się  od  matrycy  DNA. 
Przy  większym  powiększeniu  można  rozróżnić  wzdłuż  nici  DNA 
globule  polimerazy  RN  A 


120.  Fragment  kilku  włókien 
mięśnia  poprzecznie  prążkowa- 
nego; obraz  otrzymany  w mikro- 
skopie elektronowym,  powiększe- 
nie 53 000 x (H  E.  Huxley) 


121.  Polimer  aktyny,  obraz  otrzy- 
many w mikroskopie  elektrono- 
wym. Preparat  kontrastowany  ne- 
gatywowo octanem  uranylu,  po- 
większenie 455000  x (J.  Hanson. 
J.  Łowy) 
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123.  Filamant  m.ozynowy;  obraz  otrzymany  w mikroskopie  elektronowym.  Preparat  kontrastowany  negatywowo  octanem  uranylu  (H.  E.  Huxley) 


124.  Obraz  podłużnego  przekroju  przez  mięsień  sartorius  żaby  w mikroskopie  elektro- 
nowym. Strzałki  wskazują  kanaliki  poprzeczne  układu  7 (wg  D.S  Smitha) 


125.  Obrazy  otrzymane  w mikro- 
skopie elektronowym:  a)  agre- 
gatów fi  lamentów  czystej  akty- 
ny, powiększenie  144  000*,  b) 
kompleksu  aktyny  z tropomiozyną 
i troponiną,  pow.  130000  x ; pre- 
paraty kontrastowane  negatywo- 
wo octanem  uranylu  (A.  H.  Strze- 
lecka-Gołaszewska  1972) 


126.  Dyfrakcja  niskokątowa  pro- 
mieniowania rentgenowskiego  na 
żywym  mięśniu  w stanie  spoczyn- 
kowym. Dłuższa  oś  mięśnia  prze- 
biega pionowo.  Widoczne  są  li- 
nie warstwowe  i refleksy  połud- 
nikowe (dla  uwidocznienia  ref- 
leksów równikowych  stosuje  się 
krótszy  czas  ekspozycji)  (H.E. 
Huxley,  W.  Brown) 


- lOnm 


znacznik 
podstawy 
czasu 


0,02  s 


gram 


MMG 


elektro- 

miogram 


EMG 


127.  Badanie  mięśni  obsługujących  staw  ramienny  człowieka:  a)  stanowisko 
pomiarowe;  b)  mechanogram  i elektromiogram  mięśnia  dwugłowego  ramie- 
nia — zapis  oscylograficzny  uzyskany  podczas  badah  w warunkach  sta- 
tycznych 


128.  Obraz  dojrzałego  erytrocytu  otrzymany  w mikroskopie  elektronowym; 
widoczna  jest  struktura  trój  warstwowa 


130.  Dwuwarstwowa  błona  lipidowa,  obraz  otrzymany  w mikroskopie  elek- 
tronowym po  wytrawieniu  zamrożeniowym  (pow.  100  000x) 


129.  Błona  erytrocytu,  obraz  otrzymany  w mikroskopie  elektronowym  po  wytrawieniu  zamro 
zemowym  (pow.  100000  x) 


a 


131.  Seria  Balmera  wodoru  w widmach  różnych  obiektów 
gwiezdnych:  a)  widmo  absorpcyjne  z a Pegaza,  b)  widmo 
absorpcyjne  z a Liry,  c)  widmo  emisyjne  z chromosfery 
Słońca 


132.  Wycinek  widma  elektronowego  cząsteczki  NCO 


437,5  nm  440,36  nm 


natężenie 


135.  Fale  rozchodzące  się  na  powierzchni  wody  mogą 
tworzyć  trwały  układ  miejsc  wzmocnień  i wygaszeń 


136.  Różne  typy  laserów:  a)  lasery 
helowo- neonowe  o mocy  50, 15  i 5 W 
(typy  125  A,  124  A i 120  firmy  Spec- 
tra- Physics);  b)  laser  barwnikowy,  za 
nim  laser  jonowy,  pompujący  (układ 
580  A firmy  Spectra- Physics) ; c)  laser 
jonowy  (firmy  Coherent  Radiation) 
i d)  jego  wnętrze 


a 


138.  Uniwersalny  przyrząd  geodezyjny  (firma  ESSA)  z laserem  He- Cd 

139.  Aparatura  do  badania  generacji  drugiej  harmonicznej  światła  w sproszkowanych 
kryształach 


140.  Holografowanie  przedmio- 
tów nieprzezroczystych:  a)  Układ 
zestawiony  według  schematu 
przedstawionego  na  rys.  8,  str.  384 
( poszczególne  elementy  układu  są 
mocowane  do  ciężkich  podstawek 
spoczywających  na  masywnym 
stole),  b)  Układ  odtwarzający; 
przez  hologram  widoczny  jest 
obraz  odtworzony 


migawka 


141.  Holograficzne  badanie  opon  metodą  dwukrotne]  ekspozycji:  a)  ogólny  wygląd  urządzenia;  b)  in- 
terferogram  — obszar  z gęstymi  owalnymi  prążkami  świadczy  o rozwarstwieniu  opony 


142.  Holograficzne  badania  z użyciem  la- 
sera rubinowego:  a)  laboratoryjne  stano- 
wisko holograficzne  z laserami  rubinowymi 
(generator  1 i wzmacniacz  2)  do  badań 
obiektów  dynamicznych;  b)  interfero- 
gram  drgań  samochodowego  zespołu  na- 
pędowego; c)  interferogram  drgań  gardła 


143.  Hologram  (z  prawej  strony)  i jego  fragment  powiększony  ok.  1000 
razy  (koncentryczne  prążki  wywołane  są  wadami  elementów  optycz- 
nych układu  holograficznego) 


144.  Interferogram  uszkodzonej  membrany  głośnika  drgającej 
z częstością  1000  Hz 


145.  Mikrointerferometr  holograficzny 


146.  Mikrofotografie  interferogramów  ameby  uzyskane  w mikrointerferometrze  holograficznym  metodą  czasu  rzeczywistego  przy  różnych 
warunkach  pracy  urządzenia:  a)  w polu  jednorodnym,  b)  w polu  prążkowym 


147.  Zdjęcia  wirusa  fd  uzys- 
kane za  pomocą  mikroskopu 
elektronowego,  ukazujące 
strukturę  podwójnego  heliksu 
wirusa:  a)  przed  zastosowa- 
niem holograficznej  metody 
wyostrzenia,  b)  po  jej  zasto- 
sowaniu (G.  W.  Stroke  i in. 
1972) 


148.  Doświadczenie  E.  Abbego  i A.  Portera  — pierwszy  eksperyment  z filtracją 
częstości  przestrzennych  sygnałów  optycznych:  a)  schemat  układu  optycznego,  b) 
obraz  Fouriera  przedmiotu -siatki  i obraz  wyjściowy,  c)  przefiltrowany  przez  szczelinę 
poziomą  obraz  Fouriera  siatki  i obraz  wyjściowy,  d)  przefiltrowany  przez  szczelinę 
pionową  obraz  Fouriera  siatki  i obraz  wyjściowy 


przedmiot 


płaszczyzna  obraz 

ogniskowa 


149.  Filtracja  przestrzenna:  a)  obraz  przed  filtracją,  b)  obraz 
strzennego 


po  użyciu  górnoprzepustowego  filtru 


prze- 


150.  Rastrowy  portret  K.  E.  Bethego,  złożony  z biało-czarnych 
plamek  (a),  został  zamieniony  w obraz  tonowany  (b)  dzięki 
filtracji  przestrzennej  usuwającej  najwyższe  częstości  (R.  A. 
Philips,  1969) 


1 51 . Odbicie  i załamanie  fali  ultradźwiękowej  padającej  na  granicę  rozdziału  oleju  i roztworu 
soli  kuchennej.  Strzałka  oznacza  kierunek  fali  padającej  (wg  W.  A.  Krasilnikowa) 


152.  Dyfrakcja  płaskiej  fali  ultradźwiękowej  o długości  k = 1,6  mm  na  walcu  o średnicy 
1,8  mm  (wg  W.  A.  Krasilnikowa) 


HI  53.  Obraz  cieniowy  fali  ultradźwiękowej 

generowanej  przez  strumień  powietrza  wy- 
pływający z dyszy  (wg  L.  Bergmana) 


154.  Odbicie  i wtórne  wypromieniowanie  fali  ultradźwiękowej  z płytki  mosiężnej,  w której 
powstaje  fala  Lamba 


155  Fotografia  cieniowa  płaskiej  fali  ultradźwiękowej  o częstości  około  156.  Interferencja  dwóch  fal  na  powierzchni  wody:  a)  fale  o częstości 
1,5  MHz  w cieczy  drgań  mniejszej,  b)  — większej 


158.  Pęcherzyki  kawitacyjne  w polu  ultra- 

n^kn«Vm  * wodzie  po  Proroczeniu 
progu  natężenia 


159.  Sonoluminescencja 
ultradźwiękowej  w cieczy 
berga) 


w fontannie 
(wg  Rosen- 
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162.  Fontanna  oleju  parafinowego  wy- 
rzucona  przez  ciśnienie  promieniowania 
fali  ultradźwiękowej  promieniowanej  przez 
przetwornik  kwarcowy  (wg  Bergmana) 


o dużym  naięże, 


(„wiatr  akustyczny")  uwidoczniony  za 


164.  Układ  do  pomiarów  prędkości  i tłumienia  fal  ultradźwiękowych  w cieczach  metodą  interferometrii  impulsowo-fazowej  (IPPT-PAN,  Warszawa) 


165.  Obrazy  mikroskopowe  odcinka  płatka  cebuli:  a)  otrzymane  za  pomocą  mikroskopu  świetlnego, 
b)  otrzymany  za  pomocą  mikroskopu  ultradźwiękowego  (częstość  ultradźwięków  220  MHz,  po- 
ziomy wymiar  pola  widzenia  750  urn) 


166.  Hologram  i od- 
tworzony obraz  płytki 
metalowej  w kształcie 
litery  R 


b 


167.  Obraz  ręki  ludz- 
kiej uzyskany  z holo- 
gramu otrzymanego  i 
odtworzonego  metodą 
elektronową 


168.  Płaska  fala  uderzeniowa  S0 
biegnąca  perforowanym  przewo- 
dem; S zakrzywiona  fala  uderze- 
niowa; C front  gazu,  W zaburzenie 
akustyczne;  zdjęcie  wykonane 
metodą  smug 

169.  Odbicie  i dyfrakcja  płaskiej 
fali  uderzeniowej;  $0  fala  płaska, 
Si  fala  zakrzywiona,  S2  fala  odbi- 
ta, C powierzchnia  nieciągłości, 
V wir,  R fala  rozrzedzeniowa; 
zdjęcie  wykonane  metodą  cieni 


170.  Struktura  przepływu  powietrza  po  pęknięciu  szklanej  kuli,  S fala 
uderzeniowa,  C wypływające  powietrze,  6 ścianka  kuli;  zdjęcie  wykona- 
ne metodą  smug 


171.  Skośne  fale  uderzeniowe  w kanale; 
zdjęcie  wykonane  przy  użyciu  interfero- 
metru Macha-Zehndera 


172.  Modelowe  badanie  lotu  kabiny  kosmicznej  w atmosferze  z prędko- 
ścią odpowiadającą  liczbie  Macha  10,2  (metoda  smug,  światło  laserowe) 


173.  Płaska  fala  uderzeniowa  zwana  dyskiem  Macha  w strumieniu  gazu  wypływającym 
z dyszy;  zdjęcie  wykonane  metodą  smug 


174.  Wypływ  gazów  prochowych  z lufy;  S,  fala  uderzeniowa  wychodząca  z lufy 
przed  pociskiem,  S7  fala  uderzeniowa  wywołana  wypływem  gazów  prochowych; 
zdjęcie  wykonane  metodą  smug 


175.  Zmiany  struktury  przepływu  spowodowanego  przejściem  fali  uderzeniowej  przez 
kanał 


176.  Opływ  romboidalnego  profilu  z prędkością  odpowiadającą  liczbie  Macha  1,7;  zdję- 
cie wykonane  metodą  smug 
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179.  Przebieg  ciśnienia  w czasie  (u  góry)  w obszarze 
zastoju  za  dyszą  i odpowiadające  mu  struktury  przepływu 
pulsującego  w kanale;  zdjęcie  wykonane  przy  użyciu  in- 
terferometru Macha-Zehndera 


180.  Oftalmograf  ultradźwiękowy  konstrukcji  L Filip- 
czyńskiego  i współpracowników  (IPPT  PAN  War- 
szawa) 


pęcherzyk  płodowy 


182.  Tomograf  komputerowy  EMI-CT  5000  (fragament).  Pacjent  jest  ułożony  w bramce  skanin- 
gowej 


183.  Jeden  z przekrojów  mózgu  u zdrowego  człowieka:  a)  Zdjęcie  wykonane  za  pomocą  skenera 
rentgenowskiego.  Widać  (bez  wprowadzania  środka  cieniującego)  obie  komory  boczne  oraz  sza- 
rą i białą  substancję,  b)  To  samo  zdjęcie  po  obróbce  komputerowej  (wymiar  poziomy  jest  roz- 
ciągnięty w stosunku  do  zdjęcia  a).  Liczby  odpowiadają  wartościom  współczynnika  pochłaniania 
promieni  X przez  tkankę  w miejscach,  przez  które  przechodzą  promienie 
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184.  Scyntygramy  tarczycy:  a) 
Wykonany  scyntykamerą  po  po- 
daniu #9mTc.  Widać  guz  „gorący" 
w tarczycy  oraz  zarys  dolnej  części 
głowy,  szyi  i ramion,  b)  Wykona- 
ny scyntygrafem  po  podaniu 
Na  mJ.  Widać  miejsca  większej 
i mniejszej  aktywności  wewnątrz 
gruczołu 


187.  Scyntygram  kreskowy  otrzymany  za  pomocą  scyntygrafu.  Przedstawia  prawidłowe  rozmieszczenie 
w nerkach  wprowadzonego  związku  (hipuranu)  znakowanego  U1J 


188.  Scyntygramy  otrzymane  za  pomocą  scyntykamery  na  ekranie  oscyloskopu.  Przedstawiają  kolejne 
obrazy  (a-h)  rozmieszczenia  w nerkach  hipuranu  znakowanego  U1J,  rejestrowane  co  3 min.  od  ieao 
podania.  Widać  nierównomierne  wypełnianie  się  nerek 


185.  Licznik  scyntylacyjny  do  pomiaru  in  vivo  jodochwytności  tar- 
czycy 


186.  Efekt  oziębiania  się  palców  przy  paleniu  papierosów  u pacjenta 
z chorobą  Raynauda:  a)  przed  paleniem  palce  są  ciepłe,  b)  po  zapa- 
leniu jednego  papierosa  niektóre  palce  są  zimne  (brak  zarysu 
palców) 


189.  Termogram  nóg  chorego  na  chorobę  Burgera.  Niedokrwienie 
części  jednej  nogi  ujawnia  się  jako  jej  brak  na  zdjęciu 


AGA 


THV 


190.  Fotografia  satelitarna  rozwiniętego  układu  cyklonalnego.  Spiralne 
struktury  chmurowe  związane  są  z położeniem  frontów 


191.  Radiosonda  produkcji  fińskiej  firmy  „Vaisala"  (wg  Vaisala  News) 
— jeden  z kilkunastu  typów  radiosond  używanych  przez  służby  meteo- 
rologiczne całego  świata.  Unoszona  przez  balon  na  wysokości  sięgającej 
35  km  przekazuje  drogą  radiową  informacje  o ciśnieniu,  temperaturze 
i wilgotności  na  trasie  swojego  lotu.  Śledząc  jej  położenie  można  uzyskać 
dane  o rozkładzie  wiatrów  na  różnych  wysokościach.  Pomiary  położenia 
radiosondy  wykonuje  się  optycznie,  radiolokacyjnie  lub  (w  najnowszych 
rozwiązaniach)  metodami  radionawigacyjnymi.  Do  zapewnienia  właści- 
wych informacji  dla  nowoczesnej  numerycznej  prognozy  pogody  stacje 
radiosondażowe  powinny  być  rozmieszczone  co  300—400  km.  Jak  dotąd 
tylko  niektóre  obszary  świata  mają  sieć  serologiczną  o takiej  gęstości. 
Czynione  są  wysiłki  by  informacje  uzyskiwane  dotychczas  przez  radio- 
sondy otrzymywać  z satelitarnych  pomiarów  promieniowania  w różnych 
wycinkach  widmowych 


192.  Zdjęcie  satelitarne  mezoskalowego  układu  chmur.  Choć  przypomina 
ono  chmury  kłębiasto-warstwowe,  rozmiary  poszczególnych  „kłębków" 
są  rzędu  kilkudziesięciu  kilometrów.  Każdy  kłębek  zawiera  wiele  chmur 
kłębiastych  ( cumufus ),  kłębi  as  to  -warstwowych  ( stratocumutus ) 


193.  Główne  rodzaje  chmur:  a)  cirrus,  b)  cirrocumulus,  c)  cirrostratus  nebulosus,  d)  altocumulus,  e)  niskie  strzępy  chmur  „złej  pogody”  na  tle  chmur  altostratus,  f)  stratocu- 
mulus,  g)  stratus,  h)  i i)  cumulusy,  j)  cumulonimbus 


195.  Geostacjonarny  satelita  meteorologiczny  Meteosat  wykonany  w wyniku  współ- 
pracy państw  Europy  Zachodniej.  Mapka  ukazuje  zasięg  jego  obserwacji  (linia  ciągła) 
‘ łVzności  (linia  przerywana).  Wyposażenie  satelity  umożliwia  rozróżnianie 

obiektów  o średnicy  2,5  km  w świetle  widzialnym  i o średnicy  5 km  w podczerwieni 
(pasma  5,7-7, 1 pm  i 10-12,5  pm).  Obrazy  satelitarne  są  przetwarzane  przez  centralną 
stację  odbiorczą  i rozsyłane  użytkownikom.  W uproszczonej  postaci  mogą  być  odbie- 
rane bezpośrednio  z satelity  przez  wszystkie  służby  meteorologiczne  dysponujące 
nieskomplikowanymi  stacjami  odbiorczymi  w zasięgu  nadajników  satelity.  Satelita 
jest  także  przystosowany  do  zbierania  informacji  z naziemnych  automatycznych  stacji 


196.  Fotografia  układu  chmur  cyklonu  tropikalnego  na  wskaźniku  panoramicznym. 
Koncentryczne  kręgi  — linie  jednakowej  odległości  poziomej  podane  w milach 
morskich 


centrum^ 


tormu 


197.  Morska  baza  doświadczalna  IB  W- PAN  w Lubiatowie 


198.  Falowanie  wiatrowe 


199.  Hydrauliczne  modelowanie  falowania  wiatrowego  w bazie  badawczej  IBW-PAN  w Oliwie 

200.  Falowanie  sztormowe  w strefie  przybrzeżnej 


201.  Sonda  miernika  funkcji  rozpraszania  światła  w morzu, 
w której  źródłem  światła  jest  laser  (G.  Kullenberg  1968  r.)j 
A laser,  B ruchomy  odbiornik  światła  rozproszonego  pod 
dużymi  kątami,  C odbiornik  światła  rozproszonego  pod  ma- 
i.iomi  M-IRM  n złącz  a orzewodów 


202.  Sonda  morska  z zestawem  mierników  radiacji,  przezna- 
czona do  pomiarów  strumieni  światła  przychodzącego 
z różnych  kierunków  w morzu.  Na  zdjęciu  widoczne  są:  4 
mierniki  radiacji  ustawione  w różnych  kierunkach,  motor  z 
turbiną  do  obracania  układu  w przestrzeni  wodne],  pojemnik 
na  połączenia  przewodów,  konstrukcja  nośna  oraz  zawie- 
szenie na  kablu  doprowadzającym  wyposażonym  jedno- 
cześnie w linę  nośną  (N.G.  Jerlov  1968  r.) 


203.  Pęknięcie  uskokowe  w Mongolii,  powsta- 
łe w wyniku  trzęsienia  ziemi  4 grudnia  1 957  r. 


120° 


205.  W czasie  trzęsienia  ziemi  może  nastąpić  wyraźne  przesunięcie  powierzchniowych  warstw  skorupy  ziemskiej:  a)  jedna  z ulic  San  Francisco  po  słynnym  trzęsieniu 
ziemi  w 1906  r.;  b)  szyny  kolejowe  w pobliżu  Puerto  Banios  (Gwatemala)  po  trzęsieniu  ziemi  w lutym  1976  r. 


206.  Zdjęcie  lotnicze  gaju  cytrusowego 
zrobione  po  trzęsieniu  ziemi  w 1 940  r.  w 
Imperial  Va!ley.  Wyraźnie  widać  prze- 
sunięcie drzew  w gaju. 


207.  Sejsmiczny  przekrój 
czasowy  i jego  związek  z 
budową  geologiczną  syn- 
klinarium  łódzkiego  w re- 
jonie Uniejowa;  J jura,  T 
trias.  C cechsztyn,  U utwo- 
ry podsolne 


— 


Uniejów 


MH 


isisii 


208.  Pomiary  wartości  gradientu  pionowego  siły  cięż- 
kości dgfBz  za  pomocą  grawimetru.  Z lewej  strony  wieża 
pomiarowa,  u dołu  wykryła  forma  antropogeniczna  (wy- 
robisko górnicze);  h głębokość,  na  której  znaleziono  tę 
formę;  wyniki  pomiarów  podane  są  na  wykresie  w etwe- 
szach  E,  1 E * 1 (cm/s3)/cm 


209.  Grawimetr  — przyrząd  do  pomiarów  względnych 
siły  ciężkości 


210.  Przenośny  magnetometr  protonowy  do  pomiarów  wartości  całkowitego  natężenia  pola  magnetycznego 
Ziemi,  typ  PMP-2 


211.  Fotograf*  Mgławicy  Krab  w św.etle  spolaryzowanym  (strzałki  ukazuią  kierunek  wektora  elektrycznego).  Wyraźna  różnica  w obraz, e świadczy  o synchrotronowym 
mechanizmie  emisji  promieniowania 


212.  Ogniskujący  teleskop  rentgenowski.  Owa  zwierciadła  o średnicach  23  » 31  cm 
mają  łączną  powierzchnię  zbierającą  równą  44  cm2 


213.  Rentgenowskie  zdjęcie  korony  słonecznej  wykonane  w miękkim  promieniowa- 
niu X 


214.  Teleskop  do  obserwacji  bły- 

sków  promieniowania  Czerenko- 

wa  w atmosferze  (u  góry)  i 

sfotografowany  za  jego  pomocą 

obraz  błysku.  Krzyżykiem  zazna- 

czony  jest  punkt  największej  ja- 
sności błysku 


a 


215.  Mgławica  Krab.  Kółkiem  zaznaczony  jesi 
obszar  będący  źródłem  promieniowania  X Sko- 
śna linia  przedstawia  brzeg  Księżyca  w czasie  za- 
ćmienia pulsara  oznaczonego  strzałką 


216.  Odbiornik,  za  którego  pomocą  wykryto 
pierwsze  kosmiczne  źródło  promieniowania  X 


21  7.  Jednowymiarowy  rozkład  promieniowania 
X mgławicy  Vela  X nałożony  na  jej  zdjęcie  wy- 
konane w świetle  nadfioletowym.  Symbolem 
PSR  zaznaczone  jest  położenie  pulsara 


218.  Promieniowanie  radiowe  Wielkiej  Mgławicy 
(M  31)  w Andromedzie  (względne  natężenie 
promieniowania  1,415  MHz) 

219.  Antena  grawitacyjna  zbudowana  p bra- 
ginskiego  w Moskwie 


220.  Podziemne  obserwatorium  neutrinowe 
Davisa  — zbiornik  z czterochloroetyłenem 
zmontowany  w szybie  kopalni  złota  w Połud- 
niowej Dakocie  (USA) 


224  Galaktyka  spiralna  widziana 
z boku.  Ciemna  smuga  biegnąca 
wzdłuz  równika  jest  utworzona  z 
obłoków  pyłu 


225.  Różne  typy  galatyk:  nieregularna  (a  Mały  Obłok 
Magellana),  spiralne  (b  Mgławica  Trójkąta,  c Mgławi- 
ca Andromedy,  d Ml  04);  spiralne  z poprzeczką  (e,  f,  g). 
soczewkowate  (h,  i),  eliptyczne  {j  M32,  k NGC185, 
I M87),  eliptyczne  karłowate  fm  system  Formax,  n sy- 
stem Sekstans) 


226.  Zewnętrzna  część  Mgławicy  Andromedy  rozdzielo- 
na na  gwiazdy.  Aby  określić  odległość  Mgławicy  trzeba 
wśród  gwiazd  wyszukać  cefeidy  i zmierzyć  ich  okresy 
zmian  blasku 


227.  Eksplozja  w jądrze  galaktyki  M 87  Struga  wypływa- 
jącej materii  widoczna  jest  przy  odpowiednio  dobranym 
czasie  naświetlenia.  Zdjęcie  225  I przedstawia  tę  samą  ga- 
laktykę (naświetlano  je  wielokrotnie  dłużej) 


zdiecia^a>°  gięcie  b)  które  jest  stukrotnie  powiększonym  wycinkiem  środkowej  częśc 

3'Muicu  ' aś  etlano  w,elokrotnie  krócej.  Maksymalne  zagęszczenie  gwiazd  na  rys.  b ma  średnicę  zaledwie 


230.  Kwintet  Stefana.  Przykład  ciasnej  grupy  wzajemnie  oddziałujących  galaktyk 


229.  Centralna  część  gromady  galaktyk  Coma 


231 . Wybuch  w jądrze  galaktyki  (galaktyka  M 82).  Chmury  materii  oddalają  się  od  jądra  z prędkościami  dochodzącymi  do  3000  km/s 


2najd^ey^n2war^tż^ódlo^od^lefwon^ntaUrUS  ^ ’ SklasV,lkowa"a  ,ako  E2  ma  nietypowy  dla  galaktyk  eliptycznych  równikowy  pas  ciemnej  materii.  W centrum  galaktyk, 


